时间序列的分形及其混沌分析

别妄想泡我
709次浏览
2020年07月30日 14:12
最佳经验
本文由作者推荐

小海龟-祝福语句


北京交通大学
博士学位论文
时间序列的分形及其混沌分析
姓名:许娜< br>申请学位级别:博士
专业:运筹学与控制论
指导教师:商朋见
201011


北京交通大学博士学位论文
中文摘要
中文摘要
时间序列是国内外科 学研究中的热点,其研究涉及确定性和随机性、有序和
无序、简单和复杂性等范畴和概念的认识与深化, 对于整个自然科学都有着重大
的影响.本文主要利用分形和混沌理论,结合消除趋势波动分析及其推广的 性质
与特征,就时间序列的重分形,不同趋势对其影响,两组时间序列间的交叉相关
程度等进行 研究和探讨.本文主要针对两组时间序列的交叉相关性问题设计了一
类新的算法,这些算法同时为甄别时 间序列的交叉相关程度等问题提供了算法理
论依据框架.
第一章是引言部分,简要介绍了本文的 研究背景、动机及其意义和主要的研
究结果,以及本文所需要的混沌与分形理论知识.
第二章, 本文将Laplace变换及其滑动滤波技术引入消除趋势波动分析模型,
找到了消除指数趋势对单分形 和重分形分析影响的算法.
第三章,为了研究时间序列交叉相关性产生的机理,时间序列自相关性对交< br>叉相关性的影响,以及趋势对交叉相关性的影响,构造了一类具有重分形交叉相
关的时间序列模型 .此外,还提出了重分形交叉标度指数和重分形交叉谱的概念,
并利用Legendre变换得出二者之 间的数量关系,进而完善了重分形交叉相关判
定理论.同时探讨了幂函数、对数函数和指数函数对双组A RFIMA模型交叉相
关特征的影响.
第四章,提出了将重分形时间序列分解为正波动和负波动 的信号分解技术.
根据时间序列自相关和交叉相关特征得到了若干重要结果.从而,为两组时间序
列交叉相关性的判定提供了理论和算法支撑.
第五章,提出了基于距离权重的混沌预测方法,在最大L yapunov指数预测
理论的基础上,改善了LinSay相邻点选取技术,得到了较理想的预测结果 .经
过实证分析表明,所研究的水文时间序列预测精度周期不超过15天.
第六章,将混沌奇异 值分解滤波技术引入消除趋势波动分析模型,通过对具
有指数趋势单分形与重分形的时间序列的验证,证 明上述滤波技术是消除时间序
列中指数趋势的有效工具.
第七章,总结了本文的主要结果,同时 对进一步的研究方向进行了展望.
关键词:重分形消除趋势波动分析;拉普拉斯变换;混沌预测;重分形 消除交叉
相关趋势波动分析;分整自回归移动平均模型;混沌奇异值分解.

< br>北京交通大学博士学位论文
中文摘要


北京交通大学博士学位论文
AB
STRACT
hot
topic
ofresearchersall英文摘要
Time
serieshas
become

over
the
world,and
it’S
mainly
concerne dwith
the
understanding
and
deepening< br>of
the
category
and
concept
ofdeterminacy
or
randomness,regularity
or
irregularity,simplicity
or
complexity,an d
SO
on.So
the
study
is
of
gr eat
importance
innaturescience.In
this
paper,we
mainly
discuss
the
multi—fra ctal
nature
oftime
series,the
effects< br>0fdifferenttrends
to
time
series
an dthecross-correlation
behaviorsof
two
gro ups
oftime
series.Especially,we
design

class
of
new
algorithm
to
inv estigate
the
cross-correlation
behaviors< br>of
two
groups
oftime
series,whichprovide
theoretical
fundamentalfor
dist inguishing
the
degree
of
cross-correla tion
behaviors.
In
Chapter
1,we
int roduce
the
studybackground,motivation,signif icance
and
the
main
results
of
t his
paper,in
addition,chaos
are
and
fractal
theorieswhich
needed.
In
Chap ter
2,a
smoothing
algorithm
based
o n
the
Discrete
Laplace
Transform
(D FT)is
in
proposed
to
minimize
theeffectof
exponential
trendsanddistortionthe
log——logplots
obtained
bY
techni que
is
demonstrated
on
MF——DFA
tech niques.The
effectiveness
of
the
monofr actaland
multifractal
data
corrupted
w ith
exponential
trends.
3,in
order
to
investigate
the
causing
In
Chapt er
mechanism
ofthe
cross-
correlation< br>behaviors,together
with
theeffects
ofa uto-correlation
and
trends
cross-correlat ion
behaviors,we
construct
two-component< br>on
fractionally
auto—regressive
con-integratedmoving
cept
of
average(ARFIMA )model.Furthermore,we
suggest
the
multi—f ractal
cross-scaling
exponents
and
cro ss-singularityspectrum,then
we
give
thequantitative
relations
betweenthem
byapplying
Legendre
trails—
form.Finally, we
investigate
theinfluenceof
power-lawtrends,logarithm
function
trends
and
exponential
trends
model.
on
the
c ross-correlation
behaviorsof
two
groupsof
A冗FIMA
In
Chapter
4,we
demonst rate
the
technology
of
separating
m ulti—fractal
time
series
into
positive
fluctuation
signals
and
the
negati ve
fluctuation
signals.There
exist
lon g—range
cross-correlations
between
the
positive
fluctuation
signals
andthe
f rom
two
negative
fluctuation
signals,w hich
derived
adj
acent
lanes
respec tively.It


北京交通大学博士学位论文英文摘要
is
the< br>theory
and
algorithm
foundationfor
judging
the
cross-correlation
properties.
In
Chapter5,the
chaos
forecasting
methodbased
on
the
weight
of
distan ce
is
suggested.We
improve
the
LinS ayneighboringpoints
selection
technology
based
on
the
largestLyapunov
exponent< br>forecasting
theory.Thepredicted
values
are,in
general,ingoodagreement
withtheobser ved
ones
within15
days.
In
Chapter< br>6,a
smoothing
algorithm
based
on
thechaotic
singular
value
decomposition( CSVD)is
proposed
to
minimizetheeffectofexponential
trends
and
distortion
in
the
log—log
plots
obtained
by

F—DFA
techniques.The
effectivenessofthe< br>technique
is
demonstrated
on
monofr actaland
multifractal
data
corrupted
w ith
exponential
trends.
In
Chapters
7,the
main
contributionsof
thesis
are
concluded
andsomefuture
researchissuesare
presented.
KEYWORDS:multifractal
de trended
fluctuation
analysis(MF-DFA);Laplace
transform;chaotic
prediction;multifractaldetrended
cross-correlation
analysis(MF-DCCA);fractionally
auto-regressive
integra tedmoving
average(ARFIMA);chaotic
singularvalue
decomposition(CSVD).


致谢
首先 ,要衷心地感谢导师商朋见教授的辛勤培养.本文工作是在商老师的悉
心指导下完成的.商老师渊博的知 识、长远的目光、独到的见解和严谨的学风,
使我在五年的学习中受益非浅,并将继续指引我在未来的道 路上前进.在学习之
余,商老师还在生活上给予了我无微不至的关怀.
感谢关心我们成长的学校 、学院领导,感谢给我以传道授业解惑和在生活学
习上支持帮助我的所有老师们.
感谢同门的师 兄师姐师弟师妹们,共同的学习、探讨与合作使我收获多多.
感谢所有一路走来、互相勉励的同学和朋友 ,感谢他们在学习和生活中给予我的
关心和帮助.
感谢我的男朋友袁广才以及我们的父母多年来 给予我的理解与鼓励,是他们
的爱与包容让我能在失落和悲伤时,仍能满怀热情,不畏挫折地面对未来.
最后,诚谢各位评审论文的老师们,谢谢您辛苦的评阅,期待得到您的指导
与帮助.

< p>
第一章引言
在本章中,我们阐明了时间序列的背景及意义,回顾了混沌与分形理论,最后,简单介绍了本文的主要工作.
§1.1研究背景及意义
时间序列的重分形研究开始于2 0世纪90年代初,该技术已成功应用于物理
学、社会学、医学、生物学、经济学、地质学、计算机科学 等众多领域,掀起了其
在不同学科的研究热潮.20世纪90年代至今时间序列的重分形研究主要是以配
分函数为基础的重分形分析及其在各领域中的应用.众所周知,标准的重分形形
式体系能够刻画 正规、平稳测度的分形性质,但令人遗憾的是:这一标准形式体系。
并不能准确描述非平稳时间序列,且 其要求的数据较大.由于实际情况的复杂性
及各应用领域的不同特点,获得的数据大多是非平稳的、是很 有限的,并经常伴
有很强的噪音.因此,人们在近几年对重分形形式体系进行了各式各样的改进.
效果最好,人们最推崇,并在广泛使用的工具是以趋势消除分析为基础的重分形
消除趋势分析方法.围 绕这条主线,涌现出大量的研究结果[1--5J.特别是在医学
领域的成果令人震惊,重分形消除趋势 分析方法已应用于诸如与心血管有关疾病
的评估领域14j.
经验时间序列通常呈现非平稳性特 征,即其均值和方差为波动的变量,这多
数是由系统内部的趋势和局部相关性导致的.为此,近年来由P eng[6j等提出的消
除趋势波动分析(以下简称DFA)技术成为刻画噪音时间序列分形标度性质和 相
关特征的重要工具.Kantelhardt[1J【7】于2002年把DFA方法改进为重分形消 除
趋势波动分析(MF—DFA)理论,主要研究重分形数据的谱特征指数作为一种
可靠的探测 时间序列长相关性质的工具,它的本质是辨别出时间序列的长相关标
度趋势.时间序列的趋势是由外部效 应引起的,例如季节的更替对气温记录的影
响,直流电指数衰减对电圈的作用等.时间序列中较强的干扰 趋势会导致对长相
关性的判断失误.而最近几年的研究成果表明DFA方法具有对一定趋势的抗干
扰性【8I.因此,它是一种能有效捕获标度指数精确性并且在不断发展中的技术方
法,其结果成功应 用于众多领域:
(1)DNA序列;
(2)医学和生理学时间序列(心跳动力系统、呼吸系统、 血压、血液流动);


第一章


(3)地球物理学 时间序列(气温、日照时数、降雨量、臭氧含量、风速、云结
构、地震事件、植被覆盖、水土保持);< br>(4)天体物理学时间序列(x射线和太阳黑子);
(5)应用技术时间序列(因特网流量、交通 流、反应堆的中子密度);
(6)社会学时间序列(金融经济、语言特征、伊拉克战争引起的灾难);< br>(7)物理学(器件表面粗糙程度与光谱分析).
DFA模型只能消除多项式趋势,对其它趋势无 能为力.因此,国内外科研
工作者针对不同的情形对DFA模型进行了多种修正研究.2004年Car bone[9]
针对随机时间序列中存在局部相关性特征,提出了基于消除滑动平均技术(简称
DMA)的DFA模型,目的在于,应用此模型可以有效消除随机过程的局部相关
趋势.
200 5年Alvarez—Ramirez[10】将滑动平均技术与DFA模型相结合,得
到基于中心滑动 平均技术(简称CMA)的DFA模型,经过实证分析表明,结合
CMA技术处理后的DFA模型能够有 效消除非平稳长相关信号中的噪音,而不
影响研究对象的整体标度特征.同年,
Kiyono[ 11】针对健康人体心跳动力系统的
特有形式,得到修正DFA模型(简称MDFA),此模型可以消除 人体心跳动力
系统标度状态的交叉点.
Staudacher[12】于2005年创立了连续 DFA模型(简称
CDFA),把研究对象扩展至连续时间序列.Chianca[”J将傅里叶变换引 入DFA
模型,形成傅里叶DFA模型(简称FDFA),此模型可以降低低频噪音对时间序
列 的影响.
J/mosi[14】首次将DFA模型与经验模式分解技术相结合,对Arosa
和 MaunaLoa两处的臭氧时间序列进行实证分析,对分解出的高频信号逐一进行
研究.
Na garajan[15】致力于基于奇异值分解技术(简称SVD)的DFA模型的
开发,得到一系列的 研究成果.可以看出,DFA模型是一类应用范围广且功能
强大的算法,并在消除时间序列趋势和局部相 关性方面获得较大的成功.由于自
然记录中存在大量的指数趋势,鉴于此,我们首次将Laplace变 换及其滑动滤波
技术引入消除趋势波动分析模型,找到了消除指数趋势对单分形和重分形分析影
响的算法.
自然记录的本质是非线性的时间序列,它是国内外科学研究中的热点,非线
性系统的 突出特点是构成系统内部的各种组成部分之间存在相互作用,即交互信
息.对于非平稳信号间重分形交叉 相关性研究,是非线性科学的一个极具挑战性
的课题.该问题有着重大的科学价值.例如,Campil lo[16】将各个探测器的天线得
到的噪音信号阵列的交叉相关程度用于地震与火山爆发的预警.S凸m“e2ssD佗【1
7】
计算了出当前噪音的交叉相关性并与之标准比较来决定是否 需要改变信号符号.


北京交通大学博士学位论文
Mesina[18】对城市交 通各道路交通流的交叉相关性进行的研究可用于指导大城市
交通拥堵之疏解.Conlon[191针对 不同资产和证券投资组合提出的交叉相关矩阵
可用于进行风险评估.然而,两组时间序列交叉相关性问题 的研究刚刚起步,相关
研究结果不是很多.2008年Podobnik[20J在文献“Detren ded
cross—correlation
analysis:a
new
m ethod
for
analyzing
two
nonstationary< br>time
series”中首次
提出消除交叉相关分析模型(以下简称DCCA),研究 了两组时间序列间的交叉相
关特征,在Podobnik的DCCA模型中,除去的是2阶局部趋势,获 取了交叉指
数A的具体数值.同年,Zhou[21】将DCCA模型中的局部趋势发展为口阶波动函数,并由此得出一般的交叉指数.遗憾的是,重分形的DCCA理论不应该仅限
于一般交叉指数的 研究.另外,各种趋势对重分形DCCA理论的影响还未有研
究成果出现.针对第一种情况,我们更加深 入地探讨了重分形DCCA模型,借助
Legendre变换获取重分形交叉标度指数和重分形交叉谱, 同时证明了上述变量间
的函数关系.针对第二种情况,我们探讨幂函数、指数函数和对数函数三种趋势< br>对两组时间序列交叉相关性的影响.
非线性系统的一种极为重要的运动状态就是混沌,它是研究自 然界非线性过
程中内在随机性所具有的特殊规律性.经过20多年的发展,以Takns嵌入技术
为基础,以关联维数、Lyapunov指数等参数为基本描述手段的非线性动力系统
学分析方法在时 间序列分析方面取得了很多成果.但是,也存在着许多问题,最主
要的是传统非线性时间序列的关联维数 和Lyapunov指数等的计算精度问题.因
此,在本论文中我们提出了基于距离权重的混沌预测方法 .在最大Lyapunov指
数预测理论的基础上,改善了LinSay相邻点选取技术,得到了较理想 的预测结
果.
混沌与分形的关系十分密切,混沌运动的轨道或奇异吸引子都是分形.分形
学是描述混沌现象的恰当语言,分形维数已成为研究混沌现象的一个定量参数.
所以说分形学中必定有 混沌的内容.因此在介绍分形之前,需要先简单介绍混沌
的基础知识,以便了解分形在混沌中的一些应用 [22-26】.
混沌是一种确定性系统中出现的(或决定论规律产生的)类似随机的过程.它
首先是由Lorenz(洛伦兹)【27J在流体热对流的简化模型计算中观察到的.他说明
了,由于非 线性的Lorenz方程在长时间迭代过程中的分岔导致了结果的不确定
性,所以长时间天气预报必然失 败.这就是说,一个决定论系统可以引起无规则
涨落,随机性不必由外界引入而可由系统内在的简单确定 规律产生.
混沌在字典中定义为“完全的无序、彻底的混乱”,而在科学中混沌定义为,


第一章


“由确定规则生成的、对初始条件具有敏感依赖性的恢 复性非周期运动”.那么,
数学上如何定义混沌呢?
1975年李天沿和约克(Yorke)[ 28】首次在数学文献中使用“混沌”这一名词,
用它来表示某些非线性函数的一维迭代(或映射)的类 似随机输出【29】.在1986
年伦敦第一次国际会议上与会者提出,数学上的混沌指确定系统中出现 的随机状
态.不过上述定义显得有些笼统,Devaney[30】于1989年给了一个较严格的定义 :
(1)度量空间X上的自映射.厂:x—X,满足:该映射的周期点构成x的
一个稠密集.< br>(2)映射对初始条件有敏感的依赖性.
(3)若映射是传递的,则称映射在X上是混沌的.混沌运动具有确定性运动所没有的几何和统计特征,可归纳如下【31】:
(1)随机性,这是混沌 现象的重要特征之一.体系处于混沌状态,是由于体系
内部动力学随机地产生出不规则行为,产生混沌的 系统一般具有整体稳定而局部
非稳定,局部不稳定正是内在随机性的特点,也是对初始条件敏感性的原因 .
(2)分维性,我们说混沌具有分维性质是指系统运动轨迹在相空间(phase
space )几何形态上可以用分形的维数来描述.系统的混沌运动在相空间中无穷地
缠绕,折叠和扭结,构成了具 有无穷层次的自相似结构,这种结构称为奇异吸引
子.
(3)标度性(标度律),混沌现象是一 种无周期的有序态,只有我们的数值计算
精度和实验仪器分辨率足够高时,才可以从中发现小尺度混沌的 有序运动,所以
说具有标度律性质.
(4)普适性,系统趋向混沌状态(即向混沌过度)时所表 现出来的特征具有普
适意义,其特征不因具体系统的不同和系统运动方程的差异而变化.这类系统与Feigenbaum常数6有关.换言之,通向混沌的简单道路是Feigenbaum序列1[An).
在序列值的某个范围,系统的行为是周期性的,周期为T,超出这个范围时周期变
成2T,再超 出下一个阈值时,系统周期变为4T…也就是说,系统在发展时会逐
级分岔,每一周期为前一周期的两倍 ,形成一个倍周期通道。当周期无限制增加
时就要出现非周期行为,这时,系统从简单的周期行为走向复 杂的非周期行为,
走向了混沌.
自20世纪70年代以来,在物理学、数学、力学、化学以及生 命科学、社会
学等领域关于混沌的研究十分广泛,尤其以物理学方面最为突出.几乎在所有的
物 理学领域均发生了混沌现象.


北京交通大学博士学位论文
进入20世 纪80年代后,发现动物的许多器官都是非线性动态系统,并在心
血管系统的动态研究中取得进展,混沌 分析改变了我们对心脏健康的传统观念.
健康的心脏无规律地跳动,似乎总是包含着明显的偶然行为的干 扰,心跳的高度
规则性足以说明心脏的疾病.织物结构具有混沌特征,因为分维数与纤维表面的
光滑、光亮程度直接相关;而纤维的力学强度、纤维的形状、尺寸及织构之间的
相互作用,或磨损、抛光 等均可降级分维数.国外涂料工业已把注意力集中到颜
料粒子尺寸或改变分形结构来改变颜料的光学品质 如不透光性和反射性,这些对
燃料工业及织物的光学性能、美感都有一定的启发性.比如用于织物漂白的 蓝色
颗粒具有吸附紫外线的晶体结构,它们吸收的紫外线辐射能量比可见光(荧光)方
式释放的 能量更多,这是有些白色衣服比某些黑色衣服穿起来可能更热的原因.
地球系统中的许多作用和现象都具 有自组织、分形和混沌特征,说明地球演化至
今已经被永久地锁定在混沌状态.因此,应用混沌理论来研 究和探索地球系统的
奥秘也就自然而然的了.自然界各种图样花纹的选择与生长,或者生物形态的发生过程都在变化无常中展现出内在规律和明显的混沌结构,应用分形方法生长出
来的雪花、霜花、蕨 类植物及等同天然状态极其相似,形成迷人的分形景色为纺
织品的图案设计开拓了十分广阔的道路132 J.
总之,经过近年来的迅猛发展,混沌对改变传统学科划分各研究方法起到了
推波助澜的积极 所用,突破了确定论的束缚,形成了一些新的观念、新的思路和
新的方法,这些对科学技术的发展和应用 的促进作用将是不可估量的.
分形(“Fractal”)这个词是Mandelbrot创造的[33 -34],来源于拉丁文“Fractus’’,
其英文意思是“Broken’’.1975年,obiects
Mandelbrot在巴黎出版了法文著作“Les
dimension ”,1977年在美国出版了其英文版
fractals:forme,basard
and< br>et
“Fractals:form,chancedimension”,它们都可以译为“分 形,机遇和维数
”.同年他又出版了“Thefractal
geometry
ofn ature”,但这三本书对社会的影响
并不大.直到1982年,随着“The
fracta l
geometry
of
nature”第二版的问世,
在美国乃至欧洲迅速 形成了“分形热”.
迄今为止,分形还没有一个严格的定义.
1982年Mandelbrot 将分形定义为
Hausdorff维数大于拓扑维数的集合(集合的拓扑维数总是整数,当它是全不连< br>通时维数为O;而当它的任意小邻域都具有维数0的边界,它的维数为1,并以此类
推).此定义 强调维数,而其中的Hausdorff维数一般不是整数.这个定义有时是
不合理的,因为它把一些明 显应当是分形的集排除了.1986年Mandelbrot[35J给
出了一个更广泛、更通俗的定义 :
“分形是局部和整体有某种方式相似的形’’(“A


第一章
引言
fractal
is

shape
made
oyparts
similar
to
thewhole
in
some
way’’).该定义
强调图形中局部和整体之间(包括小的局部和大的局部之间)的自相似性 .除了几
何图形,还可以研究相空间中的轨迹等图形的自相似性.
称集F是分形,即认为它具有 下面的典型的性质;
(1)F具有精细的结构,即有任意小比例的细节.
(2)F是如此地不规 则以至于它的整体和局部都不能用传统的几何语言来描
述.
(3)F通常有某种自相似的形式, 可能是近似的或是统计的.
(4)一般F的“分形维数”通常都大于它的拓扑维数.
(5)在大 多数令人感兴趣的情形下,
过程产生.
一个质量分布p可能分布在一个区域上,使得质量的集中 程度变化很大.如
果经常发生以下的情形:质量的集中程度具有一个给定的密度,比如说,对于很小F以非常简单的方法定义,或许以递归
的r成立p(耳(z))≈ra(这里的耳(。)为X的r覆 盖),并且不同的集对应于不同
的Q,这就显示了类似于分形的特征.一个具有这类性质的质量分布或测 度肛称
为重分形测度[361.随着重分形理论研究的深入,它已被成功应用到物理学、生物
学 、经济学、地质学、气象学等领域【37】【38|.其原理均是一种基于配分函数的重分
形形式体系.
幂谱是研究分形的重要工具.对于时间序列z(£),z=1,2….,Ⅳ,幂谱是指它
的Fo urier变换的模的平方,即


E(,)=寺Il∑z(t)e_玎112
如果幂谱或幂谱的一部分遵循幂律形式,
时间的倒数,
(1.1)
E(f)o(.厂 ~,其中‘厂是频率,等于
6是幂谱指数,那么我们把满足幂律的频率区间及相应的时间区间
称 为“无标度区间”,即分形关系成立的尺度区间.在无标度区间内,研究对象具
有无标度性,即自相似性 .
配分函数的定义源于统计矩的数学思想.给定时间序列z(t),t=1,2,…,Ⅳ,
首先 把时间序列分割成若干不相交的等值小区间,设<为小区间长度与总区间长
度比值的最大值.记整个区间 流量总和为^彳.
第i个小区间概率密度分布函数为A(<)=丛M业.

北京交通大学博士学位论文
定义统计矩函数(也称为配分函数)
Xq(<)兰∑b(<)r
(1.2)
这里q描述了统计矩的阶,理论上是一个从一o。到+o。的数值.
若统计 矩服从幂律关系
‰(<)=E慨(<)】g。(‘丁(口)
(1.3)
则这个幂律关系 通常反映在双对数关系上.在满足幂律关系的尺度区间,我
们可以通过双对数关系图来确定配分函数7- (g).
丁(g)=觊掣
(1.4)
通过分析-,-(q)与q的关系,如果两者之间 存在着非线性关系,则说明研究对
象具有重分形性;如果-r(q)是g的线性函数,则说明研究对象是 单分形的.
研究时间序列重分形的最好方法就是考察它的奇异谱(也称重分形谱),奇异
谱是利 用一种特殊指数来描述研究对象子集的分形特性.定义如下:
设概率密度分布函数Pi(<)满足幂律关 系鼽(<)。(,(扪,其中Q(i)称为霍尔德
指数,它依赖于第i个小区间.如果对于所有的厶,Q (i)取值相同,则说明研究对
象为单分形的;反之,为重分形时间序列.并把具有相同OL值的小区间 的数目记
为虬(‘),且有如下幂律关系成立.
帆(<)o(q-f(a)
(1.5)
一个复杂的分形体,它的内部可以分为一系列不同Q值所表示的子集.这样,.厂(a)
就给出 了这一系列子集的分形特征,称函数,(Q)为“重分形谱”或“奇异谱’’.当
丁(口)与,(&)可 微时,有勒让德(Legendre)变换【3引.
嘶)=掣川a)=q,oL(g)叫口)
( 1.6)
它建立了独立变量g和7.及独立变量Q和,之间的联系,通常容易求出随q变
化的丁 ,因此,可根据公式(1.6)来求得ce(q)和.厂(a(g)),使得,(Q)相对OL的图通
过 参数口来刻画.如果所研究的对象是单分形的,则函数,(a)为一定值;如果是
重分形,则函数.厂( Q)一般为单峰图像.使,(Q)≥0的区间记为[Qmin,0f一】,其
中,Otm饥=幽dqI口。+。。,Q~=乌笋I。.一。。,,(乜mtn)=,(&~)=0.


第一章引

我们可以用三个参数来描述时间序列的重分形程度,他们分别为厶 眦=,(Qo),
010∈[Q仇溉Qm∞】;区间【Qm溉OEmax】的宽度W=&眦一a碱n,第 三个参数为B,
用最小二次拟合可求得.具体方法如下:在函数。厂(Q)取得最大值处Q的取值Qo< br>附近,用最d、--"次拟合法,拟合的二次函数设为.厂(Q)=A(Q—Qo)2+B(Q—Ct0) +C
其中,参数B表示谱曲线的对称性,当B=0时,谱曲线是对称的;当B>0
时,谱曲线峰 值偏右;当B<0时,谱曲线峰值偏左.通过以上三个参数对时间
序列的描述,说明当.厂(a)的最大 值越大,区间[Olm溉Q~]的宽度w越宽及谱
曲线I厂(Q)对称性越好时,时间序列的重分形性越 强11】.
§1.2本文的主要工作
考虑到时间序列研究在非线性科学研究中的必要性和重要性 ,我们的研究工
作主要分为如下五部分展开:
第一部分是指数趋势对Laplace—DFA模 型影响的研究.针对自然记录中存
在大量的指数趋势现象,提出了将Laplace变换及其滑动平均技 术引入DFA模
型.并且,对于单分形与重分形时间序列,上述技术在消除指数趋势时效果显著,
不仅消除了波动函数的交叉点,还保持了原始时间序列的标度特征.此时,相应
的复合模型成为消除自 然记录指数趋势的最优化充要条件.
第二部分是时间序列的DCCA模型研究.为了研究时间序列交叉相 关性产
生的机理,时间序列自相关性对交叉相关性的影响,以及趋势对交叉相关性的影
响,我们 构造了一类具有重分形交叉相关的时间序列模型.进一步地,就不同滤
波技术与DCCA方法相结合的技 术进行讨论,并运用于不同相关程度的信号,
探讨两组信号经过滤波前后的交叉相关特征.研究结果表明 ,对数平移滤波方法
是性能良好的信号处理技术.上述滤波技术同样可以应用于自然界记录中的去噪处理领域.同时,本文提出多重分形交叉标度指数和多重分形交叉谱的概念,利
用Legendre 变换证明了它们之间的数量关系,进而完善了重分形交叉相关判定
理论.特别地,我们就不同函数趋势对 双组ARFIMA模型交叉性的影响进行了
探讨,本文利用重分形消除交叉趋势理论刻画其交叉相关特征 .
第三部分是利用DFA与DCC么技术探测交通时间序列的相关特征研究.
首先,通过自相关 函数与DFA的对比结果发现,DFA降噪效果更为显著.其
次,为了研究非平稳时间序列的交叉相关的 生成机理,本文定义了正波动时间序
列和负波动时间序列.应用DFA和DCCA理论研究其自相关与交 叉相关特征.


北京交通大学博士学位论文
从而,为交通时间序列的建 模预测以及管理提供了理论和模型支撑.
第四部分是时间序列非线性预测及其应用研究.我们提出了基于 距离权重的
混沌预测模型,在最大Lyapunov指数预测理论的基础上,改善了LinSay相邻点
选取技术,得到了较理想的预测结果,经过实证分析表明,预测精度周期不超过
15天.这些算 法同样为时间序列的非线性预测及其应用方面提供了算法的理论框
架.
第五部分是基于CSVD —DFA模型的指数趋势最小化研究.针对自然记
录,尤其是具有混沌特征的时间序列中存在着指数趋势 现象,将混沌奇异值分解
算法引入DFA模型.在单分形与重分形的条件下,上述滤波技术在处理指数趋
势时效果显著,不仅消除了波动函数的交叉点,还保持了原始时间序列的标度特
征.从而,CS VD—DFA模型为消除混沌时间序列的指数趋势提供理论模型与
算法支撑.


第一章


10


第二章
消除指数趋势对La place—DFA模型影响研究
指数趋势存在于众多的自然记录中,如结核病的发病率、物价指数、生 产资
料价格指数等.同时,自然记录中的众多噪音也是以指数趋势存在.在探讨研究
对象的主要 趋势时就需要对这些指数趋势进行有效的“过滤”.
消除趋势波动分析方法(DFA)是Peng[6】 【39】等在研究核糖核酸行为机制过
程中提出来的一种分析幂律函数的模型,现已成功地应用于生命科 学、地质学、气
象学和水文学等领域,被证明是检测非平稳时间序列长相关特征最重要、最可靠
的工具之一.2002年,Kantelhardt[1】等在一维分形DFA的基础上将其推广,
并与 基于标准配分函数的重分形公式体系联系起来,提出了MF—DFA模型.
该模型可以对平稳和非平稳的 时间序列及涨落标度性进行度量,为重分形谱的估
计提供了有力的工具.然而,MF—DFA模型只能消 除多项式趋势,不能消除
其它趋势.因此,我们需要找出其它方法.本章我们将在这方面做一些尝试.针
对自然记录中存在大量的指数趋势现象,提出了将Laplace变换及其滑动平均技
术引入D FA模型.并且,对于单分形与重分形时间序列,上述技术在消除指数
趋势时效果显著,不仅消除了波动 函数的交叉点,还保持了原始时间序列的标度
特征.此时,相应的复合模型成为消除自然记录指数趋势的 最优化充要条件.
§2.1模型与算法
§2.1.1MF—DFA模型
设时间序列z七 ,七=1,2…是紧支集,MF—DFA的步骤如下【1】:
第一步,求序列对于均值的累积离差y(z ):

v(i)=∑IXk--<z>】,i=1,2,…,N
七=1
(2. 1)
其中<z>是序列。耙的平均值.
第二步,分割序列v(i)成等长小区间.将序列v(i )分成Ⅳs=int(-警)个互
不重叠的小区间,每个小区间均含有s个数据.由于Ⅳ未必整除s,则 Y(i)将有
一段剩余,为了使序列v(i)的全部数据进入计算,再从序列v(i)的尾部重复这一分割过程,于是得到2Ⅳs个等长小区间.
第三步,用最/5-次拟合法求均方误差F2(s,u ).
11


第二章
消除指数趋势对Laplace-DFA模型影响研究
设可口(i)是第V个小区间的拟合多项式,当V=l,2,…,Ⅳs时,有
1S
F2 (s,u)三妄E{y[(u—1)s+i】一纨(t))2

(2.2)
f=1当V=Ⅳs+1,Ⅳs+2,…,2Ⅳs时,有
1S
F2(s,臼)三妄E{Y[N一(u 一Ⅳs)s+i]一蜘(i))2
口{=1
(2.3)
这里拟合多项式纨(i)可以是 一次的,二次的,三次的,…一般记为MF—DFAm,
m是拟合多项式的阶数.
第四步,对于 2Ⅳs个区间,求F2(s,")的平均值,得口阶波动函数B(s),

删三‘瓦至瞅s卅弦
当q=0时,波动函数可以由下式确定,

2N,
,1
(2.4)< br>Fo(s)三e印_[砜1脚E
1n瞰s,u)】)
2肌
(2・5)
当 q=2时,MF—DFA就退化成DFA.当口<o时,‘(s)的大小主要取决
于小波动偏差F2(s ,V)的大小.而当q>0时,B(s)的大小主要取决于大波动偏
差F2(s,V)的大小.这样,不 同的口就描述了不同程度的波动对日(s)的影响.
第五步,分析B(s)与s的双对数函数,确定波动 函数的标度性.R(s)是q
与8的函数,且对于较大的s,B(s)以幂律形式增加,即
日( s)~sh(口)(2.6)
这里h(q)称为广义赫斯特(Hurst)指数,当序列是平稳时间序列 时,h(2)称
为Hurst指数.通常,波动函数R(s)是s的增函数,做出lnR(s)对lns 的函数
关系图,求出ln‘(s)相对于lns的变化斜率,其斜率即为所得的标度指数^(g).为了使R(s)有较高的稳定程度,通常s的取值不超过譬.当序列(z七),为一单
分形时,偏差 F2(s,u)在所有区间的标度行为是一致的,从而h(q)独立于g为一
常数.特别的,当序列(z 七),不相关或短程相关时,
为g的函数时,序列(观),为多重分形.
然而,
九(g )={;当九(g)依赖于g
MF—DFA方法仅能确定正的广义Hurst指数h(q)的信号性质.
12


北京交通大学博士学位论文
当h(q)趋于0时,信号表现出强的 逆相关,此时,MF—DFA方法不能准确地确
定信号的性质,这就需要修正MF—DFA过程.最简单 的方法就是在MF-DFA
方法之前,在第一步中两次求累积离差,方法如下:
夕(i)三∑[ y(忌)一<y>】
以下步骤同MF—DFA方法,我们得到广义的波动函数B(s),
(2. 7)
只(s)一sh(g’
(2.8)
对于大的标度,有元(g)=九(g)+1.假 设序列z_Ic为长度为N的稳定时间序列,
那么在用MF—DFA方法分析此稳定时间序列时,就可以 省略第三步的消除趋
势过程,也就是所谓的传统的波动分析法(简记为FA).用FA方法进行分析,< br>此法的第一步,第二步同MF—DFA方法,在第三步中方程(2.2)改为
睇A(s,u)三[ Y(vs)一y((u一1)s)]2
将(2.9)式代入(2.4),(2.6)式可得
(2 .9)
.[瓦简№)一m一1)s)限”删
.[雨1F
2N,Z
ly(us) 一y((u一1)s)l。)j。sh(口’
(2.10)(2-10)
我们考虑简单的情况, 这里假设N是s的整数倍,即Ⅳs=譬这样可得
∑IY(vs)一y((u一1)s)l口一s咖(g) 一1
由方程(2.1)可得,
t,S
(2.11)
Y(vs)一y((口一1 )s)I=∑z七=Ps
V)
k=(v-1)s
(2.12)
标度指数7-( g)是由配分函数乙(s)来定义:


磊(s)=∑IPs(")I口一s丁(口’
v=l
(2.13)
由方程(2.11),(2.12),(2.13)得到
r(q)=qh(q)一1
13
(2.14)


第二章
消除指数 趋势对Laplace-DFA模型影响研究
这样,我们就得到了MF—DFA方法中定义的广义Hur st指数h(q)与传统方
法中的标度指数7-(口)的关系.勒让德(Legendre)变换【1】 =
口=TI(口);,(Q)=g&一7.(g)(2.15)
根据勒让德(Legendre )变换式和(2.14)式,得到重分形谱,(Q)和广义Hurst指
数h(q)的关系式:
Q=h(q)+qh7(g);,(Q)=口陋一^(口)]+1(2.16)
如果研究的时间序列是单 分形的,则函数.厂(Q)是一定值;如果时间序列是重分
形,则函数,(a)一般为单峰钟形图像.使 .厂(a)≥0的区间记为[Qm溉&仃眦】,其
中,
Qmin=垒二d皿q
lP+∞ ,
Otmax=塑d皿q
Ip一∞,且-厂(Q眈n)=,(Qm∞)=0,我
们可以 用三个参数来描述时间序列的重分形程度,他们分别为厶眦=.厂(&o),
Olt)∈[OLmin, Olmax】;区间[OLmin,乜m∞】的宽度W=Q眦一a,n溉第三个参数为B,
用最dx-- 次拟合可求得.具体方法如下:在函数,(0f)取得最大值处Q的取值∞
附近,用最/J、--次拟合 法,拟合的二次函数设为,(Q)=A(&一50)2+B(a-ao)+c
其中,参数B表示谱曲线的 对称性,当B=0时,谱曲线是对称的;当B>0
时,谱曲线峰值偏右;当B<0时,谱曲线峰值偏左. 通过以上三个参数对时间
序列的描述,说明当,(Q)的最大值越大,区间Ia戚。,Q。。】的宽度w 越宽及谱
曲线,(理)对称性越好时,时间序列的重分形性越强【1|.
§2.1.2Lapl ace算法
法国数学家Pierre—Simon
Laplace(1749—1827)引入 的积分变换可以巧妙地
将一般常系数微分方程映射成代数方程,奠定了很多领域,如电路分析、自动控< br>制原理等的数学模型基础.本文将介绍Laplace变换及其逆变换的定义与性质.
一个时域函 数f(t)的Laplace变换可以定义为
z帅)】_上∞)e-3tdt=F(5)
式中,
(2・17)
Z[.厂(£)】为Laplace变换的简单记号.
下面将不加证明地 列出一些Laplace变换的性质.
(1)线性性质.若a与b均为标量,则Z[o,(z)4-bg (t)】=oZ【,(z)】4-6Z[夕(£)】.
(2)时域平移性质.Z[,(艺一口)】=e- asF(s).
】4


北京交通大学博士学位论文
(3)s一域平移性质 .zle咄‘f(t)J=F(s4-a).
(4)微分性质.
求出.
z[辔]=sF (s)一f(o+),一般地,n阶微分方程可以由下式
z[杀弛)】_S吲s)_¥n-I加+)-s 棚掣一.o
o_可dn-af丁(O+)(2.18)
若假设函数,(£)及其各阶导数的初值 均为0,则式(2.18)可以简化成
z【掣】=s吲s)
此性质事实上是微分方程映射成代数 方程的关键式子.
(2.19)
(5)积分性质.若假设零初始条件,
z[后.厂(7 .)d7-】=掣,一般地,函数f(t)
(2.2。)
的n重积分的Laplace变换可以 由下式求出.
引Zt/02竹M=掣
(6)初值性质.
{i.mo邢)2熙sF(s)
(7)终值性质.如果F(s)没有s≥0的极点,则
(2・21)
恕∞)2
1i—mo
sF(s)
(8)卷积性质.Z[.厂(艺)木夕(t)】=Z[.厂(t)】Z1 9(£)】,卷积算子车的定义为
(2・22)
,(t)车夕(z)=/02,(丁)夕(t一 丁)d丁=/o。,(亡一丁)夕(丁)d丁
(9)其它性质.
‘(2.23)
州∽J _(-1)凡掣卅等】=■./。。耶№n
Laplace逆变换
(2.24)
如果已 知函数的Laplace变换F(s),则可以通过下面的逆变换公式求出其
(2.25)
m) =z一1[F(s)]。丽1一faa+,j∞。。F(5)e82ds
其中,gr大于F(s)奇点的 实部.


第二章消除指数趋势对Laplace—DFA模型影响研究
最近几年来 ,国际上众多学者基于多种滤波技术发展了MF—DFA模型来
消除时间序列的噪音[9-151.但是 ,对消除时间序列指数趋势的研究却很少.在本
节中我们提出基于Laplace变换的MF—DFA模 型,此模型不但能够有效消除
时间序列中的指数趋势,而且可以保持时间序列的标度特征.
第一 步,给定满足幂律分布的时间序列u(k)和指数趋势t(k)=AeB寿,k=
0,1,…,Ⅳ一1. 因此,复合时间序列由下式给出:
x(k)=札(尼)+t(k)
第二步,对时间序列z(七) 进行Laplace变换
^r一1
(2.26)
z[z(七)】三x(z)=E
z(七)z一七
k=O
(2.27)
其中,z∈C一{o).
第三步,令< br>x4(z)=Azk(七一1)]+(1一入)Z陋(七+1)】
这里的实参数:
入:0 <入<1.
(2.28)
第四步,确定滤波数据的逆Laplace变换:
z+(尼) 2南舡RX+(z)・少。dz
这里J=√=T,并且R(>o)为较大的实数.
影响程度降到 最低.下面通过单分形和重分形时间序列来验证此模型算法.
(2.29)
我们就把此滤波技术 与MF—DFA模型相结合,使指数趋势对时间序列的
§2.2基于Laplace.DFA模型的指数 趋势最小化效应
§2.2.1
具有指数趋势的单分形时间序列
将上述滤波技术应用于具 有指数趋势的单分形时间序列,即满足幂律长相关
的时间序列.在此,我们采用修正的傅里叶技术…生成 长度为6680的单分形时
间序列u(尼),它的标度指数为o.800.指数趋势为t(k)=AeB 嵛(A=B=1),因
而,复合时间序列为z(尼)=乱(七)+£(尼),k=0,1,…,Ⅳ一1. 利用滤波模型对复合
时间序列进行研究,得到时间序列z+(尼).分析结果如下:
16


北京交通大学博士学位论文
图2—1具有指数趋势单分形时间序列的波动函数
在图2一l(a)中是MF—DFA应用于人造单分形数据的情形,其中拟合
多项式阶数分别为m=2, 4,6,8.从双对数图中得到与预期标度指数一样的值
a=O.800.对具有指数趋势的单分形时间 序列进行研究时发现,其波动函数出现
了交叉点[如图2—1(6)】.交叉点的重要作用在于:提示我 们,复合时间序列并不
像原始单分形时间序列那样满足统一的幂律关系.不管采用多高阶的拟合多项式< br>17


第二章
消除指数趋势对Laplace-DFA模型影响研究
(m=2,4,6,8),还是低阶的拟合多项式,由于指数趋势导致的交叉点总是除之不
去.因指数 趋势造成的波动函数发生扭曲,呈现非线性波动状态.在此条件下,
在整个标度区间内我们将无法得到统 一的标度指数.然而,经Laplace模型技术
处理后,复合时间序列的波动函数在整个标度区间内又 满足幂律分布.而且,检
测到标度指数Q=o.802(如图2—1(c)),与单分形时间序列的标度 指数十分接近
(如图2—1(n)).因此,上述滤波模型在处理具有指数趋势的单分形时间序列时,< br>会把指数趋势效应降到最低,由MF—DFA模型得到的标度指数与单分形时间
序列相差无异.研 究结果表明,基于Laplace算法的MF—DFA模型可以有效
除去单分形时间序列的指数趋势.< br>§2.2.2具有指数趋势的重分形时间序列
z七=an(卜1)(1一o)竹m。z哪(k-1 ),
二项式序列是一种特殊的重分形时间序列。
这里0<a<1,k=1,2….,Ⅳ,N=2 nm一,礼(七)是把十进制的k表示成二进
制后1的个数.如n(13)=3,即十进制的13表示成 二进制为1101,有3个1.
Kantelhardt【1J不仅证明了此序列为重分形序列,而且还 推导出它的配分函数和
标度指数的具体形式.
图2—2是重分形、附有指数趋势的重分形和滤波 后的时间序列波动函数趋
势图.由图可见,推广的乘积阶次模型不仅对口>0的阶数进行表征,还适用于
口<0的阶数,表明该模型可以对重分形时间序列的特征进行精确描述.同时,图
2—2(a) 表明,当q=一25:7:25时,重分形时间序列的波动函数整体呈现幂律
分布状态,这和文献“Mu ltifractal
time
detrendedfluctuation
anal ysis
of
nonstationary
series”的结果保持一致,在此就不 再赘述.
为了确定基于Laplace变换的MF—DFA模型对重分形时间序列的影响
效应, 我们以二项式重分形时间序列为例,对其附加指数趋势t(七)=AeB青,七=
0,1,…,Ⅳ一l, 这里的A=B=1.图2—2(b)为指数趋势重分形时间序列的波
动函数趋势图.由图可见,具有指数 趋势重分形时间序列的波动函数出现一个很
大的交叉点,而这个交叉点把波动函数撕裂为两种不同的幂律 分布,显然,这不
是我们想要看到的结果.
图2—2(c)是由滤波模型处理具有指数趋势重分 形时间序列的波动函数状态
图.我们发现,经滤波算法处理后不仅除去了波动函数的交叉点,而且保持了 时
间序列的本质特征.研究结果表明,基于Laplace算法的MF—DFA模型可以
有效除 去重分形时间序列的指数趋势.
18


北京交通大学博士学位论文




v叮



u-

图2-2具有指数趋势重分形时间序列的波动函数
类似地,我们同样能够证明,基于Lapla ce算法的MF—DFA模型在研究
以交通流时间序列为代表的自然记录时效果显著[411
1 9


第二章
消除指数趋势对Laplace-DFA模型影响研究
§2. 3主要结果
通过基于Laplace变换的MF—DFA模型对单分形和重分形时间序列进行
研 究,研究结果表明,此模型能够有效消除指数趋势而不影响时间序列的标度特
征.然而,一般的滤波技术 还不是能把任何干扰趋势降到最小化的推广工具.不
论是理论还是经验数据都需要进行深入地研究.20


第三章时间序列DCCA模型研究
Dangeti[42】在其博士毕 业论文中讨论了以高斯噪音为代表的五类噪音,同时
设计了基于图像噪点的线性滤波(包括线性平均滤波 和最/J、--次平均自适应滤波)
和离散小波变换滤波模型,并结合二维图像进行了实证分析.
Chen[8】首次给出
了基于一维时间序列的线性、非线性多项式、指数函数、对数函数的滤波算法 ,
可以看出,这几类滤波技术是非常简便且效果极佳的滤波算法.迄今为止,这些
滤波技术仅仅 以图像以及一维时间序列为研究对象,而对两组时间序列的交叉相
关性的影响一直未有研究.因此,我们 采用线性、非线性多项式、指数函数、对数
函数的滤波算法来研究它们对两组时间序列交叉相关特征的影 响问题.
传统的时间序列分析模型主要有自回归模型(AR),滑动平均模型(MA),自
回归 滑动平均模型(ARMA),自回归求和滑动平均模型(ARIMA)以及乘积季节
ARIMA模型(S ARIMA)模型等,这些模型主要是短记忆模型.近年来,人们
对失业率、GDP、汇率等多种数据的 研究发现,远距离观测值间的相互依赖性
尽管很小,但是仍不能被忽视,即其具有“长记忆性”.分整自 回归移动平均模
型(ARFIMA),又称分形差分自回归模型)是一种长记忆模型,它是由Grang er
和Joyeux(1980)[43】以及Hosking(1981)[44】在ARIMA模型 的基础上构建的,
广泛用于时间序列研究.Podobnik[45烨6J等在一维ARFIMA模型基 础上建立了
二维ARFIMA模型,此模型一经发现就迅速应用于两组时间序列交叉相关性的
研 究.其中,Podobnik[46】就正弦函数对双组ARIMA模型的影响进行了深入研
究.受此启 发,我们研究幂函数、指数函数和对数函数对双组ARIMA模型的影
响,探讨非平稳时间序列交叉相关 性产生的机理问题.
§3.1
§3.1.1
ARFIMA与MF—DCCA模型
R/S模型
Range
R/S分析(Re—scaled
Analysis)最早来 自于水文学【4
71,又称为重标
极差分析法.Hurst率先运用该方法对尼罗河潮汐数据进 行了研究,发现水文时
间序列中的长期记忆性,随后该方法被广泛运用到流体学、气象学等自然科研领< br>域.它与传统的方法(如自相关分析,谱分析等)相比,
R/S分析是侦测长相关
性方面 的一个更为有力的工具.它主要通过Hurst指数的计算来侦测时间序列中
的长相关陛.
21


第三章时间序列DCCA模型研究
Hurst指数反映了时间序列均值的累计离 差随时间变化的范围,并且Hurst
建立了以下关系:
(芸)丁:c丁日
其中,为常数,日为Hurst指数.
(3.1)
R为时间序列的极差,S为标准差(即重标极差 ),丁为时间间隔,C
设已知时间序列为{已)墨。,7-为时间间隔,则7-个时间序列数据的均值为
(联)丁=圭∑已
由此,可求得累计偏差
(3.2)
x(i,7-)=∑‰一 (E∈)丁】=∑已一i(E∈)丁,(1≤i≤7-)
极差
(3.3)
冗(7I)= maxX(i,7.)一minX(i,丁),(1≤i≤7.)
标准差
(3.4)
s (7.)={=1∑陈一(E∈),】2){
(3.5)
根据(3.1),一旦通过(3.2) 一(3.5)估计出来R/S,则Hurst指数可通过最小
二乘法回归计算出
ln躲-ln( 卅Hln(N)
其中0≤H≤1.
(3.6)
如果时间序列具有分数Brown运动特 性,给定一个从一t到0的过去增量
(匈一z—t),与未来增量(忍一Zo)的相关系数为
∞ ,=警掣,
22
因为
E[(Zo—Z—t)+(zt一徇)】2=E[旎一Z-t】2 ,
代入上式整理有
㈣:—(2t)矿2H--2t2H:22肭一1.
根据上式有如下 结论:


北京交通大学博士学位论文
(1)当日=百1时,c(t)=0,这标志 着时间序列是随机的,事件是随机和不相
关的,即过去与将来不存在相关性,时间序列为完全独立过程.
(2)当{<H≤l时,则暗指正相关,该时间序列具有持久性或为外力强制
主导序列,即如果 过去有一个增加,那么在平均意义上,未来也有个增加.序列
具有长记忆性.
(3)当0≤H< 虿1时,则暗指负相关,该时间序列具有抗持久性,表现出一
定的期望恢复行为,即过去的减少趋势使未 来可能出现增加趋势.
§3.1.2一维ARFIMA模型
一维ARF,^彳A(,r口c抚D n022掣n乱艺D—re夕ress讥7e
模型定义如下㈨:
o。
integrat ed
moving-average)
Xt=∑OLn(d)zt一竹+8t
rt一- --1
(3.7)
这里,一0.5<d<0.5,d=H一0.5(H为时间序列Xt的Hur st指数,在本
篇论文中我们利用R/S模型得到).包是满足高斯分布的变量:(岛)=0,(E;) =1.
an(d)是满足‰(d)=dF(n—d)/(r(1一d)r(扎+1))的常数.r为Ga mma函数,
n为时间标度.
§3.1.3双组ARFIMA模型
欲探测两组各自满足 幂律自相关变量兢和Y。的交叉相关特征,我们计划采
用双组ARFIMA模型来重构两组时间序列,具 体过程如下【46】:
Xt=[WXt+(1一w)M】+毛
Yt=[(1一彤)Xt+彬K】 +磊
o。
(3.8a)
(3.8b)
(3.8c)
五=∑an(d1 )Xt—n
n=l
oo
+K=∑an(d2)Yt—n
n=1
(3. 8d)
此处,g。和磊为满足高斯分布的变量:
(旬)=(磊)=0,(《2)=(磊2)=1 ,
‰(d1)和ore(d2)同时满足r函数的关系式‰(d)=dr(n—d)/(r(1一d)r (n+1)),
d1和d2为标度参数(0≤dl,2≤0.5,dl=H1—0.5,d2=H2—0 .5,H1和吼分别
为变量五和M的Hurst指数),w是力偶参数(0.5<W<1).

< p>
第三章时间序列DCCA模型研究
§3.1.4MF.DCCA模型
我们把Pod obnik提出的DCCA方法拓展到重分形领域,从而,形成重分形消
除交叉趋势波动分析(Mult i—Fractal
DetrendedCross—Correlation
Analysi s,
简称MF—DCCA)模型.具体过程如下:
给定两组时间序列{觑)和.【z:),i= 1,2,…,Ⅳ,Ⅳ为上述同距时19序列的长
度.MF—DCCA模型主要分为五个步骤:
第 一步,求两组序列对于均值的累积离差K和×’(对于i=1,2,...Ⅳ):
M三∑陬一(z)】< br>(3.90)
七=1

《三∑嗽一(z’)】
(3.9b)
k ----1
第二步,取定标度S,分别划分M和×’成等长度盒子.
第三步,分别将序列M和× ’分成Ⅳs三int(Ⅳ/s)个互不重叠的小区间,每
个小区间均含有S个数据.由于Ⅳ未必整除S, 那么K和《将有一段剩余,为
了使序列×和×’的全部数值点进入计算,再从序列M和×’的尾部重复这 一分
割过程,于是得到2Ⅳs个等长小区间.
第四步,在划分的小盒子内,求协方差尼CCA( s,u):
尼CCA(s,u)三=1∑(K一欧,∞)(《一《,。)
(3.10)
。k=l
设K,秒和Y’七,u是第V个小区间的拟合多项式,当口=1,2,...,2Ⅳs时得到波
动函数:
碍ccA三{嘉∑%CCA(刚)]价/)1/g
(3.11)
。o ’s
t,=l
第五步,为为探究两组时间序列的标度状态,作出波动函数璐ccA(s)关于标
度S的双对数图.若两组时间序列{既)和{z:),i=1,2,...,Ⅳ,满足交叉相关特
征,则玛ccA(s)关于标度S有如下关系成立:
码cc月(s)一Sh。cc^(g)
( 3.12)
此处的hDecA(g)即为刻画两组时间序列{z0和{z:)交叉相关特征的指数,称之为广义交叉Hurst指数.当q=2时,h(2)=A,MF—DCCA即为如前所
述的DC CA模型.
24


北京交通大学博士学位论文
类似于MF—DFA模型, 由MF—DCCA模型也可得到重分形交叉标度
指数TDCCA(q):
TDCCA(q)=q hDcCA(q)一1(3.13)
TDCCA(q)是衡量两组时间序列间是否满足重分形交叉相关性 的标准,若两组
时间序列满足重分形交叉相关特征,则它们的TDCCA(q)为曲线;反之,TDCC A(g)
为直线.
当7-DCCA(q)为直线时,ADCCA为常数.
当7"DCC A(q)为曲线时,利用Legendre变换推导出如下方程式:
ADccA=艺CCA(g)
fDCCA(入OCCA)=q入DCCA—TDCCA(q)
进而,得到:
(3.14a)
(3.14b)
入DCCA=hDCCA(q)+口九,DCCA(g)
,DccA( 入DccA)=q[ADCCA—hDCCA(q)】+1
(3.15a)
(3.15b)其中,ADCCA为两组时间序列交互信息的霍尔德指数,foccA(ADCCA)为其
相应的重 分形交叉谱.
通常情况下,fDCCA(ADCCA)≥0的区间为[maXlDCCA,min入DC CA].
rain),
=’
ACCDAz
口—_+。o
rZm61. 3(
lj.ioa、)
一d1'DC仃C仃A(q)Ig一佃

=‘
∞q
Iq一一00(一-j.…lbo、)
一一

且fDCCA(maxAD CCA)=fDCCA(minADCCA)=0,我们可以用三个参数来描
述时间序列的多重分形程度 ,它们分别为:maxfDCCA=foccA(Ao),Ao的取值范
围为[minADCCA,ma XADCCA],区间[minADCCA,maXADCCA】的宽度AADCCA,第
三个参数为B ,用最小二次拟合可求得,具体方法如下:在函数fDCCA('入DCCA)取
得绝对最大值Ao附件 ,用最IJ、-"次拟合法,拟合的二次函数设为;
fOCCA(AOCCA)=A(ADCCA一入o )2+B(ADCCA一入o)+c(3.17)
其中,参数B表示谱曲线的对称性.当B=0时,谱曲 线是对称的;当
B>0时,谱曲线峰值偏右;当B<0时,谱曲线峰值偏左.通过以上三个参数
对两组时间序列交叉性的描述,说明当fDCCA('XDCCA)的绝对最大值越大,区间
[minA DCCA,maXADCCA】的宽度A,\DCCA越宽,谱曲线fDCCA(ADCCA)对称性越
好时,两组时间序列的交叉多重分形性越强.


第三章时间序列DCCA模型研究
§3.2基于多种滤波技术的DCCA研究
§3.2.1多项式滤波
对两组能够确定其标度指数 的时间序列{zd和.[纨),相应的标度指数为71
和仇.分别对时间序列.【魏)和{Yi)进行多 项式变换,然后利用DCCA模型对它
们进行交叉相关特征研究[请见图3—1】.
图3—1基 于多项式滤波的DCCA分析
首先,考虑对两个不相关时间序列(白噪音)分别实施三种多项式滤波后的
交叉相关性质[如图3—1(o)].结果表明,两组不相关时间序列的参数入为原始信
号自相 关指数71和他的均值:A=0.5.线性滤波不改变两组时间序列的交叉标
度函数波动趋势,两组时间 序列分别经二次多项式滤波后相应的入=o.75,两组
时间序列分别经三次多项式滤波后对应的参数入 =0.65.综上所述:对两个白噪
音时间序列分别进行非线性多项式滤波后,会使其参数入发生变化, 同时交叉相
关波动函数呈幂律趋势.
两组反相关时间序列(71<o.5,讹<o.5)分别经 线性滤波后,它们的交叉参
数A不发生改变[如图3—1(6)】,仍为o.3.经二次多项式滤波后, 参数入=0.5,经
三次多项式滤波后,参数A=o.35.可见,对两组反相关的时间序列进行非线性
滤波,改变了它们的参数入,即使两组时间序列的交叉相关性特征发生改变.
与反相关时间序列 不同,两组相关的时间序列经过线性滤波后,参数入为原始
自相关指数的,y1和72的均值[如图3— 1(c)所示】:,y1=o.6,仇=0.7,而A=o.65.
26


北京交 通大学博士学位论文
不过,两组时间序列经过二次和三次多项式滤波后,参数A呈现杂乱的波动状态,< br>没有出现幂律趋势,或是出现某一段短暂幂律趋势后又变得杂乱无章.
我们注意到,不论对两个强 相关时间序列进行何种多项式滤波,不影响参数
A的数值[如图3—1(d)所示】:参数入为原始时间 序列自相关指数饥和他的均值.
综上所述,对两组时间序列分别进行多项式滤波后,会破坏两时间序列的 交
叉相关程度.参数入为自相关指数7,和72的均值.除相关时间序列外,滤波前
后两组时间 序列的交叉表度函数均呈幂律趋势波动.
§3.2.2幂函数滤波
我们考虑幂函数hi=(Zi +凸)m,-1<乞<1,i=1,2,...,Ⅳ,这里a和m均为
正常数.对两组时间序列xi)和 {玑)分别进行幂函数滤波,利用DCCA模型探
测它们的交叉相关标度特征.

。< br>2
,一,’i。i绪
彳爹ooo,-i

。。
。5
3 4

富1
j。
一'
o--0"o
“ll即。厂・。1“_・ ”-01

zI
..—t
彦琢一
oo矿

35
5‘
‘懒”“州叼”8_却6・铲-,?
∥V.。。—拶
d蔓■
O-65


∥广<,7.^’
…p10‘’
一0.5
a tlO一3


‘L-o・5
j:

图3.2基于幂函数滤 波的DCCA分析
不失一般性,令m=-0.39,对于两组不相关时间序列(白噪音)[如图3-2( a)
所示】,我们发现随着参数a的增大,交叉相关波动函数FDCCA(8)震荡加剧,而
且 出现较多的交叉点.当标度s较小时,FDCCA(¥)满足幂律分布,同时入=0.5.
对两组反相关 时间序列进行幂函数滤波后[如图3-2(b)所示】,FDCCA(8)整体趋势
发生变化:不再光滑 ,出现较多的交叉点,并且随着参数a的增大,FDcca(s)趋
于平滑.相关和强相关时间序列经过 幂函数滤波后,交叉相关波动函数-%ccA()
不再满足幂律分布,仅仅是依赖于s的递增函数.由此 得出结论,幂函数滤波彻
底颠覆了两组时间序列交叉相关的标度性.
27


第三章时间序列DCCA模型研究
§3.2.3指数滤波
在这里我们采用指数函数为hi=e (。≈+引,一1<zi<1,i=1,2,...,N,其中,c
和a均为正常数,此处取c=1.图 3—3是两组时间序列经指数滤波的如.ccA(s)
波动图.
图3-3基于指数滤波的DCC A分析
研究结果表明,两组不相关的时间序列对其进行指数滤波后,交叉相关波动
函数FDCC A(¥)仍满足幂律分布[如图3-3(a)所示】.随着参数a的增大,YDccA(s)
愈发远离初 始轨迹,参数A变为o.52,大于原始时间序列的交叉标度指数的均值.
反相关时间序列也具备类似的 交叉相关特征[如图3-3(b)所示].经过指数滤波后
两组相关时间序列的交叉相关波动函数FDC CA()不再满足幂律分布[如图3-3(c)
所示】.两组强相关时间序列经指数滤波后,参数A不发 生变化,为1.15,是两组
时间序列自相关指数的均值【如图3-3(d)所示].
§3.2 .4对数滤波
对数滤波的一般形式为:hi=l0910(忍+盘),o<Zi<1,i=1,2,.. .,Ⅳ.图3—4
是时间序列经过对数滤波后的如ccA(s)一s双对数波动图.
不难看出, 两组不相关和反相关时间序列经过对数滤波后,它们的交叉标度
函数FDCCA对s均表现为幂律趋势. 随着a的增加,见,ccA越来越接近原始轨
迹,同时参数入随之减少[如图3—4(口)和3—4(6 )】.两组相关时间序列经对数滤
波后,FDCCA不再满足统一的幂律分布,而且出现较多的交叉点[ 如图3—4(c)】.
2R


北京交通大学博士学位论文
两组强相关时间 序列经对数滤波后,FDccA的标度特征不发生改变,参数入是
两组原始时间序列自相关指数的均值[ 如图3-4(d)].
图3—4基于对数滤波的DCCA分析
§3.2.5对数平移滤波
对数平移滤波是一种常见的时间序列与处理技术,尤其是在探讨系统内部的
相关特征时,一般先利用对 数平移技术做去噪处理.我们将研究对数平移滤波对
两组时间序列交叉相关性特征的影响.
给定 两组时间序列:
{兢)和{玑),7・和仇是相应的自相关指数.为保证所
有的值均为正,不妨 做平移预处理:
{兢)弓{Xi+△),{玑)毒1(玑+人),这里
的△=-二zm饥+£, 人=一Yi+E,Xm饥是时间序列'[以)的最小值,
Ymin是时间
序列.(玑)的最小值 ,£称之为补偿参数.如前所述,线性滤波不改变两组时间序
列的交叉相关性,因此,首先对两组时间序 列{鼢)和{犰)进行对数平移技术处
理:
{l0910(戤一zm饥+£))和{loglo (yi—Ymin+E)),最后利用DCCA模型对新
时间序列进行交叉相关特征研究.
对两 组不相关时间序列分别进行对数平移滤波后,不改变它们的交叉相关特
征【如图3—5(凸)】,在整个 标度区间内参数A=0.5,随着补偿参数的增加,滤波
后的交叉相关波动函数FDcca(s)逐渐远 离原始波动状态,同时愈发光滑,参数
A=(71+"y2)/2.
反相关,相关和强相关时间 序列经过对数滤波处理后均是如此情形,它们的
参数入分别为o.3[如图3-5(b)],0.65[ 女Ⅱ图3-5(c)】和1.15[如图3-5(d)].
29


第三章时间序列 DCCA模型研究
综上所述,对数平移滤波不改变两时间序列的交叉相关特征,而且能够去掉
交 叉相关波动函数的噪点,为一种有效滤波技术.
‘。籼一冀≥“—一
●一,t・,_t”。,. .‘
__
一一Ⅲ一
.:
∞帅■=1:竺。槲伊
t一一一.一j。f" 一。.,一
一一
●一一一_一●_●
[≥一

≥::
109 1。(11m..

、——一,
I————一
2.533.5
一f110
44.555.
一一£t1Do
E‘'O一1
扣伽~一冀梦■ 攀
J,f。,一。

一一p'O‘2

(d)sb舯口ly。训一・ ・卵B“了一1。k叫2
●,一’
一一一’。
。二莎一
r’一t,,一’’’ 4
壹:
—3
。掣!哆
.一一
÷j乡一
图3—5基于对数平移 滤波的DCCA分析
§3.3多种趋势对MF—DCCA模型的影响
§3.3.1幂函数趋势< br>在本节我们将探究幂函数趋势对两组时间序列交叉相关特征的影响.在式
(3.8a),(3.8 b)中分别附加幂函数趋势[(t/N)+e]m,t=1,2,…,Ⅳ,构成基于幂函
数趋势的双组A RFIMA模型,下面我们给出其理论框架:

觑2[wx+(1一w)吲+(寿+e)“+钇

(3.18凸)
(3.186)
(3.18c)
(3.18d)< br>玑2[(1一w)K+wK]+(寿+e)“+邑

Xt=∑an(d1)五一n
n-----1

K=∑a,。(d2)Yt—n
n=1
上述算法包括七个 参数,其中力偶参数W=o.69,标度参数d1=o.24和
d2=o.41,系数参数‰(d・)和 ‰(如),高斯随机变量£:和邑,在前面已有介绍,在
此不再赘述.在本节中,我们不妨将参数e分别 设为10一,10一,10_1和0,而指
数参数m=一o.39,长度参数N=5000.
3 0


北京交通大学博士学位论文
在^,F—DCCA模型中,我们的标度参数为s =10:10:200,局部指数参数
q=-6:0.61:6.至此,基于幂函数趋势的双组ARFI MA算法和^,F—DCCA
模型建立完成.值得一提的是,上述算法和模型具有普适性.
对于 给定自相关指数分别为O.24和o.41的时间序列X和K,利用双组
ARFIMA模型对它们进行重 构后,其广义交叉Hurst指数hDCCA(q)和重分
形交叉标度指数TDCCA(q)结果如下:
图3-6基于双组ARFIMA模型的广义交叉Hurst指数与重分形交叉标度指数
波动图< br>事实上,对于任意的g,重分形交叉标度指数均为曲线波动,这与我们的理论
框架保持了一致性: 当TDCCA(g)呈非线性状态波动时,两组时间序列的交叉相关
特征为重分形态.当e=10-3时 ,交叉相关的重分形特征更为明显.同时hDCCA(q)
和,7-DCCA(q)始终保持函数关系: TDCCA(q)=qhDccA(q)一1.由每两组时间序列
的重分形交叉标度指数TDCCA(g )的拟合是比较准确的,推广的乘积阶次模型不仅
可以q>0的阶数进行拟合,还适用于g<0的阶数, 表明该模型可以对目标时
间序列的重分形交叉谱进行精确描述.
考虑到要有较好的谱特征,本人 在进行MF—DCCA计算时,统一采用二阶
局部多项式.图3—7是基于幂函数趋势双组ARFIMA 模型的lnFDCCA(S)"一lns
关系曲线.
31


第三章时间序 列DCCA模型研究
图3—7基于双幂函数双组ARFIMA模型的2凡如ccA(s)^一2ns关系 曲线
可以看出,在所有的时间标度上,FDCCA(s)与s之间是幂律相关的.这也证
明了目 标时间序列存在交叉重分形特征.同时,当幂函数趋势的参数e取值分别
为10~,10一,10.1和 。时,相应的二阶lnFoccA(s),'-,lns的拟合斜率为o.9604,
0.9608,O .958和0.9600,同样表明,当e=10_3时,复合时间序列的交叉重分形
性最强;当e=1 0-1时,复合时间序列的交叉重分形性最弱.然而,每两组交叉
相关指数均大于o.9l,证明,基于 幂函数趋势ARFIMA模型新建时间序列的时
间序列交叉鼋分形性要强于两组原始时间序列.
图3—8基于幂函数双组ARFIMA模型的重分形交叉谱
32


北京交通大学博 士学位论文
图3—8是复合时间序列的重分形交叉谱fOCCA(AOCCA).由图可见,每两组时间序列的重分形交叉谱不对称,且都是向右钩状的曲线.除e=10-3情形外,
曲线的开1:3 均向上,这是和一维时间序列的奇异谱不同的(一维时间序列的奇异
谱开1:3均向下,未曾出现开1: 3向上的状况).图3—8(口),3—8(c)和3—8(d)中,交
叉谱在口>o(对应于较小的A DCC^)的分布区间小于g<o(对应于较大的ADCCA)
的分布区间,即ADceA较大的部分占 优势.q>0时交叉谱刻画了大涨落的交叉
标度行为;q<0时刻画了小涨落的交叉标度行为.因此,图 3—8(凸),3—8(c)和
3~8(d)的分析结果表明,小涨落的交叉影响在新建时间序列中占优 势.图3—8(b)
中交叉谱的分布完全相反.这也是两组时间序列具有长交叉相关性的重要原因之表3.1重分形交叉谱的特征参数
由表3—1得知,当e=10_6时,重分形谱的绝对最大值最大 ,谱宽度最宽,
对称性最好.表明,当a=10_6时,复合时间序列的交叉相关重分形性越强.而当e=10_1时,复合时间序列的交叉相关重分形性越弱.
§3.3.2
指数趋势
在本节中我们研究基于指数趋势双组ARFIMA模型的交叉相关特征,指数
函数的一般形式为e2专 却,这里,Z=1(如前所证,线性变换不会改变时间序列的
标度特征),Ⅳ为时间序列%和M的长度. 根据双组ARFUMA模型,我们提
出基于指数趋势的双组ARFIMA模型.理论框架如下:
z£=【WXt+(1一w)M]+e青+p+Et
纨=[(1一Ⅳ)托+wy,】+e寿+p+邑
(3.19a)
(3.19b)
(3.19c)
咒=∑an(d1)X t—n
n=1
33


第三章时间序列DCCA模型研究
00M=∑a,。(d2)Yt—n
fl,-----1
(3.19d)
此理论框架中 的参数:
W,dl,d2,‰(d1),‰(d2),£t,邑,N,s,q参照基于幂
函数趋 势的双组ARFIMA模型.P取值分别为10一,10一,10—1和0.对于给
定自相关指数分别为 0.24和o.41的时间序列X和K,利用基于指数趋势的双组
ARFIMA模型对它们进行复合后, 其广义交叉Hurst指数hDOCA(q)和重分形
交叉标度指数rDCCA(q)的分析结果如下:
图3—9基于指数趋势双组ARFIMA模型的广义交叉Hurst指数与重分形交叉
标度指数 波动图
图3—9为复合时间序列的重分形交叉标度指数ZDCCA(q)一q图形,可以看
出, 复合时间序列的TDCCA(q)与口的关系均是近似于直线的,而且为递增函数,
证明了它们具有较强 的单分形交叉特征.其中一个重要的原因是指数趋势对双组
A兄F,且夕A模型影响过于强烈.
而两组时间序列交互信息的影响程度则由其交叉相关波动函数的斜率决定.这
里,由于两组时间序列表现 为单分形交叉相关特征,我们只需直接拟合计算FDcCA
—sA的斜率即可.


北京交通大学博士学位论文
图3—10基于指数趋势双组ARFIMA模型的FDCcA一8A关系图< br>经过计算,FDCCa一8A的斜率A=0.0410士o.0008,表明两组复合时间序列
之 间存在很强的交叉反相关特征.如果,一组时间序列在过去有一段增加趋势,
那么,在未来很短的时间内 另一组时间序列必然会有一段减少的趋势.
既然两组复合时间序列表现为单分形交叉相关特征,它们的重 分形交叉谱仅
仅是一个定值,在这里,我们测得这个值为0.9921.充分说明了交叉指数的聚集程度非常集中,从另外一个角度证明了两组时间序列交叉相关的单分形特征.
§3.3.3
对数趋势
最后,我们考虑对数趋势对双组ARFIMA模型交叉相关特征的影响.对数
函数的一 般形式为:log(-寿+u).同时,基于对数趋势的双组ARFIMA模型形
成:

观=【w咒+(1一w)K】+log(亩+乱)+Et

(3.20n)
(3.2 0b)
(3.20c)
(3.20d)
Yt=[(1一w)咒+wY,】+log(寺 +让)+色
0(3
咒=∑an(d1)Xt一竹
lrt,-=-1
oo
K=∑an(d2)Yt—n
n----1
此理论框架中的参数:
W,d1,如,a n(d1),an(d2),包,邑,N,s,q参照基于幂
函数趋势的双组ARFIMA模型."tt 取值分别为10~,10一,10—1和0.


第三章时间序列DCCA模型研究
对于给定自相关指数分别为o.24和o.41的时间序列托和K,利用基于对数
趋势的双组ARFIM A模型对它们进行复合后,其广义交叉Hurst指数hDcOA(q)
和重分形交叉标度指数"rDO OA(q)的分析结果如下;

§
图3—11基于对数趋势双组ARFIMA模型的广 义交叉Hurst指数与重分形交叉
标度指数波动图
由图3—11可得:当q从一6变化到+1 0时,基于指数趋势双组ARFIMA
模型的TDCCA(g)为近似于直线的曲线,说明,复合时间序 列间存在较强的交叉单
分形特征.
图3.12基于指数数趋势双组ARFIMA模型的FDcc A(s)关于s波动图
图3—12为FDcCA(s)关于s的双对数波动图.经过测算,可得当让=1 0—6
和乱=0时,入DccA=0.2516;当乱=10—3时,
36
ADCCA =0.2016;当"it=10—1


北京交通大学博士学位论文
时,ADCC A=0.0127.证明,四个条件下,当让=10_6和u=0时,基于对数趋
势的双组ARFIMA 模型具有最弱的交叉反相关性;当仳=10_3时,基于对数趋
势的双组ARFIMA模型具有较弱的交 叉反相关性;当钍=10-1时,基于对数趋
势的双组4冗F,^彳A模型具有最强的交叉反相关性.< br>鉴于复合时间序列间存在较强的交叉单分形特征,而它又不仅仅表现为单分
形特征,这时我们的重 分形交叉谱对其就不再适用.可以说,它是游离于单分形
与重分形中间的状态,这也是我们今后深入研究 的课题之一.
§3.4主要结论
第一,借助于MF—DCCA模型,我们提出了探测两种时间序 列交叉相关重
分形特征的交叉相关标度指数TDCCA(q)和重分形交叉谱fDCCA(入OCC.4 ),推导出
了重分形交叉理论的多种数量关系.这对于彻底弄清楚两组时间序列的交叉相关
特征 有很重要的理论意义和实践指导作用.
第二,探讨了幂函数滤波、指数滤波、对数滤波和对数平移滤波对 DCCA模
型的降噪效果.为信号处理领域引入了降噪技术的新思路.
第三,建立了基于幂函数 趋势、指数趋势和指数趋势的双组ARFIMA普适
算法.研究结果表明,指数函数是一种影响性很强的 外部主导因素,这也是为什
么自然记录多数受指数趋势影响的原因.那么如何消除指数趋势对自然记录交 叉
相关性的影响,相信第二章结果会有很重要的指导意义.
第四,利用MF—DCCA模型探测 新构时间序列时发现了一种游离于单分形
与重分形中间态的交叉相关特征.这也是我们日后需要深入研究 的新课题之一.
37


第三章
时间序列DCCA模型研究


第四章
利用DFA与DCCA模型探测交通时间序列的相
关特征
在前面的研究 中,我们利用DFA模型探测时间序列的相关特征,而一个动力
系统能够稳健运行,是由众多的影响因素 相互制约的,因此,我们有必要对两个甚
至多个同时对系统作用的因素进行深入地分析研究.著名的研究 技术有Conlon[481
于2007年提出的经验相关矩阵法,Podobnik[20J在200 8年发明的交叉相关直接
定义法和消除交叉相关趋势波动分析模型(DCCA).前不久,我们又把DC CA模
型发展为完整的MF—DCCA模型.MF—DCCA模型不仅可以定性地分析两
信号的 交叉相关特征,还能量化两组时间序列的交叉标度指数与重分形交叉谱.
根据交叉标度指数和重分形交叉 谱,我们可以容易地判断两组时间序列的交叉相
关程度,其在时间序列研究领域发挥着越来越重要的作用 [49-521.
在此,我们以交通时间序列为例,结合DFA与DCCA模型探测其自相关与
交叉相关特征.探测交通模型的相关特征在常规的交通模型应用领域扮演着一个
非常重要的角色.国内外 研究学者对交通模型进行了分析和研究,并得到众多研
究成果[53-55】.交通模型的自相关和交叉 相关信息在交通安全稳定性方面能够发挥
巨大的预警作用.对于非平稳的交通时间序列而言,生成并发展 合适的自相关和
交叉相关算法,具有重要的理论指导意义.这些算法是构建智能交通系统(ITS)不可或缺的重要工具.同时上述理论已经应用于交通领域的众多方面,如意外事
件自动侦测【56】 ,车辆自动导航与控制【57】【58】58,图像数理检测技术【59】,自动交通控制
与管理【6引 ,车内导航和驾驶员信息系统【61】.综上所述,为了处理ITS的需要,许
多新算法被提出就变得尤 为重要,同时它们的准确率在很多情况下依赖于对相关
信息的预处理.交通变量的相关性信息可以应用于 描述道路交通堵塞的研究中.
例如,随时间变化的交通状况,包括车道变化的速度和流量,它们被应用于 检测
新道路交通堵塞的框架体系中【62J.
§4.1预备知识
近年来,人们对探测自 然系统的幂律长相关给予足够的重视.在众多领域均
存在长相关现象,包括生物学、物理学、经济学、地 质学和交通系统【63】【641.
我们考虑一组等测度时间序列Xk,k=1,2,...,N.通常 情况,我们任意选定参
数k,考虑X七与相应的延迟项Xk+。在标度s下的相关性.时间序列Xk的均 值为
39


第四章利用DFA与DCCA模型探测交通时间序列的相关特征
(z)=专∑丝1
Xk,一阶差分是圣七=Xk一(z).量化岔与岔七十。关系的自相关函数
(简称ACF)定义为:
Ⅳ一s
c(s)=(岔七训2志荟圣七乱+s
ACF满足下 面的性质:

(4・1)
(1)当Xk不相关时,c(s)=0.这标志着时间序列是 随机的,即时间序列的
过去值与将来值不存在相关性,时间序列为完全独立过程.
(2)当Xk 短相关时,c(s)呈指数衰减形式,即满足c(s)一e叫/如,这里的80
为标准的延迟时间.表明 时间序列具有抗持久性,表现出一定的期望恢复行为,
即过去的减少趋势使未来可能出现增加趋势.(3)当z七长相关时,
c(s)呈幂律衰减形式:
c(s)一s一1
(4.2)
这里的0<,y<1.也称之为正相关,说明此时间序列具有持久性或为外力强制主
导序列,即 如果过去有一个增加,那么在平均意义上未来也有一个增加.序列具
有长记忆性.
为了便于研究 ,我们再次回顾DFA与DCCA模型.
设时间序列Xk,k=1,2…是紧支集,DFA模型的步骤如 下【1】:
第一步,求序列对于均值的累积离差y(i):

“三,

;∑脚







1土
2 Ⅳ
(4.3)
其中<z>是序列茁七的平均值.
第二步,分割序列Y(i)成等长小区 间.将序列y(i)分成Ⅳs=int(g)个互
不重叠的小区间,每个小区间均含有8个数据.由于Ⅳ 未必整除s,则y(i)将有
一段剩余,为了使序列y(i)的全部数据进入计算,再从序列Y(i)的 尾部重复这
一分割过程,于是得到2Ⅳs个等长小区间.
第三步,用最小二次拟合法求均方误差 F2(s,").设蜘(1)是第"个小区间的
拟合多项式,当u=1,2,…,Ⅳs时,有
职 掣)三三妾{y【(u_1)s刊一嘶))2
(4.4)


北京交通大学博士学位 论文
当V=Ⅳs+1,Ⅳs+2,…,2Ⅳs时,有
F2(s,")三=1∑.(y【Ⅳ一(u 一Ⅳs)s+i】一纨(i))2
。i=1
(4.5)
这里拟合多项式纨(i)可以是 一次的,二次的,三次的,
是拟合多项式的阶数.
…一般记为DF4m,仇
第四步,对 于2Ns个区间,求F2(s,u)的平均值,得g=2阶波动函数而F^(s),
FDFA(s)三{ 嘉登[F2(s,")舟§
FDFA(s)三{焘娶即州p
第五步,分析Fz)FA(s)与S 的双对数函数,确定波动函数的标度性.
(4.6)(4・6’
对于噪点较多的时间序列,一般 不用直接计算C(s)的方法来探测其自相关
特征,而是间接地得到其自相关指数7(如图4—1所示) .由ACF得到的自相关
指数,y与由DFA模型得到的Hurst指数满足如下关系式f2】:
Q=1一丢,o<一y<1
(4.7)
在不明时间序列来源和波动趋势的条件下,DFA模型 能够快速地去除噪音并查
明时间序列的标度状态.
图4—1(o)为人造时间序列的自相关特征 波动图.图4一l(a)说明了人造时
间序列拟合的自相关指数7=0.4,而其Hurst指数Ol= o.8,同时2礼[c(s)】存
在较多的噪点,表明ACF的技术并不适用于噪点较多的人造长相关时 间序列.
图4—1(6)为交通时间序列的自相关特征波动图.图4—1(6)交通时间序列拟合
的自相关指数7=o.16,其Hurst指数0f=o.92,ln[C(s)]存在较多的噪点.因
此,ACF的技术并不完全适用于交通时间序列.综上所述,对于非平稳时间序
列DFA比ACF处理 效果更好.
41


第四章
利用DFA与DCCA模型探测交通时间序列的 相关特征

’’■


In
ls)

~’ ■岛乜
ln《s)
图4—1时间序列的DFA与ACF模型比较关系图.图(a)为人造长相关 时间序
列(ol=0.8,,y=o.4),图(b)为交通时间序列(口=o.92,7=o.16) .
DCCA模型理论框架如下:
给定两组时间序列{耽)和{z:),i=1,2,...,Ⅳ ,Ⅳ为上述同距时间序列的长
度.DCCA模型主要分为五个步骤:
第一步,求两组序列对于均 值的累积离差K和×7(对于i=1,2,...Ⅳ):

M=--∑【Xk一(z)】


(4.8口)
(4.86)
;∑汹

,k
4 2


北京交通大学博士学位论文
第二步,取定标度s,分别划分×和《 成等长度盒子.
第三步,分别将序列K和《分成Ⅳs兰int(N/s)个互不重叠的小区间,每
个小区间均含有s个数据.由于Ⅳ未必整除s,那么K和《将有一段剩余,为
了使序列M和K’的全部 数值点进入计算,再从序列K和彰的尾部重复这一分
割过程,于是得到2他个等长小区间.
第四 步,在划分的小盒子内,求协方差届CCA(s,u):
尼CCA(¥,口)三{∑(K一崴,v)(《 一《,")
。k=l
(4.9)
设硗,锄和矿’k,勘是第u个小区间的拟合多项式, 当u=1,2,...,2Ⅳs时得到
g=2阶波动函数:

2肌
如ccA( s)三{焘三[昂cc^(s,u)】2/2)172
(4.10)
第五步,为探究两组时间序 列的标度状态,作出波动函数FDCCA(8)关于标度
s的双对数图.若两组时间序列.[如)和{z :),i=1,2,...,Ⅳ,满足交叉相关特征,
则FoccA(s)关于标度s有如下关系成立:
如CCA(s)一sA
此处的A即为刻画两组时间序列{Xi)和_[z:)交叉相关特征的指 数.
(4.11)
§4.2时间序列的自相关与交叉相关特征研究
在前面的章节我们研 究了滤波技术对时间序列交叉相关特征的影响,以及不
同趋势对双组ARFIMA模型交叉相关特征的影 响.在本章,我们将针对时间序
列(包括自然记录和符号时间序列)自相关与交叉相关的关系作深入研究 .利用
DFA和DCCA模型探测时间序列(包括自然记录和符号时间序列)自相关与交
叉相关 特征间的关系.
我们以北京市三环(以下简称BTRR)某截断面的速度与流量时间序列为研
究 对象,如图4—2所示,具体参量的含义如下:
(1){饥):每一路段的平均速度.
(2)1 [吼):每一路段的平均流量.
(3)_[谚u):第一路段中的第一车道的速度.
43


第四章利用DFA与DCCA模型探测交通时间序列的相关特征
(4){谚纠):第二 路段中的第一车道的速度.
(5){迸3’):第一路段中的第二车道的速度.
(6){谚钏) :第二路段中的第二车道的速度.
(7)_[迸”):第一路段中的第三车道的速度.
(8){ 砖q):第二路段中的第三车道的速度.
事实上,我们分析的是如下变量:慨I,I或I,l谚’l,即 每个变量的一阶差分绝对
值:蚓=lVi—Vi一。I,14,1=l吼一qi-1I,I谚’l=I∥ )一妲I,这里,J=1,2,...,6,
i=1,2….,Ⅳ.

。S"函!
钰“∞l

*一一一m一“…w・一一一・・u……t+一…-v一■




‘“……矿。’‘…。。‘’一妒+1。。““”’L勰3
图4-2交通时间序列的分段车道示意图
§4.2.1
时间序列的自相关与交叉相关特征研究< br>考虑两组交通系统输出的信号:.[…)和_[I幺m其自相关和交叉相关特征的
关系如图4—3 所示.
图4—3表明,时间序列{愀I)和{14il}存在幂律形式的自相关特征,同时,
它 们的波动函数与标度之间满足幂律关系:PDFA(S)一s。,相应的,口锄=o.92,
嘞=0.9 0,即速度和流量时间序列为长具有长相关特征,而速度时间序列的长
相关性要强于流量时间序列.它们 的交叉相关函数与标度之间也满足幂律关系:
如.cc^一8A,这里,A=o.91,为O/”和%的 均值.

喝彩作文-会计从业资格准考证


病退申请书范文-双休日作文


关于水的作文-第二炮兵工程大学


上课注意力不集中怎么办-北京人事网


狄更斯双城记-补录时间


福州市教育学院-会计评价资格网


德国大使馆官网-战友聚会主持词


赴美旅游签证-我成功了作文