BVAR模型简介
雷锋简历-有关克服困难的名言
WORD格式
一、贝叶斯方法原理简介
§1贝叶斯方法起源
英国学者
T.贝叶斯1763年在《论有关机遇问题的求解》中提出一种归纳推理的理论,后
被一些统计学者发展为一种系统的统计推断方法, 称为贝叶斯方法。采用这种方法作统计推
断所得的全部结果, 构成贝叶斯统计的内容。 认为贝叶斯方法是唯一合理的统计推断方法的
统计学者,组成数理统计学中的贝叶斯学派,其形成可追溯到
60
年代,已发展为一个有影响的学派。时至今日,其影响日益扩
大。§2贝叶斯定理及其特点
记
p(y,θ)为一个随机观察向量y的联合概率密度函数,θ为一个参数向量,它也看成
是随机的。根据
通常对概率密度的运算有:
p(y,θ)p(y|θ)p(θ)p(θ|y)p(y)
因而
p(θ)p(y|θ)
p(θ|y)
其中p(y) 0。将上式表达如下:
p(y)
(1.2.2)
(1.2.1)
20世纪
30年代。到 50~
贝叶斯向量自回归模型( BVAR)简介
p(θ|y) p(θ)p(y|θ)
先验概率密度
似然函数
(1.2.3)
其中
表示成比例,p(θ|y)是在给定样本信息
y后,参数向量θ的后验概率密度,p(θ)是
预报密度
的函数,就是熟知的似然函数。
(1.2.3)将所
参数向量 的先验概率密度,
看作 式
p(y|θ)
θ θ
先验信息通过先验密度进入后验密
有的先验的、样本的信息融入其中, 度, 而所有的样本信
息通过似然函数进入。
样本信
后验信息(见图1)
贝叶斯推断的一般模式:先验信息 息
先验信息
后验分布
贝叶斯定理
样本信息
图1贝叶斯推断的基本模式
贝叶斯学派认
为,先验分布反映了实验前对总体分布的认识,在获得样本信息后,人们对这
个认识有了改变,其结果就
反映在后验分布中,即后验分布综合了参数先验分布和样本信
息。由此可以看出,频率学派统计推断是“从无到有”的过程:在实验前,关于未知参数的
专业资料整理
WORD格式
情况是一无所知, 而试验后则有些了解,
但对了解多少并无普遍的表述方法, 在实践中有赖
于所使用的统计量的针对性。贝叶斯推断则不然,它是一个“从有到有”的过程,且结果清
楚自然,符合人们的思维习惯。 根据所获得的信息修正以前的看法,不一定从零开始。 从本
质上说,贝叶斯推断方法概括了一般人的学习过程。
贝叶斯方法只能基于参数的后验分布来分析问题。 也就是说,在获得后验分布后, 如果把
样本、原来的统计模型(包括总体分布和先验分布)都丢掉, 一点也不会影响将来的统计推
断问题,凡是符合这个准则的推断就是贝叶斯推断。据此,频率学派中的矩估计、
计检验和置信区间估计都不属于贝叶斯推断的范畴,但
先验分布下的贝叶斯估计而已。
§3先验分布理论
式(1.2.3)中p(θ)表示的先验概率密度代表了我们对于一个模型中参数的先验信息,是一
个事前的自觉的认识(分“基于数据”的先验和“非基于数据”的先验)
,即在贝叶斯方
法
中,关于模型参数的先验信息。
先验分布是贝叶斯推断理论的基础和出发
点,
它大体上可以
分为扩散先验分布和共轭先验分布两大类。
§3.1扩散先验分布
3.1.1位置参数的扩散先验分布
Y的分布密度函数
f(y ),
如果随机变,则为位置参数。假没有信
量 称 设
为
息可以被利用,现在要确的先验分布。
定
如果将随机变
Y做平移变换,
Z Y
a,同时对位置参数也做同样的平移变换
量
的分布密度函数
,显然(Y, )与(Z,)有相同的统计结
f(z
),
a,则Z
为
构,从
和 有相同的先验分布
p()和概率空间。由
Radom-
Nikodym
定理有
而
p() pa),
(1.3.1)
(
取 a,可以得到
p( ) const,
,从而位置参的扩散先验分布为
数
p( ) 1,
(1.3.2)
对于正态分
N(,
02)
, 0已知,此
是位置参数,利用上述结论,参的扩
布
数
时
散先验分布为
p
(
3.1.2尺度参数的扩散先验分布
Y
的密度函数的形式如果随机变
量 为
) 1,
R
(1.3.3)
为尺度参数。如果改变尺
显著性统
MLE估计则可视为均匀先验分布下
的贝叶斯估计。因此,作为频率学派中一个很重要的极大似然估计, 不过是在一种很特殊的
1
y
f ,
0,则称
专业资料整理
WORD格式
度单位,令Z aY, a,
0,易知Z的分布密度函数为 f;同样地,(Y,)与
1z
专业资料整理
WORD格式
p(),由
Radom-
Nikodym
定理,对于
(Z,)有相同的统计结构,
和
有相同的先验分
布
尺度参,在无先验信息可利用时,尺度参的先验密度函数,
p()可取做
数 数
1,
p( ) 0
(1.3.4)
N( 0,
2)
,0已知,
对于正态分是尺度参数,利用上
0
未知,此时标准
布 差
述结论,参的扩散先验分布为
数
1
p( ) , 0
(1.3.5)
§3
共轭先验分布
.2
共轭分布是贝叶斯分析中常见的另一类参数先验分布,其思想基础是先验的规律和后验的规<
br>律具有一致性,这一要求的具体化就是先验分布和后验分布要属于同一类分布族。对于每个具
体的
分布来说,都有其共轭分布,下面利用似然函数的因子分解式和充分统计量等分析方法来
构造所需的共轭
先验分布。
f(y| )
定
3.2.1假设Y1,Y2, ,Yn是来自分布密度函数
的总体的一个样本,
,
为
理
t
n
t(Y
1
,Y
2
, ,Y
n
)是参数
的充分统计量,即似然函数可做下面分解:
n
L()
f(|Y
i
)g
n
(t
n
,
i1
)h(Y
1
,,,Y
n
)
(1.3.6
)
其中(hY
1
,Y
2
,
(1)p(
(2)
则
,Yn)与参数
无关。如果存在函数
p(),它满足如下两个条件:
) 0,
;
有限,
[2]。
g
n
(t
n
, )p()d
为参数
的共轭分布族。
这里只介绍共轭先验分布的具体定义,有关它的相关结论见参考文
献
§4贝叶斯方法的优点
贝叶斯理论的哲理有很大的吸引力,
并且方法简单,它在统计推断模式上与频率学派的不
同之处在于:频率学派认为,似然函数概括了有关参数的全部信息, 因此关于参数 θ的统计
推断只要利用似然函数就够了;而贝叶斯方法既利用了似然函数,又利用了参数先验信息。
如果先验信息很少或者没有先验信息, 这时贝叶斯推断方法所得到的结论与频率方法基本相
同。
专业资料整理
WORD格式
与频率方法比较, 贝叶斯方法有以下几方面优点: ①贝叶斯方法充分利用了样本信息和参
数的先验信息,在进行参数估计时, 通常贝叶斯估计量具有更小的方差或平方误差, 能得到
专业资料整理
WORD格式
更精确的预测结果;②贝叶斯
HPD置信区间(最高后验概率密度区间)比不考虑参数先验
信息的频率置信区间短;③能对假设检验或估计问题所做出的判断结果进行量化评
价,
而不
是频率统计理论中的接受、拒绝的简单判
断。
二、贝叶斯向量自回归模型(
BVAR)
在变量较多,滞后阶数较高时,即所要估计的参数较多的情况下,
Bayesian估计方法提供
了一个较好的方法,拟合效果要比传统的极大似然估计方法好。
§1贝叶斯非限制性VAR模型
如果令y
t
(y
1t
,y
2t
,
表示m个变量在t点处的取值,则向量序
T
,y
mt
)
列
Ay
y
t
的滞后阶
(2.1.1)
u
t
是一个m维白
数为p的非限制性VAR(
p)模型可以表示为
y
t
cA
1
y
t
此处c是一个m维向量,A
j
噪声向量,即
1 2t2
,j 1,2
Ay
u
t
,t1,2
,n ptp
,m均为m
m的系数矩阵,向量
u
t
~i..id.N
m
(0,Σ),t
1,2,n
而Σ是一个mm正定阵向量。
易知非限制性VAR(p)模型中的每个方程的解释变量是相同的。
模型系统形式
y
t
Bz
t
T
可以将(2.1.1)化成多方
程
(2.1.2)
u
t
,t 1,2 ,n
其中
B
T
c
A
1
A
2
T
T
,z
t
1
y
t
1
y
t
2
T
A
p
(mp1)m
T
y
t
p
(mp1)1
进一步,若将向量y
t
,Bz
t
和u
t
,t1,2,
,n的转置分别按行依次排列,各自形成一个nm
矩阵,则上述
n个方程可以简化为一个更为紧凑的矩阵表达形式
YZBU,U~N
nm
(0,ΣI
n
)
其中
(2.1.3)
专业资料整理
WORD格式
p)模型参数的后验分布有如下结
特别地,对于扩散先验分布,非限制
VAR(
论:
性
(B,Σ|Σ(m1)
) | 2
下,非限制性VAR(p)模型参数的后验分布
定理1.1在扩散先验分布
为
?
(B|Y,Z)~Mt
km
(B,Z
其中
T
Z,S,n
k),(Σ|Y,Z)~IW
m
(S,n m),kmp1
? T
B(Z
1 T
T
[I
m
T 1 T
Z) Z
Y,SY (Z Z) Z ]Y
(2.1.4
)
§2贝叶斯限制性VAR模型
如各方程中解释变量并不完
在VAR(p)模型中,模型系数B可能受到某些条件的限制,
全
相同,某些变量可能在部分方程中出但并不出现在其他方程中;或
者,
现, 部分方程中有线
性趋势项或季节变量,而其他方程不包含这些变
量。
根据Zeller的观点,在一般排斥性限制条件
(2.1.1)式中的VAR(
p)模型模型能够写
下,
成如下似不相关模型:
i
,i1,2,
,m
Y
i
Z
i
i
(2.2.1
)
nk
i
设
此处Y
i
是由第i个变量n个观测值构成的
n维向量,
Z
i
是第i
个变量单方程模型的
计矩阵,它由变量
y1,y2,
,y
m
的部分滞后项组成;
i
是第i
个变量单方程模型的
k
i
维系数
向量,
i
是n维正态随机误差向量。若将这个方程写成一个矩阵形式,则有
其中
Y Z
1
2
,
,~
N
( , )
1
2
(2.2.2)
mn
0 Σ I
n
Z 0
1
0 Z
2
0
Y
1
Y
2
Y
,Z
0
,
Y
m
m
由于这一情形不作为我们研究的重
点,
0 0 Z
m
m
所以这一部分的相关结论暂时省
去, 详见参考文献
[3]。
§3共轭先验分布下 VAR模型的贝叶斯分析
对于一般共轭分布而言,由于超参数太多, VAR(p)模型的贝叶斯推断只具有理论上的意
义,而不能应用于实际预测分析中,本节研究一类特殊的参数共轭先验分
Minnesota共
布:
轭先验分布
VAR(p)模型的贝叶斯分析理论。
下
先验分布
Minnesota
是
Litterman于1986年提出来的,它主要用于解决共轭先验分布下
贝叶斯VAR(p)模型中超参数过多问题,提高模型的预测精度。
§3.1Minnesota先验分
布
如果(2.1.1)式的VAR(
p)模型不含常数项,则模型中的具体方程如下:
专业资料整理
WORD格式
y
m p
it
a
ijr
y
jtr
u<
br>it
,i1,2,,m;t1,2,,n.
j 1r 1
(2.3.1)
专业资料整理
WORD格式
显然a
表示第i个方程中变量
y
的r阶滞后项y
的系数,如果随机参数
a服从均值为
i
j
r j jr ijr
ijr
、方差为S
ijr
的正态分布,此时模型
(2.3.1)中参数先验分布中需要确定的超参数至少有
2
2mp个:mp个先验均值
22
ijr
和mp个先验方差S
ijr
。如果不考虑先验信息的可取性,
22
在
2
2mp个超参数的取值是相当复杂和困难的,
因此,必须想办法
一般情况下要合理地给定这
减少需要赋值的超参数的数量,确定超参数的合理取值,提高模型的预测能
Minnesota
力。
先验分布就是解决这一问题的有效方法,它的基本假定包括以下几个方面:
(1)正态性u
t
(u
1
,u
2
,
u
m
)~N
m
(0,Σ);
, 1,2, ,, 1,2,
,相互独立;
(2)协方差阵Σ和系数
ai
jr i mr p
(3)协方差阵Σ的模型先验分布取为扩散先验分布,
即
(Σ)
Σ
(m1)2
,Σ0
(2.3.2)
N(
ijr
,S
ijr
(4)a
ijr
相互独立服从正态分布
表示参数a
ijr
的最佳猜测值,而
映了对这个猜测的信心,其取值越小表示对此猜测的信心越大;
2
ijr
),
S
ijr
反
2
(5)均值
ijr
按照下述公式确定:
ij
r
,
1,i
j,r1
0,其他情况,
即方程左边的变量只由其系数
1的滞后一阶变量表示;
为
(6)标准差S
ijr
可以分解为
4个因子的乘积,即
代表了对先验信息的较大把
握;
Sij
r
s
i
g(r)
f(i,j)
s
j
(2.3.3)
(2.3.4)
较小的值
此处是总体紧度,它的取值大小反映了分析人员对先验信息的信心大小程度,
g(r)是r阶滞后变量相对一阶变量的紧度,它表示过去信
j个变量相对于
息比当前信息有用程度的减少;函数
f(i,j)是第i个方程中第 第
紧度,s
i
是变量y
i
的单变量自回归模型的标准差。
§3.2
滞后延迟函数
Minnesota
在
先验分布中,滞后延迟函数
i个变量的
专业资料整理
WORD格式
g(r)的选择必须能反映这样一个基本信念:随
Doan推荐的调和滞后延迟函
着滞后长度的增加,滞后变量的系数趋向于零;据此这里
使用数,形式如下:
g(r)
rd,d
0
(2.3.5)
专业资料整理
WORD格式
§3
相对紧度函数
.3
和g(r)
后,先验分布中超参数数量已经在确
r
定
从
f(i,j),以
r
和g(r)
;若进一步选择合适函
数
及
的
m m矩阵
F
减少。显然,
f(i,j)
可以看做一
个
f(i,j)取如下形式的函数:
1,
i
f(i,j)
m2p减少到
m2
f(i,j),则先验分布中参数个数可大为
(f(i,j))mm的(i,j)处的元素,如果
2:m2
个相对紧度
j
w
ij
,i j
(2.3.6)
其中w
ij
是一个介于0~1的常数,它的取值大小反映了第
i个方程中其他变量(不包括
x
i
及
其滞后变量)的相对紧度。如果对所有
,均有
jw
ij
i
的
选取问题转化为确定一个超参
w的大小。
数
§3.4标准差之比s
i
s
j
的涵义
w成立,则m个参数f(i,j)的
2
在Minnesota先验分布的基本假设(
6)中,s
i
s
j
是第i个序列{yit}的自回归残差标准
差与第j个序列{y
jt
}自回归残差标准差之比,
s
i
由{y
it
}对常数项和其p阶滞后项的
OLS
s
i
s
j
主要用于反应:先验分布的设定必须考虑实际的样本
回归的残差标准差得到。比例
数
括号内的第一项为先验分布的均值,第二项为先验分布的方差。
§3.5模型参数的后验估计
据信息。
以上是Minnesota先验分布的基本含义及其参数设定问题的研究,为使上述描述更直观, 这里以一个滞后长度为2阶的双变量VAR(2)模型加以说明,该模型系数的Minnesota先验分布
为
(2.3.7)
专业资料整理
WORD格式
然后再写成(2.2.2)的形式
Y
Z , ~N
mn
(0,Σ I
n
)
专业资料整理
WORD格式
§3.6模型预测结果及其精度预测
§3.7具体数值算例
Estima公司提供的时间序列数据,利
首先,根据美国
用
Sims似然比检验量确定模型的
最
优滞后阶数,模型
VAR(p)对模型VAR(p)的似然比检验统计量为
1 2
专业资料整理
WORD格式
然后,选择贝叶斯
VAR模型中3个超参数,衰减参数 (d)、总体紧度(r)和相对紧度(w),
此处考虑超参数的三种组合情况(表 2),并将相应的贝叶斯 VAR模型分别记为 BVAR1、
BVAR2和BVAR3.
表2. 模型超参数的选择
统计值,有关结果列于表
3和表4.
表3. 1~4步超前预测的平均西尔
U统计值(1993:1~1998:4)
表4. 5~8步超前预测的平均西尔 U统计值(1993:1~1998:4)
表1.
模型最优滞后阶数的 LR检验结果
专业资料整理
WORD格式
表3和表4所列的计算结果表明: 在AR模型,VAR模型和三类贝叶斯
VAR模型中,BVAR1、
BVAR2和BVAR3模型的平均西尔
U统计值均小于前两类模型的平均西尔 U统计值,这一
点也可以从表 5中看出,这说明贝叶斯
VAR模型预测效果优于 AR模型和VAR模型。
表5. 超前预测的组合综合平均西尔 U统计值
§3.8结论
贝叶斯向量自回归估计技术用一种简单的方法来处
理
VAR模型中参数过多的问题,原则是
当参数被判定在某一值时,使模型参数趋近于这一值而不是锁定该确定值。 所以,只要有必
要的数据支持,这种随机变量有某种可能的先验分
布, 该先验分布被认为包含了预测者在预
测前所获取的某种相关信息。如果这种信息缺乏,则可能是由于存在扩散的先验分布。 模型
采用的先验分布是随机先验分
也称为Minnesota
先验分布。相比VAR方法,贝叶斯向量
布,
自回归模型(BVAR)通常在短期预测时能提供更高的预测精度,同时,也不会产生传统
[4
]
方法的不可信结构。
参考文献:
VAR
[1]阿诺德·泽尔纳著;张尧庭译.计量经济学贝叶斯推断引论
[M].—上海;上海财经大学出
版社,2005.7
[2] 朱慧明,韩玉启.贝叶斯多元统计推断理论[M].—北京;科学出版社,2006
[3] 朱慧明,林静.贝叶斯计量经济模型[M].—北京;科学出版社,2009
[4]吴剑飞,方勇,中国的通货膨:一个新开放宏观模型及其检验,金融研
究,
期
2010年第5
专业资料整理
WORD格式
整理人:吉林大学商学院 曹阳
金门之家讨论班内容 邮箱:heqijiayou@
专业资料整理
WORD格式
一、贝叶斯方法原理简介
§1贝叶斯方法起源
英国学者
T.贝叶斯1763年在《论有关机遇问题的求解》中提出一种归纳推理的理论,后
被一些统计学者发展为一种系统的统计推断方法, 称为贝叶斯方法。采用这种方法作统计推
断所得的全部结果, 构成贝叶斯统计的内容。 认为贝叶斯方法是唯一合理的统计推断方法的
统计学者,组成数理统计学中的贝叶斯学派,其形成可追溯到
60
年代,已发展为一个有影响的学派。时至今日,其影响日益扩
大。§2贝叶斯定理及其特点
记
p(y,θ)为一个随机观察向量y的联合概率密度函数,θ为一个参数向量,它也看成
是随机的。根据
通常对概率密度的运算有:
p(y,θ)p(y|θ)p(θ)p(θ|y)p(y)
因而
p(θ)p(y|θ)
p(θ|y)
其中p(y) 0。将上式表达如下:
p(y)
(1.2.2)
(1.2.1)
20世纪
30年代。到 50~
贝叶斯向量自回归模型( BVAR)简介
p(θ|y) p(θ)p(y|θ)
先验概率密度
似然函数
(1.2.3)
其中
表示成比例,p(θ|y)是在给定样本信息
y后,参数向量θ的后验概率密度,p(θ)是
预报密度
的函数,就是熟知的似然函数。
(1.2.3)将所
参数向量 的先验概率密度,
看作 式
p(y|θ)
θ θ
先验信息通过先验密度进入后验密
有的先验的、样本的信息融入其中, 度, 而所有的样本信
息通过似然函数进入。
样本信
后验信息(见图1)
贝叶斯推断的一般模式:先验信息 息
先验信息
后验分布
贝叶斯定理
样本信息
图1贝叶斯推断的基本模式
贝叶斯学派认
为,先验分布反映了实验前对总体分布的认识,在获得样本信息后,人们对这
个认识有了改变,其结果就
反映在后验分布中,即后验分布综合了参数先验分布和样本信
息。由此可以看出,频率学派统计推断是“从无到有”的过程:在实验前,关于未知参数的
专业资料整理
WORD格式
情况是一无所知, 而试验后则有些了解,
但对了解多少并无普遍的表述方法, 在实践中有赖
于所使用的统计量的针对性。贝叶斯推断则不然,它是一个“从有到有”的过程,且结果清
楚自然,符合人们的思维习惯。 根据所获得的信息修正以前的看法,不一定从零开始。 从本
质上说,贝叶斯推断方法概括了一般人的学习过程。
贝叶斯方法只能基于参数的后验分布来分析问题。 也就是说,在获得后验分布后, 如果把
样本、原来的统计模型(包括总体分布和先验分布)都丢掉, 一点也不会影响将来的统计推
断问题,凡是符合这个准则的推断就是贝叶斯推断。据此,频率学派中的矩估计、
计检验和置信区间估计都不属于贝叶斯推断的范畴,但
先验分布下的贝叶斯估计而已。
§3先验分布理论
式(1.2.3)中p(θ)表示的先验概率密度代表了我们对于一个模型中参数的先验信息,是一
个事前的自觉的认识(分“基于数据”的先验和“非基于数据”的先验)
,即在贝叶斯方
法
中,关于模型参数的先验信息。
先验分布是贝叶斯推断理论的基础和出发
点,
它大体上可以
分为扩散先验分布和共轭先验分布两大类。
§3.1扩散先验分布
3.1.1位置参数的扩散先验分布
Y的分布密度函数
f(y ),
如果随机变,则为位置参数。假没有信
量 称 设
为
息可以被利用,现在要确的先验分布。
定
如果将随机变
Y做平移变换,
Z Y
a,同时对位置参数也做同样的平移变换
量
的分布密度函数
,显然(Y, )与(Z,)有相同的统计结
f(z
),
a,则Z
为
构,从
和 有相同的先验分布
p()和概率空间。由
Radom-
Nikodym
定理有
而
p() pa),
(1.3.1)
(
取 a,可以得到
p( ) const,
,从而位置参的扩散先验分布为
数
p( ) 1,
(1.3.2)
对于正态分
N(,
02)
, 0已知,此
是位置参数,利用上述结论,参的扩
布
数
时
散先验分布为
p
(
3.1.2尺度参数的扩散先验分布
Y
的密度函数的形式如果随机变
量 为
) 1,
R
(1.3.3)
为尺度参数。如果改变尺
显著性统
MLE估计则可视为均匀先验分布下
的贝叶斯估计。因此,作为频率学派中一个很重要的极大似然估计, 不过是在一种很特殊的
1
y
f ,
0,则称
专业资料整理
WORD格式
度单位,令Z aY, a,
0,易知Z的分布密度函数为 f;同样地,(Y,)与
1z
专业资料整理
WORD格式
p(),由
Radom-
Nikodym
定理,对于
(Z,)有相同的统计结构,
和
有相同的先验分
布
尺度参,在无先验信息可利用时,尺度参的先验密度函数,
p()可取做
数 数
1,
p( ) 0
(1.3.4)
N( 0,
2)
,0已知,
对于正态分是尺度参数,利用上
0
未知,此时标准
布 差
述结论,参的扩散先验分布为
数
1
p( ) , 0
(1.3.5)
§3
共轭先验分布
.2
共轭分布是贝叶斯分析中常见的另一类参数先验分布,其思想基础是先验的规律和后验的规<
br>律具有一致性,这一要求的具体化就是先验分布和后验分布要属于同一类分布族。对于每个具
体的
分布来说,都有其共轭分布,下面利用似然函数的因子分解式和充分统计量等分析方法来
构造所需的共轭
先验分布。
f(y| )
定
3.2.1假设Y1,Y2, ,Yn是来自分布密度函数
的总体的一个样本,
,
为
理
t
n
t(Y
1
,Y
2
, ,Y
n
)是参数
的充分统计量,即似然函数可做下面分解:
n
L()
f(|Y
i
)g
n
(t
n
,
i1
)h(Y
1
,,,Y
n
)
(1.3.6
)
其中(hY
1
,Y
2
,
(1)p(
(2)
则
,Yn)与参数
无关。如果存在函数
p(),它满足如下两个条件:
) 0,
;
有限,
[2]。
g
n
(t
n
, )p()d
为参数
的共轭分布族。
这里只介绍共轭先验分布的具体定义,有关它的相关结论见参考文
献
§4贝叶斯方法的优点
贝叶斯理论的哲理有很大的吸引力,
并且方法简单,它在统计推断模式上与频率学派的不
同之处在于:频率学派认为,似然函数概括了有关参数的全部信息, 因此关于参数 θ的统计
推断只要利用似然函数就够了;而贝叶斯方法既利用了似然函数,又利用了参数先验信息。
如果先验信息很少或者没有先验信息, 这时贝叶斯推断方法所得到的结论与频率方法基本相
同。
专业资料整理
WORD格式
与频率方法比较, 贝叶斯方法有以下几方面优点: ①贝叶斯方法充分利用了样本信息和参
数的先验信息,在进行参数估计时, 通常贝叶斯估计量具有更小的方差或平方误差, 能得到
专业资料整理
WORD格式
更精确的预测结果;②贝叶斯
HPD置信区间(最高后验概率密度区间)比不考虑参数先验
信息的频率置信区间短;③能对假设检验或估计问题所做出的判断结果进行量化评
价,
而不
是频率统计理论中的接受、拒绝的简单判
断。
二、贝叶斯向量自回归模型(
BVAR)
在变量较多,滞后阶数较高时,即所要估计的参数较多的情况下,
Bayesian估计方法提供
了一个较好的方法,拟合效果要比传统的极大似然估计方法好。
§1贝叶斯非限制性VAR模型
如果令y
t
(y
1t
,y
2t
,
表示m个变量在t点处的取值,则向量序
T
,y
mt
)
列
Ay
y
t
的滞后阶
(2.1.1)
u
t
是一个m维白
数为p的非限制性VAR(
p)模型可以表示为
y
t
cA
1
y
t
此处c是一个m维向量,A
j
噪声向量,即
1 2t2
,j 1,2
Ay
u
t
,t1,2
,n ptp
,m均为m
m的系数矩阵,向量
u
t
~i..id.N
m
(0,Σ),t
1,2,n
而Σ是一个mm正定阵向量。
易知非限制性VAR(p)模型中的每个方程的解释变量是相同的。
模型系统形式
y
t
Bz
t
T
可以将(2.1.1)化成多方
程
(2.1.2)
u
t
,t 1,2 ,n
其中
B
T
c
A
1
A
2
T
T
,z
t
1
y
t
1
y
t
2
T
A
p
(mp1)m
T
y
t
p
(mp1)1
进一步,若将向量y
t
,Bz
t
和u
t
,t1,2,
,n的转置分别按行依次排列,各自形成一个nm
矩阵,则上述
n个方程可以简化为一个更为紧凑的矩阵表达形式
YZBU,U~N
nm
(0,ΣI
n
)
其中
(2.1.3)
专业资料整理
WORD格式
p)模型参数的后验分布有如下结
特别地,对于扩散先验分布,非限制
VAR(
论:
性
(B,Σ|Σ(m1)
) | 2
下,非限制性VAR(p)模型参数的后验分布
定理1.1在扩散先验分布
为
?
(B|Y,Z)~Mt
km
(B,Z
其中
T
Z,S,n
k),(Σ|Y,Z)~IW
m
(S,n m),kmp1
? T
B(Z
1 T
T
[I
m
T 1 T
Z) Z
Y,SY (Z Z) Z ]Y
(2.1.4
)
§2贝叶斯限制性VAR模型
如各方程中解释变量并不完
在VAR(p)模型中,模型系数B可能受到某些条件的限制,
全
相同,某些变量可能在部分方程中出但并不出现在其他方程中;或
者,
现, 部分方程中有线
性趋势项或季节变量,而其他方程不包含这些变
量。
根据Zeller的观点,在一般排斥性限制条件
(2.1.1)式中的VAR(
p)模型模型能够写
下,
成如下似不相关模型:
i
,i1,2,
,m
Y
i
Z
i
i
(2.2.1
)
nk
i
设
此处Y
i
是由第i个变量n个观测值构成的
n维向量,
Z
i
是第i
个变量单方程模型的
计矩阵,它由变量
y1,y2,
,y
m
的部分滞后项组成;
i
是第i
个变量单方程模型的
k
i
维系数
向量,
i
是n维正态随机误差向量。若将这个方程写成一个矩阵形式,则有
其中
Y Z
1
2
,
,~
N
( , )
1
2
(2.2.2)
mn
0 Σ I
n
Z 0
1
0 Z
2
0
Y
1
Y
2
Y
,Z
0
,
Y
m
m
由于这一情形不作为我们研究的重
点,
0 0 Z
m
m
所以这一部分的相关结论暂时省
去, 详见参考文献
[3]。
§3共轭先验分布下 VAR模型的贝叶斯分析
对于一般共轭分布而言,由于超参数太多, VAR(p)模型的贝叶斯推断只具有理论上的意
义,而不能应用于实际预测分析中,本节研究一类特殊的参数共轭先验分
Minnesota共
布:
轭先验分布
VAR(p)模型的贝叶斯分析理论。
下
先验分布
Minnesota
是
Litterman于1986年提出来的,它主要用于解决共轭先验分布下
贝叶斯VAR(p)模型中超参数过多问题,提高模型的预测精度。
§3.1Minnesota先验分
布
如果(2.1.1)式的VAR(
p)模型不含常数项,则模型中的具体方程如下:
专业资料整理
WORD格式
y
m p
it
a
ijr
y
jtr
u<
br>it
,i1,2,,m;t1,2,,n.
j 1r 1
(2.3.1)
专业资料整理
WORD格式
显然a
表示第i个方程中变量
y
的r阶滞后项y
的系数,如果随机参数
a服从均值为
i
j
r j jr ijr
ijr
、方差为S
ijr
的正态分布,此时模型
(2.3.1)中参数先验分布中需要确定的超参数至少有
2
2mp个:mp个先验均值
22
ijr
和mp个先验方差S
ijr
。如果不考虑先验信息的可取性,
22
在
2
2mp个超参数的取值是相当复杂和困难的,
因此,必须想办法
一般情况下要合理地给定这
减少需要赋值的超参数的数量,确定超参数的合理取值,提高模型的预测能
Minnesota
力。
先验分布就是解决这一问题的有效方法,它的基本假定包括以下几个方面:
(1)正态性u
t
(u
1
,u
2
,
u
m
)~N
m
(0,Σ);
, 1,2, ,, 1,2,
,相互独立;
(2)协方差阵Σ和系数
ai
jr i mr p
(3)协方差阵Σ的模型先验分布取为扩散先验分布,
即
(Σ)
Σ
(m1)2
,Σ0
(2.3.2)
N(
ijr
,S
ijr
(4)a
ijr
相互独立服从正态分布
表示参数a
ijr
的最佳猜测值,而
映了对这个猜测的信心,其取值越小表示对此猜测的信心越大;
2
ijr
),
S
ijr
反
2
(5)均值
ijr
按照下述公式确定:
ij
r
,
1,i
j,r1
0,其他情况,
即方程左边的变量只由其系数
1的滞后一阶变量表示;
为
(6)标准差S
ijr
可以分解为
4个因子的乘积,即
代表了对先验信息的较大把
握;
Sij
r
s
i
g(r)
f(i,j)
s
j
(2.3.3)
(2.3.4)
较小的值
此处是总体紧度,它的取值大小反映了分析人员对先验信息的信心大小程度,
g(r)是r阶滞后变量相对一阶变量的紧度,它表示过去信
j个变量相对于
息比当前信息有用程度的减少;函数
f(i,j)是第i个方程中第 第
紧度,s
i
是变量y
i
的单变量自回归模型的标准差。
§3.2
滞后延迟函数
Minnesota
在
先验分布中,滞后延迟函数
i个变量的
专业资料整理
WORD格式
g(r)的选择必须能反映这样一个基本信念:随
Doan推荐的调和滞后延迟函
着滞后长度的增加,滞后变量的系数趋向于零;据此这里
使用数,形式如下:
g(r)
rd,d
0
(2.3.5)
专业资料整理
WORD格式
§3
相对紧度函数
.3
和g(r)
后,先验分布中超参数数量已经在确
r
定
从
f(i,j),以
r
和g(r)
;若进一步选择合适函
数
及
的
m m矩阵
F
减少。显然,
f(i,j)
可以看做一
个
f(i,j)取如下形式的函数:
1,
i
f(i,j)
m2p减少到
m2
f(i,j),则先验分布中参数个数可大为
(f(i,j))mm的(i,j)处的元素,如果
2:m2
个相对紧度
j
w
ij
,i j
(2.3.6)
其中w
ij
是一个介于0~1的常数,它的取值大小反映了第
i个方程中其他变量(不包括
x
i
及
其滞后变量)的相对紧度。如果对所有
,均有
jw
ij
i
的
选取问题转化为确定一个超参
w的大小。
数
§3.4标准差之比s
i
s
j
的涵义
w成立,则m个参数f(i,j)的
2
在Minnesota先验分布的基本假设(
6)中,s
i
s
j
是第i个序列{yit}的自回归残差标准
差与第j个序列{y
jt
}自回归残差标准差之比,
s
i
由{y
it
}对常数项和其p阶滞后项的
OLS
s
i
s
j
主要用于反应:先验分布的设定必须考虑实际的样本
回归的残差标准差得到。比例
数
括号内的第一项为先验分布的均值,第二项为先验分布的方差。
§3.5模型参数的后验估计
据信息。
以上是Minnesota先验分布的基本含义及其参数设定问题的研究,为使上述描述更直观, 这里以一个滞后长度为2阶的双变量VAR(2)模型加以说明,该模型系数的Minnesota先验分布
为
(2.3.7)
专业资料整理
WORD格式
然后再写成(2.2.2)的形式
Y
Z , ~N
mn
(0,Σ I
n
)
专业资料整理
WORD格式
§3.6模型预测结果及其精度预测
§3.7具体数值算例
Estima公司提供的时间序列数据,利
首先,根据美国
用
Sims似然比检验量确定模型的
最
优滞后阶数,模型
VAR(p)对模型VAR(p)的似然比检验统计量为
1 2
专业资料整理
WORD格式
然后,选择贝叶斯
VAR模型中3个超参数,衰减参数 (d)、总体紧度(r)和相对紧度(w),
此处考虑超参数的三种组合情况(表 2),并将相应的贝叶斯 VAR模型分别记为 BVAR1、
BVAR2和BVAR3.
表2. 模型超参数的选择
统计值,有关结果列于表
3和表4.
表3. 1~4步超前预测的平均西尔
U统计值(1993:1~1998:4)
表4. 5~8步超前预测的平均西尔 U统计值(1993:1~1998:4)
表1.
模型最优滞后阶数的 LR检验结果
专业资料整理
WORD格式
表3和表4所列的计算结果表明: 在AR模型,VAR模型和三类贝叶斯
VAR模型中,BVAR1、
BVAR2和BVAR3模型的平均西尔
U统计值均小于前两类模型的平均西尔 U统计值,这一
点也可以从表 5中看出,这说明贝叶斯
VAR模型预测效果优于 AR模型和VAR模型。
表5. 超前预测的组合综合平均西尔 U统计值
§3.8结论
贝叶斯向量自回归估计技术用一种简单的方法来处
理
VAR模型中参数过多的问题,原则是
当参数被判定在某一值时,使模型参数趋近于这一值而不是锁定该确定值。 所以,只要有必
要的数据支持,这种随机变量有某种可能的先验分
布, 该先验分布被认为包含了预测者在预
测前所获取的某种相关信息。如果这种信息缺乏,则可能是由于存在扩散的先验分布。 模型
采用的先验分布是随机先验分
也称为Minnesota
先验分布。相比VAR方法,贝叶斯向量
布,
自回归模型(BVAR)通常在短期预测时能提供更高的预测精度,同时,也不会产生传统
[4
]
方法的不可信结构。
参考文献:
VAR
[1]阿诺德·泽尔纳著;张尧庭译.计量经济学贝叶斯推断引论
[M].—上海;上海财经大学出
版社,2005.7
[2] 朱慧明,韩玉启.贝叶斯多元统计推断理论[M].—北京;科学出版社,2006
[3] 朱慧明,林静.贝叶斯计量经济模型[M].—北京;科学出版社,2009
[4]吴剑飞,方勇,中国的通货膨:一个新开放宏观模型及其检验,金融研
究,
期
2010年第5
专业资料整理
WORD格式
整理人:吉林大学商学院 曹阳
金门之家讨论班内容 邮箱:heqijiayou@
专业资料整理