5 随机变量的函数及其分布
北京大学医学部地址-男女朋友之间的情话
§5 随机变量的函数及其分布
一、离散型随机变量的函数
二、一维连续型随机变量的函数的分布
三、(连续型)随机向量函数的分布律
四、随机向量的变换
本章补充与注记
2
人们经常碰到随机变
量的函数.例如分子运动的动能T=
mv2
是分子运动速
2
度——
随机变量
v
的函数;数理统计中经常用到(n)分布,相应的随机变量
2<
br>=
1
2
+…+
n
2
,其中各<
br>
i
相互独立,都服从N (0, 1).
2
是
1
,…,
n
的函数.
一般,若ξ是随机变量, y = g (x)是普通的实函数,则η= g(ξ)是ξ的函数.
接着产生两个问题:1) η是随机变量吗?2)
如果是,η的分布与ξ的分布有什
么关系?对于多个随机变量的函数,也存在同样的问题.
对第一个问题比较容易解决. 因为若η= g
(ξ)是随机变量,就必需满足§1
的(1)式,这就不得不对函数g (x) 有所限制.
定义 设g (x)是一维实函数,
是R上的波雷尔σ-域.
若对任意B∈
,都
有
{x: g (x)
∈B}=g
1
(B) ∈
(1)
(即当g (x)的值域是波雷尔集时,其原像也是波雷尔集),
则称g(x)是一元波雷尔
函数.
实变函数论中可以证明:一切分段连续,
分段单调的函数都是波雷尔函数,
故它是十分广泛的一类函数,日常碰到的大都是这类函数.
现在我们可以来回答第一个问题:若ξ是概率空间 (Ω,
,
P)上的随机变量,
f(x)是一元波雷尔函数,η= f (ξ) ,
则对任意的B∈
,由这里的 (1)及§1的(1)
式可得
{ω:η(ω)∈B}={ω: f
(ξ(ω))∈B}={ω:ξ(ω)∈f
1
(B) }∈
.
故η是随机变量.
类似可以定义n元波雷尔函数. 且若f
(
x
1
,,x
n
)是波雷尔函数,则η=
f(
1
,,
n
)就是随机变量.
以后我们讲随机变量的函数都是指这种函数.
下面讨论第二个问题,分几步来解决.
一、离散型随机变量的函数
这种情况比较简单,仅举几个例子来说明.
10
11
例1 设ξ的分布列为
42
1
1
8
2
1
<
br>
2
8
,η=2ξ-1, ζ=
,
求η,ζ各自的分
布.
解 η的可能取值为3, 1, 1, 3, 是有限个,
只须算出对应的概率. 由于
{η=3}= {ξ=1},故P{η=3}=
P{ξ=1},类似可得其它概率.
我们得到η
311
111
的分布:
428
3
1
8
.
ζ可取的值为0,1,4,但注意到{ζ=1}={ξ=1}
{ξ
=1},故P{ζ=1} =P{ξ
0
1
113
<
br>
=1}+P{ξ=
1
}=
848
;ζ的分
布列为
2
1
3
8
4
1
8
.
一般,设ξ有分布列P(ξ=
x
i
) = p
(
x
i
), i=1,2,…, 则η=f (ξ)有分布列
P(η=
y
j
)
=
f(x)y
i
p(x
i
)
j
,
j
=1, 2,….
例2 设ξ~B (
n
1
,
p), η~B (
n
2
, p), ξ,η相互独立,求ζ=ξ+η的分布.
解 ξ,η各可取值0,1,…,
n
1
和0,1,…,
n
2
, 则ζ可取值0, 1,…,
n
1
+
n
2
,
且由§4的(5)式,得
P(ζ= r) =
r
P(
k,
<
br>rk)
P(
k)P(
rk)
k0
rr
=
k0
=
k
0
C
k
n
1
pq
k
n
1k
C
rk
n
2
p
rk
q
n2
rk
=
pq
r
n
1
n
2r
C
k0
r
k
n
1
rkC
n
2
=
rr
n
1
n
2
r
C
n
pq
n
12
,
这里用到了组合数的性质. 计算的结果表明: ξ+η~B
(
n
1
+
n
2
, p), 这个事实
显示了二项分
布一个很重要的性质:两个独立的二项分布,当它们的第二参数相
同时,其和也服从二项分布,它的第一
参数恰为这两个二项分布第一参数的和.
这性质称为二项分布的再生性(或可加性(additive
property)).从ξ,η的概
率意义来看,这结果是非常明显的:ξ和η分别是
n1
和n
2
重贝努里试验中成功的
次数,两组试验合起来,ζ=ξ+η应该
就是
n
1
n
2
重贝努里试验中成功的次数.
本例计算过程中得到的公式
P(ζ= r) =
P(
k,
rk)
P(
k)P(
rk)
k0
rr
=
k0
(2)
是计算取非负整数值的独立随机变量和的分布的公式,称为离散卷积公式.
二、一维连续型随机变量的函数的分布
设ξ的密度函数为p (x),我们要求出η=f
(ξ)的分布函数
G
(
y
). 事实上, G(y)
=P(ηy) = P(f (ξ) y), 而D ={x:f (x)
y}是一维波雷尔集,故
G(y)= P(ξ∈D)
=
xD
p(x)dx
. (3) <
br>至于η是不是连续型随机变量,它的密度函数是什么,在一般场合无法作出
决定,但在某些特殊而
又常见的场合,我们可以直接导出η的密度函数g(y).
1
f
定理1
若f(x)严格单调,其反函数(y)有连续导函数,则η=f
(ξ)也是连
续型随机变量,其密度函数为
p(f
1
(y))
|(f
1
(y))
|,
yf(x)的值域,
y其它.
0,
g(y) =
(4)
证
不妨设f(x)严格单调增加,且∞< x <+∞时, A< f (x)
f
(y)}, 故
f
1
(y)
G(y) = P(ηy)
=
p(x)dx
,
1
f
令x
=(v), 得
G(y)=
A
y
p(f
1
(v))(f
1
(v))
dv
=
y
g(v)dv
,
其中g(v)
如(4)式所示;而当yB时有G(y)=1, 故g(y) = 0; 这就证得(4)式.
当y
= f (x)为严格单调减少时,类似可证(4)式成立.
推论 若y = f (x)
在不相重叠的区间
I
1
,I
2
,…上逐段严格单调, 在各段的反<
br>函数
h
1
(y),h
2
(y)
,…有连续导数,则η
= f(ξ)是连续型随机变量,其密度为
p(h
i
(y))
|h
i
(y)|,
当y各h
i
(y)的定义域时,<
br>
其它.
0,
g(y) =
.
(5)
证 注意到{f (ξ) y}={ξ
合,再利用(4)式得到
E
i
(y)
i
},其中
E
i
(y)
是
I
i
中满足f (x) y的
x
的集
P(
y)P(
E
i
(y))
ii
E
i
(y)
p(x)dx
=
i
y
p(h
i
(x))|hi
(x)|dx
p(h(x))|h
(x)|d
x.
=
ii
i
y
由此即得证(5)式.
例3 设ξ~N( a,
),
求η=
k
ξ+
b
的密度函数 (k
0).
1
解
y =f(x) =
kx+b满足上述定理1中的条件,
f
(y) = (y b) k, ξ的密度
2
p(x)=
1
(xa)
2
<
br>
2
2
, ∞ < x <+∞,
由(4)式,
2π
exp
1
(yka
b)
2
1
yb
22
[a]2
2
2(k
)
2π|k|
,
k
g(y) =
2π
exp{}·|1 k |
=exp
22
说明η~N(ka+b,
k
).
特别,若η= (ξa) b,则η~N(0,1),这个结果早已
为我们所熟知.
2
例4 ξ~N(0, 1), 求η=的密度.
2
解
y=
x
是分段单调的,反函数:当
I
1
=(,0)时,
x=
h
1
(
y
)=
y
;
当
I
2
=(0,+
)
时,x=
h
2
(y)=
y
; 值域都是y>0.
故y>0时,
2
2
(y)
1
(y)
1
1
<
br>
2
2
g
(y
) =
2π
exp
2y
2y
+
2π
exp
1
1
y2
=
2πy
e
;
y0时,
g
(y)=0.
它称为
2
(1) 分布.
关于
2
分布,后面还要作较详细介绍.
例5
设ξ有连续的分布函数F(x), 求θ= F(ξ)的分布.
解
考虑θ的分布函数,因为0F(x)1, 故
x<0时, P(
x) =
0,(不可能事件); x1时,
P
(
x) =1,
(必然事件);
当0x<1时,{
x}={F(ξ)
x},考虑F(x)的反函数,
由于y =
F(x)不一定严格增加,对同一y,可能有很多个x
与它对应, 为确定起见,对任意
0y1,定义
F
1
(y) = sup{x: F(x)
1
的是x
1
).于是
P(
x) = P( F(ξ) x) = P(ξ
F
1
(x)) = F(F
1
(x)) = x,
即
= F(ξ)服从[0, 1]上的均匀分布.
例6
(例5的反问题)若
服从 [0, 1] 上的均匀分布,
F(x)满足分布函数的
三个性质,求ξ= F
1
(
)的分布.
解 ξ的分布函数为
P(
x) =
P(F
1
(
) x) = P(
F(x)),
因为0F(x) 1,而
~U [0,
1],由均匀分布函数的定义,对任意x,上式等
于F(x).
本例说明:不论F(x)是什
么函数,只要满足分布函数的三个条件,就存在随
机变量使其分布函数为F(x).
三、(连续型)随机向量函数的分布律
设
(
1
,,
n
) 为连续型随机向量,其密度为p
(
x
1
,,x
n
). 又设η=f (
1
,,
n
),
则η的分布函数可由下式决定:
F
(y) = P (f
(
1
,,
n
)y) =
f(x,
1
p(x
1
,x
n
)dx
1
dx
n
,x
n
)y
. (6)
下面看几种特殊情况.
1.1.η=
1
2
F
(y) =
xxy
12
p(x
1
,x
2
)dx
1
dx
2
=
dx
1
yx
1
p(x<
br>1
,x
2
)dx
1
dx
2
,
作变量代换x
2
=z- x
2
,再交换积分次序,得
F
(y)=
dx
1
p(x
1
,zx
1
)dz
y
=
y
(
p(x
1
,zx
1
)dx
1
)dz
,
这说明η是连续型随机变量,其密度函数为
p
(z)
p(x,zx)dx
.
(7)
特别, 当
1
与
2
相互独立,各自有
密度p
1
(x), p
2
(x)时,
1
+
2
的密度为
p
(z)
p
1
(x)p
2
(zx)dx
(或
p
1
(z
x)p
2
(x)dx
'
(7)
) .
(7)
'
式称为卷积公式(convolution),与离散卷积公式 (2)
对照,两者极为相似.
例7 ξ,η独立同分布,都服从N (0,1),
求ζ=ξ+η的分布密度.
解 用卷积公式
(7)
. 对任意zR,
p
(z)
'
1
2
2
e
x
2
2
1
2
e(zx)2
dx
2
1
=
2π2
e
z4
2
2π
e
(2xz2)<
br>2
2
dx
.
1
e
z
2
4
注意到上面积分号中是N(z2
,12)的密度,
就有
p
(z)
=
2π2
ζ=ξ+η~N (0, 2).
, 这说明
以后会用更简单的方法证明:若ξ,η相互独立,ξ~N(
a
1<
br>,
1
), η~N
222
(
a
2
,
2
), 则ξ+η~N
(
a
1
a
2
,
1
2
). 本例是其特殊情况.
与本节的例2对照,
2
可知正态分布对两个参数都有再生性.
例8
设ξ,η相互独立,密度函数分别如下两式,求ζ=ξ+η的密度.
ae
ax<
br>,
x0,
be
bx
,
x0,
p
(x)
p
(x)
x0.x0
.
(b > 0).
0,
0,
(a > 0);
解 当且仅当x >0且z-x >0时, 即z > x >0时,
p
(x)p
(zx)
0.
因此由(7)
式,当z0时
p
(z)0
;当z >0时,
p
(z)
ae
ax
be<
br>b(zx)
dxabe
bz
e
(ab)xdx
00
zz
ab
bz
(ee
az
)
ab
. 故1)
a = b时,
p
(z)abze
; 2) ab时,
2.η=
1
2
F
(y)P(
1
2
y)=
dx
2
0
yx
2
bz
p
(z)
x
1
x
2
y
p(x
1
,x
2
)dx
1
dx
2
0
p(x
1
,x
2
)dx
1
p(x
1
,x
2
)dx
1
dx
2
yx
2
,
令
x
1
zx
2
, 并交换积分次序,得
F
(y)
[
y
y
0<
br>p(zx
2
,x
2
)x
2
dx
2
p(zx
2
,x
2
)x
2
dx
2
]dz
0
p
(z)dz
.
这说明若
(
1
,
2
) 是连续型随机向量,则η=
1
2
是连续型随机变量,其密度为
p
(z)
p(zx,x)|x|dx
.
(8)
例9 ξ,η相互独立,都服从U [0, a], 求ξη的密度.
0x
a,
1
,
p
(x)p
(x)
a
0,
其它.
又ξ,η相互独立,解 故只有
0xza
1
当
0xa
时,p(zx, x) =
p
(zx)p
(x)
=
a
2
0.
上述区域为图中
阴影部分.由(8)式,当z < 0时,对任何x, p(z x, x) = 0,
此时
p
(z)0
;
当0z<1时,由图
p
(z)
1
0
a
中区域I,
a
2
xdx
1
2
;
az
当1z<+∞时,为图中II,
3.次序统计量的分布
p
(z)
1
0
a
2
xd
x12z
2
.
设
1
,
2
,,
n
独立同分布,分布函数都为F(x). 把
1
,
2
,,
n
每取一组值
1
(
),
2
(
),,
n(
)
(
w
)都按大小次序排列,所得随
机变量
1
*
,
2
*
,…,
n
*
称为
****
12n1
次序统计量(order statistic), 它们满足…. 因此,= min
{
1
,
2
,,
n
}, <
/p>
n
*
=max{
1
,
2
,,
n
}.
****
1n1n
现在来求,及(,)的分布,这在数理统计中是有用的.
1)
n
的分布函数
*
P
(
n
x
) =
P(
1
x,
2
x,,
nx
)
n
=
P
(
1
x)P(
2
x)P(
n
x)
=
[F(x)
]
. (9)
*
2)
1
的分布函数
**
*
先
考虑{
1
x}的逆事件{
1
> x},
*n
P{
1
> x}=
P(
1
x,,
n
x)
=
P(
1
x)
P(
n
x)
=
[1F(x)]
,
故
P(
1
x)=1-
[1F(x)]
.
**
3)
(
1
,
n
)的联合分布函数
*n
(10)
*****
F(x, y) = P(
1
x,
n
y) = P (
n
y
)P(
1
> x,
n
y)
n
n
=
[F(x)]
-
P
(
i1(x
i
y)
),
因此当x < y时,
nn
F(x, y) =
[F(x)]
[F(y)F(x)]
;
当xy时,
n
F(x, y) =
[F(x)]
. (11)
如果
<
br>1
,
2
,,
n
还是连续型随机向量,有
密度p(x)
=F(x),则上面各随机变量
(向量)也是连续型,可将各分布函数求导以得到密度函数.
四、随机向量的变换
设
(
1
,
2
,,
n
)
的密度为p(
x
1
,,x
n
). 现有
m
个
1
,
2
,,
n
的函数:
1
=f
1
(
1
,
2,,
n
),…,
m
=f
m
(
1
,
2
,,
n
), 则
(
1
,…,
m
)
也是随机向量,除了各
边际分布外,还要求其联合分布. 类似(6)式,
其联合分布函数为
G(
y
1
,,y
m
)=P(
1
y
1
,
,
m
y
m
)=
D
p(x,
1
,x
n
)dx
1
dx
n
.(12)
这里D是n维区域:{(
x
1
,,x
n
):
f
1
(x
1
,,
x
n
)y
1
,…,
f
m
(x
1
,,x
n
)y
m
}.
定理2 如果m = n,
{f
j
}有唯一的反函数组:x
i
= x
i
(
y
1
,,y
n
), i=1,…,n, 且
(x1
,
J=
(y
1
,
,x
n
)
,y
n
)
0, 则(
1
,…,
n
)是连续型随机向量. 当(
y
1
,,y
n
)
(
f
1
,,f
n
)
的值
域时,其密度为
J|, (13)
q(
y
1
,,y
n
) = p[x
1
(
y
1
,,y
n
),…, x
n
(
y
1
,,y
n
)
]|
其它情况
q(
y
1
,,y
n
)=0.
证
只须在(12)式中利用重积分的变量代换:
u
1
=
f
1
(x
1
,x
n
)
,…,
u
n
=
f
n
(x
1
,x
n
)
, 就有
q(
u
1
,,u
n
)du
1
du
n
G(<
br>y
1
,,y
n
)
=
,
y
1
y
n
故q(
y
1
,,y
n
)确为(
1
,…,
n
)的联合密度.
例10 ξ,η相互
独立,都服从参数为1的指数分布,求α=ξ+η与β=
的联合密度;
并分别求出ξ+η与
的密度.
解
(
,
)的联合密度:当x > 0且y > 0时,p(x, y)
=
e
(xy)
, 其它情况为0.
uxy
<
br>xuv(1v)
vxy
函数组
的反函数组为
yu(1v)
,当x, y>0时, u,
v>0,
J
1
2
11
(u,v)
xyu
(1v)
(x,y)
1yxy
2
=y
2
=-
u
, 故 |J|
=
(1v)
2
,
由(13)式,(
,
)的联合密度为:
u2
u >0且v >0时, q(u, v ) =
eu(1v)
;
在其它情况q(u, v) = 0.
=ξ+η与
=
各自的密度为q(u, v) 的边际密度. 不难看出:
u>0时,
p
(u)ue
;
u
0时,
p
(u)
=0;
2
p(v)
(1v)
v>0时, =1;
v
0时,
p
(v)
=0,
u
并且
,
相互独立.
本
例中,自然也可以用第三段中的方法计算ξ+η与
各自的分布,但这里的方法显然更方便.
这是一个富有启发性的例子,它告诉我们:
1
o
要判断随机向量的几个函数
1
,…,
n
是否独立,可用
随机向量变换公式求得它们的联合分布,再用独立性的
各种充要条件来判断;
2
o要求随机向量的一个函数的分布,有时可适当补充几
个函数,先求它们的联合分布,而原来要求的函
数的分布可作为其边际分布.
例11 假设X是一个随机变量,令Y=2X,那么我们可以用X的分布
函数F
X
(x)
来表示(X,Y)的联合分布函数F
XY
(x,y)
.
如果y2x,那么
P(Xx,Yy)=P(Xx)=F
X
(x);
如果y<2x,
那么
P(Xx, Yy)=P(Yy)=P(Xy2)=F
X
(y2)
因此
F(x),y2x.
F
XY
(x,y)
X
F
X
(y2),y2x.
例12
例12
,
相互
独立,并且
服从N(0,
2
),
服从(0
,)上
的均匀分布.求
=
+acos
的密
度函数,其中a为常数.
解 (
,
)的联合密度为:
22
1
e
x2
,x,0y,
<
br>
其他.
p(x,y)=
0,
令
=
,那么与变换
=
+aco
s
,
=
相对应的方程组是
uxacosy,
vy.
它有唯一解
xuacosv,
yv,
并且J=1.
这样我们得到q(u,v)=p(uacosv,v).因此,
的密度函数为
p
(u)
1
p(uacosv,v)dv
π
π2π
0
e
(uacosv)
2
2
2
dv.
例13
与
独立同分布,都服从N(0, 1), ξ=
cos
,η=
sin
. 求证:
=
(
,
)与
=
(
,
)相互独立.
证 先利用(13)式求(
,
)的联合密度. 变换的函数组与反函数组分别为
r
(x,y),
(x,y).
x rcos
,
yrsin
.
在{∞< x <∞,∞< y <∞, (x, y) (0, 0)} 与 {r>0, 0<2}中变换是一一对应的,
J
=r, (
,
)的联合密度为
x
2
y< br>2
1
exp
2π2
< br>, p(x, y) =
故(
,
)的联合密度为
1
r
2
2
r,
e
2π
0,
q(r,
) =
r0,0
2π,
其它.
q(r,
)可分离成R(r)
(
),其中
re
r
0,
R(r) =
2
2
,
r0,
其它.
,
0
2π,
12π,
(
)=
0,其它.
分别为
,
的密 度,故
与
相互独立. 这里
的分布称为瑞利(Rayleigh)分
布,
是[0, 2]上的均匀分布.
反之,设
1
,
2
相互独立,都服从U[0, 1],
1
(2l n
1
)
12
cos(2π
2
)
,
2
(2ln
1
)
12
sin (2π
2
)
,
则
1
,
2
相互独立,都服从N(0, 1);这是产生N(0, 1)随机数的一种基本方法.
从本章习题我们可以看到, 即使
,
相互独立,
和
的两个函 数f
1
(
,
)与
f
2
(
,
)仍然可以不独立. 但在某些特殊情况,仍保持独立性.
例14 假设随f
1
机变量
X
和
Y
相互独立,并且
Z
仅是
X
的函数,
W
仅是
Y
的函
数:Zg(X),Wh(Y).
如果
g,h
导数存在,那么
Z
和
W
仍相互独立.
证. 首先假设
g(x)z,h(y)w,有唯一解
(x
1
,y
1
)
. 既然
J(x,y)
g
(x)0
0h
(y)
=
g
(x)h
(y)
并且
pXY
(x,y)p
X
(x)p
Y
(y)
,我们有 <
br>p
ZW
(z,w)
p
X
(x
1
)p
Y
(y
1
)
.
g
(x
1
)h
(y
1
)
但x
1
仅是
z的函数,y
1
仅是
w
的函数;因此,
Z
和
W<
br>相互独立. 至于解并不唯一
的情况,也可类似证明,请读者自行完成.
更一般地我们有下面的定理.
定理3 令
1n
1
n
2<
br>n
k
n
;f
1
是n
1
个变量的Bor
el可测函数,f
2
是
n
2
n
1
个变量的Bor
el可测函数,…,f
k
是
n
k
n
k1
个变量
的Borel可测函数. 如果X
1
,
X
2
,… ,
X
n
是独立随机变量,那么
f
1
(
1
,,<
br>n
1
),f
2
(
n
1
1
,,
n
2
),,f
k
(
n
k1
1
,,
n
k
)
是相互独立的.
特别,当
f
1
,f
2
,
立.
注意逆命题不成立,
即有这样的例子:
2
,
2
相互独立,但
与
不独立(见
本章习题65).
五、数理统计中几个重要分布
本段介绍数理统计中应用很广的三个重要分布——
2
分布,
t分布和F分布.
它们都与正态分布有密切关系,都可作为随机变量的函数来导出它们的密度. 先讨论比
2
分布更广泛的一类分布——分布,它的密度函数由§2的(15)
式定义. 这里再来介绍分布的一个重要性质.
引理(分布的可加性)分布
(
,r)对第二个参数具有可加性:若
1
,
2
相互独立,
1
~(
,r
1
),
2
~(
, r
2
), 则
1
+
2
~(
,r
1
+
r
2
).
证 由卷积公式(7)式,
=
1
+
2
的密度:当z<0时,p
(z)=0;
当z>0时,
,f
k
是单变量函数时,我们有
f
1
(<
br>1
),f
2
(
2
),,f
k
(
k
)
相互独
p
(z)=
z
r
1
0
(r
1
)
xe
r
1
1
x
r
2
(r
2
)
(zx)
r
2
1
e
(zx)
dx
.
整理后,作变量代换x=z t,并利用第二型欧拉积分
B(r
1
, r
2
) =
0
就有
1<
br>t
r1
1
(1t)
r
2
1
dt
=(r
1
)(r
2
)(r
1
+
r
2
),
p
(z)
rr
12
(r
1
)(r
2
)
z
r
1
r
2
1
z
eB(r
1
,r
2
)
rr
12
(r
1
r
2
)
z
r
1
r
2
1
e
z
,
所以η~(
,r
1
+ r
2
).
当r=1时,(
,1) 即为指数分布.
另一特殊情况是取
=1 2, r =n2(n为自然
数),即为下面的
1.
2
分布
称(12, n
2)为
2
(n)分布,其中称n为它的自由度(degree of
freedom). 它的
密度为
(12)
n2
n21x2
xe,x0,
p(x)
(n2)
0,
x0.
(14)
定理4 (1)
2
分布具有
可加性,也就是说,设
1
~
2
(n
1
),
2
~
2
(n
2
),则
1
+
2
~
2
(n
1
+ n
2
);(2) 若
1
,,
n
相互独立,都服从N(0,1),则
2
=
1
n
2
~
2
(n).
(15)
证 (1) 由分布的可加性即得
2
分布的可加性.
2
ii
(2) 记, i=1,…,n,
由{
}相互独立,可知{
}相互独立. 又在本节
ii
的例4已经直接算得
i
的密度,由于
(12)π
,故
i
~
2
(1),再由(1), 运用
数学归纳法,就得
i1
n
2
i
i
i1
n
~
2
(n).
上述定理显示了<
br>
2
分布的本质属性,
2
分布中的自由度n即是
正
态变量
i
的个数.
2. t分布
i1
n
2
i
中独立
T
定理5 若
~N(0,1), η~
2
(n), 且
与η相互独立,则随机变量
n
的密度函数为
((n1)2)
(1x
2
n)
(n1)2
p(x
) =
n
π
(
n
2)
, ∞< x <+∞.
(16)
称具有上述密度的随机变量
T
服从t(n)分布,n为它的自由度.
为了证明定理5, 可先用定理1求出
n
的密度,再
用商的密度公式(8)
求出
T
=
的密度,详细
证明见本章末的补充与注记6.
3.
F
分布
m
定理6
设随机变量
~
2
(m), η~
2
(n),
与η相互独立,
则
F
=
n
的密
度函数为
[(m
n)2]
m2n2
x
m21
mn,x0,
p(x)
(mn)2
(m2)(n2)(mxn)
0,x0
.
(17)
称具有上述密度的随机变量服从F(m,n)分布,m与n分别为它
的第一自由度和第
二自由度.
为了证明定理,可先用定理1求得
1
m
与
1
n
的密度,
然后再利用
商的密度公式(8)求得F=
1
1
的密度,详细计算见本章末的补充与注记6.
F分布有下述性质:
(1)(1)若F~F(m, n), 则1 F~F(n, m). 这从F的定义立即可以得到.
2) 若T~t(n),则T
2
~F(1, n).
22
2
T=
n
T
(
n)<
br>,且证 ,
与η相互独立,
~N(0,1),
~
(n),而
2
~
2
(1),
2
与η相互独立,所以T
2
~F(1, n).
补充与注记
1.
十九世纪中叶以前,概率论的主要兴趣仍然集中在随机事件的概率计算上.
俄国数学家切贝雪夫(Chebyshev 1821-1894),马尔可夫(Markov
1856-1922)
和李雅普洛夫 (Lyapunov
1857-1918)等首先明确地引进随机变量这一概念,
并加以广泛地应用与研究.
2. 电话的呼叫数, 等车的乘客数, 放射粒子数等等随机变量为什么服从普
阿松分布呢?这些随机变量表示的都是在一定的时间或空间内出现的事件数,
它们具有下列共同的特性,即平稳性,独立增量性和普通性. 以电话交换台固定
时间
t
内收到的呼唤数
为例来说明这件事,它具有
1
o
平稳性,即在 [t
0
, t
0
+t]
时段内来到的呼叫数
= k的概率只与时段的长度
t
有关,而与区间的起点
t
0
无关,记作P
k
(t).
从而对不同时段的呼叫数的考察当
长度t相同时可以看成重复试验.
2
o
独立增量性(无后效性),即
=k这一事件与t
0
以前所发生的一切事件独
立,所以考察不同时段的呼叫数是独立试验.
3
o
普通性,指在充分小的时间间隔内,最多来到一个呼叫,严格地说,当t
→0时
1P
0
(t)P
1
(t)=o(t)
(1)
现在我们来计算P
k
(t),把区间[t
0
,
t
0
+1)n等分,则 [t
0
, t
0
+ t)
分成nt份,取足
够大的n并把nt看成整数,并使近似地在每个小区间 [t
0
+
(r1)n, t
0
+ rn) 内至
多有一次呼叫,
(
t=1n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫
是一次贝努里试验,而由于头两条性质,对整个时段[t
0
, t
0
+
t) (即对nt个小区间)
的考察可看成是nt重贝努里概型,故事件{
=
k}近似服从二项分布:
P(
= k)≈b(k; nt,
p
n
) (2)
这里p
n<
br>是在一个小区间中有一次呼叫的概率,它与区间长度
t成正比,即
p
n
=
t
.
现在我们来计算P
k
(t),把区间[t
0
, t
0
+1)n等分,则
[t
0
, t
0
+ t)
分成nt份,取足
够大的n并把nt看成整数,并使近似地在每个小区间 [t
0
+
(r1)n, t
0
+ rn) 内至
多有一次呼叫,
(
t=1n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫
是一次贝努里试验,而由于头两条性质,对整个时段[t
0
, t
0
+
t) (即对nt个小区间)
的考察可看成是nt重贝努里概型,故事件{
=
k}近似服从二项分布:
P(
= k)≈b(k; nt,
p
n
) (2)
这里p
n<
br>是在一个小区间中有一次呼叫的概率,它与区间长度
t成正比,即
p
n
=
t
.
(2)式是近似的,其原因是略去了高阶无穷小,当
t
→0即n→∞时,
(2)变
limntp
t
为精确值. 由普阿松定理,得到
(注意
n
n
)
(
t)
k
t
P(
k)limb(k;
nt,p
n
)e
n
k!
, k=0,1,2,….
这就说明了
服从参数为
t
的普阿松分布.
在随机过程理论中,将用更严密的方法讨论这件事,并把上述结果进一步推
广.
3. 我们来说明-分布及指数分布的实际意义. 把参数为
t
的普阿松过程中
接
待r个顾客所需要的时间记为
r
我们来推导它的分布函数F( t ).
当
t
0时,F(t) = 0;
当
t
>0时,以
(t)表示t秒内接待的顾客数,它服从参数为
t
的普阿松分布,
而
事件{
r
≤t} = {ξ(t)≥r}, 从而
(
t)
k
e
t
k!
,
F(t) =P(
r
≤t) = P(ξ(t)≥r) =1P(ξ(t)<
r) = 1
k0
r1
故而其密度函数
k(
t)
k1
e
t
r1
(
<
br>t)
k
e
t
k!k!
k0
p(t) =F(t) =
k0
r1
r1
(
t)
e
t
r
r1
t
te
(r1)!(r)
, (t
>0).
这正是-分布.
上面推导说明普阿松过程中接待r个顾客所需要的时间
r
服从
-分布.
如果我们把某机器更换一个零件看成接待一个顾客,则更换相同的r
个零件所需的时间
r
服从-分布. 特别,更换一个另件所需时间
(即该另件的
寿命)
服从指数分布. 所以指数分布有时也称为寿命分布.
4. 离散型随机变量的概率密度函数
定义脉冲函数,即所谓广义函数
(x)
,它是满足下列积分关系的函
数:对所
有在0点连续的函数
(x)
(x)dx
(0).
通过平移变换,不难看出下式成立:
<
br>(x)
(xx
0
)dx
(x
0).
这样,对任意函数F(x),如果x
0
是其不连续点,令
k
是F(x)在x
0
处的跳跃高度,
即
kF(x
0)F(x
0
)
. 那么
k
(xx
0<
br>)
在x
0
的值可看成是
F(x)
在x
0
处的
导数.
假如X是离散型随机变量,具有分布列
x
1
x
2
x
n
p
1
p
2
p
n
那么,它的密度函数可写为:
,
即
p(
x)
i
p
i
(xx
i
),
dF(x)
F(x
i
)F(x
i
)
(xx
i
)
dx
.
同样也可用p(x)的积分来表达事件的概率,如
P(x
1
Xx
2
)
P(x
1
Xx
2
)
<
br>x
2
x
1
p(x)dx
,
x
2
x
1
p(x)dx
.
例. 如果
X服从退化分布,只取一个值c,那么它的密度函数为
p(x)
(xc)
;如果X服从两点分布,取0,1两个值的概率分别为1-
p
和
p
,
那么它的密度函数为
p(x)(1p)
(x)p
(x
1)
.
混合型随机向量的联合概率密度函数
假设X是离散型随机变
量,分布列如上;Y是连续型随机变量,分布密度为
p
Y
(y)
,
这样(X,Y)的联合概率分布完全集中在一族直线
xx
k
上.
落在线段
x
k
(y,ydy)
上的概率为
P(Xx
k
,yYydy)
.
这时,联合分布函数
F(x,y)
对y连续,对x不连续,其中不连续点为
xx
k
,k1,
2,.
如果X和Y相互独立,那么利用前面关于离散型随机变量密度
函数,同样可以写出(X,
Y)的联合密度函数为
p(x,y)
k1
p
k
(xx
k
)p
(y)
,即 <
br>
p
k
p
(y),xx
k
,k1,2
,
p(x,y)
其它.
0,
,
例. 假设
Z
是一个服从(,)上均匀分布的随机变量,如果
XcosZ,
22
YsinZ
,
那么(X,Y)的联合概率分布完全集中在圆周
xy1
上. 为了计算其
概率密度
函数,令
1
,那么
和
Z
相互独立,
并且联合概率密度函数为
1
,
1,<
br>
z
,
p(
,z)
(
1)p(z)
2
其它.
<
br>0,
另外,方程组
x
cosz,
y
sinz.
有唯一解,并且|J|=1.
因此,(X,Y)的联合概率密度函数为
22
,xy1
,
p(x,y)
2
0,其它.
5. 存在性定理
尽管常用的随机变量和分布函数都有其实际背景,与某个具体的随机试验相<
br>联系,但为了理论研究的方便,我们通常假设某随机变量服从某分布或具有某密
度函数,而不涉及
具体的随机试验. 事实上,下面的存在性定理表明,给定任一
个分布函数
G(x)
,
总可以构造一个适当的试验和相应的随机变量使得其具有分
布函数
G(x)
.
定理 假如G(x)是一个分布函数,那么存在一个概率空间
(,F,)
和一个随
机变量
使得
在
下的分布函数
F
(x)
恰好等于G(x).
证. 我们把所有实数看成是
想象的某试验的结果,即
R
,并定义其上的
域为R上的Bo
rel域. 定义概率P如下:对任意x,定义中的事件(,
x的概率
P(,x
G(x)
.
这样,由测度论中的有关理论知道,上的所有事件的概率都是确定的.
现在定
义随机变量X如下:
X(
)
,
这是合理的,因为这里的
是一个实数. 进而,对任意x我们有
F
(x)((
)x)(
x)G(x).
6.复合分布. 以上我们介绍了一些常用的分布函数,但在实际问题中往往需
要
考虑其他类型的分布函数或者是上述常用分布函数的复合.
例如,在保险精算
业务中,时常需要考虑下列一种风险模型. 记N是给定时期保单的理赔次数,
X
i
是第i次理赔的理赔量,则该时期的总理赔量S等于
i1
N
X
i
. 这个模型的特
点在于理赔次数N是随机变量,因此
S的分布是X
i
的分布与
N
的分布的复合.
为
讨论模型方便,我们作如下假定:
i)
随机变量序列X
i
同分布,共同分布为F(x);
ii) 随机变量序列N,
X
1
,X
2
,,相互独立.
这样
S
的
分布
F
S
(x)
可由全概率公式加以计算
F
S
(x
)P(Sx)
P(Sx|Nn)P(Nn).
n0
当N服从普阿松分布时,我们称S的分布为复合普阿松分布.
n
例. 假设N服从几何分布,
P(Nn)pq
,
n0,1,2,
,其中
0q1
,
p1q
;X
i
为指数分布
FX
i
(x)1
x
,
x0
,求S的分布
解.
记
S
n
i1
X
i
n
.
由上述公式得,
P(S0)P(N0)p
;对
x0
,
P(Sx)
P(Sx|Nn)P(Nn)
n0
=
n0
pqP(S
n
n
x)
=
n0
pq
n
=
x
0
1
z
n1
(n1)!
x
pz<
br>0
z
dz
pq
dz
.
这表
明S是一个混合型分布:取0值的概率为p,以概率q在(0,)上服从参数
为p的指数分布.
7. 全概率公式的连续形式
假设
A
是任一事件,并且
P(A)0
,令X是一随机变量,其分布函数为F(x),
密度函数为p(x). 对x
1
x
2
,因为
P(x
1
Xx
2
)F(x
2
)F(x
1
)
,那么
P(A|
x
1
Xx
2
)
(A,x
1
Xx
2
)
.
F(x
2
)F(x
1
)
并且进而有
P(A|x
1
Xx
2
)
F(x
2
|A)F(x
1
|A)
P(A)
F(x
2
)F(x
1
)
. (1)
对任意集合B,如果
P(B)0
,那么
P(A|B)
没有定义.
然而,如果B与X有关,
那么我们可以用某种极限的方式来定义
P(A|B)
.
现考虑一种重要情形,即
B
Xx
.
假设对某个
x
,
p(x)0
,我们可以定义
P(A|Xx)limP(A|xXxx)
x0
.
这样由(1)有
P(A|Xx)
p(x|A)P(A)
p(x)
,
其中 F(xx|A)F(x|A)
P(A)
p(x|A)lim
,
x0
F(xx)F(x)
称为在条件
A
下的条件密度函数,它具有密度函数的性质. 从上述进一步成立
P(A|Xx)p(x)dx
p(x|A)P
(A)dx
既然右边等于
P(A)
,那么我们获得全概率公式的连续形式
P(A)
P(A|Xx)p(x)dx
和相应的贝叶斯公式
p(x|)
P(A|Xx)p(x)
P(A|Xx)p(x)dx
例.
假设随机变量
P
服从(0,1)区间上的均匀分布.
现独立投掷一枚硬币10
次,每次出现正面的概率为
p
. 求出现4次正面的概率?
解. 用
表示投掷硬币10次所出现的正面次数,当
Pp
时,
服从二项分
布
B(10,p)
. 因此,由全概率公式得 <
br>P(
4)
P(
4|Pp)dp
0
1
=
0
=
1
44
C10
p(1p)
6
dp
4
C
10
(5,7)
1
11
8. t分布与
F
分布的密度函数的推广.
1). t(n)分布
2
若ξ~N(0, 1),
~
(n)
,且ξ与
η相互独立,我们来计算
t
=ξ
n
的密
度.
先求θ=
n
的密度. y
=
xn
是x的严格增加函数,其反函数x = ny
2
有连
续导数.
对 y>0
2
(12)
n2
p
(y)p
<
br>[x(y)]|x
(y)|(ny
2
)
n21
e
ny2
2ny
(n2)
2(n2)
n2
n1ny
2
2
ye
=
(n2)
;
显然当
y
0时,
p
(y)0
.
再求t =ξθ的密度. 因为ξ与η相互独立,故ξ与θ也独立.
由商的密度
公式,
t
的密度为
p
t
(z)
<
br>p(zy,y)|y|dy
p
(zy)p
(y)|y|dy
=
0
2
1
(zy)
2
2
2(n2)
n2<
br>n1ny
2
2
nz
eyeydy
y
2
(n2)
2π
(令
u
=
2
)
1(n2)
n2
2
n2
2(n1)2
(n2)(nz)
π
=
((n1)2)
z
2
1
n
n
(n2)
=<
br>
0
u
(n1)21
e
u
du
(n1)2
, (-∞< z <∞).
2). F(m, n
)分布
m
22
设ξ~
(m)
,η~
(n)
,ξ与η相互独立.
我们来计算
F
=
n
的密度.
先计算
1
m
的密度. 令y = x
m, 则x = my.
1
的密度为
(12)
m2
p
1
(y)p
(my)(my)
(my)
m21
e
my2
m
(m2)
(m2)
m2
m21my2
ye
=
(m2)
, (y >0).
(n2)
n2
n21nx
2
p
2
(x)xe
n
(n2)
同理,
1
的密度为, (x >0).
因此
F=
1
1
的密
度是
p
F
(z)
p
1
(zx)p
2
(x)|
x|dx
(m2)
m2
(n2)
n2m21
(mn)21(mzn)x2
mzn
zxedx<
br>x
0
(m2)(n2)
= (令u=
2
)
(m2)
m2
(n2)
n2
m21
2
z
(m2)(n2)mzn
=
(mn)
2
0
u
(mn)21
e
u
du
((mn)2)
m2n2
z
m21
mn
(
mzn)
(mn)2
, (z >0); =
(m2)(n2)
z
0时,
p
F
(z)0
.