5 随机变量的函数及其分布

巡山小妖精
680次浏览
2020年08月15日 16:10
最佳经验
本文由作者推荐

北京大学医学部地址-男女朋友之间的情话


§5 随机变量的函数及其分布

一、离散型随机变量的函数
二、一维连续型随机变量的函数的分布
三、(连续型)随机向量函数的分布律
四、随机向量的变换
本章补充与注记

2
人们经常碰到随机变 量的函数.例如分子运动的动能T=
mv2
是分子运动速
2

度—— 随机变量
v
的函数;数理统计中经常用到(n)分布,相应的随机变量

2< br>=

1
2
+…+

n
2
,其中各< br>
i
相互独立,都服从N (0, 1).

2


1
,…,

n
的函数.
一般,若ξ是随机变量, y = g (x)是普通的实函数,则η= g(ξ)是ξ的函数.
接着产生两个问题:1) η是随机变量吗?2) 如果是,η的分布与ξ的分布有什
么关系?对于多个随机变量的函数,也存在同样的问题.
对第一个问题比较容易解决. 因为若η= g (ξ)是随机变量,就必需满足§1
的(1)式,这就不得不对函数g (x) 有所限制.
定义 设g (x)是一维实函数,

是R上的波雷尔σ-域. 若对任意B∈

,都

{x: g (x) ∈B}=g
1
(B) ∈

(1)
(即当g (x)的值域是波雷尔集时,其原像也是波雷尔集), 则称g(x)是一元波雷尔
函数.
实变函数论中可以证明:一切分段连续, 分段单调的函数都是波雷尔函数,
故它是十分广泛的一类函数,日常碰到的大都是这类函数.
现在我们可以来回答第一个问题:若ξ是概率空间 (Ω,

, P)上的随机变量,
f(x)是一元波雷尔函数,η= f (ξ) , 则对任意的B∈

,由这里的 (1)及§1的(1)
式可得
{ω:η(ω)∈B}={ω: f (ξ(ω))∈B}={ω:ξ(ω)∈f
1
(B) }∈

.
故η是随机变量.


类似可以定义n元波雷尔函数. 且若f (
x
1
,,x
n
)是波雷尔函数,则η=
f(

1
,,

n
)就是随机变量. 以后我们讲随机变量的函数都是指这种函数.
下面讨论第二个问题,分几步来解决.

一、离散型随机变量的函数
这种情况比较简单,仅举几个例子来说明.

10

11


例1 设ξ的分布列为
42
1
1
8
2


1
< br>
2
8

,η=2ξ-1, ζ=

, 求η,ζ各自的分
布.
解 η的可能取值为3, 1, 1, 3, 是有限个, 只须算出对应的概率. 由于
{η=3}= {ξ=1},故P{η=3}= P{ξ=1},类似可得其它概率. 我们得到η

311

111


的分布:

428
3


1


8

.
ζ可取的值为0,1,4,但注意到{ζ=1}={ξ=1}

{ξ =1},故P{ζ=1} =P{ξ

0

1
113
< br>

=1}+P{ξ=
1
}=
848
;ζ的分 布列为

2
1
3
8
4


1

8

.
一般,设ξ有分布列P(ξ=
x
i
) = p (
x
i
), i=1,2,…, 则η=f (ξ)有分布列
P(η=
y
j
) =
f(x)y
i

p(x
i
)
j
,
j
=1, 2,….
例2 设ξ~B (
n
1
, p), η~B (
n
2
, p), ξ,η相互独立,求ζ=ξ+η的分布.
解 ξ,η各可取值0,1,…,
n
1
和0,1,…,
n
2
, 则ζ可取值0, 1,…,
n
1
+
n
2
,
且由§4的(5)式,得
P(ζ= r) =
r

P(

k,
< br>rk)

P(

k)P(

rk)
k0
rr
=
k0

=
k 0

C
k
n
1
pq
k
n
1k
C
rk
n
2
p
rk
q
n2
rk
=
pq
r
n
1
n
2r

C
k0
r
k
n
1
rkC
n
2


=
rr
n
1
n
2
r
C
n
pq
n
12
,
这里用到了组合数的性质. 计算的结果表明: ξ+η~B (
n
1
+
n
2
, p), 这个事实
显示了二项分 布一个很重要的性质:两个独立的二项分布,当它们的第二参数相
同时,其和也服从二项分布,它的第一 参数恰为这两个二项分布第一参数的和.
这性质称为二项分布的再生性(或可加性(additive property)).从ξ,η的概
率意义来看,这结果是非常明显的:ξ和η分别是
n1
和n
2
重贝努里试验中成功的
次数,两组试验合起来,ζ=ξ+η应该 就是
n
1
n
2
重贝努里试验中成功的次数.
本例计算过程中得到的公式
P(ζ= r) =

P(

k,

rk)

P(

k)P(
rk)
k0
rr
=
k0
(2)
是计算取非负整数值的独立随机变量和的分布的公式,称为离散卷积公式.

二、一维连续型随机变量的函数的分布
设ξ的密度函数为p (x),我们要求出η=f (ξ)的分布函数
G
(
y
). 事实上, G(y)
=P(ηy) = P(f (ξ) y), 而D ={x:f (x) y}是一维波雷尔集,故
G(y)= P(ξ∈D) =

xD
p(x)dx
. (3) < br>至于η是不是连续型随机变量,它的密度函数是什么,在一般场合无法作出
决定,但在某些特殊而 又常见的场合,我们可以直接导出η的密度函数g(y).
1
f
定理1 若f(x)严格单调,其反函数(y)有连续导函数,则η=f (ξ)也是连
续型随机变量,其密度函数为

p(f
1
(y)) |(f
1
(y))

|,
yf(x)的值域,
y其它.
0,
g(y) =

(4)
证 不妨设f(x)严格单调增加,且∞< x <+∞时, A< f (x) 显然若yA则G(y) = 0,此时有g(y)=0;当A1

f
(y)}, 故
f
1
(y)
G(y) = P(ηy) =


p(x)dx
,
1
f
令x =(v), 得


G(y)=

A
y
p(f
1
(v))(f
1
(v))

dv
=

y

g(v)dv
,
其中g(v) 如(4)式所示;而当yB时有G(y)=1, 故g(y) = 0; 这就证得(4)式.
当y = f (x)为严格单调减少时,类似可证(4)式成立.
推论 若y = f (x) 在不相重叠的区间
I
1
,I
2
,…上逐段严格单调, 在各段的反< br>函数
h
1
(y),h
2
(y)
,…有连续导数,则η = f(ξ)是连续型随机变量,其密度为


p(h
i
(y)) |h
i

(y)|,
当y各h
i
(y)的定义域时,< br>
其它.
0,
g(y) =

. (5)
证 注意到{f (ξ) y}={ξ
合,再利用(4)式得到

E
i
(y)
i
},其中
E
i
(y)

I
i
中满足f (x) y的
x
的集
P(
y)P(



E
i
(y))


ii
E
i
(y)
p(x)dx

=


i
y

p(h
i
(x))|hi

(x)|dx

p(h(x))|h

(x)|d x.

=

ii
i
y
由此即得证(5)式.
例3 设ξ~N( a,

), 求η=
k
ξ+
b
的密度函数 (k

0).
1


y =f(x) = kx+b满足上述定理1中的条件,
f
(y) = (y b) k, ξ的密度
2
p(x)=
1

(xa)
2

< br>

2

2

, ∞ < x <+∞, 由(4)式,


exp

1

(yka b)
2

1
yb
22



 [a]2

2
2(k

)
2π|k|


,
k
g(y) =


exp{}·|1 k | =exp

22
说明η~N(ka+b,
k

). 特别,若η= (ξa) b,则η~N(0,1),这个结果早已
为我们所熟知.
2

例4 ξ~N(0, 1), 求η=的密度.
2
解 y=
x
是分段单调的,反函数:当
I
1
=(,0)时, x=
h
1
(
y
)=
y
; 当
I
2
=(0,+ )
时,x=
h
2
(y)=
y
; 值域都是y>0. 故y>0时,
2
2


(y)


1

(y)


1
1


< br>




2
2
g

(y ) =

exp




2y

2y
+

exp

1


1
y2
=
2πy
e
;
y0时,
g

(y)=0.
它称为

2
(1) 分布. 关于

2
分布,后面还要作较详细介绍.
例5 设ξ有连续的分布函数F(x), 求θ= F(ξ)的分布.
解 考虑θ的分布函数,因为0F(x)1, 故
x<0时, P(

x) = 0,(不可能事件); x1时,
P
(

x) =1, (必然事件);

当0x<1时,{

x}={F(ξ) x},考虑F(x)的反函数,
由于y = F(x)不一定严格增加,对同一y,可能有很多个x
与它对应, 为确定起见,对任意 0y1,定义
F
1
(y) = sup{x: F(x)作为F(x)的反函数(图2-6中,对应y
1
的是x
1
).于是
P(

x) = P( F(ξ) x) = P(ξ F
1
(x)) = F(F
1
(x)) = x,


= F(ξ)服从[0, 1]上的均匀分布.
例6 (例5的反问题)若

服从 [0, 1] 上的均匀分布, F(x)满足分布函数的
三个性质,求ξ= F
1
(

)的分布.
解 ξ的分布函数为
P(

x) = P(F
1
(

) x) = P(

F(x)),
因为0F(x) 1,而

~U [0, 1],由均匀分布函数的定义,对任意x,上式等
于F(x).
本例说明:不论F(x)是什 么函数,只要满足分布函数的三个条件,就存在随
机变量使其分布函数为F(x).

三、(连续型)随机向量函数的分布律
设 (

1
,,

n
) 为连续型随机向量,其密度为p (
x
1
,,x
n
). 又设η=f (

1
,,

n
),
则η的分布函数可由下式决定:
F

(y) = P (f (

1
,,

n
)y) =
f(x,
1

p(x
1
,x
n
)dx
1
dx
n
,x
n
)y
. (6)
下面看几种特殊情况.


1.1.η=

1


2

F

(y) =
xxy
12

p(x
1
,x
2
)dx
1
dx
2
=



dx
1

yx
1

p(x< br>1
,x
2
)dx
1
dx
2
,
作变量代换x
2
=z- x
2
,再交换积分次序,得
F

(y)=



dx
1

p(x
1
,zx
1
)dz

y
=

y

(



p(x
1
,zx
1
)dx
1
)dz
,
这说明η是连续型随机变量,其密度函数为

p

(z)



p(x,zx)dx
. (7)
特别, 当

1


2
相互独立,各自有 密度p
1
(x), p
2
(x)时,

1
+

2
的密度为

p

(z)



p
1
(x)p
2
(zx)dx
(或



p
1
(z x)p
2
(x)dx
'
(7)
) .
(7)
'
式称为卷积公式(convolution),与离散卷积公式 (2) 对照,两者极为相似.
例7 ξ,η独立同分布,都服从N (0,1), 求ζ=ξ+η的分布密度.
解 用卷积公式
(7)
. 对任意zR,
p

(z)


'
1
2

2

e
x
2
2
1
2

e(zx)2
dx
2

1
=
2π2
e
z4


2


e
(2xz2)< br>2
2
dx
.
1
e
z
2
4
注意到上面积分号中是N(z2 ,12)的密度, 就有
p

(z)
=
2π2
ζ=ξ+η~N (0, 2).
, 这说明
以后会用更简单的方法证明:若ξ,η相互独立,ξ~N(
a
1< br>,

1
), η~N
222
(
a
2
,

2
), 则ξ+η~N (
a
1
a
2
,

1


2
). 本例是其特殊情况. 与本节的例2对照,
2
可知正态分布对两个参数都有再生性.
例8 设ξ,η相互独立,密度函数分别如下两式,求ζ=ξ+η的密度.

ae
ax< br>,
x0,

be
bx
,
x0,
p
(x)

p

(x)

x0.x0 .
(b > 0).
0,

0,
(a > 0);
解 当且仅当x >0且z-x >0时, 即z > x >0时,
p

(x)p

(zx)
0. 因此由(7)
式,当z0时
p

(z)0
;当z >0时,


p

(z)

ae
ax
be< br>b(zx)
dxabe
bz

e
(ab)xdx
00
zz

ab
bz
(ee
az
)
ab
. 故1) a = b时,
p

(z)abze
; 2) ab时,
2.η=

1


2

F

(y)P(

1


2
 y)=


dx
2

0
yx
2
bz
p

(z)
x
1
x
2
y
p(x
1
,x
2
)dx
1
dx
2
0

p(x
1
,x
2
)dx
1
 
p(x
1
,x
2
)dx
1


dx
2



yx
2
,

x
1
zx
2
, 并交换积分次序,得
F
(y)

[


y
y
0< br>p(zx
2
,x
2
)x
2
dx
2


p(zx
2
,x
2
)x
2
dx
2
]dz

0




p

(z)dz

.
这说明若 (

1
,

2
) 是连续型随机向量,则η=

1


2
是连续型随机变量,其密度为

p
(z)



p(zx,x)|x|dx
. (8)
例9 ξ,η相互独立,都服从U [0, a], 求ξη的密度.
0x a,
1

,

p

(x)p

(x)

a


0,
其它.
又ξ,η相互独立,解 故只有


0xza
1



0xa
时,p(zx, x) =
p

(zx)p

(x)
=
a
2
0. 上述区域为图中
阴影部分.由(8)式,当z < 0时,对任何x, p(z x, x) = 0, 此时
p



(z)0
; 当0z<1时,由图
p



(z)

1
0
a
中区域I,
a
2
xdx
1
2
;
az
当1z<+∞时,为图中II,
3.次序统计量的分布
p



(z)

1
0
a
2
xd x12z
2
.


1
,

2
,,

n
独立同分布,分布函数都为F(x). 把

1
,

2
,,

n
每取一组值

1
(

),

2
(

),,

n(

)
(
w


)都按大小次序排列,所得随 机变量

1
*
,

2
*
,…,

n
*
称为
****




12n1
次序统计量(order statistic), 它们满足…. 因此,= min {

1
,

2
,,

n
}, < /p>



n
*
=max{

1
,

2
,,

n
}.
****




1n1n
现在来求,及(,)的分布,这在数理统计中是有用的.
1)

n
的分布函数
*
P
(

n

x
) =
P(

1
x,

2
x,,

nx
)
n
=
P
(

1
x)P(

2
x)P(

n
x)
=
[F(x) ]
. (9)
*
2)

1
的分布函数
**
*

考虑{

1
x}的逆事件{

1
> x},
*n
P{

1
> x}=
P(

1
x,,

n
x)
=
P(

1
x) P(

n
x)
=
[1F(x)]
,

P(

1
x)=1-
[1F(x)]
.
**
3) (

1
,

n
)的联合分布函数
*n
(10)
*****
F(x, y) = P(

1
x,

n
y) = P (

n
y )P(

1
> x,

n
y)
n
n
=
[F(x)]
-
P
(
i1(x

i
y)
),
因此当x < y时,
nn
F(x, y) =
[F(x)]

[F(y)F(x)]
;
当xy时,
n
F(x, y) =
[F(x)]
. (11)
如果
< br>1
,

2
,,

n
还是连续型随机向量,有 密度p(x) =F(x),则上面各随机变量
(向量)也是连续型,可将各分布函数求导以得到密度函数.

四、随机向量的变换
设 (

1
,

2
,,

n
) 的密度为p(
x
1
,,x
n
). 现有
m


1
,

2
,,

n
的函数:

1
=f
1
(

1
,

2,,

n
),…,

m
=f
m
(
1
,

2
,,

n
), 则 (

1
,…,

m
) 也是随机向量,除了各


边际分布外,还要求其联合分布. 类似(6)式, 其联合分布函数为
G(
y
1
,,y
m
)=P(

1
y
1
,

,

m
y
m
)=

D

p(x,
1
,x
n
)dx
1
dx
n
.(12)
这里D是n维区域:{(
x
1
,,x
n
):
f
1
(x
1
,, x
n
)y
1
,…,
f
m
(x
1
,,x
n
)y
m
}.
定理2 如果m = n, {f
j
}有唯一的反函数组:x
i
= x
i
(
y
1
,,y
n
), i=1,…,n, 且
(x1
,
J=
(y
1
,
,x
n
)
,y
n
)
0, 则(

1
,…,

n
)是连续型随机向量. 当(
y
1
,,y
n
) (
f
1
,,f
n
)
的值
域时,其密度为

J|, (13) q(
y
1
,,y
n
) = p[x
1
(
y
1
,,y
n
),…, x
n
(
y
1
,,y
n
)
]|
其它情况 q(
y
1
,,y
n
)=0.
证 只须在(12)式中利用重积分的变量代换:
u
1
=
f
1
(x
1
,x
n
)
,…,
u
n
=
f
n
(x
1
,x
n
)
, 就有
q( u
1
,,u
n
)du
1
du
n
G(< br>y
1
,,y
n
) =




,
y
1
y
n
故q(
y
1
,,y
n
)确为(

1
,…,

n
)的联合密度.
例10 ξ,η相互 独立,都服从参数为1的指数分布,求α=ξ+η与β=



的联合密度; 并分别求出ξ+η与



的密度.
解 (

,

)的联合密度:当x > 0且y > 0时,p(x, y) =
e
(xy)
, 其它情况为0.

uxy
< br>xuv(1v)

vxy
函数组

的反函数组为

yu(1v)
,当x, y>0时, u, v>0,
J
1

2
11
(u,v)
xyu
(1v)


(x,y)
1yxy
2
=y
2
=-
u
, 故 |J| =
(1v)
2
,
由(13)式,(

,

)的联合密度为:
u2
u >0且v >0时, q(u, v ) =
eu(1v)
; 在其它情况q(u, v) = 0.

=ξ+η与

=



各自的密度为q(u, v) 的边际密度. 不难看出:
u>0时,
p

(u)ue
;
u
0时,
p

(u)
=0;
2
p(v)
(1v)

v>0时, =1;
v
0时,
p

(v)
=0,
u


并且

,

相互独立.
本 例中,自然也可以用第三段中的方法计算ξ+η与



各自的分布,但这里的方法显然更方便.
这是一个富有启发性的例子,它告诉我们:
1
o
要判断随机向量的几个函数

1
,…,

n
是否独立,可用 随机向量变换公式求得它们的联合分布,再用独立性的
各种充要条件来判断;
2
o要求随机向量的一个函数的分布,有时可适当补充几
个函数,先求它们的联合分布,而原来要求的函 数的分布可作为其边际分布.
例11 假设X是一个随机变量,令Y=2X,那么我们可以用X的分布 函数F
X
(x)
来表示(X,Y)的联合分布函数F
XY
(x,y) .
如果y2x,那么
P(Xx,Yy)=P(Xx)=F
X
(x);
如果y<2x, 那么
P(Xx, Yy)=P(Yy)=P(Xy2)=F
X
(y2)
因此

F(x),y2x.
F
XY
(x,y)

X

F
X
(y2),y2x.

例12 例12




相互 独立,并且

服从N(0,

2
),

服从(0 ,)上
的均匀分布.求



+acos

的密 度函数,其中a为常数.
解 (



)的联合密度为:
22

1
e
x2
,x,0y,
< br>


其他.
p(x,y)=

0,




,那么与变换

=

+aco s





相对应的方程组是

uxacosy,

vy.

它有唯一解

xuacosv,

yv,


并且J=1. 这样我们得到q(u,v)=p(uacosv,v).因此,

的密度函数为

< p>
p

(u)


1


p(uacosv,v)dv
π

π2π

0
e
(uacosv)
2
2

2
dv.

例13



独立同分布,都服从N(0, 1), ξ=
cos
,η=
sin
. 求证:

=

(

,

)与

=

(

,

)相互独立.
证 先利用(13)式求(

,

)的联合密度. 变换的函数组与反函数组分别为

r

(x,y),






(x,y).


x rcos

,


yrsin

.

在{∞< x <∞,∞< y <∞, (x, y) (0, 0)} 与 {r>0, 0<2}中变换是一一对应的,
J
=r, (

,

)的联合密度为

x
2
y< br>2

1
exp



2π2
< br>, p(x, y) =
故(

,

)的联合密度为
1
r
2
2
r,

e



0,
q(r,

) =

r0,0

2π,
其它.

q(r,

)可分离成R(r) 

(

),其中


re
r


0,
R(r) =

2
2
,
r0,
其它.
,
0

2π,

12π,


(

)=

0,其它.

分别为

,

的密 度,故



相互独立. 这里

的分布称为瑞利(Rayleigh)分
布,

是[0, 2]上的均匀分布.
反之,设

1
,

2
相互独立,都服从U[0, 1],

1
(2l n

1
)
12
cos(2π

2
)
,

2
(2ln

1
)
12
sin (2π

2
)
,


1
,

2
相互独立,都服从N(0, 1);这是产生N(0, 1)随机数的一种基本方法.
从本章习题我们可以看到, 即使

,

相互独立,



的两个函 数f
1
(

,

)与
f
2
(
,

)仍然可以不独立. 但在某些特殊情况,仍保持独立性.
例14 假设随f
1
机变量
X

Y
相互独立,并且
Z
仅是
X
的函数,
W
仅是
Y
的函
数:Zg(X),Wh(Y).
如果
g,h
导数存在,那么
Z

W
仍相互独立.
证. 首先假设
g(x)z,h(y)w,有唯一解
(x
1
,y
1
)
. 既然


J(x,y)
g

(x)0
0h

(y)
=
g

(x)h

(y)

并且
pXY
(x,y)p
X
(x)p
Y
(y)
,我们有 < br>p
ZW
(z,w)
p
X
(x
1
)p
Y
(y
1
)
.
g

(x
1
)h

(y
1
)

但x
1
仅是
z的函数,y
1
仅是
w
的函数;因此,
Z

W< br>相互独立. 至于解并不唯一
的情况,也可类似证明,请读者自行完成.
更一般地我们有下面的定理.
定理3 令
1n
1
n
2< br>n
k
n
;f
1
是n
1
个变量的Bor el可测函数,f
2

n
2
n
1
个变量的Bor el可测函数,…,f
k

n
k
n
k1
个变量 的Borel可测函数. 如果X
1
,
X
2
,… , X
n
是独立随机变量,那么
f
1
(
1
,,< br>n
1
),f
2
(
n
1
1
,,
n
2
),,f
k
(
n
k1
1
,,
n
k
)

是相互独立的.
特别,当
f
1
,f
2
,
立.
注意逆命题不成立, 即有这样的例子:

2
,

2
相互独立,但


不独立(见
本章习题65).

五、数理统计中几个重要分布
本段介绍数理统计中应用很广的三个重要分布——

2
分布, t分布和F分布.
它们都与正态分布有密切关系,都可作为随机变量的函数来导出它们的密度. 先讨论比

2
分布更广泛的一类分布——分布,它的密度函数由§2的(15)
式定义. 这里再来介绍分布的一个重要性质.
引理(分布的可加性)分布 (

,r)对第二个参数具有可加性:若

1
,

2
相互独立,

1
~(

,r
1
),

2
~(

, r
2
), 则

1
+

2
~(

,r
1
+ r
2
).
证 由卷积公式(7)式,

=

1
+

2
的密度:当z<0时,p

(z)=0; 当z>0时,
,f
k
是单变量函数时,我们有
f
1
(< br>1
),f
2
(
2
),,f
k
(
k
)
相互独
p

(z)=

z

r
1
0
(r
1
)
xe
r
1
1


x

r
2
(r
2
)
(zx)
r
2
1
e


(zx)
dx
.


整理后,作变量代换x=z t,并利用第二型欧拉积分
B(r
1
, r
2
) =

0
就有
1< br>t
r1
1
(1t)
r
2
1
dt
=(r
1
)(r
2
)(r
1
+ r
2
),

p

(z)

rr
12
(r
1
)(r
2
)
z
r
1
r
2
1


z
eB(r
1
,r
2
)

rr
12
(r
1
r
2
)
z
r
1
r
2
1
e


z
,
所以η~(

,r
1
+ r
2
).
当r=1时,(

,1) 即为指数分布. 另一特殊情况是取

=1 2, r =n2(n为自然
数),即为下面的
1.

2
分布
称(12, n 2)为

2
(n)分布,其中称n为它的自由度(degree of freedom). 它的
密度为

(12)
n2
n21x2
xe,x0,

p(x)
(n2)


0, x0.
(14)

定理4 (1)

2
分布具有 可加性,也就是说,设

1


2
(n
1
),

2


2
(n
2
),则

1
+

2


2
(n
1
+ n
2
);(2) 若

1
,,

n
相互独立,都服从N(0,1),则

2

=


1



n
2


2
(n). (15)
证 (1) 由分布的可加性即得

2
分布的可加性.
2



ii
(2) 记, i=1,…,n, 由{

}相互独立,可知{

}相互独立. 又在本节
ii
的例4已经直接算得

i
的密度,由于
(12)π
,故

i


2
(1),再由(1), 运用
数学归纳法,就得


i1
n
2
i



i
i1
n


2
(n).
上述定理显示了< br>
2
分布的本质属性,

2
分布中的自由度n即是
正 态变量

i
的个数.
2. t分布


i1
n
2
i
中独立
T
定理5 若

~N(0,1), η~

2
(n), 且

与η相互独立,则随机变量


n


的密度函数为
((n1)2)
(1x
2
n)
(n1)2
p(x ) =
n
π

(
n
2)
, ∞< x <+∞. (16)
称具有上述密度的随机变量
T
服从t(n)分布,n为它的自由度.
为了证明定理5, 可先用定理1求出



n
的密度,再 用商的密度公式(8)
求出
T
=



的密度,详细 证明见本章末的补充与注记6.
3.
F
分布

m
定理6 设随机变量



2
(m), η~

2
(n),

与η相互独立, 则
F
=

n
的密
度函数为

[(m n)2]
m2n2
x
m21
mn,x0,

p(x) 
(mn)2
(m2)(n2)(mxn)


0,x0 .
(17)

称具有上述密度的随机变量服从F(m,n)分布,m与n分别为它 的第一自由度和第
二自由度.
为了证明定理,可先用定理1求得

1


m


1


n
的密度, 然后再利用
商的密度公式(8)求得F=

1


1
的密度,详细计算见本章末的补充与注记6.
F分布有下述性质:
(1)(1)若F~F(m, n), 则1 F~F(n, m). 这从F的定义立即可以得到.
2) 若T~t(n),则T
2
~F(1, n).
22
2
T=



n
T

(

n)< br>,且证 ,

与η相互独立,

~N(0,1),



(n),而

2


2
(1),

2
与η相互独立,所以T
2
~F(1, n).

补充与注记
1. 十九世纪中叶以前,概率论的主要兴趣仍然集中在随机事件的概率计算上.
俄国数学家切贝雪夫(Chebyshev 1821-1894),马尔可夫(Markov 1856-1922)
和李雅普洛夫 (Lyapunov 1857-1918)等首先明确地引进随机变量这一概念,
并加以广泛地应用与研究.


2. 电话的呼叫数, 等车的乘客数, 放射粒子数等等随机变量为什么服从普
阿松分布呢?这些随机变量表示的都是在一定的时间或空间内出现的事件数,
它们具有下列共同的特性,即平稳性,独立增量性和普通性. 以电话交换台固定
时间
t
内收到的呼唤数

为例来说明这件事,它具有
1
o
平稳性,即在 [t
0
, t
0
+t] 时段内来到的呼叫数

= k的概率只与时段的长度
t
有关,而与区间的起点 t
0
无关,记作P
k
(t). 从而对不同时段的呼叫数的考察当
长度t相同时可以看成重复试验.
2
o
独立增量性(无后效性),即

=k这一事件与t
0
以前所发生的一切事件独
立,所以考察不同时段的呼叫数是独立试验.
3
o
普通性,指在充分小的时间间隔内,最多来到一个呼叫,严格地说,当t
→0时
1P
0
(t)P
1
(t)=o(t) (1)
现在我们来计算P
k
(t),把区间[t
0
, t
0
+1)n等分,则 [t
0
, t
0
+ t) 分成nt份,取足
够大的n并把nt看成整数,并使近似地在每个小区间 [t
0
+ (r1)n, t
0
+ rn) 内至
多有一次呼叫, (

t=1n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫
是一次贝努里试验,而由于头两条性质,对整个时段[t
0
, t
0
+ t) (即对nt个小区间)
的考察可看成是nt重贝努里概型,故事件{

= k}近似服从二项分布:
P(

= k)≈b(k; nt, p
n
) (2)
这里p
n< br>是在一个小区间中有一次呼叫的概率,它与区间长度

t成正比,即
p
n
=


t
.
现在我们来计算P
k
(t),把区间[t
0
, t
0
+1)n等分,则 [t
0
, t
0
+ t) 分成nt份,取足
够大的n并把nt看成整数,并使近似地在每个小区间 [t
0
+ (r1)n, t
0
+ rn) 内至
多有一次呼叫, (

t=1n), r=1,2,…, nt. 故在一个小区间内有还是没有一次呼叫
是一次贝努里试验,而由于头两条性质,对整个时段[t
0
, t
0
+ t) (即对nt个小区间)
的考察可看成是nt重贝努里概型,故事件{

= k}近似服从二项分布:
P(

= k)≈b(k; nt, p
n
) (2)
这里p
n< br>是在一个小区间中有一次呼叫的概率,它与区间长度

t成正比,即

p
n
=


t
.
(2)式是近似的,其原因是略去了高阶无穷小,当
t
→0即n→∞时, (2)变
limntp

t
为精确值. 由普阿松定理,得到 (注意
n
n
)
(

t)
k


t
P(

k)limb(k; nt,p
n
)e
n
k!
, k=0,1,2,….
这就说明了

服从参数为
t
的普阿松分布.
在随机过程理论中,将用更严密的方法讨论这件事,并把上述结果进一步推
广.
3. 我们来说明-分布及指数分布的实际意义. 把参数为
t
的普阿松过程中
接 待r个顾客所需要的时间记为

r
我们来推导它的分布函数F( t ).

t
0时,F(t) = 0;

t
>0时,以
(t)表示t秒内接待的顾客数,它服从参数为
t
的普阿松分布,
而 事件{

r
≤t} = {ξ(t)≥r}, 从而
(

t)
k
e


t

k!
, F(t) =P(

r
≤t) = P(ξ(t)≥r) =1P(ξ(t)< r) = 1
k0
r1
故而其密度函数
k(

t)
k1

e


t
r1
(
< br>t)
k

e


t




k!k!
k0
p(t) =F(t) =
k0

r1
r1
(

t)


e

t

r
r1

t
te
(r1)!(r)
, (t >0).
这正是-分布. 上面推导说明普阿松过程中接待r个顾客所需要的时间

r
服从
-分布. 如果我们把某机器更换一个零件看成接待一个顾客,则更换相同的r
个零件所需的时间

r
服从-分布. 特别,更换一个另件所需时间

(即该另件的
寿命) 服从指数分布. 所以指数分布有时也称为寿命分布.
4. 离散型随机变量的概率密度函数
定义脉冲函数,即所谓广义函数

(x)
,它是满足下列积分关系的函 数:对所
有在0点连续的函数





(x)

(x)dx

(0).


通过平移变换,不难看出下式成立:



< br>(x)

(xx
0
)dx

(x
0).

这样,对任意函数F(x),如果x
0
是其不连续点,令
k
是F(x)在x
0
处的跳跃高度,

kF(x
0)F(x
0
)
. 那么
k

(xx
0< br>)
在x
0
的值可看成是
F(x)
在x
0
处的 导数.
假如X是离散型随机变量,具有分布列

x
1
x
2
x
n


p
1
p
2
p
n
那么,它的密度函数可写为:



,

p( x)

i
p
i

(xx
i
),
dF(x)


F(x
i
)F(x
i
)

(xx
i
)
dx
.
同样也可用p(x)的积分来表达事件的概率,如
P(x
1
Xx
2
)

P(x
1
Xx
2
)
< br>x
2
x
1
p(x)dx
,
x
2
x
1
p(x)dx
.
例. 如果 X服从退化分布,只取一个值c,那么它的密度函数为
p(x)

(xc)
;如果X服从两点分布,取0,1两个值的概率分别为1-
p

p

那么它的密度函数为
p(x)(1p)

(x)p

(x 1)
.
混合型随机向量的联合概率密度函数
假设X是离散型随机变 量,分布列如上;Y是连续型随机变量,分布密度为
p
Y
(y)
, 这样(X,Y)的联合概率分布完全集中在一族直线
xx
k
上. 落在线段

x
k

(y,ydy)
上的概率为
P(Xx
k
,yYydy)
.
这时,联合分布函数
F(x,y)
对y连续,对x不连续,其中不连续点为
xx
k
,k1, 2,.
如果X和Y相互独立,那么利用前面关于离散型随机变量密度
函数,同样可以写出(X, Y)的联合密度函数为


p(x,y)

k1
p
k

(xx
k
)p

(y)

,即 < br>
p
k
p

(y),xx
k
,k1,2 ,
p(x,y)

其它.

0,
,

例. 假设
Z
是一个服从(,)上均匀分布的随机变量,如果
XcosZ
22
YsinZ
, 那么(X,Y)的联合概率分布完全集中在圆周
xy1
上. 为了计算其
概率密度 函数,令

1
,那么


Z
相互独立,
并且联合概率密度函数为

1



1,< br>
z

,
p(

,z)

(

1)p(z)

2


其它.
< br>0,

另外,方程组

x

cosz,


y

sinz.

有唯一解,并且|J|=1. 因此,(X,Y)的联合概率密度函数为


22

,xy1 ,
p(x,y)

2


0,其它.

5. 存在性定理
尽管常用的随机变量和分布函数都有其实际背景,与某个具体的随机试验相< br>联系,但为了理论研究的方便,我们通常假设某随机变量服从某分布或具有某密
度函数,而不涉及 具体的随机试验. 事实上,下面的存在性定理表明,给定任一
个分布函数
G(x)
, 总可以构造一个适当的试验和相应的随机变量使得其具有分
布函数
G(x)
.
定理 假如G(x)是一个分布函数,那么存在一个概率空间
(,F,)
和一个随
机变量

使得



下的分布函数
F

(x)
恰好等于G(x).
证. 我们把所有实数看成是 想象的某试验的结果,即

R
,并定义其上的

域为R上的Bo rel域. 定义概率P如下:对任意x,定义中的事件(,


x的概率
P(,x

G(x)
.
这样,由测度论中的有关理论知道,上的所有事件的概率都是确定的. 现在定
义随机变量X如下:
X(

)

,




这是合理的,因为这里的

是一个实数. 进而,对任意x我们有
F

(x)((

)x)(

x)G(x).
6.复合分布. 以上我们介绍了一些常用的分布函数,但在实际问题中往往需
要 考虑其他类型的分布函数或者是上述常用分布函数的复合. 例如,在保险精算
业务中,时常需要考虑下列一种风险模型. 记N是给定时期保单的理赔次数,
X
i
是第i次理赔的理赔量,则该时期的总理赔量S等于

i1
N
X
i
. 这个模型的特
点在于理赔次数N是随机变量,因此
S的分布是X
i
的分布与
N
的分布的复合. 为
讨论模型方便,我们作如下假定:
i) 随机变量序列X
i
同分布,共同分布为F(x);
ii) 随机变量序列N, X
1
,X
2
,,相互独立.
这样
S
的 分布
F
S
(x)
可由全概率公式加以计算
F
S
(x )P(Sx)

P(Sx|Nn)P(Nn).
n0


当N服从普阿松分布时,我们称S的分布为复合普阿松分布.
n
例. 假设N服从几何分布,
P(Nn)pq

n0,1,2,
,其中
0q1
,
p1q
;X
i
为指数分布
FX
i
(x)1
x
,
x0
,求S的分布
解. 记
S
n


i1
X
i
n
. 由上述公式得,
P(S0)P(N0)p
;对
x0


P(Sx)

P(Sx|Nn)P(Nn)
n0
=
n0

pqP(S
n

n
x)


=
n0

pq
n

=

x
0
1
z
n1
(n1)!
x
pz< br>0
z
dz

pq

dz
.
这表 明S是一个混合型分布:取0值的概率为p,以概率q在(0,)上服从参数
为p的指数分布.
7. 全概率公式的连续形式
假设
A
是任一事件,并且
P(A)0
,令X是一随机变量,其分布函数为F(x),
密度函数为p(x). 对x
1
x
2
,因为
P(x
1
Xx
2
)F(x
2
)F(x
1
)
,那么
P(A| x
1
Xx
2
)
(A,x
1
Xx
2
)
.
F(x
2
)F(x
1
)

并且进而有
P(A|x
1
Xx
2
)
F(x
2
|A)F(x
1
|A)

P(A)
F(x
2
)F(x
1
)
. (1)
对任意集合B,如果
P(B)0
,那么
P(A|B)
没有定义. 然而,如果B与X有关,
那么我们可以用某种极限的方式来定义
P(A|B)
. 现考虑一种重要情形,即
B

Xx

. 假设对某个
x

p(x)0
,我们可以定义
P(A|Xx)limP(A|xXxx)
x0
.
这样由(1)有
P(A|Xx)
p(x|A)P(A)
p(x)
,
其中 F(xx|A)F(x|A)

P(A)

p(x|A)lim ,
x0
F(xx)F(x)

称为在条件
A
下的条件密度函数,它具有密度函数的性质. 从上述进一步成立


P(A|Xx)p(x)dx

p(x|A)P (A)dx



既然右边等于
P(A)
,那么我们获得全概率公式的连续形式


P(A)

P(A|Xx)p(x)dx



和相应的贝叶斯公式
p(x|)
P(A|Xx)p(x)



P(A|Xx)p(x)dx

例. 假设随机变量
P
服从(0,1)区间上的均匀分布. 现独立投掷一枚硬币10
次,每次出现正面的概率为
p
. 求出现4次正面的概率?
解. 用

表示投掷硬币10次所出现的正面次数,当
Pp
时,

服从二项分

B(10,p)
. 因此,由全概率公式得 < br>P(

4)

P(

4|Pp)dp
0
1

=

0
=
1
44
C10
p(1p)
6
dp

4
C
10

(5,7)
1
11

8. t分布与
F
分布的密度函数的推广.
1). t(n)分布
2
若ξ~N(0, 1),



(n)
,且ξ与 η相互独立,我们来计算
t


n
的密
度.
先求θ=

n
的密度. y =
xn
是x的严格增加函数,其反函数x = ny
2
有连
续导数. 对 y>0
2
(12)
n2
p

(y)p
< br>[x(y)]|x

(y)|(ny
2
)
n21
e
ny2
2ny
(n2)

2(n2)
n2
n1ny
2
2
ye
=
(n2)

显然当
y
0时,
p

(y)0
.
再求t =ξθ的密度. 因为ξ与η相互独立,故ξ与θ也独立. 由商的密度
公式,
t
的密度为
p
t
(z)
< br>p(zy,y)|y|dy

p

(zy)p

(y)|y|dy




=


0
2
1
(zy)
2
2
2(n2)
n2< br>n1ny
2
2
nz
eyeydy
y
2
(n2)

(令
u
=
2
)

1(n2)
n2
2
n2
2(n1)2
(n2)(nz)
π
=
((n1)2)

z
2

1

n

n

(n2)

=< br>

0
u
(n1)21
e
u
du
(n1)2
, (-∞< z <∞).
2). F(m, n )分布

m
22
设ξ~

(m)
,η~

(n)
,ξ与η相互独立. 我们来计算
F
=

n
的密度.
先计算

1


m
的密度. 令y = x m, 则x = my.

1
的密度为
(12)
m2
p
1
(y)p

(my)(my)

(my)
m21
e
my2
m
(m2)

(m2)
m2
m21my2
ye
=
(m2)
, (y >0).
(n2)
n2
n21nx 2
p
2
(x)xe



n
(n2)
同理,
1
的密度为, (x >0). 因此
F=

1


1
的密
度是
p
F
(z)

p
1
(zx)p
2
(x)| x|dx



(m2)
m2
(n2)
n2m21

(mn)21(mzn)x2
mzn
zxedx< br>x

0
(m2)(n2)
= (令u=
2
)
(m2)
m2
(n2)
n2
m21

2

z

(m2)(n2)mzn

=
(mn) 2


0
u
(mn)21
e
u
du

((mn)2)
m2n2
z
m21
mn
( mzn)
(mn)2
, (z >0); =
(m2)(n2)
z
0时,
p
F
(z)0
.

城关中学-拆除合同


场景描写-股份合作协议


国考最热职位-课堂教学艺术


外国文学网-建议书怎么写


市场营销毕业论文范文-陕西省住房和城乡建设厅执业资格注册中心


入党心路历程-个人月工作总结


阿根廷签证-美丽的圣诞树


母亲节ppt模板-广告学专业