随机变量函数的分布随机变量的函数定义如果存在一个
北京石油化工学院-中秋节的来历和习俗
第四节 随机变量函数的分布
一、 随机变量的函数
定义 如果存在一个函数
g(X)
, 使得随机变量
X,Y
满足:
Yg(X)
,
则称随机变量
Y
是随机变量
X
的函数.
注:
在微积分中,我们讨论变量间的函数关系时, 主要研究函数关系的确定性特征,
例如:
导数、积分等.而在概率论中, 我们主要研究是随机变量函数的随机性特征,
即由自变量
X
的
统计规律性出发研究因变量
Y
的统计性规律.
一般地, 对任意区间
I
, 令
C{x|g(x)I}
, 则
{YI}{g(x)I}{XC},
P{YI}P{g(x)I}P{XC}.
注: 随机变量
Y<
br>与
X
的函数关系确定,为从
X
的分布出发导出
Y
的分
布提供了可能.
二、离散型随机变量函数的分布
设离散型随机变量
X
的概率分布为
P{Xx
i
}p
i
,i1,2,
易见,
X
的函数
Yg(X)
显然还是离散型随机变量.
如何由
X
的概率分布出发导出
Y
的概率分布? 其一般方法是:先根
据自变量
X
的可能
取值确定因变量
Y
的所有可能取值, 然后对Y
的每一个可能取值
y
i
,i1,2,,
确定相应的
C
i
{x
j
|g(x
j
)y
i
},
于是
{Yy
i
}{g(x
i
)y
i
}{XC
i
},
P{Yy
i
}P{XCi
}
x
j
C
i
P{Xx}.
j
从而求得
Y
的概率分布.
三、
连续型随机变量函数的分布
一般地, 连续型随机变量的函数不一定是连续型随机变量,
但我们主要讨论连续型随机
变量的函数还是连续型随机变量的情形,
此时我们不仅希望求出随机变量函数的分布函数,
而且还希望求出其概率密度函数.
设已知
X
的分布函数
F
X
(x)
或概率密度函数
f
X
(x)
,
则随机变量函数
Yg(X)
的分布
函数可按如下方法求得:
F
Y
(y)P{Yy}P{g(X)y}P{XC
y
}.
其中
C
y
{x|g(x)y}.
而
P{X
C
y
}
常常可由
X
的分布函数
F
X
(x)
来表达或用其概率密度函数
f
X
(x)
的积分来
表达:
P{XC
y
}
C
y
f
X
(x)dx
进而可通过
Y
的分布函数
F
Y
(x)
,
求出
Y
的密度函数.
定理1 设随机变量
X
具有概率密度
f
X
(x),x(,)
,又设
yg(x)
处处可导且
恒有
g
(x)0
(或恒有
g
(x)0), 则
Yg(X)
是一个连续型随机变量,其概率密度为
f[h
(y)|h
(y)|,
y
f
Y
(y)
0,其它
其中
xh(y)
是<
br>yg(x)
的反函数, 且
min(g(),g()),
max(g(),g()).
例题选讲:
离散型随机变量函数的分布
例1(讲义例1)设随机变量
X
具有以下的分布律,
试求
Y(X1)
2
的分布律.
X1012
p
i
0.20.30.10.4
解
Y
所有可能的
取值0,1,4,由
P{Y0}P{(X1)
2
0}P{X1}0.1,
P{Y1}P{X0}P{X2}0.7,
P{Y4}P{X1}0.2,
既得
Y
的分布律为
Y
.
0 1 4
P
i
0.10.70.2
连续型随机变量函数的分布
例2(讲义例2)设随机变量
X~N(0,1),Ye,
求
Y
的概率密度函数.
解 设
F
Y
(y),f
Y
(y)
分别为随机变量
Y
的分布函数和概率密度函数.
则当
y0
时, 有
F
Y
(y)P{Yy}
P{e
X
y}
P{}0.
当
y0
时,
因为
g(x)e
x
是
x
的严格单调增函数,
所以有
{e
X
y}{Xlny},
因而
F
Y
(y)P{Yy}
P{e
X
X
y}
P{Xl
ny}
2
1
2
lny
e
x
2
2
dx.
1
(lny)
'
e
2
,y0
.
再由
f
Y
(y)F
Y
(y),
得
f
Y
(y)
2
0,y0
通常称上
式中的
Y
服从对数正态分布, 它也是一种常用寿命分布.
x
8,0x4
例3(讲义例3)设
X~f
X
(x)
,
求
Y2X8
的概率密度.
0,其它
解
设
Y
的分布函数为
F
Y
(y),
则
F
Y
(y)P{Yy}P{2X8y}P{X(y8)2}F
X
[(
y8)2]
于是
Y
的密度函数
f
Y
(y)<
br>dF
Y
(y)
y8
1
f
X
dy
2
2
y8
y8
y8
注意到
0x4
时
,
f
X
(x)0,
即
8y16
时,
f
X
0,
且
f
X
2216
(y8)32,8y16
故
f<
br>Y
(y)
.
0,其它
例4 设
X~N(0,1)
, 求
YX
2
的密度函数.
解 记
Y
的分布函数为
F
Y
(x),
则
F
Y
(x)P{Yx}P{X
2
x}.
显然, 当
x0
时,
F
Y
(x)P{X
2x}0;
当
x0
时,
F
Y
(x)
P{X
2
x}P{xXx}2(x)1.
<
br>2(x)1,x0
从而
YX
的分布函数为
F
Y
(x)
0,x0
2
1<
br>
1
e
x2
,x0
(x),x0
于是其密度函数为
f
Y
(x)F
Y
(x)
x
2
x
.
0,x0
0,x0
注:
以上述函数为密度函数的随机变量称为服从
2
(1)
分布,
它是一类更广泛的分布
2
(n)
在
n1
时的特例.
关于
2
(n)
分布的细节将在第五章中给出.
例5(
讲义例4)已知随机变量
X
的分布函数
F(x)
是严格单调的连续函数,
证明
YF(X)
服从
[0,1]
上的均匀分布.
证明
设
Y
的分布函数是
G(y),
由于
0y1,
于是对
y0,G(y)0;
对
y1,G(y)1;
又由于
X
的分布函数
F
是严格递增的连续函数,
其反函数
F
1
存在且严格递增.对
0y1,
G(y
)P{Yy}P{F(X)y}
P{XF
1
(y)}F(F
1
(y))y
y0
0,
即
Y
的分布函数是
G(y)
y,0y1
1
,y1
1,0y1
求导得
Y
的密度函数
g(y)
可见,
Y
服从[0,1]上的均匀分布. 证毕.
0,其它
注:本例的结论在计算机模拟中有重要的应用.
例6(讲义例5)
设随机变量X~N(
,
2
)
.试证明X的线性函数
YaXb
(a0)
也服从
正态分布.
证
X
的概率密度为
f
X
(x)
1
2<
br>
e
(x
)
2
2
2
,
x.
由
yg(x)axb
解得<
br>xh(y)
f
Y
(y)
yb
,
且有从而
YaXb
的概率密度为
a
1
yb
f
X
,
y,
|a|
a
yb
a
2
e
2
2
即
f
Y
(y)
11
|a|
2
1
|a|<
br>
2
e
[y(ba
)]
2
2(a
)
2
(y)
即有
YaXb~N(a
b,(a
)
2
).
特别地, 若在本例中取
a
1
,b
X
,
则得
Y~N(0,1).
这就是上节中一个已知定理的结果.
例7
设随机变量
X
服从参数为
的指数分布, 求
Ymin{X,2}
的分布函数.
解 根据已知结果,
X
的分布函数
1e
x
,x0
F
X
(x)
x0
0,
Y
的分布函数
F
Y
(y)P{Yy}P{min{X,2}y}
1P{min{X,2
}y}
1P{Xy,2y}.
当
y2
时,
F
Y
(y)1P{Xy}P{Xy}F
X
(y),
当
y2
时,
F
Y
(y)1.
y0
0,
代入
X
的分布函数中可得
F
Y<
br>(y)
1e
y
,0y2.
1,y2
注:在本例中, 虽然X是连续型随机变量,
但Y不是连续型随机变量, 也不是离散型
随机变量, Y的分布在
y2
处间断.
例8 (讲义例6)
设随机变量
X
在
(0,1)
上服从均匀分布,
求
Y2lnX
的概率密度.
解 在区间 (0,1) 上, 函数
ln
x0,
故
y2lnx0,
y
2
0
x
于是
y
在区间
(0,)
上单调下降,
有反函数
xh(y)e
y2
y2
)
y2
d(e
),0e
y2
1
f
X
(e
从而
f
Y
(y)
dy
0,其它
已知
X
在在(0,1)上服从均匀分布,
1,0x1
f
X
(x)
0,
其它
1
y2
e,y0
代入
f<
br>Y
(y)
的表达式中,
得
f
X
(y)
2
其它
0,
即
Y
服从参数为12的指数分布.
例9 (对数正态分布)随机变量
X
称为服从参数为
,
2
的对数正态分布, 如果
YlnX
服从正态分布
N(
,
2
)
. 试求对数正态分布的密度函数.
解 由于
YlnX~N(
,
2
),
等价地有
Xe
Y
,
Y~N(
,
2<
br>),
于是,当
x0
时,
F
X
(x)
P{Xx}P{e
Y
x}
P{Ylnx}F
Y
(lnx
);
当
x0
时,
显然
F
X
(x)0.
继而可得
X
的密度函数为
(lnx
)
2
1
1
2
2
,x0
f
Y
(lnx),x0
e
(x)
x
f
X
(x)FX
.
2
x
0,
x0
0,x0
注: 在实际中,
通常用对数正态分布来描述价格的分布, 特别是在金融市场的理论研究
中,
如著名的期权定价公式(Black—Scholes公式),
以及许多实证研究都用对数正态分布
来描述金融资产的价格.
设某种资产当前价格为
P
0
, 考虑单期投资问题,
到期时该资产的价
格为一个随机变量, 记作
P
1
,
设投资于该资产的连续复合收益率为
r
, 则有
r
P
1
P
0
e
从而
rln
P
1
lnP
1
lnP
0
P
0
注意到
P
0
为当前价格, 是已知常数,因而假设价
格
P
1
服从对数正态分布实际上等价于假设
连续复合收益率
r
服从正态分布.
课堂练习
1. 设X的分布列为
X101252
p
i
1511
试求: (1)
2X的分布列; (2)
X
2
的分布列.
2.
设随机变量
X
的概率密度为
2x
2<
br>,0x
,
f(x)
0,其它.
求
YsinX
的概率密度.