随机变量的数字特征
繁文缛节-小学六年级下册作文
第四章 随机变量的数字特征
【基本要求】 理解随机变量的数学期望与方差的概念,掌
握它们的性质与计算方法;掌握计算
随机变量函数的数学期望方法;掌握二项分布、泊松分布、正态分布
和指数分布的数学期望和方
差;了解协方差、相关系数、矩的概念、性质及计算方法。
【本章重点】 数学期望与方差的概念、性质与计算方法;求随机变量函数的数学期望的方法;
二项分布、泊松分布、正态分布和指数分布的数学期望和方差。
【本章难点】 数学期望与方差的概念
计算方法;随机变量函数的数学期望的计算方法;协方差、
相关系数、矩的概念、性质及计算方法
【学时分配】7-9学时
分布函数:
F(x)P(Xx)
——全面描述
随机变量X取值的统计规律。但是,在实际问题中
分布函数的确定并不是一件容易的事,而且有时我们也
不需要知道分布函数,只需知道随机变量
的某些数字特征就够了。例如:
评价粮食产量,只关注平均产量;
研究水稻品种优劣,只关注每株平均粒数;
评价某班成绩,只关注平均分数、偏离程度;
评价射击水平,只关注平均命中环数、偏离程度。
描述变量的平均值的量——数学期望,
描述变量的离散程度的量——方差。
§4.1 数学期望
教学目的:使学生理解掌
握随机变量的数学期望的实际意义及概念,会计算具体分布的数学期望;
使学生理解掌握随机变量函数的
数学期望的计算及数学期望的性质。
教学重点、难点:数学期望的概念及其计算;随机变量函数的数学期望的计算及数学期望的性质。
教学过程:
(一) 数学期望的概念
先看一个例子:一射手进行打靶练习,规定射入
区域
e
2
得2分,
射入区域
e
1
得1分,脱靶即射入
e
2
区域
e
0
得0分.设射手一次射击的得分数X是一个
e
1
e
0
随机变量,而且X的分布律为P{X=k}=
p
k
,k=0,1,2
现射击N次,其中得0分
a
0
次,得1分
a
1<
br>次,得2分
a
2
次,
a
0
+
a
1<
br>+
a
2
=N.则他射击N次得分的
总和为
a
0
0+
a
1
1+
a
2
2,他平均一次射击的得分数为
2
a
0
0a
1
1a
2
2aa
k
k
,因为当N充分大时,
频率
k
稳定值
概率p
k
。
NN
N
k0
所以当N充分大时,
平均数
x
x
k
p
k
。
稳定值
k0
2
显然,数值
x
k
p
k
完全由随机变量X的概率分布确定,而与试验无关,它反映了平均数的大小。
k0
2
定义:
1.离散型随机变量的数学期望:设离散型随机变量X的分
布律为
P
Xx
k
p
k
,
k1,2,3
…若级
数
x
k
p
k
绝对
收敛,则称级数
x
k
p
k
为随机变量X的数学期望,记为
E(X)
,即
E(X)
=
x
k
p
k
。
k1k1k1
2.连续型随机变量的数学期望:设连续
型随机变量X的密度函数为
f(x)
,若积分
xf(x)dx
绝对
收敛,则称积分
xf(x)dx
的值为随机变量X
的数学期望,记为
E(X)
。即
E(X)
=
xf(x)d
x
。
数学期望简称期望,又称为均值。
(二)
数学期望的计算
关键是:求出随机变量的分布律或者密度函数。
1、离散型——若
则
E(X)
=
x
k
p
k
(绝对收敛)
k1
2、连续型——若X ~ 密度函数
,则
E(X)
=
xf(x)dx
(绝对收敛)
例1 甲、乙两个工人,生产同一种产品,在相同条件下,生产100件产品所
出的废品数分别用X、
Y表示,它们的概率分布如下:
X
P
K
0
0.7
1
0.1
2
0.1
3
0.1
Y
P
K
0
0.5
1
0.3
2
0.2
3
0
问这两个工人谁的技术好?
解:
E(X)
=
00.71
0.120.130.10.6
,
E(Y)
=
00.510
.320.2300.7
甲工人生产出废品的均值较小,甲的技术好。
例2 有5个相互独立工作的电子装置,它们的寿命X
k
(k=1,2,3,4,5)
服从同一指数分布,其概
1
x
e,x0,
率密度为
f
x
,
0
,(1)若将这5个电子装置串联连接组成整机,求整机寿命
x0.
0,
(以小时记)N的数学期望。(2)若将这5个电子装置并联连接组成整机,求
整机寿命(以小时记)
M的数学期望。
分析:5个电子装置串联,整机寿命
Nmi
n
X
1
,X
2
,X
3
,X
4<
br>,X
5
,并联,整机寿命
Mmax
X
1
,X
2
,X
3
,X
4
,X
5
,要求N,M的数学期望,关键求N,M的密度函数
f
min
(x),fmax
(x).
x
1e
,x0,
解: (
1)
X
k
k1,2,3,4,5
的分布函数为
F
x
。
0,x
0.
因为5个电子装置串联,所以整机寿命
Nmin
X
1,X
2
,X
3
,X
4
,X
5
的分布函数为
F
min
x
1
1F
x
5
1e
5x
,x0,
,因而N的概率密度为
x0.
0,
5
5x
e,x0,
5
5x
,于是N的数学期望为,
E
(N)
xf
min
x
dx
<
br>x
f
min
x
edx
。
0
5
x0.
0,
(2) 因
为5个电子装置并联,所以整机寿命
Mmax
X
1
,X
2
,X
3
,X
4
,X
5
的分布函数为<
br>F
max
x
F
x
5
5
1e
x
<
br>,x0,
,因而N的概率密度为
x0.
0,
x
x
4
<
br>5
1ee,x0,
f
max
x
<
br>
,于是N的数学期望为
x0.
0,
5
E(N)
xf
max
x
dx
x
1e
x
e
0
4
x
dx<
br>137
。
60
我们可以看到
E
M
11.4
,即5个电子装置并联联接工作的平均寿命是串联联接工作的平均寿
E
N
命的11.4倍。
例3 按规定,某车站每天8:00~
9:00,9:00~10:00都恰有一辆客车到站,但到站的时间是随机的,
且两者到站的时间相互
独立。其规律为
到站时刻 8:10
9:10
概率 16
8:30
9:30
36
8:50
9:50
26
一旅客8:20到站,求他候车时间的数学期望。
分析 :
第一车8:30到站10分钟,第一车8:50到站
30分钟
解
设旅客候车的时间为X(以分记),则X的的可取值为10、30、50、70、90. 且
P{X=10}=P
“第一班车8:30到站”=
3
.
6
2
P{X=30}= P“第一班车8:50到站”=.
6
111
P{X=50}=
P“第一班车8:10到站,且第二班车9:10到站”=
6636
133
P{X=70}= P“第一班车8:10
到站,且第二班车9:30到站” =
6636
122
P{X=90}= P“第一班车8:10
到站,且第二班车9:50到站” =
6636
即X的分布列为
X
P
k
X的数学期望为
10 30
50 70 90
所以若旅客8:20到站,则他候车时间的数学期望为27.22(分)。
例4 一个人数
很多的团体中普查某种疾病,为此要抽验N个人的血,可以用两种方法进行。(1)
将每个人的血分别去
验,这就需验N次。(2)按k个人一组进行分组.把k个人抽来的血混合在
一起进行检验,如果这混合
血液显阴性反应,就说明k个人的血都显阴性反应,这样,这k个人
的血就只需验一次。若显阳性,则再
将对这k个人的血液分别进行化验,这样,这k个人的血总
共要化验k+1次,假设每个人化验显阳性的
概率为p,且这些人的试验反应是相互独立的。试说明
当p较小时,选取适当的k,按第二种方法可以减
少化验的次数。并说明k取什么值时最适宜。
解 若按第二种方法,以k个人为一组
进行化验,记1-p=q,设组内每个人化验的次数为X,则
1k1
X的可取值为
,
.由于各人是否显阴性是相互独立的,所以:
kk
P{
x
1
}=
P
“k个人的混合血显阴性”=
P
“k个人的血都显阴性”=
k
k1
}=
P
(k个人的混合血显阳性)=
P
(k个人的混合血不阴性)=
1q
k
k
P{
x
故每个人化验次数X的期望值为:
当时,在普
查中平均每人的化验次数就小于1,从而第二种方法可以减少化验的次数。显然,
p
愈小这种方
法愈有利。当
p
已知时,可选定使
q
k
行化验,将能最大
限度地减少化验次数。
例如p=0.1即q=0.9时可用赋值法求函数
q
k
1
的最大值:
k
1
达最大即
k
达最小,以个人为一组进
k 2
3 4 5 6 7 …
0.31
0.39 0.40 0.39 0.37 0.33 …
1
有最大值0.4,说明以4个人为一组进行化验能减少40%的工作量。
k
可见,当k=4时,函数
q
k
(三)随机变量函数的数学期望
1、已知X的分布,求Y=g(X) 的数学期望E(Y)
2
我们经常需要求随机变
量的函数的数学期望,例如飞机机翼受到压力W=kV(V是风速,k>0 是
常数)的作用,需要求W
的数学期望,这里W是随机变量V的函数。这时,可以通过下面的定理
来求W的数学期望。
定理 设Y是随机变量X的函数,
Yg(X)
(
g
是连续函数)
(1) X是离散型随机变量,它的分布律为
P{Xx
k
}
p
k
,
k
=1,2,3,…,若
g(X
k)p
k
绝
k1
对收敛,则有
E(Y)E[g(x
)]
g(x)p
k
k1
k
(2) X是连续型随机变量,它的概率密度为
f(x)
,若
g(x)f(x)dx
绝对收敛,则有
E(Y)E[g(x)]<
br>
g(x)f(x)dx
证明:
设X是连续型随机变量,且y=g(x)满足第二章§5中定理的条件。
由第二章§5中的(5.2)式知道随机变量Y=g(X)的概率密度为
f
x
[h(y)]|h'(y),
y
f
Y
(y)
其它.
0,
于是,E(Y)=
yf
Y
(y)dy
yf
x
[h(y)]|h'
(y)|dy
当
h
(y)
恒>0时,E(Y)=
yf
x
[h(y)]|h'(y)|dy
g(x)f(x)
dx.
当
h
(
y)
恒<0时,E(Y)=
yf
x
[h(y)]h'(
y)dy
g(x)f(x)dx
g(x)f(x)dx.
综合上两式,(1.4)得证。
上述定理还可以推广到两个或两个以上随机变量的函数的情况。给出如下结论:
设Z是二维随
机变量
(X,Y)
的函数
Zg(X,Y)
,其中
g
是二元
连续函数,
(1)设
(X,Y)
是离散型,其分布律为
P{Xx
i,
Yy
i
}p
ij
,
i,j
=1,2,3,
…,
则当级数
g(x
i
,y
i
)p
ij
绝对收敛时,有
E(Z)E[g(x,y)]
g(x
i
,y
i
)p
ij
i1j1i1j1
(3) 设
(X,Y)
是连续型
,密度函数为
f(x,y)
,则当积分
绝对收敛时,有
E(Z)
E[g(x,y)]
<
br>
g(x,y)f(x,y)dxdy
g(x,y)f(x,y)dxdy
1
0va,
,
例5
设风速V在(0,a)上服从均匀分布,即具有概率密度
f(v)
a
<
br>
0,其它.
又设飞机机翼受到的正压力W是V的函数:WkV
2
(V是风速,k>0 是常数),求W的数学期望。
解:由(1.4
)式有E(W)=
kvf(v)dv
kv2
2
11
dvka
2
a3
例6 设二维随机变量(X,Y)的概率密度为
xy,0x10,y1,
,试求XY的数学期望。
f
x,y
0,其它
解:
E
XY
xy
f
x,y
dxdy
1
xyxydxdy
0
0
3
11
例7按季节出售的
某种应时商品,每售出一公斤获利润b元。如到季末尚有剩余商品,则每公斤
净亏损
l
元.设某商店在季度内这种商品的销售量 X(以公斤计)是一随机变量, 在区间(s
1
,s
2
)
上服从均匀分布。为使商店所获得利润的数学期望最大,问商店应进多少货? <
br>解:以s(公斤)表示进货数,易知应取
s
1
ss
2
,进
货s所得的利润记为
a
x
X
,则
a
x
X
是
bX
sX
<
br>l,s
1
Xs,
随机变量,且有
a
x
X
sb,sXs.
2
<
br>1
,s
1
ss
2
,
X的概率密度为<
br>f
x
s
2
s
1
,
0,其它.
E
a
s
X
bx
sx<
br>
l
s
1
ss
2
11
dx
sbdx
s
s
2
s
1
s
2
s
1
bl
2
bl
2
<
br>slsbsss
1
12
2
2
s
2
s
1
由于
dd
E
a
s
<
br>X
=
blsls
1
bs2
,令
E
a
s
X
<
br>=0,得
s
2
s
1
dsds
s
ls
1
bs
2
bl
<
br>,即当
s
ls
1
bs
2
bl
(公斤)时获得利润的数学期望最大。
(四) 数学期望的性质
现在来证明数学期望的几个重要性质(以下设所遇到的随机变量的数学期望存在)
1 设
C
是常数,则有
E(C)C
。
2
设
X
是一个随机变量,
C
是常数,则有
E(CX)CE(X)
3 设
X
、
Y
是两个随机变量,则有
E(XY)
E(X)E(Y)
这一性质可以推广到任意有限个随机变量之和的情况。
4
设
X
、
Y
是相互独立的随机变量,则有
E(XY)E(X)E(Y
)
这一性质可以推广到任意有限个相互独立的随机变量之积的情况。
证:证3和4,
设二维随机变量(X,Y)的概率密度为f(x,y),其边缘概率密度为f
X
(x),f
Y
(y),
E(X+Y)=
(xy)f(x,y)dxdy
<
br>
xf(x,y)dxdy
yf(x,y)dxdy
=E(X)+E(Y),3得证。
又若X,Y相互独立,
E(XY)=
xyf(x,y)dxdy
=
xyf
X
(x)f
Y
(y)dxdy
xf(x)dx
yf(y)dy
E(X)
E(Y)
X
Y
=
,4得证
例11 一民航送客
车载有20位旅客自机场开出,旅客有10个车站可以下车。如到达一个车站没
有旅客下车就不停车,以
X表示停车的次数,求E(X)(设每位旅客在各个车站下车是等可能的
并设各旅客是否下车相互独立)
。
0,在第i站无人下车
解:
引入随机变量
x
i=1,2,…,10
1,在第i站有人下车
易知
X=X
1
+X
2
+……+X
10
,现在来求E(X) 9
9
按题意,任一旅客在第i站不下车的概率为,因此20位旅客都
不在第i站下车的概率为
,
10
10
20
9
在第i站有人下车的概率为1—
,也就是
10
9
9
P{X=0}=
,P{X
i
=1}=1—
,i=
1,2,…,10
10
10
9
由此,E(X
i
)=1—
,i=1,2,…,10
10
9
进而E(X)= E(X
1
+X
2
+……+X
10
)=E(X
1
)+E(X
2
)+……+E(X
10
)=10
[1—
]=8.784(次)
10
本题是将X分
解成数个随机变量之和,然后利用随机变量和的数学期望等于随机变量数学期望之
和来求数学期望的,这
种处理方法具有一定的普遍意义。
例12 设一电路中电流I(A)与电阻R(Ω)是两个相互独立
的随机变量,其概率密度分别为:
20
20
2020
20
2i,0i1,
g
i
0,
其它,
r
2
,0r3,
试求电压V=IR的均值。
h
r
9
0,其它,<
br>
解 E(V)=E(IR)=E(I)E(R)
3
3
1
2
3
r
dr
ig(i)di
rh(r)dr
2idi<
br>
00
3
2
。
==
(五)一些常用分布的数学期望
计算可得一些常用分布的数学期望
1.0—1分布
X
P
k
0
1-
p
1
p
E(X)0(1p)1pp
2.二项分布
X:b(n,p)则E(X)np
3.泊松分布
X~
(
)
,则
E(X)
计算:
E(X)=
K
K
0
K
e
K!
<
br>
e
(K1)!
K1
K
e
e
e
K1
(K1)!
K1
4.均匀分布
X~U[
a,b
],则
E(X)
5.指数分布
X服从参数为
的指数分布,则
E(X)
。计算如下:
ab
2
E(X)
xf(x)dx
x
0
0
xe
dx
1
<
br>x
xe
d()
x
0
xde
x
x
<
br>x
xe
0
|
<
br>
e
dx
(e
)|<
br>0
0
x
6.正态分布
X~
N(
,
2
),则E(X)
这里计算了一些,没计算的由学生自己计算。
(六)小结
描述变量的平均值的量—数学期望
1、离散型——若X
~
P
Xx
k
p
k
则
E(X)
=
x
k
p
k
(绝对收敛)
k1
2、连续型——若X ~密度函数
f(x)
,则
E(X)
=
xf(x)dx
(绝对收敛)数学期望
E(X)
描述随机变量
X
取值的平均大小,要掌握数学期望的
性质,会计算数学期望,掌握几种常用分布
的数学期望。
(七)
课堂练习P
139
4、8、14、15。
布置作业
P
138
1、2、3,9、10
§4、2 方差
教
学目的:使学生理解掌握随机变量的方差概念及性质,会计算具体分布的方差,熟记常见分布
的方差;
使学生理解掌握方差的性质,能熟练计算具体分布的方差,进一步熟记常见
分布的方差。
教学
重点、难点:方差的性质、具体分布的方差的计算;随机变量的方差概念及性质、具体分布
的方差的计算
。
教学过程:
上节课,我们研究了随即变量的重要数字特征——数学期望。它描述了随机变
量一切可能取
值的平均水平。但在一些实际问题中,仅知道平均值是不够的,因为它有很大的局限性,还
不能
够完全反映问题的实质。例如,某厂生产两类手表,甲类手表日走时误差均匀分布在-10~10秒
之
间;乙类手表日走时误差均匀分布在-20~20秒之间,易知其数学期望均为0,即两类手表的日走
时误差平均来说都是0。所以由此并不能比较出哪类手表走得好,但我们从直觉上易得出甲类手
表比乙类手表走得较准,这是由于甲的日走时误差与其平均值偏离度较小,质量稳定。由此可见,
我们有
必要研究随机变量取值与其数学期望值的偏离程度——即方差。
(一) 方差的概念
1、 定义
设
X
是一个随机变量,若
E
[X
E(X)]
2
存在,则称
E
[XE(X)]
2
为
X
的方差,记为
D(X)
或
Var(X)
。即
D(X)
Var(X)
E
[X
E(X)]
2
。并称
D(X)
为
X
的标准差或
均方差。随机变
量
X
的方差表达了
X
的取值与其均值的偏离程度。
按此定义,若
X
是离散型随机变量,分布律为
P
X
x
k
p
k
,k1,2,
…,则
D(X
)
[x
k
E(X)]
2
p
k
K1
若
X
是连续型随机变量,密度函数为
f(x)
,则
D(X)
[xE(X)]
2
f(x)dx
方差常用下面公式计算:
D(X)E(X
2<
br>)[E(X)]
2
事实上
D(X)
E
[XE(X)]
2
E
X
2
2XE(X)E
2
(X)
E(X
2
)2
E(X)E(X)E
2
(X)E(X
2
)E
2
(X)
例1 设随机变量
X
具有数学期望
E(X)
,方差
D(X)
2
0
,
记
X
<
br>
x
,则
E(X
)0,D(X<
br>
)1
1
解
E(X
)
E(X
)
1
[E(X)
]
0
;
D(X
)E(X
2
)[E(X
)]
2
E[(
X
2
)]
2
2
2
E[(X
)]
2
1
1
称
X
为
X
的标准化变量。
注意:这里
X
不一定是正态随机变量。对正态随机变量,结论也成立。
例2
设随机变量X具有(0-1)分布,其分布律为:P{X=0}=1-p,P{X=1}=p,求D(X)。
解 :E(X)=0·(1-P)+1·p=p ,E(X)=0·(1-p)+1·p=p
D(X)=E(X
2
)-[E(X)]
2
=p-p
2
=p
(1-p)
例3 设X~π(λ),求D(X)。
222
解:
X的分布律为:, k=1,2,…,λ>0.
上节例6已算得E(X)=λ,而E(X
2<
br>)=E[X(X-1)+X]=E[X(x-1)]+E(X)=
=
所以方差:D(X)=E(X)-[E(X)]
2
=λ
由此可知,泊松分布的数学期望与方差相等,都等于参数λ,因为泊松分布只含一个参数λ,只
要知道
它的数学期望或方差就能完全确定它的分布了。
例4 设X~U(a,b),求D(X)。
1
,axb
ab
解:X的概率密
度为:
f(x)
ba
而
E(X)
,方差为
2
0,其它
1
x
e,x0,
例5 设随机变量X
服从指数分布,其概率密度为
f
x
x0.
0,
其中θ>0,求E(X),D(X)
解 :
于是
即有 ,
(二) 方差的几个重要性质:
1
0
设C是常数,则D(C)=0。
2
0
设X是随机变量,C是常数,则有:D(CX)=C
2
D(X)
3
0
设X,Y是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{
(X-E(X))(Y-E(Y)).
特别,若X,Y相互独立,则有:D(X+Y)=D(X)+D(Y)
这一性质可以推广到任意有限多个相互独立的随机变量之和的情况。
4
0
设D(X)=0的充要条件是X以概率1取常数C,即P{X=C}=1,显然这里C=E(X).
证明 1
0
D(C)=E{[C-E(C)]
2
}=0
2
0
D(CX)=E{[CX-E(CX)]
2
}=C
2
E{[X-E(X)]
2
}=C
2
D(X).
3
0
D(X+Y)=E{[(X+Y)-E(X+Y)]
2
}=
E{[(X-E(X))+(Y-E(Y))]
2
}
= E{ (X-E(X))
2
}+E{(Y-E(Y))
2
}+2E{[X
-E(X)][Y-E(Y)]}
=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}
上式右端第三项:
2E{[X-E(X)][Y-E(Y)]}
= 2E{XY-
XE(Y)-YE(X)+E(X)E(Y) }
=2{ E
(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y) }
=2{ E
(XY)-E(X)E(Y) }
若X,Y相互独立,由数学期望的性质4
0
知道上
式右端为0,于是D(X+Y)=D(X)+D(Y).
例6
设X~b(n,p),求E(X),D(X).
解
:由二项分布的定义知,随机变量X是n重伯努利试验中事件A发生的次数,
且在每次试验中A发生的概率为p,引入随机变量:
X
k
易知 X=X
1
+X
2
+… +X
n
(2.7)
由于X
k
只依赖于第k次试验,而各次试
验相互独立,于是X
1
,X
2
,… ,X
n
相互独立,又知X
k
,
k=1,2,……,n服从同一(0-1)分布:
(2.7)表明以n , p 为参数的二项分布布变量,可分解成为n个相互独立且都服从以p
为参数
的(0-1)分布的随机变量之和 。
由例2 知E(X
k
)=p
, D(X
k
)=p(1-p),k=1,2, …,n,故知
p
k
0
1-p
1
p
又由于X
1
,X
2
,… ,X
n
相互独立,得
例7
:设X~N(μ,σ
2
),求E(X),D(X)。
解:先求标准正态变量:
Z
X
的数学期望和方差。Z的概率密度为
因X=μ+σZ,即得E(X)=E(μ+σZ)=μ;
D(X)=D(μ+σZ)=E{[
μ+σZ-E(μ+σZ)]
2
}=E(σ
2
Z
2
)=σ<
br>2
E(Z
2
)
=σ
2
D(Z)=σ
2
这就是说,正态分布的概率密度中
的两个参数μ和σ分别就是该分布的数学期望和均方差,因而
正态分布完全可由它的数学期望和方差所确
定。
再者,由上一章§5中例1知道,若X
I
~N(μ,σ
i
2
),i=1,2,…,n,且它们它们独立,则它们的
母性组合:C
1
X<
br>1
+C
2
X
2
+… +C
n
X
n
(C
1
,C
2
,…,C
n
是不全为0的常
差的性质知道:数)仍然服从
正态分布,于是由数学期望和方差的性质知道:
nn
c
1
X
1
c
2
X
2
…
c
n
X
n
~
N(
c
i
i
,
c
i
2
2
i
)
i1i1
这是一个重要的结果。
例8:设活塞的直径(以cm计)
X~N(22.40,0.03
2
)
,气缸的直径
Y~N(22.50,0.
04
2
)
,
、
Y
相互独立。任取一只活塞,任取一只气缸,求活塞能装入气缸的概率。
解 按
题意需求
P
XY
P
XY0
由于
XY:N(0.10,0.0025)
(XY)(0.10)0(0.10)
故有
P<
br>
XY
P
XY0
=P
0.00250.0025
(
0.10
)(2)0.9772
0.05
(三)切比雪夫(Chebyshev)不等式
下面介绍一个重要的不等式.
定理 设随机变量X具有数学期望E(X)=
,方差D(X)=
2
,则对于任意正数
,不等式
2
P
X
2
成立。这一不等式称为切比雪夫(Chebyshev)不等式。
证 :
就连续型随机变量的情况来证明。设X的概率密度为f(x),则有(如下图)
切比雪夫(Chebyshev)不等式也可以
写成如下的形式: (2.10) <
br>这个不等式给出了在随机变量X的分布未知的情况下事件{|X-μ|<ε}概率的下限的估计。例如,<
br>在(2.10)式中分别取ε=3σ,4σ得到:
P{|
X-
|<3
}≥0.8889,P{|
X-
|<4
}≥0.9375
在书末附表1中列出了多种常用的随机变量的数学期望和方差,供读者查用。
(四)小结:
方差
D(X)
E
[XE(X)]
2
描述随机变量
X
与它自己的数学期望
E(X)
的偏离程度;我们常
用公式
D(X)E(X
2
)[E(X)]
2
计算方差,
注意
E(X
2
)
和
[E(X)]
2
的区别。
记住几种重要分布的方差
(1)0——1分布
D(X)pq
(2)二项分布
D(X)npq
(3)泊松分布
D(X)
2
(ba)
(4)均匀分布
D(X)
12
(5)指数分布
D(X)
2
(6)正态分布
D(X)
2
(五)
课堂练习:P
140
16、17、19,P
141
21、23
课后作业:P
141
18、20, 22
§4、3
协方差及相关系数
教学目的:使学生理解掌握协方差及相关系数的定义及性质,熟记相关系数的含义。
教学重点、难点:协方差及相关系数的定义及性质。
教学过程:
对于二维随机变量
(
,
)
,我们除了讨论
与
的数学期望与方差外,还需要讨论描述
与
之间相互关系的数字
特征——协方差与相关系数。
1 定义 称
E{[XE(X)][YE(Y)]}为随机变量
X
与
Y
的协方差。记为
Cov(X,Y)
,
即
Cov(X,Y)
=
E{[XE(X)][YE(Y)]}
而
XY
Cov(X,Y)
称为随机变量
X
与
Y
的相关系数。
D(X)D(Y)
2 协方差的性质
(1)
Cov(X,Y)
=
Cov(Y,X)
,
Cov(X,X)
D(X)
(2)
Cov(X,Y)E(XY)E(X)E(Y)
我们常用这一式子计算协方差。
(3)
Cov(aX,bY)abCov(X,Y)
(4)
Cov(XY,Z)Cov(X,Z)Cov(Y,Z)
3
相关系数的性质
(1)
XY
1
(2
)
XY
1
的充要条件是,存在常数
a,b
,使
P{YabX}1
XY
的大小表征着
X
与
Y
的线性相关程度。当
XY
较大时,则
X
与
Y
的线性相关程度较好;
当
XY
较小时,则
X
与<
br>Y
的线性相关程度较差。
当
XY
0
时,称X
与
Y
不相关。
当
X
与
Y
相互独立
时,
X
与
Y
不相关。反之,若
X
与
Y
不相
关,
X
与
Y
却不一定相互独立,
该性质说明,独立性是比不相关更为
严格的条件。独立性反映
与
之间不存在任何关系,而不
相关只是
就线性关系而言的,即使X与Y不相关,它们之间也还是可能存在函数关系的。相关系
数只是X与Y间线
性相关程度的一种量度。
关于不相关有如下定理:对于X,Y,下列等价:
①E(XY)=E(X)E(Y)
②D(X+Y)=D(X)+D(Y)
③cov(X,Y)=0
④X,Y不相关,即
=0
例1
设(X,Y)的分布律为
Y X -2 -1 1
2
1
4
P{X=i}
0 14 14 0
14 0 0 14
14 14 14 14
P{Y=i}
12
12
1
易知,E(X)=0,E(Y)=
52,E(XY)=0,于是
xy
=0,X,Y不相关。这表示X,Y不存在线性<
br>关系。但,P{X=-2,Y=1}=0≠P {X=-2}P{ Y=1},知X,Y不是相互独立的。
事实上,X和Y具有
关系:Y=X
2
,Y的值完全可由X的值所确定。
例2 设连续型随机变量的概率密度为
(X,Y)
12y
2
f(x,y)
0
0yx1,求
XY
。
其它
x
23
0x
1
0
12ydy4x
解
f
x
(x)
f(x,y)dy
其它
0
1
4
E(x)
x4x
3
dx
0
5
f
y
(y)
1
12y
2
dx12y<
br>2
(1y)0y1
y
f(x,y)dx
0其它
1
3
E(y)
12y
2
(1y)ydy
0
5
1
000
2
1431
Cov(XY)E(XY)E(X)E(Y)=
25550
1
2
又
E(x
2
)
x
2
4x
3
dx
0
3
242
所以
D(x)E(x
2
)E<
br>2
(x)()
2
3575
11
2<
br>222
E(y)
12y(1y)ydy12
(y<
br>4
y
5
)dy
00
5
231
D(y)E(y
2
)E
2
(y)()
2
5525
E(xy)
dx
xy12y
2<
br>dy
3x
5
dx
1x1
XY
Cov(XY)
D(X)D(Y)
1
6
50
4
21
7525
课堂练习P
141
24、26
课后作业P
141
28、29
§4、4 矩、协方差矩阵
教学目的:使学生理解矩、协方差矩阵的定义及n维正态变量的性质。
教学重点、难点:矩、协方差矩阵的定义及n维正态变量的性质。
教学过程:
(一) 矩
设X,Y是随机变量
(1)若E(X
k
),
k=1,2…,存在,则称它为X的k阶原点矩,简称k阶矩。
(2)若E{[X-E(X)]
k
},
k=2,3…,存在,则称它为X的k阶中心矩。
(3)若E(X
k
Y
l
),
k,l=1,2…,存在,则称它为X和Y的k+l阶混合矩。
(4)若E{[X-E(X)]
k
[Y-E(Y)]
l
},
k,l=1,2…,存在,则称它为X和Y的k+l阶混合中心矩。
的一阶原点矩即为数学期望,二阶
中心矩即为方差;
X和Y
的二阶混合中心矩即为协方差。
n维随机变量的协方差矩阵(covariance matrix)
(1)二维随机变量(
X
1
,X
2
)有四个二阶中心矩(设它们都存在),分别记为
c<
br>11
=E{[X
1
-E(X
1
)]
2
},
c
12
=E{[X
1
-E(X
1
)]
[X
2
-E(X
2
)]}
c
21
=
E{[X
2
-E(X
2
)]
[X
1
-E(X
1
)] },
c
22
=E{[
X
2
-E(X
2
)]
2
}.
c
11
则称矩阵C=
c
21
c
12
为(X
1
,X
2
)的协方差矩阵。
c
22
(2)设n维随机变量(X
1
,X
2<
br>,…,X
n
)的二阶混合中心矩:
c
ij
=Co
v(X
i
,X
j
)=E{[X
i
-E(X
i
)][Y
j
-E(Y
j
)]}, i,j=1,2,…,n 都存在,
c
11
c
12
c
22
c
则称矩阵C=
21
c
n1
c
n2
显然C是一个对称矩阵。 c
1n
c
2n
为(X
1
,X
2
,…,X
n
)的协方差矩阵。
c
nn
(二)
n维正态随机变量的概率密度
(1)
二维正态随机变量(X
1
,X
2
)的概率密度
1
2
1
2
22
(x
1
)(y
2
)
y
2
1
x
1
exp
2
222
2
1
2
2
1<
br>
2(1
)
1
f(x,y)
2
因为
c
11
D
X
1
2
,c
12
c<
br>21
Cov
X,Y
1
2
,c
22
D
Y
<
br>2
c
11
所以(X,Y)的协方差矩阵C
=
c
21
c
12
1
2
=
c
22
<
br>
1
2
1
2
2
2
1
X
记X=
则(X
,
Y)的概率密度可写成
Y
,
2
f
x,y
1
<
br>1
exp
X
C
1
X
2
2
2
2
C
1
2
(2)n维正态随机变量(X
1
,X
2
,…,X
n
)的概率密度
x
1
x2
记X=
,
x
n
1
<
br>
2
, n维正态随机变量(X
1
,X
2
,…,X
n
)的概率密度定义为:
n
f
x
1
,
x
2
,,x
n
1
2
<
br>
n
2
C
1
2
1
<
br>exp
X
C
1
X
2
其中
C是X
1
,X
2
,…,X
n
)的协方差矩阵。
(三) n维正态随机变量的性质
(1) n维正态变量(X
1
,
X
2
,…,X
n
)的每一个分量X
i
, i=1,2,…,
n都是正态分量;反
之,若X
1
,X
2
,…,X
n
都是正态分量,且相互独立,则(X
1
,X
2
,…,X
n
)
是n维正态变量。
(2) n维随机变量(X
1
,X
2
,…
,X
n
)服从正态分布的充要条件是X
1
,X
2
,…,X<
br>n
的任意的
线性组合k
1
X
1
+
k
2
X
2
+…+k
n
X
n
服从一维正态
分布(其中k
1
,k
2
,…,k
n
不全为零)。
(3) 若(X
1
,X
2
,…,X
n
)服从
n维正态分布,设Y
1
, Y
2
,…,Y
k
是X
j
(j=1,2,…,n)的线性
函数,则(Y
1
,
Y
2
,…,Y
k
)也服从多维正态分布.
(4) 设(X<
br>1
,X
2
,…,X
n
)服从n维正态分布,则“相互独立与“
X
1
,X
2
,…,X
n
两两不相
关”是等价的。
课堂练习: P
141
31、33
课后作业:P
141
30、32