数理统计期末复习题1
双方代理-云南人事考试中心
2009期末复习题
注:这份答案是在2009年最后一晚做出来的,时间比较紧,所
以可
能有些地方不严谨,有什么错误还请各位多包涵。
处理一个问题有很多合理的办法,这份答案所列出的只不过代表个人
的想法,仅供参考。
这份答案算是送大家的新年礼物吧,预祝大家期末考试顺利,一年都
有好运
孟帅
1. 设随机变量
X
和
Y
相互独立,且都服从正态分布N(0
,3
2
),而
X
1
,X
2
,,X
9和
Y
1
,Y
2
,,Y
9
分别是来自总体X
X
1
X
2
X
9
Y
Y
Y
2
1
2
2
2
9
和<
br>Y
的样本,则统计量U =
服从什么分布?为什么?
1
9
X
i
9
i1
9
1
9
Y
i
2
X
解:分子分母同除以9得到
服从N(0,1),
i
9
i1
3
i1
9
9
Y
i
2
服从X²(9)分布,因此U服从
t(9)分布(课本92页)
i1
3
2.某大学
来自A,B两市的新生中分别抽取10名和11名男生调查身
y172cm
,高,测得他们的
身高分别为
x176cm
,样本方差分别为
S
1
2
11
.3
,
2
S
2
9.1
。不妨设两个城市的男生的身高分别
服从正态分布
N(
1
,
2
)
和
N(
2
,
2
)
,求
1<
br>
2
的95%的置信区间,并请在0.05水平下判断两个城
市的男
生身高是否相等?
XY
12
2
解:
2
未知,构造T=
1
2
2
2
但是
11
(111页)
S
n
1
n
2
p>
2
=
。 =10, =11, =11.3,
S
nn
S
12
n
1
n
2
2
1
n
1
1
S
1
2
<
br>n
2
1
S
2
2
2
S
2
=9.1, =176, =172。代入T表达式得到
Y
X
4
1
2
T=
。
1.3915
t19
T服从t( +
-2)查附表7得到 =2.093
n
1
n
2
2
得到
(1.088,6.912)
1
2
的置信区间为:
这个区间不包含0,可以直接判定在0.05水平下两城市男生身
高不相等。如果想严谨一点就在进行假
设检验:
原假设:两城市男生身高相等;备择:两城市男生身高不等。
XY
t
19
比较。
检验统计量T= ,和
11
2
S
n
1
n
2
2
t
19
,拒绝原假设,否则接受。 如果T大于
3.随机调查了某校200名沙眼患者,经用某种疗法
治疗一定时期后
治愈168人,试求总体治愈率的95%置信区间。
解:样本率p=0.84,用大样本正态近似法求解,置信区间为:
p
1p
p
1p
p
u
pu
( ,
)(课本115页)
n
n
2
2
u
n=200,查附表4得 =1.960
2
95%置信区间为(0.789,0.891)
4.假设从两个总体
X
~N(0,1)
和
Y~N(1,1)
等概率地抽取样本并进行分类,
分类过程
如下:如果样本值大于
1.96
则判定为总体
Y
,否则就判断为总
体
X
,试问:将总体
X
错判为总体
Y
的概率是多少?将总体<
br>Y
错判为总
体
X
的概率是多少?
解:P(总体X错判为总体Y)=P(X>1.96),查附表4,
=1.96
u
故P(X>1.96)=0.025
2
P(总体Y错判为总体X)=P(Y≤1.96)=P(Y-1≤0.96),
而Y-1服从N(0,1)
查附表3得到Φ(0.96)=0.8315,故P(Y≤1.96)=0.8315
5.为测定某药的剂量x与血药浓度γ之间的关系,测得如下数据:
剂量 5 10
31.7
15
46.7
20
58.9
25
76.9
30
82.8 血药浓15.2
度
求γ关于x的回归方程,并检验方程的显著性(
0.01
)。
解:求回归方程:可以用公式手算,
XY6XY
ii
2
i
i1
6
6
X
i1
6X
2
aYX
当然,考试时允许用计算器的,把上面的数据直接键入,很快便
出结果了。
回归方程:
2.776x3.453
检验方程的显著性:原假设:无线性关系;备择:回归效果显著
U
<
br>
i
i
i
,
Q
F
n2
,
U
计算统计量
i1
i1
Q
(课本229-230页)
剩下的就是狂按计算器。。
6
2
6
2<
br>F
0.01
14
F=343.88,查附表8得到
=21.2,所以拒绝原假设,方
程回归效果显著。当然,用r检验也可以,二者本质上是一样的,在此不再赘述。
6.在诱发大白鼠鼻咽癌的试验中,一组用亚硝酸向鼻腔滴注(鼻注组),
另一组在鼻注的基础上加维生素B
12
肌注(鼻注+B
12
),试验数据如
下:
发癌鼠 未发癌
数
鼻 注 52
鼻注+ B
12
39
试问 ”鼻注” 与
”鼻注+B
12
” 对大鼠诱发癌的作用是否有关联?
用什么方法检验?假如上述数据
列表中的第二格的数据变为6,该方
鼠数
19
3
法是否还适用?为什么?
解:用X²检验。
原假设:无关联;备择:有关联
a=52,b=19,c=39,d=3,n=113
2
计算统计量
=5.287
n
adbc0.5n
2
ab
ac
bd
cd
2
0.05
(课本166页)查附表6得到
所以拒绝原假设。
1
3.841
数据列表中的第二格
的数据变为6,这个时候用X²检验就有点勉
强了,四格表的数据画成柱形图时,成对角线斜坡状是最理
想的,
而此时出现了6和3两个很小的状态,正态性很差,因而不适合。
此时应当用精确概率检
验:
ab
ac
bd
cd
<
br>
P
nabcd
a=52,b=6,c=39,d=3,n=100代入得
P=0.244>0.05,故不拒绝原假设,既无关。
7:随机抽取8名健康者的血液,将其的血滤
液放置不同时间(0,45m,
90m,135m),测定血糖浓度,每个受试者有4个测定值。请问,
应该
用什么方法分析血糖在不同放置时间的变化?假如要分析各个时间点
的差异,应该如何判定
?为什么?
受试放置时间(分)
者
编号
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
0
1
95
95
106
98
102
112
105
95
45
2
95
94
105
97
98
112
103
92
90
3
89
88
97
95
97
101
97
90
135
4
83
84
90
90
88
94
88
80
解:时间为单因素,不同时间为不同水平。
1
2
3
4
;备择:不全相等。 原假设:
,
SS
T
x
ij
x
=1833.96875,
=890.38
SS
e
j1i1
4
8
2
SS
A
=943.59
SS
A
41
=9.89,F服从于F(3,28)分布
F
SS
e
324
F
0.05
328
查附表8得到
=2.95,因此拒绝原假设,即时间对
血糖浓度有影响。
既然时间对血糖浓度有影响,那么就要进行两两比较,以分析各
个时间点的差异。
本题中只有四个水平,用单纯的t检验当然是可以的,但不推荐。
下面将以Q检验法为例:
=101, =99.5, =94.25,
=87.125
1234
R=max{ - }=13.875
i
j
xxxx
x
x
R
SS
e
q
=5.639 = =13.929
S
e
S
e
32
324
在
0.05水平,k=4,f=28下查q表(相当郁闷的是,表里没有
28自由度的数据,只好用内插法
了)q(4,24)=3.90,
q(4,30)=3.84。
4
q
430
2830
q
424
q
430
243
0
q
得到q(4,28)=3.86
q=13.929>q(4,28)因此拒绝原假设。
=3.848
D
T
q
428
S
e
32
D
T
的认为有显著性差异,四个组的均值两两做差,绝对值大于
发现从第二组到第三组就有显著差异了。
(注:Q、S检验课本上没有细述,在第八章-
方差检验的课件上)
8:对一组胃炎病人先后服用两种药物,然后分别测定其最大排酸量
(m
molh),请问,应该用什么方法分析两种药的效果之间的差异。
为什么?需要注意什么问题?
病例
编号
1
2
3
4
5
6
7
8
9
10
11
甲药
X
乙药
Y
病例
编号
12
13
14
15
16
17
18
19
20
21
22
甲药
X
乙药
Y
11.51 8.84
12.05 10.49
22.26 22.28
3.11
2.03
4.61
1.23
2.53
3.96
4.68
1.78
1.76
3.85
0.91
2.04
2.99
3.92
14.56 12.49
9,46 8.04
11.20 9.44
16.53 14.12
8.05
4.54
9.22
6.08
8.65
6.67
3.87
7.93
4.92
7.52
13.92 11.93
10.36 14.68 11.76 9.93
解:这是一组配对资料,可以考虑使用配对
T检验(课本129页)。
采用t检验首要数据考虑的正态性。当然,这一点一般是默许我
们使
用的。只有当数据波动特别明显是才考虑(第九题就不符合
正态性)。
D
i
X
i
Y
i
,D服从N(μ,σ²)
配对T检验:设
原假设:μ=0;备择:μ≠0。
D0.9954550
t
=3.389
Sn39.86114522
0.05
t服从于t(22-1)分布。查附表7得到 =2.080
2
t
21
故拒绝原假设。
采用符号检验或者秩检验也可以。例如符号检验,根据原始数据
的大小定义+、-号:+、+、
-、+、+、+、+、+、+、+、+、+、+、
+、+、+、+、+、+、+、+、-。即使不计算也
能看出来+太多了。
S=min{ }=2,
n
n
因而拒绝原假设。
9:用两种方法测定同一批人血清样品中的黄体生成素(HCG-
CH)含
量(mgL),试分析两法的效果,能否用固相法取代双抗体法。
含量(mgL)
含量(mgL)
在α=0.05,n=22情况下,查附表12得到
=5
,
s
样品编号
固相法 双抗体法
样品编号
固相法 双抗体法
X
1
2
3
4
5
6
1.4
2.7
4.1
28.0
83.5
105
Y
0.75
2.7
1.3
13.7
61.0
76.0
7
8
9
10
11
12
X
1700
2400
3100
11840
18000
19230
Y
1500
3520
3100
16680
16900
18320
解:这同样是配
对资料的分析,但是和上一题不同,本体绝对不可以
用T检验。数据的波动太大,要是这样的数据也能当
做正态,那
这个世界就和谐了。。
可以考虑使用符号检验,wilcoxon符号秩检验。
符号检验法:
原假设:两种方法效果相同;备择:不相同。
差值标记:+、0、+、+、
+、+、+、-、0、-、+、+。差值为零的
不计入。S=2,n=10,α=0.05。查附表12
得到 =1
,
S>
,所以接受原假设。
符号秩检验:
差值绝对值序列:
0.65、2.8、14.3、22.5、29、200、910、110
0、(-)1120、(-)4840
对应的秩为1到10
=1+2+3+4+5+6+7+8=36,
T
=9+10=19
T
T=19
s
s
T
,T>
T
根据n=10,α=0.05查附表13得到 =8
,因而接
受原假设。
10:两组大鼠,一组为药物组、另一为
空白对照组。两组大鼠在4个
不同级别的压力(分别是20、40、60、80mmHg)下测量数据,
所得数据
为在不同压力作用下测量的计量资料(一只大鼠同时有四个不同的数
据)。现要对两组
大鼠的测量数据进行统计分析比较,以了解药物对
不同压力下测量的数据有无影响。请问采用哪种统计分
析方法?
解:上课的时候老师说过10题和11题仅仅是提醒我们处理数据时要
注意同质性原则,统计方法不作要求。
老师给的方法是根据数据求出压力与数据的回归,来消除压力对
于数据的影响,从而转化成用药与不用药的单因素分析。
课本上讲到双因素方
差分析时,有一种方法叫做“等重复双因素
方差分析”,适用于这类问题,不过很繁琐,简单了解一下吧
。
11:假设测了一个细胞株在几个不同处理因素下的A指标,每组重复
测量6次取均值。然
后又测了这几个处理因素下的B指标,同样每组
重复测量6次取均值。因为A指标受B指标的干扰,所以
,要排除B
的影响,最好比较A与B的比值。问题是,两者均数都算出来了,比
值就只有一个,
如何统计分析呢?是不是可以这么做:假设A指标检
测结果是A1~A6,B指标检测结果是B1~B6
,然后用
A1mean(B1+......+B6),A2mean(B1+.......+B6)
,A3(B1+…+B6)
依此类推,得到6个比值后,再用方差分析进行各处理组间的比较?
解:这一题很让人费解啊,既然A受B的影响,那A1,A2……A6同时
除以一个相同的数能有啥作
用呢。当然,如果B指标的微小波动就
会对A产生显著影响的情况下是可行的。我向一些高人请教,他们
多数认为直接平均带来的误差太大,建议使用校正平均。我就简介
一下这种做法:首先,既然可
以通过比值来消除干扰,那么A和B
就应该有很好的同向性,即B大A也大,这样AB才能相对稳定,<
br>才符合重复试验的特征(也许有人会提出,把A和B大小排序,对
应相除。咋一听是很让人兴奋地
,不过请不要忘了,A和B的测量
是分开的,不是成对关系);将A、B按大小排序A1~A6,B1~
B6。
A
i
校正比值是
其实就是在玩线性,没啥
AA
i
B
B
6
B
1
意思。
A
6
A
1
12:采取干预措施治疗腹泻,收集两组数据,记录两组样本的基线数
据和干预后的
发病率数据,两组样本进行干预之后的发病率都有变化。
请问用何种分析方法可以分析这两组样本的净变
化是否有显著性差
异? 如基线1、2组腹泻率分别为42.5%、37.7%,最后腹泻率为
24.3%、26.4%,1组样本780,2组400人,如何分析?计算疾病的相
对净变化率=(本
期的发病率-基期的发病率)基期的发病率,比
较两组净变化率的差异,用u检验。这样是否可以?
解:σ²未知,不能用u检验。
可以将数据转化为四格表
基线1组
极限2组
合计
治愈人数
142
45
187
未治愈人数
190
106
296
合计
312
151
463
可以使用大样本X²检验。原假设:没有显著性差异
2
=6.981>3.841
312151187296
拒绝原假设,即两组净变化差异性显著。
13. 选取4种不同品系的雌性小白鼠,静脉注射
巴比妥钠60mgkg
后,观察它们的麻醉维持时间,结果见下表。
A 19 26 26
23 21 30 23 27
B 36 33 29 28 40 26
463
142106190450.5463
2
C 26 18 23 15 28
D 19 15 26 30 34 14 16 19
请问如何检验这四种不同品系的雌性小白鼠麻醉维持时间是否有显著
性差异?
解:本题是样本数量不等的方差分析,但基本公式没变。
A
B
C
D
;备择:不全相等。 原假设:
=1170.08 , =737.75, =432.33
SS
T
SS
e
SS
A
SS
A
3
=4.493
F
SS
e
23
查附表8得到
F
3232.34
,很明显应当拒绝原假设。
即不同品系之间有明显差异。
14.某山区小学,205名男生中有31人感染肺吸虫,9
0名女生中有
10人感染肺吸虫。问男女生的肺吸虫感染率是否有显著性差异?可以
有几种方法
?
解:方法一:四格表X²检验
原假设:无显著性差异
男
患病
不患病
合计
31
174
205
女
10
80
90
2
合计
41
254
295
2
=0.539<3.841,
295
3180174100
.5295
4125420590
接受原假设。
方法二:两个二项分布总体率的比较
记男生患病人数为X,女生患病人数为Y。
设X服从B(205,P1),Y服从B(90,P2)
原假设:P1=P2;备择P1≠P2。
U
X
n
1
Yn
2
p
1p
1n
1
1n
2
3120510
90
41
41
1
1205190
295
295
=0.917 (课本144页)
给定置信度95%
u
U服从N(0,1),查附表4得到 =1.960
接受原假设。
2
(这类问题的分析是很基本的,因此方法也很多,不一一详述,总之,只要检验的过程合理即可)