第5、6章 抽样与抽样分布
唐山地震死多少人-描写夏天的好段
第四章 抽样与抽样分布
一、单项选择题
1、抽样调查的目的在于(a
)。
A、了解总体的基本情况 B、用样本指标推断总体指标
C、对样本进行全面调查 D、了解样本的基本情况
2、假定10亿
人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方
法抽取本国的1%人口计
算平均年龄,则抽样误差(C)。
A、两者相等
B、前者大于后者
C、前者小于后者 D、不能确定
3、抽样调查,随着样本量的增加,调查的误差(a)
A、减小
B、不变
C、扩大 D、不确定
4
、对某单位职工的文化程度进行抽样调查,得知其中80%的人是高中毕业,抽样平均误差
为2%,当概
率为95.45%(Z=2)时,该单位职工中具有高中文化程度的比重是( c )
A、等于78% B、大于84%
C、在76%与84%之间 D、小于76%
5、某银行想知
道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本存折
抽出一本登记其余额。这样
的抽样组织形式是( c )
A、类型抽样
B、整群抽样
C、机械抽样 D、纯随机抽样
6、农户家计调查中,按地理区域划分所进行的区域抽样,其抽样组织方式属于( d )
A、简单随机抽样 B、类型抽样
C、等距抽样
D、整群抽样
7、抽样平均误差是指样本平均数或样本成数的( c )
A、平均数
B、平均差
C、标准差 D、标准差系数
8
、(甲)某高校新生1000人,从理科中随机抽取60人,文科中随机抽取40人,进行英语
水平测试
;(乙)从麦地总垅长中每3000市尺测竿落点处前后5尺长垅的产量进行实割
实测;(丙)为研究城
市青年业余时间活动情况,某城市每第10个居委会被抽取,并询
问住在那里所有从16岁到30岁的青
年人。上述哪项属于类型抽样?( a )
A、甲
B、乙
C、 乙、丙 D、 甲、乙、丙
9、抽样调查所遵循的基本原则是( b )
A、准确性原则
B、随机性原则
C、可靠性原则 D、灵活性原则
10、在其它条件不变的情况下,如果允许误差范围缩小为原来的12,则样本容量(a )
A、扩大为原来的4倍 B、扩大为原来的2倍
C、缩小为原来的12倍
D、缩小为原来的14倍
11、对一批产品按不重复抽样方法抽取200件进行调查,其中废品8件,
已知样本容量是产
品总量的120,当F(Z)=95.45%时,不合格率的抽样极限误差是( d
)
A、1.35% B、1.39%
C、2.70% D、2.78%
12、在抽样调查中,要提高推断的可靠程度即提高概率,必须( c )。
A、缩小误差范围 B、确定总体指标所在的范围
C、扩大误差范围 D、是绝对可靠的范围
1
3、有一批灯泡共1000箱,每箱200个,现随机抽取20箱并检查这些箱中全部灯泡,此
种检验属
于( c )。
A、纯随机抽样
B、类型抽样
C、整群抽样
D、等距抽样
二、多项选择题
1、影响抽样平均误差的因素有(abcd
)
A、总体标志变异程度 B、样本容量
C、抽样组织形式
D、抽样方法(重复和不重复) E、样本指标值的大小
2、下列关于假设检验的陈述正确的是(
ae )。
A、假设检验实质上是对原假设进行检验
B、假设检验实质上是对备选假设进行检验
C、当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝
对错误
D、假设检验并不是根据样本结果简单地或直接地判断原假设和备选假设
哪一个更有可能正确
E、当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝
对正确
3、抽样估计误差( ace )
A、是不可避免要产生的
B、是可以通过改进调查方法消除的
C、是可以事先计算的
D、只有调查结束之后才能计算
E、大小与抽样的方法有关
4、当样本单位数充分大时,样
本估计量充分地靠近总体指标的可能性趋于1,称为抽样估
计的( bd )
A、无偏性
B、一致性
C、有效性 D、充分性
E、以上皆不对
5、以下属于概率抽样的有(bc)
A、网民自由参加的网上调查
B、体育彩票摇奖
C、按随机原则组织的农产品量调查 D、街头随意采访
E、以上皆不是
三、计算题
1、从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1)
样本均值的抽样标准差
x
等于多少?
(2)
在95%的置信水平下,允许误差是多少?
2、某快餐店想要估计每位顾客午餐的平均花费金额,在为
期3周的时间里选取49名顾客组
成了一个简单随机样本。
(3)
假定总体标准差为15元,求样本均值的抽样标准误差;
(4)
在95%的置信水平下,求允许误差;
(5)
如果样本均值为120元,求总体均值95%的置信区间。
3、某大学为了解学生每天上网的时间,在
全校7500名学生中采取不重复抽样方法随机抽取
36人,调查他们每天上网的时间,得到下面的数据
(单位:小时):
3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5
3.2
4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3
2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5
4.7
1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。
4、 某居民小区
为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样
本,他们到单位的距离(公里
)分别是:
10 3 14 8 6 9 12 11 7
5 10 15 9 16 13 2
求职工上班从家里到单位平均距离95%的置信区间。
5、在一项家电市场调查中,随机抽取了200
个居民户,调查他们是否拥有某一品牌的电视
机。其中拥有该品牌电视机的家庭占23%。求总体比率的
置信区间,置信水平分别为90%
和95%。
6、某居民小区共有居民500
户,小区管理者准备采取一向新的供水设施,想了解居民是否
赞成。采取重复抽样方法随机抽取了50户
,其中有32户赞成,18户反对。
a)
求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;
b)
如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查?
7、根据以往的生产数据,某
种产品的废品率为2%。如果要求95%的置信区间,若要求允
许误差不超过4%,应抽取多大的样本?
8、某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120
元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过20元,
应抽取多
少个顾客作为样本?
9、某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度
不超过
1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找
证据予以支持。在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?为什
么?
10、研究人员发现,当禽类被拘禁在一个很小的空间内时,就会发生同类相残的现象。一名
孵化并出售小鸡的商人想检验某一品种的小鸡因为同类相残而导致的死亡率是否小于0.04。
试帮助这位商人定义检验参数并建立适当的原假设和备择假设。
11、某种纤维原有的平均强度不超过
6克,现希望通过改进工艺来提高其平均强度。研究人
员测得了100个关于新纤维的强度数据,发现其
均值为6.35。假定纤维强度的标准差仍保持
为1.19不变,在5%的显著性水平下对该问题进行假
设检验。
a) 选择检验统计量并说明其抽样分布是什么样的?
b)
检验的拒绝规则是什么?
c) 计算检验统计量的值,你的结论是什么?
12、一项调查显
示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了
200个家庭,且样本标准
差为平均每天2.5个小时。据报道,10年前每天每个家庭看电视的
平均时间是6.70个小时,取显
著性水平
=0.01,这个调查是否提供了证据支持你认为“如
今每个家庭每天收看
电视的平均时间增加了”?
13、经验表明,一个矩形的宽与长之比等于0.618的时候会给人们比
较良好的感觉。某工艺
品工厂生产的矩形工艺品框架的宽与长要求也按这一比率设计,假定其总体服从正
态分布,
现随机抽取了20个框架测得比值分别为:
0.699 0.749 0.654
0.670 0.612
0.672 0.615 0.606 0.690 0.628
0.668 0.611 0.606 0.609 0.601
0.553 0.570
0.844 0.576 0.933
在显著性水平
=0.05时能否认为该厂生产的工艺品框架宽与长的平均比率为0.618?
14、一个著名的医生声称有75%的女性所穿鞋子过小,一个研究组织对356名女性进行了
研究,发现其中有313名妇女所穿鞋子的号码至少小一号。取
=0.01,检验如下的假设
:
H
0
:
0.75
H
1
:
0.75
对这个医生的论断你有什么看法?
15、从三个总体中各抽取容量不同的样本数据,得到如下资料。检
验3个总体的均值之间
是否有显著差异?(
0.01
)
样本1
158
148
161
样本2
153
142
156
样本3
169
158
180
154
169
149
16、有5
种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采
用5种种子和4种施肥方
案搭配进行试验,取得的收获量数据如下表:
品种
1
2
3
4
5
施肥方案
1
12.0
13.7
14.3
14.2
13.0
2
9.5
11.5
12.3
14.0
14.0
3
10.4
12.4
11.4
12.5
13.1
4
9.7
9.6
11.1
12.0
11.4
检验种子的不同品种对收获量的影响是否有
显著差异?不同的施肥方案对收获量的影响是
否有显著差异?(
0.05
)
17、某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最
多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产
品数进行方差
分析得到下面的结果:
方差分析表
差异源
组间
组内
SS
3836
df
MS
210
F
—
P值
0.245946
—
F 临界值
3.354131
—
总计
29
— — — —
(1) 完成上面的方差分析表;
(2)
若显著性水平
0.05
,检验三种方法组装的产品数量之间是否有显著差异?
答案
1、(1)
x
0.79
;(2)E=1.55。
2、(1)
x
2.14
;(2)E=4.2;(3)(115.
8,124.2)。
3、(2.88,3.76);(2.80,3.84);(2.63,4.01)。
4、(7.18,11.57)。
5、(18.11%,27.89%);(17.17%,22.835)。
6、、(1)10%±6.98%;(2)10%±8.32%。
7、 48。
8、 139。
9、研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉
强度相对于以前提高了”,
所以原假设与备择假设应为:
10、
=“某一品
种的小鸡因为同类相残而导致的死亡率”,
11、(1)检验统计量
sn
,在大样本情形下近似服从标准正态分布;
(2)如果
zz
0.05
,就拒绝
H
0
; (3)检验统计量
z
=2.94>1.645,所以应该拒绝
H
0
。
z
x
12、
z
=3.11,拒绝
H
0
。
13、
z
=1.93,不拒绝
H
0
。
14、
z
=7.48,拒绝
H
0
。
15、
F4.6574F
0.01
8.0215
(或
Pvalue0.
0409
0.01
),不能拒绝原假设。
16、有5种不同品种的种
子和4种不同的施肥方案,在20快同样面积的土地上,分别采用
5种种子和4种施肥方案搭配进行试验
,取得的收获量数据如下表:
F
种子
7.2397F
0.05
3.2592
(或
Pvalue0.0033
0.05
),拒绝原假设。
F
施肥方案
9.2047F
0.05
3.
4903
(或
Pvalue0.0019
0.05
),拒
绝原假设。
17、方差分析表中所缺的数值如下表:
差异源
组间
组内
总计
SS
420
3836
4256
df
2
27
29
MS
210
142.07
—
F
1.478
—
—
P值
0.245946
—
—
F 临界值
3.354131
—
—
F1.478F
0.05
3.554131
(或
Pvalue0.245946
0.05
),不能拒绝原假<
br>设。