统计学(抽样极限误差与平均误差的关系及抽样方案的设计)
大学生国防教育-断舍离经典语录
➢ 抽样极限误差与抽样平均误差的关系
抽样极限误差通常用抽样平均误差的倍数表示,即
p
t
p
t称为概率度
p
Z
p
2
<
br>
x
t
x
x
Z
x
2
3、可信程度
可信程度是表示估计的可靠程度
如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。
而估计区间又与抽样
极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t
决定的。因而可靠程度与t之间有一
定正比关系。
概率度t与概率保证程度(可靠程度)之间的关系见下表。
概率度t
0.5
1.00
1.50
误差范围() 概率F(t) 概率度t
误差范围() 概率F(t)
0.5
1.00
1.50
0.3829
0.6827
0.8664
1.96
2.00
3.00
1.96
2.00
3.00
0.9500
0.9545
0.9973
例:若概率为0.95,查表得t=1.96
三、抽样推断(区间估计)
抽样推断(区间估计)的步骤如下:
⒈计算抽样平均误差
⒉给定概率保证程度,查表得概率度t
⒊计算抽样极限误差
x
t
x
⒋估计总体指标区间
x
x
Xx
x
接前面灯泡例题:
灯泡样本平均使用时间
为1057小时,合格率为91.5%,重复抽样下,灯泡的使用时间
抽样平均误差
x
3.7922
小时,合格率的平均误差为
p
1.972%
,计算在不同概
率保证下,平均数和成数的抽样极限误差?
当t=1?
当t=2?
当t=3?
第五节 抽样方案设计(P96)
一、抽样方案设计的基本原则
➢ 保证实现抽样随机性的原则
(保证消除代表性误差中的偏差)
➢ 保证实现最大的抽样效果原则
注意:
➢ 调查费用取决很多因素,其中最重要的是抽样单位数目,要确定适当的抽样单位数
目,取决
于抽样的精度和可靠性的要求;
➢
精度是指希望估计区间的长度越短越好,可靠性是指估计区间包含参数的概率越大
越好;
➢
在样本容量确定的条件下二者是矛盾的,因此抽样设计的原则是在一定的误差和可
靠性的要求下选择费用
最少的样本设计。
二、简单随机抽样(既不分组也不排队)
➢
简单随机抽样又称纯随机抽样,是按照随机的原则直接从N个总体单位中抽取n个
单位作为样本。
注意:简单随机抽样最符合随机原则
➢ 直接抽选法
➢ 抽签法
➢ 随机数码表法
三、类型抽样 (分层抽样)
➢ 类型抽样又称分类抽样或分层
抽样,是先对总体各单位按一定标志加以分类,然后
再从各类中按随机原则抽取样本,由各类内的样本组
成一个总样本。
➢ 将总体N分成N1、N2、Nm,从N1中抽取n1个单位、N2中抽取n2个单
位、Nm
中抽取nm个单位组成样本。
➢ 总体单位数N=N1+N2+…Nm
样本单位数n=n1+n2+…nm
注意:在类型抽样的情况下,因为从各类型组都抽取了样本单位,
所以,对各类型组来说
是全面调查,因此,组间方差是可以不考虑的。影响抽样误差的总方差是组内方差
。
四、机械抽样(系统抽样)
➢ 机械抽样又称等距抽样,它是对总体按一定的顺序排列,
每隔一定的间隔抽取一个
或若干个单位,并把这些单位组成样本的一种抽样方法。
➢
等距抽样按排队的标志不同,分为无关标志排队和有关标志排队的等距抽样 。
➢ 随机起点等距抽样
➢ 半距起点等距抽样
➢ 对称等距抽样
五、整群抽样
➢ 整群抽样是将总体划分为由总体单位的组成的若干群,然后以群为抽样单位,抽取
若干群作
为样本,对群内所有单位进行全面调查的抽样方法。
➢
影响整群抽样误差大小的是群间方差,误差一般大于简单随机抽样。
六、多阶段抽样
➢
在抽样调查抽选样本时并不是一次直接从总体中抽取,而是分成两个或者两个以上
的阶段来进行。
➢ 多阶段抽样的前几个阶段类似整群抽样
➢ 两阶段抽样和类型抽样、整群抽样的联系
第六节 必要抽样单位数的确定(P141)
一、确定抽样单位数的意义和原则
➢ 在选定了抽样方式后,必须确定样本容量n。
➢
n的大小同抽样推断的效果成正比,同抽样组织需要耗费的人力、物力、财力等也
成正比。
➢
在组织抽样调查的时候,需要在确保抽样推断的可靠程度和精确程度的要求下,力
求抽样组织工作更简单
。
二、确定抽样单位数的依据
➢ 总体各单位标志变异程度 :即总体方差或p(1-p)
的大小。总体标志变异程度大,要
求样本容量大一些;反之,总体标志变异程度小,样本容量可以小些。
➢ 允许的极限误差 或 的大小
:允许的极限误差越大,样本容量越小;反之,
极限误差越小,样本容量越大
➢
抽样方法:在其它条件相同的情况下,重置抽样比不重置抽样要抽取多一些样本单
位。
➢
抽样方式:采用类型抽样的样本容量要小于简单随机抽样的样本容量。
三、确定抽样单位数的计算公式(只要求掌握简单随机抽样)
➢
简单随机重复抽样平均指标的必要抽样单位数公式
2
t
2
2
2
x
t
x
t
n
2
2
n
x
x
➢
简单随机不重复抽样平均指标的必要抽样单位数公式
2
nNt
2
2
N
2
x
t
x
t
n
(1
N
)n
N
2
t
2
2
N
2
2
xx
简单随机重复抽样成数的必要抽样单位数公式
p(1p)t
2
p(1p)p(1p)
n
2
p
t
p
t
n
2
<
br>pp
➢ 简单随机不重复抽样成数的必要抽样单位数公式
p(1
p)nNt
2
p(1p)Np(1p)
t
t(1
)n
pp
22
nNN
2
N
p
p(1p)
p
tp(1p)
注意:
➢
公式的运用要求事先取得全及总体的标准差
或
P
(1
P
)
,这往往无法知道,
所以一般用抽样指标的标准差
或
p
(1
p
)
来代替。
➢
如果缺少成数资料,可以直接假定P=0.5来计算,这样P(1-P)取得最大值为0.25
➢ 在
同一个抽样调查中,如果既需要推断全及平均数,也需要推断全及成数,依据成
数和平均数计算出来的必
要抽样单位数不一致的时候,取较大的n作为统一的抽样
单位数。
例题:详见教材142、1
43页例4.12和4.13做题时,如果没有指出时重复抽样还是不重复
抽样,需要计算两种情况下的
抽样单位数。注意,不重复抽样单位数一定比重复抽样单位
数要小。
本章结束!