常见的随机抽样方法介绍
等差数列教案-教学教案
^`
抽样方法介绍
朱一军
福建省产品质量检验研究院
一、随机方法选择及随机数产生
按照GBT 10111-2008 《随机数的产生及其在
产品质量抽
样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、
基数(批量)大小
,确定抽样方法(通常包括简单随机抽样、分
层随机抽样、系统抽样、整群抽样、全数抽样五种方法)。
随机数一般可使用随机数表、骰子或扑克牌中任选一种方式
产生。
(一)简单随机抽样
(抽签法、随机样数表法)常常用于总体个数较少时,它的主
要特征是从总体中逐个抽取;
优点:操作简便易行
缺点:总体过大不易实行
1. 定义:
一般地
,设一个总体含有N个个体,从中逐个不放回地抽取
n个个体作为样本(n≦N),如果每次抽取式总体
内的各个个体
被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
2.
简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,把号码写在
^`
号签上,将号
签放在一个容器中,搅拌均匀后,每次从中抽取一
个号签,连续抽取n次,就得到一个容量为n的样本。
(抽签法简单易行,适用于总体中的个数不多时。当总体中
的个体数较多时,将总体“搅拌
均匀”就比较困难,用抽签法产
生的样本代表性差的可能性很大)
(2)随机数法
随机抽样中,另一个经常被采用的方法是随机数法,即利用
随机数表、随机数骰子或计算机
产生的随机数进行抽样。
(二)分层抽样
(Stratified Random
Sampling) 主要特征分层按比例抽
样,主要使用于总体中的个体有明显差异。共同点:每个个
体被
抽到的概率都相等NM。
定义
一般地,在抽样时,将总体分成
互不交叉的层,然后按照一
定的比例,从各层独立地抽取一定数量的个体,将各层取出的个
体合
在一起作为样本,这种抽样方法是一种分层抽样
(stratified sampling)。
(三)系统抽样
当总体中的个体数较多时,采用简单随机抽样显得较为费
事。这
时,可将总体分成均衡的几个部分,然后按照预先定出的
规则,从每一部分抽取一个个体,得到所需要的
样本,这种抽样
叫做系统抽样。
^`
步骤:
一般地,假设要从容量为N的总体中抽取容量为n的样本,
我们可以按下列步骤进行系统抽样:
(1)先将总体的N个个体编号。
(2)确定分段间隔k,对编号进行分段。当Nn(n是样本
容量)是整数时,取k=Nn;
(3)在第一段用简单随机抽样确定第一个个体编号l(l≤
k);
(4)按
照一定的规则抽取样本。通常是将l加上间隔k得
到第2个个体编号(l+k),再加k得到第3个个体
编号(l+2k),
依次进行下去,直到获取整个样本。
小结:三种抽样方法的比较
1、类别: ①简单随机抽样 ②系统抽样 ③分层抽样
2、共同点
:(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
3、各自特点: ①从总体中逐个抽取 ②将总体均分成几部分按
事先确定的规则在各部分抽取
③将总体分成层,分层进行抽取
4、相互联系: ①无②在起始部分抽样时采用简单随机抽样
③
各层抽样采用简单随机抽样或系统抽样
5、适用范围 ①总体中个体数较少
②总体中个体数较多 ③总体
由差异明显的几部分组成
^`
(四)整群抽样
什么是整群抽样 (Cluster sampling)
整群抽样又称聚类抽样。是将总体中各单位归并成若干个互
不交叉、互不重复的集合,称之为群;然后以
群为抽样单位抽取
样本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位
的差异要大,群间差异要小。
整群抽样的优缺点:
整群抽样的优点是实施方便、节省经费;
整群抽样的缺点是往往由于不同群之间的差异较大,由此而
引起的抽样误差往往大于简单随机抽样。
整群抽样的实施步骤 :
先将总体分为i个群,然后从i个群钟随即抽取若干个群,
对这些群内所有个体或单元均进行调查。抽样过程可分为以下几
个步骤:
一、确定分群的标注
二、总体(N)分成若干个互不重叠的部分,每个部分为一
群。
三、据各样本量,确定应该抽取的群数。
四、采用简单随机抽样或系统抽样方法,从i群中抽取确定
的群数。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进
^`
行产品检验;每隔8h抽1h生产的全部产品进行检验等。
整群抽样与分层抽样的区别
:
整群抽样与分层抽样在形式上有相似之处,但实际上差别很
大。
分层
抽样要求各层之间的差异很大,层内个体或单元差异
小,而整群抽样要求群与群之间的差异比较小,群内
个体或单元
差异大;
分层抽样的样本是从每个层内抽取若干单元或个体构成,而
整群抽样则是要么整群抽取,要么整群不被抽取。
二、常见的简单随机抽样方法介绍
1、随机数表法
1.1 随机数表简介
随机数表是一组由0到9数字组成的表,每个数字都有相同
的概率出现在每个位置上。
附录A提供了五张50×50的随机数表(见表A.1~表A.5)。
如表A.1不敷使用也可选择其他
合适的随机数表。
1.2获得随机数R
0
的方法
a) 确定随
机数表号与初始点:首先在第一张表上随机指定
一点,以它为起点依次向右读取5个数字,第一个数字若
小于5,
则取该数加1作为选定的随机数表号,若第一个数字大于或等于
5,则取该数减4之差
作为选定的随机数表号。第2~3位和4~
5位组成两个两位数,若两位数小于50,则加上1,若两位
数大
^`
于或等于50,则减去49,最后所得的数表示初始点所在的行数
和列数。
b) 获得R
0
的方法:从初始点依次向下读取所需m位数得到
所需的随机数R0
。在读取过程中,若读到该页的最后一行则转到
第一行依次读取后m列,若最后剩下的几
列不足m列则从下一号
表的第一列开始依次补上。
1.3读取样本单元编号R
a) 如获得的随机数R
0
≤N,则随机数R就取R
0
;若R
0<
br>>N,
则设R
0
=K
1
N+R
1
,其中K<
br>1
=[N/R
0
],当(K
1
+1)N>10时,舍弃并重新
生成随机数R
0
;当(K
1
+1)N≤10时,则取R=R
1
(若0
1
=0)。重复上
述过程,直到获得n个不同的随机数为止。
b) 为了提高效率,可以采用下述方法:如获
得的随机数
R
0
≤N,则随机数R就取R
0
;若R
0
>N,则取一个大于N的适当整
数M。一般取M=2×10,2.5×10,3×10或5×10。
设R
0
=K
2
M+R
2
,其中K
2
=[
R
0
M],则当(K
2
+1)M>10时,舍弃并
重新生成随机数R
0
;
当(K
2
+1)M≤10时,则R=R
2<
br>(若0
=0)或舍
弃重新生成
(若R
2
>N)。重复上述过程,直到获得n个不同的随机
数为止。
注1:当N小于200,而所得读数大于200,取读数减去200
的倍数,若其差数小于或等于N,则
作为所要的随机数,若差数
大于N,则舍弃;当200
注2:若采用注1的方法.读取所需随机数的效率会更高。
m
m
m-1m-1m-1m-1
m
m
^`
2、随机抽样骰子法
1 随机数骰子构成及其使用方法
1.1
随机数骰子的构成
随机数骰子是均匀材料制成的正二十面体,各面上刻有0~9
的数字各2个
。图1为其底视图与俯视图。每套骰子由盒体、盒
盖及数种不同颜色的骰子组成,如图1所示。
图1
^`
1.2随机数骰子的使用方法
根据需要选取m个骰子
并规定每种颜色所代表的数位。例
如,选用红、黄、蓝3种颜色的骰子,并规定红色骰子出现的数
字表示百数位,黄色骰子出现的数字表示十数位,蓝色骰子出现
的数字表现个数位。特别规定当m个骰
子的数字均为零时,表示
l0”。
将m个骰子放入盒中盖好,盒盖向下,水平地摇动
盒子,使
骰子充分旋转,然后打开盒子,读出骰子表示的随机数R
0
。
2
产生随机数R
0
的方法
2.1确定骰子个数
根据总体大小或批量N选定m个彀子,如表1所示。
表1
总体大小或批量N与骰子个数m的对应关系
N的范围
1≤N≤10
11≤N≤100
101≤N≤1000
1001≤N≤10000
10001≤N≤100000
100001≤N≤1000000
当
m>6或个别骰子丢失、损坏时,可通过重复摇骰子的方法
获得随机数R
0
。例如,可
用一个骰子摇m次来代替m个骰子摇一
次。规定第一次摇骰子所得数字为随机数的最高数位,摇第二次<
br>m
1
2
3
4
5
6
m
^`
骰子所得数字为随机数的第二高数位,依此类推。
2.3读取随机样本单元号R的方法
2.3.1 方法一
如获得的随机数
R
0
≤N,则随机数R就取R
0
;若R
0
>N,则舍弃不用,另行重新生成随机数R
0
。重复上述过程,直到取得n个不
同的随机数为止
。
2.3.2方法二
如获得的随机数R
0
≤N,则随机数R就取R0
;若R
0
>N,则设
R
0
=K
1
N
+R
1
,其中K
1
=[N/R
0
],当(K
1+1)N>10时,舍弃并重新生成
随机数R
0
;当(K
l
+1
)N≤10时,则取R=R
1
(若0
1
=0)。重复上述过程,直到获得n个不同的随机数为止。
2.3.3方法三 <
br>如获得的随机数R
0
≤N,则随机数R就取R
0
;若R
0>N,则取一
个大于N的适当整数M。一般取M=2×10,2.5×10,3×10
m-
1m
m-1m-1m-1
m
m
或5×10。设R
0=
K2
M+R
2
,其中K
2
=[R
0
/M],则当
(K
2
+1)M>10“时,
舍弃并重新生成随机数R
0
;当(K<
br>2
+1)M≤10时,则R=R
2
(若0
2
=o)或舍弃重新生成(若R
2
>N)。重复上述过程,
直到
获得n个不同的随机数为止。
注:若遇到与已获得随机数重复情形,则舍弃重摇。
2.4随机数骰子法示例
3、随机抽样扑克牌法
1 扑克牌式样
把一副扑克牌的四种花色的A,2,3,4
,5,6,7,8,9,
m
^`
10共40张,把A作为1,10作为0(见表1.1)。
表1.1
扑克牌编码表
扑克牌
号 码
代 表
号 码
A 2
3 4 5 6 7 8 9 10
1 2 3 4
5 6 7 8 9 0
2 产生随机数R
0
的方法
用扑克牌产生随机数R
0
的步骤如下:
a)
在开始使用时,应彻底地洗牌、切牌4次以上。
b)
经彻底洗牌、切牌以后,翻开最上面的一张,并记下一
个数码,这相当于得到一个随机数字。
c)按照所需随机数的位数重复以上过程,即可获得所需的随
机数。如果需要两位数的随机数,就把两次
切洗后得到的数码组
成一组;如果需要三位数的随机数,就把三次切洗后得到的数码
组成一组。
依此类推,就可以得到我们所需要的任意位长的随机
数。
注:在生成随机数的过程中,每次必
须把抽出的牌放回去,
并经过彻底切洗以后才能抽取下一张牌。
3 扑克牌法示例
设批量N=90,样本量n=5,试对其进行随机抽样。
将批中的单位产品按自然数从“1”开始顺序编号到90。
^`
用扑克牌获得随机数R
0
并读取样本单元编号R。
a)
若抽出的第一个随机数R
0
=23,则取R=R
0
=23;
b) 若抽出的第二个随机数R
0
=08,则取R=Ro=8;
c)
若抽出的第三个随机数R
0
=23,则应舍弃重抽;
d)
若抽出的第三个随机数R
0
=40,则取R=R
0
=40;
e) 若抽出的第四个随机数R
0
=12,则取R=Ro=12;
f)
若抽出的第五个随机数R
0
=85,则取R= R
0
=85。
从批中取出编号为8、12、23、40、85的5个单位产品。