谈谈几种典型的抽样方法(案例)
不丹国王-四大名著读后感
谈谈几种典型的抽样方法(案例)
摘 要:本文以抽样方法为中心,主要阐述几种常见的抽样方法,如简单随机抽样,分层抽
样,
整群抽样,系统抽样以及配额抽样,探讨了各种抽样方法在实际生活的应用以
及各自的优缺点等。
关键词:抽样调查,应用,缺点。
导语:抽样调
查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单
位进行调查,并据以对全部调查研究对
象作出估计和推断的一种调查方法。显然,
抽样调查虽然是非全面调查,但它的目的却在于取得反映总体
情况的信息资料,
因而,也可起到全面调查的作用。
抽样调查是建立在随机原则基础上,从总
体中抽取部分单位进行调查,并概
率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法
。例如,
从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收
入、支出
等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一
种抽样调查。从调查方法上来看,
它是属于一种非全面调查。但又与一般调查不
同,它不只停留于搜集资料和整理资料,而且还要对资料进
行分析,并据以推断
总体的数量特征,从而提高统计的认识能力。因此,抽样
调查的理论和方法在统
计中占有很重要的地位。
下面介绍一下常用的抽样方法:
一. 简单随机抽样
一般,设一个总体含有N个个体,从中逐个不放回地抽取n
个个体作为样本
(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法
叫做简单随机抽样。
简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。
直接
抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研
究,该市有职工56,000名,抽
取5,000名职工进行调查,他们的年平均收入
为10,000元,据此推断全市职工年收入为8,0
00--12,000元之间。
抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用
随机
的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个
人中选取3
个人作为代表,先把总体中的10个个体编号,把号码写在号签上,
将号签放在一个容器中,搅拌均匀后
,每次从中抽取一个号签,连续抽取3次,
就得到一个容量为3的样本。这就是抽签法,与直接抽样法类
似。
另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算
机产生的随机
数进行抽样。下面是随机数字表
(1) (2) (3) (4) (5) (6)
1
044 942 354 764 934 250
2 456 244 578 642 719
833
3 786 946 672 677 157 556
4 310 245
103 089 523 753
5 856 729 570 414 378 760
6 001 996 008 523 442 713
7 457 158 923
378 785 566
8 247 084 749 433 118 987
9
987 378 406 322 359 037
10 675 716 436 220 940
853
11 369 628 231 361 549 205
12 654 392
402 199 707 639
13 876 362 178 456 950 807
14 085 597 934 142 436 566
15 654 097 373
819 289 620
当然,随机抽样也有不足之处,它只适用于总体单位数量有限的情
况,否则
编号工作繁重;对于复杂的总体,样本的代表性难以保证;不能利用总体的已知
信息等
。在市场调研范围有限,或调查对象情况不明,难以分类,或总体单位之
间特性差异程度小时采用此法效
果较好。
抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又
不方便。
如果标号的签搅拌得不均匀,会导致抽样不公平。而随机数表法的优点
与抽签法相同,缺点上当总体容量
较大时,仍然不是很方便,但是比抽签法公平,
因此这两种方法只适合总体容量较少的抽样类型。
二. 分层抽样
分层抽样又称分类抽样或类型抽样,是先将总体的
单位按某种特征分为若干
次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。一般地
,
在抽样时,将总体分成互不交叉的层,然后按一定的比例,从各层次独立地抽取
一定数量的个
体,将各层次取出的个体合在一起作为样本。
分层抽样尽量利用事先掌握的信息,并充分考虑了保持样
本结构和总体结构
的一致性,这对提高样本的代表性是很重要的。当总体是由差异明显的几部分组
成时,往往选择分层抽样的方法。其特点是将科学分组法与抽样法结合在一起,
每个个体被抽到的概率
都相等NM。分组减小了各抽样层变异性的影响,抽样
保证了所抽取的样本具有足够的代表性。
下面是一个实例应用
某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平
相
关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样
本数为
1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,
000—
—60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为
180,000
户,收入在10,000——30,000元家庭户为350,000户,收入在30,
000——60
,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,
000户,应进
行如下抽样:
分层比例抽样示意图
总体
层
子样本
样本
N
1000000
N
1
180000
N
2
350000 N
3
300000 N
4
170000
n
1
180 n
2
350 n
3
300 n
4
170
n 1000
分层抽样与简单
随机抽样相比,往往选择分层抽样,因为它有显著的潜在统
计效果。也就是说,如果从相同的总体中抽取
两个样本,一个是分层样本,另一
个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一
方面,如
果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
总体
中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测
量的变量或与其高度相关的变量。
分层的原则是增加层内的同质性和层间的异质
性。常见的分层变量有性别、年龄、教育、职业等。分层随
机抽样在实际抽样调
查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高。
三. 系统抽样
系统抽样也称为等距抽样、机械抽样、SYS
抽样,它是首先将总体中各单位
按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,
每隔一
定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,
<
br>
先将总体从1~N相继编号,并计算抽样距离K=Nn。式中N为总体单位总数,
n为
样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取
k1+K,k1+2K……
,直至抽够n个单位为止。
根据总体单位排列方法,系统抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的
按自然状态排列。按照具体
实施等距抽样的作法,系统抽样可分为:直线
系统抽样、对称系统抽样和循环系统抽样三种。
在定量抽样调查中,系统抽样常常代替简单随机抽样。由于该抽样方法简单
实用,所以应用普遍。系统抽
样得到的样本几乎与简单随机抽样得到的样本是相
同的。
下面看一个例子,某产品的口
味测试,需要运用等距抽样的方法从某校营销
专业90名学生中抽选9名进行测试。
图
6
1 2 3 4 5 7 8 9 10 11 12 13 14
16 17 18 19 20 21 22 23 24
25 26 27 28 29
31 32 33 34
35 36 37 38 39 40 41 42 43 44
46 47 48 49 50 51 52 53 54 55 56 57 58 59
61 62 63 64 65 66 67 68 69 70 71 72 73 74
76 77 78 79 80 81 82 83 84 85 86 87 88 89
6 16 26 36 46 56 66 76
86
系统抽样方式也不是完美的,它相对于简单随机抽样方式最主要的优势
就是
经济性。系统抽样方式比简单随机抽样更为简单,花的时间更少,并
且花费也少。使用系统抽样方式最大
的缺陷在于总体单位的排列上。一些
总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能
疏忽,把
它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分
利用已有信息
对总体单位进行排队后再抽样,则可提高抽样效率。
四.整群抽样
整群抽样又称聚类抽
样。是将总体中各单位归并成若干个互不交叉、互不重
复的集合,称之为群;然后以群为抽样单位抽取样
本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群
间差异要小。
整群抽样优点是实施方便、节省经费;
整群抽样的缺点是往往由于不同群之间
的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
整群抽样示意图
总体
N 5000
分群
R
1
53
R
2
50
R
3
58
4
„„
R 48
R=130
抽样
R
53
R
4
48
R
52
98
50
R
133
R=5
样本
n 250
R
11
47
R
130
45
例如,调查中学生患近视眼的情况,抽某一
个班做统计;进行产品检验;每
隔8h抽1h生产的全部产品进行检验等。
整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。 分层抽样
要求各层之间的差异很大,层
内个体或单元差异小,而整群抽样要求群与群之间
的差异比较小,群内个体或单元差异大;分层抽样的样
本时从每个层内抽取若干
单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
以上抽样方法的抽样误差一般是:整群抽样 ≥简单随机抽样 ≥系统抽样 ≥
分层抽样。
五.配额抽样:
配额抽样也称“定额抽样”,是指调查人员将调查总体样本按一定标志分类<
br>或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。
例如一在一项
关于某品牌洗发水的消费者座谈会的研究抽样中,研究对象为
18—40岁的女性。已确定样本量为24
人。研究者选择“经济收入”和“发型”
为控制特征;并要求高低收入者各占50%,烫、直发型各占5
0%。根据上述要
求一个配额抽样的控制表便可设计出来。如下表:
经济收入
高
低
直发 6 6
发型
烫发 6 6
例如二假设某高校有2000名学
生,其中男生占60%,女生占40%;文科学
生和理科学生各占50%;一年级学生占40%,二年级
、三年级、四年级学生分
别占30%、20%和10%。现要用定额抽样方法依上述三个变量抽取一个规
模为
100人的样本。依据总体的构成和样本规模,我们可得到下列定额表:
男生(60) 女生(40)
文科(30)
理科(30) 文科(20) 理科(20)
年级 一 二 三 四 一 二 三
四 一 二 三 四 一 二 三 四
人数 12 9 6 3 12 9
6 3 8 6 4 2 8 6 4 2
配额抽样和分层随机抽样相比较,
既有相似之处,也有很大区别。配额抽样
和分层随机抽样有相似的地方,都是事先对总体中所有单位按其
属性、特征分类,
这些属性、特征我们称之为“控制特性。”例如市场调查中消费者的性别、年龄、收入、职业、文化程度等等。然后,按各个控制特性,分配样本数额。但它与分
<
br>层抽样又有区别,分层抽样是按随机原则在层内抽选样本,而配额抽样则是由调
查人员在配额内主
观判断选定样本。实际上,配额抽样属于先“分层”(事先确
定每层的样本量)再“判断”(在每层中以
判断抽样的方法选取抽样个体);费用
不高,易于实施,能满足总体比例的要求。
数学抽样在
生活中发挥着重要的作用,在我国,抽样法已被广泛应用于生产
技术及社会生活各个领域。目前,国家统
计调查制度中所包括的统计指标,依靠
抽样方法取得的资料已达到三分之一左右。在城乡住户调查、农产
品调查、价格
统计、市场调查等领域,应用抽样调查已取得很好的成果,在人口统计、社会统
计
、交通统计、商业统计等领域,抽样调查也正在发挥越来越重要的作用。随着
我国社会主义市场经济的发
展,抽样调查的应用范围将逐渐扩大,所发挥的作用
也将越来越大。