补充材料

几种抽样方法 (原文)

在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、 确定或构置抽样框、选择抽样技术、确定样本量的大小、制定实施细节并实施。 这里我们着重介绍一下定量研究的抽样方法和样本量这两个技术环节。

最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。

一、非概率抽样
非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。

偶遇抽样(方便抽样)

常见的未经许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的(包括经费和时间)。抽 样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点,这种形式的抽样还是有严重的局限性。许多可能的选择偏差都会存在,如被调查者的自我选 择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此,当我们在进行街头访问或邮寄调查时,一定要谨慎对待调查结果。

判断抽样
判断抽样是基于调研者对总体的了解和经验,从总体中抽选"有代表性的""典型的"单位作为样本,例如从全体企业中抽选若干先进的、居中的、落后的企业作为 样本,来考察全体企业的经营状况。如果判断准,这种方法有可能取得具有较好代表性的样本,但这种方法受主观因素影响较大。

配额抽样
配额抽样是根据总体的结构特征来给调查员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄 的调查人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了。唯一的要求就是所选的元素要适合 所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配 额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。另外,用这种方法进行选择时,往往存在调查员的选择偏好,因而也难以避免主观因素 的影响。如果在严格控制调查员和调查过程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时,要特别注意配额与调查结果之间的密 切联系。

雪球抽样

雪球抽样是先选择一组调查对象,通常是随机地选取的。访问这些调查对象之后,再请他们提供另外一些属于所研究的目标总体的调查对象,根据所提供的线索,选 择此后的调查对象。这一过程会继续下去,形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。由于后来被推荐的人可能类似于推荐他 们的那些人,因此这种方式的调查也是非概率的。
 

二、概率抽样
非概率抽样包括简单随机抽样,分层抽样,等距抽样,整群抽样等,每个样本的中选概率是已知的,因此可以计算抽样误差。通常的实地调查中,是把这几种抽样方法相互结合。

简单随机抽样

总体中的每一个元素都有一个相等的被抽中概率。简单随机抽样可以通过抽签法和随机数字表方法来实现。先确定或搜集一个抽样框,将抽样框中的每个元素都编上号。然后把所有抽签抽中的号码的元素或随机数字对应的号码的元素做为样本进行调查。

等距抽样(系统抽样)
按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取(如等距原则),这种抽样方法称为系统抽样。其中最常用最简单的系统抽样叫等距抽样。

分层抽样
分层抽样的特点是先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取元素。其原则是子总体内元素间差异可能小,而不同子总体间差异大。

整群抽样
整群抽样首先将总体划成许多相互排斥的子总体或群,然后以群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查。

多级抽样
也叫多阶段抽样。它是在第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查。它与分层抽样的区别在于第一层是抽取部分,与整群抽样 的区别在于第二阶段是抽取部分。这在实际实施中是最为常见的一种抽样方式。同时它的抽样精度比整群抽样高,操作性更强。

什么时候用概率抽样,什么时候用非概率抽样,应当根据各种条件来决定, 例如研究的性质、对误差容忍的程度、抽样误差与非抽样误差的相对大小、总体中的变差、以及统计上的操作上的考虑等。尽管非概率抽样不能推断总体,不能计算 抽样误差,但在实际调查中仍常被应用。一方面是操作的考虑,减少非抽样误差的发生,另一方面也是因为所调查内容不需投射总体,而且一般总体的同质性较强。 如概念测试、包装测试、名称测试以及广告测试等,这类研究中,主要的兴趣集中在样本给出各种不同应答的比例。概率抽样用于需要对总体给出很准确的估计的情 况,例如要估计市场占有率、整个市场的销售量、估计某个地区的电视收视率等。还有全国性的市场跟踪研究(提供有关产品分类和品牌使用率等信息的研究),以 及用户的心理特征和人口分布的研究等,都采取概率抽样。但在概率抽样时要特别注意控制调查过程中的非抽样误差。


返回(Back)