广播收听率调查理论的基础(一)常用的抽样方法在市场调研中,存在各种可选择的抽样方法,可根据总体的特征、调研的目标、费用预算以及运作的可行性选择一个适当的抽样方法。1.简单随机抽样(SRS)简单随机抽样是最基本的概率抽样,是对总体中所有单位按照完全符合随机原则的方法抽取样本。对于简单随机抽样,一个可操作的定义为:从一个随机数字表中按等概率选出n个不同数字,它对应于N个总体元素号码中的n个不同号码。简单随机抽样是统计学抽样理论的基础,总体中的每一个个体都有一个被选做样本的已知的独立的机率。例如,在N=500个居民户中抽取一个n=10户的简单随机样本,抽样的过程为——第一步,将总体抽样框中的500户按001-500编号;第二步,从表2.2.3随机表中的一个随机位置(画框的位置)开始抽样(见随机数字表);第三步,向下连续地以三个数字为一组摘取数字。这样,便得到10个三位数字组的简单随机样本:171,102,393,……表2.2.3随机数字表………………………………………………855383299556270924432178550982……377949123848139355964192457151……890939592400064141201436592547……766216486858761714865953115221……718213504127551024922804675344……341804523574133935226895239235……112099451876519484861379933755……273783287179579513910961872521……106581925977316195462044903264……597174173248387593297337320405……876393951781838304497745855051……086174516992794889792918945123……085285084048403594227265710886……898584460664710621668937207001……422972231906947610088130153914………………………………………………不过,在现实的调研中,很少采用简单随机抽样设计。在实际收听率调查中,总体N往往非常大,简单随机抽样不易于做到,首先难以构建一个包含全部所有抽样单元的抽样框,其次采用该方法得到的样本单元比较分散,调查难以实施。另外,考虑到不同样本在年龄、居住地区等方面存在同质性,简单随机抽样所取得的效果也往往不能达到最优。2.系统抽样(SystematicSampling)系统抽样又称等距抽样,其基本方法是:首先将总体中的单位按照某一标识排列,然后随机选定一个起点,以一个固定的间隔选取单位作为样本。例如,假定要在一座拥有N=640户的居民楼内抽取n=12户进行调查,应用系统抽样法的抽样步骤是:第一步,计算抽样间距:k=[640/12]=[53.33]=53;第二步,按照右手规则,确定640户的编号顺序。右手规则是指在行走编号的过程中,始终保持房门在行走者的右端,而且没有遗漏任何一户;第三步,随机地确定一个编号(假定是84)为样本的第一个单元,每隔53户抽取1户(即间距、步长为53);这样,所抽取的n=12户样本的编号分别是:84,137,190,243,296,349,402,455,508,561,614,27。3.整群抽样(ClusterSampling)当个别的抽选样本过于复杂,或为了节约运作成本时,可以通过整群抽样来进行,即每个抽样单位中包含若干个样本。简单地说,整群抽样是指将总体按照某种标准划分为一些子群体,以每个子群体作为一个抽样单位。例如,学校学生可以按班级抽选,公司职员可以按工作的群体抽选,城市住户可以按街区抽选,等等。整群抽样在视听率调查特别是电视收视率调查中被广泛应用。在电视收视率调查中,一般采用以户为抽样单元的整群抽样,对抽中户内的所有符合条件的居民进行调查。例如,央视·索福瑞公司的电视收视率调查,就是对所抽中家庭所有4岁以上的成员,利用人员测量仪或日记法进行调查的。在广播收听率调查中,有时也采用以户为抽样单位的整群抽样,即对抽中户内的所有符合条件的居民进行调查。例如,调查一个地区居民的广播接触率,赛立信的做法通常是对所抽中的家庭所有6岁以上具有收听广播能力的成员进行调查。4.分层抽样(StratifiedSampling)分层抽样又称类型抽样,是指先对总体单位分层,然后每一层都按照一定的方法随机抽取部分单位构成样本的一种抽样形式。大体上说,分层抽样包括以下步骤:(1)将整个总体划分成多个相互区别的次级总体,称为“层”;(2)在每一层中,从构成该层的抽样单位中选出一个独立的样本;(3)用每一层得到的样本计算一个单独的层平均数(或其它统计量)。层的平均数经过适当加权就可以得到对整个总体的估计值。【案例】某年度进行的广东省广播收听率调查在某年底进行的广东省广播收听率调查项目中,n=2300户的全省代表性样本也采用了分层、多级PPS整群抽样技术。其中,一级分层指标为“地理位置”,将总体划分为四大区域:珠江三角洲、粤东、粤北和粤西;二级分层指标为“非农业人口比例”,将各区域以县(区)为单位划分为城市域(非农业人口≥70%)和农村域(非农业人口70%);三级分层指标包括:人口规模、6岁以上人口比例、非农业人口比例、人均GDP、人均收入水平等五个指标,将各地区的城市域和农村域划分成若干个小层。5.多级抽样(Multi-stageSampling)多级抽样法也被称为多阶段抽样法,就是在总体单位比较多的情况下,根据总体单位中既定的层次或级别,然后在各个不同的级别(或“层”)中,分多个阶段采取不同的抽样方法进行抽样。先抽大单位,再在大单位中抽小单位,小单位中抽取更小的单位。多级抽样通常结合分层抽样或整群抽样等方法进行,在收听率调查中被广泛应用。例如,赛立信2005年全国50城市广播收听率调查中,就是采用了与分层抽样、等距抽样、整群抽样结合的多级抽样方法(具体做法见“赛立信城市广播收听率调查网的样本抽取方法实例”)。6.PPS抽样PPS抽样全称为“与规模的度量成比例的概率抽样”(samplingwithprobabilityproportionaltosize)。在第一阶段,根据所在群的大小,给予各个群不同的中选概率,然后在第二阶段的各个群内以等样本量的方法抽取样本。例如,要在某一个城市抽选1000户家庭进行家庭收入状况调查,该城市共有50个居委会,拟从5个居委会中各抽200户作为样本。应用PPS法的抽样步骤是:第一步,以最小户数的居委会为1,按照户数计算第i个居委会的权重iK,即iK=该居委会户数/最小居委会的户数;第二步,计算第i个居委会的中选概率iM(iiiKKM),并据此随机抽取5个居委会;第三步,在抽中的每个居委会中分别抽取1000/5=200个家庭作为调查样本。7.非随机抽样(NonrandomSampling)非随机抽样(NonrandomSampling)主要包括三种抽样法,即任意抽样、判断抽样和配额抽样,这三种抽样法的共同特点是在抽选样本过程中或多或少地增加了调查者的人为意愿因素,使可能被抽中的样本在调查者事前设定的或可控的范围内。当然,为达到调研目标,调查者使用非随机抽样法,令调查样本的确定带有人为因素,但并不是以调查者操纵调查结果为目的。因此,非随机抽样不适用于收听率调查中。(1)任意抽样在任意抽样法中不存在样本设计。这种抽样方法近似于调查人员对他们在街上、商场或者其其它地方偶然碰到的人提问,对调查对象的选择完全由调查者决定。例如,我们在某次乘坐出租车时,询问出租车司机平时习惯收听哪个电台,并了解当时正在收听哪个电台等信息,调查及选择调查对象都是随意的,其抽样方法为任意抽样。任意抽样法在小样本或小范围调查中常常被用到,而且也很管用。比如,记者需要了解市民对某一事件的态度,随意在街上对行人进行采访。再比如,如果需要寻找使用某一品牌化妆品的消费者,那么以纯粹的随机抽样为基础来进行调查就可能成本太高,采用任意抽样方式相对更为适宜。(2)判断抽样在判断抽样法中,调查者对调研中所要求包括的样本作一个简单的判断。这些判断通常由调查者或调研公司去做。例如:需要了解家庭主妇购买食用油的行为习惯和喜好,调查者可以直接在超市购物人群中抽样;需要了解白领收听广播的习惯,邀请一些白领人士参加小组座谈会,调查者可以在大型写字楼实施抽样等等。判断抽样法在一些对特定群体进行调查的定量研究和小组座谈会形式的定性研究中被经常使用。但是,由于需要调查者在抽样过程中做出某些判断,因此,调查者的调研经验和调研实施方案的合理性,往往对调查能否实现调研目标产生决定性的作用。(3)配额抽样在抽样调查中,为了减少或避免因小概率事件造成样本的重大偏差,或者增加对样本的控制和把握,调查者会依据相关的数据及其经验判断,在抽样之前对调查样本做出一些条件限制或量化定额,这种抽样方法称为配额抽样。配额抽样与判断抽样的区别在于,其对样本结构与总体结构在“量”方面的质量控制,能够保证样本具有较高的代表性。在实际调研中,这种抽样方法通常与其他的随机抽样方法结合起来使用,而且应用十分广泛。如果对总体单位特征(如听众特征)比较明确,并且有相关的数据可以参照,当抽取的样本量不是足够大的话,使用配额抽样法,就能够保证在一定程度上控制调查数据的偏差。有时基于研究目标的需要,例如比较听众对各个电台的满意度,使用配额抽样法设置配额,规定收听各个电台的听众样本量,不仅可以满足研究分析的需要,而且可以节省调研时间和费用。【案例】某城市的收听率调查,要求记录日记卡的听众样本量n=400,采用分级抽样、配额抽样结合的方式抽样,根据当地的人口结构和以前调查所得到的听众结构数据,确定受访者的配额要求如下:12-19岁20-24岁25-29岁30-39岁40-49岁50-59岁60-69岁合计A区男66212426146103女77222528167112B区男331113148355女441213158460C区男226795233女228995237合计242480921005624400(二)城市一次性的广播收听率调查的样本抽取方法在城市一次性进行的收听率调查中,调查总体是市辖区内6岁及以上的、有广播收听能力的人口,样本抽取方法主要是采取分层抽样、系统抽样、整群抽样相结合的多级抽样方法。具体做法是:第一阶段:随机抽出抽样小区1.取得调研城市的人口及各区的人口分布数据,将该城市的样本量按各区人口比例分到各区;例如:在广州市抽取500户进行收听率调查,分配到各区的样本为:合计东山荔湾越秀海珠天河芳村白云黄埔人口(万人)427.063.952.042.183.859.918.585.721.1比例(%)10015121020144205样本量(户)5007560501007020100252.通过城市地图,将所在城市的各个区划分成面积大致相等的N个地块,为抽样小区,并将各抽样小区按照一定的顺序排列;3.为了保证样本的地区分布比较均匀,规定每个抽样小区的样本量为10户,则每个区需抽出的小区数量n=该区的样本数量÷10;4.以K=N/n为步长,随机起点,每隔K抽出一个小区,作为抽中的抽样小区。例:广州市东山区,需抽样75户,共划分出35个抽样小区,则需抽出的小区为n=75÷10≈8个,步长K=35÷8=4.375(4),若以9为起点,抽中的小区如下:1234567891011121314151617181920212223242526272829303132333435第二阶段:实地抽样,随机抽出家庭样本1.在抽中的小区范围内,以任意点为起点,右手原则,按住户地址顺序,每隔五户抽一户(即步长为5);图2.2.2行走路线图2.抽样员敲门进入被抽中的住户,说明来意,请求其配合接受访问;3.若抽中的住户不接受访问,则放弃该样本,然后再间隔5户抽选下一住户,直至完成