收视率调查的流程与方法央视-索福瑞媒介研究(CSM)郑维东主要内容一、收视率调查的基本流程二、样本抽取方法三、数据采集方法四、数据处理方法一、收视率调查的基本流程收视率调查的基本流程包括三大环节,即:样本抽取数据采集数据处理收视率调查的技术流程基础研究建立样组数据采集数据处理(仅限于日记卡)质量控制加权INFOSYSTV软件提供给客户收视率调查的技术流程抽样调查技术配额控制技术样组建立与维持方法数据采集方法数据处理方法质量控制方法报告提交方法收视率调查抽样技术•获取完备的最新的抽样框资料•评估抽样框质量,控制抽样框误差•设计抽样规模和抽样程序•在抽样框中按照概率抽样方法产生抽样单位(一般采用分层抽样和PPS抽样)•在末级抽样单位中产生概率随机样本(一般采用等距抽样)•评估抽样误差•对有偏抽样考虑事后加权方案•基础研究抽样与固定样组抽样收视率调查配额控制技术•概率随机抽样原则下的配额调整•对收视行为有重要影响的指标进行配额控制(如性别、年龄、收入、户规模、有线比例、电视机台数等)•配额控制的容许误差标准按照95%置信区间•配额差异通过样户轮换逐步动态调整•每年一次的基础研究调查是配额控制的基本依据收视率调查样组建立与维持方法•样户合作协议•样户定期轮换(主动换户与被动换户)•样户礼金制度•样户行为分析•样户回访调查(电话或入户)•样户合作度调查(CoincidentalStudy)•年度基础研究收视率调查数据采集方法日记法人员测量仪法收视率调查数据处理方法•数据清洁、合成、加权、转换、处理、报告收视率调查报告提交方法•纸报告•数据(邮件或者FTP下载或者光盘)+软件•数据的简单分析收视率调查质量控制方法•按照ISO9002的原则和方法•作业规范•数据检查•质量控制体系–质控点监控与质控指标追踪–内部审核与外部审核–过程开放与用户参与二、样本抽取方法在收视率调查中,样本抽取一般包括确定调查总体、确定样本容量、抽取样本等环节。(一)确定调查总体在收视率调查中,调查总体一般被界定为目标区域内4岁及以上的电视家庭人口。这个界定包括以下三个要素:•目标区域:可以为全国、省、市、县或某一特定区域;•电视家庭人口:没有电视机家庭、集体人口及流动人口被排除在调查总体之外;•年龄下限(4岁):收视调查要求被访者必须具有一定的行为能力。(二)确定样本容量1、确定样本量时一般应考虑的因素•调查总体中各单位的差异程度差异程度越大,样本容量也应该越大;•允许误差允许误差越小,样本容量就应该越大;•抽样方法不同的抽样方法具有不同的效率,如分层抽样、系统抽样要比简单随机抽样具有更高的效率,因而在其它条件不变的条件下,分层抽样、系统抽样所需样本量要小于简单随机抽样的样本量;•经费、人力和时间等样本量越大,经费、人力及时间的投入也越大。在调查总体及抽样方法一定的条件下,样本量的大小实际上是在抽样精度(抽样误差)与成本之间相平衡的结果2、样本量的计算收视率调查是一种成数(比率)调查,样本量的计算公式为:n=t2p(1-p)/M2其中:n为样本量,p为收视率,M为允许误差,t为概率度,取P=0.5,此时p(1-p)达到昀大,在95%的置信水平(t=1.96)下,样本量n与允许误差M的关系如下图及表:样本量与允许误差的关系(95%置信度,收视率P=0.5)02000400060008000100001200000.020.040.060.080.10.12允许误差%样本量允许误差样本量1%96042%24013%10674%6005%3846%2677%1968%1509%11910%96-允许误差越小,所需样本量越大;-当允许误差小于3%时,再提高精度,所需样本量成倍增加;-权衡精度与成本的关系,样本量为1067人(300户)是合理的样本规模。根据上述理论分析,并参考国际经验,CSM所确定的样本量如下:城市网(测量仪):300户;城市网(日记卡):300户;部分小城市(日记卡):100户;省网:600户;全国网(测量仪):2000户。3、抽样误差与收视率的关系上述当样本量为1067人(300户)、在95%的置信水平下抽样误差为3%,应当明确,这是此样本规模的昀大抽样误差,实际的抽样误差要小于3%。因为:抽样误差的计算公式为:nPP)1(−抽样误差=1.96P:收视率,n:样本量上述3%的抽样误差是取P=0.5计算出来的,而由公式看出:当P=0.5时,P(1-P)达到昀大,由于实际的收视率一般低于50%,所以实际的抽样误差要小于3%。抽样误差与收视率的关系(样本量1067人(300户),置信度95%)收视率%抽样误差%收视率%抽样误差%收视率%抽样误差%10.60182.31352.8620.84192.35362.8831.02202.40372.9041.18212.44382.9151.31222.49392.9361.42232.53402.9471.53242.56412.9581.63252.60422.9691.72262.63432.97101.80272.66442.98111.88282.69452.99121.95292.72462.99132.02302.75472.99142.08312.78483.00152.14322.80493.00162.20332.82503.00172.25342.84-收视率越低,抽样误差越小;-当收视率低于12%时,抽样误差小于2%(三)样本的抽取下面以CSM为例,来说明收视调查中样本的抽取方法。CSM目前拥有的收视调查网有:•67个城市收视调查网(日记卡)•11个城市收视调查网(测量仪)•15个省级收视调查网(日记卡,湖南测量仪)•1个全国收视调查网(测量仪)各种调查网样本的抽取方法简述如下:1、CSM城市网(日记卡)的抽样方法调查总体非农人口比例在45%及以上的市辖区中电视家庭户中4岁及以上的所有人员。抽样方法CSM在收视调查网建立前以及建立后每年都要进行一次大样本量的基础调查,因而城市网的抽样方法包括基础调查的抽样方法及固定样组的抽样方法A基础调查的抽样方法∗基础调查的目的:-了解对收视行为有重要影响作用因素的信息,如频道覆盖率、电视机拥有状况、户规模、人口年龄性别结构等;-为固定样组的抽取、轮换及控制提供依据,以保证固定样组对总体的代表性。•基础调查的抽样总体非农人口比例在45%及以上的市辖区中,所有家庭户中常住人口(在本地居住半年以上,且平均每周居住5天以上)。∗基础调查的抽样方法二阶段、PPS、整群抽样第一阶段:由城市抽居(家、村)委,用PPS抽样抽取a=72(或36)个居(家、村)委会;第二阶段:由居(家、村)委抽样本户,在每个抽中居(家、村)委中,用随机等距抽样方法抽取b=14户家庭户,对于抽中家庭户中的所有常驻人口都进行调查。样本量为:a×b=72×14=1008户(大城市)a×b=36×14=504户(中小城市)PPS抽样实例PPS抽样全称是概率与规模成比例抽样(Samplingwithprobabilityproportionaltosize),它是效率较高的一种抽样方式。具体抽样过程如下:第一步:编制抽样框。从民政局、统计局或其他单位查抄全市居(家、村)委会名单及户数,所有区、街道及居(家、村)委会按自然标志排列,并累计户数,形成抽样框。见附表。第二步:计算抽样间距K。抽样间距K=居(家、村)委会总户数/拟抽选居(家、村)委会数。在本例中,某市居民累计总户数=33570,拟抽选居(家、村)委会数=10则:k=33570/10=3357。第三步:确定起点。在0~3357之间选取一随机数,如随机数为3212。第四步:抽取居(家、村)委会。在附表‘累计户数’一栏找到第一个大于等于3212的累计户数,对应的居(家、村)委会即是第一个被抽中居(家、村)委。而后抽取其它样本居委,计算3212+K,3212+2K,3212+3K,…,3212+9K,分别在‘累计户数’一栏找到第一个大于等于上述数的数字的累计户数,则对应的居(家、村)委会即被抽中。某市利用PPS抽样抽取居委会示例表(全市共有3个区、53个居(家、村)委会)区(县)街道(乡、镇)居(家、村)委会抽样框户数累计户数r+nk抽中居位1区曹山街道东站居委6246241区曹山街道长滩琚委1757991区曹山街道钢山锥子山57113701区曹山街道曹山45818281区宏业村街道宏业村三村76125891区宏业村街道宏业村四村6613250321211区宏业村街道宏业村一村78940391区宏业村街道雪华一村50045391区宏业村街道雪华二村51450531区宏业村街道宏业六村52255751区宏业村街道雪华三村67562501区解放街道二钢9977247656921区解放街道解放路86581121区解放街道大桥73688481区解放街道二钢二居89297401区解放街道革新居委74910489992631区解放街道淮河新村765112541区解放街道海航887121411区解放街道建新699128401区解放街道解放三路647134871328341区解放街道建华1058145451区解放街道曙光九巷643151881区解放街道建明37915567接上表2区胜利街道红旗一中555161222区胜利街道红旗二路三巷719168411664052区胜利街道航运干休所482173232区胜利街道机场397177202区胜利街道航英354180742区青年街道华丰街668187422区青年街道华大街741194832区青年街道保安里730202131999762区青年街道青年街738209512区青年街道奋勇454214052区青年街道同乐园748221532区青年街道菜市549227022区青年街道中平街547232492区青年街道太平街516237652335472区青年街道南山702244672区纬二街道先进里708251752区纬二街道蒋岗巷493256682区纬二街道爱国巷528261962区朝阳街道淮河371265672区朝阳街道新建445270122671182区朝阳街道新兴397274093区张公山街道长征路491279003区张公山街道张公山一村一居538284383区张公山街道张公山一村二居970294083区张公山街道张公山二村二居617300253区张公山街道张公山四村一居772307973006893区大庆街道长影826316233区大庆街道纺织厂二居548321713区大庆街道纺织厂三居1093332643区大庆街道长青新村306335703342510B固定样组的抽样方法固定样组规模:大城市300户,中小城市100户(1)居委会的抽取:在基础调查的样本居委名单中随机等距选取固定样组居委100户站抽取20个居(家、村)委会300户站抽取60个居(家、村)委会;(2)样本户的抽取:在基础调查样本户中,去掉非固定样组居(家、村)委所包含的样本户后,按以下指标排序后形成抽样框;家庭户规模、是否有线户、电视机台数、家庭户收视时间、家庭户有无子女(14岁以下)、地区分布、日用品主要采购者的年龄及家庭户收入。然后随机等距抽取100户或300户家庭户形成固定样组。2、CSM城市网(测量仪)的抽样方法CSM城市网(测量仪)调查总体的界定、操作流程与日记卡城市网相同,样本抽取方法稍有不同。A基础调查的抽样方法二阶段、PPS、整群抽样第一阶段:由城市抽居(家、村)委,用PPS抽样抽取a=200个居(家、村)委会;第二阶段:由居(家、村)委抽样本户,在每个抽中居(家、村)委中,用随机等距抽样方法抽取b=20户家庭户,对于抽中家庭户中的所有常驻人口都进行调查。样本量为:a×b=200×20=4000户B固定样组的抽取方法固定样组规模:300户首先将基础调查的样本户(4000户),按对收视率有重要影响作用的指标(家庭户规模、是否有线户、电视机台数、家庭户收视时间、家庭户有无子女(14岁以下)、地区分布、日用品主要采购者的年龄及家庭