全国电视观众抽样调查抽样方案万道侠目录一、调查背景、目的、范围和对象二、抽样方案设计的原则与特点三、样本区、县的抽选方法四、抽样总体中样本区、县内的抽样方法五、自我代表层中的抽样方法六、总样本量与抽样误差的估计七、结果与分析(一)调查背景时间:中央电视台组织,从1987年开始,每5年进行一次,本次调查2002年第四次调查。负责单位:中央电视台总编室委托中国科学院系统研究所、国家统计局农村调查总队、央视市场研究股份有限公司等机构共同完成的。组织实施:四部分。调查背景---组织实施调查的抽样设计以及结果数据的加权工作--中国科学院系统研究所的冯士雍研究员负责;试调查、问卷整理、数据录入等项工作---央视市场研究股份有限公司;入户访问、问卷审核等项工作----国家统计局农村调查总队;调查的总体设计方案、调查问卷的设计、调查问卷15%比例的电话复核、调查数据的统计分析等工作---中央电视台总编室观众联系处;历时时间:从筹备到公布调查结果历时一年。(二)调查目的获取:全国电视观众群体规模、构成以及分布情况;获取:收视习惯、对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度;为改进电视频道和栏目、开展电视观众行为研究提供新的依据。(三)调查范围全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。(四)调查对象全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。二、抽样方案设计的原则与特点(一)设计原则:科学、效率、便利一,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。二,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。(二)特殊问题及处理方法1.城乡区分(习惯和爱好)方法一独立抽样样本点数量较大,调查的地域较为分散,相应的费用也就较高方法二第一阶抽样中不考虑区分城乡统一抽取,在其后的抽样中再区分城、乡。样本点相对集中,但数据处理较为复杂样本区县:居委会;村委会续2.抽样方案的类型与抽样单元的确定全国性抽样必须采用多阶抽样-------五阶抽样抽样单元的选择(关键):第一阶抽样本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。本抽样方案采用分层五阶抽样。各阶抽样单元确定为从全国抽区(地级市以上城市的市辖区)、县(包括县级市等)从区中抽街道,县中抽乡、镇从街道中抽居委会,乡、镇中抽村委会从居委会或村委会中抽家庭户从家庭户中抽个人stage1分层stage1,2,3PPS抽样简单随机抽样等距抽样续3.自我代表层的设立北京市、天津市、上海市;广州市、成都市、长沙市、西安市;西藏自治区。包括下辖的所有区、县三、样本区、县的抽选方法全国区、县的调查总体:据2001年行政区划资料,全国共有792个区,县级行政单位2074个。(一)区、县分层:资料分类汇总及提高精度;分层标识应选取与调查指标相关程度较高的那些变量:观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等。全国区、县分层结构图区、县总体东部地区中部地区西部地区标识1:地域子层11子层12子层13分为四个子层21、22、23、24分为四个子层31、32、33、34标识2:HDI(人文发展指数)全国区、县的分层结果大层所含省、自治区、直辖市第一大层(东部地区)子层10:上海(1)、北京(2)、天津(3)(每个都作为自我代表层)子层11:辽宁(5)、山东(9)子层12:江苏(7)、浙江(6)子层13:福建(8)、广东(4)、海南(13)第二大层(中部地区)子层21:黑龙江(10)、吉林(12)子层22:河北(11)、河南(18)、山西(16)子层23:安徽(20)、江西(23)子层24:湖北(14)、湖南(17)第三大层(西部地区)子层31:内蒙古(21)、新疆(15)、宁夏(26)子层32:陕西(25)、甘肃(28)、青海(29)子层33:重庆(22)、四川(24)子层34:广西(19)、云南(27)、贵州(30)子层30:西藏(自我代表层)(二)区、县类别将各大层中所有的区、县除已划为自我代表层的以外,(如下称抽样总体)分成以下5类,每类组成1个小层:一类区,二类区,县级市,一类县,二类县区的划分标准:非农业人口占总人口的比例(80%、70%)县的划分标准:人均国内生产总值(5000元、4000元、3000元)自我代表层的区、县情况城市一类区二类区直辖市中的县及其它县级市县总计北京市855-18天津市774-18上海市973-19广州市552-12成都市524819长沙市23139西安市440513抽样总体区县情况地域子层一类区二类区县级市一类县二类县合计东部地区114362471968239东部地区123047533137198东部地区132441515942217中部地区215626403632190中部地区22396756140148450中部地区232634193195205中部地区242044394269214西部地区31278349161221西部地区3211161551131224西部地区33542145585201西部地区3419273074175325合计3004143986299432684抽样总体各小层人口占总人口的比例(%)地域子层一类区二类区县级市一类县二类县合计东部地区111.35122.27663.17280.76723.629511.1972东部地区120.69921.64873.88321.41052.28099.9226东部地区130.50831.21873.44372.34971.71509.2354中部地区211.02000.50231.77091.10351.00375.4004中部地区220.92631.91282.78584.52916.359316.5133中部地区230.52721.18001.06821.16374.93858.8776中部地区240.61061.59282.54152.27573.251910.2726西部地区310.43430.22190.73191.22651.36923.9838西部地区320.29760.55130.42570.72333.05675.0546西部地区330.14542.11320.95811.87153.89618.9843西部地区340.36290.94781.32542.64995.272210.5582合计6.883114.166222.107220.070536.7730100.0000(三)区、县的抽样方法及样本量与人口成正比的不等概率系统抽样(PPS系统抽样)各小层的区县样本量的分配地域子层一类区二类区县级市一类县二类县合计东部地区112332212东部地区122232211东部地区132232211中部地区212222210中部地区222233313中部地区232222311中部地区242222210西部地区312222210西部地区322222311西部地区332222311西部地区342222311合计2223262327121四、抽样总体中样本区、县内的抽样方法(一)样本区内的抽样每个一类样本区内采用街道(镇)、居委会、家庭户及个人的4阶抽样;每个二类样本区内采用街道(乡、镇)、居(村)委会、家庭户及个人的4阶抽样,样本量皆为90。具体方法如下。Stage1:每个样本区抽三个街道(乡镇)按人口的PPS系统抽样Stage2:每个样本街道(乡镇)抽两个居委会(村)按人口的PPS系统抽样Stage3:每个样本居委会(村)抽取15户随机起点的系统抽样Stage4:每个样本家庭户抽取1人简单随机抽样确定户内调查对象的二维随机表序号姓名性别年龄123456789101112111111111111122121122112123321132213123441322314324155412341235426631524351462771436252574388457126375319951438276528101035941728694111161510498327612127294116183105(二)样本县(县级市)内的抽样每个样本县内采用乡(镇)、村(居)委会、家庭户及个人的4阶抽样,样本量为60。Stage1:每个样本县(县级市)抽三个乡、镇按人口的PPS系统抽样Stage2:每个样本乡、镇抽两个(居)村委会按人口的PPS系统抽样Stage3:每个样本居(村)委会抽取10户随机起点的系统抽样Stage4:每个样本家庭户抽取1人简单随机抽样(三)儿童样本的确定在城乡每个样本户中,除抽取一位13岁以上的观众作为调查对象外,如果还有4-12岁的儿童,则需要抽取1位进行儿童观众的调查。如果符合年龄的条件多于1位,则仍按二维随机表的方法确定。对于自我代表的7个城市中,为保证儿童的样本量,对每个样本户,调查所有满足年龄的儿童。五、自我代表层中的抽样方法(一)自我代表城市的抽样方法每个样本区县规定都抽2个街道(乡、镇),每个样本街道、乡、镇抽2个居(村)委会。样本区内每个居(村)委会样本量仍为本15户,样本县(县级市)内每个村(居)委会样本量仍为10户。自我代表城市的样本量城市一类区二类区县总样本量北京市4(60)2(60)2(40)440天津市3(60)2(60)2(40)380上海市4(60)3(60)﹡2(40)500广州市3(60)2(60)2(40)380成都市﹡3(60)2(60)2(40)380长沙市2(60)3(60)2(40)380西安市﹡4(45)2(60)2(40)380总计13209605602840(二)西藏自治区的抽样方法西藏自治区的抽样也采用分层抽样法,其中拉萨市城关区抽4个居委会,日喀则市除城关镇外,再抽两个乡镇,共6个居(村)委会。以上两市均作为自我代表层,每层各抽取60户;其余71个县则采用按人口的PPS抽样抽2个县,每个县调查40户。西藏自治区总样本量为200户。六、总样本量与抽样误差的估计根据前述抽样设计,本方案13岁以上观众总的样本量为:1)自我代表层共2840+200=3040户,其中区样本为2400户,县样本为640户。2)抽样总体分11个子层,55个小层,样本区县共121个,其中样本区45个,样本县(县级市)76个。每个样本区抽90户,故区样本为4050户;每个样本县抽60户,县样本共4560户,共计8610户。3)全国总样本量为11650户,其中区样本为6390户,县样本为5260户。七、结果与分析结果:共抽中覆盖全国的11950个成人样本实际回收有效问卷11760份,有效率为98.41%另外附带调查了2042个儿童样本调查显示:我国4岁以上的电视观众达到11.15亿人,占4岁以上全国人口的93.9%。在抽样调查中,有95.8%的电视观众表示经常和几乎每天看电视,而天气预报、国内新闻、电视剧、国际新闻、电影、大型直播类节目、综合文艺类节目、新闻评论类节目、法制类节目、歌舞音乐类节目等成为观众收看较多的前十类,方案的合理性采用多阶段抽样减少工作量,简化抽样框的编制便于样本单元的抽取使整个抽样调查的组织工作容易进行。采取PPS抽样,抽样效率比较高,大大提高了估计精度。将几种抽样方法结合起来使用,充分发挥各种方法的优点。