抽样案例

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三期中国妇女社会地位调查抽样设计方案第三期中国妇女社会地位调查领导小组办公室中国人民大学统计学院2010年7月15日中国人民大学统计学院中国人民大学统计学科始建于1950年,目前拥有统计学全国重点学科,教育部人文社会科学重点研究基地“应用统计科学研究中心”。统计学和风险管理与精算学两个博士点,统计学、概率论与数理统计、风险管理与精算学、流行病与卫生统计学四个硕士点,应用经济学下设统计学博士后流动站金勇进教授本次抽样设计团队近年来承担全国性重大抽样设计项目(1)中国公众科学素养调查设计与数据分析,中国科协,2001-2010年共计五次。(2)中国儿童青少年心理发育特征调查抽样设计及数据分析,北京师范大学,2008年(3)2009学生国际能力测评中国试测研究抽样设计与数据分析,教育部考试中心,2009年抽样设计的原则(一)全国性大规模抽样调查,抽样方案设计必须是严格的概率抽样。抽取样本用以满足全国目标量估计的需求;对需要进行单独分析的省(自治区、直辖市),在全国样本的基础上进行样本追加用以满足省级目标量的估计。抽样设计的原则(二)抽样设计既有利于提高抽样效率,也为开展妇女社会地位与层间经济社会综合发展水平差异的相关性研究奠定基础;同时,还保证本期调查结果能够满足多领域分析的需求,如从城乡差异、不同地区经济发展水平差异等多角度进行对比分析。抽样设计的原则(三)本期调查仍然采用分层多阶段不等概率抽样,在各层内,采用与人口规模成比例的不等概率抽样。对于北京、天津、上海三个直辖市,选择街道、乡镇作为初级抽样单元;对于其他省(自治区、直辖市),选择区、县级市、县作为初级抽样单元。初级单元抽样框的划分根据国家统计局现行的统计上有关我国区域的划分标准,全国31个省、直辖市、自治区(港、澳、台地区除外)按照东中西的地域概念划分为三类地区(东、中、西部地区)。将北京、天津、上海单独作为直辖市域处理重庆位于我国西部地区,直辖市区划设立较晚,作为省对待初级单元抽样框的分层直辖市域:北京、天津、上海;东部域:辽宁、河北、山东、江苏、浙江、福建、广东、海南;中部域:黑龙江、吉林、山西、河南、安徽、湖北、湖南、江西;西部域:内蒙古、广西、重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆。初级单元抽样框的划分北京、天津、上海街道、乡镇总计773个初级抽样单元其他28个省(自治区、直辖市)共有县级行政单位(区、县级市、县)2803个初级抽样单元甘肃省的酒泉市、广东省的中山市和东莞市、海南省的三亚市都为不设县级行政单位的地级市,这4个地级市与以上2803个县级行政单位等同视为一级抽样单元据此,全国共有初级抽样单元3580个初级单元抽样框直辖市域初级单元组成抽样框一,含773个初级抽样单元东部域初级单元组成抽样框二,含836个初级抽样单元中部域初级单元组成抽样框三,含894个初级抽样单元;西部域初级单元组成抽样框四,含1077个初级抽样单元抽样框的分层依据同一抽样框内初级抽样单元之间由于所属行政地区的经济发展水平、城乡差距等原因仍然具有较大的差异。为了提高估计效率,需要在各域内进行再分层。一方面,人口的聚集程度与社会发展水平紧密联系另一方面,城市化水平(非农业人口占总人口比重)这一指标能够反映我国各地区的经济发展差异直辖市域抽样框一的分层对于以街道、乡镇为初级抽样单元的抽样框一。官方公开资料中并没有详细的街道、乡镇一级行政区划的两项指标。直辖市域的初级单元分层首先采用街道和乡镇的行政区划,直接分为街道层和乡镇层两个大类;在每一大类内再按所属直辖市依次分为北京、天津、上海三个小层。抽样框一共被分为6个小层直辖市域抽样框一的分层域大类初级单元数量小层初级单元数量直辖市街道343北京135天津107上海101乡镇430北京182天津136上海112合计773————773东中西部域抽样框的分层对于以区县(区、县级市和县)为初级抽样单元的其他三个抽样框,先将各抽样框内的初级抽样单元根据各自人口密度划分。人口密度较高的为一类层,较低的为二类层。在此基础上,根据上述两个大类内初级单元的城市化水平,将区县进一步细分为若干小层东部域抽样框二的分层域人口密度大类初级单元数量城市化水平小层初级单元数量东部域大于等于600人/平方千米人口密度一类39895%及以上一类区县12665%~95%二类区县6535%~65%三类区县6620%~35%四类区县8120%及以下五类区县60小于600人/平方千米人口密度二类43880%及以上一类区县2550%~80%二类区县2330%~50%三类区县10820%~30%四类区县11620%及以下五类区县166合计—836————836中部域抽样框三的分层域人口密度大类初级单元数量城市化水平小层初级单元数量中部域大于等于400人/平方千米人口密度一类41580%及以上一类区县9950%~80%二类区县8230%~50%三类区县2615%~30%四类区县8810%~15%五类区县8710%及以下六类区县33人口密度小于400人/平方千米人口密度二类47975%及以上一类区县3945%~75%二类区县3825%~45%三类区县11115%~25%四类区县18410%~15%五类区县9210%及以下六类区县15合计——894————894西部域抽样框四的分层域人口密度大类初级单元数量城市化水平小层初级单元数量中部域大于等于200人/平方千米人口密度一类39275%及以上一类区县6045%~75%二类区县5325%~45%三类区县6215%~25%四类区县7510%~15%五类区县9010%及以下六类区县52小于200人/平方千米人口密度二类61270%及以上一类区县2440%~70%二类区县6025%~40%三类区县9715%~25%四类区县16210%~15%五类区县15610%及以下六类区县113——西藏73————7373合计10771077各级抽样单元的确定第一阶段抽样单元:区、县级市、县(抽样框一为街道、乡镇)。第二阶段抽样单元:居委会、村委会;第三阶段抽样单元:家庭户。家庭户中15岁及以上的家庭成员,随机抽出一人填答个人主问卷;如果被抽中的是60岁及以上的老年人,还需要填答老年人附卷;针对入选家庭户中年龄在9~14岁的儿童,随机抽出一人填答儿童附卷。各级抽样单元的抽取方法第一阶段抽样中,采用与初级抽样单元人口规模成比例的系统PPS抽样,在四个抽样框抽取初级抽样单元;第二阶段抽样采用与入选区、县级市、县(北京、天津、上海为街道、乡镇)内居委会或村委会人口规模成比例的系统PPS抽样,在入选初级单元内抽取居委会或村委会;第三阶段抽样在入选的居委会或村委会内采用简单系统抽样抽取相同数量的家庭户。样本量及其分配本期调查全国基本方案个人主问卷调查人数是30000人,进行样本量分配时以个人主问卷数作为各层样本量的分配依据,再根据制定的第二、三阶段抽取的样本单元数标准,折算出需抽取的初级单元样本量。抽样框一的样本量首先单独确定直辖市域抽样框的样本量,其他三个域再按与人口规模成比例分配剩余样本量。我们以估计简单随机抽样比例P时的样本量为基础,在95%的置信度下按抽样绝对误差不超过4%的要求进行计,设计效应取为2.5,所需样本量为1500人。如果进行分性别或分城乡对比分析,直辖市层抽样框主问卷的最终样本量确定为1500*2=3000人抽样框一的样本量对于北京、天津、上海三个直辖市的街道、乡镇初级抽样单元总计773个。为了使抽取的样本初级单元相对分散,提高该层的抽样效率,按照每个样本初级单元抽2个居委会(村委会)、每个样本居委会(村委会)抽15个家庭户的原则,计算出抽样框一需抽取100个初级抽样单元(街道、乡镇)。其他三个抽样框样本量除去直辖市域的样本量3000人,剩余的27000人则作为其他三个域抽样框的样本量。根据各域的人口规模按比例进行分配。在每个中选样本初级抽样单元抽取5个居委会或村委会,每个样本居委会或村委会抽取15户,每户抽1人的原则;折算出东部域抽样框二需抽取9450人、126个初级单元,中部域抽样框三需抽取9450人、126个初级单元,西部域抽样框四需抽取8100人、108个初级样本单元。各个抽样框样本量的分配地区初级单元抽样框初级单元样本个数二级单元样本个数样本家庭户数主问卷回答人数北京、天津、上海抽样框一10020030003000辽宁、河北、山东、江苏浙江、福建、广东、海南抽样框二12663094509450黑龙江、吉林山西、河南、安徽湖北、湖南、江西抽样框三12663094509450内蒙古、广西、重庆、四川贵州、云南、西藏、陕西甘肃、青海、宁夏、新疆抽样框四10854081008100合计——46020003000030000抽样框一的样本抽取域大类小层人口规模初级单元数样本单元数直辖市街道北京952731413527天津589740510721上海1216555010127乡镇北京279548618210天津38453371368上海17448771127合计——35975969773100直辖市抽样框一的样本初级单元分配抽样框一的样本抽取在各小层层内分别采用与各个街道(乡镇)人口规模成比例的系统PPS抽样抽取街道(乡镇)在入选的街道内采用与居委会人口规模成比例的系统PPS抽样抽取2个的居委会;在入选的乡镇内采用与村委会人口成比例的系统PPS抽样抽取2个村委会在每个入选居委会或村委会内采用随机起点的等概率系统抽样抽取15户抽样框二的样本抽取域人口密度大类城市化水平小层人口规模初级单元数量样本单元数量东部域大于等于600人/平方千米人口密度一类95%及以上一类区县597222781262165%~95%二类区县2461008065935%~65%三类区县44985791661120%~35%四类区县61019359811220%及以下五类区县41820123609小于600人/平方千米人口密度二类80%及以上一类区县851880025450%~80%二类区县998112723430%~50%三类区县602636751081720%~30%四类区县597326291161620%及以下五类区县8420959016623合计————————454863452836126抽样框二的样本初级单元分配抽样框二的样本抽取在每一小层内,采用与各区、县人口规模成比例的系统PPS抽样抽取样本单元在每个入选的初级抽样单元内,分别采用与各居委会、村委会人口规模成比例的系统PPS抽样抽5个居委会或村委会在每个入选居委会或村委会内采用随机起点的等概率系统抽样抽取15户抽样框二的样本抽取域人口密度大类城市化水平小层样本居委会样本村委会东部域大于等于600人/平方千米人口密度一类95%及以上一类区县5065%~95%二类区县4135%~65%三类区县3220%~35%四类区县2320%及以下五类区县14小于600人/平方千米人口密度二类80%及以上一类区县5050%~80%二类区县4130%~50%三类区县3220%~30%四类区县2320%及以下五类区县14东部域样本居委会和村委会抽取数量的分配标准抽样框三的样本抽取抽样框三的样本初级单元分配域人口密度大类城市化水平小层人口规模初级单元数量样本单元数量中部域大于等于400人/平方千米人口密度一类80%及以上一类区县38067252991650%~80%二类区县28222033821030%~50%三类区县1501153226415%~30%四类区县63705321881210%~15%五类区县78734482871610%及以下六类区县33891686337小于400人/平方千米人口密度二类75%及以上一类区县660591839545%~75%二类区县856682438525%~45%三类区县435695091111415%~25%四类区县778381041842210%~15%五类区县477

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功