2011年陕西省以市为总体农村抽样调查样本轮换工作方案及实施细则2011年陕西省以市为总体农村抽样调查样本轮换工作方案为推动统计工作科学发展,着力提升统计调查能力,努力提高农村抽样调查数据质量,全面真实反映我省各地农村居民收入情况,圆满完成省委省政府关于“十二五”期间城乡居民收入快速发展的目标任务,今年全省将开展以市为总体农村抽样调查样本轮换工作。为了保证此次样本轮换工作规范有序地运行,确保新样本对各市(区)的代表性,陕西省统计局根据国家统计局农村社会经济司《2010年全国农村抽样调查样本轮换方案》,并结合全省以市为总体城乡居民收入调查工作的具体实际,制定本工作方案。一、样本轮换的目标和原则(一)目标此次样本轮换的目标,一是保持样本代表性。通过对现行农村抽样调查网点进行轮换,增强样本代表性,提高数据质量,达到真实客观反映近年来农村社会经济发展变化的目的。二是提高抽样调查方法的科学性。通过完成以市为总体农村住户调查工作的抽样设计,提升农村抽样调查的业务水平和统计调查能力。(二)原则1、随机性原则。样本轮换过程,要始终贯穿并科学运用随机抽样方法,保证样本轮换工作符合抽样方案的技术规范,不能人为地指定和调整样本点。2、可比性原则。每次样本轮换,都会面临着目标总体范围、统计概念上的一些变化,抽样设计过程中既要考虑到变化了的总体特性,又要与以往的范围、口径相衔接,使样本轮换前后的抽样数据具有可比性。3、高效性原则。样本轮换抽样设计方法的改进,就是要提高抽样设计的精度和效率,即在一定调查资源和样本量的约束下,抽选出代表性高的样本,提高样本效率。二、实施范围2011年以市为总体农村抽样调查样本轮换工作范围涉及到全省11个市(区)所辖107个县(市、区),市县各级统计部门一律按本方案的要求开展样本轮换工作。三、抽样方法由于以市为总体农村住户调查工作涉及全省107个县(市、区),因此住户调查抽样设计以市为总体,原则上采用二阶段自加权抽样方案,即市抽普查小区、普查小区抽户,每个调查县的调查户数按规定由各市确定。第一阶段即市抽普查小区,由各市对其所辖县(市、区)按抽样框资料中的城乡分类代码和普查小区码进行排序,结合第二次农业普查资料,采用与人口规模成比例(PPS)的抽样方法,抽选三套方案的普查小区,由各县(市、区)在此三套普查小区中任选一套方案,抽取调查户。第二阶段各县(市、区)在选定的普查小区内,用等概率系统抽样方法抽选固定数量的调查户。对于农村常住人口超过20万人的县(市、区),抽取不同村中的8个普查小区,每个普查小区抽取10个调查户。对于农村常住人口未达20万人的县(市、区),抽取不同村中的6个普查小区,每个普查小区抽取10个调查户。原则上各市(区)的样本总量不得低于轮换前的样本总量。各市(区)具体样本量见下表:市(区)西安铜川宝鸡咸阳渭南延安汉中榆林安康商洛杨凌样本量920320840940820870820880780560170(一)以市为总体农村抽样调查样本轮换工作流程图3月4月5月6月7月8月9月10月11月下旬上旬下旬上中旬下旬上中旬下旬召开全省以市为总体农村抽样调查样本轮换方案研讨会。(省局)1、制定实施方案。(省局)2、下发以市为总体农村大样本调查工作文件。(省局)1、召开全省动员、培训会议。(省局、市局)2、核对样本框数据。(市局)1、抽选普查小区。(市局)2、多次检验、评估样本。(省局、市局)完成普查小区入户清查工作。(县局)1、完成普查小区绘图工作。(县局)2、完成普查小区入户摸底工作。(县局)1、完成普查小区抽户工作。2、完成新网点辅调员选调、调查户落实工作。(县局)1、建立新网点辅调员、调查户档案(县局)。2、安排新网点的开点、开户和调查动员及培训工作。(县局)1、向省局上报新样本网点落实情况。(市局)2、完成新样本网点的审评、备案工作。(省局)1、完成新网点开展基础工作。(市局)2、完成样本轮换总结报告。(市局)1、启用新样本试记账一个月,为十二月全面启用新一轮样本打下基础。2011年陕西省以市为总体农村抽样调查样本轮换实施细则为了规范有序地做好以市为总体农村住户调查的样本轮换工作,进一步规范农村住户调查工作,提高样本代表性,确保数据质量,特制订农村住户调查样本轮换实施细则。本细则适用于农村住户调查。一、抽样范围与对象2011年陕西省以市为总体农村住户类调查的范围包括统计上新的城乡划分中的“乡村”以及“城镇”的涉农地域。具体指,统计上使用的新的城乡划分中“乡村”类别中所有的村委会、居委会、类似村委会、类似居委会1;“城镇”类别中所有的村委会、类似村委会。上述农村住户类调查的范围在本细则中简称为“农村”。上述农村范围中有关村委会、居委会、类似村委会、类似居委会的界定,按国家统计局“统计用区划代码和城乡划分代码库”中村级单位的代码进行识别和归类。对代码库中称为“社区”、“管委会”等的单位,一律按其村级单位对应代码的码段进行识别,列入村委会码段的按村委会对待,列入居委会码段的按居委会对待。对代码库中的空壳村、即将拆迁的村委会或居委会,经各市核实后不纳入这次样本轮换的抽样范围。农村住户调查的对象都是农村常住户及常住人口。农村常住户是在当地居住或即将居住时间在6个月以上的家庭户。农村常住人口是1对村委会、居委会、类似村委会、类似居委会的界定,按村级单位代码的第10-12位进行确定,居委会为001-199,村委会为200-399,类似居委会为400-497和499,类似村委会为500-597和599。在当地居住生活半年以上的家庭户成员。二、抽样方法由于以市为总体农村住户调查工作涉及全省107个县(市、区),因此住户调查抽样设计以市为总体,原则上采用二阶段自加权抽样方案,即市抽普查小区、普查小区抽户,每个调查县的调查户数按规定由各市确定。第一阶段:即市抽普查小区,由各市对其所辖县(市、区)按抽样框资料中的城乡分类代码和普查小区码进行排序,结合第二次农业普查资料,采用与人口规模成比例(PPS)的抽样方法,抽选三套方案的普查小区,由各县(市、区)在此三套普查小区中任选一套方案,抽取调查户。第二阶段:各县(市、区)在选定的普查小区内,用等概率系统抽样方法抽选固定数量的调查户。对于农村常住人口超过20万人的县(市、区),抽取不同村中的8个普查小区,每个普查小区抽取10个调查户。对于农村常住人口未达20万人的县(市、区),抽取不同村中的6个普查小区,每个普查小区抽取10个调查户。原则上各市(区)的样本总量不得低于轮换前的样本总量。三、工作步骤与具体要求(一)编制普查小区抽样框各市统计局根据第二次农业普查资料,提供各市总体范围的涉农普查小区抽样框初步资料。普查小区抽样框初步资料包括以下指标:普查小区代码、普查小区所在村的村码、村名、城乡分类代码、所在村“四通”(通电、通公路、通电话、能接收电视节目)情况、常住户户数、常住人口数及分性别人口数,常住户人口的年龄构成,常住户人口的受教育程度构成,农村常住户从业人员,农村常住户外出从业人员,按住房价值分户的比重,每百户主要资产(电视机、汽车、摩托车、手机、电脑等)拥有量。各市所辖县(市、区)统计局,将2008年国家统计局“统计用区划代码和城乡划分代码库”中确定的农村村级(含部分居委会)单位编码、名称、城乡分类代码、常住人口,与农普中得到的涉农普查小区抽样框初步资料进行核实比较,对涉农普查小区抽样框进行修订。要求如下:一是增加农普中没有的村级单位,如乡村范围内的居委会,新建社区等,在这种情况下,该村级单位先按一个普查小区对待,并直接使用代码库中的常住人口作为该单位的人口,其他指标参照其邻近的村级单位的数据进行插补。如果该单位被抽中,根据实际情况确定调查户是否分配到普查小区(村民小组)中。二是删去已拆迁的村级单位。三是校正更新由于村合并等原因已改变地址码的村级单位的编码。四是注意校正村级单位的城乡分类代码。修订更新后的普查小区抽样框资料由县(市、区)统计局上报省统计局进行审定、备案,之后省统计局下发至各市统计局进行抽样。(二)抽选普查小区在上述普查小区排序后的抽样框中,以每个普查小区的常住人口数进行累计,在此累计值的基础上,按每县抽取若干固定数量(通常为10个)的普查小区,采用PPS系统抽样方法。例如某县要抽选10个普查小区,首先计算PPS系统抽样的组距,即累计的常住人口数除以样本量10,然后在第一个组距内随机起点抽出第一个样本普查小区,随后每隔一个组距抽选一个样本普查小区。通常情况下,农业普查的普查小区与村民小组是基本一致的。对于抽中的样本普查小区,如果普查小区与村民小组没有对应一致,存在一个样本普查小区由多个村民小组交叉组成,或者普查小区仅为村民小组的一部分时,需要进行特殊处理。对于前者,只选择其中较大的一个村民小组视为抽中的普查小区;对于后者,视整个村民小组为样本普查小区。下面举例说明,利用县级样本框,采用按与常住人员规模成比例的PPS方法抽选普查小区的具体方法。表1:PPS方法抽选普查小区普查小区码城乡分类码常住人口累计常住人口随机起点+组距抽中样本(1)(2)(3)(4)(5)(6)990105001005981121231231359901050012009811216428713519901051000019811232561222399901051002000111234195322399901051002000211253414872239990105100200031125542041223999010510020004122569261022391990105100200051222632873434399010510020006122261313443439901051002000712248536194343990105100200081225204139434399010510020009122316445543431990105100201012106025057644799010510020102210395545264479901051002010321063960916447990105100201042105836674644719901051002010521031569898551990105100201062202767265855199010510020201220241750685519901051002020222030278088551990105100202032204781285519901051002020422040482168551990105100202052202218437855199010510020301220243868085511990105100203022202718951106559901051002030322033492851065599010510020304220237952210655990105100203052201559677106559901051002030622034010017106559901051002030722050310520106559901051002030822061211132106551990105100203092205391167110655990105100203102203651203610655990105100203112205881262410655表1中,样本框中普查小区排列顺序是先按第2列城乡分类代码升序排列、再按第1列普查小区码升序排列而成。第3列是抽样设计变量常住人口数,第4列是对第3列的累计。如果我们要抽选6个普查小区,则组距等于累计人口数除以组数,即组距=1262421046。在组距之内给出随机起点,这里随机起点是135,第4列中第二个普查小区的累计常住人口数大于等于随机起点,因而抽出第一个样本。以后,对第5列随机起点135再加上一个组距2104等于2239,第4列中的第七个普查小区其累计人口数大于等于2239,抽中第二个样本。然后