《调查技能教程》电子讲义2003年4月我国的统计调查体系以抽样调查为主体,以全面报表和周期性普查为基础,第一章调查导论第一章调查导论调查的概念调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中搜集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。注:“部分单元”一般指抽样调查;“所有单元”即普查。第一章调查导论调查步骤⒈调查目标的系统陈述;⒉抽样框的选择;⒊抽样方法的确定;⒋问卷设计⒌数据收集;⒍数据编码和录入;第一章调查导论调查步骤⒎审核与插补;⒏估计;⒐数据分析和调查结果的表述;⒑数据发布;⒒文档。第一章调查导论调查的生命周期⒈调查计划⒉设计和开发⒊操作与实施⒋调查评估第二章调查目标的系统陈述目标陈述的步骤和过程⒈确定信息需求(陈述问题)使用一般的术语来描述客户对调查的信息需求。第二章调查目标的系统陈述目标陈述的步骤和过程⒉确定数据的使用者(用户)和数据的用途⑴数据用户的意见在调查计划阶段中十分重要;⑵确定数据应用的范围应适当控制,不宜过大;⑶应使信息需求得到具体且精确的表述。第二章调查目标的系统陈述目标陈述的步骤和过程⒊尽可能地使用清楚、精确,已形成共识的标准定义,从而方便数据使用者和被调查者的交流,确保调查的一致性。第二章调查目标的系统陈述目标陈述的步骤和过程⒋调查内容必须确认调查内容包括信息需求的所有方面,但不包括任何无关项目,这是为了避免不必要的调查费用或者给被调查者带来过重的回答负担。第二章调查目标的系统陈述目标陈述的步骤和过程⒌分析方案(生成表)⑴确定每个项目的调查结果所需的详细程度及形式。⑵对数据分析和表示方式的详细计划称为分析方案,并需要制作生成表(数据汇总表的格式)。⑶生成表是将每个调查项目的调查结果按被调查者的类别分类列出而生成的数值表或频数表。⑷生成表为以后的分析,也为问卷设计中确定相应调查项目的详细程度及整个问卷的框架提供了依据。第二章调查目标的系统陈述地域劳动力情况就业待业下岗非劳动力合计城市A城市B城市C地区D地区E总计表2.32001年按P省地域划分的成年人口的劳动力情况生成表例:第二章调查目标的系统陈述影响目标陈述的限制性因素⑴要求的精度;⑵可以利用的资源(预算、人力和设备);⑶对调查进度的要求;⑷用现有的技术能否对调查变量进行测量;⑸被调查者回答问题负担是否过大;⑹被调查单位或个人的隐私或机密是否会被泄露;⑺对被调查者的名誉是否有负面影响。第三章调查设计导论两种不同的调查:普查与抽样调查⒈二者差别:在普查中,我们从总体的所有单元中收集信息;而在抽样调查中我们仅仅从总体中的一部分(通常是很小的一部分)单元中收集信息。⒉抽样调查的优点:能在充分满足客户所需信息质量的前提下,提供一种更快、更节省的方法。相对于普查来说,抽样调查规模小,因而更容易进行监控,对被调查者的心理压力也小。第三章调查设计导论两种不同的调查:普查与抽样调查⒊一项经科学设计并严格实施的抽样调查完全有可能获得比全面调查(普查)更为准确、更为可靠的结果。第三章调查设计导论两种不同的调查:普查与抽样调查⒋在抽样调查和普查之间作抉择时,最需要考虑的因素:⑴费用;⑵时效;⑶总体大小;⑷小区域估计;⑸属性的多寡;⑹调查误差;⑺特殊要求;⑻其它因素。⒌进行普查的一个原因是为了获得一些标准信息(或辅助信息)。这些信息可以用于改进抽样设计或抽样调查的估计量。第三章调查设计导论目标总体和调查总体⒈目标总体就是希望从中获取信息的总体。它是所感兴趣的所有单元的集合。在陈述调查目标时就应定义目标总体。⒉定义目标总体所必不可少的四个因素是:⑴总体中单元的类型;⑵单元的特征(指标);⑶单元的地理位置;⑷调查的标准时点(或时期)。⒊目标总体只是概念性的,并不一定需要一个实际存在的名录。第三章调查设计导论目标总体和调查总体⒋调查总体(抽样总体)即实际调查所覆盖的总体。它可以与目标总体不完全一致,理想状态下,这两个总体应该很相似。依据调查的结果所得出的结论仅适用于调查总体。第三章调查设计导论抽样框(调查框)⒈抽样框(调查框)提供了一条辨别和联系调查总体单元的有效途径。对于抽样调查,可根据抽样框计算总体中每个单元的入样概率。⒉抽样框应该包括下述部分或全部内容:⑴识别资料;⑵联系资料;⑶分类资料;⑷维护与连接资料(为更新抽样框);⑸辅助资料。第三章调查设计导论抽样框(调查框)⒊抽样框的类型⑴名录框(目录框)是有关所有总体单元的一份实际的或者概念的名录清单。⑵概念名录框常是基于一个调查正在进行中才存在的总体。⑶实际名录框可取自各种不同的来源。各级政府机构因各自的管理目的都保存一些名录,他们也是对抽样框进行维护的最有效的资料来源。第三章调查设计导论抽样框(调查框)⒋区域框是其单元由地理区域构成的一种特殊的名录框,也称地域框。区域框适用于以下所述的两种情况:当调查本质就是地理性质的(如通过每平方公里的野生动物数来估计野生动物的总数);或者不能获得一个适当的名录框。第三章调查设计导论抽样框(调查框)⒌当没有合适的名录框时,可以考虑借助区域框来构造名录框。通过一个区域框抽取地理区域,并列出被抽中区域内的单元清单。⑴对不断变化的总体,任何名录框都会很快过时。比较而言,由于地理边界相对稳定,维护一个区域框也就更为容易。⑵区域框中的单元可以分不同的层次,上一级单元可以细分成许多下一级单元。第三章调查设计导论抽样框(调查框)⒍多重抽样框:是两个或两个以上的抽样框的组合(如名录框和区域框的组合或者两个或两个以上名录框的组合)。第三章调查设计导论抽样框(调查框)⒎抽样框的优良性准则:⑴实用;⑵精确;⑶时效;⑷费用。第三章调查设计导论抽样框(调查框)⒏抽样框可能的缺陷:⑴不完全涵盖(或不完全覆盖);⑵过涵盖(过覆盖);⑶重复;⑷分类误差。第三章调查设计导论调查误差⒈抽样误差抽样误差是指仅根据对总体的一部分而不是全部的调查来估计总体特征所引起的误差。对于概率抽样调查,可以计算抽样误差。计算方法取决所用的抽样方法与估计方法(抽样策略)。第三章调查设计导论调查误差⒉抽样误差的大小取决于下列因素:⑴样本量;⑵总体指标的变异程度;⑶抽样设计;⑷估计方法;⑸总体大小。第三章调查设计导论调查误差⒊非抽样误差:非抽样误差为除抽样之外的几乎所有调查活动过程中所产生的误差。非抽样误差不仅出现在抽样调查中,也出现在普查中。非抽样误差可以划分为两类:⑴随机误差:如果样本足够大,这类误差可以忽略。随机误差只增加估计值的变异性。⑵系统误差:误差倾向于同一个方向,会导致最终结果的偏倚。非抽样误差的计量,极为困难。与抽样方差不同的是,系统误差导致的偏倚不能随样本量的增大而减少。第三章调查设计导论调查误差⒋非抽样误差的来源:⑴涵盖误差涵盖误差表示在抽样框或者样本中出现了单元的遗漏、错误的包含、重复以及错误的分类。涵盖误差可以导致估计的偏倚,且偏倚的大小随总体的不同而不同。第三章调查设计导论调查误差⒋非抽样误差的来源:⑵计量误差计量误差是指对一个问题所做的回答记录与它的真值之间的差异。计量误差能影响非抽样误差的大小并造成估计的偏倚。如果计量误差是随机的(实际获得的观测值随机地散布在真值周围),则会增大估计值的方差,从而降低调查的精度。如果计量误差系统地偏向某个方向或某个类别,就会产生估计的偏倚。第三章调查设计导论调查误差⒋非抽样误差的来源:⑶无回答误差无回答有两种类型:全部无回答(单元无回答)和部分无回答(项目无回答)。单元无回答是指被调查单元没有提供任何信息,而项目无回答是指问卷中某些问题的回答空缺。第三章调查设计导论调查误差⒋非抽样误差的来源:⑶无回答误差①无回答的影响:无回答的被调查者与回答的被调查者具有不同的特征,因此如果对无回答不予纠正,将会引起调查估计的偏倚。由于进行回答的单元比预期的要少,有效样本的数量减少,从而使抽样误差增大。②单元无回答的产生的原因:无人在家、拒绝访问或者由于某些原因所抽中的人无法参加调查;不完整的抽样框资料是无回答产生的另一个原因。第三章调查设计导论调查误差⒋非抽样误差的来源:⑶无回答误差③项目无回答发生在以下场合:被调查者不知道答案;拒绝回答某个问题;忘了回答;或者错误地跟随问卷的进程漏了回答;或由于有病或语言障碍而不能回答。设计低劣的问卷或者访问本身也会引起项目无回答。④无回答的产生也有访员的原因。⑤数据收集方法也会造成无回答误差。第三章调查设计导论调查误差⒋非抽样误差的来源:⑷处理误差处理是指将收集的调查结果转化为适合于列表及进行进一步数据分析所需要的形式。处理包含数据收集以后,作估计以前,对数据的编码、录入、审核及插补等的一切活动。处理误差通常可通过质量保证和控制方法来监控。第四章数据收集方法数据收集的概念⒈数据收集是在调查中对每一个被抽中的单元收集信息的过程。这个过程包括:⑴找到被抽中单元并与之相接触或建立联系;⑵取得他们的配合;⑶提问(或直接测量);⑷记录回答(结果)。⒉数据收集的目标是获得尽可能完整且精确的数据。第四章数据收集方法数据收集的模式⒈两种主要数据收集模式⑴纸张式回答记录在用纸印刷的问卷上,数据录入是数据收集后的一个单独的过程。对于一次性调查来说,纸张式方法通常比计算机辅助式方法更便宜,且开发所需时间也少。⑵计算机辅助式问卷出现在计算机屏幕上,调查时将答案直接输入到计算机中。数据收集成为一个完整、快速的,比纸张式方法更有效的过程。第四章数据收集方法数据收集的模式⒉计算机辅助数据收集方法的其他优点:⑴问卷在问题的设置流程和审核方面可以更复杂;⑵对数据质量更容易进行监督和控制;⑶更容易产生关于访问情况的管理报告;⑷能够导致较少的回答负担;⑸减少数据收集之后对某些单元的追踪回访;⑹对重复性调查,可以减少回答误差;⑺对类似的调查或重复性调查,可节省开发费用。第四章数据收集方法数据收集的方法⒈计算机方式收集方法的其他缺点有:⑴需要做大量的程序开发工作,且需经过严格的测试;⑵必须为每位访员提供一台已装好程序及有关文件的笔记本电脑;⑶要求填写问卷的人经过培训;⑷不同计算机之间的数据传输必须保证调查资料的保密性;⑸容易受到技术问题的困扰。第四章数据收集方法数据收集的方法⒉数据收集的基本方法:⑴自填式:被调查者在没有访员协助的情况下完成问卷。把问卷递送/返回的方法有:由调查员分发,通过邮寄或传真。在使用计算机辅助自我调查(CASI):将问卷的电子版本送交给被调查者,被调查者使用计算机完成问卷。第四章数据收集方法数据收集的方法⒉数据收集的基本方法:⑵人员面访:访问以面对面的形式进行,访(问)员协助被调查者完成问卷。用纸张式方法时,由于同时需要用笔,故这种方法也称为纸笔面访(PAPI);当用计算机式方法时,称作计算机辅助式面访(CAPI);第四章数据收集方法数据收集的方法⒉数据收集的基本方法:⑶电话访问:访员通过电话协助被调查者完成问卷。用纸张式方法时,称为纸笔访问(PATI);使用计算机方式时,称为计算机辅助电话访问(CATI)。第四章数据收集方法数据收集的方法⒊几种数据收集的基本方法的详细说明:⑴自填式自填式问卷要求问卷结构严谨,应有制作详细、形象友好的说明。有时可使用记帐式(日记式)问卷。自填式方法通常适用于受过相当好的教育的被调查者,管理相对容易。对于要求详细信息的调查,由于可以参考个人记录,可减少回答误差,也可用于敏感问题的调查。但自填式的回答率通常低于访员协助式方法。第四章数据收集方法数据收集的方法⒊几种数据收集的基本方法的详细说明:⑴自填式对被调查者的回答负担很大;当用邮寄的方式递送和返回问卷时,需要的时间较长;是所有数据收集方法中最便宜的一种方法。第四章数据收集方法数据收集的方法⒊几种数据收集的基本方法的详细说明:⑴自填式计算机辅助自我调查(CASI)在CASI中,出现在计算机上的问卷具有审核和“帮助”功能,用电子文件的形式将问卷传送给被调查者。被调查者使用自己的计算机完成问卷。