《统计学》讲义第二章-1-第二章统计数据的收集教学目的与要求:统计数据的收集是统计工作的基础环节,是统计整理和统计分析的前提。只有搞好数据收集,才能保证整个统计工作的质量。通过本章的学习,要求理解统计调查的概念和意义;掌握统计调查的种类、统计调查方案的设计内容和统计调查的各种组织方式。教学重点与难点:重点为统计调查的基本要求、统计调查方案的设计、专门调查的特点及应用条件。难点是调查方案中各项内容的涵义以及它们之间的相互关系、几种专门调查的特点及应用条件。统计研究过程为:收集数据整理数据分析数据解释数据本章着重讲解收集数据。第一节统计数据的来源统计数据主要来源于两种渠道:一是直接的调查和科学试验,这是统计数据的直接来源,“第一手或直接的统计数据”;二是别人调查或试验的数据,这是统计数据的间接来源,“第二手或间接的统计数据”。一、统计数据的间接来源如果与研究内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,称为间接来源的数据。第二手数据主要是公开出版的或公开报道的数据,当然也有些是尚未公开的数据。在我国,公开出版或报道的社会经济统计数据主要来自国家和地方的统计部门以及各种报刊媒介。如公开的出版物有《中国统计年鉴》、《中国统计摘要》、《中国人口统计年鉴》等。利用第二手数据对使用者来说既经济又方便,但使用时应注意统计数据的含义、计算口径和计算方法,以避免误用或滥用。同时,在引用第二手数据时,一定要注明数据的来源,以尊重他人的劳动成果。特点:1.搜集比较容易,采集成本低,且速度快;2.作用广泛,除了分析要研究的问题外,还可以提供研究问题的背景,更好的定义问题,检验和回答疑问和假设,寻找研究问题的思路和途径;《统计学》讲义第二章-2-3.搜集二手资料是研究者们首先要考虑并采用的。局限性:在使用二手资料时要保持谨慎的态度。在使用前,对二手资料进行评估:(1)资料是谁搜集的?主要考虑数据搜集者的实力和社会信誉度;(2)为何目的搜集的?为了某个集团的利益而搜集的数据是值得怀疑的。(3)数据是怎样搜集的?不同的方法所采集的数据解释力和说服力是不同的。(4)什么时候搜集的?对于过时的数据,其说服力受到质疑。二、统计数据的直接来源统计数据的直接来源主要有两个渠道:一是专门组织的调查;二是科学试验。(一)统计调查方式统计调查方式主要有普查、抽样调查、统计报表等。1.普查(1)普查的含义普查是为了某一特定目的而专门组织的一次性全面调查。它主要用来调查社会经济现象在某一时点上的数量状况。如人口普查、工业普查等。全面调查:被研究总体的所有单位都要被调查到。非全面调查:被研究总体的部分单位被调查到。(2)普查的特点1)普查通常是一次性的或周期性的。由于普查涉及面广、调查单位多,需耗费大量的人力、物力和财力,需间隔较长的时间,一般每隔10年进行一次。逢0进行人口普查,逢3进行第三产业普查,逢5进行工业普查,逢7进行农业普查,逢1或6进行统计基本单位普查。2)需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。如我国前四次人口普查的标准时间定为普查年份的7月1日0时。3)普查数据一般比较准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供基本依据。4)普查的使用范围比较窄,只能调查一些最基本及特定的现象。2.重点调查重点调查是一种为了解基本情况而组织的一次性非全面调查。它是对所要调查的全部单位中选择一部分重点单位进行调查。重点单位,是着眼于现象量方面而言,这一部分重点单位的某一主要标志的标志总量在总体标志总量中占有较大比重。重点可以是重点单位,也可《统计学》讲义第二章-3-以是地区。如要了解全国钢铁企业的生产状况,可以选择产量较大的几个钢铁企业,如宝钢、鞍钢、首钢等,对这些重点单位进行调查,就可以了解钢铁产量的大致情况及产量变化的基本走势。重点调查的特点是调查单位比较少,调查项目可多一点,是节省人力、物力,效果较好的一种调查形式。3.抽样调查抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。抽样调查的特点:1)经济性,这是其显著优点。由于调查的样本单位通常是总体单位中的很小一部分,调查的工作量小,因而可以节省大量的人力、物力、财力和时间。2)时效性强。抽样调查可以迅速、及时地获得所需要的信息。由于工作量小,调查的准备时间、调查时间、数据处理时间等都可以大大缩减,从而提高数据的时效性。与普查等全面调查相比,抽样调查可以频繁进行,随着事物的发生和发展及时取得有关信息,以弥补普查等全面调查的不足。如,两次人口普查之间各年份的人口数据都是通过抽样调查取得的。3)适应面广。抽样调查可以获得更广泛的信息,适用于对各个领域、各种问题的调查。从适用的范围来看,抽样调查既可以用于调查全面调查能够调查的对象,也能调查全面调查所不能调查的现象,特别适合对一些特殊现象的调查,如产品质量检验、农产品试验、医药的临床试验等。4)准确性高。抽样调查的数据质量有时比全面调查更高,因为全面调查工作量大、环节多,误差往往很大,而抽样调查由于工作量小,可使各环节的工作做的更细致,误差往往很小。4.典型调查1)典型调查的含义典型调查是一种重要的非全面调查。它是根据调查的任务,在对所研究的现象进行初步和全面分析的基础上,有意识地选出具有代表性的典型单位进行调查的一种调查研究方法。如,研究青少年犯罪问题,可以选择一些典型的犯人,对其做深入细致的调查,掌握大量一手资料,进而分析青少年犯罪的一般规律。特点:1.调查单位是根据调查目的有意识选择出来的少数具有代表性的单位,从典型入手,扩大到认识事物的一般,方法灵活,省时省力,提高调查效果;2.是一种深入细致的调查,既可搜集有关数字资料,又可以掌握具体、生动的情况,研究事物发生发展过程,探索《统计学》讲义第二章-4-事物发展变化的规律性。2)典型调查的作用:1.可以补充全面调查和其他非全面调查的不足;2.在一定条件下,可以利用典型调查资料,结合基本统计数值,估计总体指标数值;3.可用以研究新生事物。3)典型调查的步骤和方法1.要选好典型(1)划类选典:当总体单位之间标志值差异比较大时;(2)了解总体的一般情况,选择中等典型,“解剖麻雀”,当总体单位之间标志值差异很小很小时;(3)选先进、后进或新生事物的典型。2.要制定调查方案。3.要了解真实情况,取准取全统计数字。5.统计报表统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上逐级提供基本统计数据的一种调查方式。统计报表要以一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。(二)试验法是在所设定的特殊试验场所、特殊状态下,对调查对象进行试验以取得所需资料的一种调查方法。根据场所的不同,试验法可以分为在室内进行的室内试验法和在市场或外部进行的市场试验法。室内试验法可用于广告认知的试验等,比如,在同日的同种报纸上,版面大小相同,分别刊登A、B两种广告,然后将其散发给读者,以测定其反应结果。市场试验法可用于消费者需要调查等,比如企业让消费者免费使用一种新产品,以得到消费者对新产品看法的资料。第二节调查数据一、概率抽样和非概率抽样(一)概率抽样(probabilitysampling)也称“随机抽样”特点:按一定的概率以随机原则抽取样本。所谓“随机原则”就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中。随机不等于“随便”,随机有严格的科学含义,可以用概率来描述;“随便”带有人为的主观因素。每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率《统计学》讲义第二章-5-简单随机抽样(simplerandomsampling)•从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的•最基本的抽样方法,是其它抽样方法的基础特点:简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)•将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点:保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样(clustersampling)•将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点:抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差系统抽样(systematicsampling)•将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难《统计学》讲义第二章-6-多阶段抽样(multi-stagesampling)•先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样•具有整群抽样的优点,保证样本相对集中,节约调查费用•需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开•在大规模的抽样调查中,经常被采用的方法(二)非概率抽样(non-probabilitysampling)相对于概率抽样而言,抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。方便抽样调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。如,调查员在街头、公园、商店等公共场所进行拦截调查;厂家在出售产品柜台前对路过顾客进行的调查优点:容易实施,调查的成本低缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体判断抽样研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本,有重点抽样,典型抽样,代表抽样等方式。•判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性•抽样成本比较低,容易操作•样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体自愿样本被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本•自愿样本与抽样的随机性无关样本是有偏的不能依据样本的信息推断总体滚血球抽样《统计学》讲义第二章-7-先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。适合于对稀少群体和特定群体研究优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低配额抽样•先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位•操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似•抽取具体样本单位时,不是依据随机原则,属于非概率抽样(三)概率抽样与非概率抽样的比较1.概率抽样依据随机原则抽选样本样本统计量的理论分布是存在的可根据调查的结果推断总体2.非概率抽样不是依据随机原则抽选样本样本统计量的分布是不确定的无法使用样本的结果推断总体二、搜集数据的基本方法样本单位确定之后,对这些单位实施调查,即从样本单位那里得到所需要的数据,可以采用不同的方法。搜集