第二章统计数据的搜集与整理第一节数据的计量与类型统计研究客观事物的数量方面,离不开统计数据,统计数据是对客观现象进行计量的结果。对统计数据的属性、特征进行分类、标示和计算,称为统计测定或统计度量,有定性测定和定量测定之别,并且可分不同的层次。根据计量学的一般分类方法,按照对事物计量的精确程度,可将所采用的计量尺度由低级到高级、由粗略到精确分为四个层次,即:定类尺度、定序尺度、定距尺度和定比尺度。采用不同计量尺度可以得到不同类型的统计数据,而不同类型的逃难数据又适用于不同的统计分析方法。一、数据的计量尺度(一)、定类尺度(Nominalscale)定类尺度也称类别尺度或列名尺度,是最粗略、计量层次最低的计量尺度。它只能按照事物的某种属性对其进行平行的分类或分组。使用该尺度对事物所作的分类,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的。由于定类尺度只能区分事物是同类或不同类因此它具有=或≠的数学特性。定类尺度是对事物最基本的测度,是其他计量尺度的基础。要求:必须符合穷尽性和互斥性的要求。(二)定序尺度(Ordinalscale)定序尺度又称顺序尺度,是对事物之间等级差或顺序差别的一种测度。它不仅可以竟事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。定序尺度对事物的计量要比定类尺度精确些,但它也只测度了类别之间的顺序,而未测量出类别之间的准确差值。因此该尺度具有和的数学性质,当然也包括了定类尺度的特性,其计量结果不仅能对事物分门别类,还可以比较大小,但不能进行加、减、乘、除等数学运算。(三)定距尺度(Intervalscale)定距尺度也称间隔尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。它是对事物类别或次序之间间距的测度,通常使用自然或度量衡单位作为计量尺度,计算结果表现为数值。由于这种尺度的每一间隔都是相等的,只要给出一个计量单位,就可以准确地指出两个计数之间的差值。它不仅具有定类尺度和定序尺度的特性,其结果还可以进行加、减运算。(四)定比尺度(Ratioscale)定比尺度也称为比率尺度,它与定距尺度属于一个层次,一般可不作区分,其计量的结果也表示为数值。它除了句要上述三种计量尺度的全部特性外,还可以计算两个测度值之间的比值。这就要求定比尺度中必须有一个绝对固定的“零点”,这也是它与定距尺度的唯一差别。因此采用定比尺度计量的结果通常不会出现“0”值。现实生活中,大多数情况下使用的都是定比尺度。定距尺度和定比尺度的区别可以形象的比喻为:定距尺度是从桌面上开始测量高度,定比尺度则是从地面上开始测量高度。定比尺度中由于“0”表示不存在,因而其数值不仅可以比较大小、计算差值,还可以计算数值之间的比值。它可以进行加、减、乘、除运算。定类尺度定许尺度定矩尺度定比尺度=≠√√√√√√√+―√√×÷√二、数据的类型和分析方法(一)数据类型与分析方法统计数据是采用某种计量尺度对事物进行计量的结果,采用不同的计量尺度会得到不同类型的统计数据,有以下四种类型:定类数据:表现为类别,但不区分顺序,是有定类尺度计量形成的。定序数据:表现为类别,但有顺序,是有定序尺度计量形成的。定距数据:表现为数值,可进行加、减运算,是由定距尺度计量形成的。定比数据:表现为数值,可进行加、减、乘、除运算,是由定比尺度计量形成的。前两类数据说明的是事物的品质特征,不能用数值表示,其结果均表现为类别,也称为定性数据或品质数据(Qualitativedata);后两类数据说明的是现象的数量特征,能够用数值来表现,也称为定量数据或数量数据(Quantitaivedate)。由于定距尺度和定比尺度属于同一测度层次,所可以把后两种数据看作是同一类数据,统称为定量数据或数值型数据。特别指出:适用于低层次测量数据的统计方法,也适用于较高层次的测量数据,因为后者具有前者的数学特性;反之,适于较高层次测量数据的统计方法,则不能用于较低层次的测量数据,因为低层次数据不具有高层次测量数据的数学特性。(二)变量及其类型在统计中,把说明现象某种特征的概念称为变量(Variable),变量的具体表现称为变量值。统计数据就是统计变量的具体表现,变量可分为以下几种类型:1、定类变量(Nominalvariable)。如果一个变量由定类数据来计录就称为定类变量。如……2、定序变量(Ordinalvariable)。如果一个变量由定序数据来计录就称为定序变量。如……3、数字变量(Numericalvariable)。如果一个变量由数量数据来计录就称为数字变量。如……三、统计调查的种类(一)按调查的组织方式不同,分为统计报表和专门调查。(二)根据调查对象包括的范围不同,分为全面调查和非全面调查。全面调查即对调查对象的全部单位无一例外的进行调查,它又包括全面统计报表的普查;非全面调查即对调查对象中的一部分单位进行调查,包括抽样调查、重点调查、典型调查和非全面统计报表。(三)按调查登记时间连续与否,分为经常性调查和一次性调查。经常性调查也称连续性调查,是指随着被研究现象的变化,连续不断地进行登记,以取得这些现象在一段时期内发展的总量。一次性调查又称不连续性调查,是指对被研究现象每间隔异端相当长的时间所进行的登记,以取得这些现象在一定时点状况上的总量。(四)按搜集资料的方法不同,分为直接观察法、凭证(报告)法、询问(采访)法。直接观察法由调查人员亲临现场对被调查单位进行观察、点数、计量;凭证法是以各种原始记录和核算凭证为基础,依据统一的表格形式和要求,按照隶书关系逐机向有关部门提供统计资料的方法;询问法只指派调查员对被调查者询问、采访,提出所要了解的问题,根据被调查者的答复来搜集统计资料的方法。第二节统计数据搜集的组织形式统计数据主要来源于两种渠道:一是直接的调查和科学实验;二是别人调查和科学实验。一、统计数据的直接来源统计数据的直接来源是指由直接的调查和科学实验获得第一手资料,主要有两个渠道:专门组织的调查和科学试验。(一)统计调查方式统计调查是取得时候经济数据的主要来源,也是获得直接统计数据的重要手段。常用的统计调查方式有以下几种:1、普查。普查市委某一特定目的而专门组织的一次性全面调查,如……,它是使用于特定目的、特定对象的一种调查方式,主要用于搜集处于某一时点状态上的社会经济现象的数量,摸底是掌握特定社会经济现象的基本全貌,为国家提供有关政策或措施提供依据。普查的特点:(1)普查通常是一次性的或周期性的;(2)普查一般须要规定统一的标准时点;(3)普查的数据一般比较准确,规范化程度较高,可以为其它调查提供依据;(4)普查的使用范围比较窄,只能调查一些最基本及特定的现象。2、统计报表。统计报表是所统计数据的一种重要形式,在我国几十年的政府统计工作中,已形成了一整套比较完备的统计报表制度,它已成为国家和地方政府部门统计数据的主要来源。统计报表是按国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。它要以一定的圆熟数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。种类:按调查对象所包括的范围不同可分为全面报表和非全面报表;按报送时间不同可分为日报、月报、季报、半年报和年报等;按报表的内容和实施范围的不同可分为国家统计报表(国民经济基本统计报表)、部门统计报表和地方统计报表;按填报单位不同,可分为基层统计报表和综合统计报表等优点:统计数据的统一性和时效性、全面性、连续性、相对可靠性。3、抽样调查。它是实际中应用最广泛的一种调查方式和方法,它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查的结果来推断总体数量特征的一种非全面调查。抽样调查的特点:(1)经济性;(2)时效性强;适用面广;(4)准确性高。4、重点调查。它是专门组织的一种非全面调查,它是在调查对象中只选择一部分重点单位所进行的调查,借以了解总体的基本情况。重点单位:是指在总体中具有举足轻重的地位的单位。这些单位虽然数目较少,但就调查的标志值来说在懊恼共同标志总量中占有绝大的比重,能够反映出总体的基本情况。如……,它可以四一次性调查也可以是经常性调查。通常情况下,可以同统计报表制度想结合,采用统计报表取得所需要的资料。5、典型调查。它也是专门组织的一种非全面调查,它是根据调查研究的目的和要求,在对总体进行全面分析的基础上,有意识地选择其中有代表性的典型单位进行深入细致的调查,借以认识事物的本质特征、因果关系和发展变化的趋势。典型单位:是指那些最充分、最集中地体现总体某一方面共性的单位。选典的方法:(1)“解剖麻雀”式的方法。它适用于总体内各单位差别不太大的情况。通过对个别代表性单位的调查,即可估计总体的一般情况。(2)“划类选典”的方法。总体内部差异明显,但可以划分出若干个类型组,使各类型组内部差异较小。从各类性组中抽选一两个具有代表性的单位进行调查,即为划类选典。(3)“抓两头”的方法。既分别从先进单位和落后单位中选择典型,以便总结经验和教训,带动中间状态的单位,推动整体的发展。(二)数据的搜集方法数据的搜集方法即统计调查方法可分为两大类:询问调查和观察实验。1、询问调查。是调查者与被调查者直接或间接接触以获得数据的一种方法。具体包括:(1)访问调查。访问调查又称派员调查,是调查者与被调查者通过面对面地交谈从而得到所需统计资料的调查方法。其调查的方式有标准式访问和非标准式访问两种。标准式访问又称结构式访问,是按照调查人员事先设计好的、有固定格式的标准化问卷或表格,有顺序的依次提问,并由受访者作出回答。非标准式访问又称非结构式访问,是由调查人员给被调查者一个题目或提纲,由调查人员和受访者自由交谈,以获得所需资料。(2)邮寄调查。是通过邮寄或宣传媒体等方式将调查表或调查问卷送至被调查者手中,由被调查者填写,然后将调查表寄回或投放到指定收集点的一种调查方法。它是一种标准化调查,其特点是,调查人员和被调查者没有直接的语言交流,信息的传递完全依赖于调查表。邮寄调查的问卷或表格发放方式有邮寄、宣传媒介传送、专门场所分发三种。(3)电话调查。是调查人员利用电话同受访者进行语言交流,从而获得信息的一种方式。它具有时效快、费用低的特点。电话调查所提问题要明确,问题数量不宜过多。(4)电脑辅助调查。电脑不仅可以完成调查数据的处理,而且整个调查过程,包括问卷的设计和显示、样本设计、数据处理等也多可以由电脑来控制和完成。电脑辅助调查也称为电脑辅助电话调查,是在电话调查时,调查的问卷、答案都有计算机显示,整个调查过程,包括拨号、调查记录、数据处理等也都借助于计算机来完成。(5)座谈会。也称为集体访谈法,是将一组被调查者集中在调查现场,让他们对对调查的主题发表意见,从而获取调查资料的方法。这种方法适用于搜集与研究课题有密切关系的少数人员的倾向和意见。参加座谈会的人员不宜太多,通常为6—10人,并且是所调查问题的专家或有经验的人员。优点:取得的意见较为广泛、深入,且不会遭到拒访。(6)个别深度访问。深度访问是一种依次只有一名受访者参加的特殊的定性研究。它要求不断深入的受访者的思想当中,努力发掘其行为的真实动机。是一种无结构的个人访问,常用于动机研究。2、观察与实验。观察与实验是调查者通过直接的观察或实验获得数据的一种方法。(1)观察法。是指就调查对象的行动和意识,调查人员边观察边记录以收集信息的方法。它是一种可代替直接发问的方法。采用此方法,常常能够在被观察者不易觉察的情况下获得信息资料。(2)实验法。是一种特殊的观察调查方法,它是在所设定的特殊实验场所、特殊状态下,对调查对象进行实验以取得所需资料的一种调查方法。有室内实验法和时常实验法两种。二、统计数据的间接来源是指通过其他渠道获取别人调查或科学实验的第二手数据。第二手数据主要是公开出版的或公开报道的数据,当然也有些是尚未公开的数据。还可以在网络上获取所需要的统计数据。如……注意:利用第二手数据对使用者来说既经济又方便,但使用时应注意统计数据的含义、