1统计方法部分第一章统计和数据主讲人:宋玉峰本部分考点:1.统计学中的几个基本概念(变量、数据、数据类型)2.了解数据来源的主要渠道3.掌握常用搜集数据的方法、特点及应用条件。第一节统计学的含义一.什么是统计学统计学是一门研究数据的科学,按大百科全书的定义:统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。统计分析数据分两种:描述统计和推断统计第一节统计学的含义一.什么是统计学描述统计是研究数据搜集、处理和描述的统计学方法。推断统计则是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类。[例题•单选题]研究如何利用样本数据来推断总体特征的统计学方法是()。A.描述统计B.理论统计C.推断统计D.应用统计答案:C推断统计是研究如何利用样本数据来推断总体特征的统计学方法。描述统计是研究数据搜集、处理和描述的统计学方法。第一节统计学的含义二.统计的应用(一)统计的应用领域[例题•判断题]统计是适用于所有科学领域的通用数据分析方法。答案:正确。统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言。无论是在社会科学领域,还是在自然科学领域,进行某个课题的研究时,为使观点与结论具有事实依据和说服力,必须根据调查研究或实验取得的统计数据来说明问题,这需要运用科学地统计方法来进行。第二节数据类型数据类型(一)定性变量(数据)与定量变量(数据)定性变量:反映“职业”、“教育程度”等现象的属性特点的变量,不能说明具体量的大小和差异。分类变量:没有量的特征,只有分类特征。这种只反映现象分类特征的变量又称分类变量。分类变量的观测结果就是分类数据。说明事物类别的一个名称。如“性别”就是一个分类变量。顺序变量:如果类别具有一定的顺序,如,“教育类别”,这样的变量称为顺序变量,相应的观察结果就是顺序数据。说明事物有序类别的一个名称,这类变量的具体表现就是顺序数据。第二节数据类型二.数据类型数值(定量)变量:反映“天气温度”、“月收入”等变量可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。这些变量就是定量变量也称数值变量,定量变量的观察结果成为定量数据。说明事物数字特征的一个名称。2分类变量没有数值特征,所以不能对其数据进行数学运算。分类数据只能用来区分事物,而不能用来表明实物之间的大小、优劣关系。第二节数据类型二.数据类型顺序变量比分类变量向前进一步,它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。显然,顺序数据的功能比分类数据要强一些,对事物的划分也更精细一些。但顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离。只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异。因此,从本质上,顺序数据仍然是定性数据中的一种。第二节数据类型二.数据类型数值型数据作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。其计量精度远远高于定性数据。在统计学研究中,对数值型数据的研究是定量分析的主要内容。从上述三种数据的基本特点可以看出,这三类数据对事物的描述是由定性到定量、由低级到高级,从粗略到精细。第二节数据类型[例题•单选题]下列选项中属于分类变量的是()。A.服务满意B.员工人数C.籍贯D.利润答案:C解析:分类变量没有量的特征,只有分类特征。分类变量的观测结果就是分类数据。[例题•单选题]若产品质量由高到低划分为三个级别:1级、2级、3级,则下列说法中正确的是()。A.1级品的质量是2级品的两倍B.2级品的质量是1级品的两倍C.产品质量级别是顺序数据D.产品质量级别是定量数据答案:C解析:产品质量级别是顺序数据,无法计算相互之间的大小,是定性变量。类型[例题•单选题]顺序数据()。A.是一种定量数据B.可以进行排序,表明事物之间的大小、优劣关系等C.可以反映事物在数量上的差异D.其计算功能与数值型数据相同答案:B解析:顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离。只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异。第二节数据类型(二)观测数据和实验数据按获取数据的方法不同,可分为观测数据和实验数据。观测数据可能是全面数据也可能是样本数据(局部),实验数据一般都是样本数据。1.观测数据。3观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。在社会经济问题研究中,观测是取得数据最主要的方法。2.实验数据。实验数据一般是在科学实验环境下取得的数据。在实验中,实验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果。在自然科学研究中实验的方法应用非常普遍。第二节数据类型[例题•单选题]根据获取方法不同,数据可分为观测数据和()。2010年A.描述数据B.实验数据C.推断数据D.分析数据答案:B解析:按获取数据的方法不同,可分为观测数据和实验数据。第三节数据来源与搜集数据的方法一.数据的来源从使用者的角度看,统计数据资料的来源主要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称为次级数据或第二手间接的统计数据。第三节数据来源与搜集数据的方法(一)数据的直接来源——原始数据搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。1.统计调查统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向客观实际搜集资料的过程。通过统计调查得到的数据,一般称为观测数据。第三节数据来源与搜集数据的方法(一)数据的直接来源——原始数据2.实验法通过实验法得到的数据就是实验数据。它是通过有意识地改变或控制某些输入变量,观察其他输出变量的变化,从而达到对事物本质或相互联系的认识。第三节数据来源与搜集数据的方法(二)数据的间接来源——次级数据在很多情况下,统计研究都是在掌握次级数据的基础上进行的。次级数据是指由其他人搜集和整理得到的统计数据。这种来自他人调查整理基础上的数据我们把它称为数据的间接来源。第三节数据来源与搜集数据的方法(二)数据的间接来源——次级数据数据的间接来源有:(1)公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。(2)尚未公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机构为公开发布的调查结果数据。4第三节数据来源与搜集数据的方法[例题•多选题]统计数据的直接来源有()。A.统计调查B.文献检索C.实验D.调查机构发布的调查结果E.图书中数据答案:AC解析:统计调查或进行实验就是统计数据的直接来源。第三节数据来源与搜集数据的方法二.搜集数据的方法常用的统计调查种类有:(一)普查普查:普查是专门组织一次性的全面调查,用来调查属于一定时点或时期内的社会经济现象的总量。它适用于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。如,人口普查、全国第三产业普查等。普查要遵循以下几点:第三节数据来源与搜集数据的方法(二)抽样调查抽样调查:抽样调查是按随机原则,从总体中抽取一部分单位作为样本来进行观察,并根据其观察的结果来推断总体数量特征的一种非全面调查方法。抽样方法主要有:概率抽样和非概率抽样常用的概率抽样组织形式主要有以下几种:a.简单随机抽样:是抽样调查的最基本形式。是完全随机的选择样本。第三节数据来源与搜集数据的方法(二)抽样调查b.分层抽样:是先将总体各单位按主要标志加以分层,而后在各层中按随机的原则抽取若干样本单位,由各层的样本单位组成一个样本。c.整群抽样:是将总体各单位划分为若干群,然后以群为单元,从总体中随机抽取一部分群,对被抽中的群内所有单位进行全面调查。d.系统抽样:等距抽样:每隔一定距离抽选一个被调查者。2、非概率抽样:没有完全按照随机原则选取样本单位。第三节数据来源与搜集数据的方法(三)统计报表统计报表:它是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等)自下而上的提供统计资料的一种报表制度。在官方统计的经常调查中目前依然发挥着一定的作用。对于大型、国有企业来说,利用统计报表搜集数据,具有时间快、成本低的优点,但对于大量的小型、非国有经济单位,则难以全面采用统计报表调查。第三节数据来源与搜集数据的方法(四)重点调查重点调查:是一种非全面调查,它是在调查对象中选择一部分对全局具有决定性作用的重点单位进行调查。适用于调查任务只要求掌握调查总体的基本情况,调查标志比较单一,调查标志表现在数量上集中于少数单位,而这些少数单位的标志值之和在总体中又占绝对优势的情况。5其优点是花费较少人力、物力,在较少时间内及时取得有关的基本情况。第三节数据来源与搜集数据的方法(五)典型调查:非全面的的专门调查典型调查:根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行调查,主要作用是:第一,补充全面调查的不足;第二,在一定条件下可以验证全面调查数据的真实性。其优点是灵活机动、通过少数典型即可取得深入详实的统计资料,缺点是受“有意识地选出若干有代表性”的限制,易受人们主观认识上的影响,必须同其他调查结合起来使用,才能避免出现片面性。第三节数据来源与搜集数据的方法表一各类统计调查方法的特点调查范围调查时间收集资料的方法普查全面一次采访、报告或空间遥感抽样调查非全面经常或一次直接观察或采访统计报表全面或非全面经常报告重点调查非全面经常或一次报告典型调查非全面一次采访第三节数据来源与搜集数据的方法[例题•单选题]抽样调查的主要目的是()A.用样本指标来推算总体指标B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法答案:A[例题•判断题]重点调查和典型调查属于抽样调查的范畴,是非全面调查。答案:×解析:重点调查和典型调查、抽样调查都是非全面调查。第三节数据来源与搜集数据的方法[例题•单选题]某市对占该地交通运输业总产值三分之二的六个运输企业进行调查,这种调查方法叫()。A.普查B.典型调查C.抽样调查D.重点调查答案:D重点调查:是一种非全面调查,它是在调查对象中选择一部分对全局具有决定性作用的重点单位进行调查。本章小结:1.统计分析数据的方法——描述统计与推断统计2.数据的类型——定性变量和定量变量3.数据的类型——观测数据和实验数据4.数据的来源——原始数据和次级数据65.统计调查——普查、抽样调查、统计报表、重点调查、典型调查第二章数据描述主讲人:宋玉峰本部分考点:1.根据数据的类型,选择不同的统计图表对数据进行描述2.使用不同的统计量反映数据的集中趋势、离散程度第一节用图表展示定性数据本节主要介绍定性数据的图表展示方法。定性数据包括分类数据和顺序数据,它们的图表展示方法基本相同。通常可以用频数分布表和图形来描述。一.生成频数分布表定性数据本身是对事物的一种分类,因此,只要先把所有的类别都列出来,然后统计出每一类别的频数,就是一张频数分布表。频数分布表中落在某一特定类别的数据个数称为频数。参考教材P248[例2.1],用Excel生成定性数据频数分布表的途径,用“数据透视表”进行计数和汇总。(最简单的办法)第一节用图表展示定性数据[例题•单选题]在某一特定类别中的数据个数称为()。A.均值B.众数C.标准差D.频数答案:D解析:频数分布表中落在某一特定类别的数据个数称为频数。频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分别情况。第一节用图表展示定性数据二.定性数据的图形表示定性数据(分类数据和顺序数据)可以描绘出它们各类的比例,常用饼图和条形图表示。(一)饼图饼图又称圆饼图、圆形图等,它是利用圆形及圆内扇形面积来表示数值大小的图形