统计学原理复习重点概述本课程主要包括三部分知识。第一部分统计基础知识第一章和第二章数据收集部分。第二部分描述统计第二章统计数据整理部分(表格与图形法)、第三章数据分布特征的描述(静态数据描述法)和动态数据描述法,即第六章时间数列分析和第八章统计指数。第三部分推断统计第四章抽样估计和第五章假设检验与方差分析。第一章绪论。本章介绍统计学及相关概念,勾勒了本课程的框架结构——描述统计学和推断统计学。是统计的三层含义,总体、样本及指标等概念。统计的三层含义及相互关系统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释和推断的科学。(一)统计工作(统计的基本含义)即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作活动的总称。(二)统计资料是统计工作的成果,包括各种统计报表、统计图形及文字资料等。(三)统计学是一门收集、整理、描述、显示和分析统计数据的方法论的科学,其目的是探索事物的内在数量规律性,以达到对客观事物的科学认识。(四)三者关系统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践。统计工作和统计数据是工作和工作成果关系。统计实践活动的产生与发展三个主要的统计学派1、政治算术学派代表人物:英国的威廉·配第(1623-1687)、约翰·格朗特(1620-1674)等。威廉·配第的代表著《政治算术》对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。可以说,威廉·配第是统计学的创始人。2、记述学派(国势学派〕代表人物:德国的康令(1606-1681)阿亨瓦尔(1719-1772;1764年首创统计学一词)他们在大学中开设“国势学”课程,采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。3、数理统计学派代表人物:比利时的凯特勒(1796-1874)他把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人。代表著作:社会物理学有的教材分类古典统计学时期(17世纪中后期~18世纪中后期)1.政治算术学派:代表人物威廉·配第(政治经济学之父),首次运用数量对比分析法,又称“有名无实”的统计学。2.记述学派/国势学派:“统计学是研究一国或多国的显著事项之学”,以文字描述为主,又称“有实无名”的统计学。3.图表学派:用统计图和统计表表现和保存统计资料。近代统计学时期(18世纪末~19世纪末)1.数理统计学派:创始人阿道夫·凯特勒,第一次将概率论引入社会经济现象的研究中,被誉为“近代统计学之父”。2.社会统计学派:代表人物恩格尔,采用大量观察法研究社会经济现象总体。现代统计学时期(20世纪初至今)1.主要成果:在随机抽样基础上建立了推断统计学。2.数理统计学的发展特点与趋势(1)数学方法的广泛应用。(2)边缘统计学的形成。(3)借助计算机手段,统计学的应用日益广泛和深入。统计学的分类从统计方法的构成角度分:1、描述统计学(descriptivestatistics)研究如何取得、整理和表现数据资料,进而通过综合、概括与分析反映客观现象的数量特征。包括数据的收集与整理、数据的显示方法、数据分布特征的描述与分析方法等。2、推断统计学(inferentialstatistics)研究如何根据样本数据去推断总体数量特征的方法。包括抽样估计、假设检验、方差分析及相关和回归分析等。描述统计学和推断统计学的关系描述统计学是统计学的基础和统计研究工作的前提,推断统计学则是现代统计学的核心和统计工作的关键。从统计方法的研究和应用角度分:1、理论统计学(theoreticalstatistics)利用数学原理研究统计学的一般理论和方法的统计学,如概率论与数理统计2、应用统计学(appliedstatistics)*研究如何应用统计方法解决实际问题,大多是以数理统计为基础形成的边缘学科。如自然科学领域的生物统计学、社会科学领域的社会经济统计学等。统计学与其他学科的关系(一)统计学与数学的关系1、区别(1)研究对象不同:数学研究抽象的量,统计研究具体的量。(2)研究方法不同:数学是演绎,统计是归纳和演绎的结合。2.、联系数学为统计研究提供数学公式、模型和分析方法。(二、)统计学与其他学科的关系统计几乎与所有学科都有联系。统计方法可以帮助其他学科探索学科内的数量规律性,但对这种数量规律性的解释与进一步的研究,只能由各学科自已的研究完成。统计的研究对象、特点、作用统计的研究对象、特点:社会经济统计,也可称为经济统计,其研究对象是社会经济现象总体的数量规律,即通过对(社会)经济现象的规模、水平、结构、比例和速度等数量关系的调查研究,说明国民经济和社会发展在一定时间、地点、条件下的数量表现及变化规律,其中涉及到数量的多少、现象间的数量关系以及质量互变的数量界限等。社会经济统计学研究的就是在一定的质的规定下具体的不是抽象的数量表现与变化规律。社会经济统计的特点:1、数量性:统计研究对象是客观事物的数量方面。2、总体性:社会经济统计认识社会经济现象时,主要是研究社会经济现象的总体数量规律,即通过大量的观察,获得足够多的统计资料,说明、认知总体现象的变化情况及规律。3、具体性:社会经济统计的研究对象是具体事物的数量,不是抽象的量。它与数学研究的数量是不尽相同的。4、社会性:社会经济统计认识的对象是社会经济现象,它包括人类经济社会活动的各种条件(自然条件、社会条件)、人类各种活动的过程与结果(生产活动、交换活动、分配活动、消费活动等)。统计的职能:信息职能、咨询职能、监督职能。统计研究的基本环节统计设计收集数据整理与分析资料积累开发应用统计学理论与相关实质性学科理论描述统计推断统计统计调查、实验统计学中几个基本概念统计总体和总体单位总体即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体。例如:要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体。特点:同质性是确定总体的前提和基础。它是根据统计的研究目的而定的。研究目的不同,则所确定的总体也不同,其同质性的意义也随之变化。例如,研究城镇居民贫困户的生活状况,那么,贫困线下的城镇居民户则构成了统计总体,贫困线下的城镇居民户是同质的,而贫困线上的城镇居民户是非同质的。大量性统计总体应该由足够数量的同质性单位构成。实现统计研究目的的必要条件差异性构成总体的各个同质性单位的特征存在着差异。它是统计研究的前提和内容。总体单位(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。总体和单位的概念是相对而言的,随研究目的不同,总体范围不同而变化。同一研究对象,在一种情况下为总体,但在另一情况下又可能变成单位。根据总体所包含的单位数量,总体可以分为有限总体和无限总体两类。有限总体是由有限量的单位构成的总体。当总体单位数难以确定,其数量可能是无限时,便构成无限总体。样本由总体的部分单位组成的集合称为样本(又称子样)。当总体单位数量很多甚至无限时,不必要或不可能对构成总体的所有单位都进行调查。这时,需要采用一定的方式,从由作为研究对象的事物全体构成的总体(又称全及总体、母体)中,抽取一部分单位,作为总体的代表加以研究。样本也由一定数量的单位构成的,符合总体的概念;由样本单位组成的总体称为抽样总体,样本所包含的总体单位数称为样本容量。标志和变量总体各单位普遍具有的属性或特征称为标志。标志分类:品质标志:品质属性方面的特征,只能用文字、符号或数字代码来表现。数量标志:数量方面的特征,用数值来表现。不变标志:一个总体中各单位某标志的具体表现都相同,称之为不变标志。不变标志是总体同质性的基础。一个总体至少要有一个不变标志,才能够使各单位结合成一个总体。变异标志:亦称可变标志,在一个总体中,当一个标志在各单位的具体表现有可能不同时,这个标志便称为可变标志。作为总体,同时必须存在变异标志,这表示所研究的现象在各单位之间存在着差异,才需要进行统计研究。标志标志性别性别年龄年龄民族民族宗教信仰宗教信仰政治倾向政治倾向身高身高体重体重男汉族佛教无党派43岁182cm75公斤标志值标志值品质标志文字表述数量标志数据表述总体单总体单位标志位标志不变标志决定不变标志决定总体的同质性总体的同质性变异标志决定变异标志决定总体的差异性总体的差异性品质标志数量标志(变量)(变量)标志和变量不变标志(标志表现无差别)(标志表现无差别)变异标志(标志表现有差(标志表现有差别)别)统计指标统计指标是反映统计总体数量特征的概念和数值。如2002年我国国内生产总值104790.6亿元。–统计指标由两项基本要素构成,即指标的概念(名称)和指标的取值。–指标的概念(名称)是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。确定统计指标必须有一定的理论依据,使之与社会经济或科学技术的范畴相吻合。同时,又必须对理论范畴和计算口径加以具体化。–指标的数值反映所研究现象在具体时间、地点、条件下的规模和水平。在观察指标数值时,必须了解其具体的时间状态、空间范围、计量单位、计量方法等限定,同时注意由于上述条件的变化而引起数值的可比性问题。特性:数量性、具体性、综合性指标与标志的关系–标志反映总体单位的属性和特征,而指标则反映总体的数量特征。标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。–总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。例如,所要研究的是全国工业企业的情况,则各企业的职工人数、固定资产、工业增加值等都是总体单位(即各个企业)的标志,如果研究目的变成研究某一企业的职工状况,则该企业变成一个总体,企业职工人数变成了统计指标,每个职工的文化程度、技术等级、性别等就成为标志。统计指标总量指标(单一计量单位)总量指标(单一计量单位)数量指标数量指标按表现形式分类按内容特征分类按时间特征分类时期指标(一段时期累计总量及据此计算的相对、平均指标)时点指标(瞬间的总量及据此计算的相对、平均指标)按计量单位分类劳动指标劳动指标(工、台时等)(工、台时等)价值指标价值指标(元、美元等)(元、美元等)相对指标(无计量单位)相对指标(无计量单位)平均指标(双重计量单位)平均指标(双重计量单位)质量指标质量指标统计指标的基本分类统计指标的基本分类实物指标实物指标(吨、台等)(吨、台等)存在确定的数量关系:产量×价格=产值存在某种共同性:产销比率、盈利水平、劳动效率、偿债能力统计指标体系统计指标体系统计指标体系具有某种内在联系的一系列统计指标所构成的整体统计数据(一)变量与变量值说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变量值,统计数据就是统计变量的具体表现。例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。为了区别,在本书中,凡是变量均用大写的英文字母表示,而变量值则用小写英文字母表示。连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,气象上的温度、湿度,零件的尺寸等。离散型变量是指变量的其取值是整数值,可以一一列举。例如,企业数,职工人数等。确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量。变量的取值无法事先确定。社会经济现象既有确定性变量也有随机变量。统计学所研究的主要是随机变量。(二)数据的计量尺度统计数据是总体单位标志或统计指标的具体数量表现。根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。(三)数据的类型横截面数据又称为静