统计学笔记(精修版)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计学笔记1绪论第一节统计学的含义和作用一、什么是统计学1.统计学的含义统计学是有效收集、处理、分析和解释数据,发现规律,以便更好决策的一门方法论学科。2.分析数据的方法有描述统计、推断统计。⑴描述统计①描述统计是将所收集的数据处理后,用数值、表格或图形形式表现的有用信息。②描述统计是基础,它为推断统计、统计咨询、统计决策提供必要⑵推断统计就是根据样本数据特征去估计或检验总体的数据特征。二、统计学的作用和重要性1.统计学的作用人们用数据发现的规律做出更好的决策。2.要发现规律,对统计数据通常有要求:客观性、适用性、准确性和及时性。三、统计学是如何解决实际问题的?统计学解决实际问题的基本思路是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法处理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量知识作出总体特征的合理推断;⑥根据推断给出更好决策的建议;不解决问题时,重复第②-⑥步。第二节统计学的基本概念一、总体、单位和样本1.总体统计总体是根据一定目的确定的,由客观存在的、具有某种同质性的许多个别事物构成的整体。⑴同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。⑵统计总体还应具备大量性,即统计总体应应该由足够数量的同质性单位构成。2.总体单位(简称单位)是组成总体的各个个体。如典型案例1中英军的每架战机;事例4中的每个居民。3.由总体的部分单位组成的集合称为样本(又称子样)。构成样本的单位称为样品,样本中样品的数目称为样本容量。4.统计学解决问题的目的是认识总体的数据特征。但是,当调查是破坏性的,或者出于成本、时间等因素考虑时,不必要或不可能对构成总体的所有单位都进行调查。统计学笔记2二、标志、指标(参数)和统计量1.标志:(1)总体单位普遍具有的属性或特征称为标志。(2)标志按其表现分为品质标志和数量标志两种。①品质标志表明单位属性方面的特征,品质标志的表现只能用非数值来描述.(如:典型案例1中英军战机的类型,事例4中每个居民的性别。)②数量标志表明单位数量方面的特征,其表现用数值来描述(如:典型案例1中英军战机的弹孔位置,事例4中每个居民的收入。)2.参数(标志)⑴统计总体具有的数量特征的概念和数值称为统计指标,也称为参数。⑵统计指标由两项基本要素构成,即指标的概念和指标的取值。(指标的概念是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。)(例如事例4中居民人口数100万人,总收入31.4亿元。)⑶统计指标按表示形式可以分为数量指标和质量指标.①凡是反映现象总规模、总水平的统计指标称为数量指标,用绝对数来表示。例如事例4中居民总数100万人、总收入31.4亿元等,②凡是反映现象相对水平和工作质量的统计指标称为质量指标,用相对数或平均数来表示.例如企业职工平均工资5000元、工人出勤率93%等。质量指标是总量指标的派生指标,以反映现象之间的内在联系和对比关系。⑷单个指标不能反映总体的全貌,这便需要设立指标体系。统计指标体系是由一系列相互联系的统计指标组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。3.统计量⑴统计量是样本观测量的一个已知函数,用来说明样本的特征。是样本观测量的一个已知函数,用来说明样本的特征。⑵抽取的样本不同,统计量的观测值也就不同。如样本平均数、样本方差、样本比例是统计量,抽取样本后,人们通常用与总体参数对应的统计量观测值,作为总体参数的估计.(如某汽车制造企业从生产的一批轿车中抽取了16辆轿车,用这些轿车的平均行驶里程值、合格率值分别作为该批轿车平均行驶里程、合格率的估计。)三、数据(一)变量与变量值1.即说明现象的某一事实或数量的特征称为变量,将上述标志、指标和统计量的名称进行归纳就是变量。2.变量的具体表现是变量值,数据就是变量及其表现,也可称为反映客观事物的事实或数量依据。如:收入是一个变量,收入的表现是变量值。3.将在特定研究过程中收集的所有数据集合在一起,称为数据集。4.根据变量值的确定与否,变量分为确定性变量(受确定性因素影响,因素是明确的,可解释,可控制的)与随机变量(受许多不确定因素影响,如员工的起床时间)。(二)数据的计量尺度收集数据时需要用到以下四种由低到高的计量尺度:定类尺度、定序尺度、定距尺度和定比尺度,计量尺度的不同决定了不同的数据分析与处理方法。1.定类尺度是说明客观现象无序类别的计量。定类尺度的主要数学特征是“=”或“≠”.如居民的性别是男、女计量,战机的类型是战斗机、轰炸机、侦察机等计量,这一场合的所使用的数值只作为无序分类的代码。统计学笔记32.定序尺度是说明客观现象有序类别的非数值计量。定序尺度的主要数学特征是“”或“”.例如,对居民的满意度计量可以分为非常满意、满意、一般、不满意、非常不满意五类。这一场合的所使用的数值只作为有序分类的代码。3.定距尺度是说明客观现象数值间距有意义的计量。其用确切的数值反映现象之间在量方面的差异,定距尺度的主要数学特征是“+”“–”。如总量指标是定距尺度计量的。(0不代表不存在)4.定比尺度是说明客观现象两个数值比有意义的计量。定比尺度的主要数学特征是“x”“/”如质量指标中的相对数、平均数是定比尺度计量的(0代表不存在)5数据分类⑴定类尺度,定序尺度的数据统称为定性数据。定性变量是指带有定性数据的变量。⑵定距尺度,定比尺度的数据统称为为定量数据。定量变量是指带有定量数据的变量。根据定量变量值连续出现与否,定量变量分为连续性变量与离散型变量。①连续型变量是指变量在某一区域内的取值是连续不断的,无法一一列举。如:军机的弹孔位置,产品的寿命等。②离散型变量是指变量的取值是间断的,可以一一列举。例如,产品数等。(三)数据的类型根据对客观现象观察的角度不同,统计数据可分为:横截面数据、时间序列数据和面板数据。1.横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位进行观察而获得的数据。例如,2014年全国各省、市、自治区的居民收入总值就属于横截面数据。2.时间序列数据又称为动态数据,它是指在某一段时期内按时间顺序对同一总体进行观察而获得的数据。例如,“十二五”期间我国按年份顺序的居民收入总值就属于时间序列数据3.面板数据则是同时在时间和截面空间上取得的二维数据。例如2005-2014年30个企业的总产值数据。面板数据则由30个企业10年的数据组成,共有300个观测值。从某一年份看,它是由30个企业总产值数第二章收集数据第一节统计调查方案设计调查方案设计是指导整个调查过程的纲领性文件,其主要内容主要包括以下几个方面:一、确定调查目的1.调查要达到的具体目标2.回答“为什么调查?”3.调查之前必须明确二、确定调查对象和调查单位1.调查对象:调查研究的总体或调查范围2.调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)3.回答“向谁调查?三、选择合适的调查方式、调查方法1.调查方式是指调查的组织方式,主要有:普查、抽样调查、典型调查、重点调查和统计报表制度2.调查方法是指收集统计资料的方法,主要有:问卷法、访谈法、观察法和实验法统计学笔记4四、设计调查项目和调查表1.调查项目:调查的具体内容2.调查表:表现调查项目的表格或问卷。有单一表和一览表两种形式。3.回答“调查什么?”五、确定调查时间统计调查时间包括两种涵义:调查时间和调查期限1.调查时间:调查资料的所属时间(时期或时点)。2.调查期限:进行调查工作的时间,包括搜集资料和报送资料的整个工作所需要的时间六、调查报告的撰写调查报告的撰写包括:调查过程的描述、依据调查数据所做的决策、对调查结果的评价【在调查方案中,应给出:提交调查报告的具体时间,并对调查的精度、费用等提出具体要求】七、制订调查工作的组织实施计划第二节数据收集来源一、数据收集的来源1.原始数据:必须要求调研者亲自收集2.二手数据:调研者需要识别和评估二手数据的有效性二、二手数据的收集1.二手数据的来源⑴内部二手数据⑵外部二手数据2.二手数据收集的特点优点:快捷、成本低、易获取缺点:相关性差、时效性差、可靠性低四、二手数据收集的注意事项二手数据的评估主要包括:1.研究目的的评估——调研的目的是什么2.二手数据来源评估——谁收集了这些资料3.研究内容评估——收集了一些什么样的资料4.调查方式、方法评估——这些资料如何获得的5.二手数据相关性评估——这些资料与其他资料的一致程度如何6.二手数据时效性评估——这些资料是何时收集的第三节原始数据的收集一、数据收集的分类1.按数据收集的组织方式不同,分为统计报表和专门调查统计报表:按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级填报的一种调查组织方式。专门调查:为了某一特定目的或专门问题而专门组织的调查2.按数据收集对象包括范围的大小不同,分为全面调查和非全面调查全面调查:对构成调查对象中的所有党委进行一一不漏的调查非全面调查:是在统计调查过程中,仅对调查中的一部分单位进行调查。包括:抽样调查、统计学笔记5重点调查、典型调查和非全面统计报表3.按数据收集的登记时间是否连续,分为经常性调查和一次性调查经常性调查:又称连续性调查,它是为了观察社会经济现象在一定时期内的数量变化所进行的调查登记或数据收集一次性调查:又称不连续性调查,它是对所研究的社会经济现象间隔一段时间所进行的调查登记或数据收集4.按数据收集实施主体的不同,分为政府统计调查和民间统计调查二、数据收集的调查方式数据收集的调查方式,按照组织方式主要有:普查、抽样调查、典型调查、重点调查和统计报表制度1.普查:专门组织的一次性全面调查普查的特点:⑴通常是一次性调查,周期性强⑵全面性调查,收集的资料全面、系统、准确⑶普查的点多面广,工作量大,投入多普查应遵循以下原则:⑴时间统一性原则⑵登记工作的规范性原则⑶普查项目统一规定原则⑷同类普查同周期性原则2.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本数据推断总体数量特征的一种非全面调查。⑴概率抽样:根据随机原则从总体中抽选样本,并根据样本信息对总体的某些特征做出估计推断,对推断可能出现的误差可以从概率意义上加以控制非概率抽样:调查组根据自己的方便或主观判断抽取样本的方法⑵抽样调查优势:经济性、时效性、准确性⑶几种具体的抽样方式:①简单随机抽样——是指从总体N个单位中随机抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。②分层抽样——主要特征分层按比例抽样,主要使用于总体中的个体有明显差异。共同点:每个个体被抽到的概率都相等N/M。③整群抽样——是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。【应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小】④等距抽样——首先将总体各单位按一定顺序排列,更具样本容量大小确定抽选间隔,然后随机抽取一个进入样本,直到满足要求为止的一种抽样方式⑤多阶段抽样——是指将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将各种抽样方法结合使用,其在大型流行病学调查中常用。第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本3.典型调查:从调查对象的全部单位中选择少数典型单位进行调查。目的是描述和揭示事物的本质特征和规律。调查结果不能用于推断总体统计学笔记64.重点调查:从调查对象的全部单位中选择少数重点单位进行调查。调查结果不能用于推断总体5.统计报表制度:按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级填报的一种调查组织方式。统计报表内容:报表目录、报表表式、填表说明统计报表的资料来源:原始记录、统计台账、企业内部

1 / 47
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功