10090《统计学》2013年6月期末考试指导一、考试说明统计学原理课程主要介绍统计学的基本思想及常用的概念、方法等,目前在于使大家掌握统计学工具,并能够良好地运用于工作和学习之中。统计学研究的内容实际上就是人们处理数据的全过程,简单地说,包括数据采集、数据整理与描述、数据推断。数据采集讨论如何通过实践获得全面、系统、准确、廉价的原始数据;数据整理与描述讨论如何用简捷和有效的方法去传递和展示数据,以便使人们准确地把握数据的核心内容;数据推断是利用概率论的原理,讨论如何从一组样本数据中,推断总体的行为。统计学原理课程主要介绍统计学的基本思想及常用的概念、方法等,目前在于使学生掌握统计学工具,并能够良好地运用于工作和学习之中。本课程闭卷考试,满分100分,考试时间90分钟。考试试题包括以下三种题型:(一)名词解释(每题4分,共20分)要求准确给出相关名词的正确解释,但不必拘泥于课本,只要能够正确理解即可。(二)简答题(每题6分,共24分)回答要点,并作简要分析,要点要求完整、有序、明确,分析力求准确。(三)计算题(共56分)准确写出计算公式,注意相关计算结果。二、重点复习内容第一章绪论本章没有教学难点,主要目的是解释统计学的基本思维方式与学习方法。第二章统计调查一.统计指标:描述总体特征的名称1.总体与单位客观存在的,在同一性质基础上结合起来的许多个别事物的整体,称为统计总体,简称总体。构成统计总体的个别事物,称为总体单位,简称单位,或称个体。2.总体的特征(1)同质性。统计总体中的单位必须具有某方面的相同属性,这一相同属性使总体内的单位可以区别于非总体的单位。(2)大量性。虽然一个单位也可以构成一个总体,但统计工作中研究的总体往往是由大量的单位构成的。(3)差异性。在具有相同属性的基础上,总体中的各个单位还应当是存在差异性的,必然存在某些方法,可以将总体中的单位进行个体识别。3.统计尺度1)列名尺度:是指对事物仅做平等的分组或分类,而不提供更多的描述。2)顺序尺度:是指除提供名称描述外,还可对事物进行排序。3)间隔尺度:指能够提供两个测度之间的数量间隔。4)比率尺度:是指在两个测度之间,可以比较其比例关系。24.统计指标六要素1)指标名称:指描述指标的文字。2)计量单位:指标的计量尺度。3)计算方法:计算方法指在对总体进行测度时所使用的方法和注意事项。4)时间限制:该指标描述的对象在时间上的范围。5)空间限制:该指标所描述的对象在空间上的范围。6)指标数值:指标的最终计算结果,以数字形式表现。二.统计调查的分类1.按范围分类:全面调查、非全面调查全面调查是指对总体的全部单位均进行调查,也称为普查。全面调查由于是对全部单位进行的调查,因此不会出现以偏概全的误差。非全面调查是指仅对总体中的一部分单位进行调查,由这一部分单位的情况来反映总体的情况。非全面调查主要包括三种方式:1)重点调查。对总体中影响全局的主要单位进行调查,而对不影响全局的单位不进行调查。重点调查关注的是宏观现象,对于微观主体的状况不进行深入研究。2)典型调查。对总体中具有代表性的单位进行调查。典型调查的主要着眼点在于对各类具体单位的微观分析,而不关注整体的宏观情况。3)抽样调查。2.按方法分类:观察法、采访法、报告法、问卷调查法(1)观察法:观察法是指调查人员不直接与受访者进行接触,而是通过旁观的方法获得对受访者情况的了解。(2)采访法:采访法是指调查人员根据访问提纲,与受访者进行交谈,由此获得对受访者情况的了解。(3)报告法:报告法是指由受访者填写有关报告表格,向调查人员报告自身情况。(4)问卷调查法:问卷调查法是指调查人员利用格式化的调查问卷,向受访者进行询问。三.抽样调查1.概率抽样:指总体中的单位以确定的概率进入样本。包括以下几种类型:1)简单随机抽样:也称纯随机抽样,指对总体不进行任何处理的情况下,所进行的等概率抽样。所有的总体单位以一个相同的非零概率进入样本。2)分层抽样:将总体按主要标志划分为若干个层,再在每一层中进行随机抽选。3)等距抽样:将总体按某一标志进行排列后,按相同的间隔进行抽选。又称为机械抽样,系统抽样。4)整群抽样:将总体全部单位分成若干个部分,随机抽选一部分单位,对选中的单位进行全面调查。5)多阶段抽样:把整个抽样过程分为若干个阶段,逐级抽出受访者。2.非概率抽样,指单位进入样本的概率事先是未知的。非概率抽样一般是作为概率抽样的一种近似方法而进行的。包括以下类型:1)便利抽样:根据方便为原则进行抽选。2)判断抽样:由访问员人为判断受访者的身份,确定是否选择作为样本。3)配额抽样:根据一定的身份配额抽选受访者进行调查。4)滚雪球抽样:是一种针对稀疏总体进行的抽样方法,抽选时,先找到几个符合3条件的受访者,然后通过这些受访者找到更多符合条件的受访者,逐步外推,直至达到要求的样本数。四.调查误差的构成1.抽样误差抽样误差是指在抽样调查中,由于使用样本信息推断总体情况,而可能出现的误差。2.非抽样误差非抽样误差指不是由于样本的代表性,而是由于调查过程的各种其他因素而带来的误差。非抽样误差包括下列三种类型:抽样框误差:抽样框误差主要是指抽样框与实际的抽样总体存在差异而造成的误差。无回答误差:所谓无回答误差是指未能从指定的样本处获得有效的回答。计量误差:计量误差是指在对个体进行调查时,调查结果与个体的真实情况出现的差异。第三章描述统计一.数据分组1.分组标志一批数据可以按不同的标志进行分组,选择分组标志要根据研究目的进行。2.组数按同一标志,可以将数据分成不同数量的组。3.组距组距是指每个组的范围跨度。4.组限组限指组与组之间的界限。5.组中值(组中值的计算)组中值是一个组中处于中间位置的值,往往用以代表一个组的平均状况。2上限+下限组中值=对于缺上限或者缺下限的组,组中值的计算有几种不同的情况(1)根据邻近组组距推算邻近组组距-缺下限组组中值=上限21邻近组组距+缺上限组组中值=下限21(2)对于缺下限组而言,当邻近组组距过大时,使用上限的一半计算。(3)根据现实情况人为确定。二.次数分配次数分配是指观察值按分组标志分配在各组内的记录数。各组中观察值的数量称为次数,也称频数。各组次数与总次数的比例,称为频率。四.总量指标和相对指标总量指标是反映社会经济现象总体规模或水平的指标,又称为绝对数。相对指标是两个有联系的总量指标对比计算的比率,又称为相对数。根据相比较的总量指标之间的关系不同,相对指标可以划分为若干种类型:(1)结构相对指标4总体的整体总体的某一部分结构相对指标=(2)比例相对指标总体的乙部分总体的甲部分比例相对指标=(3)强度相对指标总体的乙方面总体的甲方面强度相对指标=(4)比较相对指标乙总体甲总体比较相对指标=(5)动态相对指标总体的乙时期指标总体的甲时期指标动态相对指标=五.描述总量指标和相对指标的一些常用术语1.静态比较与动态比较将同一时期的统计指标放在一起进行比较,称为静态比较。将不同时期的统计指标放在一起进行比较,称为动态比较。2.基期与报告期,定基比较与环比比较在进行动态比较时,有时会用当前的数据与过去某一时间的数据进行对比。此时,将当前的数据称为报告期数据,将用于比较的过去的数据称为基期数据。如果观察的是若干个时期的数据,每个时期的数据均与同一个基期数据进行对比,则这种比较方法,称为定基比较。如果在观察若干个时期的数据时,每一数据均与前一时期进行对比,则这种比较方法称为环比比较。六.平均指标平均指标指同类社会经济现象在一定时间、地点条件下所达到的一般水平。1.算术平均数(要求会计算)算术平均数也称均值,是所有数的总和与数量之商。用公式表示为:nxxi2.调和平均数调和平均数是根据标志值的倒数计算出来的平均指标,其意义与算术平均数一致。公式为:iiixMMH3.几何平均数5几何平均数是在数列具有连乘积特征的情况下所计算的平均数。计算公式为:nixG4.众数众数是一组数据中出现次数最多的变量值。众数的计算公式如下:iLMo211其中:L表示众数组的下限;1表示众数组与前一组的次数之差;2表示众数组与后一组的次数之差;i表示众数组的组距。5.中位数中位数是位于统计数列中间位置上的数。中位数的位置计算公式为21N6.分位数分位数是指将一列数据K等分的各种数。7.截尾均值截尾均值是指在一个数列中,去掉两端的极端值后所计算的算术平均数,也称为切尾均值。七.离散程度指标1.极差极差是数据的最大值与最小值之差,用公式表示如下:MinMaxR。2.内距内距也称四分位差,是指第三四分位数与第一四分位数之差,用公式表示如下:13QQIRQ。3.平均绝对差平均绝对差是指各个标志值对其算术平均数的平均离差。nxxDA..4.方差和标准差(要求会计算)平均绝对差使用绝对值来消除离差的正负号,在数学处理中,具有一些不方便之处。方差是使用求平方的方式来消除正负号,便于数学处理。方差的计算公式为:22xxi6方差的平均根称为标准差:2xxi5.离散系数标准差相对于平均数的大小,称为离散系数。xV八.探索性数据分析是从复杂的数据中分离出数据的基本模式和特点,让分析者发现其中的规律,以便选择分析方法。对于在探索性数据分析中发现的数据规律,分析者需要使用特定的统计模型进行证实分析,以确定规律是否正确。探索性数据分析有四大主题,分别是:1)耐抗性:所谓耐抗性,是指分析方法对于数据局部不良行为的非敏感性。2)残差:残差是指从数据中减去一个总括统计量或拟合模型后的残余部分。当残差出现异常时,数据中往往有值得注意的系统性问题。3)重新表达:重新表达是指找到一个新的尺度对数据进行重新描述,以便简化分析。4)图示:图示是以图形的方法描述数据,以帮助分析者看出数据、拟合、残差等行为,从而抓住想象不到的特点和常见的一贯行为。九.对于分组数列的情况,中位数的计算公式为:ifSNLMemm12其中:L表示中位数组的下限;N表示总体单位数;1mS表示中位数所在组之前的累积次数;mf表示中位数组的次数。第四章统计指数一.概念:指数是反映某一时期某一社会经济现象变动情况的指标。二.指数的计算原理1.个体指数的计算个体指数的计算就是用两个时期的同一指标进行直接对比。2.总指数的计算总指数是指涉及到若干个同类指标的指数。例如某一时期的商品价格指数,涉及到同一市场上的许多种商品,此时就涉及到多个指标的合并问题。三.综合指数计算思路(重点)1.拉氏指数:拉斯配雷斯提出使用基期变量作为同度量因素计算出来的指数,称为拉氏指数。0001qpqpK2.帕氏指数:帕许提出使用报告期变量作为同度量因素计算出来的指数,称为帕氏指数。71011qpqpK四.总平均数指数因素分析1.概念平均指标在不同的时间或者不同空间上对比形成的相对数,称为总平均数指数,也称为可变构成指数。2.结构变化影响指数由于构成总体的个体数量比例发生变化,对总平均数产生的影响,称为结构变化影响指数。3.固定构成指数指在构成不变的情况下,由于个体的平均水平发生变化,而对总平均数产生的影响。第五章时间数列一.时间序列的构成与表现形式同类社会经济现象的统计资料,按时间先后顺序的排列,称为时间数列。时间序列的一般表现形式如下:ICSTfYt,,,其中各个分项的含义分别为:1)T:长期趋势,指社会经济现象在较长的一段时间内所表现出来的稳定的趋势性。2)S:季节变动,社会经济现象表现出来的与日历周期同步的周期性。3)C:循环变动,循环变动也是一种周期性的变动,不过这种周期无法直接用日历周期来进行解释。4)I:不规则变动,由各种无法解释的因素而引起的经济波动,一般不表现出明显的规律性。二.趋势变动的测定(简答题只需答出要点)1.修匀方法修匀方法是指从数列本身出发,通过平均的方法,消除数列的短期波动,使数列表现出稳定的趋势性。修匀方法包括两类1)时距扩大法2)移动平均法移动平均法是将时距扩大法进行了一个平移,从序列顶端向下,选择