第21章统计与统计数据考情分析本章主要讲述统计学、常用的数据特征测度、统计调查等内容。在数据特征的测度及统计调查方式上容易出题,要重点掌握。最近三年本章考试题型、分值分布年份单项选择题多项选择题合计2013年3题3分2题4分5题7分2012年1题1分1题1分2011年i题2分1题2分本章主要考点1.描述统计和推断统计2.分类数据、顺序数据和数值型数据3.均值和中位数——测度数据的集中趋势4.方差和标准差——测度数据的离散趋势5.数据的来源6.统计调查的分类7.统计调查的方式考点一统计学统计学概念是关于收集、整理、分析数据和从数据中得出结论的科学描述统计研究数据收集、整理和描述的统计学方法,内容包括如何取得所需要的数据,如何用图表或数学方法对数据进行整理和展示,如何描述数据的一般性特征分类推断统计研究如何利用样本数据来推断总体特征的统计学方法,内容包括:(1)参数估计,即利用样本信息推断总体特征;(2)假设检验,即利用样本信息判断对总体的假设是否成立【例1·单选题】研究数据收集、整理和描述的统计学方法是()。A.假设检验B.推断统计C.参数估计D.描述统计【答案】D【解析】本题考查描述统计的概念。考点二变量和数据(一)变量和数据的对应关系变量是研究对象的属性或特征,是相对于常数而言的,可以有两个或更多个可能的取值。数据是对变量进行测量、观测的结果。变量数据分类表现举例分类表现举例数量变量(定量变量)取值是数量企业销售额、注册员工数量数值型数据(定量数据)表现为具体的数值企业年销售额500万分类变量(定性变量)取值表现为类别企业所属行业分类数据(定性数据)表现为类别,一般用文字来表述,也可用数字表示用1表示“男性”,2表示“女性”顺序变量(定性变量)取值表现为类别且具有一定顺序员工受教育水平顺序数据(定性数据)表现为类别,~般用文字表述,也可用数字表示用1表示“硕士及以上”,2表示“本科”,3表示“大专及以下”(二)统计数据的分类和来源1.按其收集方式,统计数据可以分为观测数据和实验数据。2.从使用者的角度看,数据的来源有两种:一是直接数据或一手数据;二是间接数据或二手数据。一手数据的来源主要有两个:一是调查或观察;二是实验。二手数据来源于别人的调查或实验的数据。3.在社会经济领域,统计调查是获取数据的主要方法,也是获得一手数据的重要方式。【例2·单选题】下列统计变量中,属于数量变量的是()。A.企业员工性别B.年末总人口C.员工受教育水平D.企业所属行业【答案】B【解析】本题考查数量变量。选项AD属于分类变量。选项C属于顺序变量。【例3·多选题】按收集方式不同,统计数据可以分为()。A.一手数据B.观测数据C.二手数据D.间接数据E.实验数据【答案】BE【解析】本题考查统计数据的分类。按其收集方式,统计数据可以分为观测数据和实验数据。考点三常用的数据特征测度常用的数据特征测度【例4·单选题】某连锁超市6个分店的职工人数由小到大排序后为57人、58人、58人、60人、63人、70人,其均值为()。A.58B.61C.59D.70【答案】B【解析】本题考查均值的计算。均值=(57+58+58+60+63+70)/6=61(人)。【例5·多选题】数值型数据离散程度的测度指标有()。A.中位数B.平均数C.众数D.标准差E.方差【答案】DE【解析】本题考查数据离散程度的测度。离散程度的测度指标包括标准差和方差。中位数、平均数属于集中趋势的测度指标。考点四统计调查(一)统计调查的分类统计调查的分类依据分类内容按调查对象的全面调查全面统计报表、普查范围不同划分非全面调查非全面统计报表、抽样调查、重点调查、典型调查按调查登记的时间连续调查说明现象的发展过程,目的是为了了解社会现象在一段时期的总量。如工厂的产品生产、原材料的投入等是否连续划分不连续调查为了对总体现象在一定时点上的状态进行研究。如生产设备拥有量、耕地面积等(二)统计调查的方式统计调查的方式调查方式含义内容统计报表是自上而下地统一布置、自下而上地逐级提供基本统计数据的调查方式按调查对象范围的不同可分为全面统计报表和非全面统计报表(目前的大多数统计报表都是全面统计报表)普查为某一特定目的而专门组织的一次性全面调查(1)适合特定目的、特定对象的一种调查方式,主要用于了解处于某一时点状态上的社会经济现象的基本全貌(2)特点:①一次性的或周期性的;②规定统一的标准调查时间,以免数据重复或遗漏;③数据一般比较准确,规范化程度也较高;④普查的使用范围比较窄,只能调查一些最基本及特定的现象抽样调查从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查是应用最广泛的一种调查方式,具有经济性、时效性强、适应面广、准确性高的特点重点调查从所要调查的总体中选择一部分重点单位进行调查,属于非全面调查(1)调查单位不是随机抽取的,调查结果不能推断总体(2)重点单位是指在所要调查的数量特征上占有较大比重的单位典型调查有意识地选择若干具有典型意义的或有代表性的单位进行的调查,属于非全面调查(1)调查单位不是随机抽取的,调查结果不能推断总体(2)主要是一种定性调查研究,其着眼点不在数量特征上【例6·多选题】按照调查登记的时间是否连续,统计调查分为()。A.全面调查B.非全面调查C.连续调查D.不连续调查E.重点调查【答案】CD【解析】本题考查统计调查的种类。按照调查登记的时间是否连续,统计调查分为连续调查和不连续调查。【例7·多选题】抽样调查的特点包括()。A.经济性B.时效性强C.适应面广D.周期性E.准确性高【答案】ABCE【解析】本题考查抽样调查的特点。抽样调查具有以下特点:经济性、时效性强、适应面广、准确性高。第22章抽样调查考情分析本章主要讲述抽样调查的基本概念、几种基本概率抽样方法,估计量和样本量等内容。近三年考题分值有所上升,应该加以重视。最近三年本章考试题型、分值分布年份单项选择题多项选择题合计2013年3题3分1题2分4题5分2012年2题2分2题2分2011年1题1分1题1分本章主要考点1.抽样调查的基本概念2.概率抽样和非概率抽样的分类3.抽样调查的一般步骤4.几种基本概率抽样方法——简单随机抽样、分层抽样、系统抽样、整群抽样、多阶级抽样5.抽样误差的估计6.样本量的影响因素考点一抽样调查的基本概念【说明】以下示例分析研究某公司所有注册在职人员的工资状况,公司总人数为2000人,抽取200人调查。定义示例总体是调查对象的全体公司所有注册在职人员总体单元是组成总体的各个个体每个注册在职人员总体和样本样本是由从总体中按一定原则或程序抽出的部分个体所组成抽取的200个注册在职人员入样单位是每个被抽中进入样本的单位抽取的每一个注册在职人员样本量是样本中包含的入样单位的个数200个续表定义示例抽样框和抽样框是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现公司2000名注册在职人员的人员名册抽样单元抽样单元是构成抽样框的基本要素,可以只包括一个总体单元,也可以包括多个总体单元抽样单元可以是每个注册在职人员,电可以是每个部门总体参数和总体参数是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。常用的形式有总体总量、总体均值、总体比例、总体方差公司所有注册在职人员的平均工资样本统计量样本统计量是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。常用的形式有样本均值、样本比例、样本方差200名注册在职人员的平均工资【例1·单选题】()是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。A.样本B.总体C.抽样框D.抽样单元【答案】C【解析】本题考查抽样框的定义。抽样框是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。【例2·单选题】研究某公司所有注册在职人员的工资状况时,每个注册在职人员就是()。A.总体B.样本C.总体单元D.总体参数【答案】C【解析】本题考查对总体单元的理解。每个注册在职人员就是总体单元。考点二概率抽样和非概率抽样(一)概率抽样概率抽样具有以下特点:①按一定的概率以随机原则抽取样本;②总体中每个单元被抽中的概率是已知的,或者是可以计算出来的;③当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率。所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查单元的情况,使每个单元都有一定的机会被抽中。(二)非概率抽样非概率抽样方法含义判断抽样在抽取样本时,调查人员依据调查目的和对调查对象情况的了解,人为确定样本单元方便抽样在抽取样本时,依据方便原则,以达到最大限度降低调查成本的目的(比如“拦截式”调查)自愿样本不是经过抽取,而是由自愿接受调查的单元所组成的样本(比较典型的是网上调查)配额抽样将总体中的各单元按一定标准划分为若干类型,将样本数额分配到各类型中.从各类型中抽取样本的方法则没有严格限制,一般采用方便抽样的方法抽取样本单元【例3·单选题】以下不属于概率抽样特点的一项是()。A.按一定的概率以随机原则抽取样本B.总体中每个单元被抽中的概率是已知的,或者是可以计算出来的C.当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率D.抽取样本并不是依据随机原则【答案】D【解析】本题考查概率抽样的特点。概率抽样是以随机抽取为原则的,选项D不属于其特点。【例4·单选题】在抽取样本时,调查人员依据调查目的和对调查对象情况的了解,主观人为确定样本单元的方法称为()。A.判断抽样B.方便抽样C.等距抽样D.分层抽样【答案】A【解析】本题考查判断抽样的含义。考点三抽样调查的一般步骤和误差(一)抽样调查的一般步骤一般而言,一个完整的抽样调查过程需要以下几个步骤:确定调查问题一调查方案设计一实施调查过程一数据处理分析一撰写调查报告。(二)抽样调查的误差抽样调杳的误差概念产生原因是由于抽样的随机性造成的,用样本统计量估计总体参数时抽到哪一个样本完全是随机的,而抽到不同的样本,对总体的估计就会不同,这就是抽样误差产生抽样误差出现的误差的根本原因非抽样误差除抽样误差以外,由其他原因引起的样本统计量与总体真值之间的差异非抽样误差产生的原因,主要有几种:(1)抽样框误差(2)无回答误差(3)计量误差【例5·多选题】非抽样误差产生的原因,主要有()。A.抽样框误差B.无回答误差C.计量误差D.参数误差E.系统误差【答案】ABC【解析】本题考查非抽样误差。非抽样误差产生的原因,主要有抽样框误差、无回答误差、计量误差。考点四概率抽样方法概率抽样方法含义优缺点适用条件简单随机抽样是最基本的随机抽样方法,分为不放回简单随机抽样和有放回简单随机抽样两种方法(1)优点:操作简单,且每个单位的人样概率相同,样本估计量形式也比较简单(2)缺点:没有利用抽样框中更多的辅助信息.用样本统计量估计总体参数的效率受到影响。在简单随机抽样条件下,样本的分布可能十分分散,增加了凋查过程中的费用和时间(1)抽样框中没有更多可以利用的辅助信息(2)调查对象分布的范围不广阔(3)个体之间的差异不是很大分层抽样指先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机地抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样特点:(1)不仅可以估计总体参数,同时也可以估计各层的参数(2)便于抽样工作的组织(3)每层都要抽取一定的样本单位,这样样本在总体中分布比较均匀,可以降低抽样误差(1)抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中(2)实现在同一层内,各单位之间的差异尽可能地小,不同层之间各单位的差异尽可能地大续表方法含义优缺点适用条件系统抽样指先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。最简单的系统抽样是等距抽样(1)优点:①操作简便。因为它只需要随机确定起始单位,整个样本就自然确定了;②对抽样框的要求也比较简单,它只要求总体单位按一定顺序排列,而不一定是一份具体的名录清单(2)缺点:方差估计