中级经济基础知识基础精讲班第四部分统计包括五章:第21章统计与统计数据第22章抽样调查第23章相关与回归分析第24章时间序列第25章统计指数近五年的分值均为21分(包括11题单选11分,5题多选10分)第二十一章统计与统计数据本章基本内容框架统1.统计学计2.变量和数据均值和中位数—测度数据的集中趋势与3.常用的数据特征测度方差和标准差—测度数据的离散趋势统观测数据和实验数据计4.数据的来源一手数据和二手数据数统计调查的概念与分类据5.统计调查统计调查的方式年份单项选择题多项选择题合计2013年3题3分2题4分5题7分一、统计学(一)统计学的含义(了解):1.统计学是关于收集、整理、分析数据和从数据中得出结论的科学(二)统计学有两个分支:描述统计和推断统计类型含义内容包括描述统计是研究数据收集、整理和描述的统计方法(1)如何取得所需要的数据;(2)如何用图表或数学方法对数据进行整理和展示;(3)如何描述数据的一般特征推断统计研究如何利用样本数据推断总体特征的统计方法(1)参数估计:利用样本信息推断总体特征(2)假设检验:利用样本信息判断对总体假设是否成立【例1·单选题】统计学包括描述统计和()两个分支。A.数据统计B.调查统计C.调查统计D.推断统计答案:D【例2•单选题】为了解与居民生活相关的商品及服务价格水平的变动情况,收集统计局发布的CPI数据,利用统计图形展示CPI的变化,利用增长率计算CPI的走势,这种统计方法是()A.描述统计B.推断统计C.推断统计D.调查统计答案:A【例3·多选题】(2013年)下列统计分析中,需要采用推断统计方法的有()。A.用样本信息估计总体特征B.用图表对数据进行展示C.描述一组数据的集中趋势D.用样本信息检验对总体的假设是否成立E.描述一组数据的离散趋势答案:AD二、变量和数据(一)变量含义变量是研究对象的属性或特征,它是相对于常数而言的常数只有一个固定取值,变量可以有两个或更多个可能的取值分类定量变量(数量变量)变量的取值是数量,其取值表现为具体的数值如企业销售额、注册员工数定性变量分类变量变量的取值表现为类别(如企业所属行业、员工性别)顺序变量变量的取值表现为类别且有一定顺序(如员工受教育水平)(二)数据1、含义:数据是对变量进行测量、观测的结果,数据根据需要可以是数值、文字或者图像等形式2、分类:类型测量内容表现为定量数据(数值型数据)是对定量变量的观测结果其取值表现为具体的数值(例如:销售金额为100万元)定性数据分类数据是对分类变量的观测结果表现为类别,一般用文字表述,也可用数字表示,不区分顺序(如用1表示“男性”,2表示“女性”)顺序数据是对顺序变量的观测结果表现为类别,一般用文字表述,也可用数字表示,但有顺序(如用1表示硕士及以上,2表示本科,3表示大专及以下)【例4·多选题】(2009年考题)下列变量中属于定量变量,其取值通常表现为具体的数值的是()。A.商品销售额B.上班出行方式C.家庭收入D.居住地区E.年龄答案:ACE【例5·单选题】当变量的取值表现为类别且有一定顺序的,则该变量为()。A.定量变量B.分类变量C.顺序变量D.类别变量答案:C【例6·单选题】(2012年考题改编)()其取值表现为具体的数值。A.定量数据B.分类数据C.顺序数据D.定性数据答案:A【例7·单选题】(2013年)下列统计变量中,属于顺序变量的是()。A.原油价格B.年末总人口C.员工受教育水平D.学生年龄答案:C解释:去年课后练习单选题第7题。三、常用的数据特征测度对收集来的数据经过整理与显示,可以对数据的分布特征有一个初步认识和了解。其中常用于分析数据分布特征的测度,主要从三个方面进行:(1)分布的集中趋势反映数据向其中心值靠拢或聚集的程度(2)分布的离散程度反映各数据远离其中心值的趋势(3)分布的偏态和峰度反映数据分布的形状(一)均值和中位数——测度数据的集中趋势集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。集中趋势的测度也就是寻找数据一般水平的代表值或中心值。1、均值含义均值也叫平均数,就是数据组中所有数值的总和除以该组数值的个数计算公式示例【教材例题】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日平均销售额。【计算过程】平均销售额=5705500750480600520元地位均值是集中趋势最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平适用范围主要适用于数值型数据,但不适用于分类数据和顺序数据特点易受极端值的影响,极端值的出现,会使平均数的真实性受到干扰。【例8·单选题】(2003年)集中趋势最主要的测度值是()。A.众数B.中位数C.均值D.方差答案:C解析:算术平均数是全部数据的算术平均,又称均值,是集中趋势中最主要的测度值。(二)中位数含义把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用Me表示。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数计算思路数据排序→确定中位数的位置→确定中位数的具体数值n为数据的个数(1)当n为奇数:中位数位置是21n,该位置所对应的数值就是中位数数值(2)当n为偶数:中位数位置是介于2n和(2n+1)之间,中位数数值就是2n所对数值和(2n+1)所对应数值的平均数。示例1【教材例题】某地级市下辖9个县,每个县的面积如下,计算中位数:14552019912101613521031212810752000计算思路:(1)先排序:91210161031107513521455200020192128(2)确定中位数的位置(9+1)÷2=5,(3)该位置所对应的数值就是中位数数值中位数1352示例2【教材例题】某地级市下辖10个县,每个县的面积如下,计算中位数:912100010161031107513521455200020192128计算思路:(1)先排序:题目中数据已经从小到大排好序(2)确定中位数的位置(10+1)÷2=5.5(3)即第5位数和第6位数所对应数值的平均数就是中位数,即:Me=2135210751213.5特点中位数是一个位置代表值,不受极端值的影响,抗干扰性强,尤其适用于收入类偏斜分布的数值型数据。适用范围主要用于顺序数据和数值型数据,但不适用于分类数据。【例9·单选题】(2007年改编)某连锁超市6个分店的职工人数由小到大排序后为57人、58人、58人、60人、63人、70人其平均数、中位数分别为()。A.59、58B.61、58C.61、59D.61、70答案:C解析:1、平均数=(57+58+58+60+63+70)/6=61人2、中位数(1)先排序:题目中数据已经从小到大排好序(2)确定中位数的位置(6+1)÷2=3.5(3)即第3位数和第4位数所对应数值的平均数就是中位数,即(58+60)÷2=59【例10·单选题】(2011年)2010年某省8个地市的财政支出(单位:万元)分别为:59000500026560266450780007800078000132100这组数据的中位数是()万元。A.78000B.72225C.66450D.75894.25答案:B解析:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数。把题干中的数据按顺序排列就是50002,59000,65602,66450,78000,78000,78000,132100。由于所给数据是8个,所以中位数的位置是第4个和第5个数据的平均数。中位数就是(66450+78000)÷2=2=72225。【例11·单选题】(2013年)在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是()。A.中位数B.均值C.标准差D.方差答案:A【例12·单选题】(2013年)在某企业中随机抽取7名员工来了解2013年上半年职工请假情况。这7名员工2013年上班年请假天数分别为:15310072这组数据的中位数是()。A.3B.10C.4D.0答案:A【解析】先从小到大排序01235710,确定中位数的位置(7+1)÷2=4,第4个数就是中位数。(二)方差和标准差——测度数据的离散趋势离散程度反映的是各变量值远离中心值的程度集中趋势与离散程度的关系(1)数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差(2)数据的离散程度越小,集中趋势的测度值对该组数据的代表性就越好【例13·单选题】(2010年)集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性()。A.越好B.越差C.始终不变D.在一定区间内反复变化答案:B1、方差含义方差是数据组中各数值与其均值离差平方的平均数,它能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值方差与均方差越小,说明数据值与均值的平均距离越小,均值的代表性越好值的关系公式对于样本数据,常用的方差公式为:s2=1-)(12nXXnii【教材164页例题】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日销售额的样本方差【计算过程】(1)计算均值(平均数)(520+600+480+750+500)÷5=570元(2)计算各数值与均值的差520-570=-50;600-570=30;480-570=90;750-570=180;500-570=-70(3)计算差平方和(-50)2+(30)2+(90)2+(180)2+(-70)2(4)计算方差1-)(12nXXnii=1-570-180903050-22222)()()()()(=122002、标准差:含义即方差的的平方根公式对于样本数据,常用的方差公式为:s=1-)(12nXXnii示例上例题算出方差后,开平方根即可样本标准差=12200=110.45特点标准差不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位地位标准差与方差是应用最广泛的统计离散程度的测度方法适用范围但是标准差与方差只适用于数值型数据。此外与均值一样,它们对极端值也很敏感【总结】常用的数据特征测度指标(测得值)是否受极端值影响数值型数据(定量数据)分类数据顺序数据测度数据的集中趋势均值受影响适用不适用不适用中位数不受影响适用不适用适用测度数据的离散趋势方差受影响适用不适用不适用标准差【例14·单选题】(2009年考题改编)下列指标中,用于描述数据集中趋势,并且易受极端值影响的是()。A.平均数B.中位数C.方差D.标准差答案:A解析:均值、方差、标准差都容易受极端值影响,但是用于描述数据集中趋势的指标是均值(即平均数),方差和标准差是描述数据离散趋势的指标,因此正确答案为A【例15·单选题】(2010年)下列指标中,适于测度顺序数据的指标有()。A.均值B.中位数C.方差D.标准差答案:B四、数据的来源1、按收集方法分为类型含义内容示例观测数据通过直接调查或测量而收集的数据观测数据是在没有对事物施加任何人为控制因素的条件下得到的,几乎所有与社会经济现象有关的统计数据都是观测数据如GDP、CPI、房价实验数据通过在实验中控制实验对象以及其所处的实验环境收集到的数据自然科学领域的数据大多都是实验数据如一种新产品使用寿命的数据;一种新药疗效的数据2、从使用者的角度看,数据的来源有两种类型内容来源一手数据直接的调查和科学实验,对使用者来说,这是数据的直接来源,称为直接数据或一手数据有两个:一是调查或观察,二是实验社会经济领域,统计调查是获得数据的主要方法,也是获得一手数据的重要方式二手数据来源于别人的调查或实验的数据,对使用者来说这是数据的间接来源来自国家和地方的统计部门以及各种报刊媒介公开出版或报道的社会经济统计数据。报纸、杂志、广播、电视、历史文献及著作、网络等也是获得第二手数据的重要渠道【例16·单选题】在不对事物施加人为控制因素的条件下,直接调查或