中级《经济基础知识》第四五部分赵老师讲义

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四部分统计第二十二章统计与统计数据一、统计学统计学是包括了描述统计和推断统计两大分支。描述统计是研究数据收集、整理和描述的统计学方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法,其内容包括参数统计和假设检验两大类。参数统计是利用样本信息推断总体特征;假设检验是利用样本信息判断对总体的假设是否成立。二、变量和数据变量是研究对象的属性或特征,它是相对于常数而言的。定量变量:当变量的取值是数量时,该变量被称为定量变量或数量变量。定性变量:分类变量:变量的取值变现为类别。顺序变量:变量的取值表现为类别且具有一定顺序。数据是对变量进行测量、观测的结果。数据根据需要可以是数值、文字或者图像等形式。分类变量的观测结果称为分类数据,表现为类别,一般用文字来表述,也可用数值代码表示。顺序数据是对顺序变量的观测结果,一般用文字表述,也可用数值代码表示。【2012年多选题】按所反映的内容或数值表现形式划分,统计指标可分为(BCE)。A.分类指标B.总量指标C.相对指标D.顺序指标E.平均指标按其所反映的内容或其数值表现形式,统计指标可分为总量指标、相对指标和平均指标。按照所采用的计量尺度,可以将统计数据分为分类数据、顺序数据和数值型数据。【2014年单项选择题】下列统计变量中,属于定量变量的是(B)。A.性别B.年龄C.产品等级D.汽车品牌三、数据的来源(一)观测数据和实验数据按其收集方法,可以分为观测数据:通过直接调查或测量而收集到的数据实验数据:通过在实验中控制实验对象以及其所处的实验环境收集到的数据。(二)一手数据和二手数据从其使用者的角度看,数据来源主要分为直接数据或一手数据:直接的调查和科学实验间接数据或二手数据:别人的调查或实验数据【2012年多选题】下列数据搜集方法中,属于搜集第二手统计数据的有(CD)。A.在控制条件下进行试验并在试验过程中搜集数据B.通过电话询问被调查者C.购买公开出版的统计年鉴D.与原调查单位合作获取未公开的内部调查资料E.要求当事人到相关机构进行登记四、统计调查(一)统计调查的分类与概念统计调查是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地收集数据信息资料的过程。统计调查可以按不同标志分类:1、按调查对象的范围不同,分为全面调查和非全面调查。全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查。全面调查由于调查的单位多、组织工作量大,往往需要耗费大量的人力、财力。因此在不影响统计研究目的的现实条件下,常常采用非全面调查。非全面调查是对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查等。2、按登记时间是否连续分为连续调查、不连续调查。(二)统计调查的方式在我国,常用的统计调查方式有统计报表、普查、抽样调查、重点调查和典型调查。【2011年多项选择题】人口普查统计数据可能存在的误差来源有(ABCD)。A.填报错误B.抄录错误C.汇总错误D.有意瞒报E.未遵守随机原则抽取样本【2012年单选题】在进行重点调查时,应选择的调查单位是(B)。A.有典型意义的单位B.就调查标志值来说在总体中占绝大比重的单位C.主动参与调查的单位D.随机抽取的单位第二十三章描述统计对于数据分布特征的测度主要分为三个方面:一是分布的集中趋势,反应各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反应各数据之间的差异程度,也能反应中心值对数据的代表程度;三是分布的偏态,反应数据分布的不对称性。一、集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。1、均值。也叫平均数。例如:某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500元,求该日平均销售额。均指是集中趋势最主要的测度值,它主要适用于数值型数据,但不适用于分类和顺序数据。此外,均指容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。【2011年单选题】下列指标中,应采用算术平均方法计算平均数的是()。A.男女性别比B.国内生产总值环比发展速度C.人口增长率D.企业年销售收入【2014年单项选择题】在某城市2014年4月空气质量监测结果中,随机抽取6天的质量指数进行分析。样本数据分别为:30、40、50、60、80和100,这组数据的均值是()。A.50B.60C.55D.702、中位数。把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数。例如:某地级市下辖9个县,每个县的面积如下,计算该市下辖县面积的中位数:1455201991210161352103121281075中位数的优点是不受极端值的影响,抗干扰性强,尤其适于收入这类偏斜分布的数值型数据。【2014年单项选择题】下列数据特征测度中,适用于反映偏斜分布数值型数据集中趋势的是(C)。A.离散系数B.方差C.中位数D.标准差3、众数。是指一组数据中出现次数(频数)最多的变量值。众数适用于描述分类数据和顺序数据的集中趋势,不适用于定量数据。【2011年单选题】2010年某省8个地市的财政支出(单位:万元)分别为:59000500026560266450780007800078000132100这组数据的中位数和众数分别是()万元。A.7222578000B.7800078000C.66450132100D.75894.25132100二、离散程度的测度集中趋势的测度值是对数据水平的一个概括性的度量,它对一组数据的代表程度,取决于该组数据的离散水平,离散程度反映的是数据之间的差异程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。1、方差。是数据组中各数值与其均值离差平方的平均数。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。2、标准差。即方差的平方根。3、离散系数。即标准差与均值的比值。【2012年单选题】标准差系数是一组数据的标准差与其相应的(C)之比。A.众数B.极值C.算术平均数D.几何平均数【2011年单项选择题】下列离散程度的测度值中,能够消除变量值水平和计量单位对测度值影响的是(A)。A.离散系数B.标准差C.方差D.极差三、分布形态的测度1、偏态系数。是指数数据分布的偏斜方向和程度,描述的是数据分布对称程度。如果偏态系数等于0,说明数据的分布是对称的;如果偏态系数为正值,说明分布为右偏的,取值在0~0.5之间说明轻度右偏,取值在0.5~1之间说明中度右偏,取值大于1说明严重右偏;如果偏态系数是负数,说明分布为左偏。偏态系数的绝对值越大,说明数据分布的偏斜程度越大。2、标准分数。在统计上,均值和标准差不同时,不同变量的数值是不能比较的。四、变量间的相关分析(一)变量间的相关关系1、按相关的程度可分为完全相关、不完全相关和不相关。当一个变量的取值变化完全由另一个变量的取值变化所确定时,称这两个变量间的关系为完全相关。当两个变量的取值变化彼此互不影响时,称为不相关现象。当两个变量之间的关系介于完全相关和不相关之间,称为不完全相关。2、按相关的方向可分为正相关和负相关。当一个变量的取值由小变大,另一个变量的取值也相应的由小变大,这种相关称为正相关。当一个变量的取值由小变大,而另一个变量的取值相反地由大变小,这种相关称为负相关。3、按相关的形式可分为线性相关和非线性相关。(二)散点图P183(三)相关系数相关系数是度量两个变量间相关关系的统计量。最常用的相关系数是Pearson相关系数,它度量的是两个变量间的线性相关关系。相关系数的取值范围在+1和—1之间。若0<r≤1,表明变量之间存在正线性相关关系;若-1≤r<0,表明变量之间存在负线性相关关系。r=0,说明变量之间不存在线性相关关系。【2014年单项选择题】变量X和变量Y的Pearson相关系数r=1,这说明变量X和变量Y间的相关关系是(B)。A.完全负线性相关B.完全正线性相关C.低度线性相关D.不存在线性相关第二十四章抽样调查一、抽样调查基本概念(一)抽样调查基本概念1、总体与样本总体即调查对象的全体。调查总体必须是明确的而不能是模糊的。样本是总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成。2、总体参数与样本统计量。总体参数是我们所关心变量的数字特征,它是根据总体中所有单位的数值计算的。样本统计量是根据样本中各单位的数值计算的,是对总体参数的估计,因为也称为估计量。3、抽样框。抽样框是供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。(二)概率抽样与非概率抽样概率抽样也称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的方法。非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不是依据随机原则。【2011年单选题】下列抽样方法中,属于非概率抽样的是()。A.判断抽样B.分层抽样C.整群抽样D.等距抽样(三)抽样调查的一般步骤1、确定调查问题。2、调查方案设计3、实施调查过程4、数据处理分析5、撰写调查报告。(四)调查抽样中的误差样本估计值和总体参数真值之间的差异称为误差。一般来说,调查中的误差可以分为抽样误差和非抽样误差两大类。抽样误差是由于抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。非抽样误差是指除抽样误差以外,由其他原因引起的样本统计量与总体真值之间的差异。非抽样误差产生的原因,主要有几种:1、抽样框误差。2、无回答误差。现场调查中由于各种原因,调查人员没能够从被调查者那里得到所需要的数据。一类是由于随机因素造成的;另一类无回答是非随机因素的影响。3、计量误差。计量误差是指由于调查所获得的数据与其真值之间不一致造成的误差。【2011年多项选择题】关于抽样调查的说法,正确的有(DE)。A.抽样调查中不存在代表性误差B.抽样调查时效性差C.抽样调查通常从总体中选择重点单位进行调查D.抽样调查用样本数据推断总体数量特征E.抽样调查适应面广【2014年多项选择题】由于受访者记忆模糊,导致调查数据与其真值之间不一致,这种误差属于(D)。A.抽样误差B.抽样框误差C.无回答误差D.计量误差二、几种基本概率抽样方法(一)简单随机抽样分为不放回简单随机抽样和有放回简单随机抽样两种方法。(二)分层抽样指先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机地抽取样本,这样所得到的样本称为分层样本。(三)系统抽样指先将总体重的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。最简单的系统抽样是等距抽样。(四)整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。【2012年单选题】在调查某城市小学教师亚健康状况时,从该城市的200所小学中随机杣取40所,每个被抽取小学中的所有教师都参与调查。这种抽样方法属于(D)。A.简单随机抽样B.分层抽样C.等距抽样D.整群抽样(五)多阶段抽样在大规模抽样调查中,一次抽取到最终样本单位是很难实现的,往往需要经过二个或二个以上阶段才能抽到最终样本单位,这就是多阶段抽样方法。【2014年单项选择题】某城市为调查居民对市政建设的满意度,先从该市所有居委会中随机抽取20个居委会,再从每个被抽中的居委会中随机抽取30个居民家庭进行入户调查。该项调查采用的抽样方法是(A)。A.多阶段抽样B.分层抽样C.整群抽样D.系统抽样【2012年单选题】在研究某城市居民的家庭消费结构时,在全部50万户家庭中随机抽取3000户进行入户调查。这项抽样调查中的样本是指该城市中(D)。A.抽取出来的3000户家庭B.50万户家庭C.每一户家庭D.抽取出来的每一户家庭第二十五回归分析(一)回归分析的概念就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的依赖关系。回归分析和相关分析的区别和联系是什么?相同点:

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功