12010年经济师(中级)经济基础知识统计会计部分复习讲解主要要点2010年10月第四部分统计第二十章统计与统计数据1.统计的含义包括:统计工作、统计数据和统计学。统计工作与统计数据是“过程”与“成果”的关系;统计工作与统计学是“实践”与“理论”的关系。2.统计数据的计量尺度分为:定类尺度、定序尺度、定距尺度和定比尺度。区分四种统计数据的计量尺度的要点:首先应区分定类尺度、定序尺度和定距尺度、定比尺度:定类尺度、定序尺度对现象进行定性计量;而定距尺度、定比尺度对现象进行定量计量;其次应区分定类尺度和定序尺度,两者的区别在于:前者区分现象性质无递进或递减关系(即无顺序);后者区分现象性质则有递进或递减关系(即有顺序)。再次应区分定距尺度和定比尺度,两者的区别在于:前者区分现象的定量关系只能进行加、减运算;后者区分现象的定量关系则能进行加、减、乘除四则运算。3.统计数据的类型按照其所采用计量尺度分为分类数据、顺序数据和数值型数据。分类数据是由定类尺度计量的;顺序数据是由定序尺度计量的;数值型数据是由定距尺度和定比尺度计量的。可按照不同计量尺度性质来理解。4.变量及其类型。.变量是说明现象某种特征的概念。其具体表现为变量值。统计数据就是变量的具体表现,即统计数据就是变量值。变量可按照统计数据的类型分为:分类变量、顺序变量和数值型变量。数值型变量又可分为离散变量和连续变量。理解不同类型的变量要从不同计量尺度性质来理解。而离散变量和连续变量区分在于:前者计量的数值只能用整数;后者计量的数值不光能用整数而且还可用小数或分数。5.统计指标及其类型。统计指标是用来反映现象总体数量状况的基本概念或者是反映现象总体数量状况的概念和数值。就是说统计指标可以是个概念,也可以是概念加数值。统计指标可分为:总量指标、相对指标和平均指标。总量指标还可分为时期指标和时点指标。总量指标一般采用加法求得(含减法和乘法),又叫数量指标;相对指标和平均指标一般采用除法求得。对于时期指标和时点指标的区分主要抓住一点,即不同时期的数值是否能够相加:能加的是时期指标,反之则是时点指标。6.统计数据的的来源主要是两种渠道:一是来源于直接的调查和科学试验,称之为第一手资料或称之为直接统计数据;二是来源于别人的调查和科学试验的数据,称之为第二手资料或称之为间接统计数据。7.统计数据的的直接来源主要是两个渠道:一是专门组织的调查;二是科学试2验。应该把握统计调查的方式:普查、抽样调查、统计报表、重点调查和典型调查等方式。⑴普查应掌握其特点:①一次性或周期性的;②需要规定统一的标准调查时间;③数据较准确、规范化程度高;④使用范围比较窄。⑵抽样调查应掌握其特点:①经济性;②时效性强;③适应面广;④准确性高。其抽样方法分为概率抽样和非概率抽样。概率抽样有;简单随机抽样、分层抽样、整群抽样和等距抽样(系统抽样)等四种方式。⑶统计报表要以统一的表式、统一的指标、统一的报送时间和统一的报送程序进行填报。统计报表按调查对象范围的不同可分为全面报表和非全面报表;按报送周期长短不同可分为日报、月报、季报和年报;按报表内容和实施范围不同可分为国家的、部门的、地方的统计报表。⑷重点调查是从调查对象的全部单位中选择少数重点单位进行调查。所谓重点单位是指在所要调查的数量特征上占有较大比重的单位。⑸典型调查是从调查对象的全部单位中选择一个或数个有代表性的单位进行全面深入的调查。目的是通过典型单位来描述或揭示事物的本质和规律。8.统计数据的的间接来源是通过各种渠道获取现成的第二手数据。其主要来源有公开的出版物、未公开的内部调查等。利用间接来源的统计数据必须注意三点:①要评估第二手数据的可用价值;②要注意指标口径和计算方法的可比性;③引用统计数据要注明数据来源。9.统计数据的误差通常是指统计数据与客观现实之间的差距,分为登记性误差和代表性误差两类。理解其概念和产生原因。10..统计数据的质量评价标准概括为:精度、准确性、关联性、及时性、一致性和最低成本。概括地说本章学习思路为:从理解统计的三个含义及其联系入手,深刻理解统计数据四个计量尺度的区别,从而掌握统计数据(变量)三个分类,由数值性数据(变量)理解延伸理解统计指标的概念和分类。从理解统计数据两个来源着手,重点抓住统计数据直接来源的五种调查方式:普查、抽样调查、统计报表、重点调查和典型调查的概念和特点。注意利用第二手资料的问题,理解统计数据的误差的概念、分类和产生原因。最后,理解.统计数据的质量评价标准。第二十一章统计数据的整理与显示1.品质数据的整理与显示。⑴所谓品质数据就是前一章所说的分类数据和顺序数据统称。所以品质数据的整理与显示就是分类数据和顺序数据的整理与显示。⑵分类数据的整理与显示:①分类数据的整理是要列出所分的类别外,还要计算出每一类别的频数、频率或比例、百分比。所谓频数(次数)是落在各类别中数据个数;所谓频率是指各类别中数据个数除以总频数(次数)的比例或百分比。因此,频率的两种表现形式3就分别是比例或百分比。这两种形式的区别在于:“比例”是用小数形式;“百分比”则是以%的形式。②分类数据的整理显示既可以用频数分布表,也可采用条形图或圆形图(饼图)。条形图是用来反映数据变动的;而圆形图(饼图)是用于表示总体各组成部分所占的比例,对于研究结构性问题十分有用。⑶顺序数据的整理显示可以采用分类数据的整理显示的方法,除此以外,还可以计算累积频数和累积百分比。从类别顺序的开始一方向类别顺序的最后一方累加频数(百分比),称为向上累积;反之,则称为向下累积。并采用累积分布图对计算累积频数和累积百分比进行显示。2.数值型数据的整理与显示。⑴品质数据的整理与显示的方法都适应数值型数据的整理与显示。⑵数值型数据的整理与显示的特定方法是采用统计分组的方法编制频数分布表,数值型数据统计分组的方法有单变量分组和组距分组。单变量分组适用于离散变量和变量值较少的情况;组距分组适用于连续变量和变量值较多的情况。组距分组需经过:①确定分组组数(组数适当,注意组内同质性,充分显示现象本身状态);②对原始资料进行排序;③求极差;④确定组距=极差÷组数;⑤确定组限;⑥确定各组观察值出现的频数。数值型数据的显示也可以进一步用图形来显示,如前述条形图或圆形图(饼图),另外还可以用直方图、折线图。直方图是用矩形的宽度和高度来表示频数分布的图形。用横轴表示数据分组,用纵轴表示频数或百分比。它与条形图的区别在于:直方图是用面积表示每一组的频数或百分比,宽度则表示各组的组距;条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的。折线图也称频数多边形图,它是在直方图的基础上,把直方图顶部的中点(组中值用直线连接起来,再把原来的直方图抹掉就成。⑶有关数值型数据组距式分组的相关概念:①组限是指组与组之间的界限。一个组的最小值称为下限;一个组的最大值称为上限。上限与下限的差值称为组距,上限值与下限值的平均数称为组中值。②为遵循组距分组的“不重不漏”的原则,统计分组时习惯上规定“上组限不在内”。3.统计表是用于显示统计数据的基本工具,其构成为:表头、行标题、列标题和数字资料,必要时可以在统计表下方加上表外附加。统计表的设计应注意:①要合理安排统计表的结构;②表头一般应包括表号、总标题和表中数据的单位等内容;③表中的上下两条横线一般用粗线,中间的其他线要用细线,表的左右两边不封口;④使用统计表时必要时可在表的下方加上注释。概括地说,本章应在深刻理解统计数据的分类的前提下,理解并把握各类统计数据整理和显示方法。重点掌握数值型数据的整理与显示的方法和相关概念、统计表的概念构成及注意事项。4第二十二章数据特征的测度1.数据集中趋势的的测度。⑴集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据的一般水平的代表值或中心值。集中趋势测度,主要包括位置平均数(含众数、中位数等)和数值平均数(含算术平均数、几何平均数等)。⑵众数是一组中出现频数最多的那个数值。适用品质数据或数值型数据,不受极端值的影响,抗干扰性强。⑶中位数是在把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数。计算中位数先确定中位数的位置=(数据个数+1)÷2。数据个数是奇数确定的中位数位置对应的数据就是中位数;数据个数是偶数确定的中位数位置的最近两个数的简单平均数就是中位数。中位数只适用于数值型数据。不受极端值的影响,抗干扰性强。⑷算术平均数是全部数据的算术平均,又称均值。它是集中趋势最主要的测度值。主要适用于数值型数据。有简单算术平均数和加权算术平均数之分。计算和运用算术平均数须注意:①算术平均数同时受到两个因素的影响,一个是各组数值的大小,另一个是各组分布频数的多少;②算术平均数易受极端值的影响。⑸几何平均数是指n个观察值连乘积的n次方根。其用途:对比率、指数等进行平均;计算平均发展速度。2.离散程度的测度。⑴离散程度是指数据之间的差异程度或频数分布的分散程度。离散程度的测度主要包括极差、方差和标准差、离散系数。⑵极差又叫全距,是总体或分布中最大的标志值和最小的标志值之差。它计算简单、含义直观,运用方便,但不能反映极端值间的变量分布情况,易受极端值影响。⑶标准差是总体所有单位标志值与其平均数离差之平方的平均数的平方根,用σ表示。(计算公式见教材P207)方差是标准差的平方。标准差和方差计算较为简便,又具有比较好的数学性质,是应用最广泛的离散程度的测度方法。⑷离散系数通常是就标准差来计算的,因此也称标准差系数,是一组数据的标准差与其相应的算术平均数之比。(计算公式见教材P208)它主要用于比较对不同组别数据的离散程度。⑸应当说明的是离散程度的测度的各个指标值越小,则总体各单位标志值间的离散程度小,平均数的代表性就好。概括地说,本章抓住两个内容:一是数据集中趋势的的测度,二是数据离散程度的测度。对于数据集中趋势的的测度,重点应把握位置平均数和数值平均数,位置平均数应掌握众数、中位数概念的理解,数值平均数应掌握算术平均数计算公式。(平均数计算看权数,权数相等简单平均,权数不等加权平均。)理解影响平均数大小因素。对于数据离散程度的测度,要掌握标准差和离散系数计算公式,理解两者作为衡量平均数代表性应用条件。第二十三章时间序列1.时间序列的概念及其分类。⑴时间序列也称动态数列,是将某一统计指标在各个不同时间上的数值按时间5先后顺序编制形成的序列。时间序列由两个基本因素构成:一个是被研究现象所属时间,另一个是反映该现象一定时间条件下数量特征的指标值。⑵时间序列按照其构成要素中统计指标值的表现形式,分为绝对数时间序列、相对数时间序列和平均数时间序列三种类型。绝对数时间序列依据指标值的时间特点,又分为时期序列和时点序列。2.发展水平的概念和分类。⑴发展水平是指时间序列中对应于具体时间的指标数值。⑵发展水平有最初水平、最末水平和中间水平。序列中第一项的指标值称为最初水平,最末项的指标值称为最末水平,处于二者之间的指标值称为中间水平。按各期指标值在计算动态分析指标时的作用来划分,又可分为基期水平和报告期水平。3.平均发展水平的概念和计算。⑴平均发展水平也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数。⑵绝对数时间序列序时平均数的计算:①由于绝对数时间序列分为时期序列和时点序列,所以,绝对数时间序列序时平均数的计算也要分时期序列序时平均数的计算和时点序列序时平均数的计算。②时期序列序时平均数的计算公式为:nyy③时点序列序时平均数的计算要分别考虑连续时点序列和间断时点序列。连续时点序列的指标值以“天”为时间长度或以“平均值”形式出现;而间断时点序列则是不具备连续时点序列的指标值特点的时点序列。同时,还要考虑指标值登记的间隔是否相等。综合以上情况,我们可把时点序列序时平均数的计算分以下四种情况:第一、连续时点序列、指标值登记的间隔是相等的。计算公式为:nyy第二、连续时点序列、指标值登记的间隔是不等的。计算公式为:fyfy第三、间断时点序列、指标值登记的间隔是相等的。计算公式为