第四部分统计第二十章统计与统计数据一、统计的含义:统计工作、统计资料、统计学二、统计数据的计量尺度:定类尺度、定序尺度、定距尺度(绝对数)、定比尺度(相对数)三、统计数据的类型:1、分类数据、顺序数据、数值型数据2、变量及其类型:把说明现象某种特征的概念称为变量,变量的具体表现为变量值。变量可以分为分类变量、顺序变量、数值型变量。离散型变量与连续型变量例如:将对服务人员的满意程度分成非常满意、满意、不满意三类,所采用的计量尺度是(C)A、定比尺度B、定类尺度C、定序尺度D、定距尺度例如:统计数据的计量尺度中能进行加、减运算的是(AD)A、定比尺度B、定类尺度C、定序尺度D、定距尺度E、定性尺度例如:数值型数据说明的是现象的数量特征,通常可以用(DE)计量A、定性尺度B、定类尺度C、定序尺度D、定距尺度E、定比尺度例如:(2009年考题)按低级到高级、粗略到精确顺序排列的数据计量尺度是(C)A、定比尺度、定距尺度、定类尺度、定序尺度B、定序尺度、定比尺度、定类尺度、定距尺度C、定类尺度、定序尺度、定距尺度、定比尺度D、定类尺度、定距尺度、定序尺度、定比尺度例如:下列变量中,通常属于数值型变量的有(ABE)A、产品产量B、时间C、性别D、居住地区E、年龄例:某产品资料如下:等级单价(元/斤)收购量(斤)收购额(元)一级品二级品三级品1.201.050.90200030004000240031503600例:某企业工人数和工资总额的资料如下:工人组别工资总额(元)2000年2001年普工22400224003040037800技工例:某企业工人日产量资料如下:例如:已知某企业资料如下:4.某企业2003年某月份按工人劳动生产率高低分组的有关资料如下:按工人劳动生产率分组(件/人)生产班组生产工人数50-6060-7070-8080-9090以上35822150100703050四、统计指标及其类型是反映现象总体数量状况的概念和数值。分类:总量指标、相对指标和平均指标;时期指标与时点指标。例如:某公司2008年1月份的有关资料如下:总产值为2563万元,职工平均工资为2400元,产品的合格率为95%。1月1日职工人数为700人例如:下列指标中属于时点指标的有(ABCE)。日产量件数(件)工人数10─2020─3030─4040─5015383413按计划完成百分比分组(%)实际产值(万元)80—9090—100100—110110—1206857126184A)某地区人口数B)某校毕业生人数C)某农场拖拉机台数D)某企业某月产品产量E)某企业月末在册职工人数例:已知某公司资料指标三月四月五月六月月末工人数(人)总产值(万元)200011200012.6220014.6220016.3五、统计数据的来源1、直接来源:普查、抽样调查、统计报表、重点调查和典型调查。2、间接来源:公开的出版物、未公开的内部调查等。例如:能够根据样本结果推断总体数量特征的调查方式是(B)A、重点调查B、抽样调查C、典型调查D、所有非全面调查例如:为了解全国煤炭企业的生产安全状况,找出安全隐患,专家根据经验选择10个有代表性的企业进行深入细致的调查。这类调查方法属于(D)A、专家调查B、重点调查C、系统调查D、典型调查例如:统计数据的直接来源有(ABCD)A、普查B、抽样调查C、重点调查D、典型调查E、《中国统计年鉴》例如:(2009年考题)对于普查而言,抽样调查的特点包括(ABCE)A、经济性B、时效性强C、适用面广D、周期性强E、准确性高六、统计数据的质量1、登记性误差与代表性误差。2、质量要求及检查精度、准确性、关联性、及时性、一致性、最低成本。例如:下列关于登记性误差和代表性误差的说法正确提(ABDE)A、登记性误差是由人为因素造成的B、因填报错误、抄录错误、汇总错误造成的误差是登记性误差C、因人为因素干扰形成的有意虚报或瞒报调查数据是代表性误差D、在用样本数据进行推断时所生的随机误差是代表性误差样本容量不足可能生产代表性误差第二十一章统计数据的整理与显示一、品质数据的整理与显示(一)分类数据的整理与显示1、频数与频数颁布(1)比例(2)比率2、分类数据的图示(1)条形图(2)圆形图例如:关于比率的说法正确的是(ACE)A、比值可能大于1B、各部分的比率之和等于1C、是各不同类别的数量的比值D、是总体中部分与整体之间的对比关系E、可以不用1作为基数,而用100或其他便于理解的数作为基数。例如:(2009年)分类数据的图示方法主要有圆形图和(A)A、条形图B、直方图C、累计分布图D、茎叶图(二)顺序数据的整理与显示1、累积频数与累计百分数2、顺序数据的图示二、数值型数据的整理与显示(一)数据的分组:1、确定分组组数2、对原始资料进行排序3、求极差4、确定各组组距5、确定组限例如:已知一组数据的上限是70,组中值是50,则该组数据的下限是(A)A、30B、40C、50D、60例如:在组距分组中,确定分组组数时要求(CD)A、组数尽可能多B、组数尽可能少C、尽量保证组间资料的差异性D、尽量保证组内资料的同质性E、使用开口组(二)数值型数据的图示1、直方图2、折线图例如:用宽度相同的条形的高度或长短来表示数据变动的图形是(B)A、折线图B、条形图C、直方图D、圆形图例如:直方图与条形图的区别是(BCD)A、直方图的各矩形通常是分开排列的B、直方图用面积表示各组频数的多少C、直方图和各矩形通常是连续排列D、直方图的矩形高度与宽度均有意义E、直方图的高度有意义而宽度无意义二、统计表(一)统计表的构成:表头、行标题、列标题和数字资料(二)统计表的设计例:某班40名学生统计学考试成绩(分)如下:57894984868775737268758297816781547987957671609065767270868589896457838178877261要求:(1)将成绩分为以下几组:60分以下,60—70,70—80,80—90,90—100,编制一张次数分配表。(2)根据次数分配表,计算该班学生统计学的平均成绩。40名学生成绩的统计分布表:学生按成绩分组学生人数组中值向上累计向下累计各组学生人数占总人数的比重(%)向上累计向下累计60以下45544010.01010060-7070-8080-9090-1006121536575859510223740363018315.030.037.57.5255592.51009075457.5合计40---------100.0学生的平均成绩:75.76403070fxfx组中值=(上限+下限)÷2第二十二章数据特征的测试一、集中趋势的测度(一)众数:是一组数据中出频数最多的那个数值。用m0表示例如:一家连锁超市的10个分店某月的销售额分别为:61、65、73、78、80、80、80、80、96、97众数m0=80万元(二)中位数:把一组数据从小到大的顺序进行排列,位置居中的数值叫中位数,用me表示上题中位数me=80例如:(2009年)适于测度顺序数据的指标有(BC)A、离散系数B、中位数C、众数D、均值E、标准差(二)算术平均数总体单位总数总体标志总量算术术平均1、简单算术平均数(总体未分组)nXnXXXXXn321[例5—1]某机械厂某生产班组有10名工人,生产某种零件,每个工人的日产量分别为45件,48件,52件,62件,69件,44件,52件,58件,38件,64件。试用简单算术平均数法计算工人平均日产量105321064385852446962524845nXX2、加权算术平均数(总体已分组)fXfffffXfXfXfXXnnn21332211例:30名工人加工零件次数颁布表如下:按日加工零件数分组工人数(人)频率(%)25-3030-3535-4040-4545-50369841020302713合计40100.0(2)例如:(2009年)下列指标中,用于描述数据集中趋势,并且易受极端值影响的是(A)A、算术平均数B、中位数C、众数D、级差(四)几何平均数几何平均数不同于算术平均数和调和平均数,是n个变量值连乘积的n次方根,是计算平均比率和平均速度时比较适用的一种方法,符合人们的认识规律。nnnGXXXXXX321二、离散程度的测度例:观察两只钟的时差:17.38301145fxfx甲:-5、-3、0、+3、+5平均误差0X乙:0、0、0、0、0平均误差0X全距=最大标志值-最小标志值例:某企业有两个车间各10名工人的日产量资料如下:甲车间:20、22、23、25、25、26、26、26、28、29平均日产量25X全距=9乙车间:11、15、18、22、30、29、31、25、34、35平均日产量25X全距=24(一)标准差和方差简单式:nXX2加权式:ffXX2甲组日产量xX-X(X-X)2乙组日产量xX-X(X-X)220222325252626262829-5-3-2001113425940011193511151822302931253435-14-10-7-35460910196100499251636081100合计066合计0612甲组标准差nXX2=2.57乙组标准差nXX2=7.82(二)离散系数XV×100%例:两个农场平均亩产X标准差离散系数XV(%)甲农场3007.52.5乙农场40092.25例:有两个数列,甲数列平均数为100,标准差为12.8;乙数列平均数为14.5,标准差为3.7。据此资料可知(A)。A、甲平均数代表性高于乙B、乙平均数代表性高于甲C、甲乙平均数代表性相同D、无法直接比较甲乙平均数代表性大小例如:(2009年)离散系数比标准差更适用于比较两组数据的离散程度,这是因为离散系数(C)。A、不受极端值的影响B、不受数据差异程度的影响C、不受变量值水平或计量单位的影响D、计算更简单第二十三章时间序列一、时间序列及其分类1、绝对数时间序列、相对数时间序列和平均数时间序列2、绝对数时间序列又分为时期序列和时点序列例如:时间序列由两个基本因素构成,分别为(AD)A、被研究现象所属的时间B、被研究现象分组情况C、被研究现象的动态性D、反映被研究现象一定时间条件下数量特征的指标值E、反映被研究现象一定空间条件下数量特征的指标值二、时间序列的水平分析(一)发展水平(二)平均发展水平(三)序时平均数的计算方法1.总量指标动态数列序时平均数的计算。(1)时期数列序时平均数的计算。nanaaaaannn121(2)时点数列序时平均数的计算。首末折半法(间隔相等):naaaaan2/2/210加权法(间隔不相等):12111232121222nnnnttttaataataaa(3)相对指标(平均指标)数列序时平均数的计算。分母平均数分子平均数bac例:某工业企业资料如下:指标一月二月三月四月工业总产值(万元)180160200190月初工人数(人)600580620600试计算:一季度月平均劳动生产率;一季度月平均劳动生产率==3000(元)(三)增长量与平均增长量1、增长量增长量=报告期水平-基期水平(1)逐期增长量(2)累计增长量(3)两者的关系:逐期增长量之和等于相应的累计增长量三、时间序列的速度分析(一)发展速度与增长速度1、发展速度发展速度=报告期水平÷基期水平(1)环比发展速度:环比发展速度的连乘积等于相应的定基增长速度。(2)定基发展速度:两个相邻的定基增长速度之商等于相应的环比发展速度(3)两者的关系:乘、除关系例:已知环比增长速度为9.2%、8.6%、7.1%、7.5%,则定基增长速度为(D)A、9.2%×8.6%×7.1%×7.5%B、(9.2%×8.6%×7.1%×7.5%)-100%C、109.2%×108.