3-1第三章统计描述第一节统计图与统计表第二节分布的集中趋势第三节分布的离中趋势第四节分布的偏度和峰度3-2第一节统计表与统计图一、统计表(一)统计表的定义和结构1、统计表:把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。3-32、统计表的结构1)从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。2)从内容上看,统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。此外,统计表还有补充资料、注解、资料来源、填表单位、填表人等。3-4(二)统计表的分类1、按主词的结构分类1)简单表:主词未经任何分组的统计表称为简单表,也称一览表。主词罗列各单位的名称。2)分组表:主词只按一个标志进行分组形成的统计表,也称简单分组表,。3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。3-52、按宾词设计分类1)宾词简单排列是指宾词不加任何分组、按一定顺序排列在统计表上,就是宾词简单排列表。2)宾词分组平行排列是指宾词栏中各分组标志彼此分开,平行排列,就是宾词分组平行排列表。3-6(三)统计表的设计统计表的设计应注意如下事项:1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。2.合计栏的设置。3.标题设计。以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。3-74.指标数值的填写。当数字因小可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“…”表示;不应有数字时用符号“—”表示。5.计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。6.注解或资料来源。在统计表下,应注明资料来源。3-8二、统计图1、直方图:用直方形的宽度和高度来表示次数分布的图形。绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方)。2、折线图:折线图可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成3、曲线图:用平滑曲线连接各组次数坐标点即得分布曲线。3-9第二节统计平均数众数中位数一、主要的统计平均数(一)统计平均数的含义(二)统计平均数的作用(三)统计平均数的分类3-10二、算术平均数1.算术平均数的基本公式计算平均数的要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间一一对应。总体单位数总体标志总量算术平均数3-112.计算方法(1)简单算术平均数。简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以单位总量而得。计算公式:nxnxxxxniin1213-12(2)加权算术平均数。A.加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式:fi为各组标志值出现的次数。niiniiinnnffxffffxfxfxx112122113-13B.权数的意义和作用权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。当各组的次数都相同时,即当f1=f2=f3=…=fn时:加权算术平均数就等于简单算术平均数。nxnfxfffxxnininiiniii11113-143.是非标志的平均数在总体中,具有某种性质的单位占总体的比率为p,不具有该种性质的单位占总体的比率为q,以1作为具有某种性质的单位的标志值,以0作为不具有该种性质的单位的标志值:p也称为总体中具有某种属性的单位成数,是非标志的平均数。pqpqpffxxniiniii01113-154.算术平均数的数学性质(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:niixxn1niiiniifxxf113-16(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:niiniixxnxx110)(niniiniiiininiiiixffxfxxfxxf111110)(3-17(3)各标志值与算术平均数离差的平方和为最小值。(4)对被平均的变量实施某种线性变换后,新变量的算术平均数等于对原变量的算术平均数实施同样的线性变换的结果。(5)对于任意两个变量x和y,它们的代数和的算术平均数等于两个变量的算术平均数的代数和。niixx12min)(3-18三调和平均数1.简单调和平均数:标志值的倒数的算术平均数的倒数。nxxxHn111121niinxnxxxn12111113-192.加权调和平均数计算公式:在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形:niiiniinnnxmmxmxmxmmmmH11221121niiniiiniiiiniiiniiiniiffxxfxfxxmm1111113-20当各组标志总量相等,m1=m2=…=mn时,加权调和平均数可化简成为简单调和平均数形式。niniiniiiniixnxmnmxmm1111113-21四、几何平均数1.几何平均数:是n项标志值连乘积的n次方根。2.分类:(1)简单几何平均数:是n个标志值xi连乘积的n次方根。计算公式为:G=式中G表示几何平均数,xi表示各项标志值。nnnxxxx11213-22(2)加权几何平均数加权几何平均数是各标志值fi次方的连乘积的次方根,计算公式为:G=niiiniinffiffnffxxxx1121213-23四、幂平均数设有一组变量求各变量k次方的和:根据算术平均数的数学性质1,以幂平均代替各具体变量xi,其数值总和不变,则称为k阶幂平均数,当k取不同的整数值时,幂平均数就给出不同的数值平均数计算公式。nikiknkkkxxxxx1321nikknikkkixnxx11)()(knikiknxx/11/3-24当k=1时,幂平均数,为算术平均数计算公式。当k=-1时,幂平均数,为调和平均数计算公式。当时,为几何平均数计算公式。nxnxxxk1111111111nxnxxxknnkkkkkxxxxnxx321100limlim0k3-25幂平均数的是关于k阶的递增函数,即幂平均数是随着k的增大而增大,随着k的减少而减少,当k1k2时,就有:因为算术平均数、几何平均数、调和平均数都是幂平均数的k阶数由1递减为0又减为-1的特例,三者之间的一般数量关系为:调和平均数小于几何平均数小于算术平均数;当各变量相等时,调和平均数等于几何平均数等于算术平均数。22111kkkknxnx3-26五、众数Mo1.定义:众数是指社会现象总体中最普遍出现的标志值。2.众数的确定1)单项式分配数列确定众数:出现次数最多的标志值就是众数。2)组距式分配数列确定众数:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。3-273.众数的几何意义1ooMMff1ooMMffoMfoMoMLoMU3-284.组距式数列确定众数的公式下限公式:上限公式:ooooooooMMMMMMMModffffffLM)()(111ooooooooMMMMMMMModffffffUM)()(1113-29六、中位数1.定义:中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值,在总体中,标志值小于中位数的单位占一半;标志值大于中位数的单位也占一半。3-302.中位数的确定1)未分组资料确定中位数。将总体各单位的标志值按照大小顺序排列,当总体单位数n为奇数时:当总体单位数n为偶数时,:21nexm2122nnexxm3-312)单项式分组资料确定中位数当为奇数时:,当为偶数时,f21fexmf2122ffexxm3-323)组距式分组资料确定中位数下限公式:上限公式:eeeeMMMMedfSfLM12eeeeMMMMedfSfUM123-333.众数、中位数和算术平均数的关系区别:1)三者的含义不相同;2)三者的计算(确定)方法不同;3)对资料的要求不同,4)对数据的“灵敏度”、“抗耐性”和“概括能力”不同。3-34联系:(1)三者都是作为反映总体一般水平(或集中趋势)的平均指标:(2)三者之间存在着一定的数量关系,A.在对称的正态分布条件下:算术平均数等于众数等于中位数:B.在非对称正态分布的情况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。eoMMx3-35当次数分配呈右偏(正偏)时:算术平均数受极大值的影响当次数分配呈左偏(负偏)时,算术平均数受极小值的影响中位数则总是介于众数和平均数之间。oeMMxxMMeo3-363、皮尔生经验法则分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:)(3eoMxMx3-37第三节分布的离中趋势一、变异指标的含义与作用1.定义:变异指标反映总体内部的离中趋势或变异状况。变异指标值越大,表明总体各单位标志的变异程度越大。2.作用:(1)衡量平均指标的代表性。(2)反映现象变动的均衡性。(3)研究总体标志值分布偏离正态的情况。(4)进行抽样推断等统计分析的一个基本指标。3-38二、极差与四分位差1、极差:1)极差也称全距,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。2)计算公式:(未分组)(分组)式中:Umax代表最高组的上限;Lmin代表最低组的下限。3)特点:计算简便,直观易于理解。minmaxxxRminmaxLUR3-392、四分位差1)计算公式:数列的3/4位次与1/4位次的标志值之差除以2。2)特点:四分位差避免了数列中极端值的影响,但去头弃尾,丢失大量的原始数据。3-40三、平均差(A.D)1、定义:平均绝对偏差,总体所有单位的标志值与其平均数的离差绝对值的算术平均数。2、计算公式:3、特点:概括地反映了所有单位标志值的变异程度,但因取绝对值,数学性质不理想,实际中较少用。niiniiiniiffxxDAnxxDA111.,.3-41四、方差与标准差(一)数量标志的方差与标准差1、数量标志方差与标准差的计算。其计算公式为:未分组的资料:方差:标准差:nxxnii122)(nxxnii12)(3-42用分组资料计算方差:标准差niiniiiffxx1122)(niiniiiffxx112)(3-432、总方差、组间方差和组内方差。在资料分组的条件下,总体各标志值对平均数的方差可以分解为组内方差和组间方差。其关系式:式中:代表总体方差;代表组内方差的平均数;代表组间方差。222i22i23-443、方差与标准差的数学性质:1)变量的方差等于变量平方的平均数减去变量平均数的平方。即:222)(xx3-452)变量对其算术平均数的方差小于对任意常数的方差。因为