第4章数据分布特征的度量.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《统计学》第4章数据分布特征的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量4.2.5方差和标准差4.1.1众数4.2.6离散系数4.1.2中位数4.2.7标准化值4.1.3均值4.1.4调和平均数4.1.5几何平均数4.3偏态和峰度的度量4.1.6均值、调和平均数和几何平4.3.1偏态系数均数的比较4.3.2峰度系数4.1.7均值、众数和中位数的比较4.2离散程度的度量4.2.1异众比率4.2.3取值范围4.2.4平均差第4章数据分布特征的度量4.1集中趋势的度量《统计学》2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量原始数据经过分组整理所形成的频数分布,直观和概略地反映出数据分布的基本特征。频数分布属于对数据分布特征的初步描述,缺乏对数据分布特征的综合度量,若需要深入地表述数据分布特征的具体特征和内在联系,还应对数据分布特征进行综合性的度量。数据分布特征的度量包括三个方面的内容,一是数据分布的集中趋势,反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;二是数据分布的离散趋势,反映总体中各个单位的数值水平偏离中心数值的综合程度;三是数据分布的偏态和峰度,反映各个总体单位的数值水平的分布形态是对称或偏倚,平坦或尖耸的具体数值。集中趋势(CentralTendency)是指一组数据所趋向的中心数值。对集中趋势的度量就是采用具体的统计方法和统计测度对这一中心数值的测量和计量,以一综合数值来表述数据所趋向的这一中心数值的一般水平。2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量4.1.1众数众数(Mode)是一组数据中频数最大的变量值,直观地反映了数据的集中趋势。众数是度量定类数据集中趋势的测度,一般用表示。例4.1某品牌运动服装专卖店一批新品球衣销售情况如下表4.1某专卖店新品球衣销售情况件球衣货号前日售出数量当日出售数量AS01-9064AS02-951821AB09-102533SP09-058893SS12-101523PP89-1586合计160180OM2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量4.1.1众数众数(Mode)是一组数据中频数最大的变量值,直观地反映了数据的集中趋势。众数是度量定类数据集中趋势的测度,一般用表示。例4.1某品牌运动服装专卖店一批新品球衣销售情况如下表4.1某专卖店新品球衣销售情况件球衣货号前日售出数量当日出售数量AS01-9064AS02-951821AB09-102533SP09-058893SS12-101523PP89-1586合计160180OM2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量例4.2利用第三章中例3.1中某学期某班35名学生统计学考试成绩的原始数据。要求试计算计算该班35名学生统计学考试成绩的众数。解将该原始数据排序之后,得到有序数据如下52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,982019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量例4.2利用第三章中例3.1中某学期某班35名学生统计学考试成绩的原始数据。要求试计算计算该班35名学生统计学考试成绩的众数。解将该原始数据排序之后,得到有序数据如下52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,9884分在这35名学生的统计学考试成绩的原始数据中出现了4次,属于出现次数最多的变量值,根据众数定义,可以确定众数为84分,即(分)84OM2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量利用已经分组的数值型数据计算众数的场合,需要运用插值公式来计算众数的近似数值。众数的插值公式有下限公式和上限公式。其下限公式从众数所在组的下限出发,有(4.1)上限公式则从众数所在组的上限出发,有(4.2)OOoOMUMLMLMOdFFFFFFLM)()(OOoOMUMLMUMOdFFFFFFUM)()(2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量OM2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量例4.3表4.2为第三章中表3.7“某学期某班35名学生的统计学考试成绩”中的部分数据。根据表4.2的已经分组的数值型数据,计算该班35名学生的统计学考试成绩众数的近似数值。表4.2某学期某班35名学生的统计学考试成绩考分/分人数/人60以下260—70470—80980—901490—1006合计352019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量通过上限公式或下限公式的计算众数所得到的计算结果是一致的。众数是一个通过数据中频数最大的数据的数值来反映集中趋势的测度,为一位置型的代表数值,所以众数的取值不受极端数值的影响,也不受组距分组中开口组设置的影响。当数值型数据中含有极小值和极大值时,使用众数来度量数据的集中趋势,可以作为其它集中趋势测度的补充。众数是一个适用于最低层次的定类数据的测度,因此可以用于各种量表数据的集中趋势分析,有效使用众数的前提是数据的频数分布存在明显的集中态势。2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量通过上限公式或下限公式的计算众数所得到的计算结果是一致的。众数是一个通过数据中频数最大的数据的数值来反映集中趋势的测度,为一位置型的代表数值,所以众数的取值不受极端数值的影响,也不受组距分组中开口组设置的影响。当数值型数据中含有极小值和极大值时,使用众数来度量数据的集中趋势,可以作为其它集中趋势测度的补充。众数是一个适用于最低层次的定类数据的测度,因此可以用于各种量表数据的集中趋势分析,有效使用众数的前提是数据的频数分布存在明显的集中态势。★讨论题:你认为那些现象不适宜采用众数来描述其集中趋势?2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量4.1.2中位数中位数(Median)是位于有序数据正中间位置上的变量值,中位数用其特殊的位置属性直接地体现了集中趋势的中心数值特征。中位数是度量定序数据集中趋势的测度,一般用表示。中位数也是一种位置型的代表数值,同时中位数还是一种顺序统计量,因此,计算中位数要求数值至少具备定序数据的性质。中位数一旦确定,就可以根据中位数的具体取值,将全部数据分成数量相等的两个部分,一半数据的数值小于或等于中位数;另一半数据的数值大于或等于中位数。由此可得出中位数的计算公式。当数据的个数为奇数时,有(4.3)当数据的个数为偶数时,有(4.4)Me21NXMe2122NNXXMe2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量例4.4仍然采用第三章中例3.1某学期某班35名学生的统计学考试成绩的原始数据。要求试计算该班35名学生的统计学考试成绩的中位数。解将原始数据排序之后,得到以下有序数据52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,98该组数据的个数为35,因此采用式(4.3)计算,排列在该组有序数据第18位上的变量值为82分,该班35名学生的统计学考试成绩的中位数为82分。即(分)821821XXMeN2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量利用已经分组的数值型数据计算中位数时,需要运用插值公式计算中位数的近似数值。中位数的插值公式也有下限公式和上限公式。其下限公式从中位数所在组的下限出发,为(4.5)上限公式从中位数所在组的上限出发,为(4.6)4.1集中趋势的度量MeMeMedFSFLMe12MeMeMedFSFUMe122019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量例4.5表4.3为第三章“表3.7某学期某班35名学生的统计学考试成绩”中的部分资料,为已经分组的数值型数据。要求根据表4.3数据,计算该班35名学生的统计学考试成绩的中位数。解运用插值公式计算该班学生统计学考试成绩中位数的近似数值。表4.3某学期某班35名学生的统计学考试成绩考分/分人数/人向上累计人数/人向下累计人数/人60以下223560—70463370—809152980—9014292090—1006356合计35——2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量显然,我们可以任选上限公式或下限公式来计算中位数,得到结果是相同的。中位数是一个顺序统计量,其取值不受极端数值的影响,也不受组距分组中开口组设置的影响。当数值型数据中含有极小值和极大值时,可以使用中位数来度量数据的集中趋势。4.1集中趋势的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量显然,我们可以任选上限公式或下限公式来计算中位数,得到结果是相同的。中位数是一个顺序统计量,其取值不受极端数值的影响,也不受组距分组中开口组设置的影响。当数值型数据中含有极小值和极大值时,可以使用中位数来度量数据的集中趋势。★讨论题:你认为中位数的主要局限是什么?4.1集中趋势的度量2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量4.1.3均值均值(Mean)为一组数值型数据之和除以该组数据总数的商,即同一组数据的总值与其频数的商。在大多数场合,均值采用算术平均方法计算,所以人们经常将均值称为算术平均数(ArithmeticalAverage)。计算均值的数据需要具备数值型数据的属性,均值是一个数值型的集中趋势测度。通过计算均值的运算过程,首先将各个数据之间的数量差异抽象掉了,以一个抽象性的综合测度概括地反映事物的集中趋势。其次将不同总体的总量规模抽象掉了,表现出来的只是一个一般性的代表水平,有利于不同规模的同类总体在不同空间和时间上的广泛比较。2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量1.简单均值简单均值(SimpleMean)是根据未分组的原始数据计算出来的均值。有(4.7)例4.6仍采用第三章中例3.1某学期某班35名学生的统计学考试成绩的原始数据要求试计算该班35名学生的统计学考试成绩的均值。解采用式(4.7)计算,有NXX分80352800NXX2019年12月18日/下午10时36分《统计学》第4章数据分布特征的度量4.1集中趋势的度量2.加权均值加权均值(WeightedMean)是运用各组

1 / 83
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功