第三章集中量数[教学目标]1.理解各种集中量数的含义、性质和作用;2.熟练掌握集中量数的计算方法;3.恰当地应用集中量数描述一组数据的集中趋势。第三章集中量数[学习重点]1.各种集中量数的概念和性质2.各种集中量数的计算方法3.各种集中量数的具体应用第三章集中量数集中趋势与离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布中大量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。这两种量数一起共同描述或反映一组数据的全貌及其各种统计特征。第三章集中量数对一组数据集中趋势的度量,就是确定描述一组数据这种特点的代表性的统计量。用于描述数据集中程度的统计量,即集中量数有多种,包括算术平均数、中数、众数、加权平均数、几何平均数、调和平均数等。第三章集中量数第一节算术平均数第二节中数与众数第三节其他集中量数第一节算术平均数一、平均数的计算方法二、平均数的特点三、平均数的意义四、平均数的优缺点五、计算和应用平均数的原则算术平均数是所有观察值的总和除以总频数所得之商。用表示。若以X1,X2,···,XN表示变量X的各个观察值,N表示观察值的个数,则算术平均数可表示为:算术平均数的概念NXNXXXXiN21X(1)在一组数据中每个变量与平均数之差的总和等于0,即。(2)在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C,即。(3)在一组数据中,每一个数都乘以一常数C,则所得的平均数为原来的平均数乘以常数C,即。算术平均数的特点XCNCXi0XXiCXNCXi(1)未分组数据(原始数据)计算法(2)数据分组后(次数分布表)计算法(式中XC为各区间的组中值,f为各区间的次数)算术平均数的计算方法NXNXXXXiN21NfXXc算术平均数的优缺点算术平均数具备一个良好的集中量数所应具备的一些条件:①反应灵敏;②严密确定;③简明易懂;④计算简单;⑤适合代数运算;⑥较少受抽样变动的影响。除此之外,算术平均数还有以下一些特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数;②用加权法可以求出几个平均数的总平均数;③用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的真值,它是总体平均数的最好估计值;④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。但是算术平均数也有一些缺点:①易受极端数据的影响;②若出现模糊不清的数据时,无法计算平均数。算术平均数的意义、适用条件及应用原则算术平均数的意义算术平均数是应用最普遍的集中量数,它是“真值”渐近、最佳的估计值。算术平均数的适用的条件一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就需要用算术平均数表示其集中趋势。计算和应用算术平均数的原则①同质性原则;②平均数与个体数值相结合的原则;③平均数与标准差、方差相结合的原则。第二节中数与众数一、中数二、众数三、平均数、中数与众数的关系中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。中数用Md表示。中数的概念(1)一组数据中无重复数值的情况指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。如果数据个数为奇数,则中数为位置的那个数;如果数据个数为偶数,则中数为居于中间位置两个数的平均数,即第与第位置的两个数据的平均数。(2)一组数据中有重复数值的情况指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。但根据重复数值数据在该组数据中所处的位置又细分为以下两种情况:①当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。②当重复数目位于数列中间时,需要假设位于中间的几个重复数目为连续数目,取序列中上下各那一点上的数值为中数。未分组数据(原始数据)求中数的方法12N21N2N2N将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。或式中为中数所在分组区间的精确下限,为中数所在分组区间的精确上限,为该组以下各组的累加次数,为该组以上各组的累加次数,为该组的次数。数据分组后(次数分布表)求中数的方法MdfifFLMdMdaNa2bLaLbFaFifFLMdMdbNb2中数的意义与应用中数的意义中数虽然也具备一个良好集中量数所应具备的一些条件,如计算简单,严密确定,简明易懂;但与算术平均数相比是相形见绌的,如反应不够灵敏,受抽样的影响较大,不适合代数运算等。因此,在一般情况下,中数不被普遍应用,但在一些特殊情况下,它的应用受到重视。中数适用的情况(1)当一组观测结果中出现两极端数目时;(2)当次数分布的两端数据或个别数据不清楚时;(3)当需要快速估计一组数据的代表值时。一项研究调查了19名大学生,他们的月消费(单位:人民币元)如下:220,227,230,231,232,232,235,236,237,239,240,245,246,249,253,258,260,510,600现欲了解他们的平均月消费?思考题由于这19名大学生的月消费中存在极端数据,算术平均数(元)不能很好地反映他们的平均月消费(19人中17人月消费低于272.63元),应求中数:(元)答:这些大学生的平均月消费是239元。解:10211921N239Md63.272X众数有理论众数和粗略众数两种定义方法。理论众数是指与次数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据(或次数分布)中次数出现最多的那个数的数值。众数用表示。众数的概念0M(1)用观察法直接寻找粗略众数在一组原始数据中,次数出现最多的那个数值就是众数;在次数分布表中,次数最多一组的组中值就是粗略众数。(2)用经验公式求理论众数的近似值①皮尔逊经验法(适合正态分布)②金氏插补法(适合偏态分布)其中为含众数这一区间的精确下限,为高于众数所在组一个组距那一分组区间的次数,为低于众数所在组一个组距那一分组区间的次数。众数的计算方法MMdM230ifffLMbaab0bLafbf众数的意义与应用众数的意义众数虽然简明易懂,较少受两极端数值的影响,但它并不具备一个良好集中量数的基本条件。如极不准确、稳定,反应不灵敏,不适合代数运算,受抽样的影响较大等。因此,在一般情况下,众数应用也不广泛,但在一些特殊情况下也常有应用。众数适用的情况(1)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时;(3)当次数分布中有两极端的数目时;(4)当粗略估计次数分布的形态时。学校要召开运动会,决定从高一年级8个班中抽调40名男生组成一个整齐的彩旗方阵队,如果从高一(1)班的体检表中任意抽出10份男生表格,得到10个男同学的身高(单位:米)如下:1.631.601.681.661.661.631.751.661.581.65请根据这10个身高值提供的信息确定参加方队学生的最佳身高值应取多少?并说明理由。思考题参加方队学生的最佳身高值应取1.66。这是因为从这10个身高值可以看出,1.66出现的次数最多,是这组数的众数,既然这10个男生中有3个身高为1.66米,而一个班远不止10个男生,那么8个班的男生中应该能选出40名这种身高的人。答:(1)当次数分布呈正态时:(2)当次数分布呈正偏态时:且(3)当次数分布呈负偏态时:且算术平均数、中数、众数之间的关系0MMdM0MMdM310MMMdM310MMMdM0MMdM第三节其他集中量数一、加权平均数二、几何平均数三、调和平均数加权平均数的概念加权平均数是不同比重数据(或平均数)的平均数,用表示。加权平均数的计算方法式中为权数加权平均数的应用当测量所得的数据,其单位权重并不相等时,要用加权平均数来求平均数。加权平均数iWiiinnnwWX212211WM几何平均数的概念几何平均数是N个数值连乘积的N次方根,用表示。几何平均数的计算方法几何平均数的应用(1)直接应用公式计算几何平均数当一组实验数据中有少数数据偏大或偏小,数据的分布呈偏态时,要用几何平均数作为集中趋势的代表。(2)应用几何平均数的变式计算当一组数据彼此间变异较大,几乎是按一定的比例关系变化时,要用几何平均数计算平均比率。几何平均数gMNNgXXXM21调和平均数的概念调和平均数(倒数平均数)是一组数据倒数的算术平均数的倒数,用表示。调和平均数的计算方法调和平均数的应用调和平均数在心理与教育研究方面的应用,主要是用以描述学习速度方面的问题。调和平均数HMiiNHXNXNXXXNM11111111121