主讲人:吴锦桂管理学院3.1集中趋势的度量3.2离散程度的度量3.3偏态与峰态的度量1.集中趋势各测度值的计算方法、特点及应用场合2.离散程度各测度值的计算方法、特点及应用场合3.偏态与峰态的测度方法4.用Excel和SPSS计算描述统计量并能分析结果的实际意义集中趋势(中心位置)偏态和峰态(形状)离中趋势(分散程度)1、集中趋势度量1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值集中趋势1.1、集中趋势度量之分类数据我们班的性别要找个中心值是什么?分类数据eg1:财管人力会计会计练习&思考?eg2:男性女性男性女性女性女性女性女性女性女性女性女性男性eg3:财管财管人力会计会计eg4:财管人力会计eg5:优秀良好良好及格eg6:2345533343353一组数据中出现次数最多的变量值适合于数据量较多时使用主要用于分类数据,也可用于顺序数据和数值型数据众数不唯一,可以没有众数不受极端值的影响不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100Mo=可口可乐计算饮料品牌的众数?练习Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.0计算回答类别的众数?练习男皮鞋号码/厘米销售量/双24.01224.58425.011825.554126.032026.510427.052合计1200某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货商场某季度男皮鞋的销售情况,得到资料如表:鞋号25.5厘米就是众数数值型分组数据某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】计算50名工人日加工零件数的众数练习1.众数的值与相邻两组频数的分布有关4.该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算MoMoiffffffLM)()(1110L:众数组下限;f:众数组频率;f-1:众数组前一组的频数;f+1:众数组后一组的频数;i:组距某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】计算50名工人日加工零件数的众数01481205=123(148)(1410)M1.2、集中趋势度量之顺序数据顺序数据与分类数据相比不同是什么?顺序数据顺序——位置!中位数和四分位数中位数排序后处于中间位置上的值Eg1:及格及格良好良好优秀Eg2:及格及格良好良好优秀优秀位置确定21n中位数位置为偶数为奇数nxxnxMnnne1222121数值确定Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—计算回答类别的中位数?练习eg1:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080521921n位置练习&思考?中位数主要使用于顺序数据,也试用于数值型数据,但不适用于分类数据eg2:男性女性男性男性女性【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789105.5=21+10=21+=n位置)(102021080960元中位数练习中位数所给的资料已分组(1)根据单项数列确定中位数经管学院2011到2012学年共有30名同学获得奖学金,其分布情况见下表学生获奖学金分布情况及计算表奖学金金额(元/人)人数(人)人数累计向上累计(人)向下累计(人)300500800100015003687639172430302721136合计30——中位数=800元例:某车间工人日产量如下:甲组:18,19,20,20,21,21,22乙组:19,20,21,21,22,23,23,24练习则:甲组日产量的中位数为20件;乙组日产量的中位数为(21+22)/2=21.5件四分位数1.排序后处于25%和75%位置上的值QLMeQU25%25%25%25%eg1:及格及格中等中等良好良好优秀优秀方法2:较准确算法SPSS确定法4)1(341ULnQnQ位置位置方法1:定义算法434ULnQnQ位置位置方法3:Excel给出的四分位数位置的确定方法43LnQ位置413UnQ位置解:QL位置=(300)/4=75QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为QL=不满意QU=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—例子【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:12345678975.649325.249UL位置位置QQ方法1具体位置不是整数怎么办?***如果位置不是整数,则按比例分摊位置两侧数值的差值abkb-aQ()akba1001500.2550Q1000.25(150100)112.5以2.25位置的分位数计算为例:【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:12345678975.649325.249UL位置位置QQ5.79725.0)780850(780LQ5.143775.0)12501500(1250UQ方法1【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789方法25.74)19(35.2419UL位置位置QQ15652163015008152850780ULQQ【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789方法3741933439UL位置位置QQ850LQ1500UQ主要用于顺序数据,也可用于数值型数据,但不可用于分类数据不受极端值的影响总结:中位数和四分位数1.3、集中趋势度量之数值型数据我们班的统计学成绩要找个中心值是什么?数值型数据平均数Eg1:原始数据:10591368Eg2:男性女性男性男性女性Eg3:中等中等良好优秀优秀平均数适用于数值型数据,不适用于分类和顺序数据9.59.09.58.47.09.98.08.5去掉一个最低分7.0(分)去掉一个最高分9.9(分)参赛选手最后得分8.8(分)减少极端值的影响权数与加权23456781924.421191817263554432221x某售货小组有5名售货员,某天的销售额分别为960元、1680元、1530元、1350元、2040元,则平均每个售货员日销售额为:5i1xx5960168015301350204051512(元)练习某学院一年级学生有200人,二年级学生有150人,三年级学生100人,四年级学生200人。某日学院召开全院大会,一年级学生缺席4%,二年级学生缺席6%,三年级学生缺席5%,四年级学生缺席8%,试问全院学生缺席百分之几?练习xf4200615051008200kiii1kii1fxxf4*2006*1508*2005*100x20015010020038005.85650练习所以,该日全院学生缺席5.85%。[例]根据提供的40名同学的统计学成绩原始资料分组整理如下表,根据此表资料计算平均成绩。40名同学统计学成绩汇总表11306076.540KiiiKiixfxf(分)解:设各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fknfMffffMfMfMxkiiikkk1212211样本加权平均总体加权平均NfMffffMfMfMkiiikkk1212211练习:根据表中资料计算平均体重。解:体重(公斤)人数(f)46-48449-512052-542555-573858-602161-631264-665kiii1kii=1fMxf694912555.59公斤组中值(M)47505356596265体重(公斤)人数(f)46-48449-512052-542555-573858-602161-631264-6651.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小1()0niixxnii1x2(-A)xA当时最小⑴ni12i112xx()()()()0nnxxxxxxxxxnxxxnn(-)证明⑵所以当时,原式有最小值221122112211221()22nniiiinniiiinniiiiniixAxxxAxxnxAxxxAxxnxAxAxxxxnxAxA证明1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大且数据较多时应用2.中位数不受极端值影响与平均数相比,数据分布偏斜程度较大时应用中位数更好点平均数易受极端值影响针对偏态分布的数据,平均数的代表性差数据对称分布或接近对称分布时应用低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据众数中位数、平均数的关系左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值均值中位数众数练习——什么分布?在次数分布偏斜程度不大的情况下,无论是右偏态还是左偏态,三者之间存在一定的比例关系,即中位数始终处于算术平均数和众数的中间,众数于中位数的距离约为算术平均数与中位数的两倍。即:0e2()eMMMX0e32MMX0e2X3MM对上式整理得到:032eMMX例:根据某校统计学期末考试的成绩资料计算得到的众数为78分,算术平均数为67分,那么中位数为多少?其次数分布呈何形态?解:由于众数78中位数71算术平均数67,说明统计学期末成绩分布呈左偏倾斜,算术平均数受低端成绩的拉动,小于中位数和