1统计学原理第四章平均指标与变异指标2第一节平均指标的概念和作用一、平均指标的概念同类社会经济现象在一定时间、地点条件下所达到的一般水平的综合指标。概括地描述统计分布的一般水平或集中趋势的数值。特点:代表性、抽象性平均指标=总体标志总量/总体单位数3二、平均指标的作用(一)可以了解总体次数分布的集中趋势(二)可以对若干同类现象在不同单位、地区间进行比较研究(三)可以研究某一总体某种数值的平均水平在时间上的变化,说明总体的发展过程和趋势(四)可以分析现象之间的依存关系(五)平均指标可作为某些科学预测、决策和某些推算的依据4众数中位数平均数位置平均数数值平均数算术平均数调和平均数几何平均数第二节平均指标5公式中,1231ninixxxxxxnn_xxn1、简单算术平均数适用于未分组资料,用总体各单位标志值加总得到标志总量除以总体单位总量而得。计算公式为:代表算术平均数。表示各单位标志值。表示总体单位数。一、算术平均数(mean)6应用:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:分平均成绩73536558253649075一、算术平均数(mean)7按家庭人口数分组(人)家庭数1234550150300200100合计800某村800个家庭人口数根据以下资料计算某村平均家庭人口数?82、加权算术平均数(Weightedmean)①根据单项数列计算加权算术平均数计算公式:112233111niinninniiiixfxfxfxfxfxff应用条件:单项式分组,各组次数不同。9例:某车间20名工人加工某种零件资料:按日产量分组(件)x工人数(人)f日产总量xf14228154601681281758518118合计20319件平均日产量1620319求平均日产量10②根据组距数列计算加权算术平均数应用条件:组距式分组,各组次数不同。按日产量分组(公斤)工人数f组中值x日产总量xf20—30102525030—407035245040—509045415050—6030551650合计200—8400公斤平均日产量422008400例:某车间200名工人日产量资料:求平均日产量11权数对均值的影响甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(x):020100人数分布(f):118乙组:考试成绩(x):020100人数分布(f):811)(82108100120101分甲nxxnii)(12101100120801分乙nxxnii12在组距数列中,均值大小不仅受组中值大小的影响,也受权数的影响,因此()A.当组中值较大且权数较大时,均值接近组中值大的一方B.当组中值较小且权数较小时,均值接近组中值小的一方C.当组中值较大而权数较小时,均值接近组中值大的一方D.当组中值较小而权数较大时,均值接近组中值小的一方E.当各组的权数相同时,权数对均值的大小没有影响133、是非标志的平均数是非标志:当总体单位某种品质标志的具体表现为“是”与“非”或“有”与“无”两种情况。是非标志x单位数f比重10合计N10N1NffpNN1qNN0111010niiiniixfxfNNNP是平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。14例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志平均数。95%xP153、算术平均数的数学性质(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:niixxn1niiiniifxxf1116(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:niiniixxnxx110)(niniiniiiininiiiixffxfxxfxxf111110)(17(3)各标志值与算术平均数离差的平方和为最小值。niixx12min)(184、算术平均数特点1)集中趋势的最常用测度值2)一组数据的均衡点所在3)易受极端值的影响4)用于数值型数据,不能用于定类数据和定序数据19二、调和平均数例:一个人步行两里,走第一里时速度为每小时10里,走第二里时为每小时20里,则平均速度为?1110202113()3里小时20二、调和平均数1.简单调和平均数:标志值的倒数的算术平均数的倒数。nxxxHn111121niinxnxxxn121111121菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种蔬菜共3斤,每斤0.33元;中午降价时又用1元钱买了4斤,每斤0.25元;晚上削价处理又用1元钱买了5斤,每斤0.2元。试问蔬菜平均每斤多少钱?22速度x行走里程m所需时间201152103合计6)(小时里xm201152103103152201)(2912126103152201小时里平均速度232.加权调和平均数缺少总体单位数计算公式:niiiniinnnxmmxmxmxmmmmH11221121niiniiiniiiiniiiniiiniiffxxfxfxxmm11111124例班组平均劳动生产率x实际工时产品产量(件)m一101001000二122002400三153004500四203006000五302006000合计—110019900xm)(09.18110019900)xm()m(工时件车间实际工时车间产品产量平均劳动生产率25车间投入量产出量合格率%x一100080080二80072090三7205047033%450%70%90%80三个车间平均合格率10005047205048007201000800%70%90%80例:某企业生产某种产品需经过三个连续作业车间才能完成。26三、几何平均数(geometricmean)1、简单几何平均数2、加权几何平均数123nnniGxxxxx应用条件:资料未分组(各变量值次数都是1)。计算公式:312111231nniiniiinfffffffniiGxxxxx应用条件:资料经过分组,各组次数不同。计算公式:27年份累计存款额本利率%第1年105%第2年105%第3年108%………第10年112%%105%5000xxx2000%105%5%105%105xxx%108%105%8%105%105202020xxx23320%112%110%108%105x例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率?0x设本金为28%77108%112%110%108%105102332平均本利率本利率x年数f105%2108%3110%3112%2合计10平均年利率=8.77%29三种平均数之间的关系H≤G≤X30四、众数(mode)1.定义:众数是指社会现象总体中最普遍出现的标志值。1)一组数据中出现次数最多的变量值2)适合于数据量较多时使用3)不受极端值的影响4)一组数据可能没有众数或有几个众数31众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242322.众数的确定1)单项式分配数列:出现次数最多的标志值2)组距式分配数列:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。334、单项式数列不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo=可口可乐34按日产量分组(件)工人数(人)201521302220231021()oM件354)组距式数列确定众数的公式下限公式:上限公式:ooooooooMMMMMMMModffffffLM)()(111ooooooooMMMMMMMModffffffUM)()(1111ooMMff1ooMMffoMfoMoMLoMU36例:00000000)()(1110MMMMMMMMdfffffflM年人均纯收入(千元)农户数(户)5以下2405—64806—711007—87008—93209以上160合计3000)(6161)7001100()4801100(48011006千元农户年人均收入众数计算表37判断法则1、当众数相邻的两组次数相等时,则众数组的组中值就是众数;2、当众数组前一组的次数较多,后一组的次数较少时,则众数在众数组内靠近他的下限;3、当众数组后一组次数较多,前一组的次数较少时,则众数在众数组内靠近他的上限。38五、中位数(median)1、中位数的含义:将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数。2、确定中位数的方法(1)由未分组资料确定中位数排序找中间位置39中位数?【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080521921n位置40中位数?【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789105.5211021n位置102021080960中位数411、未分组资料确定中位数的方法:将总体各单位的标志值按照大小顺序排列当总体单位数n为奇数时:当总体单位数n为偶数时:21nexm2122nnexxm42(2)分组数列确定中位数——累计频数到50%所对应的变量值例:按日产量分组(件)x工人数(人)f累计次数向上累计向下累计20101080221525702430555526258025合计80——43定序数据的中位数解:中位数的位置为300/2=150从累计频数看,中位数在“一般”这一组别中中位数为Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—44(3)由组距数列确定中位数计算公式12()eeeefMeMMMsMLdf下限公式12()eeeefMeMMMsMUdf上限公式45例年人均纯收入(千元)农户数(户)向上累计次数5以下2402405—64807206—7110018207—870025208—932028409以上1603000合计3000—3000720261671()1100eM千元(1)计算累计次数(2)确定中位数组(3)根据中位数计算公式计算中位数3000150022f中位数位次:462、单项式分组资料确定中位数当为奇数时:,当为偶数时,eeeeMMMMedfSfLM12f21fexmf2122ffexxm3、组距式分组资料确定中位数下限公式:上限公式:eeeeMMMMedfSfUM1247六、众数、中位数和平均数的比较1、区别:1)三者的含义不相同;2)三者的计算(确定)方法不同;3)对数据的“灵敏度”和“概括能