04第4章 描述统计中的测度

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

4-1-109第4章描述统计中的测度4.1数据分布的集中趋势测度(平均指标)4.2数据分布的离散趋势测度(标志变异指标)4.3数据分布的形状测度(偏态与峰态)4-2-109数据分布的特征集中趋势(位置)偏态和峰态(形状)离中趋势(分散程度)4-3-109数据分布特征的测度数据特征的测度众数中位数平均数离散系数方差和标准差峰态四分位差异众比率偏态分布的形状集中趋势离散程度切尾均值4-4-1094.1数据分布的集中趋势测度(平均指标)4.1.1分类数据:众数4.1.2顺序数据:中位数和分位数4.1.3数值型数据:平均数4.1.4众数、中位数和平均数的比较4-5-109平均指标的概念和作用(一)平均指标的概念1.概念:平均指标又称统计平均数,简称平均数,用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标2.特点:(1)把总体各单位标志值的差异抽象化,掩盖了现象的内部差异;(2)是一个代表值,代表总体各单位标志值的一般水平;(3)只能就同类现象计算。3.作用:(1)平均指标代表现象的一般水平,反映其综合特征(2)平均指标可以反映总体分布的集中趋势,是总体分布的一个(3)平均指标可用于同一总体在不同时间条件下的对比,反映总体的变化发展趋势(4)平均指标可用于同类现象在不同空间条件下的对比,反映现象在不同国家、不同地区、不同单位之间的差异(5)平均指标可用来分析现象之间的依存关系和进行数量上的估算4.类型:(1)从时间上分静态平均数和动态平均数。(2)从范围上分总平均数和组平均数,在抽样统计中区分全及平均数和样本平均数。(3)从计算方法上分算术平均数、调和平均数、几何平均数、众数和中位数。前三种平均数是根据总体所有标志值计算的所以称为数值平均数,后两种平均数是根据标志值所处的位置计算的,因此称为位置平均数。分类数据:众数顺序数据:中位数和分位数数值型数据:平均数众数、中位数和平均数的比较4-10-109集中趋势(centraltendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据4-11-109分类数据:众数4-12-109众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据4-13-109众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:2528283642424-14-109分类数据的众数(例题分析)不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo=可口可乐4-15-109顺序数据的众数(例题分析)解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.04-16-109数值型数据的众数(单项数列)由单项数列资料确定众数按日产量分组(件)工人数(人)2015213022202310(件)210M4-17-109数值型数据的众数(组距数列---组中值法)月工资额(元)教师人数(人)1000以下51000-20001502000-3000503000以上20众数组的上限众数组的下限,(元)::150022000100020ULULM4-18-109数值型数据的众数(组距数列---差补法)按照众数组次数与两个相邻组的次数的差数比例来确定众数数之差众数组次数与后一组次数之差众数组次数与前一组次众数组组距上组限下组限上限公式:下限公式::::,:,:2121202110dULdUMdLM4-19-109众数的几何意义1ooMMff1ooMMffoMfoMoMU4-20-109数值型数据的众数(组距数列差补法)月工资额(元)教师人数(人)1000以下51000-20001502000-3000503000以上2015921000100145100200015921000100145145100000MM上限公式:下限公式:4-21-109顺序数据:中位数和分位数4-22-109中位数(median)1.排序后处于中间位置上的值Me50%50%2.不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据4.各变量值与中位数的离差绝对值之和最小,即min1eniiMx4-23-109中位数(位置的确定)原始数据:分组数据:21n中位数位置2n中位数位置4-24-109顺序数据的中位数(例题分析)解:中位数的位置为300/2=150从累计频数看,中位数在“一般”这一组别中中位数为Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—4-25-109数值型数据的中位数(奇数个数据)【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080521921n位置4-26-109数值型数据的中位数(偶数个数据)【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:123456789105.5211021n位置102021080960中位数4-27-109数值型数据的中位数(组距式分组数据)中位数所在组的组距中位数所在组的次数计次数中位数所在组以上的累计次数中位数所在组以下的累上限下限上限公式:下限公式::,::::,:221111ifSSULifSfUMifSfLMmmmmmemme4-28-109数值型数据的中位数(组距式分组数据例题)年人均纯收入(千元)农户数(户)向上累计次数5以下2402405—64807206—7110018207—870025208—932028409以上1603000合计3000—)(71.611100720230006千元eM4-29-109四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%4-30-109四分位数(位置的确定)原始数据:4)1(341ULnQnQ位置位置分组数据:434ULnQnQ位置位置4-31-109顺序数据的四分位数(例题分析)解:QL位置=(300)/4=75QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为QL=不满意QU=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—4-32-109数值型数据的四分位数(奇数个数据的算例)【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:1234567895.74)19(35.2419UL位置位置QQ15652163015008152850780ULQQ4-33-109数值型数据的四分位数(偶数个数据的算例)【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:1234567891025.84)110(375.24110UL位置位置QQ5.1532)15001630(25.015005.772)750780(75.0750ULQQ4-34-109数值型数据:平均数4-35-109算术平均数(mean)1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.用于数值型数据,不能用于分类数据和顺序数据4-36-109简单与加权算术平均数(simplemean/weightedmean)设一组数据为:x1,x2,…,xn各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fk简单平均数nxnxxxxniin121nfMffffMfMfMxkiiikkk1212211加权平均数4-37-109已改至此!!某电脑公司销售量数据分组表按销售量分组组中值(Mi)频数(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计—1202220011122200185120kkiiiiiikiiMfMfxnf加权算术平均数(例题分析)4-38-109加权算术平均数(权数对均值的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(x):020100人数分布(f):118乙组:考试成绩(x):020100人数分布(f):811)(82108100120101分甲nxxnii)(12101100120801分乙nxxnii4-39-109算术平均数(数学性质)1.各变量值与平均数的离差之和等于零2.各变量值与平均数的离差平方和最小niixx12min)(niixx10)(4-40-109调和平均数是一种独立的平均指标,它是各个标志值倒数的算术平均数的倒数,又称倒数平均数。计算形式有:简单调合平均数加权调和平均数4-41-109简单调和平均数(harmonicmean)nxxxHn111121xn1niinxnxxxn12111114-42-109例题分析某市场3种苹果的价格分别为每斤2元、1.8元和1.5元,若一顾客各买一元的,求其平均价格。解:平均价格=3/(1/2+1/1.8+1/1.5)=1.73(元/斤)4-43-109加权调和平均数(harmonicmean)mxmxmm1niniiniiiniixnxmnmxmm111111niiiniinnnxmmxmxmxmmmmH11221121当时,加权调和平均数可化简成为简单调和平均数形式。12nmmm4-44-109例题分析某市场3种苹果的价格分别为每斤2元、1.8元和1.5元,若分别购买5元、5.4元和4.5元,求其平均价格。解:平均价格=(5+5.4+4.5)/(5/2+5.4/1.8+4.5/

1 / 108
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功