统计学李春红lichunhong0214@126.com1内容简介(51)第1章导论(3)第2章数据的收集(3)第3章数据的整理与展示(3)第4章数据分布特征的测度(9)第5章抽样与参数估计(12)第7章相关与回归分析(3)第8章时间序列分析和预测(8)第9章指数(7)复习答疑(3)2数据类型及图示3数据类型及显示分类数据频数分布表饼图条形图……顺序数据累计频数表折线图环形图……数值型数据分组直方图折线图……低计量层次数据的整理和显示方法可以用于高计量层次数据4第4章数据分布特征的测度54.1集中趋势的测度4.2离散程度的测度4.3偏态与峰态的测度6数据的特征和测度集中趋势离散趋势分布形状4.1集中趋势的测度7一、分类数据:众数二、顺序数据:中位数和分位数三、数值型数据:均值四、众数、中位数和均值的比较集中趋势某银行近一个月有10笔贷款,数额分别为:9万、60万、10万、10万、9万、11万、60万、10万、11万、10万。银行想要了解贷款的一般情况,集中趋势代表水平???8众数()1.集中趋势的测度值之一2.出现次数最多的变量值9Mo10某城市居民关注广告类型的频数分布广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100Mo=商品广告乙城市广告类型人数(人)商品广告服务广告金融广告房地产广告招生招聘广告其他广告40404040400合计20011甲城市广告类型人数(人)商品广告服务广告金融广告房地产广告招生招聘广告其他广告60501860102合计200众数的特点1.可能没有众数或有几个众数2.不受极端值的影响3.主要用于分类数据,也可用于顺序数据和数值型数据1213Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意2413893301584631105合计300100.0中位数()1.集中趋势的测度值之一2.排序后处于中间位置上的值14Me50%50%3.不受极端值的影响4.主要用于顺序数据,也可用数值型数据,但不能用于分类数据123450137100Me某银行近一个月有10笔贷款,数额分别为:9万、60万、10万、10万、9万、11万、60万、10万、11万、10万。银行想要了解贷款的一般情况,集中趋势代表水平???1516Me=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2413893301524162255285300合计300—中位数的计算17时为21时为12221偶数当奇数当nxxnxMnnne中位数位置Me的位置=(n+1)/2数值型数据的计算方法银行贷款:2422212620排序:2021222426位置:1234518中位数22321521n位置3银行贷款:10591268排序:56891012位置:12345619位置n+126+123.5中位数8+928.534四分位数1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值203.不受极端值的影响4.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLMeQU25%25%25%25%四分位数位置的计算21下四分位数(QL)位置=n+14上四分位数(QU)位置=3(n+1)4数值型数据的计算方法银行贷款:23213032282526排序:21232526283032位置:123456722QL=23n+17+1QL位置=4=4=2QU位置=3(n+1)43(7+1)4==6QU=3026银行贷款:232130282526排序:212325262830位置:12345623QL=21+0.75(23-21)=22.5QL位置=n+14=6+14=1.75QU位置=3(n+1)43(6+1)4==5.25QU=28+0.25(30-28)=28.524某生产车间50名工人日加工零件数如下(单位:个)107112117119122123125127130134108113117120122123125127131135108114118120122124126128133137110115118121123124126128133139112117118122123124127129134139)(98.1221个nxxnii均值集中趋势的测度值之一最常用的测度值易受极端值的影响计算时用到所有的数据的信息用于数值型数据,不能用于分类数据和顺序数据251233450133710026某车间50名工人日加工零件频数分布表按零件数分组频数(fi)频率(Fi)105~110110~115115~120120~125125~130130~135135~1403581410640.060.100.160.280.200.120.08合计501.00)(2.12350616011个kiikiiiffMxMifi322.5562.5940.01715.01275.0795.0550.06160.0组中值(Mi)107.5112.5117.5122.5127.5132.5137.5—MiFi6.4511.2518.834.325.515.911.0123.2分组数据的均值27设分组后的数据组中值为:M1,M2,…,Mk•相应的频数为:f1,f2,…,fk•相应的频率为:F1,F2,…,Fk•分组数据的均值的计算公式为kiikiiikffMfffMkfkfMfMx11212211kiiikiikiikiiFMfMkfkffMffM1112211128X甲=700.2+910.3+940.3+720.283.9(分)X乙79.6(分)=910.2+700.3+720.3+940.2姓名统计学成绩数学成绩英语成绩经济学成绩甲70919472乙91707294权重0.20.30.30.275.811nxXniiFiKiiixX1F加权均值29蔬菜名称批发价格(元/公斤)成交额(元)青椒1.218000白菜0.512500茄子0.86400计算三种蔬菜该日的平均批发价格。成交量(公斤)15000250008000平均批发价格=成交额/成交量=36900/48000=0.796(元/公斤)某蔬菜批发市场三种蔬菜的日成交数据如下表所示:xixififi调和平均数1.集中趋势的测度值之一2.加权均值的另一种表现形式3.易受极端值的影响4.用于数值型数据,不能用于分类数据和顺序数据30原来只是计算时使用了不同的数据!iiiiiiiimffxxfxfxH甲、乙两个企业生产三种产品的单位成本和总成本资料如下:分别计算甲、乙两个企业的平均单位成本。31产量fi甲乙140150502177550产品名称单位成本(元)总成本(元)甲乙ABC152030210030001500325515001500元)(41.193406600iiiiimxfxfxH甲xixifi合计—66006255340342元)(29.81乙mH练习三只股票的年收益率分别股票名称第一年第二年第三年第四年A150%-50%150%-50%B90%10%90%10%C50%50%50%50%32%8.1115.0*5.2*5.0*5.24mAG%6.4411.1*9.1*1.1*9.14mBG%5015.1*5.1*5.1*5.14mCG几何平均数1.集中趋势的测度值之一2.主要用于计算平均增长速度3.N个变量值乘积的N次方根331)1(1)1()1()1(121mnniinnGGGGG某公司2002年、2003年、2004年、2005年和2006年的销售额增长率为4.5%、2.0%、3.5%、5.4%、7.2%。计算该公司在这五年内的销售额平均增长率。34=4.51%1%51.1041%2.107%4.105%5.103%0.102%5.10451)1()1()1(21mnnGGGG练习众数、中位数和均值的关系35对称分布均值=中位数=众数左偏分布均值中位数众数右偏分布众数中位数均值36数据类型和所适用的集中趋势测度值数据类型分类数据顺序数据数值型数据适用的测度值※众数※中位数※均值—四分位数中位数—众数四分位数——众数均值1.各变量值与均值的离差之和等于零372.各变量值与均值的离差平方和最小niixx12min)(niixx10)(