求平均数的方法1、定义法:已知nxxx,,,21为某样本的n个数据,则这n个数据的平均数为:nxxxxn212、新数据法:数据nxxx,,,21在某个固定常数a附近波动,可先将每个数据减去a,得到一组新数据axaxaxn,,,21,计算平均数x,则原数据的平均数为axx3、加权平均数:样本中,数据x1有m1个,x2的m2个,……,xk的mk个,则平均数kkkmmmmxmxmxx2122114、频率法:一般地:若取值为nxxx,,,21的频率分别为nPPP,,,21,则平均数nnPxPxPxx22115、组中值法:若样本为n组连续型数据,则样本的平均数=组中值与对应频率之积的和=总频数的和组中值与对应频数之积平均数性质:bxabaxbaxbaxbxxaxxxxnn的平均数为则的平均数为若,,,,a,,,,321321若E(ax+b)=aE(x)+b问题?在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.你认为选谁呢?§2.2.2用样本的数字特征估计总体的数字特征(二)标准差、方差1、众数、中位数和平均数都是描述一组数据_________的量.2、两名射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677分别求出这两名运动员射击成绩的众数、中位数和平均数,对这次射击情况应如何评价?特征信息众数中位数平均数甲乙777777条形图甲的环数极差=10-4=6乙的环数极差=9-5=41、极差:在一定程度上表明了样本数据的_______,它对______非常敏感,由此可以得到一种统计策略:“______________,______________”.分散程度极端值去掉一个最高分去掉一个最低分比较分散相对集中s表示.2、标准差:考察样本数据的_______________最常用的统计量,是样本数据到_______的一种__________,一般用(2)标准差的大小,受样本中每个数据的影响,如果数据间变异大,则标准差也大,反之则小.因此,标准差越大,数据的离散程度______,标准差越小,数据的离散程度_______;(1)标准差的表达式:分散程度的大小平均距离平均数越大越小222121[()()()]nsxxxxxxn3、方差:即标准差的平方2s.(1)方差的表达式:2_________________________________________________s;(2)方差也是反映数据离散程度的特征数字.2222121[()()()]nsxxxxxxn(1)方差的表达式:(2)方差也是反映数据离散程度的特征数字.方差性质:D(ax+b)=a2D(x)方差性质:223212321,,,,a,,,2sabaxbaxbaxbxsxxxxnn的方差为则的方差为)若(0,,,,1的方差为)(cccc【预习自测】1.设6,5,4321xxx,则该样本的标准差为()A.33B.36C.35D.372.甲、乙两射击运动员在一次连续10次的射击中,所射中环数的平均数一样,但方差不同,则()A、他们水平相同B、方差较大的,潜力较大C、方差较小的,发挥较稳定D、方差较小的,发挥较不稳定5102000.51.01.52.0人数时间3.某篮球队在一个赛季的六场比赛中分别进球的个数为:10,11,12,11,14,8.则该球队平均每场进球____个,方差为__________________。BC1110/35102000.51.01.52.0人数时间4、某校随机调查了50名学生在某天各自的课外阅读所用的时间结果如图所示,根据条形图可得这50名学生这天平均每人的课外阅读时间为()小时A、0.6B、0.9C、1D、1.5B某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:等待时间(分钟)[0,5)[5,10)[10,15)[15,20)[20,25]频数48521用上述分组资料计算出病人平均等待时间的估计值=________.解析:=20(1)(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5.答案:9.5x示例1:画出下列四组样本数据的条形图,说明它们的异同点.(1)(2)(3)(4)示例2:甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲乙从生产的零件内径的尺寸来看,谁生产的质量较高?X甲≈25.401X乙≈25.406s甲≈25.401S乙≈25.4013、若样本121,1,,1nxxx的平均数是7,方差是2,则样本1221,21,,21nxxx的平均数是__________,方差是____________________。133、若样本121,1,,1nxxx的平均数是7,方差是2,则样本1221,21,,21nxxx的平均数是__________,方差是____________________。8频率分布直方图的应用[典例]为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?[解](1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析:(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.答案:(1)3(2)6000为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:分组(单位:岁)频数频率[20,25)50.05[25,30)①0.20[30,35)35②[35,40)300.30[40,45]100.10总计1001.00(1)频率分布表中的①②位置应填什么数据?(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.解:(1)设年龄在[25,30)岁的频数为x,年龄在[30,35)岁的频率为y.根据题意可得100(x)=0.20,100(35)=y,解得x=20,y=0.35,故①处应填20,②处应填0.35.(2)由频率分布表知年龄在[25,30)岁的频率是0.20,组距是5.所以组距(频率)=5(0.20)=0.04.补全频率分布直方图如图所示:根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数为500×0.07×5=175.