某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,37,39,44,49,50.问题1:如何分析该运动员的整体水平及发挥的稳定程度?问题2:初中统计部分曾学过用什么来反映总体的水平?用什么来考察稳定程度?我们还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就是我们今天要学习的茎叶图。在初中我们学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度。图叶茎322..黄建忠制作.)(,,,,:的顺序同行列出或从小到大般按从大到小共茎的叶一上向下列出茎按从小到大的顺序从茎相同者共用一个茎叶个位数字作为茎为字作将所有两位数的十位数制作茎叶图的方法.,,,,,,,,,,,,::50494439373636313125241512情况如下赛的得分比场各季赛某在员运动某篮球上述问题54321个位数表示叶:十位数表示茎:分界线2545116679490.,,,,,,.,,依次类推分一个分一个分两个分第三行说明有两个分分和明得分为第二行说同理分分和员的得分为这一行说明该运动这表示个位数字和的右侧字数表示十位左侧的线界行分一图中第393736312524151252154321个位数表示叶:十位数表示茎:分界线.,,,,发挥比较稳定说明其集中程度高且分布较对称之间到众数都在位数、该运动员平均得分及中出从这张图可以直观地看40202545116679490.,,,,,,,,,,.,,,,,,,,,,,,.,513938332826231614138504944393736363131252415125乙甲得分水平试比较这两位运动员的下赛季每场比赛的得分如甲、乙两篮球运动员上例.,,,如图叶分左、右两侧间共用可将茎放在中为便于对比分析画出两人得分的茎叶图解.,,,不能遗漏得分要重复记录的相同写的顺序从小到大侧的按右到小的顺序写大从左侧的叶按.,,同其他各行与此分分、分、分为得乙分分、得分为第二行表示甲1614131215094976611545213893683468543210甲乙094976611545213893683468543210甲乙甲运动员的得分基本上是对称的,叶的分布是“单峰”的,乙除了一个特殊得分(51分)外,也大致对称,但是,从叶在茎的分布情况来看,甲运动员的得分更集中于峰值附近,这说明甲发挥得更稳定。1、为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午8:00-10:00间各自的点击量:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?频数茎叶21078111127636867220131268427861043204134230下表一组数据是某车间30名工人加工零件的个数,设计一个茎叶图表示这组数据,并说明这一车间的生产情况.134112117126128124122116113107116132127128126121120118108110133130124116117123122120112112练习:该车间的工人加工零件数大多都在110到130之间,且分布较对称,集中程度高,说明日生产情况较稳定,工人的技术水平较接近。小结.,.,:好了茎叶图的效果就不是很样本数据很多时但当叶图便于记录和表示二是茎从这张茎叶图中得到一是所有的信息都可以个优点用茎叶图刻画数据有两(一)众数、中位数、平均数一众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数:一组数据的算术平均数,即)(121nxxxnX问题1:众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?平均数:反映所有数据的平均水平众数:反映的往往是局部较集中的数据信息中位数:是位置型数,反映处于中间部位的数据信息1、求下列各组数据的众数(1)、1,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9众数是:32、求下列各组数据的中位数(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:43、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数。解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米)。这组数据的平均数是1(1.5021.603...1.901)1.6917x米二、众数、中位数、平均数与频率分布直方图的关系频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。如何在频率分布直方图中估计众数可将众数看作直方图中面积最大长方形的“中心”00.10.20.30.40.50.6月均用水量/t0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02前四个小矩形的面积和=0.49后四个小矩形的面积和=0.262.02如何在频率分布直方图中估计中位数分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.02149.022.015.008.004.002.0x02.202.02在样本中中位数的左右各有50%的样本数,条形面积各为0.5,所以反映在直方图中位数左右的面积相等.,中位数)可将中位数看作整个直方图面积的“中心”0.50.01x如何在频率分布直方图中估计平均数=2.02)()()(1001)(1001100991254110021xxxxxxxxxx1009912541100210081004xxx25.4402.0215.008.025.0004.0=2.02平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。可将平均数看作整个直方图面积的“重心”人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900例:某工厂人员及工资构成如下表:(1)指出这个工厂人员周工资的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映该工厂人员的工资水平吗?为什么?【解】(1)由表格可知:众数为200,中位数为220.平均数为(2200+250×6+220×5+200×10+100)÷23=(2200+1500+1100+2000+100)÷23=6900÷23=300.(2)虽然平均数为300,但由表格中所列出的数据可知,只有经理在平均数以上,其余人员的工资都在平均数以下,故用平均数不能客观地反映该工厂的工资水平.课堂练习:1、假设你是一名交通部门的工作人员。你打算向市长报告国家对本市26条公路项目投资的平均资金数额,其中一条新公路的建设投资为2200万元人民币,另外25个项目的投资在20万与100万.中位数是25万,平均数是100万,众数是20万元。你会选择哪一种数字特征来表示每一个项目的国家投资?你选择这种数字特征的缺点是什么?选择平均数更好:因为,此时的众数20万比中位数25万还小,所以众数代表的是局部的数。中位数代表的虽然是大多数公路投资的数额,但由于其不受极端值的影响,不能代表全体,因而此时成了它的缺点。选择平均数较好,能比较好的代表整体水平,但缺点是仍不能显示出具体的数字特征(二)情境一;甲.乙两名射击队员,在进行的十次射击中成绩分别是:甲:10;9;8;10;8;8;10;10;9.5;7.5乙:9;9;8,5;9;9;9.5;9.5;8.5;8.5;9.5试问二人谁发挥的水平较稳定?分析:甲的平均成绩是9环.乙的平均成绩也是9环.一.实例引入情境二:某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下:(单位cm)甲:31323537333032313029乙:53165413661613111662问:哪种玉米苗长得高?哪种玉米苗长得齐?x=32乙x=32甲怎么办呢?甲37(最大值)29(最小值)8乙66(最大值)11(最小值)55极差甲:31323537333032313029乙:53165413661613111662甲32372937321166乙极差:一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度离散程度为了对两人射击水平的稳定程度,玉米生长的高度差异以及钢筋质量优劣做个合理的评价,这里我们引入了一个新的概念,方差和标准差.设一组样本数据,其平均数为,则x称s2为这个样本的方差,称为这个样本的标准差,分别称为样本方差、样本标准差它的算术平方根222121[()()()]nsxxxxxxn2222121[()()()]nsxxxxxxnx1,x2,…,xn•样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。例1.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1)解:190(13214023)908x.所以这组数据的方差为5.5,标准差为2.3.见课本76-77页练习:若甲、乙两队比赛情况如下,下列说法哪些说法是不正确的:甲乙平均失球数平均失球个数的标准差1.52.11.10.41、平均来说,甲的技术比乙的技术好;2、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;4、乙队很少不失球。全对例2:甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm),试根据这组数据估计哪一种水稻品种的产量比较稳定.2品种第一年第二年第三年第四年第五年甲9.89.910.11010.2乙9.410.310.89.79.8解:10)2.10101.109.98.951(甲x02.05])102.10()1010()101.10()109.9()108.9[(222222甲s10)8.97.98.103.104.951(乙x24.05])108.9()107.9()108.10()103.10()104.9[(222222乙s较稳定。,所以甲水稻的产量比小于因为乙甲xx1、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为_________________;2、已知数据的方差为2,则求数据的方差。123,,aaa1232,2,2aaa9.5,0.016三.当堂反馈思考一下:12,,,nxxxx2s12,,,nxbx