第2课时用样本估计总体第2课时用样本估计总体考点探究·挑战高考考向瞭望·把脉高考温故夯基·面对高考温故夯基·面对高考1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距和组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.思考感悟频率分布直方图中纵轴的含义是频率吗?提示:不是.表示的是频率/组距.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的_______,就得到频率分布折线图.(2)总体密度曲线:随着___________的增加,作图时______________增加,_______减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.中点样本容量所分的组数组距3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种____________.平均距离(2)标准差与方差的计算公式s=1n[x1-x2+x2-x2+…+xn-x2];s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].(xn是样本数据,n是样本容量,x是样本平均数)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积______________,由此可以估计中位数的值.应该相等(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的__________.(3)众数:在频率分布直方图中,众数是最高的矩形的中点的___________.横坐标之和横坐标考点探究·挑战高考频率分布直方图考点突破频率分布直方图是从各个小组数据在样本容量中所占比例大小的角度,来表示数据的分布的规律.图中各小长方形的面积等于相应各组的频率,它直观反映了数据落在各个小组的频率的大小.(2010年高考安徽卷)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.例1(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【解】(1)频率分布表:(2)频率分布直方图如图所示:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数17,占当月天数的1730,超过50%,说明该市空气质量有待进一步改善.【规律小结】(1)解决频率分布直方图问题,应注意某一组的频率=某一组频数样本容量=某一组对应小长方形的面积这一关系的灵活运用.(2)利用样本的频率分布,可近似地估计总体的分布,利用样本在某一范围内的频率,可近似地估计总体在这一范围内的概率.一般制作茎叶图的方法是:将所有两位数的十位数字作“茎”,个位数字作“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出,共茎的叶按从大到小(或从小到大)的顺序同行列出.茎叶图美国NBA篮球赛中甲、乙两篮球运动员上赛季某些场次比赛的得分如下:甲:12,15,24,25,31,31,36,36,37,39,44,49,50.乙:8,13,14,16,21,23,24,26,28,33,38,39,51.(1)画出两组数据的茎叶图;(2)试比较这两位运动员的得分水平.例2【思路分析】(1)将十位数字作为茎,个位数字作为叶,逐一统计,样本中有一位数,有两位数,把一位数的十位数字看为0.(2)根据茎叶图分析两组数据,得到结论.【解】(1)为便于对比分析,可将茎放在中间共用,叶分列左、右两侧.如图:(2)从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分及中位数都是30多分.乙运动员的得分除一个51分外,也大致对称,平均得分及中位数都是20多分.因此甲运动员发挥比较稳定,总体得分情况比乙好.【规律小结】当样本数据较少时,用茎叶图表示数据的效果较好.但当样本数据较多时,就不太方便了.因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.同时,茎叶图还可以帮助我们分析样本数据的一些数字特征.平均数、众数、中位数描述一组数据的集中趋势,方差和标准差描述其波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度.一组数据的方差或标准差越大,说明这组数据波动越大.方差的单位是原数据的单位的平方,标准差的单位与原单位相同.用样本的数字特征估计总体的分布甲乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图:例3(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.【解】(1)由图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x甲=10+13+12+14+165=13(分),x乙=13+14+12+12+145=13(分),s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s2甲s2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.【规律小结】平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,要学会通过这些数据分析其含义,从而为正确决策提供依据.当两组数据的平均数相同或相近时,用方差或标准差比较它们的波动大小,样本方差或标准差越大,样本数据的波动越大,稳定性越差;反之,样本数据波动就越小,稳定性越好.方法技巧1.几种表示频率分布方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.方法感悟(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.2.用样本的数字特征估计总体的分布(1)平均数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度.(2)一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同.(3)若x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,…,mxn+a的平均数是mx+a.失误防范在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰.考向瞭望·把脉高考考情分析从近几年的广东高考试题来看,频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.预测2012年广东高考,频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,同时应注意和概率、平均数等知识的结合.(本题满分12分)(2010年高考湖北卷)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示).例规范解答(1)在下面表格中填写相应的频率;分组频率[1.00,1.05)[1.05,1.10)[1.10,1.15)[1.15,1.20)[1.20,1.25)[1.25,1.30)(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.【解】(1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表:分组频率[1.00,1.05)0.05[1.05,1.10)0.20[1.10,1.15)0.28[1.15,1.20)0.30[1.20,1.25)0.15[1.25,1.30)0.028分(2)0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47.10分(3)120×1006=2000,所以水库中鱼的总条数约为2000.12分【名师点评】本题考查了频率分布直方图,试题难度较小,绝大多数考生都能得全分,但仍有些考生对频率等于组距乘以(频率/组距)不理解.1.已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是()A.0.14,0.15B.0.15,0.14C.0.15,0.15D.0.15,0.145答案:D名师预测2.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为()①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏A.1B.2C.3D.4答案:D3.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为()A.1B.2C.3D.2答案:B4.一个容量为32的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为______.答案:20本部分内容讲解结束点此进入课件目录按ESC键退出全屏播放谢谢使用