2.2用样本估计总体2.2.1用样本的频率分布估计总体分布学习目标1.会列频率分布表,画频率分布直方图、频率折线图、茎叶图.2.能根据实际问题的需求合理地选取样本.课堂互动讲练知能优化训练2.2.1课前自主学案用样本的频率分布估计总体分布课前自主学案温故夯基1.为估计总体所抽的样本必须有很好的代表性.抽样的方法有_____________、系统抽样和_____________.2.初中学统计知识时,画频数分布直方图的步骤是:①计算最大值与最小值的差;②________________;③列频数分布表;④____________________.简单随机抽样分层抽样决定组距和组数画频数分布直方图1.频率分布样本中所有数据(或者数据组)的_____和________的比,就是该数据的频率.所有数据(或者数据组)的频率的分布,可以用频率分布表、频率分布直方图、频率分布折线图、茎叶图等来表示.2.频率分布直方图在频率分布直方图中,纵轴表示_________,数据落在各小组内的频率用____________________表示,各小长方形面积的总和等于____.知新益能频数样本容量频率/组距各小长方形的面积13.频率分布折线图与总体密度曲线连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着___________的增加,作图时所分的______也在增加,相应的频率分布折线图就会越来越接近于一条____________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.样本容量组数光滑曲线4.茎叶图的特点当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来了方便.1.什么是总体分布?提示:总体分布是指总体取值的分布规律,即某小组数据在总体数据中所占的比例大小.2.在一组测量长度的数据(单位:cm)中最小数据为15.2,最大数据为20.3,如果组距为1,那么画频率分布直方图时,可分为几组较好?第一组数据及最后一组数据,如何限定区间?提示:因为20.3-15.2=5.1,可分为6组,第一组可限定为(15.1,16.1),最后一组为(20.1,21.1).问题探究课堂互动讲练频率分布表、频率分布直方图及折线图考点突破频率分布表是反映总体频率分布的表格,一般内容有数据的分组、频率的统计、频数和频率等内容.根据这个表格,就可以在坐标系中画频率分布直方图.横坐标表示数据的分组,纵坐标表示频率组距,将直方图中长方形上端的中点连接起来就是折线图.这三者是相互统一的.例1从高三学生中抽取50名学生参加数学竞赛,成绩的分组及各组的频率如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例.【思路点拨】组距为10,直方图的高度依次为0.004,0.006,0.02,0.03,0.024和0.016.【解】(1)频率分布表如下成绩分组频数频率[40,50)20.04[50,60)30.06[60,70)100.2[70,80)150.3[80,90)120.24[90,100]80.16合计501.00(2)频率分布直方图如图所示.(3)成绩在[60,90)的学生比例即学生成绩在[60,90)的频率,0.2+0.3+0.24=74%.【思维总结】利用样本在某一范围内的频率,近似地估计总体在这一范围内的频率.一般地,频率分布表除最下边的区间是闭区间外,其他区间均为左闭右开区间.茎叶图是一种既能保留原始数据又能展示数据分布情况的表与图的结合.茎叶图例2某中学高二(2)班甲、乙两名同学自上高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较,说明甲、乙两人谁发挥比较稳定.【思路点拨】用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学考试成绩的个位数.作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填.比较时从数据分布的对称性、中位数、稳定性等方面来比较.【解】甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.【思维总结】绘制茎叶图的关键是分清茎和叶.一般地说,如果数据是整数(至少为两位数)的,除个位数字以外的其它数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据特点合理选择茎和叶.变式训练(2010年高考福建卷)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析:选A.将这组数据从小到大排列,得87,89,90,91,92,93,94,96.故平均数x=87+89+90+91+92+93+94+968=91.5,中位数为91+922=91.5,故选A.频率分布直方图的应用列频率分布表和画出频率分布直方图的最终目的是通过样本分布估计总体分布.在估计时,只需要求出相应的样本分布中的有关数据即可推知总体分布的情况.例3为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110次以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?【思路点拨】根据各小长方形面积之和为1,求频率.由第二小组频数求得样本容量,得达标率.【解】(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150(2)由图可估计该校高一学生的达标率约为:17+15+9+32+4+17+15+9+3×100%=88%.故第二小组的频率是0.08,样本容量是150,高一学生的达标率是88%.【思维总结】频率分布直方图也反映了各个范围内取值的可能性,利用样本在这一范围内的频率,可近似估计总体在这一范围内的可能性.方法感悟方法技巧1.在列频率分布表时,极差、组距、组数有如下关系(1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则极差组距的整数部分+1=组数.(如例1)2.茎叶图的制作步骤(1)将数据分为“茎”、“叶”两部分;(2)将最大“茎”与最小“茎”之间的数字按大小顺序排成一列,茎相同者共用一个茎,再画上竖线作为分界线;(3)将各个数据的“叶”在分界线的一侧对应茎处同行列出.失误防范1.频率分布直方图中的纵轴不是频率,而是频率/组距.2.因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.知能优化训练本部分内容讲解结束点此进入课件目录按ESC键退出全屏播放谢谢使用