第2章统计2.2总体分布的估计学习目标核心素养1.通过对实例的分析,体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率分布折线图,体会它们各自的特点,感受它们在揭示表面上杂乱无序的数据所蕴涵的规律中的作用.(重点)3.会利用样本数据的四种图表估计总体分布.1.通过对问题中数据样本进行分析,培养学生数据分析的数学核心素养.2.通过对样本数据的计算来培养学生数学运算的数学核心素养.自主预习探新知1.频率分布表当总体很大或不便于获得时,可以用_______________估计总体的频率分布,我们把反映总体频率分布的表格称为频率分布表.样本的频率分布2.频率分布直方图(1)我们将_____________的长度称为全距,___________的长度称为组距.(2)把横轴分成若干段,每一段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的频率组距,这样得出一系列的矩形,每个矩形的面积恰好是该组的_____,这些矩形就构成了频率分布直方图.整个取值区间分成的区间频率思考1:(1)对数据分组时,组距、组数的确定有没有固定的标准?(2)当样本容量不超过100时,分多少组合适?[提示](1)组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(2)组数与样本容量有关,一般地,样本容量越大,分的组数也越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.3.频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的_____顺次连接起来,就得到频率分布折线图,简称频率折线图.4.总体分布的密度曲线如果将样本容量取的______,分组的组距取的______,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.中点足够大足够小思考2:几种表示样本分布的方法有什么区别与联系?[提示]名称区别频率分布表从数量上比较准确地反映样本的频率分布规律频率分布直方图直观地反映样本的频率分布情况频率分布折线图直观地反映了数据的变化趋势总体分布的密度曲线虽然客观存在,但要准确画出难度较大,只能用样本频率分布估计.样本容量越大,估计越准确这几种表示样本分布的方法都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:1.下列关于频率分布直方图的说法,正确的是()A.直方图的高表示取某数的频率B.直方图的高表示该组上的个体在样本中出现的频数与组距的比值C.直方图的高表示该组上的个体在样本中出现的频率D.直方图的高表示该组上的个体在样本中出现的频率与组距的比值D[频率分布直方图的高表示该组上的个体在样本中出现的频率与组距的比值.]0.19[根据题意知,四个组的频率之和为1,所以第三组的频率为1-0.27-0.54=0.19.]2.将一批数据分成四组,列出频率分布表,其中第一组的频率是0.27,第二组与第四组的频率之和为0.54,那么第三组的频率是________.3.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]的同学有30人,若想在这n个人中抽取50个人,则在[50,60]之间应抽取的人数为________.15[根据频率分布直方图得总人数n=301-0.01+0.024+0.036×10=100,依题意知,应采取分层抽样,再根据分层抽样的特点,则在[50,60]之间应抽取的人数为50×30100=15.]合作探究提素养频率分布表的制作及应用【例1】(1)容量为20的样本数据,分组的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数234542数据落在区间[10,40)的频率为________.(2)已知一个样本数据:2723252729312730323128262729282426272830以2为组距,列出频率分布表.思路点拨:(1)数据落在区间[10,40)内的频数为9,样本容量为20,所求频率P=920=0.45.故填0.45.(2)依据频率分布表的制作步骤来进行,注意确定分点时,为了避免出现某一数据所在组别不能确定的情况,可以使分点比已知数据多一位小数,并且把第一组的起点稍微减小,故本题的第一组的起点可定为22.5.(1)0.45(2)[解]①计算最大值与最小值的差:最大值为32,最小值为23,它们的差为32-23=9.②已知组距为2,决定组数:因为92=4.5,所以组数为5.③决定分点:[22.5,24.5),[24.5,26.5),[26.5,28.5),[28.5,30.5),[30.5,32.5].④列频率分布表如下:分组频数频率[22.5,24.5)20.1[24.5,26.5)30.15[26.5,28.5)80.4[28.5,30.5)40.2[30.5,32.5]30.15合计2011.频率、频数和样本容量的关系为频率=频数样本容量,利用此式可知二求一.2.制作频率分布表的步骤(1)求全距,决定组数与组距,组距=全距组数;(2)分组,通常对组内数值所在区间取左闭右开区间(或左开右闭区间),最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.提醒:(1)在制作频率分布表时,分组过多或过少都不好.分组过多会给制作频率分布表带来困难,分组过少虽减少了操作,但不能很好地反映总体情况.一般样本容量越大,所分组数应越多.当样本容量不超过100时,按照数据的多少,常分成5组至12组.(2)所分的组数应力求“取整”.组数k=全距组距,若k∈Z,则组数为k;否则,组数为大于k的最小整数,这时需适当增大全距,在两端同时增加适当的范围.(3)在决定分点时,应避免将样本中的数据作为分点,常将分点的数值取比样本中的数据多一位小数.120[某一组的频率等于该组的频数与样本容量的比.由于30n=0.25,所以n=120.]1.一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n等于________.2.对某电子元件进行寿命追踪调查,情况如下:寿命(h)100~200200~300300~400400~500500~600个数2030804030(1)列出频率分布表;(2)估计寿命在100h~400h以内的电子元件所占的百分比.[解](1)寿命频数频率累计频率100~200200.100.10200~300300.150.25300~400800.400.65400~500400.200.85500~600300.151合计2001(2)由频率分布表可以看出,寿命在100h~400h的电子元件出现的频率为0.65,因此我们估计寿命在100h~400h的电子元件所占的百分比为65%.频率分布直方图、折线图的制作与应用【例2】有同一型号的汽车100辆,为了解这种汽车每耗油1L所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油1L所行路程试验,得到如下样本数据(单位:km):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4,其分组如下:分组频数频率[12.45,12.95)[12.95,13.45)[13.45,13.95)[13.95,14.45]合计101.0(1)完成上面的频率分布表;(2)根据上表,在给定坐标系中画出频率分布直方图及频率分布折线图;(3)根据上述图表,估计总体数据落在[12.95,13.95)中的可能性.思路点拨:(1)依据频率分布表的制作步骤完成上面的频率分布表.(2)依据制作频率分布直方图及频率分布折线图的方法步骤绘制频率分布直方图及频率分布折线图.(3)计算出样本数据落在[12.95,13.95)中的频率.[解](1)频率分布表:分组频数频率[12.45,12.95)20.2[12.95,13.45)30.3[13.45,13.95)40.4[13.95,14.45]10.1合计101.0(2)频率分布直方图及频率分布折线图如图.(3)根据上述图表,可知数据落在[12.95,13.95)中的频率为0.3+0.4=0.7,故总体数据落在[12.95,13.95)中的可能性为0.7.1.制作频率分布直方图的方法步骤(1)制作频率分布表.(2)建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,纵轴表示频率组距.(3)画矩形:在横轴上标明各组端点值,以相邻两点间的线段为底,作高等于该组的频率组距的矩形,这样得到一系列矩形,就构成了频率分布直方图.2.频率分布折线图的制作步骤(1)取每个矩形上底边中点.(2)顺次连接各个中点.(3)取值区间两端点需分别向外延伸半个组距,并取此组距上在x轴上的点与折线的首、尾分别相连.3.解决频率分布直方图的相关计算,需掌握下列关系式:(1)频率组距×组距=频率,即小长方形的高乘以宽即为落在相应区间数据的频率.(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量.提醒:频率分布直方图中,每个矩形的高为频率组距,面积为对应组的频率.3.如图是容量为100的样本的频率分布直方图,试根据图中的数据填空:样本数据落在[6,10)内的频率为_______,样本数据落在[10,14)内的频率为________.0.320.36[样本数据落在[6,10)内的频率为0.08×4=0.32,样本数据落在[10,14)内的频率为0.09×4=0.36.]4.通过全国人口普查工作,得到我国人口的年龄频率分布直方图如图,那么在一个总人口数为200万的城市中,年龄在[20,60)之间的人大约有________万.116[在频率分布直方图中,小矩形的面积表示频率,年龄在[20,60)之间的频率约为(0.018+0.011)×20=0.58,200×0.58=116(万),故年龄在[20,60)之间的人大约有116万.]1.本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图,难点是理解用样本的频率分布估计总体分布的方法.2.本节课要重点掌握的规律方法(1)绘制频率分布直方图的步骤.(2)会用频率分布直方图的意义解决问题.当堂达标固双基1.对于样本频率分布折线图与总体分布的密度曲线的关系,下列说法正确的是()A.频率分布折线图与总体分布的密度曲线无关B.频率分布折线图就是总体分布的密度曲线C.样本容量很大的频率分布折线图就是总体分布的密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限趋于总体分布的密度曲线D[总体分布的密度曲线通常都是用样本频率分布估计出来的.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条曲线就是总体分布的密度曲线.]0.12[设剩下的三组中频率最高的一组的频率为x,则另两组的频率分别为x-0.05,x-0.1,而由频率总和为1,得0.79+(x-0.05)+(x-0.1)+x=1,解得x=0.12.]2.容量为100的某个样本,数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为________.3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5),2;[15.5,19.5),4;[19.5,23.5),9;[23.5,27.5),18;[27.5,31.5),11;[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5],3.根据样本的频率分布,估计大于或等于31.5的数据约占_______.13[根据各组数据可知,符合条件的数据占12+7+366=13.]4.在一个容量为80的样本中,数据的最大值是140,最小值是56,组距是10,则应将样本数据分为多少组?[解]当全距组距不是整数时,组数=