1.2.1用样本的频率分布估计总体的分布【学习目标】通过实例体会频率分布的意义和作用,在表示样本数据的过程中,学会列出频率分布表、画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点。【概念形成】1、画频率分布直方图的一般步骤:(1)(2)(3)(4)(5)2、频率分布折线图的画法:连接中各小长方形上端的,就得到频率分布折线图。3、总体密度曲线:样本容量,所分组数,各组的频率就越接近于在相应各组取值的概率.设想样本容量无限,分组的组距无限,则频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线.它反映了在各个范围内取值的概率.4、茎叶图用茎叶图表示数据有两个突出的优点,一是从统计图上没有的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在,方便记录与表示。5、众数是指:,中位数是指【例题选讲】例1某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需要定期对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的100件钢管进行检测,把这100件钢管的质量分布情况作为总体的质量分布情况来看待。根据规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们特别希望知道所有生产的钢管中优等品所占的比例,这时就可以用样本的分布情况估计总体的分布情况。下面的数据是一次抽样中的100件钢管的内径尺寸:25.3925.3625.3425.4225.4525.3825.3925.4225.4725.3525.4125.4325.4425.4825.4525.4325.4625.4025.5125.4525.4025.3925.4125.3625.3825.3125.5625.4325.4025.3825.3725.4425.3325.4625.4025.4925.3425.4225.5025.3725.3525.3225.4525.4025.2725.4325.5425.3925.4525.4325.4025.4325.4425.4125.5325.3725.3825.2425.4425.4025.3625.4225.3925.4625.3825.3525.3125.3425.4025.3625.4125.3225.3825.4225.4025.3325.3725.4125.4925.3525.4725.3425.3025.3925.3625.4625.2925.4025.3725.3325.4025.3525.4125.3725.4725.3925.4225.4725.3825.39上面的100个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据用统计的方法加以概括和整理。下面我们列出这组样本数据的频率分布表、频率分布直方图,步骤如下:(1)计算级差(一组数据中最大值与最小值的差)(2)决定组距与组数(样本容量不超过100时,组数常分为5~12组)如果组距定为0.03,那么级差/组距=,于是应将样本数据分成组(组距还可以定为其他的数值)(3)决定分点将第1组的起点定为,组距为,这样所分的组分别是:[,]、[,]……(4)列频率分布表分组个数累计频数频率频率/组距25.235~25.265125.265~25.295225.295~25.325525.325~25.3551225.355~25.3851825.385~25.4152525.415~25.4451625.445~25.4751325.475~25.505425.505~25.535225.535~25.5652合计---------------------(5)绘制频率分布直方图(1)其中纵轴表示(2)小长方形的面积==(3)各长方形的面积总和等于(4)从频率分布表或频率分布直方图容易看出,优等品所占的比例等于,于是可以估计出所有生产的钢管中有的优等品。例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50。乙的得分:8,13,14,16,23,26,28,33,38,39,51。试用茎叶图表示以上两名运动员的成绩,并求出样本数据中的中位数。【巩固提高】1)、对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是()(A)频率分布直方图与总体密度曲线无关(B)频率分布直方图就是总体密度曲线(C)样本容量很大的频率分布直方图就是总体密度曲线(D)如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线2)、在用样本频率估计总体分布的过程中,下列说法中正确的是()(A)总体容量越大,估计越精确(B)总体容量越小,估计越精确(C)样本容量越大,估计越精确(D)样本容量越小,估计越精确3)、10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,数0.4是指1号球占总体分布的()(A)频数(B)概率(C)频率(D)累计频率4)、已知样本:12711121112101098131210961189810那么频率为0.25的样本的范围是((A)(B)(C)(D)5)、频率分布直方图中,小长方体的面积等于()(A)相应各组的频数(B)相应各组的频率(C)组数(D)组距6)、在总体密度曲线中,总体在区间(a,b)内取值的百分率就是直线______、_______、_______和总体密度曲线围成的图形的面积.7)、对100位大学毕业生在该年七月份求职录取情况调查结果如下:20人录取在行政机关,31人录取在公司,3人录取在银行,18人录取在学校,其余的还在求职中.那么七月份这100位大学生还未被录取的频率为_______________.8)、一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n=_______________.9)、已知某样本的频率分布表如下:分组频数频率频率/组距[10.75,10.85)3[10.85,10.95)9[10.95,11.05)13[11.05,11.15)16[11.15,11.25)26[11.25,11.35)20[11.35,11.45)7[11.45,11.55)4[11.55,11.65)2合计100(1)完成上面的频率分布表.(2)根据上表,画出频率分布直方图.(3)根据上表,估计数据落在[10.95,11.35)范围内的百分比约为多少?10)、甲乙两个小组各10名学生的英语口语测试成绩如下(单位:分):甲组:76908486818786828583乙组:82848589798091897974试用茎叶图表示两个小组的成绩。