用样本的频率分布估计总体分布(二)用样本的频率分布估计总体分布一频率分布图和频率分布直方图二频率分布折线图和总体密度曲线三莖叶图(stem-and-leafdisplay)频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限地接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?2.2总体分布的估计频率组距月均用水量(mm)ab当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近条光滑曲线——总体密度曲线.S阴影部分的面积表示总体在区间(a,b)内取值的百分比.用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在每个区间内取值百分比。总体密度曲线反映了总体在每个区间内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线1、有的总体没有密度曲线,例如总体是掷骰子试验的所有可能出现结果。一定能用样本的频率分布折线图准确的估计总体的密度曲线吗?2、尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用样本来估计,由于样本是随机的,它的频率分布拆线图不是惟一的,而是随着样本的容量和分组情况的变化而变化,因此不能由样本的频率分布折线图准确估计密度曲线。茎叶图甲乙两名篮球运动员每场比赛得分的原始记录如下:甲得分:13,51,23,8,26,38,16,33,14,28,39乙得分:49,24,12,31,50,31,44,36,15,37,25,36,39012345甲乙346836938812554161679490一般地:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。1.茎叶图的概念:一般地,画出一组样本数据的茎叶图的步骤如何?第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的数按从小到大次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎右(左)侧.注意:在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”部分;同一数据出现几次,就要在图中体现几次.茎叶图甲乙两名篮球运动员每场比赛得分的原始记录如下:甲得分:13,51,23,8,26,38,16,33,14,28,39乙得分:49,24,12,31,50,31,44,36,15,37,25,36,39012345甲乙634836938812545161679490012345甲乙3468369388125541616794902.茎叶图的特征:(1)茎叶图表示数据的优点:一、保留了原始数据,没有损失样本信息;二、数据可以随时记录、添加或修改;(2)茎叶图表示数据的缺点:一、茎叶图只便于表示两位有效数字的数据,对样本数据个数较多或位数较多时不太方便;二、茎叶图只方便记录左右两组数据;三、分析只是粗略的,对差异不大的两组数据不易分析。几种表示频率分布的方法的优点和不足:1.频率分布表:反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便。2.频率分布直方图:能够非常直观的表明数据分布的形状,一般是中间高、两端低、左右对称的峰状结构。但是从直观图把原有的具体数据信息就被抹掉了。3.频率分布折线图:反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线。4.茎叶图:由所有的样本数据组成,没有损失任何样本信息,也可以在抽样时随时记录,但在样本数据个数较多或位数较多时就不适用了,况且只能记录左右两组数据,分析也比较粗略。在本赛季的NBA比赛中,我国著名篮球运动员姚明所在的休斯敦火箭队战绩骄人,下面是火箭队在最近10场比塞中,姚明与队友麦克格雷迪各自的得分情况:姚明麦迪34741421097202216420358茎叶图场次一二三四五六七八九十姚明20121411142227171413麦迪22212624103538222019姚明麦迪74443211097202012246358练习:某市对上、下班交通情况做抽样调查,上、下班时间各抽取了12辆机动车行使时速如下:(单位:km/h)上班时间:303318273240262821283520下班时间:271932293629302225161730用茎叶图表示上面的样本数据,并求出样本数据的中位数。解:依题意,茎叶图如下上班下班8196708186727992552303260004练习:1、右面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()012345甲乙824719936250328754219441AA.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分