高中数学-用样本频率分布估计总体分布(1)课件-新人教A版必修3

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2.2.1用样本的频率分布估计总体分布频数:在总体(或样本)中,某个个体出现的次数叫做这个个体的频数。频率:某个个体的频数与总体(或样本)中所含个体的数量的比叫做这个个体的频率。性质:在总体(或样本)中,各个个体的频率之和等于1。3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2通过抽样我们得到了100户居民的某年的月平均用水量为了确定一个比较合理的标准a,必须先了解全市居民的日常用水量的分布情况。通过抽样调查了解居民的用水情况。列频数分布表和画频数分布直方图1.求极差:步骤:4.3-0.2=4.12.决定组距与组数:组数=4.10.5=8.2组距极差=3.将数据分组[0,0.5),[0.5,1),…,[4,4.5]列频数分布表和画频数分布直方图步骤:数学高考总复习人教A版·(理)第四模块平面向量、数系的扩充与复数的引入分组频数累计(划记)[0,0.5)[0.5,1)正[1,1.5)正正正[1.5,2)正正正正丅[2,2.5)正正正正正[2.5,3)正正[3,3.5)正[3.5,4)[4,4.5]丅合计频数4815222514642频率0.040.080.150.220.250.140.060.040.021频率/组距0.080.160.30.440.500.280.120.080.04数学高考总复习人教A版·(理)第四模块平面向量、数系的扩充与复数的引入频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=?数学高考总复习人教A版·(理)第四模块平面向量、数系的扩充与复数的引入频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积总和=?数学高考总复习人教A版·(理)第四模块平面向量、数系的扩充与复数的引入频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5月均用水量最多的在那个区间?数学高考总复习人教A版·(理)第四模块平面向量、数系的扩充与复数的引入频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5请大家阅读第68页,直方图有那些优点和缺点?数学高考总复习人教A版·(理)第四模块平面向量、数系的扩充与复数的引入问题5总结画频率分布直方图的操作步骤1.求极差,即数据中最大值与最小值的差2.决定组距与组数组数=极差/组距3.将数据分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间4.登记频数,计算频率和频率/组距,列出频率分布表5.画出频率分布直方图(纵轴表示频率/组距)0.511.522.533.544.5频数(个)月平均用水量(t)27242118161396305.画频数分布直方图分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100频率0.040.080.150.220.250.140.060.040.021分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100频率频率0.040.080.150.220.250.140.060.040.021频率月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100频率0.040.080.150.220.250.140.060.040.021频率/组距0.080.160.30.440.50.280.120.080.044.列频率分布表频率/组距频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.55.画频率分布直方图思考:各小长方形的面积之和等于多少?分组频数累计(划记)频数[0,0.5)4[0.5,1)正8[1,1.5)正正正15[1.5,2)正正正正丅22[2,2.5)正正正正正25[2.5,3)正正14[3,3.5)正6[3.5,4)4[4,4.5]丅2合计100频率0.040.080.150.220.250.140.060.040.021频率/组距频率/组距0.080.160.30.440.500.280.120.080.04问题5总结画频率分布直方图的操作步骤1.求极差,即数据中最大值与最小值的差2.决定组距与组数组数=极差/组距3.将数据分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间4.登记频数,计算频率和频率/组距,列出频率分布表5.画出频率分布直方图(纵轴表示频率/组距)同样一组数据,如果组距不同,得到的图的形状也会不同。影响组数与组距的因素因素1:样本容量的大小;因素2:原始数据的精细程度;当样本容量不超过100时,常分成5~12组。这是由统计经验获得的。频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.021思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.021分析:月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下.因此,居民月用水量标准定为3t是一个可以考虑的标准.频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.021想一想:你认为3t这个标准一定能够保证85%以上的居民用水不超标吗?如果不一定,那么哪些环节可能会导致结论的差别?所得到的结论的统计意义3t这个标准一定能保证85%以上的居民用水不超标吗?不一定!原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。所得到的结论的统计意义一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。频率分布表和频率分布直方图在带给我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。频率分布直方图的优缺点是什么?连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。直方图(0.5组距)00.10.20.30.40.50.6频率/组距思考:上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?分析:样本容量越大,这种估计越精确。但随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线.频率组距产品尺寸(mm)ab当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线——总体密度曲线.区间在总体内取值的概率),(ba总体密度曲线总体密度曲线用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线思考:对于一个总体,如果存在总体密度曲线,这条曲线是否惟一?频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.由于样本是随机的,不同的样本得到的不同频率分布折线图;即使对与同一样本,不同的分组情况得到的也不同频率分布折线图。频率分布折线图是随着样本容量和分组情况变化而变化的。1、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录为:甲运动员的得分:135123826381633142839乙运动员的得分:49241231503144361537253639我们可以画出茎叶图,也就是中间的数表示十位数,旁边的数表示两个人得分的个位数,就象一棵树的茎与叶子一样,能更直观地看出这两个人的得分情况。例题:茎叶图甲乙0123452554161679490846336838911、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39茎叶图叶就是从茎的旁边生长出来的数,表示得分的个位数。茎是指中间的一列数,表示得分的十位数画茎叶图的步骤:1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字。2.将最小茎和最大茎之间的数按大小次序排成一列。3.将各个数据的叶按读数次序(或按大小次序)写在其茎的左(右)侧。茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。报纸随堂练习1,2报纸随堂练习3,)(频数∵分析:149121315141310-10014.010014频率

1 / 55
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功