221用样本频率分布估计总体分布.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2.2.1用样本的频率分布估计总体分布1、用样本去估计总体,是研究统计问题的一个基本思想2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。极差:样本数据中的最大值和最小值的差称为极差相关概念:组距:指每个小组的两个端点的距离组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)。试作出该样本的样本的频率分布表。168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166解:(1)在全部数据中找出最大值180和最小值151,则两者之差29,确定全距为30,决定以组距3将区间[150.5,180.5]分成10个组;(2)从第一组[150.5,153.5]开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表:例2.某铸件厂从规定尺寸为25.40mm的一堆零件中任取100件,测得它们的实际尺寸如下:25.3925.3625.3425.4225.4525.3825.3925.4125.4325.4425.4825.4525.4325.4625.4025.3925.4125.3625.3825.3125.5625.3725.4425.3325.4625.4025.4925.3425.3525.3225.4525.4025.2725.4325.5425.4025.4325.4425.4125.5325.3725.3825.3625.4225.3925.4625.3825.3525.3125.4125.3225.3825.4225.4025.3325.3725.4725.3425.3025.3925.3625.4625.2925.4025.3525.4125.3725.4725.3925.4225.4225.2425.4725.3525.4525.4325.3725.4025.3425.5125.4525.4425.4025.3825.4325.4125.4025.3825.4025.3625.3325.4225.4025.5025.3725.4925.3525.3925.3925.47(1)这100件零件尺寸的极差是多少?(2)如果将这100个数据分为11组,则如何分组?组距为多少?(3)画出以上数据的频率分布表。(4)如果规定尺寸在[25.325,25.475)之间的零件为合格产品抽样检查,合格品率大于85%,这批零件才能通过检验,则这批产品能通过检验吗?•我国是世界上严重缺水的国家之一。2000年全国主要城市中缺水情况排在前10位的城市如何节约用水?例:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:三、样本分析一般通过表、图、计算来分析数据,帮助我们找出样本数据中的规律,使数据所包含的信息转化成直观的容易理解的形式。1、频率分布表2、频率分布直方图它们可以使我们看到整个样本数据的频率分布情况频率分布直方图步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图1.求极差(即一组数据中最大值与最小值的差)2.决定组距与组数组数=4.3-0.2=4.14.10.5=8.2组距极差=3.将数据分组左闭右开区间,最后一组取闭区间[0,0.5),[0.5,1),…,[4,4.5]组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。知识探究(一):频率分布表4.列频率分布表100位居民月平均用水量的频率分布表频率=频数÷样本容量频数=样本数据落在各小组内的个数频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.55.画频率分布直方图小长方形的面积=组距频率=组距×频率注意:①这里的纵坐标不是频率,而是频率/组距;②某个区间上的频率用这个区间矩形的面积表示;直方图0.080.160.300.440.500.280.120.080.04思考:所有小长方形的面积之和等于?频率分布直方图中各小长方形的面积总和为1图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距思考:频率分布直方图非常直观地表明了样本数据的分布情况.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O例从某中学高三年级参加期中考试的1000名学生中,用系统抽样法抽取了一个容量为200的总成绩样本,分数段及各分数段人数如下(满分800分):(1)列出频率分布表;(2)画出频率分布直方图;(3)估计分数在300~600分数段以内的人数在总体中所占的比例;(4)估计分数在600分以上的人数在总体中所占的比例.分数段[300,400)[400,500)[500,600)[600,700)[700,800)人数2030804030(1)样本频率分布表:分组频数频率[300,400)200.10[400,500)300.15[500,600)800.40[600,700)400.20[700,800]300.15合计2001.00(2)样本频率分布直方图:(3)因为0.10+0.15+0.40=0.65,故分数在300~600分数段人数约占65%.人数0.0040.0030.0020.0010300400500600700800频率组距(4)因为0.20+0.15=0.25,故分数在600分以上人数约占25%.一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表频率分布直方图步骤:五、画出频率分布直方图(纵轴表示频率/组距)小结:频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.例1.关于频率分布直方图中小长方形的高说法,正确的是()A.表示该组上的个体在样本中出现的频率B.表示某数的频率C.表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距的比值课堂测试:D2.根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据《法制晚报》报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共500人,如图1是对这500人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为()A.25B.50C.75D.100答案:C频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线——总体密度曲线.总体密度曲线用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39甲乙804631253682543893161679449150注:中间的数字表示得分的十位数字。旁边的数字分别表示两个人得分的个位数。茎叶图当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且可以随时记录,给数据的记录和表示都方便。练习:某中学高一(2)班甲,乙两名同学自高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。小结图形优点缺点频率分布1)易表示大量数据丢失一些直方图2)直观地表明分布地情况信息1)无信息损失只能处理样本茎页图2)随时记录方便记录和表示容量较小数据课堂小结表示样本分布的方法:(1)频率分布表(2)频率分布图(包括直方图和条形图)(3)频率分布折线图(4)茎叶图1.频率分布表表示样本的分布的方法:分组个数累计频数频率频率/组距产品尺寸(mm)2.频率分布直方图样本频率分布中,当样本容量无限增大,组距无限缩小样本频率分布直方图接近于一条光滑曲线——总体密度曲线,反映了总体分布。3.频率分布折线图1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布。2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。小结

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功