01用样本的频率分布估计总体分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

通过抽样方法收集数据的目的是什么?从中寻找所包含的信息,用样本去估计总体我国是世界上严重缺水的国家之一,城市缺水问题较为突出.2.2用样本估计总体2.2.1用样本的频率分布估计总体分布为了节约生活用水,某市政府计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费.(1)如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?(2)为了较合理地确定这个标准,你认为需要做哪些工作?3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2假设通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t,其他在0.2t~4.3t之间.频率分布表和频率分布直方图(1)求极差(一组数据中的最大值与最小值的差).例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1t.(2)决定组距与组数.设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1.【课堂探究1】为方便起见,组距的选择应力求“组数取整”.在本问题中,组数=极差÷组距=4.1÷0.5=8.2,因此可以将数据分为9组,这个组数是比较合适的,于是取组距为0.5,组数为9.当样本容量不超过100时,组数一般为5~12组(4)列频率分布表.计算各小组的频率,作出下面的频率分布表.(频数=样本数据落在各小组内的个数,频率=频数÷样本容量)(3)将数据分组.以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5].列频率分布表:分组频数累计频数频率[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计48152225146420.040.080.150.220.250.140.060.041001.00频率=样本容量频数注意:频数的合计应是样本容量,频率合计应是1.0.02频率/组距0.080.160.300.440.500.280.120.080.04频率分布表一般分“分组”,“频数累计”(可省),“频数”,“频率”,“频率/组距”五列,最后一行是合计(5)画频率分布直方图.根据频率分布表可以得到如图所示的频率分布直方图:月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图来反映样本的频率分布.【提升总结】频率分布直方图第一步:画平面直角坐标系.第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.0.100.200.400.50月均用水量/t0.30O频率/组距0.511.52.53.54.5234各组的频率在图中哪里显示出来?各小长方形的面积=频率.各小长方形的面积之和是否为定值?各小长方形的面积之和为1.宽度:组距高度:频率组距月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?【课堂探究2】月均用水量/t0.100.200.300.400.50O频率/组距0.511.52.53.54.5234大部分居民的月均用水都在1t~3t之间如果市政府希望85%以上的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民在3t以下,标准可定为3t.在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?在实际中,对统计结论是需要进行评价的.【课堂探究3】频率分布直方图如下:月均用水量/t0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.o频率/组距频率分布折线图:月均用水量/t0.100.200.300.400.500.511.522.533.544.5o频率/组距利用样本频率分布对总体分布进行相应估计:(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?(2)样本容量越大,这种估计越精确.(3)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线——总体密度曲线.总体密度曲线月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比).o频率/组距总体密度曲线和横轴围成的面积之和为1!总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总体分布的工具.用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的百分比.例、某地区为了了解知识分子的年龄结构,随机抽样30名,其年龄分别如下:32,43,46,45,37,42,38,45,48,39,38,42,49,44,36,51,39,56,40,46,44,47,48,34,45,51,46,52,44,57.(1)列出样本频率分布表.(2)画出频率分布直方图.(3)估计年龄在37岁~52岁的知识分子所占的比例约是多少.解:(1)极差为57-32=25,取组距为5,分为5组.分组频数频率频率/组距[32,37)30.10.02[37,42)60.20.04[42,47)120.40.08[47,52)60.20.04[52,57]30.10.02合计301.00样本频率分布表:(2)样本频率分布直方图:年龄0.090.080.070.060.050.040.030.020.01323742475257O(3)因为0.2+0.4+0.2=0.8,故年龄在37岁~52岁的知识分子约占80%.频率/组距2、总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.1、频率分布直方图的步骤:(1)求极值(2)决定组距与组数(3)分组(4)画频率分布表(频数,频率,频率与组距的商)(5)画频率分布直方图1.将样本容量为100的数据按从大到小的顺序分为8组如下表:912131514141310频数87654321组号则第三组的频率为()A.0.14B.1/14C.0.03D.3/14A2.(2013·辽宁高考)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为若低于60分的人数是15,则该班的学生人数是()A.45B.50C.55D.6020,40,40,60,60,80,80,100频率组距成绩/分B优化探究第31页探究一、探究二3.(2014·山东高考)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kpa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…….,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.1B.8C.12D.18C【解析】选C.由图知,样本总数为20500.160.24N.设第三组中有疗效的人数为x,则60.3650x,解得12x.

1 / 26
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功