2.2用样本估计总体(一)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

分层抽样系统抽样随机数法抓阄抽签简单随机抽样抽样方法)(复习回顾1.抽样方法有哪些?类别共同点各自特点相互联系适用范围简单随机抽样系统抽样分层抽样2.三种抽样方式比较1.不放回抽样2.抽样过程中,每个个体被抽取的机会均等从总体中逐个抽取将总体均分为几部分,按简单随机抽样抽取第一个样本,然后按相同的间隔抽取其他样本将总体分成几层,分层进行抽取抽取第一个样本时采用简单随机抽样各层抽样时,采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多(间隔相同的时间或距离)总体由差异明显的几部分组成练习:在下列问题中,各采用什么抽样方法抽取样本较合适?1、从20台电脑中抽取4台进行质量检测;2、从2004名同学中,抽取一个容量为20的样本3、某中学有180名教工,其中业务人员136名,管理人员20名,后勤人员24名,从中抽取一个容量为15的样本。简单随机抽样系统抽样分层抽样如何从样本数据中提取基本信息来估计总体的情况呢?抽样是统计的第一步,接下来就要对样本进行分析。2.2用样本估计总体一、用样本的频率分布估计总体的分布二、用样本的数字特征估计总体的特征平均数、中位数、众数、极差、方差、标准差频率分布表、频率分布直方图、频率折线图、茎叶图①采用抽样调查的方式获得样本数据②分析样本数据来估计全市居民用水量的分布情况我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?探究:你认为,为了较为合理地确定出这个标准,需要做哪些工作?下表给出100位居民的月均用水量表分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?为此我们要对这些数据进行整理与分析初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数。下面将要学习的频率分布图和频率分布表,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。它可以使我们看到整个样本数据的频率分布情况。〈一〉频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布一、频率分布直方图第一步:求极差:(数据组中最大值与最小值的差距)最大值=4.3最小值=0.2所以极差=4.3-0.2=4.1第二步:决定组距与组数:(注意取整)当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便组距的选择应力求“取整”.本题如果组距为0.5(t).则4.18.20.5极差组数=组距第三步:将数据分组:(给出组的界限)所以将数据分成9组较合适.[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9组.第四步:列频率分布表.分组频数频率频率/组距[0-0.5)4[0.5-1)8[1-1.5)15[1.5-2)22[2-2.5)25[2.5-3)15[3-3.5)5[3.5-4)4[4-4.5)2合计100组距=0.50.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.05为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O00.10.20.30.40.50.60.511.522.533.544.5频率/组距月均用水量/t(组距=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面积=?小长方形的面积总和=?月均用水量居民人数最多的在哪个区间?请大家阅读第68页,直方图有哪些优点和缺点?第五步:画出频率分布直方图.同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.分别以1和0.1为组距重新作图,然后谈谈你对图的印象.频率分布直方图的特征:1.频率分布直方图频率分布表更直观地反映了样本的分布规律.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,你能对制定月用水量标准提出建议吗?88%的居民月用水量在3t以下,可建议取a=3.小结:画频率分布直方图的步骤:第一步:求极差:(数据组中最大值与最小值的差距)第二步:决定组距与组数:(强调取整)第三步:将数据分组(给出组的界限)第四步:列频率分布表.(包括分组、频数、频率、频率/组距)第五步:画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.)组距:指每个小组的两个端点的距离组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。注意第几组频数(1)第几组频率样本容量(2)纵坐标为:频率组距练习:例某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.分组频数频率[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67)30.06合计501.00样本频率分布表:(2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267频率组距O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32~52岁的知识分子约占70%.课堂练习2.(2006年全国卷II)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000](元)月收入段应抽出_______人.0.00010.00020.00030.00040.0005月收入(元)频率/组距251000150020002500300035004000频率组距课堂练习0.30.14.34.54.74.95.1视力频率/组距A.0.27,78B.0.27,83C.2.7,78D.2.7,833.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图频率分布折线图由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着样本的容量和分组情况的变化而变化的。利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线并非所有的总体都存在密度曲线,如一些离散型总体不能由样本折线图得到准确的总体密度曲线随堂训练6.如图是总体密度曲线,下列说法正确的是()(A)组距越大,频率分布折线图越接近于它(B)样本容量越小,频率分布折线图越接近于它(C)阴影部分的面积代表总体在(a,b)内取值的百分比(D)阴影部分的平均高度代表总体在(a,b)内取值的百分比c茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39甲乙012345255416167949084633683891叶茎叶当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。1.茎叶图:2.画茎叶图的步骤:1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字;2.将最小茎和最

1 / 93
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功