第二章统计复习人教A版必修③本章回顾本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.总体抽样分析估计简单随机抽样系统抽样分层抽样样本分布样本特征数总体分布总体特征数说明:1.抽样公平性原则—等概率—随机性;2.抽签法适用与总体中个数N不大的情形.1.将总体中的所有个体编号(号码可以从1到N);2.将1到N这N个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);3.将号签放在同一箱中,并搅拌均匀;4.从箱中每次抽出1个号签,并记录其编号,连续抽取k次;5.从总体中将与抽到的签的编号相一致的个体取出.2.1抽样方法1.简单随机抽样(1)抽签法例题——1系统抽样(等距抽样)例子.为了解高一年级500名同学的视力情况,试用系统抽样从中抽取50名同学进行检查。S1:把500人从1到500编号;S3:在第一段1~10号中用的的方法抽取一个号码,比如3;S4:依次抽取……这50个号码。这样就得到了一个容量为50的样本。S2:计算分段间隔为k=人。把编号从小到大依次分成段,每段人;编号分段定首号取余号501050050=10简单随机抽样3,13,23,33,2.1抽样方法(2).随机数表法:将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可以是00,01,02,…,99.这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表.当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:(1)对总体中的个体进行编号(每个号码位数一致);(2)在随机数表中任选一个数作为开始;(3)从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;(4)根据选定的号码抽取样本.将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可以是00,01,02,…,99.这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表.当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:(1)对总体中的个体进行编号(每个号码位数一致);(2)在随机数表中任选一个数作为开始;(3)从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止;(4)根据选定的号码抽取样本.例子:下面我们用随机数表法求解本节开头的问题.(1)对50个同学进行编号,编号分别为01,02,03,…,50;(2)在随机数表中随机地确定一个数作为开始,如第8行第29列的数7开始.为便于说明,我们将附表中的第6行至第10行摘录如下:1622779439495443548217379323788735209643842634916484421753315724550688770474476721763350258392120676630163785916955567199810507175128673580744395238793321123429786456078252420744381551001342996602795457608632440947279654491746096290528477270802734328第29列第8行(3)从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,29,42这10个号码,就是所要抽取的10个样本个体的号码.小结:1.抽样无放回;2.抽样公平性;3.抽签法,随机数表法—简单的随机抽样.系统抽样的步骤为:(1)采用随机的方式将总体中的个体编号;(2)将整个的编号按一定的间隔(设为k)分段,当(N为总体中的个体数,n为样本容量)是整数时,k=;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N′能被n整除,这时k=,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号l;(4)将编号为l,l+k,l+2k,…,l+(n-1)k的个体抽出.NnNnNn1Nn2.系统抽样:第四步将编号为,+10,+20,…,+610的个体抽出,组成样本.第三步在第一段000,001,002,…,009这十个编号中用简单随机抽样确定起始号码;因为624的10%约为62,624不能被62整除,为了保证“等距”分段,应先剔除4人.例;某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10%的工人进行调查.如何采用系统抽样方法完成这一抽样?0i分析:第一步将624名职工用随机方式进行编号;解:第二步从总体中剔除4人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,…,619),并分成62段;0i0i0i0i小结:1.适用与总体中个体无明显的层次差异;2.系统抽样—等距抽样.一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样(stratifiedsampling),其中所分成的各个部分称为“层”.分层抽样的步骤是:(1)将总体按一定标准分层;(2)计算各层的个体数与总体的个体数的比;(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;(4)在每一层进行抽样(可用简单随机抽样或系统抽样).3.分层抽样例某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为1200人,其中持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱2435456739261072电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?分析:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥.说明:1.适用与总体中个体有明显的层次差异,层次分明的特点;2.总体中个体数N较大时,系统抽样,分层抽样二者选其一.类别特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取总体中的个体个数较少抽样过程中每个个体被抽到的可能性相同系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体个数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成以上我们学习了三种抽样方法,这些抽样方法的特点及适用范围可归纳如下:3.某校有行政人员、教学人员和教辅人员共200人,其中教学人员与教辅人员的比为101,行政人员有24人,现采取分层抽样容量为50的样本,那么行政人员应抽取的人数为()A3B4C6D8C教学人员和教辅人员应抽取的人数分别为_____和_____.404用样本估计总体1.作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数;(组数=极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。例子:2009年义乌小商品博览会共设国际标准展位5000个。为了解展览期间成交状况,现从中抽取100展位的成交额(万元),制成如下频率分布表和频率分布直方图:分组频数频率频率/组距[150,170)40.04[170,190)0.05[190,210)[210,230)[230,250]5合计1536500.500.05100频率/组距0.0021501701902102302500.0060.0100.0140.0180.0220.026万元0.360.040.050.360.500.050.0020.00250.0180.0250.0025例子:2009年义乌小商品博览会共设国际标准展位5000个。为了解展览期间成交状况,现从中抽取若干展位的成交额(万元),制成如下频率分布表和频率分布直方图:频率/组距0.0021501701902102302500.0060.0100.0140.0180.0220.026万元0.040.050.360.500.05试通过直方图估计:(1)众数;(2)中位数;(3)平均数;最高矩形区间中点面积相等(概率0.5)区间中点与相应概率之积的和220万元212万元209.4万元小结:1.频率直方图中矩形条的面积=组距=频率;2.频率分布表频率直方图后者更直观形象地反映样本的分布规律.频率组距2.3总体特征数的估计1.平均数12naaaan2.方差,标准差设一组样本数据,其平均数为,则称12,,,,nxxxx2211()niisxxn211()niisxxn为这个样本的方差,其算术平方根为样本的标准差,分别简称样本方差、样本标准差.小结:1.方差,标准差是用来刻画样本的稳定性;2.比较的标准——越小越好。例:甲、乙两种冬水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.82.4线性相关关系:能用直线方程ˆybxa近似表示的相关关系叫做线性相关关系.x1x2x3xnxy1y2y3yny线性回归方程:一般地,设有n个观察数据如下:……2221122()()...()nnQybxaybxaybxaˆybxa当a,b使取得最小值时,就称这n对数据的线性回归方程,该方程所表示的直线称为回归直线.为拟合.______y25x81.05x.0y.1^的估计值为时,,则已知回归方程.________a_______,__________b.2数用最小二乘法求回归系11.69n1i2n1ii2in1in1iin1iiiixxnyxyxnxby7.小王记录了产量x(吨)和能耗y(吨标准煤)对应的四组数据,用最小二乘法求出了,不慎将一滴墨水滴于表内,表中第二行第四列的数据已无法看清,据您判断这个数据应该是多少?35.07.0ˆxyx3456y2.5344.5思考:您如何判断x与y成线性相关关系?思考:您认为小王求出的线性回归直线方程对吗?思考:如果原来100吨产品的能耗为90吨煤;试预测现在的能耗比技术改造前降低了多少吨煤?x3456y2.5344.5解:所以线性回归方程为y=0.7x+0.355.3,5.4yx7.05.44865.35.445.662b35.0297.05.3a由系数公式可知,..D.Cyx.Byx.A.3性关系相关关系是一种非确定;变量之间有无相关关系点图,可判断由两个变量所对应的散唯一确定;不能由么确定关系,那变量之间的关系若是非都是变量;和在线性回归分析中,)下列说法不正确的是(CˆA.5.751.75yxˆB.1.755.75yxˆC.1.755.75yxˆD.5.751.75yx4.三点(3,10),(7,20),(11,24)的线性回归方程是()D