第十二章统计(文)2012高考调研考纲要求1.了解简单随机抽样、分层抽样的意义,会用它们对简单实际问题进行抽样.2.会用样本频率分布估计总体分布.3.会利用样本估计总体期望和方差.考情分析《统计》是文科选修内容,主要从生产、生活的实际需要出发,介绍一些较简单的统计知识,在高考中所占比重不大,但由于初中阶段已有“统计初步”的基础,并且本章知识在解决实际问题时应用广泛,故高考新课程卷每个都会设置一道4—5分的小题.本章的主要内容包括:抽样方法中的简单随机抽样和分层抽样、样本估计中的样本平均数、样本方差等知识.其实它们又是一个有机的整体,即通过科学合理的抽样,使样本能够反映总体的情况,再通过对样本数据的处理、分析来得到对总体分布的认识.第五十六讲抽样方法与总体分布的估计第五十六讲抽样方法与总体分布的估计回归课本1.抽样方法(1)简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.实现简单随机抽样,常用抽签法和随机数表法.(2)分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.2.总体分布的估计总体分布:总体取值的概率分布规律通常称为总体分布.用样本的频率分布估计总体分布时,就要对样本数据进行如下整理:①计算最大值与最小值的差;②决定组距与组数;③决定分点,然后列出频率分布表,再绘制出频率分布直方图.考点陪练1.对于简单随机抽样和分层抽样,每个个体被抽到的机会()A.相等B.不相等C.不确定D.与抽取次数有关解析:无论采取何种抽样,每个个体被抽取的机会是均等的.答案:A2.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4B.5C.6D.7答案:C点评:本题主要考查了分层抽样的特点.解析:抽样比为20100=15,故有30×15=6.3.(1)某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某项指标,要从中抽取一个容量为100的样本;(2)从10名同学中抽取3名参加座谈会.Ⅰ.简单随机抽样方法;Ⅱ.分层抽样方法.问题和方法配对正确的是()A.(1)Ⅰ(2)ⅡB.(1)Ⅱ(2)ⅠC.(1)Ⅰ(2)ⅠD.(1)Ⅱ(2)Ⅱ解析:(1)中各类家庭差异明显,故应用分层抽样.(2)中总体容量较小,可采用抽签法,故应为简单随机抽样.答案:B4.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是()A.简单随机抽样法B.抽签法C.随机数表法D.分层抽样法解析:由分层抽样的定义可知,该抽样为按比例的抽样.答案:D答案:C5.(2011·湖北八校)在样本的频率分布直方图中,一共有m(m≥3)个小矩形,第3个小矩形的面积等于其余m-1个小矩形面积和的14,且样本容量为100,则第3组的频数是()A.0.2B.25C.20D.以上都不正确解析:第3组的频率是15,样本容量为100,故第3组的频数是100×15=20.选C.类型一简单随机抽样解题准备:(1)要分清“余下的每个个体被抽到的概率”与“从含N个个体的总体中抽取一个容量为n的样本,每个个体被抽到的概率“含义不同.(2)公式P=中,n、N、P的含义.(3)抽样必须是客观公平的.【典例1】某项大赛举行群众参与活动,现在要从6名入围的幸运观众中抽取三人获得大赛一等奖.问第一次抽取时,每个个体被抽到的概率是多少?第二次抽取时,余下的每个个体被抽到的概率是多少?第三次抽取时,余下的每个个体被抽到的概率是多少?整个抽样过程中,每个个体被抽取的概率是多少?应当选用什么样的方法抽取获奖观众更公平?[分析]本例主要考查抽样方法的公平性和简单随机抽样方法的应用.[解析]设三名获奖观众中的任一名被抽到的概率为A,则第一次抽取时,抽到A的概率为P1=16,第二次抽取时,从余下的5人中抽到A的概率为P2=1-16×15=16(显然第一次未抽到).第三次抽取时,从余下的4人中抽到A的概率为P3=1-16×1-15×14=16.根据概率的运算性质,在整个过程中,A被抽到的概率[点评]抽样方法的科学保证了用样本来研究总体的合理性,在使用简单随机抽样时,无论抽取样本容量是多少,对于每个入样者和不入样者都可以通过基本事件的概率运算论证其公平性,在今后的实际应用中,将不再对此作详细论证,但可以看出本节的抽样方法都是以前面的概率知识为基础的,应充分肯定其抽样过程的公正、公平原则.P=16+56×15+56×45×14=16+16+16=12.由A的任意性可知,每位幸运观众成为获奖者的概率都是12.本次抽样属于简单随机抽样,可以采用抽签法完成.注意:在计算第二次、第三次被抽到的概率时,应按照相互独立事件和互斥事件的原理进行运算,如第二次某人被抽到的概率P=56×15=16,而不是15.探究1:某班有50名学生,要从中随机地抽出6人参加一项活动,请用抽签法进行抽选,并写出过程.解析:将这50名学生的学号写在形状、大小相同的号签上,然后将这些号签放在同一个盒子里,进行均匀搅拌,抽签时,每次抽出1个号签,连抽6次,则所抽得的6个号签上的同学号所对应着选出的6个学生,这就是抽签法的过程.类型二分层抽样的相关问题【典例2】在100个产品中,一等品20个,二等品30个,三等品50个,用分层抽样的方法抽取一个容量为20的样本.(1)简述抽样过程;(2)求证:用这种抽样方法可使总体中每个个体被抽取的概率是相等的.解题准备:(1)若已知总体由差异明显的几部分组成,为了使样本充分地反映总体的情况,通常按照样本容量与总体容量的比例,合理地将其分配到各层,以确保抽样的科学性,当然解决实际问题时,在确定样本容量的过程中,一定要结合抽样比,考虑到分配的合理性.(2)分层抽样时某层抽到的个体数为:样本容量总体的个体数×该层个体数.[分析]显然分三层,按比例抽取.[解析](1)先将产品按等级分成三层:第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的样品容量,∵20︰30︰50=2︰3︰5,所以应在第一层中抽取产品4个,在第二层中抽取产品6个,在第三层中抽取产品10个.再分别给这些产品编号并贴上标签,用抽签法或随机数表法分层抽取样本,得到一等品4个,二等品6个,三等品10个.这样我们就通过分层抽样法得到了一个容量为20的样本.[点评]根据总体的不同特点,来确定是采取简单随机抽样法,还是采用分层抽样法.但不管采用哪种抽样法,它们都能保证入样个体的等概性.(2)证明:在100个产品中抽取20个,因此,总体中每个个体入样的概率P=20100=15.在第一层中每个个体入样的概率P1=420=15;在第二层中每个个体入样的概率P2=630=15;在第三层中每个个体入样的概率P3=1050=15.∴P1=P2=P3=P=15.这就是说,用上述方法抽样,可使总体中每个个体入样的概率相等.类型三总体分布的估计解题准备:(1)列频率分布表时要注意区分频数、频率的意义.(2)画频率分布条形图、直方图时要注意纵、横坐标代表的意义及单位.(3)通过本题可以掌握总体分布估计的各种常见步骤和方法.(4)解决总体分布估计问题的一般步骤如下:①先确定分组的组数;②分别计算各组的频数及频率频率=频数总数;③画出频率分布直方图,并作出相应的估计.【典例3】为了估计某人的射击技术状况,在他的训练记录中抽取了50次进行检验,他命中环数如下:786865910785656787910985787986779658696810787869871069(1)作出频率分布表;(2)画出频率分布条形图;(3)估计他命中6~8环的概率.[分析]此题属总体分布的第一种情况,即总体的个数取不同数值较少(本题为5,6,7,8,9,10六个数),可直接列表画图.[解析](1)频率分布表如下:环数频数频率550.106100.207110.228120.24980.161040.08(2)以命中环数为横轴,频率为纵轴,画频率分布条形图(3)由题意,命中6环的概率为0.20,命中7环的概率为0.22,命中8环的概率为0.24,则他命中6~8环的概率为0.20+0.22+0.24=0.66.[点评]只要横轴的单位取得一致,纵轴单位取得一致即可,不要求两者单位相同..探究2:有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计数据小于30.5的概率.分析:按要求制表、绘图,用样本的分布估计总体的分布.解析:(1)样本的频率分布如下:分组频数频率[12.5,15.5)60.06[15.5,18.5)160.16[18.5,21.5)180.18[21.5,24.5)220.22[24.5,27.5)200.20[27.5,30.5)100.10[30.5,33.5)80.08合计1001.00(2)频率分布直方图如图所示.(3)数据大于等于30.5的频率是0.08,∴数据小于30.5的频率是0.92,∴数据小于30.5的概率约为0.92.点评:解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除组距得组数);(2)分别计算各组的频数及频率频率=频数总数;(3)画出频率分布直方图,并作出相应的估计.快速解题技法某报社为了调查读者对报纸的评价情况,分别在300名老年人,500名中年人,400名青年人中作问卷调查,结果要在所有问卷中抽取120份,如何抽取才能得到较客观的答案?快解:由于总共从300+500+400=1200人中抽120人作问卷调查,每位读者被抽到的概率都是110,机会是等可能的、公平的,所以可以采用编号用随机数表抽取的方法,即从0001开始到1200结束,共计1200个号码,然后利用随机数表随机抽出120个号码,即为入样者编号,来完成抽样过程.名师作业·练全能