章末总结归纳常用的三种抽样方法为简单随机抽样、系统抽样、分层抽样.它们的共同特点是:在抽样过程中每一个个体被抽到的可能性是一样的,体现了抽样方法的客观性和公平性.当总体个数较多时,常采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.它们在抽样过程中都要用到简单随机抽样,通常使用抽签法或随机数法实现简单随机抽样.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人进行某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,3,…,270;使用系统抽样时,将学生统一随机编号为1,2,3,…,270,并将整个编号平均分成10段.如果抽得的号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样【解析】①③④为等距抽样,若满足10段中每段抽取一个,即为系统抽样.④中的第一个数30不在第一段中,④不是系统抽样.则只有①③为系统抽样,排除A、C;若采用分层抽样,三个年级分别抽取4人,3人,3人,即在1至108范围内抽取4个编号,109至189及190至270范围内分别抽取3个编号,①②③都符合要求,排除B.【答案】D某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量n=()A.160B.120C.80D.60【解析】设样本容量为n,由已知得,n×22+3+5=16,∴n=80,故选C.【答案】C频率分布直方图的优点:形象、直观地反映了样本的分布规律;缺点是从中得不出原始的数据内容.频率分布直方图是考察数形结合的良好载体.某校高一年级举行科技知识竞赛,所有参赛同学的最后得分(得分为整数)的频率分布直方图如下图所示,根据图中给出的信息,直接写出下列问题的结果:(1)图中各长方形的面积和等于________;(2)若50.5~60.5一组的频率是0.1,则80.5~90.5这组的频率为________.【解析】(1)各长方形面积的意义是各组的频率,所有组数的频率之和为1,故长方形面积之和为1.(2)由题图知80.5~90.5这组的长方形的高度是50.5~60.5这组长方形的高度的3倍,故可求频率为0.3.【答案】(1)1(2)0.3样本的数字特征:一类是反映样本数据集中趋势的,如平均数、众数、中位数;一类是反映样本数据波动大小的,如样本的极差、方差、标准差.要掌握这些特征数字的求法及它们反映出来的数字特征.为选派一名学生参加全市实践活动技能竞赛,A、B两位同学在学校实习基地现场进行加工直径为20mm的零件的测试,他们俩各加工的10个零件的相关数据如图所示(单位:mm),其相关数字特征如下表.平均数方差完全符合要求个数A20.00.0262B20.0s2B5根据测试得到的有关数据,试解答下列问题:(1)考虑平均数与完全符合要求的个数,你认为________的成绩好些;(2)计算出s2B的大小;(3)观察上图你认为派谁去参赛较合适?说明你的理由.【解】(1)B同学(2)s2B=110×[5×(20.0-20.0)2+3×(19.9-20.0)2+(20.1-20.0)2+(20.2-20.0)2]=0.008.(3)从图中折线图趋势可知,尽管A的成绩前面起伏较大,但后来逐渐稳定,方差较小,所以可选派A去参赛.两个变量之间的关系,除了函数关系这种确定性的关系之外,还大量存在因变量取值带有随机性的两个变量,它们之间是相关关系,通过建立线性回归方程就可以根据其部分观测值获得对这两个变量整体关系的了解.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解】(1)由题意,作散点图如图.(2)由对照数据,计算得∑4i=1xiyi=66.5,∑4i=1x2i=32+42+52+62=86,x=4.5,y=3.5,b=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a=y-bx=3.5-0.7×4.5=0.35,所以回归方程为y=0.7x+0.35.(3)当x=100时,y=100×0.7+0.35=70.35(吨标准煤),预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).1.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002B.x+100,s2+1002C.x,s2D.x+100,s2解析:由于每个数都增加了100,则平均数也增加100.每个数增加100后,这组数据的离散程度没变,则方差不变.答案:D2.某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250解析:高中生抽取比例为703500=150,初中生抽取人数为1500×150=30,∴样本容量为70+30=100.答案:A3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18解析:第一组与第二组共有20人,频率之和为0.24+0.16=0.4.∴样本容量为20÷0.4=50.第三组的人数为50×0.36=18,有疗效的人数为18-6=12.答案:C4.期中考试后,某班对50名学生的成绩进行分析,得到数学成绩y对总成绩x的回归直线方程为y=6+0.4x,由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩相差________分.解析:由题意可得y1-y2=0.4(x1-x2),当x1-x2=50时,y1-y2=0.4×50=20.答案:205.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.880.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.730.85,所以2.5≤x3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.