-1-章末优化总结抽样方法及应用应用抽样方法抽取样本时,应注意以下几点:(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,则抽样间隔为k=Nn;如果总体容量N不能被样本容量n整除,则先用简单随机抽样剔除多余个体,抽样间隔为k=Nn.Nn表示取Nn的整数部分(3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体容量较大,样本容量也较大时,可采用系统抽样;当总体中个体差异较显著时,可采用分层抽样.-2-在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本.(1)采用简单随机抽样法,将零件编号为00,01,02,…,99,利用抽签法随机抽取20个.(2)采用系统抽样法,将所有零件分成20组,每组5个,然后从每组中随机抽取1个.(3)采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下面说法是否正确,说明理由.①不论采用哪一种抽样方法,这100个零件中每一个被抽到的机会都相等.②(1)(2)两种抽法,这100个零件中每一个被抽到的机会相等,而(3)并非如此.③采用不同的抽样方法,这100个零件中每一个被抽到的机会是不相等的.[解]①是正确的,②③都不正确.因为无论是简单随机抽样还是系统抽样,分层抽样,由其操作步骤知,都能保证每一个个体被抽到的机会是均等的.用样本的频率分布估计总体的分布利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到,二是便于记录和表示,但数据较多时不方便.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位:cm):区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165(1)列出样本的频率分布表(频率保留两位小数);(2)画出频率分布直方图;(3)估计身高低于134cm的人数占总人数的百分比.[解](1)列出样本频率分布表:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计1201.00-3-(2)画出频率分布直方图,如图所示.(3)因为样本中身高低于134cm的人数的频率为5+8+10120=23120≈0.19.所以估计身高低于134cm的人数约占总人数的19%.用样本的数字特征估计总体的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括平均数、众数、中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,我们用样本的数字特征估计总体的数字特征.甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示:(1)填写下表:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.[解](1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x-乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上-4-(2)①甲、乙的平均数相同,均为7,但s2甲<s2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.求回归方程除了函数关系这种确定性的关系外,还有大量因变量的取值带有一定随机性的两个变量之间的关系——相关关系.分析两个变量的相关关系时,我们可根据样本数据的散点图给出判断.若是线性相关,还可以利用最小二乘法求出回归方程.求回归方程的步骤:(1)由已知数据计算出x-,y-,i=1nx2i,i=1nxiyi;(2)计算回归方程的系数a^,b^,(3)写出回归归方程y^=b^x+a^下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长性计算的,且对于给定的x,y为正态变量,其方差与x无关.x(℃)300400500600700800y(%)405055606770(1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1000℃时,黄酮延长性的情况.甲71.271乙75.47.53-5-[解](1)散点图如图:(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.,(3)列出下表并用科学计算器进行有关计算.i123456xi300400500600700800yi405055606770xiyi120002000027500360004690056000x2i90000160000250000360000490000640000x=550,y=57,i=16xi2=1990000,i=16xiyi=198400于是可得因此所求的回归直线的方程为:y^=0.05886x+24.627.(4)将x=1000代入回归方程得y^=0.05886×1000+24.627=83.487,即退水温度是1000℃时,黄酮延长性大约是83.487%.1.(2015·聊城高一检测)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种.现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4B.5C.6D.7-6-解析:选C.食品共有100种,抽取容量为20的样本,即抽样比为15,故抽取植物油类与果蔬类食品种数之和为2+4=6.故选C.2.如图所示是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分解析:选A.从茎叶图可以看出:甲运动员的成绩集中在大茎上的叶多,故成绩好.3.设矩形的长为a,宽为b,其比满足b∶a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是()A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:选A.计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.故选A.4.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864由表中数据得线性回归方程y=b^x+a^中b^=-2,预测当气温为-4℃时,用电量的度数约为________.解析:x-=18+13+10-14=10,y-=24+34+38+644=40,将点(x-,y-)代入线性回归方程,得a^=y--b^x-=40+20=60,所以线性回归方程为y=-2x+60.将x=-4代入线性回归方程,得y=68.答案:68-7-[A.基础达标]1.抽签法中确保样本代表性的关键是()A.制签B.搅拌均匀C.逐一抽取D.抽取不放回解析:选B.只有搅拌均匀每个个体被抽取的可能性相等,这样抽取的样本才有代表性,故选B.2.下列抽样方式是简单随机抽样的是()A.按居民身份证号码的后3位数字是632作为样本,来进行中央电视台春节联欢晚会的收视率的调查B.对不同地区,不同职业的人,按一定比例抽取作为样本,来进行中央电视台春节联欢晚会的收视率的调查C.从产品生产流水线上随机抽取100个个体作为样本D.某公司从800袋牛奶中抽取60袋.利用随机数表法抽取样本,检验某项指标是否合格解析:选D.因为随机数表法是简单随机抽样,故选D.3.某市政府在人大会上,要从农业、工业和教育系统的代表中抽查对政府工作报告的意见,为了更具有代表性,抽样应采取()A.抽签法B.随机数表法C.系统抽样法D.分层抽样解析:选D.因为样本来自差异较大的三个部分:农业、工业、教育,故选D.4.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在40~45kg的人数是()A.10B.2C.5D.15解析:选A.由图可知频率=频率组距×组距,故频率=0.02×5=0.1.∴0.1×100=10人.5.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲7,8,7,9,5,4,9,10,7,4乙9,5,7,8,7,6,8,6,7,7那么,根据这次测试成绩得出的结论是()A.甲与乙技术一样稳定B.甲比乙技术稳定C.乙比甲技术稳定D.无法确定-8-解析:选C.因为x-甲=x-乙=7,s甲=2,s乙≈1.1,故选C.6.如图是2005年至2014年某省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到2005年至2014年我省城镇居民百户家庭人口数的平均数为________.解析:这10年的家庭人口数为291,291,295,298,302,306,310,312,314,317,再求这10个数的平均数为291+291+295+298+302+306+310+312+314+31710=303.6.答案:303.67.(2015·山东滨州质检)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)篮球组书画组乐器组高一4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.解析:根据分层抽样各层抽样比是一样的,则有30120+a=1260,解得a=30.答案:308.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x(℃)171382月销售量y(件)24334055由表中数据算出