第九章统计、统计案例(时间:120分钟满分:150分)一、选择题(每小题5分,共60分)1.(2013·湖南高考)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是(D)A.抽签法B.随机数法C.系统抽样法D.分层抽样法由于被抽取的个体的属性具有明显差异,因此宜采用分层抽样法.2.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是(C)A.x和y正相关B.x和y的相关系数为直线l的斜率C.x和y的相关系数在-1到0之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同由图知,回归直线的斜率为负值,∴x与y是负相关,且相关系数在-1到0之间,∴C正确.3.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是(C)A.4B.5C.6D.7四类食品的每一种被抽到的概率为2040+10+30+20=15,则植物油类和果蔬类食品被抽到的种数之和为(10+20)×15=6.4.为了了解某校高三400名学生的数学学业水平测试成绩,制成样本的频率分布直方图如下图所示.规定不低于60分为及格,不低于80分为优秀,则及格率与优秀人数分别是(C)A.60%,60B.60%,80C.80%,80D.80%,60由频率分布直方图可知,及格率为(0.025+0.035+0.010+0.010)×10=80%,优秀人数为(0.010+0.010)×10×400=80.5.(2013·哈尔滨四校统考)甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数x8.38.88.88.7方差s23.53.62.25.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是(C)A.甲B.乙C.丙D.丁由题目表格中数据可知,丙平均环数最高,且方差最小,说明丙技术稳定,且成绩好,故选C.6.(2013·江南十校联考)一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为(D)A.8B.5C.4D.2甲、乙两班成绩按大小顺序排列,处在最中间的数分别为87,89,故它们之差的绝对值是2.7.(2013·西宁模拟)已知一组数据:a1,a2,a3,a4,a5,a6,a7构成公差为d的等差数列,且这组数据的方差等于1,则公差d等于(B)A.±14B.±12C.±128D.无法求解这组数据的平均数为a1+a2+a3+a4+a5+a6+a77=7a47=a4,∵这组数据的方差等于1,∴17[(a1-a4)2+(a2-a4)2+(a3-a4)2+(a4-a4)2+(a5-a4)2+(a6-a4)2+(a7-a4)2]=(3d)2+(2d)2+d2+0+d2+(2d)2+(3d)27=1,即4d2=1,解得d=±12.8.(2013·衡阳联考)已知x与y之间的一组数据:x0123ym35.57已求得关于y与x的线性回归方程y^=2.2x+0.7,则m的值为(D)A.1B.0.85C.0.7D.0.5回归直线必过样本中心点(1.5,y),故y=4,m+3+5.5+7=16,得m=0.5.9.(2013·衢州一中期中)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在(2,14)内的概率约为(B)A.0.24B.0.76C.0.12D.0.38由频率分布直方图中长方形的面积表示频率,知(2,14)中小长方形的面积为1-(0.03+0.03)×4=0.76.10.2012年2月,国内某网站就“你认为皮纹测试即可测出孩子的潜能及发展方向是‘科学’还是‘不科学’”向广大中学生和大学生网民征集看法.根据回收大学生50人与中学生50人的100份有效帖中,统计了不同年龄段的学生对“皮纹测试”的看法,把所得数据制成如下列联表:不科学科学合计大学生401050中学生203050合计6040100参考数据:P(K2≥k)0.150.100.050.0250.010k2.0722.7063.8415.0246.635则利用独立性检验,判断相信“认为皮纹测试是否科学与学生所处的阶段有关”的把握是(D)A.不超过90%B.不超过92%C.超过95%D.超过99%K2=100×(30×40-20×10)250×50×60×40≈16.676.635,∴有超过99%的把握判断相信“认为皮纹测试是否科学与学生所处的阶段有关”.11.甲、乙两名同学在几次数学测试中,成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别是x甲,x乙,则下列结论正确的是(A)A.x甲x乙,甲比乙成绩稳定B.x甲x乙,乙比甲成绩稳定C.x甲x乙,甲比乙成绩稳定D.x甲<x乙,乙比甲成绩稳定由茎叶图可知甲的成绩为68,69,70,71,72,x甲=70;乙的成绩为63,68,69,69,71,x乙=68,∴x甲x乙;再比较方差:甲的方差为15×[(-2)2+(-1)2+02+12+22]=2,乙的方差为15×[(-5)2+02+12+12+32]=3652,故甲比乙成绩稳定.12.近年,多家洋快餐企业爆出“老油门”事件(煎炸食品所用油长期不更新,从而导致过氧化值、酸值超标),令世人震惊.我国某研究机构为此开发了一种用来检测过氧化值、酸值是否超标的新试剂,把500组过氧化值、酸值超标的食品与另外500组上述未超标的食品作比较,提出假设H0:“这种试剂不能起到检测出过氧化值、酸值超标的作用”,并计算出P(K2≥6.635)≈0.01.对此四名同学作出了以下判断:P:有99%的把握认为“这种试剂能起到检测出过氧化值、酸值超标的作用”;Q:随意抽出一组食品,它有99%的可能性是过氧化值、酸值超标;R:这种试剂能起到检测出过氧化值、酸值超标的作用的有效率为99%;S:这种试剂能起到检测出过氧化值、酸值超标的作用的有效率为1%.则上述判断正确的个数是(A)A.1B.2C.3D.4本题中提出假设H0:“这种试剂不能起到检测出过氧化值、酸值超标的作用”,并计算出P(K2≥6.635)≈0.01,∴在一定程度上,说明假设不合理,我们就有99%的把握拒绝假设,故易知P的判断正确,Q,R,S的判断错误.二、填空题(每小题5分,共20分)13.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x(千箱)与单位成本y(元)的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1481,b^=1481-6×72×7179-6×722≈-1.8182,a^=71-(-1.8182)×72≈77.36,则销量每增加1000箱,单位成本下降__1.8182__元.由题意可得线性回归方程为y^=-1.8182x+77.36,销量每增加1000箱,则单位成本下降1.8182元.14.某企业三月中旬生产A,B,C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是__800__件.由于B种产品共1300件,分层抽样取了130件,即每个个体被抽到的概率为1301300=110,而A,C两种产品共有1700件,按分层抽样应共抽取1700×110=170(件),设C抽取了c件,则A抽取了(c+10)件,则有c+c+10=170,得c=80,即C抽取了80件,而每个个体被抽到的概率为110,故C产品共有80÷110=800(件).15.最近网络上流行一种“QQ农场游戏”,这种游戏通过虚拟软件模拟种植与收获的过程.为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为__57__.由最小的两个编号为03,09可知,抽样间距为6,因此抽取人数的比例为16,即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+(10-1)×6=57.16.(2013·武汉武昌联考)已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出职工的号码为__2,10,18,26,34__;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图所示,则该样本的方差为__62__.(1)由题意知被抽出职工的号码为2,10,18,26,34.(2)由题中茎叶图知5名职工体重的平均数x=59+62+70+73+815=69,则该样本的方差s2=15×[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.三、解答题(共70分)17.(10分)某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:管理技术开发营销生产共计老年40404080200中年80120160240600青年401602807201200共计16032048010402000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对某运动会筹备情况的了解,则应怎样抽样?(1)用分层抽样,并按老年4人,中年12人,青年24人抽取.(3分)(2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取.(6分)(3)用系统抽样,对2000人随机编号,号码从0001~2000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,…,1900,得到容量为20的样本.(10分)18.(10分)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:82,81,79,78,95,88,93,84;乙:92,95,80,75,83,80,90,85.(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中任意选两个)考虑,你认为选派哪位学生参加合适?请说明理由.(1)作出茎叶图如下:(5分)(2)派甲参赛比较合适.理由如下:x甲=18(70×2+80×4+90×2+8+9+1+2+4+8+3+5)=85,x乙=18(70×1+80×4+90×3+5+0+0+3+5+0+2+5)=85,(7分)s2甲=18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s2乙=18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.∵x甲=x乙,s2甲s2乙,∴甲的成绩比较稳定,派甲参赛比较合适.(10分)19.(12分)某市2013年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,4