强化训练11统计中的综合问题1.为确保食品安全,某市质检部门检查了1000袋方便面的质量,抽查总量的2%,在这个问题中,下列说法正确的是()A.总体是指这1000袋方便面B.个体是1袋方便面C.样本是按2%抽取的20袋方便面D.样本容量为20答案D解析总体是指这1000袋方便面的质量,A中说法错误;个体是指1袋方便面的质量,B中说法错误;样本是指按照2%抽取的20袋方便面的质量,C中说法错误;样本容量为20,D中说法正确.2.总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()5044664421660658056261655435024235489632145241524822662215862663754199584236722458375218510337183911A.23B.21C.35D.32答案B解析随机数表第1行的第6列和第7列数字为6,4,所以从这两个数字开始,由左向右依次选取两个数字如下,64,42,16,60,65,80,56,26,16,55,43,50,24,23,54,89,63,21,45,…,其中落在编号01,02,…,39,40内的有16,26,24,23,21,…,故第5个编号为21.3.设样本数据x1,x2,x3,…,x19,x20的平均数和方差分别为2和8,若yi=2xi+m(m为非零常数,i=1,2,3,…,19,20),则y1,y2,y3,…,y19,y20的平均数和标准差为()A.2+m,32B.4+m,42C.2+m,42D.4+m,32答案B解析设样本数据xi的平均数为x,方差为s2,标准差为s,则新样本yi=2xi+m的平均数为2x+m,方差为22s2,标准差为2s,所以y=2x+m=4+m,s2=8,所以标准差为s=22,所以2s=2×22=42.4.为检测某药品服用后的多长时间开始有药物反应,现随机抽取服用了该药品的1000人,其服用后开始有药物反应的时间(分钟)与人数的数据绘成的频率分布直方图如图所示.若将直方图中分组区间的中点值设为解释变量x(分钟),这个区间上的人数为y(人),易见两变量x,y线性相关,那么一定在其线性回归直线上的点为()A.(1.5,0.10)B.(2.5,0.25)C.(2.5,250)D.(3,300)答案C解析由频率分布直方图可知,第一个区间中点坐标,x1=1.0,y1=0.10×1000=100,第二个区间中点坐标,x2=2.0,y2=0.21×1000=210,第三个区间中点坐标,x3=3.0,y3=0.30×1000=300,第四个区间中点坐标,x4=4.0,y4=0.39×1000=390,则x=14(x1+x2+x3+x4)=2.5,y=14(y1+y2+y3+y4)=250,则一定在其线性回归直线上的点为(x,y)=(2.5,250).5.(多选)每年的台风都对泉州地区的渔业造成较大的经济损失.某保险公司为此开发了针对渔船的险种,并将投保的渔船分为Ⅰ,Ⅱ两类,两类渔船的比例如图所示.经统计,2019年Ⅰ,Ⅱ两类渔船的台风遭损率分别为15%和5%.2020年初,在修复遭损船只的基础上,对Ⅰ类渔船中的20%进一步改造.保险公司预估这些经过改造的渔船2020年的台风遭损率将降为3%,而其他渔船的台风遭损率不变.假设投保的渔船不变,则下列叙述中错误的是()A.2019年投保的渔船的台风遭损率为10%B.2019年所有因台风遭损的投保的渔船中,Ⅰ类渔船所占的比例不超过80%C.预估2020年Ⅰ类渔船的台风遭损率会小于Ⅱ类渔船的台风遭损率的两倍D.预估2020年经过进一步改造的渔船因台风遭损的数量少于Ⅱ类渔船因台风遭损的数量答案ABC解析设全体投保的渔船为t艘.2019年投保的渔船的台风遭损率为60%·15%+40%·5%=11%,故A错;2019年所有因台风遭损的投保的渔船中,Ⅰ类渔船所占的比例为60%·15%60%·15%+40%·5%=911810,故B错;预估2020年Ⅰ类渔船的台风遭损率为20%·3%+80%·15%=12.6%2×5%,故C错;预估2020年经过进一步改造的渔船因台风遭损的数量t·60%·20%·3%少于Ⅱ类渔船因台风遭损的数量t·40%·5%,故D正确.6.(多选)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)23456销售额y(万元)1925343844根据上表可得线性回归方程为y^=6.3x+a^,下列说法错误的是()A.回归直线y^=6.3x+a^必经过样本点(2,19),(6,44)B.这组数据的样本点中心(x,y)未必在回归直线y^=6.3x+a^上C.回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元D.据此模型预报广告费用为7万元时销售额为50.9万元答案ABC解析回归直线y^=6.3x+a^,不一定经过任何一个样本点,故A错;由最小二乘法可知,这组数据的样本点中心(x,y)一定在回归直线y^=6.3x+a^上,故B错;回归系数6.3的含义是广告费用每增加1万元,预测销售额增加6.3万元,故C错;x=15(2+3+4+5+6)=4,y=15(19+25+34+38+44)=32,将(4,32)代入y^=6.3x+a^可得a^=6.8,则回归方程为y^=6.3x+6.8,当x=7时,y^=6.3×7+6.8=50.9,故D正确.7.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x(℃)181310-1山高y(km)24343864由表中数据,得到线性回归方程y^=-2x+a^(a^∈R),由此估计出山高为72(km)处的气温为________℃.答案-6解析由题意可得x=10,y=40,所以a^=y+2x=40+2×10=60,所以y^=-2x+60,当y^=72时,-2x+60=72,解得x=-6.8.检测600个某产品的质量(单位:g),得到的频率分布直方图中,前三组的长方形的高度成等差数列,后三组所对应的长方形的高度成公比为0.5的等比数列,已知检测的质量在100.5~105.5之间的产品数为150,则质量在115.5~120.5的长方形高度为________.答案160解析由题意知,产品质量在100.5~105.5之间的频率为150600=14,则前3个矩形的面积和为34,后两个矩形的面积和为14.设中间矩形的面积为x,则后两个矩形的面积为12x,14x,则12x+14x=14,所以x=13,最后一个矩形的面积为112,所以长方形的高度为160.9.已知一组数据10,5,4,2,2,2,x,且这组数据的平均数与众数的和是中位数的2倍,则x所有可能的取值为________.答案-11或3或17解析由题意可得这组数据的平均数为10+5+4+2+2+2+x7=25+x7,众数为2,若x≤2,可得25+x7+2=4,可得x=-11;若2≤x≤4,则中位数为x,可得2x=25+x7+2,可得x=3;若x≥4,则中位数为4,可得2×4=25+x7+2,可得x=17.10.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,40岁以上调查了50人,不高于40岁调查了50人,所得数据制成如下列联表:不喜欢西班牙队喜欢西班牙队总计40岁以上pq50不高于40岁153550总计ab100已知工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.参考公式与临界值表:K2=nad-bc2a+bc+da+cb+d.P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828答案95%解析设“从所有人中任意抽取一个取到喜欢西班牙队的人”为事件A,由已知得P(A)=q+35100=35,所以p=25,q=25,a=40,b=60,K2=100×25×35-25×15240×60×50×50=256≈4.1673.841,故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.11.成都是全国闻名的旅游城市,有许多很有特色的旅游景区.某景区为了提升服务品质,对过去100天每天的游客数进行了统计分析,发现这100天每天的游客数都没有超出八千人,统计结果见下面的频率分布直方图:(1)估计该景区每天游客数的中位数和平均数;(2)为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了5天,统计出这5天的游客数(千人)分别为0.8,3.7,5.1,5.6,6.8,已知这5天的最高气温(℃)依次为8,18,22,24,28.(ⅰ)根据以上数据,求游客数y关于当天最高气温x的线性回归方程(系数保留一位小数);(ⅱ)根据(ⅰ)中的回归方程,估计该景区这100天中最高气温在20~26℃内的天数(保留整数).参考公式:由最小二乘法所得回归直线的方程是y^=b^x+a^;其中,b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.参考数据:i=15(xi-x)(yi-y)=70,i=15(xi-x)2=232.解(1)左边三个矩形的面积之和为0.32,左边四个矩形的面积之和大于0.5,故中位数在第四个矩形中,所以中位数为3+0.180.24×1=3.75.平均数为0.5×0.07+1.5×0.09+2.5×0.16+3.5×0.24+4.5×0.18+5.5×0.14+6.5×0.07+7.5×0.05=3.82,所以,该景区这一百天中每天游客数的中位数约为3750人,平均数约为3820人.(2)(ⅰ)x=20,y=4.4,b^=70232≈0.3,a^=y-b^x=4.4-0.3×20=-1.6,所以y^=0.3x-1.6.(ⅱ)当最高气温在20~26℃内时,当x=20时,y^=0.3×20-1.6=4.4;当x=26时,y^=0.3×26-1.6=6.2.根据y^=0.3x-1.6得游客数在4.4~6.2内,直方图中这个范围内方块的面积为(5-4.4)×0.18+0.14+(6.2-6)×0.07=0.262,天数为0.262×100≈26,所以,这100天中最高气温在20~26℃内的天数约为26天.12.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.各种传染疾病的潜伏期不同,数小时、数天、甚至数月不等.某市疾病预防控制中心统计了该市200名传染病患者的相关信息,得到如下表格:潜伏期(单位:天)[0,2](2,4](4,6](6,8](8,10](10,12](12,14]人数174360502631(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有99%的把握认为该传染病的潜伏期与患者年龄有关.潜伏期≤6天潜伏期6天总计50岁以上(含50岁)10050岁以下55总计200(2)将200名患者的潜伏期超过6天的频率视为该市每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该市疾病预防控制中心随机调查了该地区30名患者,其中潜伏期超过6天的人数为X,求随机变量X的均值和方差.附:P(K2≥k0)0.050.0250.010k03.8415.0246.635K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.解(1)由题意得列联表:潜伏期≤6天潜伏期6天总计50岁以上(含50岁)752510050岁以下4555100总计12080200由上表