主攻36个必考点(十四)统计案例1.(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=nad-bc2a+bc+da+cb+d.P(K2≥k)0.0500.0100.001k3.8416.63510.828解:(1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K2的观测值k=100×40×20-30×10250×50×70×30≈4.762.由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分)3.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?解:(1)第二种生产方式的效率更高.理由如下:①由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79min.因此第二种生产方式的效率更高.②由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80min;用第二种生产方式的工人完成生产任务平均所需时间低于80min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知m=79+812=80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)因为K2=4015×15-5×5220×20×20×20=106.635,所以有99%的把握认为两种生产方式的效率有差异.[把脉考情]考什么1.回归方程的求解与应用2.独立性检验问题考多深多在解答题中考查,试题难度中等,分值12分考多宽联系实际生活考查线性回归方程或非线性回归方程及独立性检验的应用,有时与概率结合,考查数学建模、数学运算、逻辑推理、数据分析的核心素养线性回归方程及应用[典例1](2019·郴州模拟)某公司想了解对某产品投入的宣传费用与该产品的营业额的影响.下面是以往公司对该产品的宣传费用x(单位:万元)和产品营业额y(单位:万元)的统计折线图.(1)根据折线图可以判断,可用线性回归模型拟合宣传费用x与产品营业额y的关系,请用相关系数加以说明;(2)建立产品营业额y关于宣传费用x的回归方程;(3)若某段时间内产品利润z与宣传费用x和营业额y的关系为z=x(y-1.01x-0.09)+50,应投入宣传费用多少万元才能使利润最大?并求最大利润.参考数据:i=17yi=37.28,i=17xiyi=160.68,i=17yi-y2=2.2,7≈2.65.参考公式:相关系数r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2=i=1nxiyi-nxyi=1nxi-x2i=1nyi-y2;回归方程y^=a^+b^x中斜率和截距的最小二乘估计公式分别为b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.(计算结果保留两位小数)[解](1)由折线图中数据和参考数据得x=4,i=17(xi-x)2=28,r=160.68-4×37.2828×2.2≈0.99,因为y与x的相关系数近似为0.99,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.(2)因为y=i=17yi7≈5.33,b^=160.68-4×37.2828≈0.41,a^≈5.33-0.41×4=3.69,所以y关于x的回归方程为y^=0.41x+3.69.(3)由z=x(y-1.01x-0.09)+50=-0.6x2+3.6x+50,可得x=3时,zmax=55.4.所以投入宣传费用3万元时,可获得最大利润55.4万元.增分方略进行回归分析时的注意事项(1)所作回归分析要有实际意义.(2)回归分析前,最好先作出散点图.(3)应用回归方程进行预测时,不要使用超出资料所包括范围的自变量数值.(4)预测的回归方程只能反映一定时期内事物间的相互关系,随着时间的推移,这种关系会起变化.非线性回归分析[典例2]如图是某小区2018年1月至2019年1月当月在售二手房均价(单位:万元/米2)的散点图.(图中月份代码1~13分别对应2018年1月~2019年1月)根据散点图选择y^=a^+b^x和y^=c^+d^lnx两个模型进行拟合,经过数据处理得到两个回归方程分别为y^=0.9369+0.0285x和y^=0.9554+0.0306lnx,并得到一些统计量的值如下表所示.y^=0.9369+0.0285xy^=0.9554+0.0306lnxi=113(yi-y^i)20.0005910.000164i=113(yi-y)20.006050(1)请利用相关指数R2判断哪个模型的拟合效果更好.(2)某位购房者拟于2019年6月份购买这个小区m(70≤m≤160)平方米的二手房(此房为其家庭首套房).若购房时该小区所有住房的房产证均已满2年但未满5年.请你利用(1)中拟合效果更好的模型解决以下问题.①估算该购房者应支付的购房金额;(购房金额=房款+税费,房屋均价精确到0.001万元/米2)②若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精确到1平方米)注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格进行征收的.(计税价格=房款)征收方式见下表.契税(买方缴纳)首套面积在90平方米以下(含90平方米)的税率为1%;首套面积在90平方米以上且在144平方米以下(含144平方米)的税率为1.5%;首套面积在144平方米以上或非首套的税率为3%.增值税(卖方缴纳)房产证未满2年或满2年且面积在144平方米以上(不含144平方米)的税率为5.6%;其他情况免征.个人所得税(卖方缴纳)首套面积在144平方米以下(含144平方米)的税率为1%;首套面积在144平方米以上或非首套的税率均为1.5%;房产证满5年且是家庭唯一住房的免征.参考数据:ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,2=1.41,3≈1.73,17≈4.12,19≈4.36.参考公式:相关指数R2=1-i=1nyi-y^i2i=1nyi-y2.[解](1)设模型y^=0.9369+0.0285x和y^=0.9554+0.0306lnx的相关指数分别为R21和R22,则R21=1-0.0005910.006050,R22=1-0.0001640.006050,因为0.0005910.000164,所以R21R22,所以模型y^=0.9554+0.0306lnx的拟合效果更好.(2)由(1)知,模型y^=0.9554+0.0306lnx的拟合效果更好,利用该模型预测可得,这个小区2019年6月份的在售二手房均价为y^=0.9554+0.0306ln18=0.9554+0.0306(ln2+2ln3)≈1.044(万元/米2).①设该购房者应支付的购房金额为h万元,因为税费中买方只需缴纳契税,所以(ⅰ)当70≤m≤90时,契税为计税价格的1%,所以h=m×1.044×(1+1%)=1.05444m;(ⅱ)当90m≤144时,契税为计税价格的1.5%,所以h=m×1.044×(1+1.5%)=1.05966m;(ⅲ)当144m≤160时,契税为计税价格的3%,所以h=m×1.044×(1+3%)=1.07532m.故h=1.05444m,70≤m≤90,1.05966m,90m≤144,1.07532m,144m≤160.所以当70≤m≤90时,购房金额为1.05444m万元;当90m≤144时,购房金额为1.05966m万元;当144m≤160时,购房金额为1.07532m万元.②设该购房者可购买该小区二手房的面积为t平方米,由①知,当70≤t≤90时,应支付的购房金额为1.05444t万元,又1.05444t≤1.05444×90100,且房屋均价约为1.044万元/米2,所以欲使购房面积最大,应有90t100.由1.05966t≤100,解得t≤1001.05966,因为1001.05966≈94.4,所以该购房者可购买该小区二手房的最