主攻36个必考点(十六)概率与统计的综合问题1.(2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为2+16+3690=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6×450-4×450=900;若最高气温位于区间[20,25),则Y=6×300+2(450-300)-4×450=300;若最高气温低于20,则Y=6×200+2(450-200)-4×450=-100.所以Y的所有可能值为900,300,-100.Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为36+25+7+490=0.8,因此Y大于零的概率的估计值为0.8.2.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50kg箱产量≥50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2≥k)0.0500.0100.001k3.8416.63510.828K2=nad-bc2a+bc+da+cb+d.解:(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表箱产量<50kg箱产量≥50kg旧养殖法6238新养殖法3466根据表中数据及K2的计算公式得,K2=200×62×66-34×382100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.[把脉考情]考什么1.概率与统计中的创新性问题2.概率与统计案例中的创新性问题考多深主要在解答题中考查,试题难度中等偏上,分值12分考多宽概率与统计的创新问题主要考查以实际生活问题为背景的方案选择、环保、民生、决策型问题,常与分段函数相结合.概率与统计案例的创新问题,主要是指以实际生活问题为背景的概率与回归分析、独立性检验相交汇的问题,考查数据分析、数学建模、数学运算的核心素养概率与统计的综合问题[典例1]据统计,2019年国庆中秋假日期间,某市共接待游客590.23万人次,实现旅游收入48.67亿元,同比分别增长44.57%,55.22%.旅游公司规定:若公司导游接待旅客,旅游年总收入不低于40(单位:百万元),则称为优秀导游.经验表明,如果公司的优秀导游率越高,则该公司的影响度越高.已知甲、乙两家旅游公司各有导游100名,统计他们一年内旅游总收入,分别得到甲公司的频率分布直方图和乙公司的频数分布表如下:甲公司的频率分布直方图分组[10,20)[20,30)[30,40)[40,50)[50,60)频数b1849245乙公司的频数分布表(1)求a,b的值,并比较甲、乙两家旅游公司哪家的影响度高;(2)若导游的奖金y(单位:万元)与其一年内旅游总收入x(单位:百万元)之间的关系为y=1,x20,2,20≤x40,3,x≥40,求甲公司导游的年平均奖金;(3)从甲、乙两家公司旅游收入在[50,60)的总人数中,用分层抽样的方法随机抽取6人进行表彰,其中有两名导游代表旅游行业去参加座谈,求参加座谈的导游中有乙公司导游的概率.[解](1)由直方图知(0.01+0.025+0.035+a+0.01)×10=1,解得a=0.02.由频数分布表知b+18+49+24+5=100,解得b=4.所以甲公司的导游优秀率为(0.02+0.01)×10×100%=30%;乙公司的导游优秀率为24+5100×100%=29%.由于30%29%,所以甲公司的影响度高.(2)甲公司年旅游总收入在[10,20)的人数为0.01×10×100=10(人);年旅游总收入在[20,40)的人数为(0.025+0.035)×10×100=60(人);年旅游总收入在[40,60)的人数为(0.02+0.01)×10×100=30(人).故甲公司导游的年平均奖金y=1×10+60×2+30×3100=2.2(万元).(3)由已知得,年旅游总收入在[50,60)的人数为15人,其中甲公司10人,乙公司5人.按分层抽样的方法,从甲公司抽取6×1015=4(人),记为a,b,c,d;从乙公司抽取6×515=2(人),记为1,2.6人中随机抽取2人的基本事件有(a,b),(a,c),(a,d),(a,1),(a,2),(b,c),(b,d),(b,1),(b,2),(c,d),(c,1),(c,2),(d,1),(d,2),(1,2),共有15种.参加座谈的导游中有乙公司导游的基本事件有(a,1),(a,2),(b,1),(b,2),(c,1),(c,2),(d,1),(d,2),(1,2),共9种.设事件A为“参加座谈的导游中有乙公司导游”,则P(A)=915=35,所以所求概率为35.[典例2](2019·天津高考)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工项目ABCDEF子女教育○○×○×○继续教育××○×○○大病医疗×××○××住房贷款利息○○××○○住房租金××○×××赡养老人○○×××○①试用所给字母列举出所有可能的抽取结果;②设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.[解析](1)由已知得老、中、青员工人数之比为6∶9∶10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人、9人、10人.(2)①从已知的6人中随机抽取2人的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{B,C},{B,D},{B,E},{B,F},{C,D},{C,E},{C,F},{D,E},{D,F},{E,F},共15种.②由表格知,符合题意的所有结果为{A,B},{A,D},{A,E},{A,F},{B,D},{B,E},{B,F},{C,E},{C,F},{D,F},{E,F},共11种.所以,事件M发生的概率P(M)=1115.增分方略1.破解频率分布直方图、分层抽样与概率相交汇的问题的关键(1)会观图读数据,能从频率分布直方图中读出频率,进而求出频数;(2)能根据分层抽样的抽样比或各层之间的比例,求出分层抽样中各层需取的个数;(3)会应用分段函数表示所求;(4)正确列出基本事件的个数.2.谨记两个易错点(1)用列举法求概率时,没有按照一定的规律进行列举,导致所求的基本事件的个数出错;(2)误以为频率分布直方图中的小矩形的高就是频率,事实上,小矩形的高表示频率组距,不表示频率.概率与回归分析的综合问题[典例2](2019·郴州模拟)寒冷的冬天,某高中一组学生来到一大棚蔬菜基地,研究种子发芽与温度控制技术的关系,他们分别记录五组平均温度及种子的发芽数,得到如下数据:平均温度x(℃)111013912发芽数y(颗)2523301626(1)若从五组数据中选取两组数据,求这两组数据平均温度相差不超过2℃的概率;(2)求y关于x的线性回归方程y^=b^x+a^;(3)若由线性回归方程得到的估计数据(结果保留整数)与实际数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?参考公式:b^=i=1nxiyi-nxyi=1nx2i-nx2=i=1nxi-xyi-yi=1nxi-x2,a^=y-b^x.[解](1)从五组数据中选取两组数据,基本事件有(11,10),(11,13),(11,9),(11,12),(10,13),(10,9),(10,12),(13,9),(13,12),(9,12),共10个,其中平均温度相差不超过2℃的事件有(11,10),(11,13),(11,9),(11,12),(10,9),(10,12),(13,12),共7个,所以这两组数据平均温度相差不超过2℃的概率P=710.(2)x=11+10+13+9+125=11,y=25+23+30+16+265=24,i=15xiyi=11×25+10×23+13×30+9×16+12×26=1351,i=15x2i=112+102+132+92+122=615,所以b^=1351-5×11×24615-5×112=3.1,a^=y-b^x=24-3.1×11=-10.1.所以y关于x的线性回归方程为y^=3.1x-10.1.(3)利用线性回归方程y^=3.1x-10.1,得到五组估计数据如表:平均温度x(℃)111013912发芽数y(颗)2523301626估计发芽数(颗)2421301827可知估计数据与实际数据的误差不超过2颗.所以线性回归方程y^=3.1x-10.1是可靠的.增分方略破解概率与回归分析的综合问题的关键:(1)读准题目中的数据;(2)学会对问题进行分析转化;(3)熟练掌握求线性回归方程的步骤.概率与独立性检验的综合问题[典例3](2019·贵州黔东南州联考)近年来我国电子商务行业迎来发展的新机遇,与此同时,相关管理部门推出了针对电商商品和服务的评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品好评率为35,对服务好评率为34,其中对商品和服务都做出好评的交易为80次.(1)是否可以在犯错误概率不超过0.1%的前提下认为商品好评与服务好评有关?(2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择2次交易进行客户回访,求只有1次好评的概率.附:P(K2≥k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828参考公式:K2=nad-bc2a+bc+da+cb+d,n=a