状元桥优质课堂高考必考题突破讲座(六)概率与统计的综合问题高考总复习·数学(文科)目录高考必考题突破讲座返回目录题型特点考情分析命题趋势1.有关统计、统计案例的计算问题.2.概率与统计、统计案例的综合应用问题.2018·全国卷Ⅰ,182018·全国卷Ⅱ,182018·全国卷Ⅲ,182017·全国卷Ⅰ,192017·全国卷Ⅱ,192017·全国卷Ⅲ,181.以统计图表或文字叙述的实际问题为载体,考查频率分布表、频率分布直方图、茎叶图、用样本的数字特征估计总体的数字特征,回归方程的求法与应用,独立性检验及运用数学知识解决实际问题的能力.2.以统计、统计案例中的计算与概率计算为主要内容,考查对数据的处理能力与运算能力及应用意识.分值:12分返回目录题型一概率与统计知识的综合应用1.概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.返回目录2.统计知识与概率综合问题的求解步骤概率的计算问题往往与抽样方法、频率分布直方图、频率分布表、茎叶图等知识点相结合进行考查,一般难度不大,考查基础知识点和基本方法.解决此类综合问题可遵循以下几个步骤进行:第一步,根据所给的频率分布直方图、茎叶图等统计图表确定样本数据、平均数等统计量;第二步,根据题意,一般由频率估计概率,确定相应的事件的概率;第三步,利用互斥事件、对立事件、古典概型等概率计算公式计算概率.返回目录【例1】(2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表.最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574返回目录以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.返回目录解析(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知最高气温低于25的频率为2+16+3690=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6×450-4×450=900;若最高气温位于区间[20,25),则Y=6×300+2(450-300)-4×450=300;返回目录若最高气温低于20,则Y=6×200+2(450-200)-4×450=-100.所以Y的所有可能值为900,300,-100.当Y大于零时,最高气温不低于20,由表格数据知最高气温不低于20的频率为36+25+7+490=0.8,因此Y大于零的概率的估计值为0.8.返回目录素养解读本例以前三年六月份的气温数据为基础,对酸奶的需求进行数据分析与测算,考查了数学运算与数学抽象的核心素养.返回目录【突破训练1】济南天下第一泉风景区为了做好宣传工作,准备在A和B两所大学分别招募8名和12名志愿者,将这20名志愿者的身高(单位:cm)编成如图所示的茎叶图.若身高在175cm以上(包括175cm)定义为“高精灵”,身高在175cm以下定义为“帅精灵”.已知A大学志愿者的身高的平均数为176,B大学志愿者的身高的中位数为168.返回目录(1)求x,y的值;(2)如果用分层抽样的方法从“高精灵”和“帅精灵”中随机抽取5人,再从这5人中选2人,求至少有1人为“高精灵”的概率.解析(1)由茎叶图得18×(159+168+170+170+x+176+182+187+191)=176,160+y+1692=168,解得x=5,y=7.(2)由题意可得“高精灵”有8人,“帅精灵”有12人,如果从“高精灵”和“帅精灵”中抽取5人,则抽取的“高精灵”和“帅精灵”的人数分别为8×520=2,12×520=3.返回目录记抽取的“高精灵”分别为b1,b2,“帅精灵”分别为c1,c2,c3,从这5人中任选2人的所有可能情况为(b1,b2),(b1,c1),(b1,c2),(b1,c3),(b2,c1),(b2,c2),(b2,c3),(c1,c2),(c1,c3),(c2,c3),共10种,记“从这5人中选2人,至少有1人为‘高精灵’”为事件A,则A包含的情况为(b1,b2),(b1,c1),(b1,c2),(b1,c3),(b2,c1),(b2,c2),(b2,c3),共7种,所以P(A)=710.故从这5人中选2人,至少有1人为“高精灵”的概率为710.返回目录题型二线性回归分析的实际应用1.线性回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义,根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.返回目录2.线性回归分析问题的类型及解题方法(1)求线性回归方程:①利用公式,求出回归系数b^,a^;②待定系数法,利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.返回目录【例2】(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.返回目录为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值一次为1,2,…,17)建立模型①:y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.返回目录解析(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y^=99+17.5×9=256.5(亿元).返回目录(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.返回目录(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.返回目录素养解读本例通过折线图和已经建立的线性回归方程对2018年的情况进行预测,并对其可靠性进行分析,综合考查了数据分析、直观想象、数学建模等核心素养.返回目录【突破训练2】为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据.天数t/天34567繁殖个数y/千个2.5344.56(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,预测t=8时的细菌繁殖个数.附:回归直线的斜率和截距的最小二乘法估计公式分别为返回目录b^=i=1nti-tyi-yi=1nti-t2,a^=y-b^t.返回目录解析(1)由表中数据计算得t=5,y=4,i=1n(ti-t)(yi-y)=8.5,i=1n(ti-t)2=10,所以b^=i=1nti-tyi-yi=1nti-t2=0.85,返回目录a^=y-b^t=4-0.85×5=-0.25.所以回归方程为y^=0.85t-0.25.(2)将t=8代入(1)的回归方程中得y^=0.85×8-0.25=6.55.故预测t=8时,细菌繁殖个数为6.55千个.返回目录题型三独立性检验的实际应用1.2×2列联表是反映两个分类变量的频数表,通过特殊的计算,能说明两个变量之间关系的强弱.如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)根据K2=nad-bc2a+ba+cb+dc+d计算K2的观测值k;(3)比较k与临界值的大小,作统计推断.返回目录【例3】(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.返回目录返回目录(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg旧养殖法新养殖法返回目录(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2≥k0)0.0500.0100.001k03.8416.63510.828K2=nad-bc2a+bc+da+cb+d.返回目录解析(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得到列联表如下.箱产量50kg箱产量≥50kg旧养殖法6238新养殖法3466K2=200×62×66-34×382100×100×96×104≈15.7056.635.故有99%的把握认为箱产量与养殖方法有关.返回目录(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.返回目录素养解读本例通过统计图表中的数据分析,计算新、旧养殖法的产量概率和相关性检验并进行比较,全面考查了直观想象、数据分析、数学运算的核心素养.返回目录【突破训练3】近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表.患三高疾病不患三高疾病总计男630女总计36(1)请将列联表补充完整,若用分层抽样的方法在患三高疾病的人群中抽9人,其中女性抽多少人?返回目录(2)为了研究三高疾病是否与性别有关,请计算出统计量K2的观测值k,并说明是否可