-1-第八节概率与统计的综合问题[最新考纲]能从研究对象中获取数据,会用数学方法对数据进行整理、分析和推断,构建模型等.考点1离散型随机变量的均值与方差离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如两点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率的对应.(2019·广州一模)某商场以分期付款方式销售某商品,根据以往资料统计,顾客购买该商品选择分期付款的期数ξ的分布列为ξ234P0.4ab其中0<a<1,0<b<1.(1)求购买该商品的3位顾客中,恰有2位选择分2期付款的概率;(2)商场销售一件该商品,若顾客选择分2期付款,则商场获得的利润为200元;若顾客选择分3期付款,则商场获得的利润为250元;若顾客选择分4期付款,则商场获得的利润为300元.商场销售两件该商品所获得的利润记为X(单位:元).①求X的分布列;②若P(X≤500)≥0.8,求X的数学期望EX的最大值.[解](1)设购买该商品的3位顾客中,选择分2期付款的人数为η,依题意得η~B(3,0.4),则P(η=2)=C23(0.4)2×(1-0.4)=0.288,∴购买该商品的3位顾客中,恰有2位选择分2期付款的概率为0.288.(2)①依题意X的取值分别为400,450,500,550,600,P(X=400)=0.4×0.4=0.16,P(X=450)=2×0.4a=0.8a,P(X=500)=2×0.4b+a2=0.8b+a2,P(X=550)=2ab,-2-P(X=600)=b2.∴X的分布列为:X400450500550600P0.160.8a0.8b+a22abb2②P(X≤500)=P(X+400)+P(X=450)+P(X=500)=0.16+0.8(a+b)+a2,根据0.4+a+b=1,得a+b=0.6,∴b=0.6-a,∵P(X≤500)≥0.8,∴0.16+0.48+a2≥0.8,解得a≥0.4或a≤-0.4,∵a>0,∴a≥0.4,∵b>0,∴0.6-a>0,解得a<0.6,∴a∈[0.4,0.6),E(X)=400×0.16+450×0.8a+500(0.8b+a2)+1100ab+600b2=520-100a,当a=0.4时,E(X)的最大值为480,∴X的数学期望E(X)的最大值为480.本例融概率、分布列、函数于一体,体现了高考命题的最新动向,求解时可先借助分布列的性质及题设条件“P(X≤500)≥0.8”探求得到参数a的范围,然后借助数学期望公式建立关于参数a的函数关系式,并通过二次函数求得数学期望EX的最大值.(2019·九江二模)某企业打算处理一批产品,这些产品每箱100件,以箱为单位销售.已知这批产品中每箱出现的废品率只有两种可能10%或者20%,两种可能对应的概率均为0.5.假设该产品正品每件市场价格为100元,废品不值钱.现处理价格为每箱8400元,遇到废品不予更换.以一箱产品中正品的价格期望值作为决策依据.(1)在不开箱检验的情况下,判断是否可以购买;(2)现允许开箱,有放回地随机从一箱中抽取2件产品进行检验.①若此箱出现的废品率为20%,记抽到的废品数为X,求X的分布列和数学期望;②若已发现在抽取检验的2件产品中,其中恰有一件是废品,判断是否可以购买.[解](1)在不开箱检验的情况下,一箱产品中正品的价格期望值为:Eξ=100×(1-0.2)×100×0.5+100×(1-0.1)×100×0.5=8500>8400,∴在不开箱检验的情况下,可以购买.(2)①X的可能取值为0,1,2,P(X=0)=C02×0·20×0·82=0.64,P(X=1)=C12×0·21×0·81=0.32,P(X=2)=C22×0·82×0·20=0.04,∴X的分布列为:-3-X012P0.640.320.04E(X)=0×0.64+1×0.32+2×0.04=0.4.②设事件A:发现在抽取检验的2件产品中,其中恰有一件是废品,则P(A)=C12×0.2×0.8×0.5+C12×0.1×0.9×0.5=0.25,一箱产品中,设正品的价格的期望值为η,则η=8000,9000,事件B1:抽取的废品率为20%的一箱,则,P(η=8000)=P(B1|A)=PAB1PA=C12×0.2×0.8×0.50.25=0.64,事件B2:抽取的废品率为10%的一箱,则P(η=9000)=P(B2|A)=PAB2PA=C12×0.1×0.9×0.50.25=0.36,∴E(η)=8000×0.64+9000×0.36=8360<8400,∴已发现在抽取检验的2件产品中,其中恰有一件是废品,不可以购买.考点2概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.从某技术公司开发的某种产品中随机抽取200件,测量这些产品的一项质量指标值(记为Z),由测量结果得如下频率分布直方图:(1)公司规定:当Z≥95时,产品为正品;当Z95时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元.记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和数学期望;(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均-4-数x,σ2近似为样本方差s2(同一组中的数据用该区间的中点值作代表).①利用该正态分布,求P(87.8Z112.2);②某客户从该公司购买了500件这种产品,记X表示这500件产品中该项质量指标值位于区间(87.8,112.2)内的产品件数,利用①的结果,求E(X).附:150≈12.2.若Z~N(μ,σ2),则P(μ-σZμ+σ)=0.6827,P(μ-2σZμ+2σ)=0.9545.[解](1)由频率估计概率,产品为正品的概率为(0.033+0.024+0.008+0.002)×10=0.67,所以随机变量ξ的分布列为ξ90-30P0.670.33所以E(ξ)=90×0.67+(-30)×0.33=50.4.(2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数x和样本方差s2分别为x=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150.①因为Z~N(100,150),从而P(87.8Z112.2)=P(100-12.2Z100+12.2)=0.6827.②由①知,一件产品中该项质量指标值位于区间(87.8,112.2)内的概率为0.6827,依题意知X~B(500,0.6827),所以E(X)=500×0.6827=341.35.本题以统计图表为载体,将正态分布、二项分布、频率分布直方图巧妙的融合在一起,体现了知识的整合性与交汇融合性,搞清这些统计图表的含义,掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算是解决问题的关键.经销商经销某种农产品,在一个销售季度内,每售出1t该产品获得利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.-5-(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的均值.[解](1)当X∈[100,130)时,T=500X-300(130-X)=800X-39000.当X∈[130,150]时,T=500×130=65000.所以T=800X-39000,100≤X<130,65000,130≤X≤150.(2)由(1)知利润T不少于57000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0.7.(3)依题意可得T的分布列为T45000530006100065000P0.10.20.30.4所以E(T)=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.考点3概率与统计案例的综合应用概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.(2019·武汉二模)某市房管局为了了解该市市民2018年1月至2019年1月期间购买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:平方米,60≤m≤130)进行了一次调查统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年1月至2019年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年1月至2019年1月)-6-图1图2(1)试估计该市市民的平均购房面积m-;(2)从该市2018年1月至2019年1月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X,求X的分布列与数学期望;(3)根据散点图选择y^=a^+b^x和y^=c^+d^lnx两个模型进行拟合,经过数据处理得到两个回归方程,分别为y^=0.9369+0.0285x和y^=0.9554+0.0306lnx,并得到一些统计量的值,如表所示:请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年6月份的二手房购房均价(精确到0.001).参考数据:ln2≈0.69,ln3≈1.10,ln7≈2.83,ln19≈2.94,2≈1.41,3≈1.73,17≈4.12,19≈4.36.-7-参考公式:R2=1-i=1nyi-y^i2∑ni=1yi-y-2.[解](1)m-=65×0.05+75×0.1+85×0.2+95×0.25+105×0.2+115×0.15+125×0.05=96.(2)每一位市民购房面积不低于100平方米的概率为0.20+0.15+0.05=0.4,∴X~B(3,0.4),∴P(X=k)=Ck3×0·4k×0·63-k,(k=0,1,2,3),P(X=0)=0.63=0.216,P(X=1)=C13×0.4×0·62=0.432,P(X=2)=C23×0·42×0.6=0.288,P(X=3)=0.43=0.064,∴X的分布列为:X0123P0.2160.4320.2880.064∴E(X)=3×0.4=1.2.(3)设模型y^=0.9369+0.0285x和y^=0.9554+0.0306lnx的相关指数分别为R21,R22,则R21=1-0.0005910.00605,R22=1-0.0001640.00605,∴R21R22,∴模型y^=0.9554+0.0306lnx的拟合效果更好,2019年6月份对应的x=18,∴y^