1第5讲概率与统计■真题调研——————————————【例1】[2019·全国卷Ⅱ]11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10∶10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.解:(1)X=2就是10∶10平后,两人又打2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1-0.5)×(1-0.4)=0.5.(2)X=4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1-0.4)+(1-0.5)×0.4]×0.5×0.4=0.1.【例2】[2019·全国卷Ⅲ]为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:甲离子残留百分比直方图乙离子残留百分比直方图记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).2解:(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.【例3】[2019·北京卷]改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额(元)支付方式(0,1000](1000,2000]大于2000仅使用A18人9人3人仅使用B10人14人1人(1)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(2)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.解:(1)由题意知,样本中仅使用A的学生有18+9+3=30人,仅使用B的学生有10+14+1=25人,A,B两种支付方式都不使用的学生有5人.故样本中A,B两种支付方式都使用的学生有100-30-25-5=40人.所以从全校学生中随机抽取1人,该学生上个月A,B两种支付方式都使用的概率估计值为40100=0.4.(2)X的所有可能值为0,1,2.记事件C为“从样本仅使用A的学生中随机抽取1人,该学生上个月的支付金额大于1000元”,事件D为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于1000元”.由题设知,事件C,D相互独立,且P(C)=9+330=0.4,P(D)=14+125=0.6.所以P(X=2)=P(CD)=P(C)P(D)=0.24,3P(X=1)=P(CD∪CD)=P(C)P(D)+P(C)P(D)=0.4×(1-0.6)+(1-0.4)×0.6=0.52,P(X=0)=P(CD)=P(C)P(D)=0.24.所以X的分布列为X012P0.240.520.24故X的数学期望E(X)=0×0.24+1×0.52+2×0.24=1.(3)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额都大于2000元”.假设样本仅使用A的学生中,本月支付金额大于2000元的人数没有变化,则由上个月的样本数据得,P(E)=1C330=14060.答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2000元的人数发生了变化.所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.【例4】[2019·全国卷Ⅰ]为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.4(ⅰ)证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;(ⅱ)求p4,并根据p4的值解释这种试验方案的合理性.解:(1)X的所有可能取值为-1,0,1.P(X=-1)=(1-α)β,P(X=0)=αβ+(1-α)(1-β),P(X=1)=α(1-β).所以X的分布列为(2)(ⅰ)由(1)得a=0.4,b=0.5,c=0.1.因此pi=0.4pi-1+0.5pi+0.1pi+1(i=1,2,…,7),故0.1(pi+1-pi)=0.4(pi-pi-1),即pi+1-pi=4(pi-pi-1).又因为p1-p0=p1≠0,所以{pi+1-pi}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列.(ⅱ)由(ⅰ)可得p8=p8-p7+p7-p6+…+p1-p0+p0=(p8-p7)+(p7-p6)+…+(p1-p0)=48-13p1.由于p8=1,故p1=348-1,所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)=44-13p1=1257.p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=1257≈0.0039,此时得出错误结论的概率非常小,说明这种试验方案合理.■模拟演练——————————————1.[2019·南昌二模]某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区试点,得到试点地区加盟店个数分别为51,2,3,4,5时,单店日平均营业额y(单位:万元)的数据如下:加盟店个数x12345单店日平均营业额y/万元10.910.297.87.1(1)求单店日平均营业额y(单位:万元)与所在地区加盟店个数x的线性回归方程;(2)该公司根据(1)中所求的回归方程,决定在其他5个地区中,开设加盟店个数为5,6,7的地区数分别为2,1,2.小赵与小王都准备加入该公司的加盟店,但根据公司规定,他们只能分别从这5个地区的30个加盟店中随机抽取一个加入.记事件A:小赵与小王抽取到的加盟店在同一个地区,事件B:小赵与小王抽取到的加盟店预计日平均营业额之和不低于12万元,求在事件A发生的前提下事件B发生的概率.(参考数据及公式:i=15xiyi=125,i=15x2i=55,线性回归方程y^=b^x+a^,其中b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x)解:(1)由题可得,x=3,y=9,设所求线性回归方程为y^=b^x+a^,则b^=i=15xiyi-5xyi=15x2i-5x2=125-13555-45=-1,将x=3,y=9代入a^=y-b^x,得a^=9-(-3)=12,故所求线性回归方程为y^=-x+12.(2)根据(1)中所得回归方程,加盟店个数为5的地区单店预计日平均营业额为7万元,加盟店个数为6的地区单店预计日平均营业额为6万元,加盟店个数为7的地区单店预计日平均营业额为5万元.P(A)=C25×2+C26+C27×2C230=77435,P(AB)=C25×2+C26C230=35435,所以P(B|A)=PABPA=511.62.[2019·武汉4月调研]中共十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加.为了更好地制定2019年关于加快提升农民年收入,力争早日脱贫的工作计划,该地区扶贫办统计了2018年50位农民的年收入(单位:千元)并制成如下频率分布直方图:(1)根据频率分布直方图,估计50位农民的年平均收入x(单位:千元)(同一组数据用该组数据区间的中点值表示).(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布N(μ,σ2),其中μ近似为年平均收入x,σ2近似为样本方差s2,经计算得s2=6.92.利用该正态分布,解决下列问题:①在2019年脱贫攻坚工作中,若使该地区约有占总农民人数的84.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元?②为了调研“精准扶贫,不落一人”的落实情况,扶贫办随机走访了1000位农民.若每个农民的年收入相互独立,问:这1000位农民中年收入不少于12.14千元的人数最有可能是多少?附:参考数据与公式6.92≈2.63,若X~N(μ,σ2),则①P(μ-σX≤μ+σ)≈0.6827;②P(μ-2σX≤μ+2σ)≈0.9545;③P(μ-3σX≤μ+3σ)≈0.9973.解:(1)x=12×0.04+14×0.12+16×0.28+18×0.36+20×0.10+22×0.06+24×0.04=17.40(千元).(2)由题意,X~N(17.40,6.92).①P(Xu~σ)≈12+0.68272≈0.8414,μ-σ≈17.40-2.63=14.77,7即最低年收入大约为14.77千元.②由P(X≥12.14)=P(X≥μ-2σ)≈0.5+0.95452≈0.9773,得每个农民的年收入不少于12.14千元的事件的概率为0.9773,记这1000位农民中年收入不少于12.14千元的人数为ξ,则ξ~B(103,p),其中p=0.9773,于是恰好有k位农民的年收入不少于12.14千元的事件的概率是P(ξ=k)=Ck103pk(1-p)103-k,从而由Pξ=kPξ=k-1=1001-k×pk×1-p1,得k1001p,而1001p=978.2773,所以,当0≤k≤978时,P(ξ=k-1)P(ξ=k),当979≤k≤1000时,P(ξ=k-1)P(ξ=k).由此可知,在所走访的1000位农民中,年收入不少于12.14千元的人数最有可能是978.3.[2019·