专题09概率与统计1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)iixyi得到下面的散点图:由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是A.yabxB.2yabxC.exyabD.lnyabx【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y和温度x的回归方程类型的是lnyabx.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.【2020年高考全国II卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者A.10名B.18名C.24名D.32名【答案】B【解析】由题意,第二天新增订单数为50016001200900,设需要志愿者x名,500.95900x,17.1x,故需要志愿者18名.故选:B【点晴】本题主要考查函数模型的简单应用,属于基础题.3.【2020年高考全国III卷理数】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,pppp,且411iip,则下面四种情形中,对应样本的标准差最大的一组是A.14230.1,0.4ppppB.14230.4,0.1ppppC.14230.2,0.3ppppD.14230.3,0.2pppp【答案】B【解析】对于A选项,该组数据的平均数为140.1230.42.5Ax,方差为2222212.50.122.50.432.50.442.50.10.65As;对于B选项,该组数据的平均数为140.4230.12.5Bx,方差为2222212.50.422.50.132.50.142.50.41.85Bs;对于C选项,该组数据的平均数为140.2230.32.5Cx,方差为2222212.50.222.50.332.50.342.50.21.05Cs;对于D选项,该组数据的平均数为140.3230.22.5Dx,方差为2222212.50.322.50.232.50.242.50.31.45Ds.因此,B选项这一组标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是A.62%B.56%的C.46%D.42%【答案】C【解析】记“该中学学生喜欢足球”为事件A,“该中学学生喜欢游泳”为事件B,则“该中学学生喜欢足球或游泳”为事件AB,“该中学学生既喜欢足球又喜欢游泳”为事件AB,则()0.6PA,()0.82PB,0.96PAB,所以()PAB()()()PAPBPAB0.60.820.960.46所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.5.【2020年高考山东】信息熵是信息论中的一个重要概念.设随机变量X所有可能的取值为1,2,,n,且1()0(1,2,,),1niiiPXipinp,定义X的信息熵21()logniiiHXpp.A.若n=1,则H(X)=0B.若n=2,则H(X)随着1p的增大而增大C.若1(1,2,,)ipinn,则H(X)随着n的增大而增大D.若n=2m,随机变量Y所有可能的取值为1,2,,m,且21()(1,2,,)jmjPYjppjm,则H(X)≤H(Y)【答案】AC【解析】对于A选项,若1n,则11,1ip,所以21log10HX,所以A选项正确.对于B选项,若2n,则1,2i,211pp,所以121121log1log1HXpppp,当114p时,221133loglog4444HX,当13p4时,223311loglog4444HX,两者相等,所以B选项错误.对于C选项,若11,2,,ipinn,则222111logloglogHXnnnnn,则HX随着n的增大而增大,所以C选项正确.对于D选项,若2nm,随机变量Y的所有可能的取值为1,2,,m,且21jmjPYjpp(1,2,,jm).2222111loglogmmiiiiiiHXpppp122221222122121111loglogloglogmmmmpppppppp.HY122221212122211111logloglogmmmmmmmmpppppppppppp12222122212221221121111loglogloglogmmmmmmpppppppppppp由于01,2,,2ipim,所以2111iimippp,所以222111loglogiimippp,所以222111loglogiiiimippppp,所以HXHY,所以D选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.6.【2020年高考江苏】已知一组数据4,2,3,5,6aa的平均数为4,则a的值是▲.【答案】2【解析】∵数据4,2,3,5,6aa的平均数为4∴4235620aa,即2a.故答案为:2.【点睛】本题主要考查平均数的计算和应用,比较基础.7.【2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____.【答案】19【解析】根据题意可得基本事件数总为6636个.点数和为5的基本事件有1,4,4,1,2,3,3,2共4个.∴出现向上的点数和为5的概率为41369P.故答案为:19.【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题.8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为A.10B.18C.20D.36【答案】B【解析】根据直方图,直径落在区间5.43,5.47之间的零件频率为:6.255.000.020.225,则区间5.43,5.47内零件的个数为:800.22518.故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.9.【2020年高考天津】已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.【答案】1623【解析】甲、乙两球落入盒子的概率分别为11,23,且两球是否落入盒子互不影响,所以甲、乙都落入盒子概率为111236,甲、乙两球都不落入盒子的概率为111(1)(1)233,所以甲、乙两球至少有一个落入盒子的概率为23.故答案为:16;23.【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础题.10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为,则(0)P_______,()E_______.【答案】13,1【解析】因为0对应事件为第一次拿红球或第一次拿绿球,第二次拿红球,所以1111(0)4433P,随机变量0,1,2,212111211(1)434324323P,111(2)1333P,所以111()0121333E.的故答案为:1;13.【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求解能力,属基础题.11.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116.(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为111178168816.12.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160iix,2011200iiy,2021)8(0iixx,2021)9000(iiyy,201)()800(iiiyyxx.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数12211)(()()()iiininiinixyrxyxyxy,21.414.【解析】(1)由已知得样本平均数20160120iiyy,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(,)iixy(1,2,,20)i的相关系数20