1专题能力训练20概率、统计与统计案例专题能力训练第46页一、能力突破训练1.某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是()ABCD答案:B解析:这是几何概型问题,总的基本事件空间如图所示,共40分钟,等车时间不超过10分钟的时间段为7:50至8:00和8:20至8:30,共20分钟,故他等车时间不超过10分钟的概率为P=,故选B.2.已知x与y之间的一组数据:x0123ym35.57已求得关于y与x的线性回归方程为=2.1x+0.85,则m的值为()A.1B.0.85C.0.7D.0.5答案:D解析:由题意,得=1.5,(m+3+5.5+7)=,将()代入线性回归方程=2.1x+0.85,得m=0.5.3.通过随机询问50名性别不同的大学生是否爱好某项运动,得到如下的列联表,由K2=-得K2=-8.333.参照附表,得到的正确结论是()爱好不爱好合计男生20525女生101525合计302050P(K2≥k0)0.0100.0050.001k06.6357.87910.828A.在犯错误的概率不超过0.5%的前提下认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.5%的前提下认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下认为“爱好该项运动与性别无关”答案:A2解析:因为8.3337.879,由表知7.879对应值为0.005,所以在犯错误的概率不超过0.5%的前提下认为“爱好该项运动与性别有关”,故选A.4.(2018全国Ⅱ,理8)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是()ABCD答案:C解析:不超过30的素数有“2,3,5,7,11,13,17,19,23,29”共10个.其中和为30的有7+23,11+19,13+17共3种情况,故P=5.将甲、乙两个篮球队5场比赛的得分数据整理成茎叶图如图所示,由图可知以下结论正确的是()A.甲队平均得分高于乙队平均得分B.甲队得分的中位数大于乙队得分的中位数C.甲队得分的方差大于乙队得分的方差D.甲、乙两队得分的极差相等答案:C解析:甲=29;乙=30,甲乙,∴选项A错误;又甲的中位数是29,乙的中位数是30,2930,∴选项B错误;甲的极差为31-26=5,乙的极差为32-28=4,5≠4,∴选项D错误;故选C.6.如图,点A的坐标为(1,0),点C的坐标为(2,4),函数f(x)=x2.若在矩形ABCD内随机取一点,则此点取自阴影部分的概率等于.答案:3解析:∵S阴影=∫(4-x2)dx=,S矩形ABCD=4,∴P=阴影矩形7.有一个底面圆的半径为1,高为2的圆柱,点O为这个圆柱底面圆的圆心,在这个圆柱内随机取一点P,则点P到点O的距离大于1的概率为.答案:解析:设“点P到点O的距离大于1”为事件A,则表示事件“点P到点O的距离小于或等于1”.在圆柱内以O为球心,以1为半径作半球,则半球的体积V半球=13=,又V圆柱=π×12×2=2π,由几何概型,P()=半球圆柱故所求事件A的概率P(A)=1-P()=1-8.已知某地春天下雨的概率为40%.现采用随机模拟的方法估计未来三天恰有一天下雨的概率;先由计算器产生0到9之间取整数值的随机数,指定1,2,3,4表示下雨,5,6,7,8,9,0表示不下雨;再以每三个随机数作为一组,代表未来三天是否下雨的结果.经随机模拟产生了如下20组随机数:907,966,191,925,271,932,812,458,569,683,431,257,393,027,556,488,730,113,537,989.据此估计,该地未来三天恰有一天下雨的概率为.答案:0.4解析:根据题意,因为1,2,3,4表示下雨,当未来三天恰有一天下雨,就是三个数字xyz中只有一个数字属于集合{1,2,3,4},这20组数据中有以下8个数据符合题意,分别是925,458,683,257,027,488,730,537,所以其概率为=0.4.9.PM2.5是衡量空气污染程度的一个指标,为了了解A市空气质量情况,从2018年每天的PM2.5的数据中随机抽取40天的数据,其频率分布直方图如图所示.将PM2.5的数据划分成区间[0,100),[100,150),[150,200),[200,250],分别称为一级、二级、三级和四级,统计时用频率估计概率.(1)根据2018年PM2.5的数据估计该市在2019年中空气质量为一级的天数;4(2)按照分层抽样的方法,从样本二级、三级、四级中抽取6天的PM2.5数据,再从这6个数据中随机抽取2个,求仅有二级天气的概率.解:(1)由样本空气质量PM2.5的数据的频率分布直方图可知,其频率分布如下表:PM2.5数据[0,50)[50,100)[100,150)[150,200)[200,250)频率0.1250.1250.3750.250.125由上表可知,如果A市维持现状不变,那么该市2019年的某一天空气质量为一级的概率为0.25,因此在365天中空气质量为一级的天数约有365×0.25≈91(天).(2)在样本中,按照分层抽样的方法抽取6天的PM2.5数据,则这6个数据中二级、三级、四级天气的数据分别有3个、2个、1个,分别记为A1,A2,A3,B1,B2,C.从这6个数据中随机抽取2个,基本事件为{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A1,C},{A2,A3},{A2,B1},{A2,B2},{A2,C},{A3,B1},{A3,B2},{A3,C},{B1,B2},{B1,C},{B2,C},共15个基本事件,事件E为“仅有二级天气”,包含{A1,A2},{A1,A3},{A2,A3}共3个基本事件,故所求概率为P(E)=10.(2018全国Ⅲ,理18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,在犯错误的概率不超过0.01的情况下认为两种生产方式的效率有差异?附:K2=-,P(K2≥k0)0.0500.0100.001k03.8416.63510.828解:(1)第二种生产方式的效率更高.理由如下:5①由茎叶图可知,用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.②由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.③由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.④由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可.(2)由茎叶图知m==80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2=-=106.635,所以在犯错误的概率不超过0.01的前提下认为两种生产方式的效率有差异.11.研究机构对某校学生往返校时间的统计资料表明:该校学生居住地到学校的距离x(单位:千米)和学生花费在上学路上的时间y(单位:分钟)有如下的统计资料:到学校的距离x/千米1.82.63.14.35.56.1花费的时间y/分钟17.819.627.531.336.043.2如果统计资料表明y与x有线性相关关系,试求:(1)判断y与x是否有很强的线性相关性?(相关系数r的绝对值大于0.75时,认为两个变量有很强的线性相关性,精确到0.01)(2)求线性回归方程x+;(精确到0.01)(3)将27分钟的时间数据称为美丽数据,现从这6个时间数据中任取2个,求抽取的2个数据全部为美丽数据的概率.6参考数据:xi=23.4,yi=175.4,xiyi=764.36,(xi-)(yi-)=80.30,(xi-)2=14.30,(yi-)2=471.65,√--=82.13.参考公式:r=--√-----解:(1)∵r=--√--0.980.75,∴y与x有很强的线性相关性.(2)依题意得=3.9,yi≈29.23,(xi-)(yi-)=80.30,-=14.30.所以---5.62.又因为=29.23-5.62×3.9≈7.31,故线性回归方程为=5.62x+7.31.(3)由(2)可知,当x=3.1时,=24.73227,当x=4.3时,=31.47627,所以满足27分钟的美丽数据共有3个,设3个美丽数据为a,b,c,另3个不是美丽数据为A,B,C,则从6个数据中任取2个共有15种情况,即aA,aB,aC,bA,bB,bC,cA,cB,cC,AB,AC,BC,ab,ac,bc,其中,抽取到的数据全部为美丽数据的有3种情况,即ab,ac,bc.所以从这6个数据中任取2个,抽取的2个数据全部为美丽数据的概率为二、思维提升训练12.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2017年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加7C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案:A解析:由题图可知2017年8月到9月的月接待游客量在减少,故A错误.13.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:由表可得回归直线方程x+中的=-4,据此模型预测零售价为15元时,每天的销售量为()x16171819y50344131A.51个B.50个C.49个D.48个答案:C解析:由题意知=17.5,=39,代入回归直线方程得=109,即得回归直线方程=-4x+109,将x=15代入回归方程,得=-4×15+109=49,故选C.14.从n个正整数1,2,…,n中任意取出两个不同的数,若取出的两数之和等于7的概率为,则n=()A.10B.9C.8D.7答案:A解析:从n个正整数1,2,…,n中任意取出两个不同的数共有种取法,其中两数之和为7的取法为{1,6},{2,5},{3,4}共3种,故两数之和等于7的概率为由,解得n=10.15.从区间[0,1]随机抽取2n个数x1,x2,…,xn,y1,y2,…,yn,构成n个数对(x1,y1),(x2,y2),…,(xn,yn),其中两数的平方和小于1的数对共有m个,则用随机模拟的方法得到的圆周率π的近似值为()ABCD答案