第4讲概率与统计的综合问题第十一章统计、统计案例某中学高三年级共有学生1000人,将某次模拟考试的数学成绩(满分150分,所有成绩均不低于70分)按[70,80),[80,90),…,[140,150]分成8组,并制成如图所示的频率分布直方图.“双图”“五数”及概率(师生共研)(1)求x的值;(2)用分层抽样的方法从成绩在[70,90)内的试卷中抽取7份,求这7份试卷中成绩在[70,80)内的试卷数;(3)从(2)中抽出的7份试卷中任取2份,求成绩在[70,80)和[80,90)内的试卷各有1份的概率.【解】(1)由(0.002+0.005+0.008+2x+2×0.02+0.025)×10=1,得x=0.01.(2)成绩在[70,80)内的试卷数为1000×0.002×10=20,成绩在[80,90)内的试卷数为1000×0.005×10=50.故这7份试卷中成绩在[70,80)内的试卷数为7×27=2(份).(3)由(2)知成绩在[70,80)内的试卷数为2,分记为A1,A2,成绩在[80,90)内的试卷数为5,分别记为B1,B2,B3,B4,B5,从中任取2份试卷的所有情况为(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A1,B5),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(A2,B5),(B1,B2),(B1,B3),(B1,B4),(B1,B5),(B2,B3),(B2,B4),(B2,B5),(B3,B4),(B3,B5,)(B4,B5),共21种.成绩在[70,80)和[80,90)内的试卷各有1份的情况为(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A1,B5),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(A2,B5),共10种,记“从这7份试卷中任取2份,成绩在[70,80)和[80,90)内的试卷各有1份”为事件M,则P(M)=1021.求解此类问题的关键是准确地掌握数与形的语言转换要领.一是会画图,二是会读图,三是会用公式,四是能准确计算.(2019·唐山五校联考)某篮球队在本赛季已结束的8场比赛中,队员甲得分统计的茎叶图如下:(1)求甲在比赛中得分的均值和方差的大小;(2)从甲比赛得分在20分以下的6场比赛中随机抽取2场进行失误分析,求抽到2场都不超过均值的概率.解:(1)甲在比赛中得分的均值x-=18×(7+8+10+15+17+19+21+23)=15,方差s2=18×[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.(2)题设所述的6场比赛甲得分分别为:7,8,10,15,17,19.从中随机抽取2场,这2场比赛的得分如下:(7,8),(7,10),(7,15),(7,17),(7,19),(8,10),(8,15),(8,17),(8,19),(10,15),(10,17),(10,19),(15,17),(15,19),(17,19),共15种.其中抽到2场都不超过均值的情形是:(7,8),(7,10),(7,15),(8,10),(8,15),(10,15),共6种,所以所求概率P=615=25.某公司为了解广告投入对销售收益的影响,在若干地区共投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.频率直方图与统计案例(师生共研)(1)根据频率分布直方图计算图中各小矩形的宽度;(2)试估计该公司投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x/万元12345销售收益y/万元2327由表中的数据显示,x与y之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出y关于x的回归直线方程.附参考公式:b^=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.【解】(1)设各小矩形的宽度为m,由频率分布直方图中各小矩形的面积和为1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m=1,解得m=2.故图中各小矩形的宽度为2.(2)由(1)知各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],它们的中点的横坐标分别为1,3,5,7,9,11,各组对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,故可估计销售收益的平均值为1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5.(3)由(2)可知空白栏中填5.由题意可知,x-=1+2+3+4+55=3,y-=2+3+2+5+75=3.8,i=15xiyi=1×2+2×3+3×2+4×5+5×7=69.i=15x2i=12+22+32+42+52=55,所以b^=69-5×3×3.855-5×32=1.2,a^=3.8-1.2×3=0.2,故所求的回归直线方程为y^=1.2x+0.2.求解频率分布直方图与回归直线方程相交汇题的关键:一是会观图读数据,即会利用频率分布直方图,读出相关的数据;二是会用公式,如会用平均数的计算公式求样本的平均数,会利用回归系数a^,b^的计算公式求出a^,b^,从而得其回归直线方程.(2017·高考全国卷Ⅱ改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)估计旧养殖法的箱产量低于50kg的概率;(2)填写下面2×2列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.箱产量<50kg箱产量≥50kg合计旧养殖法新养殖法合计附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k)0.0500.0100.001k3.8416.63510.828解:(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,所以旧养殖法的箱产量低于50kg的概率估计值为0.62.(2)根据箱产量的频率分布直方图得2×2列联表如下:箱产量<50kg箱产量≥50kg合计旧养殖法6238100新养殖法3466100合计96104200K2=200×(62×66-34×38)2100×100×96×104≈15.705,由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(2019·郑州第一次质量测试)2017年10月份郑州市进行了高三学生的体育学业水平测试,为了考察高中学生的身体素质情况,现抽取了某校1000名(男生800名,女生200名)学生的测试成绩,根据性别按分层抽样的方法抽取100名学生的测试成绩进行分析,得到如下统计表:概率与统计案例(师生共研)男生测试情况:抽样情况病残免试不合格合格良好优秀人数5101547x女生测试情况:抽样情况病残免试不合格合格良好优秀人数2310y2(1)现从抽取的100名且测试等级为“优秀”的学生中随机选出2名学生,求选出的这2名学生恰好是一男一女的概率;(2)若测试等级为“良好”或“优秀”的学生为“体育达人”,其他等级(含病残免试)的学生为“非体育达人”,根据以上统计数据填写下面列联表,并回答能否在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关?”男性女性总计体育达人非体育达人总计临界值表:P(K2≥k0)0.100.050.0250.0100.005k02.7063.8415.0246.6357.879附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解】(1)按分层抽样的知识知男生应抽取80名,女生应抽取20名.所以x=80-(5+10+15+47)=3,y=20-(2+3+10+2)=3.抽取的100名且测试等级为“优秀”的3名男生分别记为A,B,C,2名女生分别记为a,b.从5名学生中任选2名,总的基本事件有(A,B),(A,C),(A,a),(A,b),(B,C),(B,a),(B,b),(C,a),(C,b),(a,b),共10个.设“选出的2名学生恰好是一男一女”为事件M,则事件M包含的基本事件有(A,a),(A,b),(B,a),(B,b),(C,a),(C,b),共6个,所以P(M)=610=35.(2)2×2列联表如下:男性女性总计体育达人50555非体育达人301545总计8020100则K2=100×(50×15-30×5)280×20×55×45≈9.091.因为9.091>6.635且P(K2≥6.635)=0.010.所以能在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关”.求解概率、统计综合问题的一般步骤第一步:审清题意.理清条件和结论,找到关键数量关系.第二步:找数量关系.把图形语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案.找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论.依据数据,借助数表作出正确判断.(2019·江西七校第一次联考)最近青少年的视力健康问题引起习主席的高度重视,某地区为了解当地24所小学,24所初中和12所高中的学生的视力状况,准备采用分层抽样的方法从这些学校中随机抽取5所学校对学生进行视力调查.(1)若从所抽取的5所学校中再随机抽取3所学校进行问卷调查,求抽到的这3所学校中,小学、初中、高中分别有一所的概率;(2)若某小学被抽中,调查得到了该小学前五个年级近视率y的数据如下表:年级号x12345近视率y0.050.090.160.200.25根据前五个年级的数据,利用最小二乘法求出y关于x的线性回归方程,并根据方程预测六年级学生的近视率.附:回归直线y^=b^x+a^的斜率和截距的最小二乘法估计公式分别为,a^=.解:(1)由24∶24∶12=2∶2∶1,得抽取的5所学校中有2所小学、2所初中、1所高中,分别设为a1,a2,b1,b2,c.从这5所学校中随机抽取3所学校的所有基本事件为(a1,a2,b1),(a1,a2,b2),(a1,a2,c),(a1,b1,b2),(a1,b1,c),(a1,b2,c),(a2,b1,b2),(a2,b1,c),(a2,b2,c),(b1,b2,c),共10种.设事件A表示“抽到的这3所学校中,小学、初中、高中分别有一所”,则事件A包含的基本事件为(a1,b1,c),(a1,b2,c),(a2,b1,c),(a2,b2,c),共4种,故P(A)=410=25.(2)由题中表格数据得x-=3,y-=0.15,5x-y-=2.25,5x-2=45,且由参考数据:得b^=2.76-2.2555-45=0.051,a^=0.15-0.051×3=-0.003,得线性回归方程为y^=0.051x-0.003.当x=6时,代入得y^=0.051×6-0.003=0.303,所以六年级学生的近视率在0.303左右.