【一轮复习讲义】2024年高考数学高频考点题型归纳与方法总结(新高考通用)素养拓展39概率与统计的综合问题(精讲+精练)①超几何分布与统计②二项分布与统计③正态分布与统计④条件概率与统计一、概率与统计问题概率与统计是高考数学命题中的必考题,由于概率与统计中的分析方法与计数有关,而计数中的分析方法不同于逻辑分析方法,需要重新建立一种独特的思维模式.在此过程中,基础不够牢固的话,遇到思维障碍较多.随机变量的分布列建立在随机变量的取值与取值的概率之上,把随机变量的取值转化为随机事件,才容易通过计数方法得到取值的概率.概率统计问题本质上难在两个方面:一是模型的识别与分析,要准确把握给定现象或信息中随机变量所遵循的概率模型;二是在计算分布列时,随机变量取值转化为随机事件的概率,这涉及计数的难点.二、相关知识点归纳Ⅰ频率分布直方图1.频率、频数、样本容量的计算方法①频率组距×组距=频率.②频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于1.2.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为x,利用x左(右)侧矩形面积之和等于0.5,即可求出x.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有1111nnxxpxpxp,其中nx为每个小长方形底边的中点,np为每个小长方形一、知识点梳理的面积.Ⅱ独立性检验(1)定义:利用独立性假设、随机变量2K来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.(2)公式:22()()()()()nadbcKabcdacbd,其中nabcd为样本容量.(3)独立性检验的具体步骤如下:①计算随机变量2K的观测值k,查下表确定临界值0k:20pKk0.50.400.250.150.100.050.0250.0100.0050.0010k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828②如果0kk,就推断“X与Y有关系”,这种推断犯错误的概率不超过20pKk;否则,就认为在犯错误的概率不超过20pKk的前提下不能推断“X与Y有关系”.Ⅲ线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程ybxa的求法为1122211()()()nniiiiiinniiiixxyyxynxybxxxnxaybx其中,11niixxn,11niiyyn,(x,y)称为样本点的中心.Ⅳ二项分布1.定义一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,不发生的概率1qp,那么事件A恰好发生k次的概率是CkknknPXkpq(0k,1,2,…,n)于是得到X的分布列X01…k…np00Cnnpq111Cnnpq…Ckknknpq…0Cnnnpq由于表中第二行恰好是二项式展开式001110CCCCnnnkknknnnnnnqppqpqpqpq各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记作()XBnp~,,并称p为成功概率.3.二项分布的期望、方差若()XBnp~,,则()EXnp,)(1)(nppDX.Ⅴ超几何分布1.定义在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件Xk发生的概率为()knkMNMnNCCPXkC,0k,1,2,…,m,其中minmMn,,且nN,MN,n,M,*NN,称分布列为超几何分布列.如果随机变量X的分布列为超几何分布列,则称随机变量服从超几何分布.X01…mP00nMNMnNCCC11nMNMnNCCC…mnmMNMnNCCCⅥ正态分布1.定义随机变量X落在区间(]ab,的概率为,()d()baPxaXbx,即由正态曲线,过点(0)a,和点(0)b,的两条x轴的垂线,及x轴所围成的平面图形的面积,如下图中阴影部分所示,就是X落在区间(]ab,的概率的近似值.一般地,如果对于任何实数a,()bab,随机变量X满足,()d()baPxaXbx,则称随机变量X服从正态分布.正态分布完全由参数,确定,因此正态分布常记作2()N,.如果随机变量X服从正态分布,则记为2()XN,.其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.2.3原则若2()XN,,则对于任意的实数0a,,()d()aaPaXaxx为下图中阴影部分的面积,对于固定的和a而言,该面积随着的减小而变大.这说明越小,X落在区间(,]aa的概率越大,即X集中在周围的概率越大X特别地,有()0.6826PX;(22)0.9544PX;(33)PX0.9974.由(33)PX0.9974,知正态总体几乎总取值于区间(33),之内.而在此区间以外取值的概率只有0.0026,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用中,通常认为服从于正态分布2()N,的随机变量X只取(33),之间的值,并简称之为3原则.【典例1】某学校共有1000名学生参加知识竞赛,其中男生500人,为了解该校学生在知识竞赛中的情况,采取分层抽样随机抽取了100名学生进行调查,分数分布在450950分之间,根据调查的结果绘制的学生分数频率分布直方图如图所示:将分数不低于750分的学生称为“高分选手”.(1)求a的值,并估计该校学生分数的平均数、中位数和众数;(同一组中的数据用该组区间的中点值作代表);(2)现采用分层抽样的方式从分数落在650,750,750,850内的两组学生中抽取8人,再从这8人中随机抽取3人,记被抽取的3名学生中属于“高分选手”的学生人数为随机变量X,求X的分布列及数学期望.【详解】(1)由题意知1000.00150.00250.00150.0011a,解得0.0035a,所以每组的频率依次为0.150.350.250.150.10,,,,,样本平均数5000.156000.357000.258000.159000.10670x,因为0.150.350.5,所以中位数650,又因为550,650的频率最大,所以众数为600.(2)由题意可得:从650,750中抽取0.25850.250.15人,从750,850中抽取0.15830.250.15人,二、题型精讲精练则随机变量X的所有可能取值有0,1,2,3.可知33538CC0,1,2,3CkkPXkk,即031221303535353533338888CCCCCCCC5151510,1,,3C28C28C56C56PPPkPXXXX,所以随机变量X的分布列为:X0123P52815281556156随机变量X的数学期望51515190123282856568EX.【典例2】某市热线网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票,按照该市暴雨前后两个时间各收集了50份有效投票,所得统计结果如下表:暴雨前后支持情况支持不支持总计暴雨后xy50暴雨前203050总计AB100已知工作人员从所有投票中任取一张,取到“不支持投入”的投票概率为25.(1)求列联表中的数据x,y,A,B的值;(2)能够有多大把握认为暴雨与该市民众是否赞成加大修建城市地下排水设施的投入有关?(3)用样本估计总体,在该市全体市民中任意选取4人,其中“支持加大修建城市地下排水设施的资金投入”的人数记为ξ,求ξ的分布列和数学期望.附:22nadbcabcdacbd.【详解】(1)设“从所有投票中任取一张,取到‘不支持投入’的投票”为事件C,由已知得3021005yPC,所以10y,所以40B,40x,60A;(2)χ2=2100(30402010)16.676.63550504060,故有99%的把握认为暴雨对该市民众是否赞成加大对修建城市地下排水设施的投入有关.(3)ξ的所有可能取值为0,1,2,3,4,用样本估计总体,任取一人支持的概率6031005P,所以3(4,)5B,4432()C()().55kkkPk所以ξ的分布列为:ξ01234P166259662521662521662581625312()4.55Enp【典例3】射箭是群众喜闻乐见的运动形式之一,某项赛事前,甲、乙两名射箭受好者各射了一组(72支)箭进行赛前热身训练,下表是箭靶区域划分及两人成绩的频数记录信息:箭靶区域环外黑环蓝环红环黄圈区域颜色白色黑色蓝色红色黄色环数1-2环3-4环5环6环7环8环9环10环甲成绩(频数)0012363624乙成绩(频数)01245123612用赛前热身训练的成绩估计两名运动员的正式比赛的竞技水平,并假设运动员竞技水平互不影响,运动员每支箭的成绩也互不影响.(1)甲乙各射出一支箭,求有人命中8环及以上的概率;(2)甲乙各射出两支箭,求共有3支箭命中黄圈的概率.【详解】(1)设A“甲运动员一箭命中8环及以上”,B“乙运动员一箭命中8环及以上”,C“有人命中8环及以上”,则6611()7212PA,605()726PB,显然事件A,B相互独立,CAB,()()()()()PCPABPAPBPAB1111571()()()()126126725PAPBPAPB,所以甲乙各射出一支箭,有人命中8环及以上的概率为7172.(2)设iA=“甲运动员第i箭命中黄圈”,iB=“乙运动员第i箭命中黄圈”,1,2i,则605(726)iPA,482(723)iPB,设D=“共有3支箭命中黄圈”,1212121212121212DAABBAABBAABBAABB,显然1212,,,AABB相互独立,且1212AABB,1212AABB,1212AABB,1212AABB互斥,所以甲乙各射出两支箭,共有3支箭命中黄圈的概率为:1212121212121212)()(PDPAABBAABBAABBAABB552155125122152235663366336633663381.【典例4】W企业D的产品p正常生产时,产品p尺寸服从正态分布80,0.25N,从当前生产线上随机抽取400件产品进行检测,产品尺寸汇总如下表:产品尺寸/mm76,78.578.5,7979,79.579.5,80.580.5,8181,81.581.5,83件数85454160724012根据产品质量标准和生产线的实际情况,产品尺寸在3,3以外视为小概率事件.一旦小概率事件发生视为生产线出现异常,产品尺寸在3,3以内为正品,以外为次品.()0.6827,(22)0.9545,(33)0.9973PXPXPX.(1)判断生产线是否正常工作,并说明理由;(2)用频率表示概率,若再随机从生产线上取3件产品复检,正品检测