第08讲两点分布、二项分布、超几何分布与正态分布目录考点要求考题统计考情分析(1)理解两点分布、二项分布、超几何分布的概念,能解决一些简单的实际问题.(2)借助正态分布曲线了解正态分布的概念,并进行简单应用.2022年II卷第13题,5分2021年II卷第6题,5分2018年I卷第18题,12分从近五年的全国卷的考查情况来看,本节是高考的热点,特别是解答题中,更是经常出现.本节的重点内容是求随机变量的分布列与数学期望.求分布列其实是求概率的过程,首先要明确随机变量的类型,是二项分布、超几何分布或是一般的概率分布.对于一般的概率分布,没有特别的公式,就需要将复杂事件拆分为等价的几个事件,根据概率计算公式求概率,从而得到分布列.对于数学期望与方差,都可用定义运用相应的公式求解,因而关键问题还是求分布列.知识点一.两点分布1、若随机变量X服从两点分布,即其分布列为X01P1pp其中01p,则称离散型随机变量X服从参数为p的两点分布.其中(1)PX称为成功概率.注意:(1)两点分布的试验结果只有两个可能性,且其概率之和为1;(2)两点分布又称01分布、伯努利分布,其应用十分广泛.2、两点分布的均值与方差:若随机变量X服从参数为p的两点分布,则()10(1)ppEXp,()(1)pDXp.知识点二.n次独立重复试验1、定义一般地,在相同条件下重复做的n次试验称为n次独立重复试验.注意:独立重复试验的条件:①每次试验在同样条件下进行;②各次试验是相互独立的;③每次试验都只有两种结果,即事件要么发生,要么不发生.2、特点(1)每次试验中,事件发生的概率是相同的;(2)每次试验中的事件是相互独立的,其实质是相互独立事件的特例.知识点三.二项分布1、定义一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,不发生的概率1qp,那么事件A恰好发生k次的概率是CkknknPXkpq(0k,1,2,…,n)于是得到X的分布列X01…k…np00Cnnpq111Cnnpq…Ckknknpq…0Cnnnpq由于表中第二行恰好是二项式展开式001110CCCCnnnkknknnnnnnqppqpqpqpq各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记作()XBnp~,,并称p为成功概率.注意:由二项分布的定义可以发现,两点分布是一种特殊的二项分布,即1n时的二项分布,所以二项分布可以看成是两点分布的一般形式.2、二项分布的适用范围及本质(1)适用范围:①各次试验中的事件是相互独立的;②每次试验只有两种结果:事件要么发生,要么不发生;③随机变量是这n次独立重复试验中事件发生的次数.(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.3、二项分布的期望、方差若()XBnp~,,则()EXnp,)(1)(nppDX.知识点四.超几何分布1、定义在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件Xk发生的概率为()knkMNMnNCCPXkC,0k,1,2,…,m,其中minmMn,,且nN,MN,n,M,*NN,称分布列为超几何分布列.如果随机变量X的分布列为超几何分布列,则称随机变量服从超几何分布.X01…mP00nMNMnNCCC11nMNMnNCCC…mnmMNMnNCCC2、超几何分布的适用范围件及本质(1)适用范围:①考察对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考察某类个体个数Y的概率分布.(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.知识点四、正态曲线1、定义:我们把函数22()2,1()e2xx,()x,(其中是样本均值,是样本标准差)的图象称为正态分布密度曲线,简称正态曲线.正态曲线呈钟形,即中间高,两边低.2、正态曲线的性质(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x对称;(3)曲线在x处达到峰值(最大值)12;(4)曲线与x轴之间的面积为1;(5)当一定时,曲线的位置由确定,曲线随着的变化而沿x轴平移,如图甲所示:(6)当一定时,曲线的形状由确定.越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示::X甲乙知识点五、正态分布1、定义随机变量X落在区间(]ab,的概率为,()d()baPxaXbx,即由正态曲线,过点(0)a,和点(0)b,的两条x轴的垂线,及x轴所围成的平面图形的面积,如下图中阴影部分所示,就是X落在区间(]ab,的概率的近似值.一般地,如果对于任何实数a,()bab,随机变量X满足,()d()baPxaXbx,则称随机变量X服从正态分布.正态分布完全由参数,确定,因此正态分布常记作2()N,.如果随机变量X服从正态分布,则记为2()XN,.其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.2、3原则若2()XN,,则对于任意的实数0a,,()d()aaPaXaxx为下图中阴影部分的面积,对于固定的和a而言,该面积随着的减小而变大.这说明越小,X落在区间(,]aa的概率越大,即X集中在周围的概率越大特别地,有()0.6826PX;(22)0.9544PX;(33)PX0.9974.由(33)PX0.9974,知正态总体几乎总取值于区间(33),之内.而在此区间以外取值的概率只有0.0026,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用中,通常认为服从于正态分布2()N,的随机变量X只取(33),之间的值,并简称之为3原则.【解题方法总结】1、超几何分布和二项分布的区别(1)超几何分布需要知道总体的容量,而二项分布不需要;(2)超几何分布是“不放回”抽取,在每次试验中某一事件发生的概率是不相同的;而二项分布是“有放回”抽取(独立重复),在每次试验中某一事件发生的概率是相同的.2、在解决有关问题时,通常认为服从正态分布2(,)N的随机变量x只取(33),之间的值.如果服从正态分布的随机变量的某些取值超出了这个范围就说明出现了意外情况.3、求正态变量x在某区间内取值的概率的基本方法:(1)根据题目中给出的条件确定与的值.(2)将待求问题向(],,(22],,(33],这三个区间进行转化;(3)利用x在上述区间的概率、正态曲线的对称性和曲线与x轴之间的面积为1求出最后结果.4、假设检验的思想(1)统计中假设检验的基本思想:根据小概率事件在一次试验中几乎不可能发生的原则和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:是拒绝假设,还是接受假设.(2)若随机变量ξ服从正态分布2(,)N,则ξ落在区间(33],内的概率为0.9974,亦即落在区间(33],之外的概率为0.0026,此为小概率事件.如果此事件发生了,就说明不服从正态分布.(3)对于小概率事件要有一个正确的理解:小概率事件是指发生的概率小于3%的事件.对于这类事件来说,在大量重复试验中,平均每试验大约33次,才发生1次,所以认为在一次试验中该事件是几乎不可能发生的.不过应注意两点:一是这里的“几乎不可能发生”是针对“一次试验”来说的,如果试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,也有3%犯错的可能性.题型一:两点分布例1.(2023·江苏镇江·高三江苏省镇江第一中学校考阶段练习)若随机变量X服从两点分布,其中103PX,,EXDX分别为随机变量X的均值与方差,则下列结论不正确的是()A.1PXEXB.324EXC.324DXD.29DX例2.(2023·全国·高三专题练习)设随机变量X服从两点分布,若100.4PXPX,则EX()A.0.3B.0.4C.0.6D.0.7例3.(2023·全国·高三专题练习)有一个盒子里有1个红球,现将n(*nN)个黑球放入盒子后,再从盒子里随机取一球,记取到的红球个数为个,则随着n(*nN)的增加,下列说法正确的是()A.E减小,D增加B.E增加,D减小C.E增加,D增加D.E减小,D减小变式1.(2023·全国·高三专题练习)已知离散型随机变量X的分布列服从两点分布,且0341PXPXa,则a()A.23B.12C.13D.14变式2.(2023·北京·高三专题练习)某高校“植物营养学专业”学生将鸡冠花的株高增量作为研究对象,观察长效肥和缓释肥对农作物影响情况.其中长效肥、缓释肥、未施肥三种处理下的鸡冠花分别对应1,2,3三组.观察一段时间后,分别从1,2,3三组随机抽取40株鸡冠花作为样本,得到相应的株高增量数据整理如下表.株高增量(单位:厘米)4,77,1010,1313,16第1组鸡冠花株数92092第2组鸡冠花株数416164第3组鸡冠花株数1312132假设用频率估计概率,且所有鸡冠花生长情况相互独立.(1)从第1组所有鸡冠花中随机选取1株,估计株高增量为7,10厘米的概率;(2)分别从第1组,第2组,第3组的所有鸡冠花中各随机选取1株,记这3株鸡冠花中恰有X株的株高增量为7,10厘米,求X的分布列和数学期望EX;(3)用“1k”表示第k组鸡冠花的株高增量为4,10,“0k”表示第k组鸡冠花的株高增量为10,16厘米,1,2,3k,直接写出方差1D,2D,3D的大小关系.(结论不要求证明)变式3.(2023·全国·高三专题练习)某工厂生产某种电子产品,每件产品不合格的概率均为p,现工厂为提高产品声誉,要求在交付用户前每件产品都通过合格检验,已知该工厂的检验仪器一次最多可检验5件该产品,且每件产品检验合格与否相互独立.若每件产品均检验一次,所需检验费用较多,该工厂提出以下检验方案:将产品每k个5k一组进行分组检验,如果某一组产品检验合格,则说明该组内产品均合格,若检验不合格,则说明该组内有不合格产品,再对该组内每一件产品单独进行检验,如此,每一组产品只需检验1次或1k次.设该工厂生产1000件该产品,记每件产品的平均检验次数为X.(1)求X的分布列及其期望;(2)(i)试说明,当p越小时,该方案越合理,即所需平均检验次数越少;(ii)当0.1p时,求使该方案最合理时k的值及1000件该产品的平均检验次数.变式4.(2023·全国·高三专题练习)某单位有员工50000人,一保险公司针对该单位推出一款意外险产品,每年每位职工只需要交少量保费,发生意外后可一次性获得若干赔偿金.保险公司把该单位的所有岗位分为A,B,C三类工种,从事三类工种的人数分布比例如饼图所示,且这三类工种每年的赔付概率如下表所示:工种类别ABC赔付概率511052104110对于A,B,C三类工种,职工每人每年保费分别为a元、a元、b元,出险后的赔偿金额分别为100万元、100万元、50万元,保险公司在开展此项业务过程中的固定支出为每年20万元.(1)若保险公司要求每年收益的期望不低于保费的15%,证明:153174200ab.(2)现有如下两个方案供单位选择:方案一:单位不与保险公司合作,职工不交保险,出意外后单位自行拿出与保险公司提供的等额赔偿金赔付给出意外的职工,单位开展这项工作的固定支出为每年35