1二项分布与超几何分布辨析马关县民族职业高级中学杨平荣摘要:二项分布与超几何分布是中学数学研究的两种分布类型,本文通过对两种分布的定义辨析入手,重点研究了超几何分布与二项分布的区别与联系,通过实例分析了两种分布类型的适用范围,理清了导致混淆的根源。关键词:超几何分布、二项分布、辨析、区别与联系。正文:在人教版《数学选修2-3》的课本中,第二章《概率》的2.1节和2.2节分别介绍了两种离散型随机变量的概率分布,超几何分布(hyper-geometricdistribution)与二项分布(binomialdistribution)。通过实例,让学生认识模型所刻画的随机变量的共同特点,从而建立新的模型,并能运用两模型解决一些实际问题。然而在教学过程中,却发现学生不能准确地辨别所要解决的问题是属于超几何分布还是二项分布,学生对这两模型的定义不能很好的理解,一遇到含“取”或“摸”的题型,就认为是超几何分布,不加分析,随便滥用公式。事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别。一、概念辨析二项分布:课本定义:在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则P(X=k)=𝐶𝑛𝑘𝑝𝑘(1−𝑝)𝑛−𝑘,𝑘=0,1,2,⋯,n.此时称随机变量X服从二项分布(binomialdistribution),记作X~B(n,k),并称p为成功概率。期望EX=np,方差DX=np(1-p).超几何分布:课本定义:一般地,在含有M件次品的N件产品中,任取n件,2其中恰有X件次品,则P(X=k)=𝐶𝑀𝑘∙𝐶𝑁−𝑀𝑛−𝑘𝐶𝑁𝑛,k=0,1,2⋯m.其中m=min{𝑀,𝑛},且n≤N,M≤N,n,M,N∈𝑁∗.则称随机变量X服从超几何分布(hypergeometricdistribution),记作X~H(N,n,M),期望X=𝑛,方差X=𝑛(−)(−𝑛)[(−)]。二、超几何分布和二项分布的联系把超几何分布中的视为二项分布中的成功率p则两者的期望均为EX=np,也就是两者的期望是一致的。二项分布的方差为DX=np(1-p),而超几何分布的方差为DX=n(1−)−𝑛−.可以看出,对于相同的N和n,超几何分布的方差是二项分布的方差的−𝑛−倍,当N时,−𝑛−1,此时超几何分布的方差趋近于二项分布的方差。三、超几何分布和二项分布的区别二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型。不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型。四、例题分析例1、袋中有6个白球、2个黑球,从中随机连续抽取3次,每次取一个球,求:(1)有放回抽样时,取到黑球的个数X的分布列和数学期望;(2)无放回抽样时,取到黑球的个数Y的分布列和数学期望。解:(1)有放回抽样时,随机变量X的可能取值为0、1、2、3,由于每次取到黑球的概率均为5,因此,3次取球可以看成3次独立重复试验,则X~B(3,4).P(X=k)=𝐶3𝑘∙(4)𝑘∙(1−4)3−𝑘,k=0、1、2、3.3X的分布列为X0123p27642764964164EX=34.(2)无放回抽样时,随机变量Y的可能取值为0、1、2.P(Y=0)=𝐶0∙𝐶63𝐶83=2056,P(Y=1)=𝐶1𝐶6𝐶83=3056P(Y=2)=𝐶𝐶61𝐶83=656,EY=0×20561×30562×656=34辨析:1.有放回抽样:每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型。2.不放回抽样:取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型。因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。然而我们也从中看到,尽管两种情况的随机变量的取值不尽相同,取同一个值时对应的概率也不同,但是两个随机变量最终的数学期望值却是相同的,这就是学生容易混淆的地方,所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的.例2、《中华人民共和国环境保护法》规定食品的汞含量不得超过1.00ppm.罗非鱼是体型较大,生命周期长的食肉鱼,其体内汞含量比其他鱼偏高.现从一批罗非鱼中随机地抽出15条作样本,经检测得各条鱼的汞含量的茎叶图(以小数点前一位数字为茎,小数点后一位数字为叶)如下:(ppm)罗非鱼的汞含量013215987321123544(Ⅰ)若某检查人员从这15条鱼中,随机地抽出3条,求恰有1条鱼汞含量超标的概率;(Ⅱ)从抽出的15条鱼中随机选取3条,记Y表示抽到的鱼汞含量超标的条数,求Y的分布列及数学期望EY.(Ⅲ)以此15条鱼的样本数据来估计这批鱼的总体数据.若从这批数量很大的鱼中任选3条鱼,记X表示抽到的鱼汞含量超标的条数,求X的分布列及数学期望EX.解:(I)记“15条鱼中任选3条恰好有1条鱼汞含量超标”为事件A则.∴15条鱼中任选3条恰好有1条鱼汞含量超标的概率为(Ⅱ)错解:依题意可知,这批罗非鱼中汞含量超标的鱼的概率P=,Y的所有可能取值为0,1,2,3,且Y~,Y的分布列为:P(Y=k)=𝐶3𝑘(3)𝑘(1−3)3−𝑘,k=0、1、2、3.所以EY=3×3=1正解:Y的所有可能取值为0、1、2、3.P(Y=0)=𝐶50𝐶103𝐶153=249,P(Y=1)=𝐶51𝐶10𝐶153=459,P(Y=2)=𝐶5𝐶101𝐶153=209P(Y=3)=𝐶53𝐶100𝐶153=29,所以,随机变量Y的分布列为:Y0123P24945920929EY=0×2491×4592×2093×29=1(Ⅲ)错解:X的所有可能取值为0、1、2、3.P(X=0)=𝐶50𝐶103𝐶153=249,P(X=1)=𝐶51𝐶10𝐶153=459,P(X=2)=𝐶5𝐶101𝐶153=209P(X=3)=𝐶53𝐶100𝐶153=29,所以,随机变量X的分布列为:X0123P249459209291251031545P(A)91CCC459131155)31(3,B5EX=0×2491×4592×2093×29=1正解:依题意可知,这批罗非鱼中汞含量超标的鱼的概率P=,X的所有可能取值为0,1,2,3,且X~,X的分布列为:P(X=k)=𝐶3𝑘(3)𝑘(1−3)3−𝑘,k=0、1、2、3.所以EX=3×3=1辨析:通过此例可以看出,学生最容易混淆这两种分布类型,准确把握超几何分布与二项分布的区别与联系是正确解决此类问题的关键,当用样本估计总体时,把样本的频率当作总体的概率,此时必须看清楚所抽取的个体究竟来自于样本还是来自于总体,当个体是从样本中抽取时,随机变量服从超几何分布,当个体是从总体中抽取时,可以认为随机变量服从二项分布。例3、甲、乙两人参加数学竞赛培训。现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如下:学科网甲乙9875842180035539025(Ⅰ)指出学生乙成绩的中位数,并说明它在乙组数据中的含义;学科网(II)现要从中选派一人参加数学竞赛,从平均成绩和方差的角度考虑,你认为派哪位学生参加合适?请说明理由;学科网(Ⅲ)若将频率视为概率,对学生甲在今后的三次数学竞赛成绩进行预测,记这三次成绩中高于80分的次数为,求的分布列及数学期望。学解:(Ⅰ)学生乙成绩的中位数是84,它是这组数据中最中间位置的一个数或最中间位置两个数的平均数,中位数可能在所给的数据中,也可能不在所给数据中。(Ⅱ)派甲参加比较合适,理由如下:,,,且。甲的成绩比较稳定,派甲参加比较合适。(Ⅲ)记“甲在一次数学竞赛中成绩高于80分”为事件,则。31155)31(3,BE1(70280490298842153)858x甲1(70180490353525)858x乙235.5S甲241S乙xx乙甲2S甲2S乙A63()84PA6依题意,得。,。的分布列为:0123。(或利用)参考文献:1、人教版《数学选修2-3》2、《超几何分布及二项分布的两个混淆点》,作者:钟聘3~(3,)4B3333()()(1)44kkkPkC0,1,2,3kP1649642764276419272790123646464644E39344E