第四章常用概率分布三、Poisson分布的概念与特征一、Poisson分布的概念 Poisson分布是一种离散型分布,用于描述单位时间、空间、面积等的罕见事件发生次数的概率分布。如:n每毫升水中的大肠杆菌数、n单位时间(如1分钟)内放射性质点数、n每1000个新生儿中某出生缺陷、多胞胎、染色体异常等事件出现的例数、n …… 2注意: Poisson分布要求观察结果相互独立,发生的概率p不变。如,人群中传染性疾病首例出现后便成为传染源,会增加后续病例出现的概率,因此病例数的分布不能看作是Poisson 分布;又如,污染的牛奶中细菌成集落存在,单位容量牛奶中细菌数不能认为服从Poisson分布。 3二、Poisson分布的特征 Poisson分布一般记作P(l),其概率函数为: 式中,l=nπ为Poisson分布的总体均数; X 为观察单位内某稀有事件的发生次数; e 为自然对数的底,为常数,约等于2.71828。 () ! X PXe Xll-= 4例1 如某地20年间共出生短肢畸形儿10名,平均每年 0.5名。试估计该地每年出生此类短肢畸形儿的人数为0, 1, 2,…的概率P(X)。 X 0 1 2 3 4 5 0.607 0.303 0.076 0.013 0.002 0.000 () PX 2 0.5 0.5 (2)0.0762! Pe-== 1 0.5 0.5 (1)0.303,1! Pe-== 0 0.5 0.5 (0)0.607,0! Pe-== 5图1 l取不同值时的Poisson分布图随着l的增大,Poisson分布逐渐趋于对称分布。当l20时,Poisson分布可视为近似正态分布。6Poisson分布具有以下特性:(1)总体均数与总体方差相等:均为l。(2)可加性:从总体均数分别为l 1 和l 2 的两个Poisson分布总体中各自随机抽出一份样本,其中稀有事件的发生次数分别为X 1 和X 2 ,则合计发生数T=X 1 +X 2 也服从Poisson分布,总体均数为l 1 +l 2 。 7水源P(l 1 ) P(l 2 ) P(l 3 ) P(l 1 +l 2 +l 3 +l 4 +l 5 ) P(l 4 ) P(l 5 ) 可加性可推广到多个Poisson分布。正态近似8若随机变量X服从Poisson分布,Y=2X是否服从Poisson分布?否!n若服从Poisson分布的随机变量可能取值为0,1,2,…;但Y的可能取值为0,2,4,…,与Poisson分布随机变量的可能取值不符。n若X的总体均数和方差为μ,则Y的总体均数为2μ,总体方差为4μ,总体均数≠总体方差。 9三、Poisson分布的应用 1、概率估计:如果某地新生儿先天性心脏病的发病概率为8‰,那么该地120名新生儿中有4人患先天性心脏病的概率有多大?()() 4 1.96 1200.0080.96 !0.96 40.014 4! X n PXe X Pellpl--==´==== 102、累积概率计算如果稀有事件发生次数的总体均数为λ,那么该稀有事件发生次数至多为k次的概率为 00 ()() ! X kk XX PXkPXe Xll-==£==åå发生次数至少为k次的概率为 ()1(1) PXkPXk³=-£- 116606162 22 00 6666 (3)() !0!1!2! = 0.062 X XX eeee PXPX X----=====++åå 606166 (1)1(0)(1)1 0!1! 0.983 ee PXPXPX--=-=-==--=例2某100cm 2 的培养皿中平均菌落数为6个。今用100cm 2 的培养皿进行培养,试估计每一个培养皿中菌落数小于3个的概率,大于1个的概率。该培养皿菌落数小于3个的概率为菌落数大于1个的概率为12例3 某放射性物质半小时内发出的脉冲数服从Poisson分布,平均为 360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。 4000.5360 (400)1(400)1()1(2.135)0.0164360 PXPX+-=-£»-F=-F=该放射性物质半小时内发出的脉冲数大于400个的概率为0.0164。 13二项分布Poisson分布正态分布n很大π很小l≥20 np≥5,且n(1p)≥5 14