第5章 几种常见概率分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

主要内容:第一节二项分布第二节泊松分布第三节正态分布一、贝努利试验及其概率公式(一)独立试验和贝努利试验对于n次独立的试验,如果每次试验结果出现且只出现对立事件与之一;在每次试验中出现A的概率是常数p(0p1),因而出现对立事件的概率是1-p=q,则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验。AAA第一节二项分布(Binomialdistribution)(二)二项分布的概率在贝努利试验中,事件A发生x次的概率恰好等(q+p)n二项展开式中的第x+1项,因此也将称作二项概率公式。二、二项分布的意义及其性质(一)定义设随机变量X所有可能取的值为零和正整数:0,1,2,…,n,且有(其中p0,q0,p+q=1),则称随机变量X服从参数为n和p的二项分布,记为(),0,1,2.....,xxnxnnPxpqxnC()(),0,1,2.....,xxnxnnnPXxPxpqxnC),(~pnBx二项分布n=10,p=0.5二项分布n=10,p=0.1(二)二项分布的性质二项分布是一种离散型随机变量的概率分布,由n和p两个参数决定,参数n称为离散参数,只能取正整数;p是连续参数,取值为0与1之间的任何数值。二项分布具有概率分布的一切性质,即:(x=0,1,2,…,n)二项分布的概率之和等于1,即:()()0nPXxPx0()1nxxnxnnxCpqqp上面是二项分布概率的基本性质;是我们在运算中经常要根据题目要求运算时要应用到的,要注意理解。0()()mxxnxnnxPXmPxmCpq()()nxxnxnnxmPXmPxmCpq21121212()()()mxxnxnnxmPmXmPmxmCpqmm二项分布的性质三、二项分布的平均数与标准差统计学证明,服从二项分布B(n,p)的随机变量之平均数μ、标准差σ与参数n、p有如下关系:npqnp四、二项分布的概率计算及其应用条件(一)概率计算二项分布的概率计算,可以直接利用二项概率公式进行。把时间A发生的次数k代入公式即可求得对应的概率。[例]有一批种蛋,其孵化率为0.85,今在该批种蛋中任选6枚进行孵化,试给出孵化出小鸡的各种可能情况的概率。这个问题属于贝努里模型,其中,孵化6枚种蛋孵出的小鸡数x服从二项分布.其中x的可能取值为0,1,2,3,4,5,6。85.0,6pn15.085.01q)85.0,6(B00001139.0)15.0()15.0()85.0()0(660066CP00038728.0)15.0()85.0(6)15.0()85.0()1(51161166CP00548648.0)15.0()85.0(15)15.0()85.0()2(42262266CP04145344.0)15.0()85.0(20)15.0()85.0()3(33363366CP17617711.0)15.0()85.0(15)15.0()85.0()4(24464466CP39933478.0)15.0()85.0(6)15.0()85.0()5(15565566CP37714952.0)85.0()15.0()85.0()6(6066666CP思考:求至少孵出3只小鸡的概率是多少?孵出的小鸡数在2-5只之间的概率是多大?其中:应用条件:n个观察单位的观察结果互相独立;各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料。已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-P=q,实际中要求p是从大量观察中获得的比较稳定的数值。第二节泊松分布Possiondistribution泊松分布是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的分布。所谓稀有事件即为小概率事件。要观察到这类事件,样本含量n必须很大。在生物、医学研究中,服从泊松分布的随机变量是常见的。由于泊松分布是描述小概率事件的,二项分布中p很小,n很大时,可使用泊松分布•泊松分布常用于描述在某一指定时间内或在某一指定范围内,源源不断出现的稀有事件个数的分布。•例如,120急救中心每天接到要求服务的呼叫次数;每天到达机场的飞机数;在早上(7:00–8:00)交通高峰期间通过某一道口的机动车数;纺织品在单位面积上的疵点数等等。一、泊松分布的意义(一)定义若随机变量X(X=x)只取零和正整数值,且其概率分布为其中x=0,1,…;μ>0;e=2.7182…是自然对数的底数,则称X服从参数为μ的泊松分布记为X~P(μ)。(二)特征泊松分布作为一种离散型随机变量的概率分布有一个重要的特征。这就是它的平均数和方差相等,都等于常数μ,即μ=σ2=μ。利用这一特征,可以初步判断一个随机变量是否服从泊松分布()!xPXxex泊松分布μ=4二、泊松分布的概率计算μ是泊松分布所依赖的唯一参数。泊松分布的概率计算,只要参数μ确定了,问题就解决了。把x=0,1,2,…代入公式即可求得各项的概率。但是在大多数服从泊松分布的实例中,分布参数μ往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为μ的估计值。[例]我们调查了200个奶牛场,统计各场某10年内出现的怪胎(如缺皮症,全身无毛等)的头数,然后以怪胎头数把200个奶牛场分类,统计每类中奶牛场数目,结果如下:试研究10年内母牛怪胎数的概率分布。10年内母牛产怪胎次数(m)01234总计奶牛场数(f)109652231200先假设母牛产怪胎数的概率分布为泊松分布。根据观察结果计算每一奶牛场10年内母牛产怪胎的平均数,根据加权法可得:用=0.61估计μ,代入计算当m=0,1,2,3,4时的概率和理论次数怪胎数(m)01234总计实际次数(f)109652231200概率(理论)0.54340.33140.10110.02060.00310.9996理论次数108.6866.2820.224.120.62199.92xx61.020014332221650109nfxx()!xPXxex下面我们再来证实我们所得的资料是否具有泊松分布的特征。已经计算出=0.61,样本方差计算如下,与很接近,这正是泊松分布所具有的特征611.0199200/122413322216501091/)(222222222nnfmfmSxx2S一、正态分布的定义及其特征(一)定义若连续性随机变量X的概率分布密度函数为:其中,µ为平均数,σ2为方差,则称随机变量χ服从正态分布,记为χ~N(µ,σ2).相应的概率分布函数为第三节正态分布normaldistribution0,,21)(222)(xexfxxxexF222)(21)((二)特征正态分布密度曲线是以χ=µ为对称轴的单峰、对称的悬钟形;f(x)在χ=µ处达到极大值,极大值为f(x)是非负数,以x轴为渐进线;曲线在χ±σ处各有一个拐点;正态分布密度函数曲线21)(f正态分布有两个参数,即平均数µ和标准差σ。µ是位置参数,σ是变异度参数。分布密度曲线与横轴所夹的面积为1,即:正态分布密度函数曲线特征121)(222)(dxexPxμ相同而σ不同的三个正态总体σ相同而μ不同的三个正态总体特征二、标准正态分布standardnormaldistribution(一)定义由于正态分布是依赖于参数µ和(或σ)的一簇分布,造成研究具体正态总体时的不便。因此将一般的(μ,σ2)转换为µ=0,σ2=1的正态分布,则称µ=0,σ2=1的正态分布为标准正态分布。标准正态分布的概率密度函数及分布函数如下:若随机变量U服从标准正态分布,记作U~(0,1)dee222221)(,21)(标准正态分布概率密度函数(二)标准化的方法对于任何一个服从正态分布(μ,σ2)的随机变量X,都可以通过标准化变换:u=(χ-μ)/σ即减平均数后再除以标准差,将其变换为服从标准正态分布的随机变量。对不同的u及P(Uu)值编成函数表,称为正态分布表,从中可以查到任意一个区间内曲线下的面积,即为概率。标准正态分布函数三、正态分布的概率计算(一)标准正态分布的概率计算设U服从标准正态分布,则u落在u1,u2]内的概率dueuuuPuuu21222121)(duedueuuuu1222222121)()(12uu可由附表查得.与而)()(12uu99.0)58.258.2(95.0)96.196.1(9973.0)33(9545.0)22(6826.0)11(uPuPuPuPuP99.0)58.258.2(95.0)96.196.1(9973.0)33(9545.0)22(6826.0)(uPuPuPuPuP应熟记的几种标准正态分布概率(二)一般正态分布的概率计算将区间的上下限标准化,服从正态分布的随机变量χ落在〔χ1,χ2〕内的概率,等于服从标准正态分布的随机变量μ落在的概率。然后查标准正态分布的概率表[例]若χ服从μ=30.26,σ2=5.102的正态分布,试求P(21.64≦x﹤32.98)。令u=(χ-30.26)/5.10,则u服从标准正态分布,故/,/21xx21.6430.2630.2632.9830.26(21.6432.98)()5.105.105.10(1.600.53)(0.53)(1.69)0.6564xPxPPu(三)双侧(两尾)概率与单侧(一尾)概率随机变量x落在平均数加减不同倍数标准差区间之外的概率称为双侧概率(两尾概率),记作α对应于双侧概率可以求得随机变量x小于μ-kσ或大于μ+kσ的概率,称为单侧概率(一尾概率),记作α/2如x落在(μ-1.96σ,μ+1.96σ)之外的双侧概率为0.05,而单侧概率为0.025。即025.0)96.1()96.1(005.0)58.2()58.2(xPxPxPxP)()(kxPkxP2/)()(kxPkxP标准正态双侧分位数的查法:附表3①标准正态分布②③)1,0(~Nu2uuuu/(双侧)表示的上侧临界值表示的下侧临界值或表示的双侧临界值正态分布密度函数曲线为双侧临界值为双侧概率,其中  uuuuPuuP0)(1)(•例假设,求下列概率:•1.;2.;•3.;4.。•解•1.•2.•3.•4.•正态分布与标准正态分布的关系•如果,则于是,在正态分布与标准正态分布的概率密度f(x)和φ(u)、分布函数F(x)和Φ(u)之间存在下列关系式:•这就是说,计算任一正态分布随机变量的概率都能通过标准正态分布来实现。正态分布的应用•正态分布在概率论和统计学的研究及应用中具有极其重要的作用,它在各种概率分布中居首要地位,是抽样和抽样分布的理论基础。这是因为:•1.客观世界的许多现象都可以利用正态分布来近似地描述其统计规律性。例如,人的身高和体重等,都可以看作是具有“两头小,中间大”分布特征的随机变量,一般可以认为是近似服从正态分布的。•2.正态分布是许多重要分布的极限分布。例如可以用正态分布来近似二项分布。•3.正态分布在统计推断中有重要的应用。例如t分布,F分布和分布都是服从正态分布的随机变量的函数。四、三种重要的概率分布之间的关系前面讨论的三个重要的概率分布中,前两个概率分布属离散型的,后一个属连续型的。

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功