生物统计学第三章概率和概率分布(2)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/5/16第三章概率与概率分布第一节概率基础知识第二节几种常见的理论分布第三节统计数的分布2020/5/16离散型变量连续型变量二项分布泊松分布超几何分布负二项分布指数分布正态分布第二节几种常见的理论分布2020/5/16一、二项分布(BinomialDistribution)1.贝努利试验和在什么情形下应用二项分布•贝努利试验(Bernoullitrial):试验只有两种可能的结果,并且发生每种结果的概率是一定的。例如:抛一枚硬币,看得到正面还是反面;掷一次骰子,看得到6还是没有得到6;随机抽查一名婴儿的性别,看是男是女在贝努利试验里,两种结果可分别称为“成功”和“失败”,或者“事件A发生”和“事件A没有发生”。2020/5/16•什么情形时应用二项分布:实验中进行了n次独立的贝努利试验,统计在这n次试验中总共获得了多少次“成功”。“成功”的次数,记为变量X;X称为二项分布变量,X的概率分布称为二项分布。(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。X的可能取值为0,1,2,…,n。所以X是个离散型变量。二项分布变量的一些例子:(2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。(4)n头病畜治疗后的治愈数X,X服从二项分布。(5)n尾鱼苗的成活数X,X服从二项分布。2020/5/162.二项分布的常用符号样本含量)贝努利试验的次数(或:nx:nAX在次试验中事件出现的次数,即二项分布变量的取值)(A:每次试验都是恒定的发生的概率事件发生的概率事件-A:1p(x):XP(X)x的概率函数即ixxF()P(Xx)p(x)ix2020/5/163.二项分布的概率函数P(y)怎样得到P(x)?种:次成功的方式有次贝努利试验里,获得在2424C以n=4,x=2为例,欲求P(x=2)=?。ffssfsfsfssfsffssfsfssff24x24!4!4321,6x!(x)!2!2!2121nCnCCn注意:是从四个位置选取两个位置的组合方式。依据计算公式=2020/5/16每种方式发生的概率为:22)1()(1)(1f)P(f)P(s)P(s)P(P(ssff)乘法法则其它5种方式发生的概率也是如此。224244x2(2)(1)nPC因此,在次试验中取得次成功的概率为xxx**x(x)(1)nnnPC由此类推到一般情形,在此贝努利试验中,共获得次成功的概率是2020/5/16xxx(x)(1)nnPC关于的讨论:xxx1(1)[(1)]x1nnnC()从形式上来说,是二项式展开的第项,所以有“二项分布”这个名称。00111xxx0[(1)](1)(1)(1)(1)nnnnnnnnnnCCCCxxxx0x02(x)(1)[(1)]11nnnnnnPC()2020/5/16例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3:1。求窝产仔10头,有7头白猪的概率。310,0.75x74n解:根据题意,这是一个二项分布的问题,视白猪为成功,有=,。7710710(x7)(7)0.75(10.75)PPC2503.025.075.0!3!7!1037所以,窝产仔10头,有7头白猪的概率是0.2503。2020/5/16例二,有一批玉米种子,出苗率为0.67。现任取6粒种子种1穴中,问这穴至少有1粒种子出苗的概率是多少?6,0.67x,xn解:根据题意,这是一个二项分布的问题。视出苗为成功,有=。设出苗的种子数为则服从二项分布。(1)(x1)(x1)(x2)(x6)PPPPP至少有粒出苗=9987.00905.00799.00157.033.067.033.067.033.067.0066642265116CCC这说明每穴种6粒种子,几乎肯定出苗。9987.00013.0133.067.01)0y(1)(1)1(6006CPPP=没有出苗-=粒出苗至少有另外一种方法:2020/5/164二项分布的概率分布表和概率分布图除以P(x)表示,二项分布也可通过表或图来直观显示。XP(x)00.06210.25020.37530.25040.062例如,抛硬币4次,获得的正面数记为X,则X服从二项分布。X的概率分布表为062.05.05.0)0(,5.0,44004CPn2020/5/16二项分布00.050.10.150.20.250.30.350.401234获得正面的次数y概率时,分布偏斜:时,分布对称;5.05.0X的概率分布图为注意:时,负偏时,正偏5.05.02020/5/165二项分布变量的平均数和标准差平均数)1()(2nXVar(X)En方差和标准差)1(n2020/5/16例三,某树种幼苗成材率为70%,现种植2000株,问成材幼苗数的平均值和标准差是多少?2000X,X解:设株幼苗的成材数为则服从二项分布。。根据题意,70.0,2000n140070.02000n平均数49.203.07.02000)1(n标准差2020/5/16二项分布(实例)【例】已知100件产品中有5件次品,现从中任取一件,有放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的概率解:设X为所抽取的3件产品中的次品数,则根据二项分布公式有22323X2(0.05)(0.95)0.007125PC2020/5/16二项分布的程序计算方法二项分布函数Binomdist(k,n,p,false/true)某数阶乘的计算函数Fact从给定元素数目m的集合中抽取若干n元素的排列组合数计算函数Combin(m,n)nmC2020/5/16二、泊松分布(PoissonDistribution)1.在什么情形下应用泊松分布泊松分布是一种用来描述一定的空间或时间里稀有事件发生次数的概率分布。服从泊松分布的变量的一些例子:•一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。•畜群中遗传的畸形怪胎数•单位空间内某些野生动物或昆虫数•每升饮水中的大肠杆菌数2020/5/162.泊松分布的概率函数与特征数泊松分布变量X只取零和正整数:0,1,2…,其概率函数为x(x)x!Pe是自然对数底数。其中7182.2,0exxxx(x),0,(1)x!nnPnnCe注意:怎么得到的呢?泊松分布可以用二项分布在的情形来近似。在这种情形下。2020/5/16泊松分布的平均数)(XE=泊松分布的方差和标准差)(2XVar=2020/5/16例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告,平均每张样片可以观察到3个微粒,问在一次观察中看到3个微粒的概率是多大?少于3个微粒的概率是多少?若观察100张片子,大约有多少张片子看到的微粒数少于3个?X3解:一张片子里看到的微粒数,可以看成是一定空间里的稀有事件数,所以它服从泊松分布,且有。x333(X3)0.2240x!3!eeP031323(X3)(0)(1)(2)3330!1!2!0.4232PPXPXPXeee)(32.424232.0100)3(100张大约有XP2020/5/16程序计算Poisson(x,µ,trueorfalse)2020/5/16超几何分布适用范围:多次完全相同并且相互独立的重复试验,如果在有限总体中不重复抽样,抽样成功的次数X的概率分布服从超几何分布,如福利彩票数学期望与方差计算程序:P(X)=hypgeomdist(x,n,M,N)2020/5/16例子四川卧龙大熊猫自然保护区共有野生大熊猫100只,其中10只做了标记。某小组去调查研究大熊猫的生活习性,随机观察了15只大熊猫,问这15只大熊猫中有5只做了标记的概率?解:依题意有N=100,M=10,n=15,y=5,求p(5)p(5)=hypgeomdist(x,n,M,N)=hypgeomdist(5,15,10,100)=0.005692020/5/16三、正态分布(NormalDistribution)正态分布是一种最重要的连续型变量的概率分布。•在生物科学研究里,有许多变量是服从或近似服从正态分布的,如水稻产量、小麦株高、玉米百粒重等;•许多统计分析方法是以正态分布为基础的。•不少随机变量的概率分布在样本容量增大时趋于正态分布。因此,在统计学里,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。2020/5/161正态分布的定义与主要特征定义:若变量X的概率分布的密度函数为22(x)21(x)2fe22XX~(,)N其中,为平均数,为方差,则称变量服从正态分布,记为。f(x)的曲线为•X的分布函数22(x)xx21(x)(Xx)(x)xx2FPfded没有更简化的形式2020/5/16正态分布曲线的主要特征:(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是x=μ(2)曲线是非负函数,以x轴为渐近线,分布从-∞到∞(3)曲线在x=μ±σ处各有一个拐点,即在[μ-σ,μ+σ]范围内是上凸,其余是下凸。(4)曲线有两个参数:μ和σ。μ代表平均数,σ代表标准差,μ和σ一起决定曲线的位置和形状。μ越大,则曲线沿x轴越向右移动;反之向左。σ是变异度参数,σ愈大则曲线愈“胖”;反之则愈瘦。(5)曲线下和x轴所夹的总面积为1σ=0.5σ=1σ=22020/5/162标准正态分布定义:μ=0,σ=1时的正态分布称为标准正态分布。标准正态分布变量记为U,写作U~N(0,1)。2221)(ueu密度函数:y21)()(2/y2deuUPuu分布函数:的曲线:密度函数)(u2020/5/163标准正态分布的概率计算查表法:附表1(260页)列出了标准正态变量的累积分布函数值,即U小于某个值u的概率:P(Uu)左边的面积即为表中列出的数值uu)(关系式:)()()()()(abaUPbUPbUaP)()(ccUP)()(1)(1)(dddUPdUP2020/5/16)53.134.0()4(),56.2|(|)3(),58.2()2(),64.1()1(),1,0(~UPUPUPUPNU试求:例一,已知05050.0)64.1(1查表)解:(UP00494.099506.01)58.2(1)58.2()2(查表UPUP01046.000523.02)56.2(2U2)56.2|(|)3()(UP(4)(0.341.53)(1.53)(0.34)0.936990.63310.30389PUPUPU2020/5/16定理:4一般正态分布的概率计算通过如下定理,将一般正态分布变量转化成标准正态分布变量来求。2XX(,)~(0,1)NN假设变量~,则Y(X)abPabP因此,baPU定理ab2020/5/16X(X)cPcP同理,ccUPX(X)dPdPdUPddUP112020/5/162Y~(30,5)(1)

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功