第三章-概率和概率分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章概率与概率分布一、概率的概念二、概率的计算三、概率的分布四、大数定律第一节概率基础知识一、概率的概念(一)事件必然事件(U):一定条件下必然出现。不可能事件(V):一定条件下必然不出现。随机事件(A):一定条件下可能出现。生物统计学只讨论随机事件。(二)频率设事件A在n次重复试验中发生了m次,其比值m/n称为事件A发生的频率(frequency),记为:W(A)=m/n1)(0AW(三)概率(probability,P)事件A在n次重复试验中,发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值p,于是定义p为事件A发生的概率(probability)。记为:P(A)=p只有当试验次数无限增大时,任一事件的频率趋于稳定,这时频率又称统计概率.这时的频率和概率才是一样的.调查株数(n)52550100200500100015002000受害株数(a)212153372177351525704植株受害频率(a/n)0.400.480.300.330.360.3540.3510.3500.352例:表3.1棉田发生盲椿象的为害情况表3.2抛掷一枚硬币发生正面朝上的试验记录概率的三个性质:(1)任何事件概率均满足0≤P(A)≤1(2)必然事件的概率为1(3)不可能事件的概率为0,即P(V)=00≤P(A)≤1P(U)=1P(V)=0二、概率的计算(一)事件的相互关系和事件积事件互斥事件对立事件独立事件完全事件系事件A和事件B中至少有一个发生而构成的新事件称为事件A和事件B的和事件,记作A+B。n个事件的和,可表示为A1+A2+…+An。和事件ABAB事件A和事件B中同时发生而构成的新事件称为事件A和事件B的积事件,记作AB。n个事件的积,可表示为A1A2…An。积事件ABABAB互斥事件事件A和事件B不能同时发生,则称这两个事件A和B互不相容或互斥。n个事件两两互不相容,则称这n个事件互斥。事件A和事件B必有一个发生,但二者不能同时发生,且A和B的和事件组成整个样本空间。即A+B=U,AB=V。则事件B为事件A的对立事件。B=A对立事件互斥事件对立事件事件A和事件B的发生无关,事件B的发生与事件A的发生无关,则事件A和事件B为独立事件。独立事件完全事件系如果多个事件A1、A2、A3、…、An两两互斥,且每次试验结果必然发生其一,则称事件A1、A2、A3、…、An为完全事件系。(二)概率的计算法则1互斥事件加法定理若事件A与B互斥,则P(A+B)=P(A)+P(B)推理1P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)推理2P(A)=1-P(A)推理3完全事件系的和事件的概率为1。2独立事件乘法定理事件A和事件B为独立事件,则事件A与事件B同时发生的概率为各自概率的积。P(AB)=P(A)P(B)推理:A1、A2、…An彼此独立,则P(A1A2A3…An)=P(A1)P(A2)P(A3)…P(An)播种玉米时,每穴播两粒种子,种子的发芽率为90%,则:A:第一粒种子发芽B:第二粒种子发芽C:两粒种子均发芽D:只有一粒种子发芽E:两粒种子均不发芽9.0)(AP1.0)(AP9.0)(BP1.0)(BP81.0)()()(BPAPCP18.0)()()(BAPBAPDP01.01.01.0)()()(BPAPEP1)()()()(EPDPCPEDCP(一)离散型变量的概率分布要了解离散型随机变量x的统计规律,必须知道它的一切可能值xi及取每种可能值的概率pi。三、概率分布1.列出离散型随机变量X的所有可能取值.2.列出随机变量取这些值的概率.3.通常用下面的表格来表示:表3.3离散型变量的概率分布变量(x)x1x2x3x4……..xn概率(P)p1p2p3p4…….pn设离散型变量x的一切可能值为xi(i=1,2,3…),取相应值的概率为pi,则pi称为离散型随机变量x的概率函数。),,3,2,1()(nipxxPii表3.4某鱼群的年龄组成年龄(x)1234567频率(W)0.45970.33350.12540.05070.02150.00800.0012例,鱼群年龄的概率分布例:掷一次骰子所得点数的概率函数6,5,4,3,2,1,61)(xxfx123456f(x)1/61/61/61/61/61/6概率分布列例:掷二次骰子所得点数之和的概率分布x234567f(x)1/362/363/364/365/366/36x89101112f(x)5/364/363/362/361/363621)()7(72xxfF366)7()7(21xxPf)()(21xxxPxf概率分布图(二)连续型变量的概率分布整理成频率分布表,n增加、分组多,组距减少、直方条增加阶梯形曲线趋于光滑当n无限大时,频率转化为概率,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布就转化为概率分布了,此曲线为总体的概率密度曲线。曲线函数用f(x)表示。(1)(2)(3)(4)-2020.00.10.20.30.4badxxfbxaP)()(连续型随机变量不能列出每一个值及其相应的概率,在某一区间内可以有无限种可能的值,定义其取某特定值的概率没有意义,只能定义它在某区间内取值的概率。概率密度函数f(x)与x轴所围成的面积为1。连续型随机变量x在某一区间的概率:值(值,频数)频数f(x)abx概率密度函数f(x)f(x)不是概率badxxfbaxfbXaP)()()(=之间的面积和曲线下在ddxxfdxfdXP)()()(=右边的面积曲线下在cdxxfcxfcXP-=左边的面积曲线下在)()()(概率函数(probabilityfunction)随机变量所取的值x的概率写成x的函数(离散型随机变量)概率密度函数(probabilitydensityfunction)随机变量取某一特定值x的概率密度的函数(连续型随机变量)概率分布函数或概率累积函数(probabilitydistributionfunction)随机变量取值小于或等于某特定值的概率。频率W(A)概率P(A)n值大统计数参数四、大数定律大数定律:概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。设m是n次独立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对于任意小的正数ε1}{limpnmPn1、贝努利大数定律(Bernoullitheorem)JocobBernoulli(1654-1705年):瑞士数学家当实验次数足够多时,某一事件出现的频率与概率有较大偏差的可能性很小设x1,x2,x3,…,xn是来自同一总体的变量,对于任意小的正数ε。1}{limxPn2、辛钦大数定律(Khinchinetheorem)Khinchine(1894~1959)苏联数学家只要从总体中抽取的随机变量相当多,就可以用样本的统计数来估计总体的参数。参数统计数样本容量越大,样本统计数与总体参数之差越小。随机变量的分布可用分布函数来表述概率离散型变量(discreterandomvariable)连续型变量(continuousrandomvariable)二项分布泊松分布正态分布变量第二节几种常见的理论分布动物种子穗子生物个体雄性雌性发芽不发芽有芒无芒成活死亡对立事件一、二项分布—贝努利分布二项总体二项分布“非此即彼”事件所构成的总体概率分布二项总体特点1、试验只有两个对立结果,概率分别为p与q(q=1-p)2、重复性3、独立性(一)二项分布的概率函数试验的条件不变,即在每次试验中事件A出现的概率皆为p。任何一次试验中,事件A的出现与其余各次试验中出现的结果无关。从雌雄各半的100只动物中,做一抽样试验。第一次从这100只动物中随机抽取1只,记下性别后放回,再做第二次抽样。不论第一次抽样结果,第二次抽样中,得到雌性或雄性的概率仍是50/100。这两次试验是独立的第一次抽样后不放回,再做第二次抽样。这两次试验是非独立的雄性动物抽到雄性的概率是49/99抽到雌性的概率是50/99雌性动物抽到雄性的概率是50/99抽到雌性的概率是49/99放回式抽样非放回式抽样二项分布超几何分布x表示在n次试验中事件A出现的次数,其概率分布函数为:P(x)为随机变量x的二项分布,记作B(n,p)Σp(x)=1),,2,1,0()1()!(!!)1()(nxppxnxnppCxfxnxxnxxn二项分布的概率函数【例】已知一批产品的次品率为4%,从中任意有放回地抽取5个。求5个产品中:(1)没有次品的概率是多少?(2)恰好有1个次品的概率是多少?(3)有3个以下次品的概率是多少?80.81537269)04.01()04.0()0(05005CXP20.16986931)04.01()04.0()1(15115CXP0.999397860.0141557720.1698693180.81537269)2()1()0()3(XPXPXPXP(1)当p值较小且n不大时,分布是偏倚的。随n的增大,分布趋于对称;(2)对于固定的n和p,当x增加时,P(x)先随之增加并达到极大值,以后又下降。(3)当p值趋于0.5时,分布趋于对称。二项分布的形状np)1(pnp二项分布B(n,p)的参数二项成数分布:npqy_py_pp)1()(2pnpXVar应用二项分布时,当试验的次数n很大,成功的概率p很小时,这时二项分布就变成泊松分布,为二项分布的一种特殊类型。例:一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数抽检大量产品中出现次品的件数田间小区内出现变异植株的计数二、泊松分布(Poissondistribution)(Simeon-DenisPoisson,1781-1840)法国数学家n很大,p值很小。用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。1)(xPλ为参数,λ=npe=2.71828!)(xexPx泊松分布概率函数2P(λ)的形状由λ确定λ较小时,泊松分布偏倚。λ增大时,泊松分布趋于对称。λ无限增大时,泊松分布接近正态分布。泊松分布形状对于小概率事件,可用泊松分布描述其概率分布。二项分布当p0.1和np5时,可用泊松分布来近似。21泊松分布应用【例】假定某航空公司预订票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?7426010解:设X为10分钟内航空公司预订票处接到的电话次数149.06!e7676XP!)(xexPx围绕在平均值左右,由平均值到分布的两侧,变量数减少,即两头少,中间多,两侧对称。特点Gauss,1777-1855三、正态分布(normaldistribution)N非常大p与q接近λ大二项分布泊松分布正态分布p<0.1,λ(np)<5(一)正态分布的概率函数μ总体平均数σ总体标准差π圆周率,3.14159e为自然对数底,2.71828记为:N(μ,σ2)eyfyN22121)(x=μ时,f(x)值最大,正态分布曲线是以平均数μ处为峰值的曲线。x-μ的绝对值相等时,f(x)值也相等,正态分布以μ为中心向左右两侧对称。f(x)是非负函数,以x轴为渐近线,x的取值区间为(-∞,+∞)。12(二)正态分布的特征eyfyN22121)(3正态分布曲线由参数μ,σ决定,μ确定正态分布曲线在x轴上的中心位置,μ减小,曲线左移,μ增大,曲线右移;σ确定正态分布的展开程度,σ大,曲线展开度越大,数据分散。σ小,曲线展开度小,数据集中。4的影响的影响决定曲线在x轴上的位置决定曲线的形状正态分布曲线在x=μ±σ处各有一个拐点,曲线通过拐点时改变弯曲度。5曲线与x轴围成的全部面积

1 / 110
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功