第三章常用概率分布本章在介绍概率论中最基本的两个概念——事件、概率的基础上,重点介绍生物科学研究中常用的几种随机变量的概率分布——二项分布、正态分布以及样本平均数的抽样分布、t分布、分布和F分布。2第一节事件与概率一、事件(一)必然现象与随机现象随机现象:偶然性和规律性概率论与数理统计:研究和揭示随机现象统计规律的科学第一节事件与概率一、事件(二)随机试验与随机事件1、随机试验:可重复性、多可能结果、随机性例如:种子发芽试验、抛掷硬币试验等2、随机事件:基本事件(不能再分)、复合事件例如:20个数字中取1个数,基本事件数20;复合事件取得是偶数有10个基本事件二、概率第一节事件与概率概率:用以刻划事件发生可能性大小的数量指标,以揭示事件的内在规律性事件A的概率记为:P(A)。随机事件研究:随机事件数及其概率(一)概率的统计定义:随机事件A的频率稳定值P(A)≈m/n(n充分大)例如小麦种子发芽试验记录如下试验种子粒数n100200300400500600700发芽种子粒数m65155204274349419489频率m/n0.6500.6750.6800.6850.6980.69830.6986二、概率【例3·1】在1、2、3、…、20个数字中随机抽取1个,求:(1)A=“抽得1个数字≤4”;(2)B=“抽得1个数字是偶数”的概率4()0.220AmPAn10()0.520BmPBn二、概率(二)概率的古典定义古典概型:有限个结果、等可能性和不相容性古典概率:随机事件A所包含基本事件的比率P(A)=m/n三、小概率事件实际不可能性原理小概率事件:概率很小的随机事件P0.05,0.01,0.005,0.001不可能事件:P=0小概率事件实际不可能性原理(小概率原理)在1次试验中把小概率事件看成是实际不可能发生的事件在1次试验中发生了的事件必是大概率事件这个原理是统计推断的理论依据第二节概率分布概率:1次试验中某1个结果发生的可能性大小或n次重复中某1个结果可能发生的机率概率分布:1次试验或n次重复中,各种可能结果的概率变化例如:调查5个人的性别,则共有6种可能的结果,且各概率是变化不等的【例3·2】对100株树苗进行嫁接,观察其成活株数,其可能结果是“0株成活”,“1株成活”,……,“100株成活”用x表示成活株数,则x=0、1、2、……、100。第二节概率分布一、随机变量统计上,常用随机变量x来表示1次试验中的各种可能结果【例3·3】抛掷一枚硬币,其可能结果是“正面”或“反面”用x表示试验结果,则x=0、1【例3·4】测定某品种小麦产量(㎏/亩)用x表示试验结果,则x=(200,300)一、随机变量离散型随机变量:x取有限个值,如例2,例3连续型随机变量:x取无限个值,如例4二、离散型随机变量的概率分布函数P(x=xi)=pi(i=1,2,…)变化值xx1x2…xnpp1p2…pn表示:图示:xP由于x取值是不可数的,因此P(x=xi)=0对于连续型随机变量,关心的是:P(a≤x<b)=?ab图中曲线的函数称为概率分布密度函数三、连续型随机变量的概率分布计算一个区间的概率等同于计算这个区间的面积(几何概率):求曲面面积可归结为求这个曲线的定积分:P(a≤x<b)=f(x)具有下列性质:1.f(x)≥02.3.ab()bafxdx()0ccfxdx()1fxdx不同的随机变量可能具有不同的分布,因而有不同的密度函数。以下将介绍几种最常用的连续型随机变量的分布。第三节二项分布二项试验:只有两种可能结果的随机试验例如:调查一个人的性别丢一个硬币是否正面朝天概率分布为:p(x=1)=p;p(x=0)=q贝努里试验:n次独立的二项试验例如:调查5个人的性别100次丢一个硬币一、贝努利试验及其概率公式二项分布:贝努里试验的概率分布对于n次独立的二项试验,共有n+1种可能的结果,每种结果的概率可由二项展开式求得:001110()......nnnnnkknknnnnqpCpqCpqCpqCpq例如:调查5个人的性别(p=q=0.5)x012345p(x)0.55C510.55C520.55C530.55C540.550.55第三节二项分布二、二项分布的意义和性质二项分布的概率计算对于n次独立的试验,如果某事件A恰好发生x次(0≤x≤n),其概率计算为:(),0,1,2,,!!()!xxnxnnxnPxCpqxnnCxnx其中二、二项分布的意义和性质二项分布的概率分布二项分布是一种离散型随机变量的概率分布(,)0.5xBnpnp记作大,,曲线对称00.050.10.150.20.250510152025第三节二项分布三、二项分布的概率计算及其应用条件(),0,1,2,,xxnxnnPxCpqxn概率计算应用条件二项试验p已知n次试验结果独立【例3·5】有一批玉米种子,出苗率为0.67,现任取6粒种子种1穴中,问这穴至少有1粒种子出苗的概率是多少?根据题意,n=6,x≥1p=0.67,q=(1-0.67)=0.331152246606661)(1)(2)...(6)0.670.330.670.330.670.330.0157+0.0799+0.2162+0.3292+0.26720.09050.9987PxPPPCCC(【例3·6】大豆紫花与白花这一相对性状在F2的分离比例符合一对等位基因的遗传规律,即F2的紫花植株与白花植株之比为3:1。求F210株有7株是紫花的概率。根据题意,n=10,x=7p=3/4=0.75,q=1/4=0.25773731010!(7)0.750.250.750.250.25037!3!PxC四、二项分布的平均数和标准差例如:每次取n=5位同学调查性别,可得到次数和百分数数据x012345p=x/n00.20.40.60.81.0xxnpnpq/ppppqn【例3·7】某树种幼苗成材率为70%。现种植2000株,问成材幼苗的平均数、标准差是多少?200070%1400200070%30%20.49npnpq70%/70%30%/200010.25%ppqn(1)试验结果以次数x表示(2)试验结果以百分数x/n表示第四节正态分布正态分布是一种连续型随机变量的概率分布有许多变量是服从或近似服从正态分布另有不少变量在一定条件下近似服从正态分布f(x)x若随机变量X的概率密度函数为:则称x服从具有参数和2的正态分布记为222)(21)(xexf),(~2NX一、正态分布的定义与主要特征(一)正态分布的定义利用密度函数可以作出正态分布曲线的图像。222)(21)(xexf-2+2-3-++3f(x)x(二)正态曲线的特征⑴单峰,倒钟状,当x=时,f(x)达最大值;⑵当x±时,f(x)0;⑶以x=为轴左右对称;⑷曲线与横轴间面积为1;⑸在x=处有两个拐点;⑹若不变,改变使曲线左右平移⑺当不变,改变使曲线形状改变,对称轴不变;当变小时,曲线变高瘦,中部的面积变大当变大时,曲线变矮胖,中部的面积变小f(x)xμ=0,σ2=1的正态分布称为标准正态分布,记作221()2uue(0,1)N-101)1,0(~2Nu二、标准正态分布标准正态分布的概率密度函数xu称为标准化正态离差显然,这是数学的变量代换过程,将曲线平移和拉伸μ2~(,)xN0)1,0(~2Nu二、标准正态分布x~N(μ,σ2)u~N(0,1)变换前后,某1区间的面积相等吗?三、正态分布的概率计算(一)标准正态分布的概率计算设u~N(0,1),则u在[u1,u2)区间内的概率为:=Φ(u2)-Φ(u1)只需通过查表即可得到Φ(u2)、Φ(u1)值。2212221121211221()21122uuuuuuuPuuuedueduedu【例3·8】已知u~N(0,1),试求(1)P(u≤-1.64);(2)P(u≥2.58);(3)P(∣u∣≥2.56);(4)P(0.34≤u≤1.53)。查附表1得:(1)P(u<-1.64)=Φ(-1.64)=0.0505(2)P(u≥2.58)=Φ(-2.58)=0.02494(3)P(∣u∣≥2.56)=2Φ(-2.56)=2×0.005234=0.010468(4)P(0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389有时会遇到给定Φ(u)值,反过来查u值例如Φ(u)=0.284,求u值在附表1中找到与0.284最接近的值0.2843其对应的数为u=-0.57下一张主页退出上一张关于标准正态分布,以下几种概率应当熟记:P(-1≤u<1)=0.6826P(-1.96≤u<1.96)=0.95P(-2≤u<2)=0.9545P(-2.58≤u<2.58)=0.99P(-3≤u<3)=0.9973-3-2-10123f(u)u若随机变量x服从正态分布N(μ,σ2),则x的取值落在任意区间[x1,x2)的概率,记作P(x1≤x<x2),即:dxexxxPxxx21222)(2121)(三、正态分布的概率计算(二)一般正态分布的概率计算怎样计算该定积分呢?2221221()212121()212xxxxuxPxxxedxedu2211212211()2((uuuPuuueduuu))(二)一般正态分布的概率计算,xudxdu1212,xxuu其中因此,计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得(二)一般正态分布的概率计算【例3·9】设x服从μ=30.26,σ2=5.102的正态分布,试求P(21.64≤x<32.98)(21.6432.98)21.6430.2630.2632.9830.26()5.105.105.10PxxP=P(-1.69≤u<0.53)=Φ(0.53)-Φ(-1.69)=0.7019-0.04551=0.6564xPxPxxPx【例3·10】已知x~N(30.26,5.12),求:1)P(x<15);2)P(x≥40);3)P(|x-30.26|<5.1);4)P(20.06≤x<40.46)(1)P(x<15)=P(<)=P(u<-2.9922)=Φ(-2.9922)=0.001395x-30.265.115-30.265.1(2)P(x≥40)=P(≥)=P(u≥1.9098)=Φ(-1.9098)=0.0281-30.265.1x40-30.265.1xPxPxxPx【例3·10】已知x~N(30.26,5.12),求:1)P(x<15);2)P(x≥40);3)P(|x-30.26|<5.1);4)P(20.06≤x<40.46)330.265.15.130.265.130.26115.111110.6826PxPxxPPu420.0640.4620.0630.2630.2640.4630.265.15.15.122220.977250.022750.9545PxxPPu关于一般正态分布P(μ-σ≤x<μ+σ)=0.6826P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)=0.9973P(μ-1.96σ≤x<μ+1.96σ)=0.95P(μ-2.58σ≤x<μ+2.58σ)=0.99-2+2-3-++3f(x)x两尾概率:随机变量x落