第二章spss生物统计学

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章常用概率分布•前面介绍了数据资料的整理与反映资料分布的集中性和离中性的特征数。通过样本的结果(统计量)推断总体的的特征(参数),必须以概率论为基础。•本章在讨论“事件”与“概率”的基础上,主要介绍生物学研究中三种常用的概率分布,即正态分布、二项分布和泊松分布,然后简述样本平均数的抽样分布与t分布。•难度级:•第一节事件与概率•第二节概率分布•第三节正态分布•第四节二项分布•第五节泊松分布•第六节样本平均数的抽样分布•第七节t分布第一节事件与概率•一、事件•(一)必然现象与随机现象•1、必然现象指在某些条件下,一定会发生的现象。(可分为必然事件和不可能事件两类)•2、随机现象指在相同条件下重复进行试验,结果未必相同,这种现象称为随机现象。•事实证明,当在相同条件下进行大量观察时,随机现象大都呈现某种规律。概率论与数理统计就是研究随机现象统计规律性的一门数学学科。。(二)随机试验(randomtrial)与事件(randomevent)•我们把对自然现象的一次观察或进行的一次科学试验统称为一个试验。如果这个试验具有下述三个特性就称其为随机试验,简称试验。•可以在相同条件下重复进行;•每次试验的可能结果不止一个,并且事先能明确试验的所有可能结果;•试验前不能确定哪一个结果会出现。•随机试验的每一个可能结果称为随机事件,简称事件,通常用字母A、B、C……等表示。二、概率(probability)•(一)定义设在同一条件组S下进行了n次试验,事件A发生了m次。当随着n的增大,如果事件A发生的的频率m/n稳定地接近某一数值p,则称p为随机事件A在条件组S下发生的概率,记为P(A)=p。当n充分大时,P(A)=m/n。•(二)小概率事件与小概率原理•当事件A的概率与0非常接近时,称此事件为小概率事件。小概率事件虽然不是不可能事件,但通常认为在一次试验中实际上是不可能发生的,称之为“小概率事件实际不可能性原理”。这是统计假设检验的基础。第二节概率分布(probabilitydistribution)•若要全面了解试验,则必须知道试验的全部可能结果及各种结果发生的概率,即试验结果的概率分布。•一、随机变量(randomvariable)•(一)定义•作一次试验或抽样观察,其结果有多种可能。每一种可能结果都可用一个数来表示。把这些数作为变量x的取值范围,则试验或观察结果可用变量x来表示。变量x就称为随机变量。•随机变量可用x、y…等字母表示。(二)分类•1、离散型随机变量•(discreterandomvariable)•如果表示试验结果的随机变量x,其可能取值为有限个或至多可列个,并可以按一定顺序一一列举,则称x为离散型随机变量。•2、连续型随机变量•(continuousrandomvariable)•如果表示试验结果的随机变量x,其可能取值为某范围内的任何数值,表现为不可列性和连续变异,则称x为连续型随机变量。二、离散型随机变量的概率分布•(一)研究离散型随机变量的概率分布要解决的两个问题:•要了解离散型随机变量x的统计规律,就必须知道它的一切可能取值;•取每种可能值的概率。•亦即,要想了解只取整数值的某一总体的全面情况,只须知道其个体的一切可能值,以及取各种可能值的个体在总体中所占的比率。ixip(二)离散型随机变量的概率分布•将离散型随机变量x的一切可能取值•及其对应的概率,记作•上式即称为离散型随机变量x的概率分布或分布。•也可用分布列表示离散型随机变量x的概率分布,离散型随机变量概率分布的基本性质:10iipp和变量xx1x2…xn…概率Pp1p2…pn…,...)2,1(ixiipiipxxP)(,...2,1i三、连续型随机变量的概率分布•连续型随机变量的概率分布不能用分布列来表示,因为其可能取的值是不可数的。因此只能用随机变量x在某个区间内取值的概率P(a≤xb)来表示。•(一)概率分布密度曲线和概率分布密度函数(参见P35)•(二)连续型随机变量的概率由概率分布密度函数确定xdxfbxaPba)()((三)连续型随机变量概率分布的性质•分布密度函数大于或等于0,•即•当随机变量x取某一特定值时,其概率为0,即•在一次试验中x取值必在范围内,为一必然事件。因此0)(xfccdxxfcxp0)()(x1)()(dxxfxpc为任意实数第三节正态分布(normaldistribution)•正态分布是一种很重要的特殊的连续型随机变量的概率分布。•生物现象中有许多变量是服从或接近正态分布的;•许多统计分析方法都是以正态分布为基础的;•此外,还有不少随机变量在一定条件下以正态分布为其极限分布。•因此,正态分布无论对理论研究还是实际应用,在统计学中均占有重要的地位。•一、正态分布的定义及其特征•(一)定义若连续性随机变量x的概率分布密度函数为:•其中,为平均数,为方差,则称随机变量x服从正态分布,记为•相应的概率分布函数为222)(21)(xexf),(~2xxxexF222)(21)(2二、正态分布的特征•f(x)是非负数,以x轴为渐进线;•曲线在处各有一个拐点;xx21)(fx正态分布密度函数曲线•正态分布密度曲线是以为对称轴的单峰、对称的悬钟形;•f(x)在处达到极大值,•极大值为•正态分布有两个参数,即平均数和标准差。是位置参数,是变异度参数。•分布密度曲线与横轴所夹的面积为1,即:dxexPx222)(21)(μ相同而σ不同的三个正态总体σ相同而μ不同的三个正态总体二、标准正态分布(standardnormaldistribution)•(一)定义由于正态分布是依赖于参数和•(或)的一簇分布,造成研究具体正态总体时的不便。因此将一般的转换为•的正态分布,则称的正态分布为标准正态分布。•标准正态分布的概率密度函数及分布函数如下:),(2N2deueu2221221)(,21)(若随机变量u服从标准正态分布,记作•(二)标准化的方法•对于任何一个服从正态分布的随机变量x,都可以通过标准化变换:•即减平均数后再除以标准差,将其变换为服从标准正态分布的随机变量u。对不同的u值编成函数表,称为正态分布表,从中可以查到任意一个区间内曲线下的面积,即为概率。/)(xu)1,0(~Nu三、正态分布的概率计算•(一)标准正态分布的概率计算•设u服从标准正态分布,则u落在u1,u2)内的概率dueuuuPuuu21222121)(duedueuuuu1222222121查得。可由附表)与(而1)(12uu)()(12uu应熟记的几种标准正态分布概率99.0)58.258.2(95.0)96.196.1(9973.0)33(9545.0)22(6826.0)11(uPuPuPuPuP01.0)58.2(05.0)96.1(0027.0)3(0455.0)2(3174.0)1(uPuPuPuPuP1)1()1()1()11(uPuPuPuP(二)一般正态分布的概率计算•将区间的上下限标准化,服从正态分布的随机变量x落在〔x1,x2〕内的概率,等于服从标准正态分布的随机变量u落在的概率。•然后查标准正态分布的概率表•[例]若x服从的正态分布,试求。•令u=(x-30.26)/5.10,则u服从标准正态分布,故/,/21xx2210.5,26.3098.3264.21xP6564.0)69.1()53.0()53.069.1()10.526.3098.3210.526.3010.526.3064.21()98.3264.21(uPxPxP(三)双侧概率(两尾概率)与单侧概率(一尾概率)•随机变量x落在平均数加减不同倍数标准差区间之外的概率称为双侧概率(两尾概率),记作•对应于双侧概率可以求得随机变量x小于•或大于的概率,称为单侧概率(一尾概率),记作。•如x落在之外的双侧•概率为0.05,而单侧概率为0.025。即kk2/)96.1,96.1(025.0)96.1()96.1(xPxP005.0)58.2()58.2(xPxP第四节二项分布(Binomialdistribution)•一、贝努利试验及其概率公式•(一)独立试验和贝努利试验•将随机试验重复进行n次,若各次试验结果互相不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是相互独立的。•对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与之一;在每次试验中出现A的概率是常数p(0p1),因而出现对立事件的概率是1-p=q,则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验。AA(二)二项分布的概率•在n重贝努利试验中,事件A发生k次的概率恰好等于(q+p)n二项展开式中的第k+1项,因此也将称作二项概率公式。•二、二项分布的意义及其性质(一)定义设随机变量x所有可能取的值为零和正整数:0,1,2,…,n,且有(其中p0,q0,p+q=1),则称随机变量x服从参数为n和p的二项分布,记为nkqpCkPknkknn,,2,1,0,)(nkqpCkPkxPknkknn,,2,1,0,)()(),(~pnBx(二)二项分布的性质•二项分布是一种离散型随机变量的概率分布,由n和p两个参数决定,参数n称为离散参数,只能取正整数;p是连续参数,取值为0与1之间的任何数值。二项分布具有概率分布的一切性质,即:•(k=0,1,2,…,n)•二项分布的概率之和等于1,即:0)()(kPkxPn1)(0nnkknkknpqqpC•上面是二项分布概率的基本性质;是我们在运算中经常要根据题目要求运算时要应用到的,要注意理解。mkknkknnqpCmkPmxP0)()()()()(21212121mmqpCmkmPmxmPmmkknkknnnmkknkknnqpCmkPmxP)()(三、二项分布的概率计算及其应用条件•(一)概率计算•二项分布的概率计算,可以直接利用二项概率公式进行。把时间A发生的次数k代入公式即可求得对应的概率。•[例]有一批种蛋,其孵化率为0.85,今在该批种蛋中任选6枚进行孵化,试给出孵化出小鸡的各种可能情况的概率。•这个问题属于贝努里模型,其中,•孵化6枚种蛋孵出的小鸡数x服从二项分布.其中x的可能取值为0,1,2,3,4,5,6。85.0,6pn15.085.01q)85.0,6(B其中•思考:求至少孵出3只小鸡的概率是多少?孵出的小鸡数在2-5只之间的概率是多大?00001139.0)15.0()15.0()85.0()0(660066CP00038728.0)15.0()85.0(6)15.0()85.0()1(51161166CP00548648.0)15.0()85.0(15)15.0()85.0()2(42262266CP04145344.0)15.0()85.0(20)15.0()85.0()3(33363366CP17617711.0)15.0()85.0(15)15.0()85.0()4(24464466CP39933478.0)15.0()85.0(6)15.0()85.0()5(15565566CP37714952.0)85.0()15.0()85.0()6(6066666CP(二)应用条件(三个

1 / 54
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功