高级生物统计--基本知识

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

高级生物统计学第三章多年多点试验结果的联合分析第一章单个自由度比较分析第二章裂区试验设计及其统计分析第四章曲线回归分析第五章多元回归分析第六章协方差分析第七章一次回归正交设计及其统计分析生物统计学基本知识回顾第八章二次回归正交设计及其统计分析第九章二次旋转设计及其统计分析基本知识回顾第三节生物统计学的基本方法第一节生物统计学的基本概念第四节田间试验及设计方法第二节生物统计学的基本原理第五节方差分析第六节直线回归分析生物统计学及其特点生物统计学(BiometryorBio-statistics)是数学中的概率论与数理统计学在生物科学中的应用而形成的一门系统性学科。统计学理论统计学即数理统计学应用统计学社会科学领域的统计学自然科学领域的统计学1.逻辑性较强;2.假设较多,比较抽象;3.统计方法的分析过程复杂;4.规律性较强;5.分析方法的分析步骤不具灵活性。其特点:第一节生物统计学的基本概念1.数据(data)——在科学试验或调查过程中,对研究对象的某些特征、特性进行观察记载得到的数字资料的总称。数据具有变异性和趋中性。2.变数(variable)——生物个体具有变异性的特征、特性。变数的某一具体数值称为变量(variate)或观测值(observedvalue)。连续性变数(continuousvariable)是指观测值在一定范围内可以取任何一个数值,这些观测值一般是通过测量或称量的方法获得的。离散性变数(discontinuousordiscretevariable)是指观测值只能取0或正整数的变数,其观测值一般通过观察和计数的方法获得的。第一节生物统计学的基本概念3.总体(populationoruniverse)——根据研究目的而确定的,具有共同性质的个体所组成的集团,或者说是整个研究对象中每个个体某一变数所有观测值的总称。5.样本(sample)——从总体中抽出一部分有代表性的个体或观测值。4.总体的参数或参量(parameter)——根据总体全体观测值算出的总体特征数。常用希腊字母表示。如总体平均数,方差2,标准差等。6.统计数或统计量(statastic)——根据样本所有观测值计算出的样本特征数。常用英文字母表示。例如样本平均数,方差S2,标准差S等。第一节生物统计学的基本概念算术平均数:7.平均数(averageormean)是数据的代表值,表示资料中观测值的中心位置。中(位)数(median):众数(mode):几何平均数(geometricmean):所有观测值的总和除以观测值数目所得的商。将资料所有观测值排序后,居于中间位置的那个观测值的值(或,当观测值数目为偶数时,那两个观测值的和之半)。资料中最常见的一数,或次数分布表中次数最多的那组的组中值。n个观测值的乘积的n次方根。其中以算术平均数最为常用。第一节生物统计学的基本概念极差(range)—一组数据的最大值与最小值之差。8.变异数—表示数据资料变异大小的数值。离均差平方和简称平方和(sumofsquares,SS)可较好地衡量资料的变异。定义公式:计算公式:其中C为矫正数,为资料中所有观测值总和的平方除以观测值的个数。2)(xxSSCxnxxSS222/)(第一节生物统计学的基本概念8.变异数—表示数据资料变异大小的数值。方差(variance)是平方和除以观测值的个数。总体方差(populationvariance):NxNSSNii/)(/212样本方差(samplevariance):)1/()()1/(212nxxnSSsniiNxfNSSkii/)(/212分类资料:分类资料:)1/()()1/(212nxxfnSSskii第一节生物统计学的基本概念8.变异数—表示数据资料变异大小的数值。标准差(standarddeviation)是方差的正根值。总体标准差(PopulationSD):NNxxNx/]/)([/)(222样本标准差(SampleSD):)1/(]/)([)1/()(222nnxxnxxs变异系数(CoefficientofVariation,记为C.V.)是指资料的标准差与平均数之比。即:%100/..xsVC不可能事件自然界中每一件事物的每一种可能出现的情况。第二节生物统计学的基本原理随机事件事件概率每一个事件出现的可能性。必然事件在特定情况下必定发生的事件;在特定情况下不可能发生的事件;在特定情况下可能发生也可能不发生的事件;某事件出现的概率用P()表示;例如P(A)、P(B)等。概率的有效范围为0~1,即0≤P(A)≤1。必然事件记为,其概率为1,即P()=1。不可能事件记为,其概率为0,即P()=0。随机事件的概率在0~1之间,即0<P(A)<1。1.事件(event)与概率(probability)第二节生物统计学的基本原理事件间的关系事件A和B至少有一件发生的事件,记为A+B。和事件事件A和B同时发生的事件,记为AB。积事件互斥事件两件不可能同时发生的事件,例如AB=。对立事件两件不可能同时发生,两者中必定有一件发生的事件,例如AB=同时A+B=。事件系n个事件两两互斥,但其必定有一件发生,例如AiAj=同时A1+A2+…+An=。事件的独立性若事件A发生与否不影响事件B发生的概率则称事件A与事件B相互独立。完全事件系完全互斥事件系几个相互有联系的事件放在一起。各事件的和事件为必然事件的事件系,记为A1+A2+…+An=。第二节生物统计学的基本原理计算事件概率的法则假定两互斥事件A和B的概率分别为P(A)和P(B),则事件A与B的和事件的概率等于事件A的概率与事件B的概率之和。互斥事件的加法定律可以引伸到:n个两两互斥的事件的概率等于这n个事件的概率之和。即:如果AB=,则P(A+B)=P(A)+P(B)。即:如果AiAj=,则P(Ai)=[P(Ai)]。第二节生物统计学的基本原理计算事件概率的法则互斥事件的加法定律假定P(A)和P(B)是两独立事件A和B各自出现的概率,则事件A与B同时出现的概率等于事件A的概率与事件B的概率之乘积。独立事件的乘法定律可以引伸到:n个相互独立的事件同时发生概率等于这n个事件各自发生的概率之乘积。即:P(AB)=P(A)P(B)。对立事件的概率若事件A的概率为,则其对立事件的概率为。AP(A)-1)AP(P(A)完全互斥事件系的概率之和为1。即,如果AiAj=同时A1+A2+…+An=,则P(Ai)=1。第二节生物统计学的基本原理2.二项分布(binomialdistribution):由对立事件构成的总体称为二项总体(binomialpopulation),二项总体观测值的概率分布即为二项分布。若某事件出现的概率为p,其对立事件出现的概率为q=1-p,做n次重复独立试验,该事件出现X次的可能性(概率)有多大?现在是:n=2,p=3/4,q=1/4,X可以为0,1,2。P(X=0)=(1)(1/4)(1/4)=(1)(3/4)0(1/4)2=(1)p0q2-0P(X=1)=(2)(3/4)(1/4)=(2)(3/4)1(1/4)1=(2)p1q2-1P(X=2)=(1)(3/4)(3/4)=(1)(3/4)2(1/4)0=(1)p2q2-2其中系数为在n个中取X个进行组合的数目。xnxxnxnxxnqpxC)41()43(C)(P所以,概率分布函数为:第二节生物统计学的基本原理比较下面两个概率分布图,会发现二项分布的形状是由n和p两个参数决定的。当p=q=0.5时,分布是对称的;当p≠q时,分布就不对称;p和q差异越大,分布就越偏斜。00.10.20.30.4012345p=0.35,q=0.65时:00.10.20.30.40.5012345p=0.15,q=0.85时:第二节生物统计学的基本原理利用概率分布表,可以计算出随机变量X的总体平均数和总体方差2。xp01……………nnnqp00C111Cnnqp0CqpnnnpXnnqp00(0)C111(1)Cnnqp0)C(qpnnnnXnp0np1npn2)(Xpnnqp-np002C)(01112C)(1nnqp-np02C)(qpn-npnnnnpqpXCnXxnxxn0对数列求和得X的总体均数为:npqqpCnpXnXxnxxn022)(同法求得X的总体方差为:npq将方差开平方得X的总体标准差为:第二节生物统计学的基本原理于是,随机变量X落在区间(X1,X2)内的概率为:3.正态分布(normaldistribution)连续性变数的概率分布,其概率密度函数为:记为其中为X的平均数,为X的方差。222)(21)(xexf),(N~2X2其概率分布函数为:dxexFxx222)(21)(dxexxxxxx22212)(2121)(P第二节生物统计学的基本原理-2+2-3-++3f(x)x正态曲线的特性:⑴单峰,倒钟状,当X=时,f(x)达最大值;⑵当X±时,f(x)0;⑶以X=为轴左右对称;⑷曲线与横轴间面积为1;⑸在X=处有两个拐点;⑹若不变,改变使曲线左右平移,形状不变;=0时,对称轴与纵轴重合;说明代表了数据的中心位置;⑺当不变,改变使曲线形状改变,对称轴不变;当变小时,曲线变高瘦,中部的面积变大;当变大时,曲线变矮胖,中部的面积变小;说明衡量了资料的变异程度。面积占68.27%面积占95.45%X的某区间内曲线与横轴之间的面积就是随机变量X落在该区间的概率。这部分的面积是如何计算的呢?第二节生物统计学的基本原理dueuuuxxxdxexxxuuuxxx221212)(21221222121)(P)(P21)(P,那么将有:如果将服从分布的随机变量X进行变换:),(2NXu222)(XudXXddududx,。2211,,XuXu于是原变量X在区间(X1,X2)之间的概率就可以用u在区间(u1,u2)之间的概率来计算。这个u称为正态离差u的密度函数记为:并称为标准正态分布密度函数。2221)(ueu相应地记标准正态分布的概率函数为:dueuuu2221)(因为X的平均数为,方差为2,所以的平均数为:方差为:Xu0Xu11)(1)(222XVarXVaruVar)()(12uu统计学家已经将标准正态分布的概率计算出来,我们只要学会查表就可以计算对应于不同的u的(u)值。第二节生物统计学的基本原理统计学一个主要任务是研究总体和样本之间的关系总体和样本之间的关系可以从两个方向进行研究:⑴从总体到样本:即研究从总体中抽出的所有可能样本的统计数的分布及其与原总体之间的关系。即抽样分布的情况。⑵从样本到总体:即研究从总体中抽出的一个随机样本,①用该样本的统计数来估计总体的参数,即参数估计;②对总体的参数作出推断,即统计假设测验。4.抽样分布(samplingdistribution)研究样本统计数的概率分布。第二节生物统计学的基本原理研究样本的方法对于比较小的总体,可以将总体中所有可能的样本都抽出来进行研究样本统计数的分布。对于较大或无限总体,可以从中抽出比较多的样本来研究样本统计数的分布。抽样又分为复置抽样和不复置抽样复置抽样将抽得的个体放回总体继续参加抽样。不复置抽样抽得的个体不放回总体参加后续的抽样。大数定律:对客观事物进行足够多地观察,客观事物的规律性就会充分显现出来。大数定律保证了参数估

1 / 66
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功