生物统计学第四版知识点总结

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

一、田间试验的特点1、田间试验具有严格的地区性和季节性,试验周期长。2、田间试验普遍存在试验误差3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或栽培条件的效果。二、田间试验的基本要求结果重演性、结果可靠性、条件先进代表性、目的明确性三、单因素试验的处理数就是该因素的水平数。四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是?3因素3水平的处理组合数是?多因素试验的处理数是各因素不同水平数的所有组合。五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为喷施等量清水。六、简单效应的计算N的简单效应为40-30=10在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。七、平均效应的计算P的主效(8+14)/2=11;N的主效(10+16)/2=13;八、互作的计算N与P的互作为(16-10)/2=3或(14-8)/2=3九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误差,则精确度=准确度。)十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。适当的时候可以考虑增加重复次数来降低误差。小区面积一般在6-60m2,而示范小区面积不小于330m2。十一、通常情况下,狭长小区误差比方形小区误差小。小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复;小区面积较大的试验可设2-4次重复。十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。)十五、算术平均数的主要特征•1、样本各观测值与平均数之差的和为零,即离均差之和为0。2、离均差的平方和最小。十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。(1)A=“抽得1个数字≤4”;(2)B=“抽得1个数字是2的倍数”。(即n=20,而事件A所包含的基本事件有4个,既抽得编号为1,2,3,4中的任何1个,事件A便发生,即mA=4,所以B所包含的基本事件数mB=10,即抽得数字为2,4,6,8,10,12,14,16,18,20中的任何1个,事件B便发生,故(•十七、推论1:完全事件系的概率为1;推论2:对立事件的概率为:十八、二项分布是离散型变数的一种重要的理论分布,必须满足两个基本条件:(各事件是相互独立的;各随机事件必须发生非此即彼的对立事件。)十九、正态分布曲线是一个曲线系统。有两个参数,即平均数μ和标准差σ。μ决定了曲线在x轴上的位置,σ决定了它的变异度当σ恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动。当μ恒定时,σ越大,表示x的取值越分散,曲线越“胖”;σ越小,x的取值越集中在μ附近,曲线越“瘦”。分布密度曲线与横轴所夹的面积为1。X落入曲线下某一区间的概率,等于该区间的面积占总面积的成数。记住P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.997320、中心极限定理:只要样本容量适当大,不论总体分布形状如何,分布都可看作为正态分布,n30,就应用它21、F测验需具备以下两个条件(1)变数x遵循正态分布N(μ,σ2)(2)S12和S22彼此独立。当资料不符合这些条件时,需作转换。名词解释准确性:也叫准确度,指在试验中某一试验指标或性状的观测值与其真值接近的程度。精确性:也叫精确度,指试验中同一试验指标或性状的重复观测值彼此接近的程度。4()0.220AmPAn10()0.520BmPBn)(1)(APAPnxxux)()(试验因素:试验中由人为控制的被变动的条件的总称,简称“因素”。水平:试验因素的质的不同状态和量的不同等级。例,品比试验中,品种是因素,每一个品种就是一个水平。(质量水平)密度试验呢?(数量水平)处理:几个因素不同水平的组合,即试验中具体研究比较的对象。简单效应:同一因素内不同水平之间试验效应的差异。平均效应:又叫主要效应,简称主效。一因素内各简单效应的平均数互作(交互作用):因素内简单效应的平均差异。试验误差:试验中观测值与理论真值之间的偏差边际效应:小区两边或两端的植株因占有较大的空间而表现出的差异。生长竞争:当相邻小区种植不同品种或施用不同肥料时,由于株高、分蘖能力或生长期的不同,通常将有一行或更多行受到影响的现象。小区(plot):田间试验中安排一个处理的小块地段。区组(block):将全部处理分配于相对同质的一块土地上,成为一个区组。重复(Replication):同一处理所设置的试验单元数。即同一处理种植的小区数。局部控制:将整个试验环境分成若干相对一致的小环境(区组),再在小环境内设置成套处理。总体:具有共同性质的个体所组成的集合。(总体内个体的数目用N表示。分为有限总体和无限总体。)样本:从总体中抽出的若干个个体组成样本。随机样本:从总体中随机抽取的样本。样本容量:样本中所包含的个体数目,用n表示。(样本容量越大,越能代表总体。注意:生物统计中规定,n30为小样本,n=30为大样本。)全距:是资料中最大值与最小值之差,又称为极差(range),用R表示自由度:在计算离均差平方和时,能够自由变动的离均差的个数。二项总体:由非此即彼、二者必居其一的对立事件构成的总体。抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。二项分布:二项总体的概率分布,称为二项分布。研究随机变数的取值以及取值对应的概率形成的分布。正态分布:统计推断:根据抽样分布律和概率理论由样本结果(统计数)来推断总体参数的过程。包括统计假设测验和参数估计两方面的内容。参数估计:用样本的统计数对总体参数作出点估计和区间估计。回归分析:对回归模型的资料进行的统计分析。其目的是建立由x预测y的回归方程,并确定给定的x某一值,y将什么范围内变化。回归模型:变数之间存在因果关系相关模型:变数间呈平行变化关系,即变量间相互影响。相关分析:对相关模型的资料进行的统计分析。其目的是测定变数在数量关系上的密切程度和性质。简答题一、田间试验误差的来源及控制途径来源一:试验材料固有的差异。其控制途径:选材一致、标准一致。来源二:操作管理不一致引起的差异。其控制途径:统一操作标准,一切操作管理、观察测量和数据收集都应以“区组”为单位进行,尽量减少可能发生的差异。来源三:外界环境造成的差异。外界因素中,土壤差异是最主要、最有影响、最难以控制的差异。其控制途径:1)选择肥力均一的试验地;2)试验中采用适当的小区技术;3)应用良好的试验设计和统计分析二、各种实验设计的优缺点及其利用1)完全随机设计应用了试验设计的重复和随机两个原则,其优点是设计容易,处理数与重复次数都不受限制,统计分析也比较简单。•主要缺点是没有应用局部控制的原则,试验环境条件差异较大时试验误差较大,试验的精确度较低。常用于土壤肥力均匀一致的田间试验和在实验室、温室、网室中进行的试验。2)随机区组设计简单;适应性广;能提供无偏误差估计,降低误差;对试验地形要求不严格;试验的处理数目一般不要超过203)拉丁方设计(区组数目等于重复次数,等于处理数。)优点:双向控制土壤差异,具有较高的精确度;缺点:缺乏随机区组的灵活性,不能将一直行或一横行分开设置,要求有整块平坦的土地;重复数等于处理数,两者相互制约,通常只限4-8个处理。*裂区设计(多因素试验的一种设计形式。)1、先按一个因素的各处理设置主处理小区(主区),然后在主区内引进第二个因素的各个处理(副处理),即将主区按副处理再划分小区(副区或裂区)。副处理间的比较比主处理间的比较更为精确。2、应将精确度要求更高的、主要研究的因素作为副区因素。公式:组中值=(组下限+组上限)/2=组下限+1/2组距=组上限-1/2组距平均数是反映变数集中性的特征数算术平均数:是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。直接法加权法nxnxxxxniin121xi—各组组中值;fi—各组次数;k—分组数。(一)变异数的计算1、极差R=Xmax-Xmin2、方差或均方(Variance)方差是根据全部观察值来度量资料的变异度的,是能够正确反映资料的变异度的度量方法平方和:样本均方(S2):总体均方(σ2):3.标准差(StandardDeviation)方差的正根值,可以很好的表示资料的变异度,其单位与观察值的度量单位相同。样本标准差(S)总体标准差(σ)n-1是自由度(degreeoffreedom,缩写为DF)其统计意义是指在计算离均差平方和时,能够自由变动的离均差的个数。•如:有5个观察值,其4个的离均差为3,2,-3,6,则第5个离均差必定为-8,才能保证离均差之和等于0。所以,在估计其他统计数时,如果该统计数受k个条件限制,则其自由度应该为n-k。4、变异系数变异系数是样本标准差与样本平均数的比值,以百分数形式表示,计算公式(二)标准差的计算1、直接法2、矫正系数法样本(n≤30)和未经分组的资料,直接利用下式计算标准差。3、加权法22()(1)xxSnNxNii1221)(2nxxsNx2)(%100xSCV1)(2nxxs22()/1xxnsn1)(2fxxfs22()1fxfxnSn对于大样本(n﹥30)且已分组的资料,可在次数分布表的基础上采用加权法计算标准差,计算公式为:f为第i组的次数;x为第i组的组中值;n为样本观测值的总个数。理论分布1、二项分布正态分布的定义若连续型随机变量x的概率密度函数为μ为平均数,σ2为方差,则称随机变量x服从正态分布,记为x~N(μ,σ2)。标准化变换:μ=0,σ2=1的正态分布为标准正态分布。标准正态分布的概率密度函数及概率分布累积函数分别记作f(u)和F(u):随机变量u服从标准正态分布,记作u~N(0,1)。P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.9973作变换u=(x-μ)/σ,故有P(u1≤u≤u2)=F(u2)-F(u1)因此,计算一般正态分布的概率时,只要将区间的上下限作适当标准化变换,就可查标准正态分布的概率表求得概率。样本标准误:在实际工作中,总体标准差σ往往是未知的,因而无法求得。此时,可用样本标准差S大题统计假设测验的基本步骤和方法1、对样本所属的总体提出统计假设,包括无效假设H0和备择假设HA。2、确定显著水平α值。3、在无效假设为正确的条件下,根据统计数的分布律计算实际差数由误差造成()kknknnPkCpq()()kknknfkPkCpq222)(21)(xexfxu221()2uue2211,xuxu222()()/(1)(1)xSSnxxxxnnnnnx的概率。4、依据“小概率事件实际不可能发生”原理接受或否定无效假设。某地小麦品种的产量为每亩300kg,。现有一新品种经过25个小区试验后,得亩产量为330kg,试问这个新品种与当地品种的产量有否显著差异?1、提出假设无效假设:H0:μ=μ0=300kg,即实际差数是由试验误差造成的。说明这个新品种产量与当地一般品种比较差异不显著。备择假设:HA:备择假设μ≠μ0,即实际差数是试验中处理的效应,不是误差造成的。说明这个新品种与当地品种差异显著。2、确定显著水平:一般定为α=0.053、计算概率:根据u测验公式计算:4、推断结论:查表:u

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功