生物统计学第四版知识点总结

jisuqiji
2 ℃
2020-05-19

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

一、田间试验的特点1、田间试验具有严格的地区性和季节性，试验周期长。2、田间试验普遍存在试验误差3、研究的对象和材料是农作物，以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或栽培条件的效果。二、田间试验的基本要求结果重演性、结果可靠性、条件先进代表性、目的明确性三、单因素试验的处理数就是该因素的水平数。四、例如：甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是？3因素3水平的处理组合数是？多因素试验的处理数是各因素不同水平数的所有组合。五、如进行一个喷施叶面肥的试验，如果设置两个叶面肥浓度，对照应为喷施等量清水。六、简单效应的计算N的简单效应为40-30=10在N1水平下，P2与P1的简单效应为38-30=8；在N2水平下，P2与P1的简单效应为54-40=14。七、平均效应的计算P的主效（8+14）/2=11；N的主效（10+16）/2=13；八、互作的计算N与P的互作为（16-10）/2=3或（14-8）/2=3九、田间试验误差可分为系统误差和随机误差两种。（1、系统误差影响试验的准确性，随机误差影响试验的精确性。2、准确度受系统误差影响，也受随机误差影响；精确度受随机误差影响。3、若消除系统误差，则精确度=准确度。）十、小区面积扩大，误差降低，但扩大到一定程度，误差降低就不明显了。适当的时候可以考虑增加重复次数来降低误差。小区面积一般在6-60m2，而示范小区面积不小于330m2。十一、通常情况下，狭长小区误差比方形小区误差小。小区的长边必须与肥力梯度方向平行，即与肥力变化最大的方向平行。一般小区长宽比为3-10：1，甚至达20：1十二、何时采用方形小区？（1）肥水试验；（2）边际效应值得重视的试验。十三、一般小区面积较小的试验，重复次数可相应增多，可设3-6次重复；小区面积较大的试验可设2-4次重复。十四、将对照或早熟品种种在试验田四周，一般4行以上。目的？（目的是防止外来因素破坏及边际效应的影响。）十五、算术平均数的主要特征•1、样本各观测值与平均数之差的和为零，即离均差之和为0。2、离均差的平方和最小。十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个，求下列随机事件的概率。（1）A=“抽得1个数字≤4”；（2）B=“抽得1个数字是2的倍数”。（即n=20,而事件A所包含的基本事件有4个，既抽得编号为1，2，3，4中的任何1个，事件A便发生，即mA=4，所以B所包含的基本事件数mB=10，即抽得数字为2，4，6，8，10，12，14，16，18，20中的任何1个，事件B便发生，故（•十七、推论1：完全事件系的概率为1；推论2：对立事件的概率为：十八、二项分布是离散型变数的一种重要的理论分布，必须满足两个基本条件：（各事件是相互独立的；各随机事件必须发生非此即彼的对立事件。）十九、正态分布曲线是一个曲线系统。有两个参数，即平均数μ和标准差σ。μ决定了曲线在x轴上的位置，σ决定了它的变异度当σ恒定时，μ愈大，则曲线沿x轴愈向右移动；反之，μ愈小，曲线沿x轴愈向左移动。当μ恒定时，σ越大，表示x的取值越分散，曲线越“胖”；σ越小，x的取值越集中在μ附近，曲线越“瘦”。分布密度曲线与横轴所夹的面积为1。X落入曲线下某一区间的概率，等于该区间的面积占总面积的成数。记住P（-1≤u＜1）=0.6826P（-2≤u＜2）=0.9545P（-3≤u＜3）=0.997320、中心极限定理：只要样本容量适当大，不论总体分布形状如何，分布都可看作为正态分布，n30，就应用它21、F测验需具备以下两个条件（1）变数x遵循正态分布N(μ,σ2)（2）S12和S22彼此独立。当资料不符合这些条件时，需作转换。名词解释准确性：也叫准确度，指在试验中某一试验指标或性状的观测值与其真值接近的程度。精确性：也叫精确度，指试验中同一试验指标或性状的重复观测值彼此接近的程度。4()0.220AmPAn10()0.520BmPBn)(1)(APAPnxxux)()(试验因素：试验中由人为控制的被变动的条件的总称，简称“因素”。水平：试验因素的质的不同状态和量的不同等级。例，品比试验中，品种是因素，每一个品种就是一个水平。（质量水平）密度试验呢？（数量水平）处理：几个因素不同水平的组合，即试验中具体研究比较的对象。简单效应：同一因素内不同水平之间试验效应的差异。平均效应：又叫主要效应，简称主效。一因素内各简单效应的平均数互作（交互作用）：因素内简单效应的平均差异。试验误差：试验中观测值与理论真值之间的偏差边际效应：小区两边或两端的植株因占有较大的空间而表现出的差异。生长竞争：当相邻小区种植不同品种或施用不同肥料时，由于株高、分蘖能力或生长期的不同，通常将有一行或更多行受到影响的现象。小区（plot）：田间试验中安排一个处理的小块地段。区组（block）：将全部处理分配于相对同质的一块土地上，成为一个区组。重复（Replication）：同一处理所设置的试验单元数。即同一处理种植的小区数。局部控制：将整个试验环境分成若干相对一致的小环境（区组），再在小环境内设置成套处理。总体:具有共同性质的个体所组成的集合。（总体内个体的数目用N表示。分为有限总体和无限总体。）样本：从总体中抽出的若干个个体组成样本。随机样本：从总体中随机抽取的样本。样本容量：样本中所包含的个体数目，用n表示。（样本容量越大，越能代表总体。注意：生物统计中规定，n30为小样本，n=30为大样本。）全距：是资料中最大值与最小值之差，又称为极差(range)，用R表示自由度：在计算离均差平方和时，能够自由变动的离均差的个数。二项总体：由非此即彼、二者必居其一的对立事件构成的总体。抽样分布：指从总体中按一定的样本容量随机抽取全部所有可能的样本，由这些样本计算的统计数组成的分布。二项分布：二项总体的概率分布，称为二项分布。研究随机变数的取值以及取值对应的概率形成的分布。正态分布：统计推断：根据抽样分布律和概率理论由样本结果（统计数）来推断总体参数的过程。包括统计假设测验和参数估计两方面的内容。参数估计：用样本的统计数对总体参数作出点估计和区间估计。回归分析：对回归模型的资料进行的统计分析。其目的是建立由x预测y的回归方程，并确定给定的x某一值，y将什么范围内变化。回归模型：变数之间存在因果关系相关模型：变数间呈平行变化关系，即变量间相互影响。相关分析：对相关模型的资料进行的统计分析。其目的是测定变数在数量关系上的密切程度和性质。简答题一、田间试验误差的来源及控制途径来源一：试验材料固有的差异。其控制途径：选材一致、标准一致。来源二：操作管理不一致引起的差异。其控制途径：统一操作标准，一切操作管理、观察测量和数据收集都应以“区组”为单位进行，尽量减少可能发生的差异。来源三：外界环境造成的差异。外界因素中，土壤差异是最主要、最有影响、最难以控制的差异。其控制途径：1）选择肥力均一的试验地；2）试验中采用适当的小区技术；3）应用良好的试验设计和统计分析二、各种实验设计的优缺点及其利用1）完全随机设计应用了试验设计的重复和随机两个原则，其优点是设计容易，处理数与重复次数都不受限制，统计分析也比较简单。•主要缺点是没有应用局部控制的原则，试验环境条件差异较大时试验误差较大，试验的精确度较低。常用于土壤肥力均匀一致的田间试验和在实验室、温室、网室中进行的试验。2）随机区组设计简单；适应性广；能提供无偏误差估计，降低误差；对试验地形要求不严格；试验的处理数目一般不要超过203）拉丁方设计（区组数目等于重复次数，等于处理数。）优点：双向控制土壤差异，具有较高的精确度；缺点：缺乏随机区组的灵活性，不能将一直行或一横行分开设置，要求有整块平坦的土地；重复数等于处理数，两者相互制约，通常只限4-8个处理。*裂区设计(多因素试验的一种设计形式。)1、先按一个因素的各处理设置主处理小区（主区），然后在主区内引进第二个因素的各个处理（副处理），即将主区按副处理再划分小区（副区或裂区）。副处理间的比较比主处理间的比较更为精确。2、应将精确度要求更高的、主要研究的因素作为副区因素。公式：组中值＝(组下限＋组上限)/2＝组下限＋1/2组距＝组上限－1/2组距平均数是反映变数集中性的特征数算术平均数:是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数。直接法加权法nxnxxxxniin121xi—各组组中值；fi—各组次数；k—分组数。（一）变异数的计算1、极差R=Xmax-Xmin2、方差或均方（Variance）方差是根据全部观察值来度量资料的变异度的，是能够正确反映资料的变异度的度量方法平方和：样本均方（S2）：总体均方（σ2）：3.标准差（StandardDeviation）方差的正根值，可以很好的表示资料的变异度，其单位与观察值的度量单位相同。样本标准差（S）总体标准差（σ）n-1是自由度（degreeoffreedom，缩写为DF）其统计意义是指在计算离均差平方和时，能够自由变动的离均差的个数。•如：有5个观察值，其4个的离均差为3，2，－3，6，则第5个离均差必定为－8，才能保证离均差之和等于0。所以，在估计其他统计数时，如果该统计数受k个条件限制，则其自由度应该为n－k。4、变异系数变异系数是样本标准差与样本平均数的比值，以百分数形式表示，计算公式（二）标准差的计算1、直接法2、矫正系数法样本(n≤30)和未经分组的资料，直接利用下式计算标准差。3、加权法22()(1)xxSnNxNii1221)(2nxxsNx2)(%100xSCV1)(2nxxs22()/1xxnsn1)(2fxxfs22()1fxfxnSn对于大样本(n﹥30)且已分组的资料，可在次数分布表的基础上采用加权法计算标准差，计算公式为：f为第i组的次数；x为第i组的组中值；n为样本观测值的总个数。理论分布1、二项分布正态分布的定义若连续型随机变量x的概率密度函数为μ为平均数，σ2为方差，则称随机变量x服从正态分布，记为x～N(μ,σ2)。标准化变换：μ=0,σ2=1的正态分布为标准正态分布。标准正态分布的概率密度函数及概率分布累积函数分别记作f(u)和F(u)：随机变量u服从标准正态分布，记作u～N(0，1)。P（-1≤u＜1）=0.6826P（-2≤u＜2）=0.9545P（-3≤u＜3）=0.9973作变换u=(x-μ)／σ，故有P(u1≤u≤u2)＝F(u2)－F(u1)因此，计算一般正态分布的概率时，只要将区间的上下限作适当标准化变换，就可查标准正态分布的概率表求得概率。样本标准误：在实际工作中，总体标准差σ往往是未知的，因而无法求得。此时，可用样本标准差S大题统计假设测验的基本步骤和方法1、对样本所属的总体提出统计假设，包括无效假设H0和备择假设HA。2、确定显著水平α值。3、在无效假设为正确的条件下，根据统计数的分布律计算实际差数由误差造成()kknknnPkCpq()()kknknfkPkCpq222)(21)(xexfxu221()2uue2211,xuxu222()()/(1)(1)xSSnxxxxnnnnnx的概率。4、依据“小概率事件实际不可能发生”原理接受或否定无效假设。某地小麦品种的产量为每亩300kg，。现有一新品种经过25个小区试验后，得亩产量为330kg，试问这个新品种与当地品种的产量有否显著差异？1、提出假设无效假设：H0：μ=μ0=300kg，即实际差数是由试验误差造成的。说明这个新品种产量与当地一般品种比较差异不显著。备择假设：HA：备择假设μ≠μ0,即实际差数是试验中处理的效应，不是误差造成的。说明这个新品种与当地品种差异显著。2、确定显著水平：一般定为α＝0.053、计算概率：根据u测验公式计算：4、推断结论：查表：u