生物统计学作业答案完善版第一章习题1.1答:生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门科学。生物统计学的主要内容包括实验设计和统计分析。基本作用有以下四个方面:①提供整理和描述数据资料的科学方法,确定某些数性状和特性的数理特征;②判断实验结果的可靠性;③提供有样本推断总体的方法;③提供实验设计的一些重要原则。习题1.2总体:总体是具有相同性质的个体所组成的集合,是研究对象的全体。样本:是从总体中抽出来的若干个体所组成的集合。样本容量:样本中所含个体总数。变量:相同性质的事物间表现的差异性的某些特征。参数:是描述总体特征的数量。统计数:是描述样本特征的数量。效应:是由因素而引起的实验差异的作用。互作:是指两个或两个处理因素间的相互作用产生的效应。实验误差:实验中不可控因素所引起的观测值和真实值之间的差异。习题1.3答:随机误差:它是由实验中许多无法控制的因素所造成的实验结果和真实值之间的误差,是不可避免的。系统误差:是由于实验处理以外的其他条件明显不一致所造成的带有倾向性的或定向的偏差,是可控的。习题1.4答:准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。第二章习题2.3答:平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的68.26%,X-+2s内的观测值个数占总个数的95.49%,x-+3s内的观测值个数占总个数的99.73%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。习题2.4答:总体平均数µ=∑x/N,式中分母为总体观察个数N;样本平均数x=∑x/n,公式中n是样本容量;样本平均数是总体平均数的无偏估计值。总体和样本标准差都等于离均差的平方和除以样本容量;而总体标准差σ=,分母上是总体观测值个数N;而样本标准差是s=,分母上是样本自由度n-1.样本标准差s是总体标准差σ的无偏估计值。习题2.5解:(1)极差:R=7.22—2.70=4.52(2)样本容量n=100,组数为10组,则:组距=4.52/10=0.452≈0.5(3)列次表如下表。习题2.6解:样本总和=473.98平均数=4.7398标准差s=0.866164变异系数=cv=18.2743习题2.9解:单养平均数为:x=nx=5046...4545=42.70(kg)单养极差为:R=55-25=30(kg)单养标准差为:S=1nxx2)(=7.078(kg)单养系数为:CV=xs×100%=16.58%混养平均数为:x=∑x/n=52.10(kg)混养极差为:R=69-39=30(kg)混养标准差为:S=1nxx2)(=6.335(kg)混养变异系数为:CV=xs×100%=12.16%从单养和混养的贻贝重量数据可以看出,混养贻贝平均重量大于单养。二者稽查相等,说明最大值、最小值差距相等。但单养的标准差和变异系数都打与混养,说明单养贻贝的重量的整齐度没有与海带混养整齐度高。以上结果表明,贻贝与海带混养效果较好。第三章习题3.1答:在一定条件下必然出现的时间叫必然事件;相反,在一定条件下必然不出现的事件叫不可能事件;而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件。例如,发育正常的鸡蛋,在39°C下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。习题3.2答:事件A和事件B不能同时发生,即A·B=V,那么称事件A和事件B为互斥事件,如人的ABO血型中,某个人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。事件A和事件B必有一个发生,但二者不能同时发生即A+B=U,A×B=V,则称事件A与事件B为对立事件,如抛硬币时向上的一面不是正面就是反面。事件A与事件B的发生毫无关系。反之事件B的发生与事件A的发生毫无关系,则称事件A与事件B为独立事件,如第二胎生男生女与第一台生男生女毫无关系。习题3.3答:事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率。二者的关系是:当试验次数n充分大时,频率转化为概率。习题3.4答:正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。U=0,σ²=1的正态分布为标准正态分布。正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值21;②、正态分布是以μ为中心向左右两侧对称的分布③、ux的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为(-∞,+∞);④、正态分布曲线完全由参数μ和来决定⑤、正态分布曲线在x=μ±处各有一个拐点;⑥、正态分布曲线与x轴所围成的面积必定等于1。正态分布具有两个参数μ和,μ决定正态分布曲线在x轴上的中心位置,μ减小曲线左移,增大则曲线右移;决定正态分布曲线的展开程度,越小曲线展开程度越小,曲线越陡,越大曲线展开程度越大,曲线越矮宽。习题3.7解:(1)F1代非糯杂合体Ww与糯稻亲本ww回交,后代非糯杂合体Ww与糯稻纯合体ww各占一半,即概率均为0.5,故在后代N=200株中预期糯稻和非糯稻均为0.5×200=100(株)。(2)F1代非糯杂合体Ww自交,后代非糯杂合体WW:非糯杂合体Ww:糯稻杂合体ww=1:2:1,但表型非糯:糯稻=3:1,即非糯和糯稻的概率分别为0.75和0.25,故在后代N=2000株中,糯稻应为0.25×2000=500(株),非糯稻应为0.75×2000=1500(株)。习题3.8解:根据研究的目的基因,可将F2代分为纯合正常抗绣植株和非纯合正常抗绣植株,且不同大麦出现该目的基因为独立的,同时出现纯合正常抗绣植株的概率p=0.0036,非常小,故该题可用二项分布或泊松分布的概率函数公式计算。(1)=np=200*0.0036=0.72,代入泊松分布概率函数公式:P(X)=!x*72.0ex72.0X=0,1,2…200F2代出现纯合正常抗锈植株的各种可能株数的概率分别为:P(0)=0.487P(1)=0.350P(2)=0.126P(3)=0.030P(4)=0.005P(5)=0.001P(X≥6)=1-P(0)-P(1)-P(2)-P(3)-P(4)-P(5)=1-0.487-0.350-0.126-0.030-0.005-0.001=0.001出现6或6株以上纯合正常抗锈植株的概率总共为0.001,已经非常小了,不必再一一计算。(2)欲求P(X≥1)=0.99.则P(0)=0.01,即P(X)=!00e=0.01,对两边求对数,则有:n=4.605/0.0036=1279株因此,希望有0.99的概率保证获得1株或1株以上纯合正常抗锈植株,则F2代至少应种1279株。习题3.9解:小白鼠接种病菌后,要么生存要么死亡,个体间又相互独立,故服从二项分布。设时间A为接种病菌后生存,由已知得ρ=0.425,n=5,x=4,则“四生一死”的概率为:Ρ(4)=q45445PC=5×425.04×(1-0.425)¹=0.0938第四章习题4.1答:统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。统计推断主要包括参数统计和假设检验两个方面。假设检验是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,进过一定的计算,作出在一定概率水平(或显著水平)上应该接受或否定的那种假设的推断。参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。参数估计包括点估计和区间估计。习题4.2答:小概率原理是指概率很小的事件再一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于0.05或0.01的时间作为小概率事件。他是假设检验的依据,如果在无效假设H0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H0,否定HA;,如果某时间的概率小于0.05或0.01,说明无效假设不成立,则否定H0,接受HA。习题4.3答::在假设检验中如果H。是真实的,检验后却否定了它,就犯了第一类错误,即α错误或弃真错误;如果H。不是真实的,检验后却接受了它,就犯了第二类错误,即β错误或纳伪错误。为了减少犯两类错误的概率,要做到以下两点:一是显著水平α的取值不可太高也不可太低,一般取0.05作为小概率比较合适,这样可使得犯两类错误的概率都比较小;二是尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减少标准误,减少两类错误。假设检验中的两类错误是取证错误和取伪错误。为了减少犯两类错误的概率要做到:①显著水平a的取值不可以太高也不可太低,一般去0.05作为小概率比较合适,这样可以使犯两类错误的概率都比较小;②尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。习题4.4答:区间估计指根据一个样本的观测值给出总体参数的估计范围给出总体参数落在这一区间的概率。点估计是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。置信度与区间估计的关系为;对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。第五章习题5.1答:x2检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。习题5.2答:x2检验的步骤为:(1)提出无效假设H0:观测值与理论值的差异由抽样误差引起即观测值=理论值备择假设HA:观测值与理论值的差值不等于0,即观测值≠理论值(2)确定显著水平a.一般可确定为0.05或0.01(3)计算样本的x2,求得各个理论次数Ei,并根据各实际次数Oi,代入公式,计算出样本的x2。(4)进行统计推断第六章习题6.1答:(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。(3)方差分析的基本步骤如下:a.将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。b.列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。c.若F检验显著,对个处理平均数进行多重比较。习题6.2答:(1)多个平均数两两间的相互比较称为多重比较。(2)多重比较常用的方法有最小显著差数法和最小显著极差法,其中最小显著极差法又有新复极差检验和q检验法。(3)多重比较的结果常以标记字母法和梯形法表示。标记字母法是将全部平均数从大到小依次排列,然后再最大的平均数上标字母a,将该平均数与以下各