第一章填空1.变量按其性质可以分为(连续)变量和(非连续)变量。2.样本统计数是总体(参数)的估计值。3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。4.生物统计学的基本内容包括(实验设计)和(统计推断)两大部分。5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。6.生物学研究中,一般将样本容量(n大于等于30)称为大样本。7.试验误差可以分为(系统误差)和(随机误差)两类。判断1.对于有限总体不必用统计推断方法。(F)2.资料的精确性高,其准确性也一定高。(F)3.在试验设计中,随机误差只能减小,而不能完全消除。(R)4.统计学上的试验误差,通常指随机误差。(R)第二章填空1.资料按生物的性状特征可分为(数量性状资料)变量和(质量形状资料)变量。2.直方图适合于表示(连续变量)资料的次数分布。3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异性)。5.样本标准差的计算公式s=(√∑𝑥2−(∑𝑥)2𝑛𝑛−1)。判断题1.计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(F)2.条形图和多边形图均适合于表示计数资料的次数分布。(F)3.离均差平方和为最小。(R)4.资料中出现最多的那个观测值或最多一组的中点值,称为众数。(R)5.变异系数是样本变量的绝对变异量。(F)单项选择1.下列变量中属于非连续性变量的是(C).A.身高B.体重C.血型D.血压2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成(A)图来表示.A.条形B.直方C.多边形D.折线3.关于平均数,下列说法正确的是(B).A.正态分布的算术平均数和几何平均数相等.B.正态分布的算术平均数和中位数相等.C.正态分布的中位数和几何平均数相等.D.正态分布的算术平均数、中位数、几何平均数均相等。4.如果对各观测值加上一个常数a,其标准差(D)。A.扩大a倍B.扩大a倍C.扩大a2倍D.不变5.比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。A.标准差B.方差C.变异系数D.平均数第三章填空1.如果事件A和事件B为独立事件,则事件A与事件B同时发生的概率P(AB)=P(A)P(B)。2.二项分布的形状是由(n)和(p)两个参数决定的。3.正态分布曲线上,(μ)确定曲线在x轴上的中心位置,(σ)确定曲线的展开程度。4.样本平均数的标准误𝜎𝑥̅=(σ√𝑛⁄)。5.事件B发生条件下事件A发生的条件概率,记为P(A/B),计算公式:(P(AB)/P(B))判断题1.事件A的发生和事件B的发生毫无关系,则事件A和事件B为互斥事件。(F)2.二项分布函数Cnxpxqn-x恰好是二项式(p+q)n展开式的第x项,故称二项分布。(F)3.样本标准差s是总体标准差σ的无偏估计值。(F)4.正态分布曲线形状和样本容量n值无关。(R)5.х2分布是随自由度变化的一组曲线。(R)单项选择题1.一批种蛋的孵化率为80%,同时用2枚种蛋进行孵化,则至少有一枚能孵化出小鸡的概率为(A)。A.0.96B.0.64C.0.80D.0.902.关于泊松分布参数λ错误的说法是(C).A.μ=λB.σ2=λC.σ=λD.λ=np3.设x服从N(225,25),现以n=100抽样,其标准误为(B)。A.1.5B.0.5C.0.25D.2.254.正态分布曲线由参数μ和σ决定,μ值相同时,σ取(D)时正态曲线展开程度最大,曲线最矮宽.A.0.5B.1C.2D.3计算题例题1甲、乙、丙三人向同一飞机射击,设甲、乙、丙射中的概率分别为0.4,0.5,0.7,又设若只有一人射中,飞机落下的概率为0.2,若两人击中,飞机落下的概率为0.6,若三人击中飞机必落,求三人射击一次,飞机落下的概率?解:记B=“飞机坠毁”,Ai=“有i人击中”,其中i=0、1、2、3.显然A0,A1,A2,A3是完备事件组,运用概率加法和乘法定理,P(A0)=0.6X0.5X0.3=0.09P(A1)=0.4X0.5X0.3+0.6X0.5X0.7=0.36P(A2)=0.6X0.5X0.7+0.4x0.5x0.7+0.4x0.5x0.3=0.41P(A3)=0.4x0.5x0.7=0.14根据题意可知,P(B/A0)=0,P(B/A1)=0.2,P(B/A2)=0.6,P(B/A3)=1利用全概率公式,则有:P(B)=∑𝑃(𝐴𝑖)𝑃(𝐵𝐴𝑖)3𝑖=0=0.09x0+0.36x0.2+0.41x0.6+0.14x1=0.458例题2中年男性人群中,20%超重,50%正常,30%体重偏低,他们患动脉硬化的概率分别为0.3,0.1,0.01,从中随机抽取一人,恰为动脉硬化患者,求他可能来自各人群的概率?解:设A1,A2,A3分别表示超重,正常,偏轻,B表示动脉硬化邮题意,P(A1)=0.2,P(A2)=0.5,P(A3)=0.3,P(B/A1)=0.3,P(B/A2)=0.1,P(B/A3)=0.01,有贝叶斯公式可得,P(A1/B)=P(A1)P(B/A1)/∑𝑃(𝐴𝑖)𝑃(𝐵/𝐴𝑖)3𝑖=1=0.2*0.3/(0.2*0.3+0.5*0.1+0.3*0.01)=0.06/0.113=0.531同理可得,P(A2/B)=0.05/0.113=0.442P(A3/B)=0.003/0.113=0.027例题3仓库中有四批种子,第一批占仓库种子总数的10%,第二批占20%,第三批占30%,第四批占40%,已知第一批种子的发芽率为0.8,第二批为0.7,第三批为0.6,第四批为0.5,今随机从仓库中抽取一粒种子,问其不发芽种子的概率为多少?如果抽取到的种子为发芽种子,试问该种子来自第三批的可能性为多大?解:设A1,A2,A3,A4分别表示第一批,第二批,第三批,第四批种子,B表示发芽P(A1)=0.1,P(A2)=0.2,P(A3)=0.3,P(A4)=0.4,P(B/A1)=0.8,P(B/A2)=0.7,P(B/A3)=0.6,P(B/A4)=0.5所以抽取1粒种子发芽的概率P(B)=0.1*0.8+0.2*0.7+0.3*0.6+0.4*0.5=0.6所以抽取1粒种子不发芽的概率P(𝐵̅)=1-P(B)=1-0.6=0.4P(A3/B)=P(A3)P(B/A3)/P(B)=0.3*0.6/0.6=0.3重要公式:二项分布:泊松分布:正态分布:第四章抽样估计:用抽样调查所得到的一部分单位的数量特征来估计和推算总体的数量特征抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布置信区间:指由样本统计量所构造的总体参数的估计区间概率:概率是事件在试验结果中出现可能性大小的定量计量,是事件固有的属性。随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称为随机误差。α错误:H0是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称为α错误。β错误:指如果H0不是真实的,假设检验时却接受了H0,否定了HA这样就犯了接受不真实假设的错误,称为β错误。统计推断:指从样本的统计数对总体参数做出的推断。参数估计:由样本结果对总体参数在一定概率水平下所做出的估计统计学——研究随机现象规律性的方法学;是一门关于如何收集、分析、解释和表达数据的科学1)(2nyysNy2)(122nnxxs)(xnxxnppCxP)1()()1(pnp)1(2pnpnpexxPx!)(np2222)(21)(xexfxu第五章一、填空1.统计推断主要包括(假设检验)和(参数估计)两个方面。2.参数估计包括(点估计)估计和(区间估计)估计。3.假设检验首先要对总体提出假设,一般要作两个:(无效)假设和(备择)假设。4.总体方差σ12和σ22已知,或总体方差σ12和σ22未知,但两个样本均为大样本时应采用u检验法5.在频率的假设检验中,当np或nq(小于)30时,需进行连续性矫正。二、判断1.作假设检验时,若|u|﹥uα,应该接受H0,否定HA。(F)2.若根据理知识或实践经验判断甲处理的效果不会比乙处理的效果差,分析的目的在于推断甲处理是否真的比乙处理好,这时应用单侧检验。(R)3.小概率事件在一次试验中实际上是不可能发生的。(R)4.当总体方差σ2未知时需要用t检验法进行假设检验。(F)5.在进行区间估计时,α越小,则相应的置信区间越大。(R)6.在小样本资料中,成组数据和成对数据的假设检验都是采用t检验的方法。(R)7.在同一显著水平下,双尾检验的临界正态离差大于单尾检验。(R)三、单选1.两样本平均数进行比较时,分别取以下检验水平,以(A)所对应的犯第二类错误的概率最小。A.α=0.20B.α=0.10C.α=0.05D.α=0.012.当样本容量n﹤30且总体方差σ2未知时,平均数的检验方法是(A)。A.t检验B.u检验C.F检验D.χ2检验3.两样本方差的同质性检验用(C)。A.t检验B.u检验C.F检验D.χ2检验4.进行平均数的区间估计时,(B)。A.n越大,区间越大,估计的精确性越小。B.n越大,区间越小,估计的精确性越大。C.σ越大,区间越大,估计的精确性越大。D.σ越大,区间越小,估计的精确性越大。5.已知某批25个小麦样本的平均蛋白含量𝑥̅和σ,则其在95%置信信度下的蛋白质含量的点估计L=(D)。A.𝒙̅±u0.05σB.𝒙̅±t0.05σC.𝒙̅±u0.05𝜎𝑥̅D.𝒙̅±t0.05𝜎𝑥̅计算题例题1某鱼塘水中的含氧量,多年平均为4.5ml/L,现在该鱼塘设10个点采水样,测得水中含氧量分别为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26ml/L,试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。解:假设H0:μ=4.54.5mlL-1,备择假设HA:μ≠4.5mlL-1该样本为总体标准差未知,且为小样本容量,故采用t检验,选择显著水平α=0.05𝑥̅=110∑𝑥𝑖10𝑖=1=4.33+4.62+⋯+4.2610=4.421mlL-1s=√∑𝑥2−(∑𝑥)2𝑛𝑛−1=√4.332+4.622+⋯+4.262−44.2121010−1=0.267mlL-1𝑆𝑥̅=𝑠√𝑛=0.267√10=0.084mlL-1t=𝑥̅−𝜇𝑆𝑥̅=(4.421-4.5)/0.084=-0.94df=n-1=9,t0.05=2.262,|𝑡|t0.05推断接受H0,所以该抽样测定的鱼塘水中含氧量与多年平均含氧量没有显著差异。2、测得某批25个小麦样本的平均蛋白质含量𝑥̅=14.5%,已知σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。解:由于本题σ已知,置信度P=1-α=0.95所以α=0.05.查表得u0.05=1.96𝜎𝑥̅=𝜎√𝑛=2.5√25=0.5L1=𝑥̅-u0.05𝜎𝑥̅=14.5-1.96*0.5=13.52%L2==𝑥̅+u0.05𝜎𝑥̅=14.5+1.96*0.5=15.48%L=𝑥̅±u0.05𝜎𝑥̅=14.5±1.96*0.5=14.5±0.98%第六章一、名词解释*方差分析的基本思想是将测量数据的总变异按照变异原因不同分解为处理效应和实验误差,并作出其数量估计。(方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和)。二、填空1.根据对处理效应的不同假定,方差分析中的数学模型可以分为(固定模型)、(随机模型)和(混合模型)3类。2.在进行两因素或多因素试验时,通常应设置(重复),以正确估计试验误差,研究因素间的交互作用。3.一个试验的总变异依据变异来源分为相应的变异,将总平方和分解为:处理间平方和