第1页共7页中国科学院武汉教育基地2006—2007学年第二学期期末考试试卷课程名称:生物统计学考试时间:2007年4月29日上午8:30-10:00。一、选择题(每小题只选择一个最确切的答案,2分×10=20分)1、对于一个连续型变量,其平均数之间有如下关系:A、算术平均数几何平均数调和平均数B、调和平均数算术平均数几何平均数C、几何平均数调和平均数算术平均数D、调和平均数几何平均数算术平均数2、一个小样本量(n10)的连续型变量X的均数记为X,其标准差为。A、1)(2nXXB、1)(2nXXC、nXX2)(D、nXX2)(3、若)(~2l、)(~2k,且、相互独立,则ξ+η服从。A、t分布B、F分布C、χ2分布D、二项分布4.某资料的观察值呈正态分布,则下面的叙述哪一个不正确?A.图形左右不一定对称B.均数决定图形在X轴上的位置C.曲线下面积为1D.标准差决定曲线的形状5、泊松(Poisson)分布是的极限分布。A、χ2分布B、正态分布C、二项分布D、t分布6、在下列试验设计方法中,不是考虑交互作用的实验设计。A.正交设计B.随机区组设计C.析因设计D.重复测量设计7、如果变量X和Y之间的相关系数为-1,说明两个变量之间。A、不存在相关关系B、相关程度很低C、相关程度很高D、完全负相关8、随机抽取几十名7岁儿童,在他们上小学一年级时进行入学和学年期末两次推理能力的测试,现在要比较学生的推理能力在入学后的一年里是否有所提高,应该用进行推断。A、Paired-SampleTTest,1-tailedB、IndepentTwo-SampleTTest,1-tailedC、Paired-SampleTTest,2-tailedD、IndepentTwo-SampleTTest,2-tailed第2页共7页9、某地区五月份的降水量y与四月份的平均气温X1,平均气压X2有关,假设此关系是线性的,气象站统计了连续12年的资料,数据如下,年序123456789101112降水量242925263133254027313328气温101025121624132415201814气压304022262920273325183134要确定五月份的降水量与4月份的气温和气压的关系,则用统计方法?A、一元线性回归B、多元线性回归C、一元线性相关D、多元线性相关10、为了研究不同记忆条件下的记忆效果,取4名被试,每个被试均分别接受4种不同条件(A、B、C、D)下的记忆实验,实验顺序随机决定,所得结果如下,被试者ABCD114192819235243028331354036427222427这里所测得的记忆能力得分的分布不明,请问用下列法比较不同记忆条件下的记忆效果?A、One-wayANOVAB、K-Independent-Samplestest,Kruskal-Wallis秩和检验C、K-Related-Samplestest,Friedman秩和检验D、K-Related-Samplestest,Kendall协同系数检验二、填空题(1分×20=20分)1、在对计量资料进行统计描述时,对于正态分布的资料,平均指标常常用,变异指标用;对于偏态分布的资料,平均指标常常用,变异指标用。2、已知)7,70(~2N,则ξ的标准差为,变异系数为。3、在一次家禽流行病过程中,某养鸡场1000只鸡已有300头死于流行病。如果从该鸡场购买5只鸡,有2只鸡存活的概率为。4、将45尾幼虾等分为5份,称取每份虾的总重量,其标准差为81mg,则这45尾幼虾单尾重量的标准差为。5、某男子身高为161cm,该地区男子的平均身高为173cm,方差为36cm2,则该男子身高在其所在地区的标准得分为。6、统计推断主要包括和。7、变量X和变量Y线性相关,其相关系数为-0.8,则X对Y的决定系数为。第3页共7页8、建立多元回归方程过程中,筛选对因变量作用显著的自变量的方法主要有法、法和法。9、在判别分析中,常用的判别方法有判别、判别和判别。10、在生存分析中截尾数据是指从至所经历的时间。三、判断题(1分×10=10分)(在下面有关统计学的陈述后面的括号内,你认为正确的打“√”,错误的划“×”)1、总体的统计指标称为统计量。()2、若x~N(μ,σ2),则x~N(μ,σ2/n)。()3、对一个分为两组的正态资料的两均数进行比较时,方差分析与t检验是等价的。()4、在方差分析过程中,对多组均数进行比较时,最小显著差异(LSD)检验适用于多个均数两两之间的全面比较。()5、交叉设计是考虑交互作用的实验设计。()6、在总体分布未知时,非参数统计的效率比参数检验方法高。()7、协方差分析是将方差分析与相关分析结合在一起的统计方法。()8、在直线相关分析中,r值不仅反映两变量间关系的密切程度,同时也反应它们相关的方向。()9、对变量的聚类和对样品聚类在数学上是对称的,没有什么不同。()10、在对多变量数据进行降维时,变量越相关,降维效果就越好。()四、简答题:(5分×2=10分)1、某水产研究所为了比较四种不同饲料对鱼的增重效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果见表4-1。表4-1饲喂不同饲料的鱼的增重(单位:10g)饲料鱼的增重(xij)A131.927.931.828.435.9A224.825.726.827.926.2A322.123.627.324.925.8A427.030.829.024.528.51)如果对本例进行方差分析,需要具备哪些条件?2)如果本例数据满足方差分析的条件,请简述主要的几个步骤(不需要进行具体的计算)。2、在一个三因素析因实验设计中,A因素有3个水平,B因素有2个水平,C因素有3个水平,每个水平组合重复3次试验。第4页共7页1)一共需要做多少次试验?2)如果需要分析本试验中所有因素间的交互作用,则有多少个三阶交互作用,用多少个二阶交互作用,有多少个主效应?3)如果最后的统计分析模型只需要保留有统计学意义的效应,则按什么顺序去除无统计学意义的交互作用或效应?五、计算题(5分×2=10分)1、在进行方差分析时,当有4个均数需要作全面两两比较时,共有多少次比较?设每次检验所用I类错误的概率水准为0.05,在样本彼此独立的情况下,累积I类错误的概率为多少?2、有4个样品,每个样品由3个指标反应,其数据矩阵记为X。1)试完成下面绝对距离矩阵的计算。数据矩阵绝对距离矩阵8530---5820--13270-615302)如果对样品进行聚类,则最先将哪两个样品聚为一类?六、分析题(10分×3=30分)1、甲乙两个班每班40位学生某次数学考试的部分成绩见表6-1,利用SPSS软件对两个班成绩的正态检验(Explore)结果见表6-2,对两个班成绩均数的参数检验(IndependentSamplesTest)输出结果见表6-3,对中位数的非参数检验(Mann-Whitney秩和检验)的结果见表6-4。表6-1两个班的数学成绩(Score)Class学生编号123456789101112131415161718...401656962707080665544626958807065433751...312646455606852785768595761636671695874...68表6-2SPSSoutput:TestsofNormalityclassKolmogorov-SmirnovaShapiro-WilkStatisticdfSig.StatisticdfSig.Score10.107400.200*0.980400.70320.138400.0540.966400.260*Thisisalowerboundofthetruesignificance.aLillieforsSignificanceCorrection.X=D=第5页共7页表6-3SPSSoutput:IndependentSamplesTestLevene'sTestforEqualityofVariancesT-testforEqualityofMeansFSig.tdfSig.(2-tailed)ScoreEqualvariancesassumed15.5990.000-2.14978.0000.035Equalvariancesnotassumed-2.14959.7750.036表6-4SPSSoutput:Mann-WhitneyTestscoreMann-WhitneyU598WilcoxonW1418Z-1.944Asymp.Sig.(2-tailed)0.052请回答下列问题:1)两班的数学成绩是否为正态资料?为什么?2)两班的数学成绩方差是否相等?为什么?3)根据t测验的结果,两个班的成绩是否明显不同?为什么?4)根据非参数检验的结果,两个班的成绩是否明显不同?5)在总体分布形式已知时,非参数检验有什么缺点?2、某医师希望研究3种治疗方案对尿路感染的疗效,数据见表6-5。研究者想知道3种方案(treat=1,传统疗法;treat=2,新疗法;treat=3,服用安慰剂)以及有无并发症(bingfa=1,有并发症;bingfa=0,无并发症)对病人的疗效(result=1,治愈;result=2,未愈)有无区别。表6-53种治疗方案对尿路感染的疗效bingfatreatresultcount1117812110113168011400215403134110281201113046010502050306为了比较3种治疗方案两两之间疗效是否存在差异,将治疗方案设置为哑变量,且第三个水平(treat=3)设为参照。第6页共7页用SPSS对本例资料进行二分类变量logistic回归分析的部分结果如表6-6:表6-6SPSSoutput:LogisticRegressionBlock1:Method=EnterVariablesintheEquationBS.E.WalddfSig.Exp(B)Step1abingfa-0.96160.299810.28810.0010.3823treat24.62220.000treat(1)0.58470.26414.90210.0271.7945treat(2)1.56080.31624.40110.0004.7625Constant1.41840.298722.55110.0004.1305a.Variable(s)enteredonstep1:bingfa,treat.1)试判断有无并发症以及不同的治疗方案对尿路感染的疗效是否有不同?为什么?2)传统疗法组和新疗法组的尿路感染治愈率分别是服用安慰剂组的几倍?3)如果需要比较新疗法组与传统疗法组的疗效,则哑变量应该怎样设置?3.欲比较某药三种不同浓度(dose1=10nmol,dose2=30nmol,dose3=90nmol)诱发小白鼠皮肤发生癌变(trans=1,癌变;trans=0,未致癌)的时间,每种浓度均处理了30只老鼠,试验结果见表6-7。表6-7某药三种不同浓度对小白鼠皮肤的致癌作用dosetimetranscountdosetimetranscountdosetimetranscount132112221131111401222601322111421123211323011441123301328111461123501329111481123611332141601223812334011600124012336111621124211338141640124302340131661124415342111720124401344121761824512344011760824613345112481134811248033480124902349051)变量count为各时间点小白鼠出现癌变或未癌变的例数。欲用SPSS软件对本例资料进行生存分析,先需要对