浙江林学院硕士研究生多元统计分析(科目)试卷(B卷)研究生课程考试成绩统计表题号一二三四五六七八合计得分阅卷人任课教师签字:考试时间:学号:姓名:专业:一、名词解释:(每小题5分,共20分)1.马氏距离2.聚类分析3.因子分析4.典型相关分析二、填空:(每小题3分,共21分)1.P(A)=P(B)=P(C)=0.25,P(AB)=P(BC)=0,P(AC)=0.125。则A、B、C三个事件中至少出现一个的概率__________。2.协方差分析有二个意义,一是,二是。3.R型聚类以相似系数作为统计量,列出3个R型聚类的统计量夹角余弦、相关系数。4.判别分析和聚类分析用于分类和分组的多元统计方法。5.系统聚类法是在聚类分析的开始,每个样本自成一类;然后,按照某种方法度量所有样本之间的亲疏程度,并把最相似的样本首先聚成一小类;接下来,度量剩余的样本和小类间的距离,并将当前最接近的样本或小类再聚成一类;如此反复,直到所有样本聚成一类为止。6.请指出下面SPSS软件操作分别代表多元统计分析中什么分析:(1)Analysis→Classify→Discriminant判别分析(2)Analysis→DataReduction→Factor因子分析7.判定系数是估计的的度量,表明Y的变异性能被估计的回归方程解释的部分。三、简要地回答下列问题:(每小题7分,共14分)1.描述多元线性回归模型2.描述主成分分析与因子分析的关系四、操作题(20分)为研究三类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-12的地理已分成3类,13-15的待定(下表6列为原始数据)。序号X1X2X3X4实际类Function1Function2预测类150331421-9.029-.5071246361021-10.428-2.4441348311621-8.045.1541449361411-10.615.350155524371021.3891.891266731471522.7932.316275630411321.547.857286429431321.9062.286296731562439.159-2.3053108931512337.346-1.7493116530522036.729-.4083125827511937.247-.44031358285124待定9.836-5.055145434172待定-9.1211.0331555234013待定3.853.347(1)写出判别分析的基本思想(2)在刚进入判别分析界面时,请完成以下操作(填空):将选入GroupingVariable框中,并点击DefineRange,在跳出的界面中Minimum框中填写,在Maximum框中填写;将选入Independents框中;……(3)最后输出的DescriminantScores列在上表的第7-8列,请在表的最后1列的最后3行空格处填上序号13-15样品的预测分类号。并说明其中的原因。五、计算:(25分)1.为了研究7种植物A、B、C、D、E、F、G的分布规律,根据资料做类型划分。已知各植物两两间距离矩阵如下D=04381721140311618201506523100192413022120110GFEDCBAGFEDCBA试用系统聚类法(类与类采用最短距离法)进行聚类分析:(1)写出系统聚类法的基本思想;(2)写出从7类最后聚成1类的详细过程;(3)画出系统聚类图。