哈尔滨商业大学数学实验报告实验题目:___用SPSS软件来实现判别分析___________姓名:__张彦琛_____学号:__201214390009____专业:____数学与应用数学_____________________日期:______2012-10-27_______________________成绩一、实验目的用SPSS软件来实现判别分析及其应用。二、实验内容已知某研究对象分为3类,每个样品考察4项指标,各类观测的样品数分别为7,4,6;另外还有2个待判样品分别为第一个样品:x1=-8,x2=-14,x3=16,x4=56第二个样品:x1=92,x2=-17,x3=18,x4=3.0三、实验步骤及结论(一)实验步骤把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中进行判别分析。执行菜单命令,单击“分析—分类—判别”,进行操作步骤……点击确定,即可得到实验结论。(二)实验结论表一:检验结果a箱的M35.960F近似。2.108df110df2537.746Sig..022对相等总体协方差矩阵的零假设进行检验。a.有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为18.794。表一是box检验的结果。Box的检验结果是35.390,Sig.的值为0.00220.05,拒绝原假设,即每类的协差阵不完全相等。表二:特征值函数特征值方差的%累积%正则相关性13.116a99.699.6.8702.012a.4100.0.111a.分析中使用了前2个典型判别式函数。表二是特征值。从表中知第一个特征值是3.116,方差贡献率为99.6%,累计贡献率为99.6%,判断率为99.6%,则第一判别函数有效。表三:Wilks的Lambda函数检验Wilks的Lambda卡方dfSig.1到2.24017.8408.0222.988.1543.985表三给出了Fisher判别函数的有效性检验。由表三知第一个Sig.的值为0.0220.05,拒绝原假设,检验是显著的,进而说明第一Fisher判别函数是有效的。而第二个Sig.的值为0.9850.05,第二Fisher判别函数不显著,即不有效。表四:典型判别式函数系数函数12x1.010.023x2.543-.107x3.047-.024x4-.068.001(常量)9.240-1.276非标准化系数表四是典则判别式函数系数。由表中可以写出第一Fisher判别函数是y1=9.240+0.010*x1+0.543*x2+0.047*x3-0.068*x4。第一个待判样本:y1=-1.498;第二个待判样本:y1=1.571。表五:组质心处的函数类别号函数121.00-1.846-.0322.00.616.1783.001.744-.081在组均值处评估的非标准化典型判别式函数表五是组质心处的典则判别函数值。第一类的质心G1是-1.846,第二类的质心G2是0.616,第三类的质心G3是1.744。第一个待判样本:|y1-G1|=0.348,|y1-G2|=2.114,|y1-G3|=3.242,由|y1-G1||y1-G2||y1-G3|,则应属于第一类。第二个待判样本:|y2-G1|=3.417,|y1-G2|=0.955,|y1-G3|=0.173,由|y1-G3||y1-G2||y1-G1|,则应属于第三类。表六:组的先验概率类别号先验用于分析的案例未加权的已加权的1.00.33377.0002.00.33344.0003.00.33366.000合计1.0001717.000由表四可知,每一类的先验概率均为0.333。表七:分类函数系数类别号1.002.003.00x1-.074-.045-.040x2-19.412-18.097-17.457x34.5494.6614.720x41.5821.4141.337(常量)-223.516-199.536-190.099Fisher的线性判别式函数表七是分类函数系数,即Fisher判别函数系数。由Fisher判别函数系数表可以确定3个类的贝叶斯线性判别函数分别是:Y1=-223.516-0.074*x1-19.412*x2+4.549*x3+1.582*x4;Y2=-199.536-0.045*x1-18.097*x2+4.661*x3+1.414*x4;Y3=-190.099-0.040*x1-17.457*x2+4.720*x3+1.337*x4;将待判样本的各变量值代入上述贝叶斯判别函数得:对第一个待判样本:Y1=210.22,Y2=207.942,Y3=205.011,由Y1Y2Y3,则应属于第一类。对第二个待判样本:Y1=186.308,Y2=192.113,Y3=191.961,由Y1Y3Y2,则应属于第二类。表八:分类结果b,c类别号预测组成员合计1.002.003.00初始计数1.0061072.0004043.001056%1.0085.714.3.0100.02.00.0100.0.0100.03.0016.7.083.3100.0交叉验证a计数1.0061072.0012143.001146%1.0085.714.3.0100.02.0025.050.025.0100.03.0016.716.766.7100.0a.仅对分析中的案例进行交叉验证。在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。b.已对初始分组案例中的88.2%个进行了正确分类。c.已对交叉验证分组案例中的70.6%个进行了正确分类。表八是预测分类结果,由表中可以看出判别率。在回代验证中,第一类正确率为85.7%,第二类的正确率为100%,第三类的正确率为83.3%。在交叉验证中,第一类正确率为85.7%,第二类的正确率为50%,第三类的正确率为66.7%。在整体中,对原始分组案例中的88.2%个进行了正确分类,对交叉验证分组案例中的70.6%个进行了正确分类。四、心得体会1.通过这次上机实验,我学会了用SPSS软件来实现判别分析,用所学的来解决实际问题。2.通过老师的讲解,学会了如何操作SPSS软件,知道如何分析所得到的实验结果,读懂实验表格。3.实际生活中很多的问题都会用到多元回归分析模型,因此应该充分了解判别分析的思想,将实际问题进行数字化,建立正确的模型。