应用数理统计报告报告人:宋玲地点:计算机院软工实训室时间:2013年12月25日主要内容报告题目1输出结果3编写程序2分析及总结4报告题目在林木生物量生产率研究中,为了了解林地施肥量(x1,kg)、灌水量(x2,10)与生物量(Y,kg)的关系,在同一林区共进行了20次试验,观察值见下表,试建立Y关于x1,x2的线性回归方程。从数据中可知,通过给定数据之间的关系,采用线性回归的方法分析过程REG.编写程序DATAct;INPUTx1x2y@@;XSQ=x1*x2;CARDS;5429506139515226527048546342537964606845596530657951677644707136708250737539749260789662829261809150878547841067288905292PROCREG;MODELy=x1x2/PCLI;MODELy=x1x2xsq/PCLI;RUN;定义变量数据数据过程步输出结果(model1)图1图2输出结果(model2)图3图4结果分析(1)回归模型是否显著,显著水平是多少?复相关系数是多少?答:回归方程显著,显著水平是0.0001。复相关系数是0.9659。(2)回归系数的估计值是多少?显著性如何?答:Intercept-4.940480.1711X11.539520.0001X2-0.943850.0001X1与X2的系数对于表达式极显著,截距项对应的系数对表达式在0.01下不显著。(3)写出回归方程的表达式。y=1.53952x1-0.94385x2-4.94048(4)利用残差(实测值与预测值之差)、95%置信取间的上下限讨论预测预报效果及预报的稳定性。答:根据上面结果可知残差和95%置信区间的上下限的差异很大,最大的达到7.4640.最小的达到0.2868.幅度比较大。所以稳定性也很差。结果分析(5)对本问题再求出Y关于X1、X2的二次多项式回归方程,并与线性回归方程比较,说明优缺点。Intercept-14.553330.2210X11.668570.0001X2-0.733310.0126XSQ-0.002710.3914由输出结果知:二次模型在0.0001水平下是显著的,预测模型为:y=-14.553333+1.66857x1-0.73311x2-0.00271x1*x2线性模型在0.001水平下也是显著的,预测模型为:Y=1.53952X1-0.94385X2-4.94048对比来说:MODEL2复相关系数更接近1,预测值与实测值更接近,回归效果更好,因此y与x的关系应选用二次模型。题目本数据来源于2003年所做的试验,数据参考文件reg-4.xls,观测11个水稻品种(03DH1、03DH2、03DH3、03DH4、03DH5、03DH6、03DH7、03DH8、03DH9、03DH10、03DH11)的各种性状:穗数xl、枝梗数x2、秕粒x3、200粒重y。每个水稻品种取5株.以5株为一个单位。研究水稻200粒重y与穗数xl、枝梗数x2、秕粒x3之间的关系,分析哪些因素对200粒重y的影响较大。从数据中可知,通过给定数据之间的关系,采用线性回归的方法分析过程REG.编写程序TITLE‘多元线性回归分析’;DATAAMO;INPUTYX1-X3;CARDS;5.871416595.582713275.833111944.712015645.5924141673.8519133405.523013405.652913904.973014855.314113120;PROCREG;MODELy=x1x2x3;MODELY=X1X2X3/SELECTION=STEPWISECLI;RUN;CLI表示求预测值与预测区间MODEL2用逐步回归分析方法输出结果(model1)图1输出结果(model2)图2图3结果分析REG过程中,MODEL语句可以交互使用,本例我们建立了两个模型,第一个MODEL没有做变量筛选,第二个MODEL指定逐步回归方法筛选变量。并且用CLI输出预测值与预测区间。REG过程拟合带截距项的直线回归方程,用最小二乘法估计模型的参数,并给出模型及参数的方差分析及T检验。本例的两个模型1检验P值大于0.05,无统计学意义。模型2为逐步回归法,只纳入了X3,由参数估计表可知,对常数检验t值为t=615.68,Pr|t|的值小于0.0001,远小于0.05,说明截距项(即常数项Intercept)通过检验,估计值为5.82331.对自变量x1分析同样可以得知,x1系数通过检验,估计值为-0.00493.所以回归方程为:y=0.00493*x1+5.82331.综上所述:在研究影响水稻粒重的因素中,只有秕粒对它的影响较大。Thankyou!结束