科目:统计软件姓名:张镓麟学院:数学科学学院系别:信息与计算数学系学号:190200822029562011年7月一、问题描述1、设定问题根据9个不同类型矿床的统计资料分析,发现矿床的评价值与矿床储量以及矿石品位之间的关系。2、查找数据N矿床评价值(亿元)矿床储量(万t)X1矿石品位(%)X210.065101.1520.235701.0430.775461.3141.405571.2651.585561.3162.075921.6772.396421.7583.137431.8393.527392.33二、处理数据以及回归分析1.绘制散点图value-data.frame(X1=c(510,570,546,557,556,592,642,743,739),X2=c(1.15,1.04,1.31,1.26,1.31,1.67,1.75,1.83,2.33),Y=c(0.06,0.23,0.77,1.40,1.58,2.07,2.39,3.13,3.52))plot(value)2.得到线性拟合模型lm.sol-lm(Y~X1+X2,data=value)summary(lm.sol)运行结果:由上表可知,回归方程的常数项0=-4.254788工商税收X1的系数1=0.005245农业税收X2的系数2=1.819148三、模型检验1.显著性检验从上面的运行结果可以看出,检验因变量(矿床评价值)与所有自变量(矿床储量、矿石品位)之间的线性关系是显著的。由以上的运行结果在α=0.05下,在2到6的自由度中,F比为29.89,p值为0.0007589,因此我们认为回归方程是显著Call:lm(formula=Y~X1+X2,data=value)Residuals:Min1QMedian3QMax-0.45221-0.339920.093960.181740.53546Coefficients:EstimateStd.ErrortvaluePr(|t|)(Intercept)-4.2547881.376223-3.0920.0213*X10.0052450.0037851.3860.2151X21.8191480.7772322.3410.0578.---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:0.4233on6degreesoffreedomMultipleR-squared:0.9088,AdjustedR-squared:0.8784F-statistic:29.89on2and6DF,p-value:0.0007589的。2.学生化残差分析rstudent(lm.sol)从图中我们可以看出残差的分布没有明显的趋势,从我们选取的有限个点的分布来看大致可以认为它满足线性的假定,条件同方差的假定和独立性的假定。3.多重共线性vif(lm.sol)运行结果:X1X24.5529474.552947由结果可以看出,方差膨胀因子VIF并不是很大,由此可以说明自变量(矿床储量、矿石品位)之间不满足多重共线性。四、结论此次试验中,我们使用二元线性回归的模型来刻画样本,并且通过残差分析大致验证了模型的线性的假定,条件同方差的假定、独立性的假定和正态性假定。通过F检验确定了模型线性的显著性,通过方差膨胀因子的方法说明了自变量之间不满足多重共线性。