第8章非线性回归思考与练习参考答案8.1在非线性回归线性化时,对因变量作变换应注意什么问题?答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式,还要注意误差项的形式。如:(1)乘性误差项,模型形式为eyAKL,(2)加性误差项,模型形式为yAKL对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。表8.15生产率x(单位/周)1000200030003500400045005000废品率y(%)5.26.56.88.110.210.313.0解:先画出散点图如下图:5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x和y之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。(1)二次曲线SPSS输出结果如下:ModelSummary.981.962.942.651RRSquareAdjustedRSquareStd.ErroroftheEstimateTheindependentvariableisx.ANOVA42.571221.28650.160.0011.6974.42444.2696RegressionResidualTotalSumofSquaresdfMeanSquareFSig.Theindependentvariableisx.Coefficients-.001.001-.449-.891.4234.47E-007.0001.4172.812.0485.8431.3244.414.012xx**2(Constant)BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.从上表可以得到回归方程为:72ˆ5.8430.0874.4710yxx由x的系数检验P值大于0.05,得到x的系数未通过显著性检验。由x2的系数检验P值小于0.05,得到x2的系数通过了显著性检验。(2)指数曲线ModelSummary.970.941.929.085RRSquareAdjustedRSquareStd.ErroroftheEstimateTheindependentvariableisx.ANOVA.5731.57379.538.000.0365.007.6096RegressionResidualTotalSumofSquaresdfMeanSquareFSig.Theindependentvariableisx.Coefficients.000.000.9708.918.0004.003.34811.514.000x(Constant)BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Thedependentvariableisln(y).从上表可以得到回归方程为:0.0002tˆ4.003ye由参数检验P值≈00.05,得到回归方程的参数都非常显著。从R2值,σ的估计值和模型检验统计量F值、t值及拟合图综合考虑,指数拟合效果更好一些。8.3已知变量x与y的样本数据如表8.16,画出散点图,试用αeβ/x来拟合回归模型,假设:(1)乘性误差项,模型形式为y=αeβ/xeε(2)加性误差项,模型形式为y=αeβ/x+ε。表8.16序号xy序号xy序号xy14.200.08663.200.150112.200.35024.060.09073.000.170122.000.44033.800.10082.800.190131.800.62043.600.12092.600.220141.600.94053.400.130102.400.240151.401.620解:散点图:(1)乘性误差项,模型形式为y=αeβ/xeε线性化:lny=lnα+β/x+ε令y1=lny,a=lnα,x1=1/x.做y1与x1的线性回归,SPSS输出结果如下:ModelSummaryb.999a.997.997.04783Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),x1a.DependentVariable:y1b.ANOVAb10.930110.9304778.305.000a.03013.00210.96014RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),x1a.DependentVariable:y1b.Coefficientsa-3.856.037-103.830.0006.080.088.99969.125.000(Constant)x1Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:y1a.从以上结果可以得到回归方程为:y1=-3.856+6.08x1F检验和t检验的P值≈00.05,得到回归方程及其参数都非常显著。回代为原方程为:y=0.021e6.08/x(2)加性误差项,模型形式为y=αeβ/x+ε不能线性化,直接非线性拟合。给初值α=0.021,β=6.08(线性化结果),NLS结果如下:ParameterEstimates.021.001.020.0236.061.0445.9656.157ParameterabEstimateStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalANOVAa4.45822.229.00113.0004.459152.46714SourceRegressionResidualUncorrectedTotalCorrectedTotalSumofSquaresdfMeanSquaresDependentvariable:yRsquared=1-(ResidualSumofSquares)/(CorrectedSumofSquares)=1.000.a.从以上结果可以得到回归方程为:y=0.021e6.061/x根据R2≈1,参数的区间估计不包括零点且较短,可知回归方程拟合非常好,且其参数都显著。8.4Logistic函数常用于拟合某种消费品的拥有率,表8.17(书上239页,此处略)是北京市每百户家庭平均拥有的照相机数,试针对以下两种情况拟合Logistic回归函数。(1)已知100u,用线性化方法拟合,(2)u未知,用非线性最小二乘法拟合。解:(1),100u时,的线性拟合。对0111tybbu函数线性化得到:11ln()1.8510.264100y0111ln()lnln100btby,令311ln()100yy,作3y关于t的线性回归分析,SPSS输出结果如下:ModelSummaryb.994a.988.987.16820Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),ta.DependentVariable:y3b.ANOVAb39.839139.8391408.165.000a.48117.02840.32018RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),ta.DependentVariable:y3b.Coefficientsa-1.851.080-23.039.000-.264.007-.994-37.526.000(Constant)tModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:y3a.由表ModelSummary得到,0.994R趋于1,回归方程的拟合优度好,由表ANOVA得到回归方程显著,由Coefficients表得到,回归系数都是显著的,得到方程:11ln()1.8510.264100y,进一步计算得到:00.157b,10.768b(100u)回代变量得到最终方程形式为:1ˆ0.010.1570.768ty最后看拟合效果,通过sequence画图:由图可知回归效果比较令人满意。(2)非线性最小二乘拟合,取初值100u,00.157b,10.768b:一共循环迭代8次,得到回归分析结果为:ParameterEstimates91.0622.03586.74795.377.211.028.152.271.727.012.701.753ParameterubcEstimateStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalANOVAa60774.331320258.11085.369165.33660859.7001915690.38618SourceRegressionResidualUncorrectedTotalCorrectedTotalSumofSquaresdfMeanSquaresDependentvariable:yRsquared=1-(ResidualSumofSquares)/(CorrectedSumofSquares)=.995.a.0.995R0.994,得到回归效果比线性拟合要好,且:91.062u,00.211b,10.727b,回归方程为:110.211*0.72791.062ty。最后看拟合效果,由sequence画图:得到回归效果很好,而且较优于线性回归。8.5表8.18(书上240页,此处略)数据中GDP和投资额K都是用定基居民消费价格指数(CPI)缩减后的,以1978年的价格指数为100。(1)用线性化乘性误差项模型拟合C-D生产函数;(2)用非线性最小二乘拟合加性误差项模型的C-D生产函数;(3)对线性化检验自相关,如果存在自相关则用自回归方法改进;(4)对线性化检验多重共线性,如果存在多重共线性则用岭回归方法改进;(5)用线性化的乘法误差项模型拟合C-D生产函数;解:(1)对乘法误差项模型可通过两边取对数转化成线性模型。lny=lnA+lnK+lnL令y′=lny,β0=lnA,x1=lnK,x2=lnL,y′=β0+x1+2+SPSS输出结果如下:模型综述表ModelSummaryb.997a.994.993.04836Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),lnL,lnKa.DependentVariable:lnYb.从模型综述表中可以看到,调整后的为0.993,说明C-D生产函数拟合效果很好,也说明GDP的增长是一个指数模型。方差分析表ANOVAb8.44624.2231805.601.000a.05122.0028.49724RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),lnL,lnKa.DependentVariable:lnYb.从方差分析