1多元线性回归、多重共线性、异方差综合实验报告一

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

多元线性回归、多重共线性、异方差综合实验报告一、研究目的和要求:随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化了产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要因素,分析旅游收入增长规律,需要建立计量经济模型。影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。二、模型设定根据以上的分析,建立以下模型:Y=β0+β1X1+β2X2+β3X3+β4X4+Ut参数说明:Y——旅游景区营业收入/万元X1——旅游业从业人员/人X2——旅游景区固定资产/万元X3——旅游外汇收入/万美元X4——城镇居民可支配收入/元收集到的数据如下(见表2-1):表2-12011年全国旅游景区营业收入及相关数据(按地区分)地区营业收入从业人数固定资产外汇收入可支配收入北京145249.01145466694252.3054160032903.03天津48712.372478793529.6717555326920.86河北182226.8779643420342.744476518292.23山西29465.0357719121809.745671918123.87内蒙古70313.0736264206819.126709720407.57辽宁25665.306481646573.2727131420466.84吉林20389.302906687827.163852817796.57黑龙江38367.8130341137426.279176215696.18上海194762.391106563007.4457511836230.48江苏316051.651401541195000.6056529726340.73浙江385976.921324591110975.2045417330970.68安徽79562.7555840139769.0211791818606.13福建155378.9580303151897.6936344424907.40江西54961.664179185528.054150017494.87山东116995.67143026327733.2925507622791.84河南222108.3370164482005.325490318194.80湖北104565.5862767243794.629401818373.87湖南118180.8780615257226.710143418844.05广东476345.502265391160675.4139061926897.48广西66195.5549876143982.0310518818854.06海南29081.603075970386.553761518368.95重庆86713.6750160230124.009680620249.70四川218624.0370756464763.525938317899.12贵州42214.142768362415.211350716495.01云南135897.9762679348426.0416086118575.62西藏30406.736023462971.031296316195.56陕西48692.1757077154529.1912950518245.23甘肃30949.003128056684.68174014988.68青海638.4387419851.28265915603.31宁夏49509.861219623149.9062017578.92新疆28993.114045152280.364651915513.62数据来源:1.中国统计年鉴2012,2.中国旅游年鉴2012。三、参数估计(一)操作步骤利用Eviews6.0做多元线性回归分析步骤如下:1.创建工作文件双击Eviews6.0图标,进入其主页。在主菜单中依次点击“File\New\Workfile”,出现对话框“WorkfileRange”。本例中是截面数据,在workfilestructuretype中选择“Unstructured/Undated”,在Daterange中填入observations31,点击ok键,完成工作文件的创建。2.输入数据在命令栏中输入DATAYX1X2X3X4,回车出现“Group”窗口数据编辑框,在对应的YX1X2X3X4下输入相应数据,关闭对话框将其命名为group01,点击ok,保存。对数据进行存盘,点击“File/SaveAs”,出现“SaveAs”对话框,选择存入路径,并将文件命名,再点“ok”。3.参数估计在Eviews6.0命令栏中键入“LSYCX1X2X3X4”,按回车键,即出现回归结果。利用Eviews6.0估计模型参数,最小二乘法的回归结果如下:表3-1回归结果DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:14Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.C32390.8339569.490.8185810.4205X10.6036240.3661121.6487410.1112X20.2342650.0412185.6835830.0000X30.0446320.0607550.7346200.4691X4-1.9140342.098257-0.9122020.3700R-squared0.879720Meandependentvar114619.2AdjustedR-squared0.861215S.D.dependentvar112728.1S.E.ofregression41995.55Akaikeinfocriterion24.27520Sumsquaredresid4.59E+10Schwarzcriterion24.50649Loglikelihood-371.2657Hannan-Quinncriter.24.35060F-statistic47.54049Durbin-Watsonstat2.007191Prob(F-statistic)0.000000根据表中的样本数据,模型估计结果为^Y=32390.83+0.603624X1+0.234265X2+0.044632X3-1.914034X4(39569.49)(0.366112)(0.041218)(0.060755)(2.098257)t=(0.818581)(1.648741)(5.683583)(0.734620)(-0.912202)R2=0.879720R2=0.861215F=47.54049DW=2.007191可以看出,可决系数R2=0.879720,修正的可决系数R2=0.861215。说明模型的拟合程度还可以。但是当α=0.05时,X1、X2、X4系数均不能通过检验,且X4的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性。四、模型修正1.多重共线性的检验与修正(1)检验选中X1X2X3X4数据,点击右键,选择“Open/asGroup”,在出现的对话框中选择“View/CovarianceAnalysis/correlation”,点击ok,得到相关系数矩阵。计算各个解释变量的相关系数,得到相关系数矩阵如下。表4-1相关系数矩阵变量X1X2X3X4X11.0000000.8097770.8720930.659239X20.8097771.0000000.7583220.641086X30.8720930.7583221.0000000.716374X40.6592390.6410860.7163741.000000由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。(2)多重共线性修正采用逐步回归的办法,检验修正多重共线性问题。分别作Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LSYCX1,LSYCX2,LSYCX3,LSYCX4保存结果,整理如表4.2所示。表4-2一元回归结果变量X1X2X3X4参数估计值1.9782240.3151200.31694612.54525t统计量8.63511112.474956.9224794.005547R20.7199830.8429240.6229880.3561912R0.7103270.8375080.6099880.333991其中,X2的方程2R最大,以X2为基础,顺次加入其它变量逐步回归。在命令窗口中依次输入:LSYCX2X1,LSYCX2X3,LSYCX2X4,并保存结果,整理结果如表4.3所示。表4-3加入新变量的回归结果(一)变量变量X1X2X3X42RX2,X10.711446(2.679575)0.230304(5.891959)0.866053X2,X30.258113(7.016265)0.087950(2.043471)0.853546X2,X40.312045(9.319239)0.293708(0.143226)0.831828经比较,新加入X1的方程2R=0.866053,改进最大,而且各个参数的t检验显著,选择保留X1,再加入其它新变量逐步回归,在命令栏中依次输入:LSYCX2X1X3,LSYCX2X1X4,保存结果,整理结果如表4.4所示。表4-4加入新变量的回归结果(二)变量变量X1X2X3X42RX2,X1,X30.603269(1.652919)0.227087(5.630196)0.024860(0.439370)0.862078X2,X1,X40.773017(2.741794)0.237243(5.833838)-1.364110(-0.701920)0.863581当加入X3或X4时,2R均没有所增加,且其参数是t检验不显著。从相关系数可以看出X3、X4与X1、X2之间相关系数较高,这说明X3、X4引起了多重共线性,予以剔除。当取α=0.05时,tα/2(n-k-1)=2.048,X1、X2的系数t检验均显著,这是最后消除多重共线性的结果。修正多重共线性影响后的模型为^Y=0.711446X1+0.230304X2(0.265507)(0.039088)t=(2.679575)(5.891959)R2=0.8749832R=0.866053F=97.98460DW=1.893654在确定模型以后,进行参数估计表4-5消除多重共线性后的回归结果DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:47Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.C-4316.82412795.42-0.3373730.7384X10.7114460.2655072.6795750.0122X20.2303040.

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功