非线性回归和主成分分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

双曲函数模型双对数模型单对数模型对数模型模型幂函数模型和指数函数多项式回归模型、可线性化的回归模型试算法散点法识别不可化为线性可化为线性种类类与识别、非线性回归模型的种非线性回归模型21一非线性回归模型的建模目的(1)实际的需要。实际中,许多经济变量的关系式非线性的。(2)建模目的的需要。例如:建立弹性分析模型,进行弹性分析;为克服模型残差可能存在的异方差需要建立对数模型;为克服模型自相关需要改变模型形式等。这章的主要介绍几种常用的可线性化的一般非线性回归模型和非线性趋势回归模型的建立方法。二非线性回归模型的识别方法法一:散点图法画出应变量与解释变量的散点图,根据图形识别模型形式。法二:试算法对散点图识别出来的几种模型进行试算。选择R2最大的且MAPE最小的。结合三可线性化的非线性回归模型方法:将非线性回归模型转化为线性回归模型后,用OLS法估计参数。3.1多项式回归模型tktktttexxxyˆˆˆˆ2210基本形式:对于此模型,参数估计步骤如下:kkxqxqxq,,,221令(1)线性化kqqq,,,21在工作文件窗口分别用Genr命令生成新变量:得到标准的线性回归方程:),,,(ˆˆˆˆnteqqqytktkttt2122110(2)估计参数建立回归方程。应用OLS法估计参数建立回归方程在公式栏中输入回归命令:LSycq1q2q3···qK得到k个解释变量的多元线性回归方程:),,,(ˆˆˆˆˆntqqqyktkttt2122110各种参数检验是对此模型的检验(3)还原与应用。还原为原变量的回归方程:),,,(ˆˆˆˆntxxxyktkttt212210已知某公司G产品的产量Q(万件)、总成本TC(万元)的样本数据列于案例3中,试建立该产品的总成本模型和平均成本模型。散点图(1)模型识别。画出总成本TC与产量Q的散点图从直观上看出有TR与Q为非线性函数,根据平均成本与产量之间呈U形曲线的理论,总成本模型应该是三次多项式模型:对模型线性化,使用eviews6.0的OLS法估计参数,模型的输出结果见下图:),,,(ˆˆˆˆ152132210ieQQQTCitkiii步骤1:导入数据。步骤2:在工作文件窗口输入:lstccqq^2q^3,得到结果如图1所示,由图1容易看出,c的t检验的概率为0.10.05,不通过t检验。步骤3:在工作文件窗口输入:lstcqq^2q^3,得到结果如图2所示,由图2容易看出,所有变量的t检验都通过。步骤4:在结果窗口可得到模型的拟合与残差分布图,可以看出模型的拟合效果较好。可以得到总成本模型:图1图3图2GraphsidualFittedActualsidualFittedActualviewRe,,Re,,3i-52iiiQ*10264.58215851+Q*0.04323-Q*97.488=TC二、幂函数模型此为非线性模型,所以要线性化,再用ols法估计参数。步骤如下:1)线性化(取对数)。tttexylnlnˆˆlnln102)设变量。令exqyzln,ln,ˆlnˆ,ln00得线性回归模型:tttqz10ˆˆ3)估计参数。用OLS法,得到估计的回归方程LSzcq4)还原。),,,(ˆˆntexyttt2110幂函数回归模型:财政支出具有两面性,其规模既可提高国民经济的增长速度,也可拟制其增长速度,其规律呈倒U形,近似为凹函数,具有最优值。本案例利用常被使用的自然效率原理研究我国财政支出最优规模。(1)原理与模型。以C—D生产函数为基础,建立我国财政支出最优规模模型。应该写为:ttttGLAKGDP式中,Kt为资本存量,Lt为劳动力人数,Gt为财政支出最优规模,为待估参数。,,首先,两边取自然对数,可得双对数模型:其次,在EViews的工作文件窗口输入:log(GDP)clog(k)log(L)log(G).可得到如图4所示的模型的结果,由结果可以看出log(l)的t检验没有通过,但是为了研究劳动力人数对GDP的影响,可去掉常数c,之后的结果如图5所示。ttttGLKAGDPlnlnlnlnln图4图5图6由图5所示模型的回归方程为:进而画出模型的拟合图和残差分布图,如图6所示。由图6可以看出模型的拟合效果较好。(2)还原。将上式的左右两边取以e为底的指数函数可以得到C-D函数生产模型,如下式所示:(2)结论。有上面两式可以看出GDP的增长与K(资本的存储量)的关系最为密切,GDP对固定资本的形成总额K的弹性系数为0.811,对劳动力L的弹性系数为0.211,说明在样本期内我国的国民经济属于资本拉动型。)LN(G*0.199)LN(L*0.211)LOG(K*0.811)LN(GDPttttGLKGDP0.199t0.211t0.811tt弹性:是指一个变量对另一个变量的敏感程度或反应性。它定量的描述了一个变量x相对变化百分之一时,引起另一个y相对变化百分之几。四、对数模型对数模型分为双对数模型和单对数模型两种。1、双对数模型tttexylnˆˆln10(一元双对数模型)tktktttexxxylnˆlnˆlnˆˆln22110(多元双对数模型)这种双对数模型主要用于弹性分析,应用十分广泛。2、单对数模型。(1)应变量y为对数形式的单对数模型。tttexy10ˆˆln式中是应变量y的增长率。1ˆ应变量为对数形式,而解释变量为趋势变量t的单对数模型,称为对数—趋势模型。1、主成分分析的产生背景当多元回归的模型存在多重共线性,又希望所有解释变量对应变量的影响,即不想采用提出解释变量的方法克服多重共线性时,主成分回归是较好的克服多重共线性的方法。2、主成分分析简介主成分是将k个具有一定先关关系的解释变量,组合成新的相互独立的p(pk)个综合变量,并用其来代替原来的k个解释变量,同时能够尽可能多的反应全体解释变量的信息,这种综合变量就是全体解释变量的主成分Fi(i=1,2,…,p)。通常,主成分是k个解释变量的线性组合,而这些解释变量的线性组合可能有很多,应该如何选取呢?选取的准则:对于第一个主成分F1,自然希望F1能尽可能多的包含k个解释量的信息,信息用Var(F1)表示,信息越多,Var(F1)就越大。因此选择所有解释变量的线性组合中使得Var(F1)最大的,作为第一主成分,同理可以考虑第二主成分,为了有效的反映原来的信息,F1包含的信息不能出现在F2,这就要求Var(F1,F2)=0,以此类推,可以得到第三,第四,…,第p个主成分。显然这些主成分间不相关,且他们的方差依次递减。下面通过一个案例演示一下什么时候需要使用主成分分析,以及如何利用EViews实现主成分分析。财政收入的规模对于一个国家来说有着十分重要的意义,它是国家宏观调控的基础。本案例通过在政策之后、风险管理、税收规模和财政支出规模优化进行定量分析进而找到我国财政收入的主要因素。1、变量与样本数据(1)确定变量。应变量:财政收入(TRt);解释变量:税收总额(TAXt)、国内生产总值(GDPt)、固定投资额(TZt)、社会零售总额(CLt)、进出口总额(IEt)、实际利用外资源(WZt)、一级1978年为基数的居民消费价格基数(P78t)七大指标。为消除物价影响,用P78t对名义数据经行平减,固定意义下变量:TRPt=TRt/P78t;TAXPt=TAXt/P78t;GDPPt=GDPt/P78t;TZPt=TZt/P78t;CLPt=CLt/P78t;IEPt=IEt/P78t;WZPt=WZt/P78t(2)使用EView软件,利用变量TRPt、TAXPt、GDPPt、TZPt、CLPt、IEPt、WZPt和P78t建立多元回归模型。进行参数估计和检验,最后确定影响我国财政收入的主要因素。(3)样本数据。根据可获得性原则,利用1978~2005年的年度数据,样本本数据来自《中国统计年鉴.2006》,样本数据列于“计量数据”的D3.1中。步骤一:利用EViews建立影响财政收入的多元回归模型。首先,导入数据,然后,在工作文件的命令行输入:lstrpctaxpgdpptzpclpiepwzpp78p,可以得到多元回归模型的结果如图1所示。由图1可以看出,TAXP、TZP、CLP、IEP的t检验都没有通过,并且有5个解释变量的系数为负,和我们的经济理论不一致。因此,我们猜想这些解释变量间可能存在多重共线性。图1步骤二:求解释变量间的相关系数矩阵。首先,在变量窗口选中所有的解释变量,单击右键选择openasgroupviewcovarianceanalysis图2弹出如图2所示的对话框,选则correlation,就会弹出如图3所示的相关系数矩阵。由图3容易看出,按临界值0.95考虑,CLP与IEP、TAXP、TZP之间强相关等等。图3为了考虑每一个解释变量对GDPP的影响,因此不能提出解释变量。因此我们需要利用主成分分析的方法来消除多重共线性。步骤三:主成分分析。在步骤二的全体解释变量窗口选择Viewprinciplecomponent,弹出如图四所示的对话框,选择显示主成分的个数为2,以及展示为Table的形式。可以得到如图5所示的结果。图4图4图5图5可以分为两个部分(实际图表还有一块相关系数矩阵)。上面是主成分1,2对应的特征值、方差,贡献率和累计贡献率。下面是主成分1,2的特征向量。从第一部分可以看出,主成分1的贡献率已达到89.36%,即反应了7个解释变量85%的信息,故只需取第一个主成分。由下半部分主成分1的特征向量可写出第一主成分的表达式:ttttttttWZPTZPTRPTAXPPIEPCLPF*.*.*.*.*.*.*.3350394038003880783560389039801由上式可以得出:社会零售总额(CLt)对GDP(实际的GDP)的贡献最大,达到35.1%。固定投资额(TZt)、税收总额(TAXt)、进出口总额(IEt)对GDP的贡献相当,实际利用外资源(WZt)对GDP的贡献最低。步骤4:求主成分回归回归方程。利用Genr命令根据主成分1的公式生成主成分F1,建立GDPP与F1的回归模型:输出结果如图6所示。建立LGDP对F1的回归方程:1ttF*0.8812.58-GDPP图6将F1代入可求得主成分回归方程:ttttttttWZPTZPTRPTAXPPIEPCLPGDPP*******.0.2960.3480.3350.342780.3150.3430.3515812

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功