1影响农业总产值相关因素的分析(经济学院2003级博士生刘良灿吴文元)一、问题的提出由于农业生产的特点,决定了农业生产过程中各种生产要素的投入量与产出之间、生产要素与生产要素之间、产品与产品之间的数量关系十分复杂。因此,反映这种复杂关系的生产函数也是多种多样的。生产函数按数学形式进行区分,主要有线性生产模型和非线性生产模型两大类。线性函数模型主要用于描述和反映经济变量之间的线性关系;而非线性函数模型主要用于描述和反映经济变量之间的非线性关系。应用生产函数模型对农业生产过程中投入产出的数量分析,可以为生产决策提供可靠的经济依据。同时还由于对农业生产的经济问题加强了数量研究,这就为我们把握和控制农业经济的运行变化规律提供了可能,从而使农业经济学科更好地为农业生产服务。由于非线性函数模型在分析过程中较为复杂,本文采用了线性函数模型进行农业产出的相关因素分析。而且在实际的农业经济分析中,线性生产函数模型得到了广泛的应用。二、解释变量的确定在农业生产过程中生产要素与产量的关系表现在两个方面,一方面是生产要素对产量的影响,另一方面是生产要素之间的配合比例对产量的影响。制约农业生产发展的因素是多种多样的,但是在众多的因素中总有一些因素对发展农业生产起着主导的决定性的作用。因此,解决主导因素成为发展农业生产的关键。根据我们初步的理论分析,选取以下五个因素作为可能的解释变量,分别如下(包括其含义的解释):(1)农业机械总动力(万千瓦):指主要用于农、林、牧、渔业的各种动力机械的动力总和。包括耕作机械、排灌机械、收获机械、农用运输机械、植物保护机械、牧业机械、林业机械、渔业机械和其他农业机械〔内燃机按引擎马力折成瓦(特)计算、电动机按功率折成瓦(特)计算〕。不包括专门用于乡、镇、村、组办工业、基本建设、非农业运输、科学试验和教学等非农业生产方面用的动力机械与作业机械。(2)单位面积谷物产量(公斤/公顷):指单位耕地面积上的谷物产量。(3)农作物播种面积(千公顷):指实际播种或移植有农作物的面积。凡是实际种植有农作物的面积,不论种植在耕地上还是种植在非耕地上,均包括在农作物播种面积中。在播种季节基本结束后,因遭灾而重新改种和补种的农作物面积,也包括在内。(4)农用化肥施用量(万吨):指本年内实际用于农业生产的化肥数量,包括氮肥、磷肥、钾肥和复合肥。化肥施用量要求按折纯量计算数量。折纯量是指把氮肥、磷肥、钾肥分别按含氮、含五氧化二磷、含氧化钾的百分之一百成份进行折算后的数量。复合肥按其所含主要成分折算。(5)乡村劳动力数量(万人):指在乡村从事农业生产活动的劳动力数量。三、模型的设定-我们采用多元线性回归模型对农业总产量及其相关因素进行数量分析。回归2模型是研究相关变量之间变化规律的一种数学方法,它把大量的不确定的相关关系转化为确定的函数关系。通过回归模型的计测,不仅可以指出在现有技术水平条件下所能达到的产量水平及其资源消耗量,而且还可以根据生产要素之间的合理配置,确定获得最大收益的生产模式。本文的模型设定如下:y=β1+β2x1+β3x2+β4x3+β5x4+β6x5+ui其中:y——农业总产值(亿元)β1——模型的截距项x1——农机机械总动力(万千瓦)x2——单位面积谷物产量(公斤/公顷)x3——农作物播种面积(千公顷)x4——化肥使用量(万吨)x5——乡村劳动力数量(万人)四、数据的收集由于本文选用了5个可能的解释变量,《中国统计年鉴》有关这5个指标的数据达不到计量经济学关于样本容量大小的最低要求(即要求至少有30个样本数据)。故本文采用截面数据来进行模型估计。本文的数据来源于2003年《中国统计年鉴》。采用我国2002年31个省、市、自治区的农总产值及农机机械总动力、单位面积谷物产量、农作物播种面积、化肥使用量和乡村劳动力数量等几个指标。表12001年中国各省、区、市农业总产值及相关因素一览表名称X1(万千瓦)X2(公斤/公顷)X3(千公顷)X4(万吨)X5(万人)Y(亿元)北京3955194386.415.767.989.7天津603.34820544.517.38186.7河北2744.440258990.8273.41665899.4山西1767.528063672.384.9658191.3内蒙古1423.638545707.379.3518.4307.6辽宁1401.348913964.8109.8649503.1吉林1096.551254890.1114.1514.3405.9黑龙江1648.345129989.2123.2742.5540.6上海133.97320490.920.383.295.5江苏2957.963027777.43381452.31142.7浙江2017.260823245.990.3985.1529.5安徽316548298733.1280.71975.6688福建888.850892713.1117.4760.4433.2江西100252335534.7109.7977.4405.9山东7689.6526811266.1428.62434.31401.3河南6078.7490713127.7441.73472.31331.6湖北1469.258857489245.31143.7658.3湖南235860157931.7184.32058.7665.7广东1760.253605193.1195.11566.4817.9广西1552.446566288.1168.11555.1439.9海南212.24169871.727179.9141.3重庆628.144483555.972.6884.6250.43四川1735.147599571.52122582.6769.9贵州647.942364650.7701368.3279.9云南1397.839235929.61201689.4431.3西藏123.25044230.9388.827.6陕西1099.830954331.9131.1985.9337.4甘肃112229053688.966.1696.8254青海264.733615297.2141.628.9宁夏407.640441007.624.6151.749.4新疆880.957713404.183.3321348.8(数据来源:中国统计信息网,2002年《中国统计年鉴》电子版)五、模型估计及检验(一)、初步回归分析利用Eviews软件,用OLS方法对模型进行参数估计,其结果如下:表2初步回归结果此回归方程的可决系数为0.95346,说明模型拟合较好。当取显著水平a=0.05,查t分布表得ta/2(n-6)=t0.025(25)=2.060.因为|tβ1|=1.7180932.06,所以接受H0:β1=0,同理,β2、β4、β6也接受H0,即常数项β1、x1的系数β2、x3的系数β4、、x5的系数β6都通不过t检验。只有x2和x4系数β3、β5通过t检验。查F分布表得临界值F0.05(k-1,n-k)=F0.05(5,25)=2.62,由于此回归方程的F=102.43422.62,则拒绝H0,说明从整体上看解释变量与被解释变量之间的线性关系显著。查D—W表得,dL=1.09,dU=1.825,这时有dUd=2.7404674-du,表明不存在一阶自相关,这在很大程度上是由于本文选取的是截面数据的原因。(二)、多重共线性检验从初步回归结果的t值可看出,x1、x3、x5系数均不显著,即使x2、x4的系数4也不是非常显著。但是从调整可决系数(AdjustedR-squared=0.944152)来看,模型整体上比较显著,所以该模型可能存在多重共线性,需要对其进行检验。1、解释变量之间的相关系数如下:表3x1,x2,x3,x4,x5相关系数变量名称X1X2X3X4X5X110.1283059800.7996748250.9024925930.786342460X20.12830598010.0782378280.2164575490.090625242X30.7996748250.07823782810.8908613570.879363314X40.9024925930.2164575490.89086135710.868133219X50.7863424600.0906252420.8793633140.8681332191从表中各变量之间的相关系数可以看出x1与x3、x1与x4、x1与x5、x3与x4、x3与x5、x4与x5之间都存在较严重的线性相关性。2.多重共线性调整过程:调整的基本思路为:先用y分别对各解释变量进行单独回归,找出其中调整可决系数最大的解释变量作为第一次调整保留的变量;以此变量为基础再分别对剩下的解释变量进行二元回归,找出一个比第一次调整可决系数大的变量作为要保留的解释变量(如有几个变量的调整可决系数比第一次保留解释变量的调整可决系数都大,那么就选择其中系数最大的那一个);以此类推,直到全部新的调整可决系数比上一次最大的要小,从而确定模型的基本解释变量。第一次回归结果:名称X1X2X3X4X5调整可决系数0.7872960.0526430.766630.9378050.717077第一次回归选择x4第二次回归结果:名称X1X2X3X5调整可决系数0.9371260.9428420.9369700.936084故第二次回归选择x4,x2第三次回归结果:名称X1X3X5调整可决系数0.9436980.9446270.942409故第三次回归选择x2,x3,x4第四次回归结果:名称X1X5调整可决系数0.9460870.942730故第四次回归选择x1,x2,x3,x4第五次回归:和x5回归得到的调整可决系数为:0.944152,小于上面的0.946087,所以模型不应该包括x5这个解释变量。根据多重共线性检验结果,我们应该选择x1,x2,x3,x4作为解释变量。以x1,x2,x3,x4作为解释变量进行回归,结果如下:5表4y对x1,x2,x3,x4的回归结果由回归结果看出,x1,x3仍通不过t检验。如果选取t值较理想的x2、x4作为解释变量进行回归,结果如下:表5y对x2、x4的回归结果回归结果中x2又通不过t检验。从以上分析看来,似乎模型不太合理。但是我们进行另外的尝试,用y对x1,x2,x3,x4的不同组合进行回归,比较结果。x1,x2,x3,x4的其它组合都不太理想,只有x1,x2,x3组合最为理想,其回归结果如下:6表6y对x1,x2,x3的回归结果相对于前面的回归结果来看,尽管调整可决系数和F值有所降低,但它的t值明显提高了(前面模型的t值有通不过检验的)。总的来看,选取x1,x2,x3作为解释变量较为合理。(三)、异方差检验因为本文采用的是截面数据,故在异方差检验中没必要进行ARCH检验。White(无交叉项)检验结果如下:表7White检验7在显著水平为0.05的条件下,查χ2分布表得到临界值χ0.052(6)=12.5916。而从上表中可看出,nR2=9.007823χ0.052(6)=12.5916,则接受H0:辅助回归方程的各个系数均为0(不包括它的截距项为0)。另外,从上表也可以看出,辅助回归方程各自变量系数的t值均不显著,说明模型中随机误差u不存在异方差。附:ARCH检验结果如下:表8ARCH检验结果也表明不存在异方差。(四)、自相关检验1、检验从表6可以看出,D-W值为2.666422。在α=0.05的显著水平下(本模型的样本容量n=31,解释变量个数kˊ=3),查表得dL=1.229,dU=1.650。因为4-dUD-W4-dL,这表明该模型不能确定是否存在自相关。需要进行进一步修正。2、修正应用Cochrane-Orcutt迭代法进行修正,结果如下:表9Cochrane-Orcutt迭代法修正结果8经过调整,其D-W值变为2.291942,与未修正时的D-W值(2.666422)相比,有了明显好转。这时dUD-W4-dU,表