生产函数估计与预测方法介绍一、生产函数的估计1.含义我们在《经济学》课程的学习中已经知道,产量是由生产要素的投入数量和组合关系决定的。那么生产函数的估计实际就是客观反映生产量与各生产要素投入量之间的函数关系。2.方法与步骤估计生产函数最常用的方法是利用实际收集到的一组数据进行回归分析,这种方法较为客观,通过它得到的信息比较完全和精确。为了完成回归分析,我们必须首先构造一个生产函数并确定函数的具体形式;然后再在收集数据的基础上用回归分析方法求出函数的具体参数值;最后,我们还需要检验回归结果对数据的拟合程度,以及回归分析的前提条件是否成立,因为一个没有显著函数关系或回归分析前提条件不成立的回归分析结果是没有意义的。(1)影响变量的选取就一个具体的回归分析而言,各个变量必须具有特定的含义。在进行回归分析时,我们应该对于研究对象具有深入的了解,否则在函数构造这一步可能会漏掉一些很重要的解释变量。在进行回归分析时应注意不要漏掉重要的解释变量,但这并不意味着解释变量越多越好,因为在模型中包括一些并不重要的解释变量反而会引起一些统计上的问题,一般来说,当解释变量超过5至6个时,就可能降低模型的自由度,甚至引起多重共线性问题,这些都会影响到模型的解释力。对于一些属性因素,如年龄、季节、性别等,如不同的属性表现对被解释变量有明显不同的影响时,还需设计虚拟变量。(2)生产函数形式的确定上面所构造的生产函数只涉及了变量的选取,但为了完成回归分析,我们必须确定生产函数的具体形式。生产函数可采用多元线性的,但一般最常用的是柯布—道格拉斯生产函数2211bbXAXY(3)数据的收集当模型的具体形式已经确定下来之后,我们需要针对模型中的变量收集样本数据。数据类型包括时序数据和截面数据。回归分析中也会碰到数据不足的情况,这时我们就不得不做一些理论上简化,(4)建立回归方程及参数估计1)一元线性回归模型①总体回归模型如果两个变量在总体上存在线性回归关系,可以用下式表示bxaY—随机误差公式中a,b是总体回归模型的参数,是X变量以外其它所有影响因素对Y值的总合影响,故称随机干扰项。如果在一定时期内一些因素的单独影响都比较零散、微弱,就可以不把它们单独列为自变量,而合并为一个随机因素。在一个模式中是否存在随机误差,体现了确定型依存关系和统计型依存关系的区别。随机误差体现了在X取既定值时Y的变异。②假定前提a.是随机变量对应于某个X既定值,的符号和绝对值的大小是随机的,它既独立于X的取值,也独立于前一项值。b.服从正态分布影响Y的其它因素的作用趋于互相抵消,E()=0,Y的期望值落在总体回归线上,在给定X值后,Y值围绕Y的期望值呈正态分布。c.对于任何X值,有恒定的方差2,xy(同方差性)。无论X取什么值,Y值围绕总体回归线的变异程度相同。③总体回归直线方程与样本回归直线方程如果从总体回归函数,xY中排除,就得到表示Y值随X取值而定的正态分布期望值与X值关系的方程—总体回归直线方程bxaxy,上式表明,在X的值给定的条件下,Y的期望值是X的严密的线性函数。xy,称为Y的条件平均数,对于一个双变量协变总体,当自变量X取特定值时,因变量取值服从如下正态分布),(~2,,xyxyNY根据样本数据拟合的直线,称为样本回归直线。ttxbayˆˆˆ,t=1,2,……式中Y是样本回归线上与X相对应的Y值,可视为xy,的估计,称为Y的估计值或拟合值,aˆ为截距,bˆ为斜率,表示当X变化1个单位时Y的变化量,它们是总体回归系数a,b的估计值。实际观测到的变量Y值,并不完全等于yˆ,如果用e表示两者之差,它与总体误差项相对应tttyYeˆe称为残差由上述可知,样本回归直线是对总体回归直线的近似反映。回归分析的主要任务就是采用适当的方法,充分利用样本所提供的信息,使得样本回归直线尽可能地接近真实的总体回归直线。④回归模型参数的估计a.回归系统的估计根据样本资料确定样本回归方程时,一般总希望Y的估计值从整体来看尽可能接近实际观测值。即残差te的总量越小越好,为了避免te简单的代数和会相互抵消,也便于数学上的处理,通常采用残差平方和2te作为衡量偏差的尺度。最小二乘法就是根据这一思路,通过使残差平和和为最小来估计回归系数的一种方法。222)ˆˆ()ˆ(tttttxbaYyYeQ很明显,残差平方和Q的大小将依赖于aˆ和bˆ的取值。根据微积分求极小值的原理,Q对aˆ和bˆ的偏导必须为零。ttttttYXXbXaYXban2ˆˆˆˆ2)())((xxxxxxbiii或22)(ˆttttttxxnYXYXnbXbYanXbYattˆaˆ,bˆ的具体数值即回归系数的估计值随选取的样本不同而不同,所以它是随机变量。b.总体方差的估计除了a,b之外,一元线性回归模型还包括了另一个未知参数,总体方差2,xy,它可以反映理论模型误差的大小。在数学上,2,xy的无偏估计是2,xyS。2)(222,nyYneSxyn为样本容量,xyS,称为估计标准误差。它可用于描述用样本数据拟合回归直线时,在X取特定值时Y观察值对于相应的拟合值的离散程序。c.最小二乘估计量的性质最小二乘法是估计方法中的一种,最小二乘估计量是总体回归系数的无偏估计量,数学上还可进一步证明,在所有的无偏估计量中回归系数的最小二乘估计量的方差最小;同时随着样本容量的增大,其方差会不断缩小,所以它又是最优和一致估计量。2)多元线性回归模型现实中,某一现象的变动常受多种现象变动的影响,右这种场合,仅仅考虑单个变量是不够的,这就产生了测定多因素之间相关关系的问题。研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,它是一元线性回归模型的扩展,其基本原理与一元线性回归模型相类似,只是在计算上比较繁琐。①总体回归函数与总体回归直线tktktttxxx2211ktktxyxx11.表示截距,j表示在其它自变量保持不变的情况下,自变量jx变动一个单位所引起的因变量Y平均变动的数额,成为偏回归系数。②前提假定与一元线性前提假定相同,另外再加上,回归模型所包含的自变量之间不能具有较强的线性关系。③样本回归方程ktkttxxY11ˆˆˆ(t=1,2,……n)④模型的估计以三元线性回归方程为例,即tttxxY2211a.回归系数的估计(最小二乘法)2221122)ˆˆ()ˆ(ttttttxxYYYeMinQ22211222122111122112ˆˆˆˆˆˆˆˆˆxxxxYXxxxxYXxxnYb.总方差的估计kneSty2212.n:样本容量,k:方程中回归系数的个数22,nyS称为回归估计的标准误差,越小表明样本回归方程的代表性越强3ˆˆˆ22112,nYxYxYYSxy3)非线性回归模型如果因变量和自变量之间是非线性关系,我们就必须采用非线性回归模型,但对非线性回归模型的估计必须首先将其转化为线性函数,然后再利用先行回归方法估计各参数。非线性回归模型主要有以下几种:①幂函数2211bbxaxY两边取对数,得:2211lnlnlnlnxbxbaY令:YYlnaAln11lnxx,22lnxx221xbxbAY这种形式就是前面的三元线性回归方程。利用前文所述方法估计模型参数。特点:方程中的参数可以直接反映因变量Y对于某一个自变量的弹性。YxaxbYXxaxbYXXYZbbbbxy/)(/)(2121112111211111=1b即,b1是在其它因素不变的条件下,x1变动1%所引起Y变动的百分比。②指数型:2121xxbabY两边取对数,得:2211lnlnlnlnbxbxaY令YYlnaAln11lnbB22lnbB,则2211xBxBAY③多项式函数32dxcxbxaY令:xx122xx33xx321dxcxbxaY非线性回归方程转化为线性回归方程后,可利用前文所述方法,估计各参数,最后利用反函数转化为最初形式。(5)回归模型的检验1)经济学检验经济学检验主要是检验参数估计值的符号和取值区间所显示的自变是与应变量的变化关系是否与理论和人们的实践经验相一致。2)统计学检验利用统计学中的抽样理论来检验样本回归方程的可靠性。a.拟合程度的评价所谓拟合程度,是指样本观测值聚在样本回归线周围的紧密程度,判断回归模型拟合程序优劣最常用的数量指标是可决系数,该指标是建立在对总离差平方和进行分解的基础上。tttttteYYYYYYYY)ˆ()ˆ()ˆ()(总离差=可解释离差+未解释离差两边取平方,得)ˆ)(ˆ(2)ˆ()(22tttttYYYYeYYYY22)ˆ()ˆ(ttYYYYSSESSRSST离差平方和=回归平方和+残差平方和显而易见,如果各个样本观察点与样本回归直线靠得越紧,SSR在SST中所占比重超越大,因此可定义这一比例为可决系数。222)()ˆ(11YYYYSSTSSESSTSSRrttt102r可决系数越大,方程拟合度越高,在多元线形回归方程中,为了更准确地衡量回归方程的拟合程度,常使用经调整的多元可决系数。22,2221)1/()ˆ()/()ˆ(1yxySSnYYknYYR)1/())((222nnYYSYn为样本容量,k为模型中回归系数的个数。b.显著性检验。i.回归系数的显著性检验主要目的是为了检验与各回归系数对应的自变量对因变量的影响是否显著,以便对自变量的取舍作出正确判断,一般来说,当发现某个自变量的影响不显著时,应将其从模型中删除。这样才能够做到以尽可能少的自变量去达到尽可能高的拟合优度。回归系数的检验主要是对各自变量斜率的检验。检验y和Xj之间是否具备一定的线性回归关系就是判断总体斜率j是否等于0,如果j=0,则Y对Xj的回归不成立。因此关于j假设检验将以j=0的零假设出发,分为以下步骤:(i)提出假设0:0jH零假设0:1jH备择假设显著水平05.0(ii)检验统计量及概率分布因为tY是服从正态分布,jˆ也服从正态分布),0(~ˆ2jNj一般来说,2j是未知的,我们用其无偏估计量jSˆ来代替,当样本为小样本时,回归系数的估计值服从t(kn)分布。那么用t检验统计量jStjjˆ0ˆ(iii)判断,查表得.)(knt,其值由显著水平和自由度kn决定,如果.)(knttj,则拒绝H0,即认为Xj对Y的影响是显著的。如果).(knjtt,则接受原假设,即认为Xj对Y的影响是不显著的。ii.回归方程的显著性检验多元线性回归模型包括了多个回归系数,所以还需对整个回归方程模型进行显著性检验,以检验回归模型总体函数的线性关系是否显著,这主要是在方差分析基础上采取F检验完成的。(i)0:210kHjH:1不全为0(ii)进行方差分析,列出回归方差分析表离差名称平方和自由度均方和回归平方和残差平方和总离差平方和2)ˆ(YYSSRt2teSSE2)(YYSSTtk-1n-k(n-1)SSR/(k-1)SSE/(n-k)(iii)根据方差分析的结果求F统计量,即)()1(knSSEkSSRF~),1(knnf(iv)根据自由度和给定的显著性水平,查F分布表中的理论临界值F,当FF,拒绝原假设,即认为总体回归函数中各自变量与因变量的线性回归关系显著。反之认为所建立的回归模型没意义。3)经济计量学检验在回归分析之前,我们提出了一些回归型的假设