国内生产总值与第一、二产业的关系国内生产总值(GDP),指按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果.第一产业是指农业、林业、畜牧业、渔业和农林牧渔服务业.第二产业是指采矿业,制造业,电力、煤气及水的生产和供应业,建筑业.改革开放以来,我国的经济增长方式和产业结构发生了重大变化,第一、第二产业的发展对国内生产总值增长所起的作用也发生了变化。数据来自《中国统计年鉴2008》,选取我国1978-2007年国内生产总值与第一、二产业的数据.根据数据绘制数据变化趋势如下.05000010000015000020000025000030000019701980199020002010年份产值国内生产总值第一产业第二产业从图中可以直观地发现,国内生产总值与第一、二产业存在着一定的相关关系.利用国内生产总值作为因变量Y,第一产业、第二产业作为自变量X1、X2,做多元线性回归分析,得到结果.ANOVAb1.36E+01126.82E+01015268.310.000a120598704274466618.71.37E+01129回归残差合计模型1平方和df均方F显著性预测变量:(常量),第二产业x2,第一产业x1。a.因变量:国内生产总值yb.系数a-516.794794.031-.651.521.811.219.0943.712.0011.895.053.90835.795.000(常量)第一产业x1第二产业x2模型1B标准误非标准化系数Beta标准化系数t显著性因变量:国内生产总值ya.得到的回归方程为21895.1811.0794.516XXY显著性P值Sig=0.000,说明回归方程高度显著.对回归系数作显著性检验,可以看出,X1、X2单独对因变量Y有显著性影响,最大的P值为0.0010.05.模型摘要1.000a.999.9992113.43764模型1RR方调整的R方估计的标准差预测变量:(常量),第二产业x2,第一产业x1。a.复相关系数R=1,决定系数R2=0.999,估计的标准差为2113.43764,小于回归平方和(1.36e+11),说明拟合效果较好.即可以以99.9%以上的概率断言自变量X1、X2对因变量Y产生显著性线性影响.通过检验.当一个回归问题存在异方差性时,如果仍用普通最小二乘方法估计未知参数,将引起不良后果,特别是最小二乘估计量不再具有最小方差的优良性,即最小二乘估计的有效性被破坏了.残差图是一种直观、方便的分析方法.它以残差e为纵坐标,以其他适宜的变量为横坐标画散点图.如果回归模型适合于样本数据,那么残差e反映误差项所假定的性质,残差e应该在e=0附近随机变化,并在变化幅度不大的一个范围内,因此可以根据残插图来判断回归模型是否具有某些性质.分别画出X1、X2的残差图.第一产业x130000.0025000.0020000.0015000.0010000.005000.000.00UnstandardizedResidual6000.000004000.000002000.000000.00000-2000.00000-4000.00000第二产业x2120000.00100000.0080000.0060000.0040000.0020000.000.00UnstandardizedResidual6000.000004000.000002000.000000.00000-2000.00000-4000.00000由上面两个图可看出,残差e值随x值的增大而增大,具有明显的规律,因而可认为模型的随机误差项的方差是非齐次的,存在异方差.当问题存在异方差性时,线性回归模型的基本假定就被违反了,这时,就不能用普通最小二乘法进行参数估计,必须对原来的模型进行变换,使变换之后的模型满足同方差性假设,然后进行模型参数的估计,就可以得到理想的回归模型.加权最小二乘法(weightedleastsquare,WLS)是一种最常用的消除异方差性的方法.计算等级相关系数如下.相关系数1.000.690**..0003030.690**1.000.000.3030相关系数Sig.(双侧)N相关系数Sig.(双侧)N第一产业x1abseSpearman的rho第一产业x1abse在置信度(双测)为0.01时,相关性是显著的。**.相关系数1.000.689**..0003030.689**1.000.000.3030相关系数Sig.(双侧)N相关系数Sig.(双侧)Nabse第二产业x2Spearman的rhoabse第二产业x2在置信度(双测)为0.01时,相关性是显著的。**.从输出结果看出,残差绝对值abse与X1的相关系数r1e=0.69,与X2的相关系数r2e=0.689,r1er2e,因而选取X1作为权函数作用变量.对数似然值b-299.281-292.183-285.050-277.893-270.750-263.714-256.956-250.724-245.325a-2.000-1.500-1.000-.500.000.5001.0001.5002.000幂选择对应幂以用于进一步分析,因为它可以使对数似然函数最大化。a.因变量:国内生产总值y,源变量:第一产业x1b.模型描述国内生产总值y第一产业x1第二产业x2第一产业x12.000因变量12自变量源幂值权重模型:MOD_1.把幂指数改为5对数似然值b-340.927-334.103-327.233-320.314-313.348-306.337-299.281-292.183-285.050-277.893-270.750-263.714-256.956-250.724-245.325-241.349-240.008a-242.446-248.298-256.273-265.489-5.000-4.500-4.000-3.500-3.000-2.500-2.000-1.500-1.000-.500.000.5001.0001.5002.0002.5003.0003.5004.0004.5005.000幂选择对应幂以用于进一步分析,因为它可以使对数似然函数最大化。a.因变量:国内生产总值y,源变量:第一产业x1b.模型描述国内生产总值y第一产业x1第二产业x2第一产业x13.000因变量12自变量源幂值权重模型:MOD_2.35,保存最优权作为新的变量.再次回归模型摘要b,c.999a.999.999.00151模型1RR方调整的R方估计的标准差预测变量:(常量),第二产业x2,第一产业x1。a.因变量:国内生产总值yb.加权最小二乘回归-加权值为WLS、MOD_3...第一产业X1**-3.000中国内生产总值y的权重c.估计的标准差为0.00151,与加权前(2113.43764)相比减少了很多,说明选用加权最小二乘估计是正确的.系数a,b-567.90570.496-8.056.000.776.091.1468.499.0001.914.038.86350.352.000(常量)第一产业x1第二产业x2模型1B标准误非标准化系数Beta标准化系数t显著性因变量:国内生产总值ya.加权最小二乘回归-加权值为WLS、MOD_3...第一产业X1**-3.000中国内生产总值y的权重b.ANOVAb,c.0522.02611549.955.000a.00027.000.05329回归残差合计模型1平方和df均方F显著性预测变量:(常量),第二产业x2,第一产业x1。a.因变量:国内生产总值yb.加权最小二乘回归-加权值为WLS、MOD_3...第一产业X1**-3.000中国内生产总值y的权重c.加权最小二乘估计的回归方程是21914.1776.0905.567XXY回归方程及回归系数的显著性均为0.000,说明高度相关,通过检验.相关性a1.000.943.998.9431.000.924.998.9241.000..000.000.000..000.000.000.303030303030303030国内生产总值y第一产业x1第二产业x2国内生产总值y第一产业x1第二产业x2国内生产总值y第一产业x1第二产业x2Pearson相关性显著性(单侧)N国内生产总值y第一产业x1第二产业x2加权最小二乘回归-加权值为WLS、MOD_3...第一产业X1**-3.000中国内生产总值y的权重a.1yr=0.943,2yr=0.998,说明第一产业和第二产业对国内生产总值影响较大.回归系数1.9140.776,说明从1978年,也就是改革开放以来,第二产业对国内生产总值影响比第一产业要大.画出第一、第二产业在国内生产总值中所占比例的散点图如下.00.10.20.30.40.50.619701980199020002010年份比例第一产业第二产业由上图可看出,自改革开放以来,第二产业在国内生产总值中所占的比例有所上升,而第一产业所占的比例则在逐年下降.第二产业是对第一产业和本产业提供的产品(原料)进行加工的部门,如采矿业,制造业,建筑业等等.自改革开放以来,为了满足建设“四个现代化”的装备需要,一些工业品取代农牧产品,如合成纤维等.随着人民生活水平的提高,消费者扩大了对工业品的需要,如农村市场大量买进彩电、洗衣机、电冰箱等家用电器.由于消费的增加,引起能源的需求增加,从而促进了煤炭、炼油等能源工业的发展.农业是国民经济的基础,但我国农业发展的现状是基础薄弱,高投入,低产出.大量农村劳动力开始转向打工一族,投入到第二产业.应该按照按照科学发展观全面协调可持续的基本要求,发展高产、优质、高效的农业,走增加质量与效益相统一,发展生产与保护环境相促进的生态环保型农业发展道路.参考文献[1]何晓群刘文卿应用回归分析北京中国人民大学出版社