第五章线性模型的扩展

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第五章线性回归模型的扩展第一节非线性回归模型一、可线性化模型(1)倒数变换模型模型:011yx0111yx可以设:1xx,1yy进行变量的倒数变换,就可以将其转化成线性回归模型,所以该模型为倒数变换模型。观察:倒数变换模型有一个明显特征:经济学中哪些经济现象有类似的变动特征?(平均固定成本曲线,菲利普斯曲线等。)例:某地十六年中化学工业投资与相应年份的国民生产总值的统计数据如下表所示:X表示国民生产总值,Y表示化工总投资,用双曲函数模型表示两个变量之间的非线性关系0111iiiuYX年份国民生产总值(X)化工总投资(Y)年份国民生产总值(X)化工总投资(Y)123456785.235.635.946.356.887.537.968.680.0160.0150.0160.0190.0250.0290.0280.0289101112131415169.359.8210.6311.7113.0614.1315.1616.920.0310.0340.0340.0350.0440.0560.0620.066(2)双对数模型(幂函数模型)模型:01lnylnx设:,ylnyxlnx因为,1dlnydlnx恰好就是被解释变量关于解释变量x的弹性(3)半对数模型模型:01yInx01Inyx2这些模型中的回归系数1的含义也很明确。(4)多项式模型模型:2012.....kkyxxx进行变量间的代换后,可以将之转化成为多元线性回归模型。例:为了分析某行业的生产成本情况,从该行业中选取了10家企业,表中列出了这些企业总产量X(吨)和总成本Y(万元)的有关资料,试建立该行业的总成本函数和边际成本函数。总成本Y19.322.624.024.425.726.027.429.735.042.0总产量X102030405060708090100二、不可线性化模型用高斯——牛顿迭代法估计非线性回归模型(两种做法进行比较)例:我国国有企业生产函数。我国国有独立核算工业企业的非线性模型如何估算?运用C——D生产函数:YALKe我国国有独立核算工业企业统计资料年份时间t工业总产值Y(亿元)职工人数L(万人)固定资产K(亿元)1978197919801981198219831984198519861987198819891990199119921993199412345678910111213141516173289.183581.263782.173877.864151.254541.054946.115586.145931.366601.607434.067721.017949.558634.809705.5210261.6510928.66313932083334348835823632366938153955408642294273436444724521449845452225.702376.342522.812700.902902.193141.763350.953835.794302.254786.055251.905808.716365.797071.357757.258628.779374.34作业:1.某制造厂表面处理车间试验将铬后污水同电解污泥混合,使之生成无毒溶液,效果很好。但实际排出污水的浓度不完全相同,而且一定浓度的定量铬后污水只有同定量的电解污泥混合后,才能反应完全。现通过试验,找出铬后污水用量与电解污泥用量之比对于铬后污水浓度之间的关系。试验数据如下:表3序号X:铬后污水浓度(G/L)Y:铬后污水用量(ML)/电解污泥用量(ML)12345678910113510304050608010012016031020010049403228231614102.某市1980~1996年国内生产总值Y,生产资金K和从业人数L的统计资料如下表所示。分别利用线性化方法和迭代法估计C-D生产函数:0(1)tYArLKe时期时间变量tGDP(亿元)生产资金(亿元)从业人数(万人)19801103.52461.67394.7919812107.96476.32413.0219823114.10499.13420.5019834123.40527.22435.6019845147.47561.02447.5019856175.71632.11455.9019867194.67710.51466.9419878222.00780.12470.9319889259.64895.66465.15198910283.34988.65469.79199011310.951075.37470.07199112342.751184.58479.67199213411.241344.14485.70199314536.101688.02503.10199415725.142221.42513.00199516920.112843.48515.301996171102.103364.34512.00三、回归模型的比较(一)图形观察分析观察被解释变量与解释变量的相关图,可以直观地看出两者的相关程度和相关类型。为设定模型的具体函数形式指出了大致方向。(二)模型估计结果观察分析回归系数的符号和值的大小是否符合经济意义,这是对所估计模型的最基本要求;改变模型形式之后是否使判定系数的值明显提高;各个解释变量的t检验的显著性;系数的估计4误差较小。(三)残差分布观察观察分析残差分布表中,各期残差是否大多数都落在的虚线框内;残差分布是否具有某种规律性;近期残差的分布情况。例:我国税收预测模型的比较分析如下表,列出了我国1985~1998年期间税收收入Y和国内生产总值(GDP)X的统计资料。(单位:亿元人民币)我国税收与GDP统计资料年份税收GDP年份税收GDP1985198619871988198919901991204120912140239127272822299089641020111963149281690918548216181992199319941995199619971998329742555127603869108234926326638346344675958478678857446379396(1)相关图分析:将模型初步设定为指数函数模型、二次函数模型和双对数模型。(2)估计模型。(3)残差分布分析。(4)拟合预测分析。(5)外推预测。作业:为了研究生产率与废料率之间的关系,记录了如下的数据,试根据这些数据拟合适当的模型。(提示:分别用指数曲线和直线拟合,并比较)生产率x(单位/周)1000200030003500400045005000废品率y(%)5.26.56.88.110.210.313.05第二节虚拟变量一、虚拟变量及其作用经济变量的影响因素中间有时还包括一些定性因素,例如,消费习惯、地区差异将直接影响居民的消费支出;劳动者素质、季节因素对产品的生产和销售都会产生影响。舍弃定性因素,一方面不能真实地描述经济变量之间的相关关系,增大模型的设定误差,同时也不能计量这些定性因素的影响。10D,1为城镇居民,0为农村居民10D,1为销售旺季,0为销售淡季10D,1政策紧缩,0为政策宽松10D,1为本科以上学历,0以本科以下学历在计量经济模型中引入虚拟变量有以下作用:(1)可以描述和测量定性因素的影响(2)能够正确反映经济变量之间的相互关系,提高模型的精度。(3)便于处理异常数据;当样本资料中存在异常数据时,一般有三种处理方式,一是在样本容量较大的时候直接剔除异常数据;二是用平均数方式修匀异常数据;三是设置虚拟变量:???虚拟变量的设置有规律吗?练习:中日关系的冷热也是一个定性因素,如果让你设置,你怎么设置呢?表一个局部数据列表个人编号WAGEEDUCFEMALEMARRIED1234……5255253.103.243.006.00……11.563.501112118……16141100……100101……10012wagefemaleeduu问:如果1表示女性,0表示男性,那么1的经济含义是什么呢^-^通过图形来说明。6二、虚拟变量的设定(一)虚拟变量的引入方式:加法方式,乘法方式,一般方式。1.加法方式居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女,教育支出就多一些。10D,1为有适龄子女,0为无适龄子女。将家庭教育费用支出函数取成:012iiiiYXD这样,就形成了两个函数:没有适龄子女家庭的教育费用支出:01iiiYX有适龄子女家庭的教育费用支出:012iiiYX=021()iiX画出样本回归方程的图像可知,以加法方式引入虚拟变量时,反映的是定性因素对截矩的影响,即平均水平的差异情况。以加法方式加入虚拟变量时,暗含着什么意思呢^-^2.乘法方式定性因素的影响不仅表现在截矩上,有时可能还会影响斜率。例如,随着收入水平的提高,家庭教育支出的边际消费倾向可能会发生变化。于是用乘法方式引入,将家庭教育费用支出函数取成:012iiiiYXXD其中,iiiXDXD该支出函数等价于以下两个等式:通过画图可以说明,以乘法方式引入虚拟变量,反映的是定性因素对斜率的影响,系数2描述了定性因素的影响程序。3.一般方式用不同方式引入虚拟变量将反映不同的经济效果,所以最初是大致判断定性因素的影响类型,然后用加法方式或乘法方式在模型中设置虚拟变量。但是在实际应用中,却不是这样。实际做法是:先都引入,再进行回归,对D和XD前的系数进行T检验,决定以什么样的方式来加入。7表:我国城镇居民家庭抽样调查资料关于彩电拥有量收入等级彩电拥有量Y(台/百台)人均收入X(元/年)困难户最低收入户低收入户中等偏下户中等收入户中等偏上户高收入户最高收入户83.6487.0196.75100.90105.89109.64115.13122.542198.882476.753303.174107.265118.996370.597877.6910962。16作法:1.设置虚拟变量。2.以两种方式同时引入,进行回归。3.进行经济解释。(二)虚拟变量的设置原则:一个因素多个类型,多个因素两种类型1.一个因素多个类型例如,某公司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素,应该设置几个虚拟变量呢?(假设以加法形式引入)A方案:2,1,0,iD研究生本科大专以下年薪函数取成:012iiiiYXD方案A好吗?B方案:11,0,D本科其他,21,0,D研究生其他,31,0,D大专以下其他方案B好吗?C方案:好在哪里?总结规律。一个定性因素,M个属性,设M-1个虚拟变量。对上例进行图解说明。课堂练习:已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入哪几个虚拟变量呢?82.多个因素两种类型研究居民住房消费函数时,考虑到城乡差异以及不同收入层次的影响,将消费函数取成:012132iiiiiYXDD其中,Y,X分别是居民住房消费支出和可支配收入,虚拟变量110D,其中,1指农村居民,0指城镇居民210D,其中,1指高收入家庭,0指低收入家庭这样,可以反映各类居民家庭的住房消费情况:四类:因此,如果有M个定性因素,且每个因素各有两个不同的属性类型,则引入M个虚拟变量。三、虚拟变量的特殊应用(一)调整季节变动利用季节资料建立模型时,经常存在着季节波动。例如,利用季度数据分析某公司利润Y与销售收入X之间的相互关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量1,10iID第季度其他

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功