第二章简单线性回归模型

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章简单线性回归模型思考题2.1相关分析与回归分析的关系是什么?2.2什么是总体回归函数和样本回归函数?它们之间的区别是什么?2.3.什么是随机扰动项带口剩余项(残差)?它们之间的区别是什么?2.4.为什么在对参数做最小二乘估计之前,要对模型提出古典假定?2.5.总体方差和参数估计方差的区别是什么?2.6为什么可决系数可以度量模型的拟合优度?在简单线性回归中它与对参数的t检验的关系是什么?2.7有人说:“得到参牧区间估计的上下限后,说明参数的真实值落入这个区间的概率为1-a”,如何评论这种说法?2.8对参数假设检验的基本思想是什么?2.9为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽?2.10如果有人利用中国1978-2000年样本估计的计量经济模型直接预测:“中国综合经济水平将在2050年达到美国2002年的水平.”你如何评论这种预测?2.11对本章开始提出的:“中国旅游业总收入将超过3000亿美元”,你认为可以建立什么样的简单线性模型去分析?练习题2.1为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据(表2.9)。表2.9深圳市地方预算内财政收入与国内生产总值的关系(单位:亿元)年份地方预算内财政收入Y国内生产总值(GDP)X19901991199219931994199519961997199819992000200121.703727.309142.959967.250774.399288.0174131.7490144.7709164.9067184.7908225.0212265.6532171.6665236.6630317.3194449.2889615.1933795.6950950.04461130.01331289.01901436.02671665.46521954.6539资料来源:深圳统计年鉴2002.中国统计出版社1)建立深圳地方预算内财政收入对GDP的回归模型.2)估计所建立模型的参数,解释斜率系数的经济意义;3)对回归结果进行检验;4)若2005年的国内生产总值为3600亿元,试确定2005年财政收入的预测值和预测区间(α=0.05)。2.2某企业研究与发展经费和利润的数据见表2.10。分析企业研究与发展经费和利润额的相关关系,并做回归分析。表2.10某企业研究与发展经费和利润的数据(单位:万元)年份1995199619971998199920002001200220032004研究与发展101088121212121111经费利润额1001502001802503002803103203002.3为研究中国的货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相互依存关系,分析1990~2001年中国货币供应量(M2)和国内生产总值(GDP)的有关数据(表2.11)。表2.111990~2001年中国货币供应量{Mz)和国内生产总值{GDP}的有关数据年份货币供应量M2/亿元国内生产总值GDP/亿元19901529.318598.4199119349.925402.221662.5199226651.9199334879.834560.5199446923.546670199560750.557494.9199676094.966850.5199790995.373142.71998104498.576967.21999119897.980579.42000134610.388228.12001158301.994346.4资料来源:中国统计年鉴2002.中国统计出版社,51.662对货币供应量与国内生产总值做相关分析,并说明分析结果的经济意义。2.4表2.12是某年16种公益股票每股账面价值和当年红利。表2.12某年16种公益股票每股账面价值和当年红利公司序号帐面价值(元)红利(元)公司序号帐面价值(元)红利(元)122.442.4912.140.8220.892.981023.311.94322.092.061116.233414.481.09120.560.28520.731.96130.840.84619.251.551418.051.8720.372.161512.451.21826.431.61611.331.07根据表2.12资料:1)建立每股账面价值和当年红利的回归方程;2)解释回归系数的经济意义;3)若序号为6的公司的股票每股账面价值增加1元,估计当年红利可能为多少?2.5美国各航空公司业绩的统计数据公布在〈华尔街日报1999年年鉴〉(TheWallStmetJournalAlmanac1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如表2.13所示。表2.13美国各航空公司航班正点到达的比率和每10万名乘客技诉的次数航空公司名称航班正点率/%投诉率/(次/10名乘客)西南(Southwest)航空公司大陆(Continental)航空公司西北(Northwest)航空公司美国(Usairways)航空公司联合(United)航空公司美洲(American)航空公司德尔塔(Delta)航空公司美国西部(Americawest)航空公司环球(Twa)航空公司81.876.676.675.773.872.271.270.868.80.210.580.850.680.740.930.721.221.25资料来源:[美]DavidR.Anderm等.商务与经济统计.机械工业出版社,4051)画出这些数据的散点图。2)根据散点图,表明二变量之间存在什么关系?3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程。4)对估计的回归方程的斜率做出解释。5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?2.6研究青春发育与远视率(对数视力)的变化关系,测得结果如表2.14所示。表2.14青毫发育与远视率(对数视力}的变化关系年龄x/岁远视率y/%对数视力Y=lny678910111213141516171863.6461.0638.8413.7514.508.074.412.272.091.022.513.122.984.1534.1123.6592.6212.6742.0881.4840.820.7370.020.921.1381.092试建立曲线回归方程ˆˆ(ln)bxyaeYabx并进行计量分析。2.7为研究美国软饮料公司的广告费用X与销售数量Y的关系,分析七种主要品牌软艾料公司的有关数据(表2.15)。表2.15美国软饮料公司广告费用与销售数量品牌名称广告费用X(百销售数量Y(百万美元)万箱)Coca-ColaClassic131.31929.2Pepsi-Cola92.41384.6Diet-Coke60.4811.4Sprite55.7541.5Dr.Pepper40.2546.9MoutainDew29535.67-Up11.6219.5资料来源:[美]DavidR.Andemn等.商务与经济统计.机械工业出版社,405分析广告费用对美国软饮料公司销售影响的数量关系。2.8从某公司分布在11个地区的销售点的销售量(Y)和销售价格(X)观测值得出以下结果:X=519.8Y=217.822iX=3134543iiXY=12968362iY=5395121)做销售额对价格的回归分析,并解释其结果。2)回归直线未解释的销售变差部分是多少?2.9表2.16是中国1978-1997年的财政收入Y和国内生产总值X的数据。表2.16中国国内生产总值及财政收入(单位:亿元)年份国内生产总值X财政收入Y19783624.11132.2619794038.21146.3819804517.81159.9310814860.31175.7910825301.81212.3319835957.41366.9519847206.71642.8619858989.12004.82198610201.42122.01198711954.52199.35198814992.32357.24198916917.82664.9199018598.42937.1199121662.53149.48199226651.93483.37199334560.54348.951994466705218.1199557494.96242.2100666850.57407.99199773452.58651.14数据来源:中国统计年鉴试根据这些数据完成下列问题。1)建立财政收入对国内生产总值的简单线性回归模型,并解释斜率系数的经济意义;2)估计所建立模型的参数,并对回归结果进行检验;3)若1998年的国内生产总值为78017.8亿元,确定1998年财政收入的预测值和预测区间(α=0.05)。第二章习题解答1.回答下列问题(1)为什么在对参数进行最小二乘估计之前,要对模型提出古典假定?答:在古典假定条件下,OLS估计得到的参数估计量是该参数的最佳线性无偏估计,具有无偏性、有效性、线性。总之,作古典假定是为了使所作出的估计具有较好的统计性质和方便地进行统计推断。(2)什么是总体回归函数和样本回归函数,它们之间的区别是什么?答:将总体应变量的条件期望表示为解释变量的某种函数,这个函数就称为总体回归函数,其一般表达式为:)()/(iiXfXYE,当然通常的表达式为:iiiuXfY)(,其中iu为随即扰动项。样本回归函数:将应变量Y的样本观测值的条件均值表示为解释变量的某种函数。样本回归函数是总体回归函数的一个近似。总体回归函数具有理论上的意义,但其具体的参数不可能真正知道,只能通过样本估计。样本回归函数就是总体回归函数的参数用估计的值替代之后的形式。(3)什么是随机误差项和残差,它们之间的区别是什么?答:随机误差项iu=iY-)/(iXYE。当把总体回归函数表示成iiieYY时,其中的ie就是残差。它是用iY估计iY时带来的误差iiiYYe,是对随机误差项iu的估计。(4)总体方差与参数估计方差的区别是什么?答:总体方差反映总体的波动情况,对一个特定的总体而言,是一个确定的值。在最小二乘估计中,由于总体方差在大多数情况下并不知道,所以用样本数据去估计:)/(22knei。其中n为样本数,k为待估参数的个数。是线性无偏估计,为一个随机变量。2.可决系数2R说明了什么?在简单线性回归中它与斜率系数的t检验的关系是什么?答:可决系数是对模型拟合优度的综合度量,其值越大,说明在Y的总变差中由模型作出了解释的部分占得比重越大,模型的拟合优度越高,模型总体线性关系的显著性越强。反之亦然。斜率系数的t检验是对回归方程中的解释变量的显著性的检验。在简单线性回归中,由于解释变量只有一个,当t检验显示解释变量的影响显著时,必然会有该回归模型的可决系数大,拟合优度高。3.有n组观测值(Xi,Yi)i=1,2,…,n,用最小二乘法将Y对X回归得XY21,将X对Y回归得YX21,这两条直线是否一致?在什么条件下一致?答:不一定一致。当二者互为反函数时,即当1=1/1,2=-1/2时是一致的。4.说明显著性检验的意义和过程。答:显著性检验分模型的拟合优度检验和变量的显著性检验。前者主要指标为可决系数以及修正可决系数,后者主要通过计算变量斜率系数的t统计量进行检验。。。。。表2-9给出1986-2000年期间国内产品的GDP评价因子和进口商品的GDP平价因子,GDP平价因子常用来代替消费者物价指数(CPI)作为通货膨胀的指标。该国是一个小而开放经济的国家,在很大程度上依赖国外贸易以求得生存。为了研究国内与世界物价的关系,下面给出两个模型:

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功