回归分析练习题及参考答案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

11下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元北京辽宁上海江西河南贵州陕西224601122634547485154442662454973264490115462396220816082035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性(0.05)。(6)如果某地区的人均GDP为5000元,预测其人均消费水平。(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解:(1)可能存在线性关系。(2)相关系数:2系数a模型非标准化系数标准系数tSig.相关性B标准误差试用版零阶偏部分1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000.998.998.998a.因变量:人均消费水平有很强的线性关系。(3)回归方程:734.6930.309yx系数a模型非标准化系数标准系数tSig.相关性B标准误差试用版零阶偏部分1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000.998.998.998a.因变量:人均消费水平回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4)模型汇总模型RR方调整R方标准估计的误差1.998a.996.996247.303a.预测变量:(常量),人均GDP。人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。模型摘要模型RR方调整的R方估计的标准差1.998(a)0.9960.996247.303a.预测变量:(常量),人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%3(5)F检验:Anovab模型平方和df均方FSig.1回归81444968.680181444968.6801331.692.000a残差305795.034561159.007总计81750763.7146a.预测变量:(常量),人均GDP。b.因变量:人均消费水平回归系数的检验:t检验系数a模型非标准化系数标准系数tSig.相关性B标准误差试用版零阶偏部分1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000.998.998.998a.因变量:人均消费水平%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(6)某地区的人均GDP为5000元,预测其人均消费水平为734.6930.30950002278.693y(元)。(7)人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399],预测区间为[1580.46315,2975.74999]。2从n=20的样本中得到的有关回归结果是:SSR(回归平方和)=60,SSE(误差平方和)=40。要检验x与y之间的线性关系是否显著,即检验假设:01:0H。(1)线性关系检验的统计量F值是多少?(2)给定显著性水平0.05,F是多少?(3)是拒绝原假设还是不拒绝原假设?4(4)假定x与y之间是负相关,计算相关系数r。(5)检验x与y之间的线性关系是否显著?解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;因此:F=1SSRkSSEnk=6014018=27(2)1,18F=0.051,18F=4.41(3)拒绝原假设,线性关系显著。(4)r=SSRSSRSSE=0.6=0.7746,由于是负相关,因此r=-0.7746(5)从F检验看线性关系显著。3随机抽取7家超市,得到其广告费支出和销售额数据如下:超市广告费支出/万元销售额/万元ABCDEFGl24610142019324440525354求:(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。(2)检验广告费支出与销售额之间的线性关系是否显著(0.05)。(3)绘制关于x的残差图,你觉得关于误差项的假定被满足了吗?(4)你是选用这个模型,还是另寻找一个更好的模型?解:(1)系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a.因变量:销售额(万元)(2)回归直线的F检验:ANOVA(b)模型平方和df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.0555合计1,002.0006a.预测变量:(常量),广告费支出(万元)。b.因变量:销售额(万元)显著。回归系数的t检验:系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a.因变量:销售额(万元)显著。(3)未标准化残差图:广告费支出(万元)20151050UnstandardizedResidual10.000005.000000.00000-5.00000-10.00000-15.00000__标准化残差图:6广告费支出(万元)20151050StandardizedResidual1.000000.00000-1.00000-2.00000学生氏标准化残差图:7广告费支出(万元)20151050StudentizedResidual2.000001.000000.00000-1.00000-2.00000看到残差不全相等。(4)应考虑其他模型。可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)。84根据下面SPSS输出的回归结果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,并根据F,se,R2及调整的2aR的值对模型进行讨论。模型汇总b模型RR方调整R方标准估计的误差10.8424070.7096500.630463109.429596Anovab模型平方和df均方FSig.1回归321946.80183107315.60068.9617590.002724残差131723.19821111974.84总计45367014系数a模型非标准化系数tSig.B标准误差1(常量)657.0534167.4595393.9236550.002378VAR00002VAR00003VAR000045.710311-0.416917-3.4714811.7918360.3221931.4429353.186849-1.293998-2.4058470.0086550.2221740.034870解:自变量3个,观察值15个。回归方程:ˆy=657.0534+5.710311X1-0.416917X2-3.471481X3拟合优度:判定系数R2=0.70965,调整的2aR=0.630463,说明三个自变量对因变量的影响的比例占到63%。估计的标准误差yxS=109.429596,说明随即变动程度为109.429596回归方程的检验:F检验的P=0.002724,在显著性为5%的情况下,整个回归方程线性关系显著。回归系数的检验:1的t检验的P=0.008655,在显著性为5%的情况下,y与X1线性关系显著。2的t检验的P=0.222174,在显著性为5%的情况下,y与X2线性关系不显著。93的t检验的P=0.034870,在显著性为5%的情况下,y与X3线性关系显著。因此,可以考虑采用逐步回归去除X2,从新构建线性回归模型。5下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位:元)。企业编号销售价格y购进价格x1销售费用x2l23456789101112131415l238l266l200119311061303131311441286l084l120115610831263124696689444066479185280490577l51150585l659490696223257387310339283302214304326339235276390316求:(1)计算y与x1、y与x2之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?(2)根据上述结果,你认为用购进价格和销售费用来预测销售价格是否有用?(3)求回归方程,并检验模型的线性关系是否显著(0.05)。(4)解释判定系数R2,所得结论与问题(2)中是否一致?(5)计算x1与x2之间的相关系数,所得结果意味着什么?(6)模型中是否存在多重共线性?你对模型有何建议?解:(1)y与x1的相关系数=0.309,y与x2之间的相关系数=0.0012。对相关性进行检验:相关性销售价格购进价格销售费用销售价格Pearson相关性10.3090.001显著性(双侧)0.2630.997N151515购进价格Pearson相关性0.3091-.853(**)显著性(双侧)0.2630.000N151515销售费用Pearson相关性0.001-.853(**)110显著性(双侧)0.9970.000N151515**.在.01水平(双侧)上显著相关。可以看到,两个相关系数的P值都比较的,总体上线性关系也不现状,因此没有明显的线性相关关系。(2)意义不大。(3)回归统计MultipleR0.593684RSquare0.35246AdjustedRSquare0.244537标准误差69.75121观测值15方差分析dfSSMSFSignificanceF回归分析231778.153915889.083.2658420.073722残差1258382.77944865.232总计1490160.9333Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%(常量)375.6018339.4105621.106630.290145-363.911115.114-363.911115.114购进价格x10.5378410.210446742.5557110.02520.0793170.9963650.0793170.996365销售费用x21.4571940.667706592.1823860.0496810.0023862.9120010.0023862.912001从检验结果看,整个方程在5%下,不显著;而回归系数在5%下,均显著,说明回归方程没有多大意义,并且自

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功