应用回归分析课程设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

课程设计报告课程:应用回归分析学号:姓名:班级:12金统教师:周勤江苏师范大学科文学院《应用回归分析》课程设计指导书一、课程设计的目的1.加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握SPSS常用统计软件的应用。2.通过学习达到熟练掌握一元线性回归建模过程,熟悉一元线性回归建模步骤;掌握模型选择,参数估计,模型检验,模型优化和模型预测的方法。3.掌握诊断序列自相关性(或异方差性)的方法,并能给出消除自相关性(或异方差性)的方法。4.能够根据历史数据,对未来走势作出预测;可以处理一些简单的经济问题。二、设计名称:检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。三、设计要求1.数据来源要真实,必须注明数据的出处。2.尽量使用计算机软件分析,说明算法或过程。3.必须利用到应用回归分析的统计知识。4.独立完成,不得有相同或相近的课程设计。四、设计过程1.思考研究课题,准备搜集数据。2.确立课题,利用图书馆、上网等方式方法搜集数据。3.利用机房实验室等学校给予的便利措施开始分析处理数据。4.根据试验结果,写出课程设计报告书。5.对实验设计报告书进行完善,并最终定稿。五、设计细则1.利用的统计学软件主要为SPSS,因为其方便快捷,功能也很强大,界面美观。2.对Word文档进行编辑的时候,有些特殊的数学符号需要利用Mathtype这款小软件进行编辑。3.数据来自较权威机构,增加分析的准确性与可靠性。4.力求主题突出,观点鲜明,叙述简洁明了。六、说明1.数据来源于江苏统计年鉴2013;2.所选取数据可能不会涉及到所学的各种分析方法,本课程设计最后会对此情况作出解释。3.本课程设计中,取显著性水平为=0.05,对于分析中需要用到的数据做加粗处理课程设计任务书姓名学号班级12金统课程名称应用回归分析课程性质专业课设计时间2014年5月26日——2014年6月2日设计名称检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。设计要求1.掌握线性回归方程的建立及回归方程的显著性检验的法;并能解决建模中遇到的问题,最终给出预测。2.通过实验加深理解应用回归分析在实践中的应用意义。设计思路与设计过程设计思路:为了对线性回归方程的建立及回归方程的显著性检验进行分析。先对理论部分进行掌握,再搜集数据,然后对数据进行分析处理。设计过程:①先对相关定理和结论进行整理②搜集数据③用统计软件对数据进行处理④对结果进行分析计划与进度5月26日—5月28日:先对相关定理和结论进行整理,并搜集数据;5月29日—5月31日:用统计软件对数据进行处理,调整;6月1日—6月2日:对结果进行分析,定稿。任课教师意见说明设计名称:检验1949年-2012年农林牧渔业总产值和农业产值之间的关系。日期:2014年6月1日设计内容:单位(亿元)年份农林牧渔业总产值农业林业畜牧业渔业农林牧渔服务业194922.5919.41…3.020.16195231.8726.140.035.000.70195736.8130.100.225.251.24196240.1534.190.324.481.16196557.2747.020.638.251.37197071.3357.080.8511.761.64197591.6672.171.4715.552.471976100.7182.531.3114.862.01197789.1673.051.2512.901.961978105.8785.171.4816.782.441979145.25114.262.0325.773.191980138.45105.981.9426.653.881981153.62119.902.0027.114.611982188.11145.691.9635.804.661983206.86160.383.3036.666.521984253.82193.284.3347.179.041985288.55201.854.6366.5415.531986332.66235.075.1569.8322.611987380.25257.906.0287.9528.381988497.95310.207.29140.4939.971989522.25325.027.02148.1342.081990580.53362.467.94160.7849.351991580.93354.427.55168.3050.661992673.82411.339.93188.6463.921993875.37518.5514.61236.81105.4019941335.23777.9418.38390.70148.2119951686.78986.1521.42475.67203.5419961693.761062.3923.48368.54239.3519971816.371085.2622.56430.57277.9819981849.201096.8824.16435.51292.6519991837.431095.1326.13413.95302.2220001869.731096.0230.17430.53313.0120011956.101142.6630.76448.51334.1720022011.481165.4936.29456.02353.6820031952.20981.2531.49458.87371.56109.0320042417.631242.4140.16563.44449.47122.1520052576.981291.0645.27599.14511.86129.6520062718.611416.9154.26544.48543.39159.5720073064.721542.5358.88704.38579.00179.9420083590.641746.8364.92916.46665.75196.6920093816.021948.2070.79873.97719.25203.8120104297.142269.5678.12923.25805.25220.9520115237.452640.9592.811190.501060.44252.7420125808.812966.7299.741226.181235.40280.77(1)画散点图(2)x与y之间是否大致呈线性关系(3)用最小二乘估计求出回归方程(4)求回归标准误差ˆ(5)给出0ˆ与1ˆ的置信度为95%的区间估计(6)计算x与y的决定系数(7)对回归方程作方差分析(8)作回归系数0,1显著性分析(9)做相关系数的显著性检验(10)用线性回归的plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。设计目的与要求:1.加深理解本课程的研究方法、思想精髓,提高解决实际问题的能力,熟练掌握SPSS常用统计软件的应用。2.通过学习达到熟练掌握一元线性回归建模过程,熟悉一元线性回归建模步骤;掌握模型选择,参数估计,模型检验,模型优化和模型预测的方法。3.掌握诊断序列相关性(或异方差性)的方法,并能给出消除自相关性(或异方差性)的方法。设计环境或器材、原理与说明:设计环境器材:统计实验室、SPSS软件、EXCEL软件等原理与说明:1、一元线性回归模型的一般形式设随机变量y与一般变量x的线性回归模型为y=01x0称为回归常数,称为回归系数。是随机误差,我们常假定2()0var()E2、F检验对随机变量y是否有明显的影响。为此提出原假设01H0:构造F检验统计量如下/1/(2)SSRFSSEn在正态假设下,当原假设01H0:成立时,F服从自由度为(1,n-2)的F分布。3、t检验t检验是统计推断的一种方法,因此,检验回归系数是否显著,等价于检验假设111:0:0oHH如果接受原假设oH,则x不显著;如果拒绝原假设oH,则x是显著的。在一元线性回归中,回归系数显著性的t检验与回归方程显著性的F检验是等价的。4、拟合优度拟合优度用于检验回归方程对样本观测值的拟合程度。样本决定系数2/rSSRSST,样本决定系数2R的取值在[0,1]区间内,2R越接近1,表明回归拟合的效果越好;2R越接近0,表明回归拟合的效果越差。与F检验相比,2R可以更清楚直观地反映回归拟合的效果,但是并不能作为严格的显著性检验。5、通过画散点图我们可以从中观察出样本变量间是否有线性关系6、用普通最小二乘估计和最大似然估计可以对参数0,1进行估计7、关于残差图:一般认为,如果一个回归模型满足所给出的基本假定,所有残差是在=0附近随机变化,并在变化幅度不大的一条子带内。若e随x的增大而减小,则为异方差。6、消除异方差:一元加权最小二乘估计法:用自变量的幂函数的倒数形式作为权数对原模型进行加权:1mwixi设计过程(步骤)或程序代码:1.确定模型(1)散点图:图形---旧对话框---散点/点状(2)回归方程:分析---回归---线性2.模型检验:(1)相关系数:分析---相关---双变量3.残差检验:(1)散点图:图形---旧对话框---散点/点状4.模型预测:(1)模型预测:分析—回归—线性—保存—预测—为标准化分析—回归—线性—统计量—保存—预测区间—均值5.消除异方差:分析—回归—权重估计—因变量,自变量,将自变量输入权重变量,确定。设计结果与分析:一,确定模型:一元线性回归是描述两个变量之间统计关系的最简单的回归模型。拿到一组数据,在建立回归模型之前,通常先做出其散点图,直观地判断一下它们之间的数量关系,进而选择合适的理论回归模型。(1)我们以农业产值为横轴,以农林牧渔业总产值为纵轴,做出散点图。图形如下。(2)通过散点图我们看出样本数据点(,)iixy大致分别落在一条直线附近。这说明变量x与y之间具有明显的线性关系。进而,我们可以选择一元线性回归模型来拟合此例。(3)我们以农业产值为自变量ix,以农林牧渔业总产值为因变量iy,做线性回归拟合,得到如下模型:系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)-107.90224.426-4.417.000-157.196-58.607农业1.967.023.99783.857.0001.9202.015a.因变量:农林牧渔业总产值由回归系数表,可得一元线性回归方程:xy967.1902.107(4)模型汇总b模型RR方调整R方标准估计的误差更改统计量R方更改F更改df1df2Sig.F更改1.997a.994.994116.30261.9947031.956142.000a.预测变量:(常量),农业。b.因变量:农林牧渔业总产值由模型汇总表可得回归标准误差:116.30261^(5)系数a模型非标准化系数标准系数tSig.B的95.0%置信区间B标准误差试用版下限上限1(常量)-107.90224.426-4.417.000-157.196-58.607农业1.967.023.99783.857.0001.9202.015a.因变量:农林牧渔业总产值由回归系数表可得回归系数:0ˆ的95%置信区间为[-157.196,-58.607]1ˆ的95%置信区间为[1.920,2.015](6)由模型汇总表得x与y的决定系数:994.02r二,检验模型:当我们得到一个实际问题的经验回归方程01yx后,还不能马上就用它去做分析和预测,因为01yx是否真正描述了变量y与x之间的统计规律性,还需运用统计方法对回归方程进行检验。(7)Anovab模型平方和df均方FSig.1回归95116318.610195116318.6107031.956.000a残差568104.4544213526.297总计95684423.06443a.预测变量:(常量),农业。b.因变量:农林牧渔业总产值由方差分析表可得F=

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功