STAT第11章回归预测一、回归预测概述二、回归预测的一般步骤三、一元线性回归预测四、实例分析STAT一、回归预测概述•回归预测法是指从各种经济现象之间的相关关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测法。•回归预测以因果关系为前提,预测对象称为因变量,相关的分析对象称为自变量。STAT⒈出租汽车费用与行驶里程:总费用=行驶里程每公里单价PKG⒉家庭收入与恩格尔系数:考虑家庭收入、消费支出结构。函数关系:指现象间所具有的严格的确定性的依存关系。相关关系:指客观现象间确实存在,但数量上不是严格对应的依存关系。比较下面两种现象间的依存关系STAT相关分析与回归分析研究现象间相关关系的两种方法相关分析:是用一个指标(相关系数)来表明现象间相互依存关系的密切程度。回归分析:是根据相关关系的具体形态,选择一个合适的数学模式,来近似地表达自变量和因变量之间的数量变化关系,进而确定一个或几个变量的变化对另一个特定变量的影响程度。STAT相关分析与回归分析的关系联系区别①相关分析是回归分析的基础和前提;②回归分析是相关分析的深入和继续。因此,只有把两者结合起来,才能达到统计分析的目的。①相关分析只研究变量间是否存在关系及关系的密切程度;回归分析研究的是变量间存在的是什么关系。②相关分析不必区分自变量与因变量,所研究变量属于对等关系;回归分析必须区分自变量和因变量,所研究变量属于非对等关系。STAT定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度相关关系的测定STAT正相关负相关曲线相关不相关xyxyxyxy又称散点图,用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。相关图STAT例某市1996年—2003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。序号年份工资性现金支出(万元)x城镇储蓄存款余额(万元)y119965001202199754014031998620150419997302005200090028062001970350720021050450820031170510100200300400500400500600700800900100011001200工资性现金支出(万元)城镇储蓄存款余额(万元)STAT在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示2222222)(yynxxnyxxynnyynxxnyyxxSSSryxxy相关系数STAT相关系数r的取值范围:-1≤r≤1r0为正相关,r0为负相关;|r|=0表示不存在线性关系;|r|=1表示完全线性相关;0|r|1表示存在不同程度线性相关:|r|0.4为低度线性相关;0.4≤|r|<0.7为显著性线性相关;0.7≤|r|<1.0为高度显著性线性相关。STAT是相关系数的平方,用表示;用来衡量回归方程对y的解释程度。2r102r判定系数取值范围:2r越接近于1,表明x与y之间的相关性越强;越接近于0,表明两个变量之间几乎没有直线相关关系.2r判定系数STAT2222)()(yynxxnyxxynr判定系数与相关系数的关系2rr))(())(()(222222yynxxnyxxynrSTAT种类1.按照表现形式不同分为2.按照变化方向不同分为直线相关曲线相关负相关正相关相关分析的种类STAT回归分析的种类一元回归(简单回归)多元回归(复回归)线性回归非线性回归一元线性回归SimpleLinearregression按自变量的个数分⒈按回归曲线的形态分⒉STAT•回归分析根据自变量的多少分为一元回归分析、二元回归分析与多元回归分析。•因此,如果研究的因果关系只涉及一个因变量和一个自变量,这种回归分析法称为一元线性回归。STAT二、回归预测的步骤第一步:判断变量之间是否存在相关关系第二步:确定因变量与自变量第三步:建立回归预测模型第四步:对回归预测模型进行评价第五步:利用回归模型进行预测,分析评价预测值STAT三、一元线性回归预测•一元线性回归预测是在一个因变量与一个自变量之间进行的线性相关关系的回归预测。•一元线性回归的基本步骤如下:第一步:绘制散点图,观察自变量与因变量之间的相互关系;第二步:建立一元线性回归模型;第三步:对预测模型进行检验;第四步:进行预测。STAT1、建立模型对于经判断具有线性关系的两个变量y与x,构造一元线性回归模型为:XY为随机误差项为模型参数,与式中:假定E()=0,有总体一元线性回归方程:XYEYˆSTAT一元线性回归方程的几何意义)(YEXXYˆ截距斜率截距表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数表明自变量x每变动一个单位,因变量y平均变动个单位。STAT例如某市1996年—2003年的工资性现金支出与城镇储蓄存款余额的资料。y=-199.498+0.5858x表明该市工资性现金支出每增加1万元,储蓄存款余额就增加0.5858万元。序号年份x(万元)y(万元)x2y2xy119965001202500001440060000219975401402916001960075000319986201503844002250093000419997302005329004000014600052000900280810000784002520006200197035094090012250033950072002105045011025002025004725008200311705101368900260100596700合计6480220056812007600002035300STAT2.模型检验•相关系数检验相关系数是描述两个变量之间线性关系能密切程度的数量指标。•t检验:利用t统计量来检验回归参数a和b是否具有统计意义。STAT样本相关系数r的显著性检验(t检验法)⒈提出假设:0:0:10HH目的检验总体两变量间线性相关性是否显著步骤⒉构造检验统计量:)2(~122ntrnrtSTAT相关系数的显著性检验(t检验法)⒊根据给定的显著性水平,确定临界值;2t⒌计算检验统计量并做出预测和决策。22ntt⒋确定原假设的拒绝规则:22ntt若,则接受H0,表示总体两变量间线性相关性不显著;若,则拒绝H0,表示总体两变量间线性相关性显著步骤STAT序号能源消耗量(十万吨)x工业总产值(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计916625550862617537887四、实例分析STAT9520.09757.09757.0625261751691655086166259163788716)(26175,55086,37887,625,916,162222222222ryynxxnyxxynryxxyyxn解:已知结论:工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量x的变化能够解释工业总产值y变化的95.2﹪。【例】计算工业总产值与能源消耗量之间的相关系数及判定系数资料STAT【分析】因为工业总产值与能源消耗量之间存在高度正相关关系(),所以可以拟合工业总产值对能源消耗量的线性回归方程。9520.0,9757.02rr【例】建立工业总产值对能源消耗量的线性回归方程资料,55086,37887,625,916,162xxyyxn由计算表知解:设线性回归方程为bxayˆSTAT5142.6169167961.0166257961.091655086166259163788716222xbyaxxnyxxynb即线性回归方程为:xy7961.05142.6ˆ计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。STAT【例】检验工业总产值与能源消耗量之间的线性相关性是否显著资料线性相关性显著。,表示总体的两变量间拒绝有:0025.0221448.21426616.166616.169757.012169757.0Htnttt00:H0:0:,05.0,9757.0,1610HHrn提出假设:则解:已知当成立时,则统计量)2(~122ntrnrtSTAT能源消耗量807060504030工业总产值6050403020SPSS输出结果(一)STATModelSummary.976a.952.9492.4567Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),能源消耗量a.ANOVAb1676.44011676.440277.761.000a84.498146.0361760.93815RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),能源消耗量a.DependentVariable:工业总产值b.方差分析表SPSS输出结果(二)STATCoefficientsa-6.5162.803-2.325.036.796.048.97616.666.000(Constant)能源消耗量Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:工业总产值a.SPSS输出结果(三)