第三章回归分析预测法回归分析概述回归分析与相关分析回归模型种类一元线性回归分析相关系数显著性检验一回归的含义。回归:研究自变量与因变量之间的关系形式的分析方法目的在于根据已知自变量来估计和预测因变量的平均值二回归分析与相关分析1函数关系。2相关关系.a现象间确实存在数量关系。b现象间数量依存关系不是确定的,有一定随机性。相关分析,是研究两个或两个以上随机变量之间相互依存关系的紧密程度。回归分析,是研究某一随机变量与其他一个或几个普通变量之间的数量变动的关系。相关分析研究的都是随机变量,且不分自变量与因变量;回归分析要定出自变量与因变量,且自变量是确定的普遍变量。实践中,一般先进行相关分析,由相关系数决定是否进行回归分析。相关分析与回归分析的主要作用:1通过对数量关系的研究分析,深入认识现象之间的相互依存关系;2通过回归模型进行预测和预报;3用于补充缺少的资料。三回归模型的种类1根据回归模型自变量的多少,分为一元回归模型和多元回归模型。2根据回归模型是否线性,分为线性和非线性回归模型。3根据回归模型是否带虚拟变量,分为普通回归模型和带虚拟变量回归模型。一元线性回归预测法一一元线性回归模型Yi=a+bXi+εi.I=1,2,3…,nε~N(0,σ²),y~(a+bx,σ²)=a+bXi,a和b为回归系数。二OLS估计最小平方法思想,是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列两点要求:1原数列的观察值与模型的估计值的离差平方和为最小,2原数列的观察值与模型的估计值的离差总和为零。公式如下:Yˆ∑(Yi―)²=最小值∑(Yi―)=0Yi代表原数列的观察值;代表模型的估计值。根据最小平方法的要求,即:Q=∑(Yi-)²=∑(Yi-a-bxi)²分别对a和b求偏导,并令其等于零。则有:-2∑(Yi-a-bXi)=0;-2∑(Yi-a-bXi)Xi=0整理后可求出:b=(n∑Xi*Yi-∑Xi∑Yi)/n∑Xi²-(∑Xi)²a=∑Yi/n-b∑Xi/nYˆYˆYˆYˆXXXXXXYYYYYY(a)r=+1(b)r接近于+1(c)r逐渐变小(d)r=0(e)r接近于-1(f)r=-1三相关系数1离差平方和的分解观察值的取值大小是上下波动的,这种现象称为变差,原因有两个:①受自变量变动的影响,即x取值的不同②其他因素的影响。为了分析这两方面的影响,需对总变差进行分解。总变差=∑(Yi-)²,其可分解为,∑(Yi-)²+∑(-)²=∑(Yi-)²,其中∑(Yi-)²表示剩余变差,∑(-)²表示回归变差。YYˆYˆYYYˆYˆY2可决系数R²R²=回归变差/总变差;R²=∑(-)²/∑(Yi-)²,3根据可决系数可以求出相关系数R,当R=0称为零相关,当∣R∣=1称为完全相关,当0|R|1称为普通相关.四显著性检验最常用的显著性检验是相关系数检验法,步骤如下:1按公式计算相关系数2根据回归模型的自由度和给定的显著性水平,查出临界值3判别。若∣R∣大于等于临界值,相关关系显著,否则,不显著,不能用已建立的回归模型进行预测。YYˆY在过去的10个月中,一家钢铁厂的某部门用电量与钢产量有关,具体数据如下:产量(百吨)151314106811131412用电(百度)10599102835267799710093(a)画出散点图,观察电力消耗与产量之间的关系。(b)计算确定性系数和相关系数。(c)求出上述数据的最优拟合线,a和b的值各代表什么意义?(d)如果一个月要生产2000吨钢,该厂将需要多少电量?产量(百吨)用电(百瓦)246810121410080604020ABCDEF123计算45产量用电计算结果摘要6(百吨)(百度)71510581399相关系数0,983844914102确定性系数0,967948101083调整的r20,96394211652观察值个数10128671311791413971514100截距a18,97312161293斜率b5,9247311718预测值1920137,468线性回归观察值回归统计值参数iimmiiiXXXXYi......332211nyyyyY321nmnmmxxxxxxX...1......1...12222112mB...21XBYiiiXY121iimY21iiiixxY2321iiiixxY321