回归方程分析符号说明

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

首先来说明各个符号,B也就是beta,代表回归系数,标准化的回归系数代表自变量也就是预测变量和因变量的相关,为什么要标准化,因为标准化的时候各个自变量以及因变量的单位才能统一,使结果更精确,减少因为单位不同而造成的误差。T值就是对回归系数的t检验的结果,绝对值越大,sig就越小,sig代表t检验的显著性,在统计学上,sig0.05一般被认为是系数检验显著,显著的意思就是你的回归系数的绝对值显著大于0,表明自变量可以有效预测因变量的变异,做出这个结论你有5%的可能会犯错误,即有95%的把握结论正确。回归的检验首先看anova那个表,也就是F检验,那个表代表的是对你进行回归的所有自变量的回归系数的一个总体检验,如果sig0.05,说明至少有一个自变量能够有效预测因变量,这个在写数据分析结果时一般可以不报告然后看系数表,看标准化的回归系数是否显著,每个自变量都有一个对应的回归系数以及显著性检验最后看模型汇总那个表,R方叫做决定系数,他是自变量可以解释的变异量占因变量总变异量的比例,代表回归方程对因变量的解释程度,报告的时候报告调整后的R方,这个值是针对自变量的增多会不断增强预测力的一个矫正(因为即使没什么用的自变量,只要多增几个,R方也会变大,调整后的R方是对较多自变量的惩罚),R可以不用管,标准化的情况下R也是自变量和因变量的相关第二节一元线性回归分析本节主要内容:回归是分析变量之间关系类型的方法,按照变量之间的关系,回归分析分为:线性回归分析和非线性回归分析。本节研究的是线性回归,即如何通过统计模型反映两个变量之间的线性依存关系。回归分析的主要内容:1.从样本数据出发,确定变量之间的数学关系式;2.估计回归模型参数;3.对确定的关系式进行各种统计检验,并从影响某一特定变量的诸多变量中找出影响显著的变量。一、一元线性回归模型:一元线性模型是指两个变量x、y之间的直线因果关系。理论回归模型:理论回归模型中的参数是未知的,但是在观察中我们通常用样本观察值估计参数值,通常用分别表示的估计值,即称回归估计模型:回归估计模型:二、模型参数估计:用最小二乘法估计:三.回归系数的含义(2)回归方程中的两个回归系数,其中b0为回归直线的启动值,在相关图上变现为x=0时,纵轴上的一个点,称为y截距;b1是回归直线的斜率,它是自变量(x)每变动一个单位量时,因变量(y)的平均变化量。(3)回归系数b1的取值有正负号。如果b1为正值,则表示两个变量为正相关关系,如果b1为负值,则表示两个变量为负相关关系。四.回归方程的评价与检验:当我们得到一个实际问题的经验回归方程后,还不能马上就进行分析与预测等应用,在应用之前还需要运用统计方法对回归方程进行评价与检验。进行评价与检验主要是基于以下理由:第一,在利用样本数据估计回归模型时,首先是假设变量y与x之间存在着线性关系,但这种假设是否存在需要进行检验;第二,估计的回归方程是否真正描述了变量y与x之间的统计规律性,y的变化是否通过模型中的解释变量去解释需要进行检验等。一般进行检验的内容有:1.经济意义的检验:利用相关的经济学原理及我们所积累的丰富的经验,对所估计的回归方程的回归系数进行分析与判断,看其能否得到合理的解释。2.回归方程的统计检验:包括回归方程的显著性检验(f检验)和对回归系数的检验(t检验)。(1)线性回归方程的显著性检验——f检验线性回归方程的显著性检验即方差分析检验法,它是对所有参数感兴趣的一种显著性检验。其检验步骤为:第一步:提出假设。原假设备择假设第二步:构造f统计量在h0成立的条件下,有:第二自由度为n-2,其中n为样本容量。(2)回归系数的显著性检验——t检验回归系数的显著性检验是检验解释变量x对因变量y的影响是否显著。首先:提出假设。原假设备择假设如果h0成立,则因变量y对解释变量x之间并没有真正的线性关系,即x的变化对y并没有显著的线性影响。其次:计算检验统计量t,并得出对应的概率值(伴随概率)。检验统计量:(为回归系数的标准差)最后:根据伴随概率进行判断:如果伴随概率(sig.值)小于我们事先确定的显著性水平时,拒绝原假设,接受备择假设,即解释变量x对y的线性效果显著。否则,不能拒绝原假设,认为x对y的线性效果不显著。一元线性回归分析时,由于只有一个解释变量,因此t检验与f检验的结果是一致的。3.回归方程的评价——拟合程度分析:拟合程度是指估计的回归方程是否很接近因变量,即估计的精确度。而估计的精确度如何取决于回归方程对观测数据的拟合程度。最常用的指标就是——判定系数。1.判定系数判定系数是用来说明回归方程对观测数据拟合程度的一个度量值,以一元线性回归方程为例,若各观测值数据(xi,yi)在坐标系上形成的散点都落在一条直线上,那么这条直线就是对数据的完全拟合,直线充分代表了各个点,此时,用x估计y是没有误差的。各观测点越是紧密围绕直线,说明直线对观测数据的拟合程度越好,判定系数越高,反之则越差,判定系数越小。总变差平方和=回归平方和+残差平方和判定系数的取值范围在【0,1】,=1时,拟合是完全的,即所有观测值都在直线上。若x与y无关,x完全无助于解释y的变差,此时,则=0.可见,越接近于1,表明回归平方和占总变差平方和的比重越大,回归直线与各观测点越接近,回归直线的拟合程度就越好。反之,越接近0,回归直线的拟合程度越差。2.估计标准误差估计标准误差是残差平方和的均方根,用表示。其计算公式为:从实际意义看,反映了用估计的回归方程预测因变量y时预测误差的大小,越小,说明根据回归方程进行预测也就越准确;若各观测点全部落在直线上,则=0,此时用自变量来预测因变量是没有误差的。可见也从另一个角度说明了回归直线的拟合程度。

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功