第八章相关与回归分析1、相关分析的目的是确定变量之间的关系类型及其关联的程度。变量之间的关系存在两种不同的类型:一是函数关系(确定性关系),二是相关关系(不确定性关系)。2、相关关系的种类:完全相关、不完全相关和不相关;正相关和负相关;线性相关和非线性相关;单相关、复相关和偏相关(一个变量对另一个变量的相关关系称为单相关;一个变量对多个变量之间的相关关系称为复相关;当假定其他变量不变,研究其中两个变量的相关关系时,称为偏相关);真实相关和虚假相关(当两种变量之间的相关只是表面存在,实质上并没有内在联系时,称为虚假相关)。3、相关表:是一种反映变量之间相关关系的统计表,将一种变量按其取值大小的排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。(相关图略)4、相关系数:是度量两个变量之间关系的密切程度。总体相关系数是根据总体的全部数据计算得到的,记作;样本相关系数记作r。5、总体相关系数的计算公式:(,)([()][()])()()()CovxyExExyEyExyExEy(总体协方差),(,)()()xyCovxyDxDy,()()DxDy、称为方差6、样本相关系数:对变量x和y作n次观测,得到样本容量为n的样本观测值(,),(1,2,,)iixyin,假设x和y是刻度级变量(Page29包括定距和定比数据,表现为数值),则有公式:样本协方差1111()()()11nnxyiiiiiilxxyyxynxynn,样本相关系数:xyxxyylrll,其中2221111()()11nnxxiiiilxxxnxnn、2221111()()11nnyyiiiilyyynynn7、样本相关系数r是总体相关系数的无偏估计量,且[1,1]r。1r时,x和y为完全正线性相关关系;1r,x和y为完全负线性相关关系;0r时,x和y不存在线性关系。——一元线性回归分析1、回归分析:是根据事物与变量之间相关关系的具体形式,选择一个合适的数学模型,来近似地表述事物与变量之间的平均变化关系。2、相关分析与回归分析的区别:点击此处查看3、一元线性回归模型:两个变量之间的关系最简单是线性关系,一元线性回归模型也就是最简单的模型。变量x和y的容量为n的一组样本观测值(,),(1,2,,)iixyin,建立一元线性回归模型为:201,(1,2,,),~(0,)iiiiyxinN,其中01,为未知参数,称为回归系数。4、回归方程:01Eyx