统计学-相关与回归分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第4章相关分析与回归分析第4章相关分析与回归分析主要内容:4.1相关分析的基本问题4.2相关系数的计算4.3回归分析的基本问题4.4简单线性回归分析4.5多元线性回归分析4.6非线性回归分析第4章相关分析与回归分析4.1相关分析的基本问题1.函数关系2.相关关系(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值不是固定的。4.1.1变量之间的关系(1)确定现象之间有无相关关系,以及相关关系的表现形式。(2)确定相关关系的密切程度。(3)选择合适的数学模型。(4)测定变量估计值的可靠程度。(5)对计算出的相关系数,进行显著检验。第4章相关分析与回归分析4.1相关分析的基本问题3.相关分析的主要内容按所研究的变量多少可分为简单(单)相关、复相关和偏相关。(单相关的正相关与负相关)按相关的形式可分为线性相关和非线性相关。按相关的程度可分为完全相关、不完全相关和不相关。第4章相关分析与回归分析4.1相关分析的基本问题4.1.2相关关系的分类1、相关表和相关图第4章相关分析与回归分析4.1相关分析的基本问题4.1.3相关关系的测度年份(年)销售额(万元)流通费用(万元)1998101.81999163.12000325.22001407.720027410.4200312013.3200419718.8200524621.2200634528.31、相关表和相关图第4章相关分析与回归分析4.1相关分析的基本问题4.1.3相关关系的测度30.0025.0020.0015.0010.005.000.00流通费用400.00300.00200.00100.000.00销售额相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。相关程度的大小与计量单位无关,所以相关系数是无量纲的数量。2、相关系数第4章相关分析与回归分析4.1相关分析的基本问题4.1.3相关关系的测度设变量x,y的n对观测值为(x1,y1),…,(xn,yn),皮尔逊相关系数为第4章相关分析与回归分析4.2相关系数的计算4.2.1简单线性相关系数——皮尔逊相关系数xyxxyyLrLL221111212,,,11(...),(...)nnnyyixxixyiiiiinnLyyLxxLxxyyxxxxyyyynn第4章相关分析与回归分析4.2相关系数的计算4.2.1简单线性相关系数——皮尔逊相关系数销售额PearsonCorrelation1.989Sig.(2-tailed).000N99流通费用PearsonCorrelation.9891Sig.(2-tailed).000N99第4章相关分析与回归分析4.2相关系数的计算4.2.1简单线性相关系数——皮尔逊相关系数的意义1r1、定等级。将变量x,y的观测值按照顺序定出等级,形成两个序数数列,如果有相等的数值时,则按原有的等级求其平均数,作为这些观测值的等级。例如,某公司6位员工按学历高低排列分别为:硕士、本科、本科、本科、专科、专科。其中3个本科原来应该列为第2、3、4等级,平均数为3,2个专科原来应该列为第5、6等级,平均数为5.5,因此这6个人的学历等级可以定为:1、3、3、3、5.5、5.5。第4章相关分析与回归分析4.2相关系数的计算4.2.2等级相关系数——斯皮尔曼相关系数计算步骤:2、计算x和y两个序数数列的每对观测值的等级之差,记作D,D=x-y;3、按下述公式计算相关系数:第4章相关分析与回归分析4.2相关系数的计算4.2.2等级相关系数——斯皮尔曼相关系数计算步骤:2261(1)Drnn第4章相关分析与回归分析4.2相关系数的计算4.2.2等级相关系数——斯皮尔曼相关系数例题:员工序号学历等级x能力考核等级yD=x-yD21硕士1良好2.5-1.52.252本科3良好2.50.50.253本科3优秀1244本科3一般4.5-1.52.255专科5.5一般4.5116专科5.5较差6-0.50.25合计—21—21010226610110.7143(1)635Drnn4.3.1回归分析的概念4.3.2回归分析的特点4.3.3回归分析的类型4.3.4相关分析与回归分析(1)描述的方式不同(2)变量的地位不同(3)描述的内容不同(4)变量的性质不同第4章相关分析与回归分析4.3回归分析的基本问题第4章相关分析与回归分析4.4简单线性回归分析4.4.1总体回归模型例:某城市某月家庭可支配收入和消费支出数据(元)可支配收入x15002000250030003500各家庭消费支出y10201220142015901810105012001390158017709801180140016201800990119013701610178010101210141016001820……………平均支出10001200140016001800第4章相关分析与回归分析4.4简单线性回归分析4.4.1总体回归模型第4章相关分析与回归分析4.4简单线性回归分析4.4.1总体回归模型xx1x2x3x4x515002000250030003500E(y/x)E(y/x1)E(y/x2)E(y/x3)E(y/x4)E(y/x5)10001200140016001800第4章相关分析与回归分析4.4简单线性回归分析4.4.1总体回归模型第4章相关分析与回归分析4.4简单线性回归分析4.4.1总体回归模型条件期望表现形式:()Eyxx个别值表现形式:iiyxu4.4.2样本回归模型和基本假设第4章相关分析与回归分析4.4简单线性回归分析ˆˆˆyxˆˆiiiyxe2~(0,)iuN(,)0ijCovuu(,)0iiCovux4.4.3回归模型的参数估计第4章相关分析与回归分析4.4简单线性回归分析设变量x,y的n对观测值为(x1,y1),…,(xn,yn).参数的估计通常采用最小二乘法2ˆ()miniiyy22ˆ()iiiiiinxyxynxxˆˆyx第4章相关分析与回归分析4.4简单线性回归分析例1:家庭收入15002000250030003500消费支出10201190141016201810第4章相关分析与回归分析4.4简单线性回归分析例1:CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)405.00023.04317.576.000X.402.009.99945.324.000a.DependentVariable:Y第4章相关分析与回归分析4.4简单线性回归分析例1:第4章相关分析与回归分析4.4简单线性回归分析例1:一元线性回归模型为:ˆ405.0000.402yx以上模型表明,家庭收入每增加1千元,消费支出平均增加0.402千元。第4章相关分析与回归分析4.4简单线性回归分析4.4.4回归模型的检验1、拟合优度的度量——可决系数(判定系数)第4章相关分析与回归分析4.4简单线性回归分析4.4.4回归模型的检验1、拟合优度的度量——可决系数(判定系数)222111ˆˆnnniiiiiiiSSTyyyyyySSESSR22xyxxyyLSSRrSSTLL第4章相关分析与回归分析4.4简单线性回归分析4.4.4回归模型的检验2回归方程的显著性检验第一步:提出假设01:0,:0HH第二步:计算检验统计量F/1(1,2)/(2)SSRFFnSSEn第三步:确定显著性水平以及临界值F第四步:做出判断ANOVAbModelSumofSquaresdfMeanquareFSig.1Regression4040101404010.2.054E3.000aResidual5903196.667Total4046004a.Predictors:(Constant),Xb.DependentVariable:Y第4章相关分析与回归分析4.4简单线性回归分析4.4.4回归模型的检验2回归方程的显著性检验第4章相关分析与回归分析4.4简单线性回归分析4.4.5.简单线性回归的应用之一——预测200022()1ˆˆ(2)1()ixxyytnnxx221ˆ2ien第4章相关分析与回归分析4.5多元线性回归分析4.5.1总体回归模型和样本回归函数jmjmjjjxxxy...22110mmxbxbxbby22110ˆ1201122(,,...,)...mmmEyxxxxxx01122jjjmmjjybbxbxbxe(j=1,2,…,n)4.5.2多元线性回归的基本假设和参数估计4.5.3多元线性回归模型的检验4.5.4多元线性回归变量的筛选第4章相关分析与回归分析4.5多元线性回归分析例:铝合金化学铣切工艺中,需要对腐蚀速度进行控制,因此要考察腐蚀温度x1,碱浓度x2,腐蚀液含铝量x3,对腐蚀速度y的影响,一共做了44次试验,所得数据表如下:第4章相关分析与回归分析4.5多元线性回归分析试验号X1X2X3y173122000.0240273212000.0235375302000.0240475362000.0245575422000.0190675482000.0185779122000.0305……………第4章相关分析与回归分析4.5多元线性回归分析ModelSummaryModelRRSquareAdjustedRSquareStd.ErrorofEstimate1.875a.765.759.003382.929b.864.857.002603.968c.936.931.00181a.Predictors:(Constant),x1b.Predictors:(Constant),x1,x2c.Predictors:(Constant),x1,x2,x3ANOVAdModelSumofSquaresdfMeanSquareFSig.1Regression.0021.002136.669.000aResidual.00042.000Total.002432Regression.0022.001130.113.000bResidual.00041.000Total.002433Regression.0023.001195.451.000cResidual.00040.000Total.00243a.Predictors:(Constant),x1b.Predictors:(Constant),x1,x2c.Predictors:(Constant),x1,x2,x3d.DependentVariable:yCoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErBeta1(Constant)-.070.009-8.04.000x1.001.000.87511.69.0002(Constant)-.079.007-11.47.000x1.001.0001.01016.10.000x2.000.000-.343-5.46.0003(Constant)-.098.006-17.69.000x1.001.0001.02823.59.000x2.000.000-.335-7.69.000x38.14E-5.000.2706.73.000a.DependentVariable:y第4章相关分析与回归分析4.6非线性回归分析举例人均消费支出与教育支出数据表年份人均消费性支出(元)教育支出(元)19901627.6438.241991185

1 / 40
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功