2019/12/23《统计学实验》第6章回归分析统计学实验—SPSS和R软件应用与实例主编:费宇2019/12/23《统计学实验》第6章回归分析第6章回归分析2019/12/23《统计学实验》第6章回归分析一、实验目的1.通过运用SPSS进行相关分析和回归分析;2.熟悉SPSS的分析(Analyze)菜单中相关(Correlate),回归(Regression)和一般线性模型(GeneralLinearModel)等模块的主要功能3.掌握运用SPSS进行相关分析和回归分析的基本操作过程,并能读懂SPSS输出的结果。2019/12/23《统计学实验》第6章回归分析二、实验环境1.系统软件Windows2000或WindowsXP或Windows7;2.统计软件SPSS16.0或更高版本。2019/12/23《统计学实验》第6章回归分析三、实验内容1.相关分析2.一元线性回归的估计3.多元线性回归的估计4.逐步回归的估计5.虚拟变量回归的估计6.Logistic回归的估计7.回归曲线的估计2019/12/23《统计学实验》第6章回归分析第6章回归分析6.1相关分析6.2一元线性回归6.3多元线性回归6.4虚拟变量回归6.5Logistic回归6.6曲线回归2019/12/23《统计学实验》第6章回归分析6.1相关分析【例6.1】(数据文件为li6.1.sav)为研究初中一年级男生身高x(单位:厘米)、体重z(单位:千克)和肺活量y(单位:升)的关系,随机抽取了16名初一男生测量得有关数据如表6.1所示:表6.1初一男生身高、体重和肺活量的测量值身高x体重z肺活量y身高x体重z肺活量y140.137.02.25162.548.32.75151.538.53.0165.542.52.5161.242.13.25148.036.52.25172.846.53.25165.845.43.25150.038.03.0164.043.53.0153.542.22.75149.539.72.75170.554.53.5159.644.53.0157.037.02.25162.545.03.2(1)绘制变量散点图,分析身高x、体重z和肺活量y之间是否存在相关关系;(2)计算简单相关系数,分析身高x、体重z和肺活量y的之间是否存在直线相关关系;(3)计算偏相关系数,分析身高x、体重z和肺活量y的之间的偏相关关系。2019/12/23《统计学实验》第6章回归分析2019/12/23《统计学实验》第6章回归分析【统计理论】给定容量为n的一个样本,样本简单相关系数(correlationcoefficient)r的计算公式如下12211()()(6.1)()()niiixynniiiixxyyrxxyy2019/12/23《统计学实验》第6章回归分析【统计理论】设三个变量x、y和z是相互关联的一组变量,那么,在控制了变量z的影响后,变量x和y的偏相关系数(partialcorrelationcoefficient)为:,22(6.2)11xyxzyzxyzxzyzrrrrrr(1)画散点图,观察身高x、体重z和肺活量y之间的相关关系2019/12/23《统计学实验》第6章回归分析2019/12/23《统计学实验》第6章回归分析【软件操作】打开数据文件li6.1.sav选择Graphs→LegacyDiaglogs→Scatter/Dot在Scatter/Dot对话框中选中MatrixScatter,点击Define将身高x、体重z和肺活量y选入MatrixVariables中,点击OK,可得图6.1。2019/12/23《统计学实验》第6章回归分析图6.1身高x、体重z和肺活量y矩阵式散点图2019/12/23《统计学实验》第6章回归分析【程序方式】GRAPH/SCATTERPLOT(MATRIX)=XZY/MISSING=LISTWISE.(2)计算身高x、体重z和肺活量y之间的相关系数2019/12/23《统计学实验》第6章回归分析选择Analyze→Correlate→Bivariate将身高x、体重z和肺活量y三个变量同时选入Variables在CorrelationCoefficients中选Pearson,点OK即可得相关系数表表6.2。2019/12/23《统计学实验》第6章回归分析【软件操作】2019/12/23《统计学实验》第6章回归分析表6.2初一男生身高、体重和肺活量的相关系数表Correlationsx身高,cmz体重,kgy肺活量,Lx身高,cmPearsonCorrelation1.810**.650**Sig.(2-tailed).000.006N161616z体重,kgPearsonCorrelation.810**1.707**Sig.(2-tailed).000.002N161616y肺活量,LPearsonCorrelation.650**.707**1Sig.(2-tailed).006.002N161616**.Correlationissignificantatthe0.01level(2-tailed).【程序方式】2019/12/23《统计学实验》第6章回归分析CORRELATIONS/VARIABLES=XZY/PRINT=TWOTAILNOSIG/MISSING=PAIRWISE.(3)计算偏相关系数,分析身高x、体重z和肺活量y的之间的偏相关关系2019/12/23《统计学实验》第6章回归分析选择Analyze→Correlate→Partial将身高x和肺活量y两个变量同时选入Variables再将控制变量体重z选入Controllingfor中,点OK即可得相关系数表表6.3。2019/12/23《统计学实验》第6章回归分析【软件操作】2019/12/23《统计学实验》第6章回归分析表6.3初一男生身高、体重和肺活量偏相关系数表CorrelationsControlVariablesx身高,cmy肺活量,Lz体重,kgx身高,cmCorrelation1.000.186Significance(2-tailed)..508df013y肺活量,LCorrelation.1861.000Significance(2-tailed).508.df130【程序方式】2019/12/23《统计学实验》第6章回归分析PARTIALCORR/VARIABLES=XYBYZ/SIGNIFICANCE=TWOTAIL/MISSING=LISTWISE.2019/12/23《统计学实验》第6章回归分析6.2一元线性回归【例6.2】(数据文件为li6.2.sav)表6.4是《华尔街日报2019年年鉴》(TheWallStreetJournalAlmanac2019)上公布的美国各航空公司业绩的统计数据:航班正点到达的比率和每10万名乘客投诉的次数。表6.4美国航空公司航班正点率与乘客投诉率航空公司名称航班正点率%(x)投诉率(次/10万名乘客)(y)SouthwestContinentalNorthwestUSUnitedAmericanDeltaAmericawestTWA81.876.676.675.773.872.271.270.868.50.210.580.850.680.740.930.721.221.25(1)试以航班正点率为自变量,投诉率为因变量建立回归方程;(2)如果航班正点率为80%,估计每10万名乘客投诉的次数是多少?2019/12/23《统计学实验》第6章回归分析2019/12/23《统计学实验》第6章回归分析【统计理论】设y与x之间有直线相关关系,且y是随机变量,但x是非随机变量,它们之间的关系可以用下式表示:01(6.3)yx2019/12/23《统计学实验》第6章回归分析【统计理论】采用最小二乘方法可以得到回归系数的估计值为:从而得到回归方程:112101()()ˆ(6.4)()ˆˆniiiniixxyyxxyx01ˆˆˆ(6.5)yx2019/12/23《统计学实验》第6章回归分析【统计理论】回归方程的显著性检验等价于以下检验:对于一元线性回归来说,有两种等价的方法,即F检验和t检验。F检验的统计量为:t检验的统计量如下:0111:0:0(6.6)HHSSR(6.7)SSE/(2)Fn121ˆ(6.8)ˆ()niitxx2019/12/23《统计学实验》第6章回归分析【统计理论】200221()1ˆˆ(2)(6.9)()niixxytnnxx200221()1ˆˆ(2)1(6.10)()niixxytnnxx(1)绘制变量散点图计算相关系数和一元线性回归2019/12/23《统计学实验》第6章回归分析2019/12/23《统计学实验》第6章回归分析【菜单方式】打开数据文件li6.2.sav选择Graphs→LegacyDiaglogs→Scatter/Dot→SimpleScatterplot将y选入YAxis,将x选入XAxis→点击OK,即可得散点图图6.2。2019/12/23《统计学实验》第6章回归分析图6.2航班正点率x和投诉率散点图2019/12/23《统计学实验》第6章回归分析【程序方式】GRAPH/SCATTERPLOT(BIVAR)=xWITHy/MISSING=LISTWISE.2019/12/23《统计学实验》第6章回归分析【菜单方式】打开数据文件li6.2.sav选择Analyze→Correlate→BivariateCorrelations将y和x选入Variables,选中Pearson,Two-tailed和Flagsignificantcorrelations→点击OK,可得航班正点率和投诉率的相关系数表表6.5。2019/12/23《统计学实验》第6章回归分析Correlationsx航班正点率%y投诉率(次/10万名乘客)x航班正点率%PearsonCorrelation1-.883**Sig.(2-tailed).002N99y投诉率(次/10万名乘客)PearsonCorrelation-.883**1Sig.(2-tailed).002N99**.Correlationissignificantatthe0.01level(2-tailed).表6.5航班正点率x和投诉率y的相关系数表2019/12/23《统计学实验》第6章回归分析【程序方式】CORRELATIONS/VARIABLES=xy/PRINT=TWOTAILNOSIG/MISSING=PAIRWISE.2019/12/23《统计学实验》第6章回归分析【菜单方式】打开数据文件li6.2.sav选择Analyze→Regression→LinearRegression将y选入Dependent,将x选入Independent(s)→点击OK,可得表6.6和表6.7。2019/12/23《统计学实验》第6章回归分析表6.6航班正点率x和投诉率y的方差分析表ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression.6381.63824.674.002aResidual.1817.026Total.8198a.Predictors:(Constant),x航班正点率%b.DependentVariable:y投诉率(次/10万名乘客)2019/12/23《统计学实验》第6章回归分析CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)6.0181.0525