(易洪刚)多元线性回归.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

医用多元统计分析方法多重线性回归模型MultipleLinearRegressionModel易洪刚DepartmentofBiostatistics,SchoolofPublicHealth,NanjingMedicalUniversityEmail:ohcepf@163.com医用多元统计分析方法主要内容1多重线性回归模型简介2偏回归系数的估计3方程的假设检验4偏回归系数的假设检验5决定系数与剩余标准差6回归与t检验、方差分析的关系7标准偏回归系数与自变量的贡献医用多元统计分析方法某地13岁男童身高,体重,肺活量的实测数据(部分)编号身高(cm)x1体重(kg)x2肺活量(L)y1135.132.01.753163.646.22.755156.237.12.757167.841.52.759145.033.02.5011165.549.53.0013153.341.02.7515160.547.22.2517147.640.52.0019155.144.72.7521143.031.51.7523160.840.42.7525158.237.52.0027144.534.72.2529156.532.01.75医用多元统计分析方法身高与肺活量的关系y身高(x1)1301401501601701.522.53医用多元统计分析方法身高与肺活量的关系.regyx1Source|SSdfMSNumberofobs=15-------------+------------------------------F(1,13)=8.74Model|1.0985683311.09856833ProbF=0.0111Residual|1.63476513.125751154R-squared=0.4019-------------+------------------------------AdjR-squared=0.3559Total|2.7333333314.195238095RootMSE=.35461-------------------------------------------------------------------------y|Coef.Std.Err.tP|t|[95%Conf.Interval]--------+----------------------------------------------------------------x1|.0299623.01013722.960.011.0080622.0518624_cons|-2.2362561.565632-1.430.177-5.61861.146087-------------------------------------------------------------------------医用多元统计分析方法体重与肺活量的关系y体重(x2)30354045501.522.53医用多元统计分析方法体重与肺活量的关系.regyx2Source|SSdfMSNumberofobs=15-------------+------------------------------F(1,13)=11.50Model|1.2827088711.28270887ProbF=0.0048Residual|1.4506244613.111586497R-squared=0.4693-------------+------------------------------AdjR-squared=0.4285Total|2.7333333314.195238095RootMSE=.33405-------------------------------------------------------------------------y|Coef.Std.Err.tP|t|[95%Conf.Interval]--------+----------------------------------------------------------------x2|.0511685.01509193.390.005.0185644.0837726_cons|.3747994.59865380.630.542-.91851361.668112-------------------------------------------------------------------------医用多元统计分析方法问题:身高、体重两者与肺活量有无线性关系?用身高和体重同时预测肺活量有多高的精度?身高的贡献大,还是体重的贡献大?医用多元统计分析方法单变量分析的局限性:复杂性疾病致病机制遗传因素?环境暴露?交互作用?医用多元统计分析方法主要内容1多重线性回归模型简介2偏回归系数的估计3方程的假设检验4偏回归系数的假设检验5决定系数与剩余标准差6回归与t检验、方差分析的关系7标准偏回归系数与自变量的贡献直线回归模型?医用多元统计分析方法1多重线性回归模型简介医用多元统计分析方法1多重线性回归模型简介多重回归multipleregressionmultiplelinearregression因变量dependentvariableresponsevariable(响应变量)自变量independentvariableexplanatoryvariable(解释变量)医用多元统计分析方法回归模型因变量y,自变量为x1,x2,,xma为截距(intercept),又称常数项(constant),表示各自变量均为0时y的估计值bi称为偏回归系数(partialregressioncoefficient),简称为回归系数称为y的估计值或预测值(predictedvalue)mmxbxbxbay2211ˆyˆ医用多元统计分析方法例:根据某地29名13岁男童的身高x1(cm),体重x2(kg)和肺活量y(L)建立的回归方程为:2105406.0005017.05657.0ˆxxyyˆ当x1=150,x2=32时,=1.9168,表示对所有身高为150cm,体重为32kg的13岁男童,估计平均肺活量为1.9168(L)。包含误差项的回归模型回归模型的应用条件回归模型的矩阵形式医用多元统计分析方法回归模型医用多元统计分析方法包含误差的回归模型1122ˆmmyabxbxbx01122ˆiiimimiiiybbxbxbeyex预测值残差实测值医用多元统计分析方法回归模型的应用条件01122ˆiiimimiiiybbxbxbeyexei称为残差:自变量与因变量的关系是线性的(Linear);Cov(ei,ej)=0,即独立性(Independence);ei~N(0,2),即正态性(Normality);Var(ei)=2,即方差齐性(Equalvariance);LINE2岁身高X与成年后身高Y的散点图Y成年后的身高(英寸)X两岁时的身高(英寸)3032343638406365676971回归模型的应用条件x=x3时的E(y)x=x2时y的分布x=x1时y的分布x=x2时的E(y)x3x2x1x=x1时的E(y)0xyx=x3时y的分布0+1x正态性、方差齐性回归模型的应用条件医用多元统计分析方法回归方程的矩阵形式121nnyyyY)1(1212111111mnmnnmmxxxxxxX121nneeeE1)1(10mmbbbBEYEXBYˆ=XBYˆmmxbxbxbay2211ˆ医用多元统计分析方法回归方程的矩阵形式1305406.0005017.05657.0B0.325.15612.466.16314.309.13910.321.1351X75.175.200.275.1Y2204.04.3005406.09.139005017.05657.000.20920.00.3205406.01.135005017.05657.075.1YXBE小结:医用多元统计分析方法1多重线性回归模型简介01122ˆiiimimiiiybbxbxbeyex医用多元统计分析方法主要内容1多重线性回归模型简介2偏回归系数的估计3方程的假设检验4偏回归系数的假设检验5决定系数与剩余标准差6回归与t检验、方差分析的关系7标准偏回归系数与自变量的贡献医用多元统计分析方法2偏回归系数的估计最小二乘法(leastsquare,LS)基本思想残差平方和(sumofsquaresforresiduals)最小!成都市男中小学生12个年龄组的平均身高紫外光对新生小鼠背皮ATP酶阳性的郎格汉斯细胞(LC)照射不同时间的细胞密度(个/mm3)免疫球蛋白A(IgA,g)与火箭电泳高度(Y,mm)的关系建湖县1978~1985年疟疾逐月发病数月份月发病人数医用多元统计分析方法Y体重增量(g)X进食量(g)6007008009001000110120130140150160170180190ˆ23.94720.2305YX直线回归方程:残差(residual)2偏回归系数的估计医用多元统计分析方法bXaYˆYY1112131415165.05.56.06.51ˆlY2ˆlY点到回归直线的纵向距离平方和为最小!2偏回归系数的估计医用多元统计分析方法2偏回归系数的估计最小二乘法(leastsquare,LS)基本思想残差平方和(sumofsquaresforresiduals)最小nimminiiixbxbxbbyyyQ122211012ˆ医用多元统计分析方法2偏回归系数的估计最小二乘法(leastsquare,LS)基本思想残差平方和(sumofsquaresforresiduals)最小医用多元统计分析方法正规方程及矩阵计算法imimmimiimiimiiimmiiiiiiiimmiiiiiiimmiiiyxbxbxxbxxbxyxbxxbxbxxbxyxbxxbxxbxbxybxbxbxnb2221102222212102112211210122110YXXBXYXXXB1)(2偏回归系数的估计医用多元统计分析方法正规方程及矩阵计算法0.325.15612.466.16314.309.13910.321.1351X75.175.200.275.1Y0.322.464.300.325.1566.1639.1391.1351111'X2偏回归系数的估计医用多元统计分析方法39.4083280.16523970.107680.16523937.67706070.442470.107670.442400.29XX325.2427650.9826000.64YX00259687.000127508.009813142.000127508.000113681.012610946.0009813142.012610946.063235900.151XX从而解得:10.565664()0.00

1 / 108
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功