08生物统计学第6章2

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生物统计学第六章相关与回归分析(2)第六章相关与回归分析第一节变量间的相关关系第二节一元线性回归第三节多元线性回归第四节可化为线性回归的曲线回归学习目标1.掌握相关系数的含义、计算方法和应用2.掌握一元线性回归基本原理和参数最小二乘估计方法3.掌握回归方程的显著性检验4.利用回归方程进行预测5.掌握多元线性回归分析的基本方法6.了解可化为线性回归的曲线回归7.用Excel和SPSS进行回归分析3第三节多元线性回归一.多元线性回归模型二.回归参数的估计三.回归方程的显著性检验四.回归系数的显著性检验五.多元线性回归的预测多元线性回归模型多元线性回归模型(概念要点)1.一个因变量与两个及两个以上自变量之间的回归2.描述因变量y如何依赖于自变量x1,x2,…,xp和误差项的方程称为多元线性回归模型3.涉及p个自变量的多元线性回归模型可表示为b0,b1,b2,,bp是参数是被称为误差项的随机变量y是x1,,x2,,xp的线性函数加上误差项说明了包含在y里面但不能被p个自变量的线性关系所解释的变异性ipipiiixxxybbbb221106多元线性回归模型(概念要点)对于n组实际观察数据(yi;xi1,,xi2,,xip),(i=1,2,…,n)多元线性回归模型可表示为y1=b0b1x11b2x12bpx1p1y2=b0b1x21b2x22bpx2p2yn=b0b1xn1b2xn2bpxnpn{……7多元线性回归模型(基本假定)1.自变量x1,x2,…,xp是确定性变量,不是随机变量2.随机误差项ε的期望值为0,且方差σ2都相同3.误差项ε是一个服从正态分布的随机变量,即ε~N(0,σ2),且相互独立8多元线性回归方程(概念要点)1.描述y的平均值或期望值如何依赖于x1,x2,…,xp的方程称为多元线性回归方程2.多元线性回归方程的形式为E(y)=b0+b1x1+b2x2+…+bpxpb1,b2,,bp称为偏回归系数bi表示假定其他变量不变,当xi每变动一个单位时,y的平均变动值9多元线性回归方方程的直观解释二元线性回归模型bbb22110xxy(观察到的y)22110)(xxyEbbb回归面b0ix1yx2(x1,x2)}10多元线性回归的估计(经验)方程1.总体回归参数是未知的,利用样本数据去估计2.用样本统计量代替回归方程中的未知参数即得到估计的回归方程是估计值是y的估计值pbbbbˆ,,ˆ,ˆ,ˆ210pbbbb,,,,210pbbbb,,,,210ppxxxybbbbˆˆˆˆˆ22110pbbbbˆ,,ˆ,ˆ,ˆ210pbbbb,,,,210yˆ11参数的最小二乘估计参数的最小二乘法(要点)2.根据最小二乘法的要求,可得求解各回归参数的标准方程如下),,2,1(00ˆˆ000piQQiiibbbbbb1.使因变量的观察值与估计值之间的离差平方和达到最小来求得。即pbbbbˆ,,ˆ,ˆ,ˆ21013回归方程的显著性检验多重样本决定系数(多重判定系数R2)1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度3.取值范围在[0,1]之间4.R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差5.等于多重相关系数的平方,即R2=(R)215修正的多重样本决定系数(修正的多重判定系数R2)1.由于增加自变量将影响到因变量中被估计的回归方程所解释的变异性数量,为避免高估这一影响,需要用自变量数目去修正R2的值2.用n表示观察值的数目,p表示自变量数目,修正的多元判定系数的计算公式可表示为16回归方程的显著性检验(线性关系的检验)1.检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总体的显著性检验2.检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著–如果是显著的,因变量与自变量之间存在线性关系–如果不显著,因变量与自变量之间不存在线性关系17回归方程的显著性检验(步骤)1.提出假设–H0:b1b2bp=0线性关系不显著–H1:b1,b2,,bp至少有一个不等于02.计算检验统计量F3.确定显著性水平和分子自由度p、分母的自由度n-p-1找出临界值F4.作出决策:若FF,拒绝H0;若FF,接受H018回归系数的显著性检验(要点)1.如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量xi对因变量y的影响是否显著2.对每一个自变量都要单独进行检验3.应用t检验4.在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验19回归系数的显著性检验(步骤)1.提出假设–H0:bi=0(自变量xi与因变量y没有线性关系)–H1:bi0(自变量xi与因变量y有线性关系)2.计算检验的统计量t3.确定显著性水平,并进行决策tt2,拒绝H0;tt2,接受H020二元线性回归例子一、二代蜘蛛密度和害虫密度数据样区编号二代蜘蛛(只)y一代蜘蛛(只)x1害虫(只)x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.91250165014501310131015801490152016201570【例6.5】生态学研究人员设计在10个调查样区。研究者认为蜘蛛种群密度与上一世代样区的蜘蛛密度和害虫密度有关,希望建立它们之间的数量关系式,以预测第二代蜘蛛密度。有关数据如下表。试确定二代蜘蛛密度对一代蜘蛛密度和害虫密度的线性回归方程,分析回归方程的拟合程度,对线性关系和回归系数进行显著性检验(=0.05)。21二元线性回归例子(Excel输出的结果)SUMMARYOUTPUT回归统计MultipleR0.968159025RSquare0.937331897AdjustedRSquare0.919426725标准误差2.010050279观测值10方差分析dfSSMSFSignificanceF回归分析2423.01789211.5089452.349786.1612E-05残差728.2821154.0403021总计9451.3Coefficients标准误差tStatP-valueLower95%Upper95%Intercept-38.82516948.4785911-4.5792010.002546-58.873837-18.7765XVariable11.3406936180.14331599.35481473.31E-051.001805621.679582XVariable20.0228022930.00475424.79621720.0019750.011560350.03404411)1(122pnnRR调整1)ˆ(12pnyySniiy22二元线性回归例子(计算机输出结果解释)1.二代蜘蛛与一代密度和害虫密度的二元回归方程为2.多重判定系数R2=0.9373;调整后的R2=0.91943.回归方程的显著性检验F=52.3498,FF0.05(2,7)=4.74,回归方程显著4.回归系数的显著性检验tb1=9.3548t/2=2.3646;tb2=4.7962t/2=2.3646;两个回归系数均显著23第三节可化为线性回归的曲线回归一.基本概念二.非线性模型及其线性化方法非线性回归1.因变量y与x之间不是线性关系2.可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型25将下述函数转换为线性形式26几种常见的非线性模型指数函数2.线性化方法两端取对数得:lny=ln+bx令:y'=lny,则有y'=ln+bx1.基本形式:3.图像b0b027几种常见的非线性模型幂函数2.线性化方法两端取对数得:lgy=lg+blgx令:y'=lgy,x'=lgx,则y'=lg+bx'1.基本形式:3.图像0b1b1b=1-1b0b-1b=-128几种常见的非线性模型双曲线函数2.线性化方法令:y'=1/y,x'=1/x,则有y'=+bx'1.基本形式:3.图像b0b029几种常见的非线性模型对数函数2.线性化方法x'=lgx,则有y'=+bx'1.基本形式:3.图像b0b030几种常见的非线性模型S型曲线2.线性化方法令:y'=1/y,x'=e-x,则有y'=+bx'1.基本形式:3.图像31非线性回归(实例)【例6.6】为研究某水体中藻类密度与水质指标A之间的关系,记录数据如下表。试拟合适当的模型。水藻密度与水质指标A的关系水藻(个/L)x1000200030003500400045005000水质指标A(%)y5.26.56.88.110.210.313.032非线性回归(实例)04812160200040006000水藻密度水质指标水藻密度与水质指标A的散点图33非线性回归(实例)1.用线性模型:y=b0b1x+,则有y=2.671+0.0018x2.用指数模型:y=bx,则有y=4.05(1.0002)x3.比较:直线的残差平方和=5.3371指数模型的残差平方和=6.11。直线模型略好于指数模型。34本章小结1.相关系数与相关分析2.一元线性回归模型、回归方程与估计的回归方程3.多元线性回归模型、回归方程与估计的回归方程4.回归方程与回归系数的显著性检验5.非线性回归的线性化6.用Excel和SPSS进行回归分析35请利用最小二乘法计算下面方程的参数36Thanks!37

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功