第三节可直线化的非线性回归分析非线性回归的直线化倒数函数曲线指数函数曲线对数函数曲线幂函数曲线Logistic生长曲线12345643211234564321直线关系曲线关系直线关系是两变量间最简单的一种关系。这种关系仅在变量的一定取值范围内可用,范围过大,散点图就偏离直线,需要借助于曲线描述。两变量间的非线性关系用来表示双变量间的关系有多种曲线。曲线类型直线类型直线回归方程曲线回归方程米氏方程当反应速度等于最大速度一半时,即V=1/2Vmax,Km=[S]上式表示,米氏常数是反应速度为最大值的一半时的底物浓度。米氏常数的单位为mol/L。Km—米氏常数Vmax—最大反应速度][][SKSVVmmax米氏常数Km的意义不同的酶具有不同Km值,它是酶的一个重要的特征物理常数。Km值只是在固定的底物,一定的温度和pH条件下,一定的缓冲体系中测定的,不同条件下具有不同的Km值。Km值表示酶与底物之间的亲和程度:Km值大表示亲和程度小,酶的催化活性低;Km值小表示亲和程度大,酶的催化活性高。专业知识、经验或文献确定曲线类型单细胞生物生长初期符合指数函数增长,但若考虑到生长一定时间后,后期生长受到抑制,其生长曲线变成“S”形。酶促反应动力学中的米氏方程是一种双曲线。一、确定曲线类型的方法1散点图的方法2通过散点图,确定曲线类型。如果几种类型可供选择,可多做几次回归,进行比较,再确定曲线类型。曲线回归的相关指数:反映回归曲线拟合度的高低,表示利用曲线回归方程进行估测的可靠程度的高低。222)()(1yyyˆyR直接引入新变量二、数据变换的方法1如令x´=lgx:xbayˆlgxbayˆ方程变换后再引入新变量2如baxyˆ两边取对数xbayˆlglglg令:lg,lg,lgxxaayyxbayˆ常用曲线模型的直线化方法曲线回归方程经尺度转换的新变量及参数直线化的方程y´x´a´=(a+bx)/xy´=yx=a+bx=1/(a+bx)y´=1/y=a+bx=x/(a+bx)y´=x/y=a+bx=ax+bx2y´=y/x=a+bx=a+blnxx´=lnx=a+bx´=a+blgxx´=lgx=a+bx´=axby´=lnyx´=lnxa´=lna=a+bx´=aebxy´=lnya´=lna=a+bx=axebxy´=ln(y/x)a´=lna=a+bx=1/(axb)y´=ln(1/y)x´=lnxa´=lna=a´+bx´yˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆyˆ倒数函数曲线xbxayˆxyˆ'yˆbxa'yˆ(1)x的观测量无0值。(2)yx应具有专业意义,而不是抽象的量。(3)以y´(y´=yx)和x为坐标绘制出的散点图有明显的直线性。(4)y´和x的相关系数显著。xbayˆ1''ˆbxayxx'yˆ'yˆ1;1bxaxyˆyˆx'yˆbxa'yˆbxayˆ1yˆ'yˆ1bxa'yˆ指数函数曲线bxaeyˆbxaylnˆlnaayˆyˆln,lnbxay''ˆxabyˆbxayˆlnlnlnbbaayˆyˆln,ln,lnxb'a'yˆ对数函数曲线xbaylgˆxxlg''ˆbxay幂函数曲线baxyˆxbaylglgˆlg'''bxayxxaayˆylg,lg,lgS形曲线xbeay1ˆxbeayˆ1''ˆbxayxexyˆy,1三Logistic生长曲线特点开始增长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长的“S”,因此,也称为S型曲线。0xyK1+aK2KbxaeKy1ˆ0xxaKy1ˆKyˆ起始量终极量0xyK1+aK2KbxaeKy1ˆbax)1ln(2ˆKy拐点下凹上凸bxaeKy1ˆbxaeyˆyˆKbxayˆyˆKln)ln(bbaayˆyˆKyˆ,ln),ln(xbayˆK值y是累积频率时:y无限增大的终极量应为100(%),可用K=100表示。321332211bxbxbxaeyyKaeyyKaeyyK3221)()()()(21122112xxxxyKyyKyyKyyKy2312xxx令31223213122-2)(yyyyyyyyyKy是生长量或繁殖量时:四、存在问题不是所有非线性方程都能用变量代换线性化。即使方程类型不对时,变量代换与线性回归仍可照常进行,但结果没有任何用途,强行使用会导致错误。只能使变换后数据的线性方程残差最小,采用线性化方法进行曲线回归后必须进行检验。第四节多元线性回归分析一、多元线性回归模型二、多元线性回归方程的建立三、多元回归的假设测验和置信区间一、多元线性回归模型多元回归或复回归(multipleregression):依变量依两个或两个以上自变量的回归。(一)多元回归的线性模型和多元回归方程式若依变量y同时受到m个自变量x1、x2、…、xm的影响,且这m个自变量皆与y成线性关系,则这m+1个变量的关系就形成m元线性回归。一个m元线性回归总体的线性数学模型为:其中,为随机误差,服从N(0,)的正态分布,为离回归方差,其平方根为离回归标准差或回归估计标准误。ixmmymxmyxmyyiεxβxβxβym)-()-()-(122132123121i2,,,/21mxxxy2,,,/21mxxxy为x2,x3,…,xm固定不变时,x1每变动一个单位,y平均变动的相应单位数,称为x2,x3,…,xm固定不变时x1对y的偏回归系数(partialregressioncoefficient),简记作β1,其样本估计值简记作b1,余下类推。my231mxxxy,,,,21依次为y,x1,x2,…,xm的总体平均数,其样本估计值依次为;,,,,21mxxxy若令,则多元线性回归的数学模型为:mxmxxyμβμβμβμα2121immixβxβxβy2211样本多元线性回归方程为:或)-()-()-(222111mmmxxbxxbxxbyyˆmmxbxbxbya2211mmxbxbxbayˆ2211a为α的样本估计值,a可由下式求出:二多元回归统计数的计算同一元直线回归方程一样,多元线性回归方程也可根据最小二乘法建立:最小值22221112)]-()-()-([)(mmmxxbxxbxxbyyyˆyQ最小值则有:令22211222111)(,,,,,mmmmmXbXbXbYQxxXxxXxxXyyY要使Q达到最小,就必须使b1,b2,…,bm的偏微分方程皆等于0,即有:0)(20)(20)(22211222112122111mmmmmmmmXXbXbXbYbQXXbXbXbYbQXXbXbXbYbQ经整理,得到如下正规方程组:YXXbXXbXXbYXXXbXbXXbYXXXbXXbXbmmmmmmmmm222112222221111212211则可得如下方程组:;;y2211221121122222211YXSPYXSPYXSPXXSPXXSPXXSPXSSXSSXSSmmyymmmmmm,,,,,,,;,,,由于mymmmmymmymmSPSPbSPbSPbSPSPbSPbSPbSPSPbSPbSPb221122221211112211这个正规方程组可用矩阵表示为:mmmmmmnyyybbbSPSPSPSPSPSPSPSPSPSPSPSP21212212112121若系数矩阵用A表示,未知元矩阵用b表示,常数矩阵用K表示:Ab=K为求解式中的b,一般应先求出A的逆矩阵A-1,令:mmmmmmijccccccccccA2122212121111)(式中,A-1是一个m阶的对称矩阵,即cij=cji,由于A-1是A的逆矩阵,故有:A-1A=I(单位矩阵)由Ab=K得b=A-1K:nyyymmmmmmmSPSPSPcccccccccbbb2121222121211121由此可见,求偏回归系数建立多元线性回归方程,首先要解出系数矩阵A的逆矩阵A-1,然后由A-1求出bi和a。A-1可采用表解法求得。P216三、多元线性回归的假设测验和置信区间(一)多元回归方程的估计标准误实际观测值y与多元回归方程的点估计的差值的平方和称为多元回归方程的离回归平方和,记为Qy/12…m。yˆ自由度df=n-(m+1)=n-m-1估计标准误为:)1(12/12/mnQsmymymymyymymyymySPbSPbSPbUUSSQ221112/12/12/总平方和回归平方和(二)多元线性回归方程的假设测验H0:β1=β2=…=βm=0;HA:βi不全为0。SSy=Uy/12…m+Qy/12…m,Uy/12…m由x1、x2、…、xm的不同所引起,具有df=m;Qy/12…m与x1、x2、…、xm的不同无关,具有df=n-(m+1),由之构成的F值:)]1([//12/12/mnQmUFmymy注意:1多元线性回归关系显著不排斥有更合理的多元非线性回归方程的存在2多元线性回归关系显著不排斥其中存在着与依变量y无线性关系的自变量,因此有必要对各偏回归系数逐个进行假设检验。只有当多元回归方程自变量的偏回归系数均达到显著时,F值才有确定的意义。(三)偏回归系数的假设测验偏回归系数的假设测验,就是测验各个偏回归系数bi(i=1,2,…,m)来自βi=0的总体的概率。H0:βi=0;HA:βi≠0。测验方法有两种。1.t测验ibiisbtibsiic=sy/12…m服从df=n-(m+1)的t分布,可测验bi的显著性。ibisbt0i2.F测验)]1(/[12/mnQUFmyiUi就是y对xi的偏回归平方和。df=1。iiiicbU2Uy/12…m随着m增多而增大,且Uy/12…(m-1)=Uy/12…m-Ui注意:1、t检验结果和F检验结果一致tsbscbn-m-QUFiibimyiiimyp222/12212//)1/(2、如各自变量间不相关,即rij=0:miimyUU112/如各自变量间有不同程度的相关,即rij≠0:miimyUU112/例:两个自变量x1和x2,r12=0,Uy/12=U1+U2r120,Uy/12U1+U2r120,Uy/12U1+U2(四)多元线性回归的区间估计μy/12…m的置信区间:jijjiiijiiiiimymnxxxxcxxcnstyˆ))((2)(112/)1(jijjiiijiiiiimymnxxxxcxxcnstyˆ))((2)(1112/)1(单个y的置信区间:第五节多元线性相关分析一、多元相关分析二、偏相关一、多元相关分析多元