第三章多元校正与多元分辨多元校正与多元分辨主要研究的是复杂多组分体系的定性定量问题。在实际分析工作中所碰到的混合物体系,一般说来,不外乎以下三种情况:(1)对某些混合体系,其定性组成均已知,分析目的只在于对各种物种(或物种的不同形态)进行定量分析,这样的试样包括已知药物片剂分析和某些已知有机反应的过程分析样本,因该体系的定性组成已完全清楚,我们将其称之为“白色分析体系”,除少数非线性和所谓“病态体系”外,多元校正均可给出令人满意的解析结果。(2)对于分析试样毫无验前信息,即有关其物种数,哪几种化学物种及其浓度皆不清楚,分析化学的任务是首先确定其物种数,进而解析出各纯物种的谱图(可以是光谱、波谱等),即先将其转化成为白色分析体系,然后进行定量分析。这类分析体系是分析化学中最难解析的一类体系,因其像个黑匣子,故称之为“黑色分析体系”。化学计量学家已研究出了不少基于矩阵数据结构和张量数据结构的化学计量学解析方法,尤其是对于色谱联用仪器所产生的矩阵数据,已发展了一系列解析新方法,可望能解决某些黑色分析体系的快速定性定量分析问题。(3)除以上讨论的“白色”与“黑色”分析体系外,还有一类样本,其基本特征为:已知某些待测物种存在于待分析的样本中,但是否存在别的未知干扰却不清楚,分析目的是在未知干扰的存在下,直接对感兴趣的待测物种进行定量分析。此类分析体系因其定性组成只部分已知,介乎于“白色”与“黑色”分析体系之间,故将其称之为“灰色”分析体系。对于这类分析体系,只要可获得矩阵类型的数据,一般可望获得有物理意义的唯一解。经典分析化学的校正方法的基点以单点数据(标量),如某一物理或化学的信号与分析体系中某一待测物质存在某种对应的数量关系,借此可对该化学物质进行定性定量分析。本章所涉及的多元校正和多元分辨方法与经典校正方法在概念上有本质区别,它不只是用几个相应测量点来求解的传统多组分同时测定的简单推广,在这里有一个从标量校正向矢量、矩阵数据解析的概念性飞跃。由于矢量(或矩阵,张量)数据比标量(单点数据)所含信息要多,由此就产生了很多新的分析方法,他们可解决“灰色”与“黑色”多组分分析体系的定性定量问题,并开辟了一个新的研究领域。我们着重介绍一下白色分析体系的多元校正和多元分辨方法。目录3.1白色分析体系的多元校正方法3.1.1直接校正方法3.1.2间接校正方法3.1.3通用标准加入法3.1白色分析体系的多元校正方法白色分析体系是分析化学中常见的一类分析体系。其主要特征为:该分析体系的化学组成已知,其分析目的只是对共存的部分或全部化学组分进行定量分析,一般可用下列线性加合数学模型表出:y=c1x1+c2x2+…+cnxn+e(3-1)式中y表示混合物的量测矢量(光谱或其他谱),xi(i=1,2,…,n)为纯物质的量测矢量(纯光谱或其他纯物质谱),e为量测误差矢量,一般设为服从正态分布的等方差白噪声误差(即e服从均值为零,标准差为δ的正态分布,即e~N(0,δ)。),n为混合体系的共存物种数,ci(i=1,2,…,n)为未知待估参数,一般可看成为相对浓度。如采用矩阵表示,可写为:V=XC+e(3-2)式中x=[x1,x2,…,xn],可称为敏感度矩阵。c=[c1,c2,…,cn]T,为未知待估参数矢量,或称为待测浓度矢量。3.1白色分析体系的多元校正方法对由式(3-1)和式(3-2)表出的多组分分析体系的数学模型,分析化学计量学根据不同实验条件和不同仪器所产生数据的不同特征,采用不同方法进行解析。3.1.1直接校正方法直接校正根据所采用的不同数学方法,可分为多元线性回归方法(MLR)、kalman滤波方法(KF)和加权最小二乘回归法(WLSR)。下面将介绍第一种。3.1.1.1多元线性回归方法(MLR)多元线性回归方法为一常规的统计解析方法,可适应于由式(3-1)和式(3-2)的未知参数的估计,此法直观简单,且具有良好的统计特性。注意到由式(3-1)和式(3-2)表出的关系式中均含有一随机量测误差e,为使所估量测矢量与实际量测矢量的误差最小,一般采用最小二乘方法,何谓最小二乘方法?最小二乘法在化学量测实践中是一个常用的方法。例如,欲测试某一化学物质的质量M,进行几次量测,这时,表征这一质量的最佳量度是其均值M,这个均值就具有与单个量测值的偏离的平方(二次乘方)最小的性质。3.1.1.1多元线性回归方法(MLR)即使得(y-yˆ)T(y-yˆ)=eTe趋于最小,令:(yˆ为所估量测矢量,T表示矩阵的转置)f(c)=(y-yˆ)T(y-yˆ)=(y-xc)T(y-xc)=eTe=∑ei2注意到上式中,只有c为未知量,故可对其求导而获得f(c)的最小,因为:f(c)=(y-xc)T(y-xc)=yTy-yT(xc)-(xc)Ty+(xc)T(xc)=yTy-2yTxc+cTxTxc因yTxc为一标量,故有yTxc=cTxy,对上式求导得:df(c)/(dc)=-2xTy+2xTxc=0(求f(c)的最小)可得:xTxc=xTycˆ=(xTx)-1xTy3.1.1.1多元线性回归方法(MLR)上式所求解一般称为最小二乘解。只要由式(3-2)确定的数学模型中的假设成立,即量测误差确实服从正态分布且具有零均等方差的噪声,则上式给出的解具有很多良好的统计性质。值得指出的是,因x和y均为已知量,如果采用Matlab编程,只需一个语句可算得结果,即C=inv(x1*x)x1*y3.1.2间接校正方法直接校正方法直观且计算简单,易于在计算机上实现。但是这种方法不利于实验设计,而且,对某些存在轻微非线性的分析体系,其浓度估计的可靠性会有所下降。间接校正方法的基本思路就是用一些已知浓度的混合物经某种实验设计方法首先构成一校正矩阵Y,继利用校正矩阵来找到这些混合物量测谱所对应的各组分纯物种的量测谱(k—矩阵法),或是利用它找到混合物量测谱与各混合物浓度的一种线性关系(p—矩阵法),因这类方法不直接采用纯物种的标准量测谱来进行校正,故统称为间接校正方法。间接校正方法的一般数学模型可由下面两式给出:Y=KC(K—矩阵法)C=PY(P—矩阵法)3.1.2间接校正方法在这里,矩阵Y为(mxp)阶的校正矩阵,它是由p个混合物量测谱分别在m个分析通道(可为波长等)量测而得,它的每一列代表一个混合物的量测谱;矩阵C为(nxp)阶的浓度矩阵,它是由p个混合物的n个组分的浓度构成,它的每一列表示一个混合物对应的组分浓度矢量;对于式Y=KC,矩阵k为(mxn)阶的标准量测谱矩阵,为n个纯组分在m个分析通道量测所得,每一列代表一个纯物质的量测谱;在C=PY中矩阵Y和矩阵C的意义同前;矩阵P则为(nxm)阶的回归系数矩阵,一般要求mp和mn,因为所用分析通道数必须大于或至少等于纯组分数和用作校正的混合物量测谱数,否则无法求解。3.1.2.1k—矩阵法k—矩阵法首先由Brown引入分析化学计量学。其主要思路是先通过混合物的校正矩阵,借最小二乘求得各组分的纯物种谱,继用所得的纯物种谱来求未知待测混合物各组分的浓度,这样做有以下两个好处:因各组分的纯物种谱是由混合物的校正矩阵求得,有一定抗非线性功效;因校正矩阵可由实验者确定,可方便进行实验设计。k—矩阵法的数学模型由Y=KC表出,为一线性模型,如在光谱定量分析中,就可看成是Lambert-Beer定律,Y=KC中的k实际上就是纯物质的标准光谱量测矩阵,它的每一列就是一个物种的标准谱。3.1.2.1k—矩阵法k—矩阵法的计算步骤如下:1、用最小二乘法求出k,即K=YCT(CCT)-1或KT=(CCT)-1CYT2、用求得的k借最小二乘法求出未知混合体系的浓度矢量C未知或浓度矩阵C未知:C未知=(kTk)-1kTy未知或C未知=(kTk)-1kTY未知从上述计算步骤可以看出k—矩阵法要进行两次最小二乘,需两次求逆,这样就难免使得计算误差变大。3.1.2.2p—矩阵法p—矩阵法以C=PY为其数学模型,直接以校正矩阵的浓度阵为预测目标,求得回归系数矩阵PT,直接从混合物量测矩阵就可求出混合物的组分浓度,可避免两次求逆,简化了k—矩阵法。p—矩阵法的计算过程如下:pnxm=CnxpYmxpT(YmxpYmxpT)-1或pnxmT=(YmxpYmxpT)-1YmxpCnxpT用求得的p直接可计算未知混合体系的浓度矢量C未知或浓度矩阵C未知:C未知=pnxmy未知或C未知=pnxmY未知3.1.3通用标准加入法经典分析化学中经常采用标准加入法,以克服基体或底液对分析校正的影响。事实上,标准加入的方法同样可推广到多元校正的情况。前面讨论的多元线性回归和kalman滤波算法都是首先得获得校正所需的敏感度矩阵或是各物种的标准谱,如事先无法获得标准谱,即由于待测样本的基本条件不清楚时,无法找到标准谱的量测条件时,即可采用通用标准加入法来进行多元校正。3.1.3通用标准加入法通用标准加入法的实质是在待测样本中直接加入多种待测标准物,以构成一新量测矩阵,再从这新量测矩阵求得在此基体溶液中的各标准物的标准量测谱,继用求得的标准谱对待测多组分体系进行直接校正,即可求得此多组分体系的各组分的浓度来。设有一待测试样y0,其n个组分的浓度矢量为C0,向此试样进行m次标准加入(未作加入的原始试样认作加入量为零的试样),这样可得一新的量测矩阵Y:Ypxm=XpxnCnxm+Epxm在上式中yi(i=1,2,…,m)表示第i次加入时对混合物进行量测时所得的量测矢量,每次量测都是在p个分析通道或波长上进行的。一般仍要求mn。值得注意的是浓度矩阵C:……………y11y12y13…y1pY=[y1,y2,…,ym]=y21y22y23…y2py31y32y33…y3pym1ym2ym3…ymp在上式中ΔCij表示第i次对第j个待测组分加入的浓度。注意在加入时,必须使原待测样本的溶液的体积保持不变(即加入小体积的较浓标准溶液)或采用稀释至相同体积的方法,这样,C0可看成是一个每列相同的矩阵,即每列都由C0构成。X矩阵仍为标准谱矩阵,每一列皆由体系中各组分的标准量测谱构成,即……………c1c2c3…cnC=C0+ΔC=c1c2c3…cnc1c2c3…cnc1c2c3…cn+Δc11Δc12Δc13…Δc1nΔc21Δc22Δc23…Δc2nΔc31Δc32Δc33…Δc3n……………Δcm1Δcm2Δcm3…Δcmn……………x11x12x13…x1pX=[x1,x2,…,xm]=x21x22x23…x2px31x32x33…x3pxm1xm2xm3…xmp如用y0来组成一个与Y相同大小的矩阵Y0即……………y01y02y03…y0pY0=[y0,y0,…,y0]=y01y02y03…y0py01y02y03…y0py01y02y03…y0p矩阵Y0中包括m列相同的矢量y0,则有ΔYpxm=Y-Y0=X(C0+ΔC)-XC0=XpxnΔCnxm注意到上式中矩阵ΔYpxn和ΔCnxm皆为已知,采用最小二乘法即可求出Xpxn:X=ΔYΔCT(ΔCΔCT)-1求得标准谱矩阵X,该体系的未知浓度矢量C0就可用下式求得:C0=(XTX)-1XTy0值得提出的是,ΔC是分析过程中人为作m次加入的标准物浓度构成的矩阵,这个矩阵可以由分析者进行设计。合理的设计应当使得各次加入的标准浓度线性无关,为此可采用因子或正交设计来实现。