1近红外分光光度法(NIR)技术简介一、概述近红外光区(nearinfrared,NIR)是指波长在780~2526nm的电磁波,是人们最早发现的非可见光区域,距今已有近200多年的历史。进入80年代后期,近红外光谱分析技术迅速得到推广,成为一门独立的分析技术,有关近红外光谱的研究及应用文献几乎呈指数增长,在药学领域也已有大量文献介绍近红外光谱分析技术的应用。2通过测定被测物质在近红外谱区的特征光谱并利用适宜的化学计量学方法提取相关信息后,对被测物质进行定性、定量分析的一种分析技术。近红外分光光度法具有快速、准确、对样品无破坏的检测特性,可广泛应用于药品的理化分析、包括“离线”供试品的检测和直接对“在线”样品进行检测国外药典收载情况:USP、BP、EP中国药典2005版首次收载附录XIXK近红外分光光度法指导原则3NIR的特点分析速度快,分析效率高适用的样品范围广(液体、固体、半固体和胶状体)样品一般不需要预处理,分析成本较低测试重现性好不破坏样品,应用在活体分析和医药临床领域不适合痕量分析以及分散性样品的分析4二、基本原理1、波长范围约在780~2500nm(波数约为12800~4000cm-1)52、分子的不同振动形式对称伸缩振动---非对称伸缩振动---摇摆振动---摇摆振动---弯曲振动---剪切振动63、近红外光与物质的作用形式⑴真溶液、乳浊液近红外光照射到透明真溶液上,光在试样中透射时发生吸收,分析光在样品中经过的路程(光程)一定,透射光的强度与样品中组分浓度的关系符合Beer定律,用于测定时称为透射分析测定法;近红外光照射到乳浊液上,因为样品是浑浊的,样品中含有对光产生散射的颗粒,光在试样中透射时,除发生吸收外还会发生多次散射,光在样品中经过的路程不确定,透射光的强度与样品浓度间的关系不符合Beer定律,用于测定时称为漫透射分析测定法(也可用于固体、半固体分析)。7⑵固体、半固体发生镜面反射、漫反射、吸收、透射、折射、散射等作用方式近红外光与固体样品作用示意图1—镜面反射;2—漫反射;3—吸收;4—透射;5—折射;6—散射8样品对光漫反射示意图S—镜面反射;D—漫反射94、近红外光谱常规分析方法a:透射式b:漫反射式c:漫透射式1:光源2:单色器3:样品4:检测器透射分析和漫透射分析测定光源与检测器处在样品的两侧;漫反射分析测定光源与检测器处在样品的两侧10NIR各种物态样品最佳适应模式样品检测法波长吸收区液体透射700—2500nm合频吸收1st—4th倍频吸收固体反射1100—2500nm合频吸收1st—2nd倍频吸收悬浮液透射或反射700—1100nm3rd—4th倍频吸收11含氢基团,包括:C-H(甲基、亚甲基、甲氧基、芳基等),羟基O-H(羧基等),巯基S-H,氨基N-H(伯胺、仲胺、叔胺和铵盐等)等。合频近红外谱带位于2000~2500nm处,一级倍频位于1400~1800nm处,二级倍频位于900~1200nm处,三级和四级或更高级倍频则位于780~900nm处。5、有机化合物的近红外光谱谱带归属12不同化合物基团在近红外区的吸收谱带13不同化合物基团在近红外区的吸收谱带14分子振动从基态向高能级跃迁时产生的;记录的主要是含氢基团C-H、O-H、N-H、S-H的倍频和合频吸收。不同基团或同一基团在不同化学环境中的近红外吸收波长与强度都有明显差别。具有丰富的结构和组成信息,非常适合用于碳氢有机物质的组成性质测量。156、近红外光谱定量分析依据对于透明真溶液,近红外透射光谱符合朗伯-比尔定律。漫反射分析定量公式212'/2//1)()(SKSKSKR式中:'R为漫反射体的绝对漫反射率,反映出射光与入射光的比率,是K/S的函数,即依赖于S与K的比值;K为漫反射体吸收系数,取决于漫反射体的化学组成;S为散射系数,取决于漫反射体的物理特性。16漫反射吸光度A和K/S的关系}]2[1log{)1log(212')()(SKSKSKRASKbaA当样品浓度不高时,吸收系数K与样品浓度C成正比,当散射系数S不变时,漫反射吸光度A与样品浓度的关系可表示为:CbaA'17使用反射吸光度时的光谱加和性对于含n种组分的混合样品,由于各组分分子对光的吸收和散射是相互独立的,因此可得吸光系数的加和性,即任一波长λ处混合物样品总的吸光系数Kmix等于各组分吸光系数之和。nnnmixCCCKKKK22112118近红外漫反射光谱不具备光谱吸光度的加和性。近红外漫反射光谱不能像经典多组分分析那样通过光谱吸光度的加和性建立并解联立方程组,解得各组分的浓度)来实现多组分分析。19三、近红外漫光谱分析中常用的计算方法对特定的样品体系,近红外光谱特征峰的分析需要通过对光谱的处理减少以至消除各方面因素对光谱信息的干扰,再从差别甚微的光谱信息中提取样品的定性或定量信息。NIR技术的基本构成近红外光谱仪化学计量学软件模型20近红外光谱分析常用的计算方法为多元校正方法主要包括:多元线性回归(MultivarateLinearRegression,MLR)主成分分析(PrincipleComponentAnalysis,PCA)主成分回归(PrincipleComponentRegression,PCR)偏最小二乘法(PartialLeastSquire,PLS)人工神经网络(ArtificialNeutralNetworks,ANN)方法等。21MIR、PCR和PLS属线性回归方法,主要用于样品的质量参数为线性关系的关联。MLR方法计算简单,物理意义明确,易于理解,但对参加关联的变量(如波长通道)数目有限制。由于仅使用几个波长下的光谱数据,这样常常会丢失许多光谱信息。建立MLR模型要求训练集样品的个数多于变量数目,即使这样,它仍对许多质量参数均获得较好的结果。MLR方法计算简单,物理意义明确,易于理解,但对参加关联的变量(如波长通道)数目有限制。由于仅使用几个波长下的光谱数据,这样常常会丢失许多光谱信息。建立MLR模型要求训练集样品的个数多于变量数目,即使这样,它仍对许多质量参数均获得较好的结果。22四、近红外分光光度分析方法样品集选择用标准方法测定样品测量光谱数据光谱预处理波长选择建模模型验证231.样品集选择首先搜集一批样品,再精选代表性样品,并将样品集分为校正集和验证集。用来建立模型的校正集样品应涵盖以后要分析样品的范围。校正集中应包含除待测成分以外所有的背景信息;使校正产生的数学模型能将这些背景加以扣除。242.用标准方法测定样品对一个模型,有必要选用一个为大家所接受的、权威的参考方法,对样品的组成或性质进行分析,并用测量结果和对应的光谱建立模型。在验证模型时,使用模型预测验证集样品,将预测值和已知值比较,来验证模型预测的准确性。253.测量光谱数据透射光谱法:适用于透明样品的分析,定量关系符合比尔定律。漫透射光谱法:适用于能对光产生散射效应的样品的分析,比尔定律不适用。(如乳液体系)漫反射光谱法:几乎适用于各类样品的分析,如不透明、固体、半固体样品的分析。26NIR光谱仪光源:溴钨灯、发光二极管分光系统:滤光片、光栅、干涉仪、声光可调滤光器载样器件:液体样品:石英或玻璃样品池固体样品:积分球或特定的漫反射载样器件光纤:定位或在线分析中检测器数据处理分析系统274.光谱预处理吸收强度较弱信噪比低样品状态、测量条件等造成的光谱不确定性背景复杂、谱峰重叠现代近红外光谱分析的信息处理技术28导数光谱导数光谱可有效地消除基线和其它背景的干扰,分辨重叠峰,提高分辨率和灵敏度。但它同时会引入噪声,降低信噪比。29平滑算法常用的信号平滑方法有移动平均平滑法和Savitzky-Golay卷积平滑法。平滑处理涉及处理窗口的大小,较大的平滑点数可以使信噪比提高,但同时也会导致信号的失真。30多元散射校正MSC主要是消除颗粒分布不均匀及颗粒大小产生的散射影响经过散射校正后的光谱有效地消除了原始光谱由于颗粒度及装样误差所导致的基线平移和非线性影响人参总皂甙近红外光谱及定标建模分析315.波长选择建模波段过宽,必然包含大量冗余信息,波段选择有利于简化模型,提高模型预测精度。由于各成分分子结构存在差异,使得各自对应的最优建模波段并不相同。分段波长的组合,也可以是连续全光谱,或区域光谱波长。近红外光谱法测定复方丹参滴丸中的3种有效成分32建模主成分数的选择在建模过程中,采用不同的主成分数,模型的预测能力也会有较大的差异。因此合理确定参加建模的主成分数是充分利用光谱信息和滤除噪音的有效方法之一。预测残差平方和法(PRESS):使用一定数目的主成分建立模型,然后用这个模型对参加建模的每个样品进行预测,计算PRESS值。PRESS越小,说明模型的预测能力越好。使用PRESS对主成分数作图,确定最佳主成分数。336.建模建立样品光谱与质量参数之间的对应关系(称为校正模型)。定性(分类)定量(回归)34建立定性模型的方法有监督的模式识别:PCA无监督的模式识别:LDA、SIMCA、ANN、SVM35定性模型的应用:鉴别和定性原料药的鉴别、赋形剂和活性成分的控制、中间体的质量控制、图谱库的优化和建立多晶形(Polymorphism)其他:产地、假药鉴别、指纹图谱、药物混合均匀度的监控、生物技术产品度367.模型验证对建立的校正模型必须通过验证集样本的测量,来评价模型的好坏。校正集预测误差均方根RMSEC:用于衡量校正集样品预测结果的准确性。验证集预测误差均方根RMSEP:用于衡量验证集样品预测结果的准确性。相关系数R2:表示样品预测值与理论值的相关程度。37近红外光谱定量分析的流程与步骤38拓扑学方法和ANN方法等常用于非线性关系的关联。ANN和PLS方法结合使用,可改善数据关联的能力。39建立定量模型的方法MLR只要知道混合物中某些组分的浓度或性质,就可以建立复杂体系的校正模型。但是仅适用几个波长下的光谱数据,常常会丢失许多光谱信息。PLSR该法是一种全光谱分析方法,并能滤去原始数据噪音,提高信噪比,解决交互影响的非线性问题。PCR不需要知道校正样品中的所有组分浓度,就可以建立被测组分的校正模型,某些主成分与组分浓度无任何关系ANN其抗干扰、抗噪音及强大的非线性转换能力,对于某些特殊情况,ANN会得到更小的校正误差和预测误差。40定量模型的应用物理参数:硬度、粒度、溶解度多晶形测定水分测定含量测定冻干粉生物技术其他:药物包装的厚度41优点:(1)快速,通常30秒内就可给出分析结果,可进行在线分析;(2)制样简单;(3)信息量大,可同时测定多组分;(4)经定标建模后,无须用其他常规化学分析手段,不使用有毒有机试剂,无污染;(5)非破坏性分析,可实现产品的无损质量检测;(6)可使用光纤,从而可实现远程分析检测。42(1)建立模型需要大量有代表性且化学值已知的样品;(2)模型需要不断的维护改进;(3)近红外测定精度与参比分析精度直接相关,在参比方法精度不够的情况下,无法得到满意结果。缺点:43测定方法:透射光谱法和反射光谱法透射光谱法把待测样品置于作用光与检测器之间,检测器所检测到的分析光是作用光通过样品体与样品分子相互作用的光。若样品是透明的真溶液,则分析光在样品中经过的路程一定,透射光的强度与样品组分浓度由比耳定律决定。44•反射光谱法检测器与光源置于待测样品的同一侧,检测器检测到的分析光是光源发出的作用光投射到物体后,以各种方式反射回来的光。物体对光的反射分为规则反射光(镜面反射)与漫反射。规则反射光指在物体表面按入射角等于反射角的反射定律发生的反射。漫反射是光投向漫反射体(颗粒或粉末)后,在物体表面或内部发生的方向不定的反射。45功能:定性分析和定量分析定性分析利用模式识别与聚类的一些算法,主要用