第1页/共66页化学计量学第一章概论第2页/共66页化学计量学Chemometricsisanewchemicaldisciplinethatusesthetheoryandmethodsfrommathematics,statistics,computerscienceandotherrelateddisciplinestooptimizetheprocedureofchemicalmeasurement,andtoextractchemicalinformationasmuchaspossiblefromchemicaldata.Chemometricscouldbedefinedasadisciplineoffundamentaltheoryandmethodologyofchemicalmeasuring.化学计量学运用数学、统计学、计算机科学、以及其他相关学科的理论与方法,优化化学量测过程,并从化学量测数据中最大限度地获取有用的化学信息,可以说是一门化学量测的基础理论与方法学。第3页/共66页为什么•科学的发展与技术的进步使得化学量测工作仪器化、自动化和计算机化。现代分析仪器能迅速、准确地为人们提供大量可靠的量测数据。化学工作者面临着如何选择合适的实验方法和最优量测过程,对原始量测数据进行再加工,从而最大限度地提取有用的化学及其相关信息。随着计算机科学、应用数学和统计学方法在化学中应用的日益广泛和深入,一门崭新的化学分支学科诞生了。第4页/共66页相关仪器•光谱与波谱分析仪器(原子光谱、分子光谱、核磁、质谱)•电化学分析仪器(电导、电位、电解、极谱、伏安)•色谱分析仪器(气相、液相、离子、毛细管电泳)•流动注射分析仪器•热分析仪器•仪器联用第5页/共66页仪器联用•高校液相色谱-二极管阵列(HPLC-DAD)•气相色谱-质谱(GC-MS)•气相色谱-质谱-质谱(GC-MS-MS)•毛细管电泳-二极管阵列(CE-DAD)•液相色谱-质谱(LC-MS)•液相色谱-核磁共振谱(LC-NMR)复杂分析体系分析、大量的化学信息分析,仪器的发展、分析方法的发展第6页/共66页分析化学的发展•分析化学是发展和应用各种方法、仪器和策略,以获得有关物质在空间和时间方面组成和性质的一门科学,是表征和量测的科学,也是研究分析方法的科学。它可向人们提供物质的结构信息和物质的化学组成、含量等信息。第7页/共66页分析化学第三次变革(1)计算机控制的分析数据采集与处理:–实现分析过程的连续、快速、实时、智能;–促进化学计量学的建立。(2)化学计量学:利用数学、统计学的方法设计选择最佳分析条件,获得最大程度的化学信息。–化学信息学:化学信息处理、查询、挖掘、优化等。(3)以计算机为基础的新仪器的出现:–傅里叶变换红外;色-质联用仪。大量科学家因发明新技术、新仪器而获得诺贝尔化学奖!第8页/共66页•化学计量学是数学和统计学、化学及计算机科学三者相互交叉而形成的一门边缘学科,是化学中很具有魅力和应用前景十分广泛的新兴分支学科。按照国际化学计量学学会(ICS)的定义:化学计量学是化学的一门分支学科。它应用数学和统计学方法,设计或选择最优量测程序和实验方法,并通过解析化学量测数据而获取最大限度的信息。第9页/共66页分析化学与分析科学1、分析科学是分析化学发展新时期。分析化学=分析科学。2、“分析科学”这个名称,标志着①分析化学的内涵和外延有了跨越式发展,其特色包括“过程分析”、“智能分析仪器”、“活体分析活体分析”以及更多的联用技术等;②分析化学工作者的角色已经从数据的提供者跃居为问题的解决者;③分析化学将成为一门立足化学学科,与多学科广泛交叉、为多学科服务的一门学科,逐渐完善和发展自己的独特理论体系的科学分支。3、“分析科学”时代将带来生产和教学模式的革新。第10页/共66页•高鸿先生30多年前就预言:“数学在分析化学中的应用日益重要,如果说60年代是分析化学与电子学结合的时代,70年代是分析化学与电子计算机结合的时代,80年代就可以看成分析化学与统计学和应用数学结合的时代。”•美国分析化学杂志《AnalyticalChemistry》将化学计量学作为一个分支领域,每两年进行一次发展总结综述。第11页/共66页化学计量学的研究对象:化学计量学的研究对象是有关化学量测的基础理论和方法学。其内容涉及到统计学与统计方法、实验设计与优化、分析信号处理、多元校正、化学模式识别、定量构效关系(QSAR)、数据库及专家系统。在我国的发展已经有20多年的历史,为化学各分支学科特别是分析化学、环境化学、药物化学、有机化学、化学工程等提供了不少解决问题的新思路、新途径和新方法。化学计量学的研究对象第12页/共66页化学计量学的任务•其任务是研究有关化学测量的理论与方法学,应用数学、统计学与信息理论、计算机科学的方法和手段,科学地设计化学实验,选择最优的测量方法,最有效地获取体系有用的特征数据,并通过解析测量数据最大限度地从中提取有关物质的定性、定量、形态、结构等信息。第13页/共66页采样安排实验量测方法定性、定量分析信息提取得出结果分析采样理论实验设计理论信号处理理论校正与分辨理论化学模式识别与分子模拟理论人工智能与专家系统化学信息获取过程:分析化学的实现化学信息处理的理论:化学计量学的组成化学计量学是化学信息获取与处理的基础理论与方法学。分析化学是化学量测与表征的科学,是化学信息科学。第14页/共66页Contentsinchemometrics第15页/共66页•分析采样理论和方法(AnalyticalSamplingTheoryandMethods)•化学试验设计与优化方法(ChemicalExperimentDesignandOptimizationMethod)•分析检测理论与信号处理方法(AnalyticalDetectionTheoryandSignalTreatmentMethod)•多元校正与多元分辩(MultivariateCalibrationandMultivariateResolution)第16页/共66页•化学模式识别(ChemicalPatternRecognition)•计算机数字模拟法(ComputerNumericalSimulation)•化学构效关系和分子设计(QSAR/QSPR)•人工智能与化学专家系统(ArtificialIntelligentandChemicalExpertSystems)第17页/共66页•化学知识数据库representationandcomputer-basedsearchingofchemicaldatabases•计算机辅助分子设计computer-aidedmoleculardesign•化学软件中新方法、新算法developmentofnewcomputationalmethodsorefficientalgorithmsforchemicalsoftware•生物制药化学中生物活性分析药物开发biopharmaceuticalchemistryincludinganalysesofbiologicalactivityandotherissuesrelatedtodrugdiscovery.第18页/共66页20世纪50年代以来,化学信息的获取技术的不断进步,分析仪器的发展,使得化学信息的产生与累积达到了空前的程度,化学家们从直接的化学信息获取过程已经不能获得量测对象相关的化学信息,信息的处理与解析成为化学问题解决的瓶颈!化学计量学是化学与分析化学家面临“数据爆炸”解决问题的手段。“数据爆炸”化学计量学与信息提取***第19页/共66页数据Data信息Information知识Knowledge解释应用Understanding化学信息处理信息提取:数据处理过程第20页/共66页21世纪以来,基因组、蛋白组计划,大量生物化学信息的累计,生物信息的处理成为化学计量学研究的新生长点。20世纪70年代,化学计量学建立与发展早期,化学家们在计算机上实现了越来越多的数学、统计学方法。化学计量学的历史发展:20世纪70年代之前,分析化学中的数理统计方法和定量构效关系研究。20世纪80年代,许多大学开始讲授化学计量学,化学计量学成为大学化学课程。20世纪90年代,化学计量学成为许多化学实验室的日常方法,化学计量学方法也成为各种分析仪器的组成部分,是智能化、自动化分析仪器的主要模块。第21页/共66页什么是化学计量学?化学计量学运用数学、统计学、计算机科学、以及其它相关学科的理论与方法,优化化学量测过程,并从化学量测数据中最大限度地获取有用的化学信息,可以说是一门化学量测的基础理论与方法学。“化学计量学”(chemometrics)生物计量学(biometrics)经济计量学(econometrics)20世纪70年代瑞典Wold第22页/共66页1.发展化学数据解析的新理论和方法计算机科学、统计学、应用数学及信息科学的发展为化学计量学注入了新鲜血液经典的多元校正和多元分辨及化学模式识别在的理论和算法研究上也得到了长足发展。人工神经网络新技术模拟退火和遗传算法小波分析及图象分析统计学中的稳健方法化学计量学新方法偏最小二乘法、SIMICA、渐近因子分析方法、秩消失因子分析法化学计量学的发展表现在两方面:第23页/共66页2.化学计量学在近红外光谱分析中的应用•光谱预处理–波长分析–光谱校正–去除背景–去除噪声•建模定性定量分析第24页/共66页光谱预处理方法•光谱平滑、求导•多元信号校正(MultipleSignalCorrection,MSC)•正交信号校正(OrthogonalSignalCorrection,OSC)第25页/共66页建模分析方法•偏最小二乘(PartialLeastSquares,PLS)•主成分回归(PrincipalComponentRegression,PCR)•多元线性回归(MultipleLinearRegression,MLR)•人工神经网络(ArtificialNeuralNetwork,ANN)第26页/共66页3.多元分辨方法解决复杂组分色谱重叠峰问题•渐进因子分析法(EvolvingFactorAnalysis,EFA)•窗口因子分析法(WindowFactorAnalysis,WFA)•直观推导式演进特征投影法(HeuristicEvolvingLatentProjections,HELP)•正交投影分辨法(OrthogonalProjectionResolution,OPR)•子窗口因子分析法(SubwindowFactorAnalysis,SFA)第27页/共66页4.定量构效关系及其在药物设计中的应用•定量结构活性关系(QuantiativeStructureActivityRelationship,QSAR)•定量结构性质关系(QuantiativeStructurePropertyRelationship,QSPR)第28页/共66页药物开发药物分子设计•开发的过程漫长(10-20年)、昂贵(3-5亿$)和艰难•筛选法成功率约为1:15000SelectivityPhysicalpropertiesAbsorptionDistributionMetabolismExcretionToxicityPotency排泄代谢毒性分布潜能选择物化性能吸收第29页/共66页Chemometricsopensthedoorforobtainingusefulchemicalinformationfromthemeasurementdatagivenbymodernanalyticalinstrumentation化学计量学为解决各类复杂化学问题提供了有用的手段•QSAR是药物设计、材料设计、化合物环境毒性评估等有用的工具。•化学模式识别还可用于产品品质评估、商品检验、毒品侦揖、疾病诊断、人工嗅觉模拟等诸多方面。•目标转换因子分析探查污染源化学计