生物化学与分子生物学系陈瑜Metabolomics2代谢组学主要研究技术目录什么是代谢组学?代谢组学应用3Gene-mRNA-Protein-Metabolite系统生物学4结构基因组学:研究生物系统的基因结构组成,即DNA的序列及其表达。蛋白组学:研究由生物系统表达的蛋白质及由外部刺激引起的差异。代谢组学:研究生物体系(细胞,组织或生物体)受外部刺激所产生的所有代谢产物的变化,是结构基因组学和蛋白组学的延伸。5测序技术的进步,大规模基因组测序成为可能genomics表达序列标签EST、微阵列、基因表达连续分析SAGE,转录组学transcriptomics生物体系中所有蛋白及其功能的蛋白组学proteomics研究代谢产物的变化和代谢途径的代谢组学metabolomics6转录组学和蛋白组学的局限性:–转录组学或蛋白组学上的变化不总能反映基因变更时在生化层面的表现型的改变。–现代技术对于转录组学和蛋白组学中mRNA以及蛋白质的识别是通过已知数据库进行序列比对的来实现的,因此识别和对比过程是间接的。–如果在缺乏某mRNA或蛋白质的数据信息时,以上的两种组学就只能为人们提供少量的信息。7•基因组的变化不一定能够得到表达,从而并不一定对系统产生影响;•某些蛋白的浓度会由于外部条件的变化而升高,但由于这个蛋白可能不具备活性,从而也不对系统产生影响;•由于基因或蛋白的功能补偿作用,某个基因或蛋白的缺失会由于其他基因或蛋白的存在而得到补偿,最后反应的净结果为零;•小分子的产生和代谢才是这一系列事件的最终结果,它能够更准确的反映生物体系的状态。89代谢组学是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分。基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命的活动,而实际上细胞内许多生命活动是发生在代谢物层面的,如细胞信号释放,能量传递,细胞间通信等都是受代谢物调控的。代谢组学正是研究代谢组(metabolome)——在某一时刻细胞内所有代谢物的集合——的一门学科。基因与蛋白质的表达紧密相连,而代谢物则更多地反映了细胞所处的环境,这又与细胞的营养状态,药物和环境污染物的作用,以及其它外界因素的影响密切相关。10与转录组学和蛋白质组学比较,代谢组学专门研究生物体系受外部刺激后所产生的所有代谢产物的变化,能够更准确地反映生物体系的状态,且位于系统生物学的最下游,是生物体系整体功能或状态最终结果的表现。因此有人认为,“基因组学和蛋白质组学告诉你什么可能会发生,而代谢组学则告诉你什么确实发生了。”(BillLasley,UCDavis)11什么是代谢组学代谢组学的提出JeremyK.Nicholson教授作为代谢组学的先行者,被誉为国际“代谢组学之父”.生物系统对生理和病理刺激以及基因改变的代谢应答的定量测定.代谢组学的概念在现有的英文表述中,代谢组学同时存在两个不同的词汇和概念,即metabonomics和metabolomics.12Metabolomics精髓是:对一个生物系统的细胞在给定时间和给定条件下所有小分子代谢物质的定量分析。Metabolomics着重研究的是单个细胞或细胞类型中所有的小分子成分和波动规律,或许可以叫做细胞代谢组学。多用于植物和微生物系统。Metabonomics代谢组学是关于定量描述生物内源性代谢物质的整体及其对内因和外因变化应答规律的科学.因此,Metabolomics可以译作代谢物组,Metabolomics是Metabonomics的一个组成部分.13代谢组学定义代谢组学(Metabonomics/Metabolomics):通过考察生物体系(细胞、组织或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学。代谢组(metabolome):基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常生长功能和生长发育的小分子化合物的集合,主要是相对分子量小于1000的内源性小分子。代谢物数量因物种不同而差异较大:植物(200000种)、动物(2500种)、微生物(1500种)14代谢组是指一个细胞、组织或器官中所有代谢物的集合,包含一系列不同化学型的分子,比如肽、碳水化合物、脂类、核酸以及异源物质的催化产物等。代谢组学来源于代谢组一词,是研究一个细胞、组织或器官中所有小分子代谢组分集合的科学。代谢组学研究的目的是定量分析一个生物系统内所有代谢物的含量。代谢组学分析可以指示细胞、组织或器官的生化状态,协助阐释新基因或未知功能基因的功能,并且可以揭示生物各代谢网络间的关联性,帮助人们更系统地认识生物体。15161718代谢组学的发展•最早起源于代谢轮廓分析(Metabolicprofiling)。早在二十世纪七十年代,Baylor药学院就已经提出并发表了代谢轮廓分析的理论。•1975年,Thompson和Markey利用气相色谱和质谱在代谢轮廓分析的定量方面取得了较大进展;二十世纪七十年代末期这种方法得到了广泛认同;;八十年代早期应用HPLC和NMR来对代谢物进行分析。•1986年,JoumalofChromatographyA出版了一期关于代谢轮廓分析的专辑。•随着基因组学的提出和迅速发展,Oliver于1997年提出了代谢组学(metabolomics)的概念,之后很多植物化学家开展了这方面的研究;•1999年JeremyK.Nicholson等人提出metabonomics的概念。19代谢组学的发展20代谢产物的分析层次OliverFiehn将对生物体系的代谢产物分析分为4个层次:•1)代谢物靶标分析(Metabolitetargetanalysis):某个或某几个特定组分的分析;•2)代谢轮廓分析(Metabolicprofiling):少数预设的一些代谢产物的定量分析,如某一类结构、性质相关的化合物或某一代谢途径的所有中间产物或多条代谢途径的标志性组分;•3)代谢组学(Metabolomics):限定条件下的特定生物样品中所有代谢组分的定性和定量;•4)代谢物指纹分析(Metabolicfingerprinting):不分离鉴定具体单一组分,而是对样品进行快速分类(如表型的快速鉴定);21代谢组学的发展198219831984198919992000200120022007VanDeGreef:publicationofMSforurineprofilingSadler,BuckinghamandNicholson:Firstpublicationon1H-NMRofbloodandplasmaNicholson,etal.:Multi-componentanalysisofspectradatafromraturineNicholsonandWilson:NMRspectroscopyofbiofluidsNicholson:DefinitionofMetabonomicsHaselden,etal.:FirstindependentPharmapublicationofMetabonomicsNicholson,Lindon,andHolmes:PublicationinNatureonMetabonomicsHolmesandAnttiExplanationofstatisticsinMetabonomicsIncreasing#ofpublications222324代谢组学的特点:1)关注内源化合物2)对生物体系的小分子化合物进行定量定性研究3)上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响4)上述内源性化合物的知识可以被用于疾病的诊断和药物筛选。25代谢组学的优点:1)基因和蛋白表达的有效的微小变化会在代谢物上得到放大,从而使检测更容易;2)代谢组学的技术不需建立全基因组测序及大量表达序列标签(EST)的数据库;3)代谢物的种类要远小于基因和蛋白的数目,每个生物体中代谢产物大约在103数量级,细菌基因组中几千个基因;4)因为代谢产物在各个生物体系中都是类似的,所以代谢组学研究中采用的技术更通用;26代谢组学的局限性•不能将生物体所有的代谢产物全面涵盖,活的生物体的内在生物学变化,大多实验仪器存在动力学局限性,导致代谢物的化学复杂性•技术难题:代谢组学中的主要技术难点在于分析物浓度的动态范围?27研究方法•运用核磁共振(NMR)、质谱(MS)、气质联用技术(GCMS)、高效液相色谱(HPLC)等高通量、高灵敏度与高精确度的现代分析技术对细胞提取物、组织提取物和生物体液随时间变化的代谢物浓度进行检测,结合有效的模式识别方法进行定性、定量和分类,并将这些代谢信息与病理生理过程中的生物学事件关联起来,从而了解机体生命活动的代谢过程。28代谢组学的技术平台•红外线光谱技术(IR),•核磁共振技术(NMR),•稀薄气液色谱技术(TLC),•高效液相色谱技术(HPLC),•高效毛细管电泳技术(HPCE),•毛细管电泳与紫外线吸光率检测连用技术(CE/UV),•毛细管电泳与激光诱导荧光检测连用技术(CE/LIF),•毛细管电泳与质谱连用技术(CE/MS),•气相色谱与质谱共用技术(GC/MS),•液相色谱与质谱共用技术(LC/MS),•液相色谱与质谱先后使用技术(LC/MS/MS),•高效液相色谱与质谱和核磁共振技术功用(LC/NMR/MS)29代谢组学主要研究技术代谢组学分析流程样品的采集及预处理数据的采集数据的分析及解释30代谢物组学研究有样品预处理、数据采集和数据分析解释三个阶段,以高通量的检测实验和大规模的计算为特征。-核磁共振技术有极大优势,1H-核磁共振(1H-NMR)最为常用-可得到代谢物成分指纹图谱。-在模式识别方法中,主成分分析法(principalcomponentanalysis,PCA)最为常用、有效。代谢物组学研究需要高通量定量检测技术和大规模的计算31研究步骤第一,生物样品收集与制备。代谢组学的研究对象很广,常用的有生物体液,包括尿液、血液、唾液、组织提取液及活体组织等。生物样品的收集与制备是代谢组学研究的第一阶段,也是重要环节之一,样品的浓度、pH值也会影响实验结果。32第二,NMR制谱。NMR方法适合研究代谢产物中的成分,表征和研究海量的代谢信息及其变化规律,从而得到丰富的生理、病理、药理和毒理等生物信息。其中1HNMR对含氢化合物均有响应,能给出精细的代谢物成分图谱即代谢物指纹图谱。33不同器官组织具有不同的代谢轮廓,广谱全采集34第三,数据预处理。原始NMR谱图往往由于溶剂峰、溶剂峰压制后的残余峰和基线畸变等因素的影响而不能直接拿来做多元数据统计分析,因此,通常需要对NMR谱进行预处理。预处理的步骤如下:NMR谱图去噪、溶剂峰消除、调相与基线校正;NMR谱图分段积分;归一化;标准化。数据预处理包括行处理(针对单个样本)与列处理(针对所有样本的某一个变量)。通常,行处理在前,剔除一些对数据分析没有意义的变量,列处理在后,针对保留下来的变量根据要求进行变换。35第四,通过找到一种空间变换方式,把经标准化后的原始变量按一定的权重经线性组合而成新的变量,这些变量具有以下性质:(l)每个主成分(PC)之间都是正交的;(2)每个PC之间的相关系数为零,即互不相关;(3)第一个PC包含了数据集的绝大部分方差即贡献率,第二个次之,依次类推。36第五,特征代谢物识别和生物分析。这是代谢组学的最后一步,也是关键步骤之一。利用模式识别方法(如PCA)得到特征变量,通过对这些变量的分析研究并结合NMR谱图归属信息,就可以获得全面的代谢物信息及代谢紊乱标记物。根据已知的特征代谢物,结合生物,化学,医学手段可以进行疾病诊断,药理分析和药物毒性跟踪等。37步骤总结如下:38代谢组学各分析流程技术394041代谢组学的应用•代谢组学自从出现以来,引起了各国科学家的极大的兴趣,广泛地应