定量生理组学发展概述及展望陈尚宾,曾绍群,骆清铭,刘谦∗华中科技大学生命科学与技术学院,武汉430074摘要:定量生理组学研究生命过程的定量化和系统整合,是系统生物学的重要研究方向。本文简要介绍该新兴学科的发展历程、综述国内外发展现状并展望其发展前景。关键词:定量生理组学整合系统生物学1990年美国启动人类基因组计划(HumanGenomeProject,HGP),该计划被誉为生命科学“阿波罗计划”;2001年,人类基因组计划基本完成,标志着生命科学进入了“后基因组”时代[1,2]。人类基因组计划和随后发展的各种组学技术,包括基因组学、蛋白质组学、代谢组学,把生物学带入了系统生物学(SystemsBiology)的时代。作为人类基因组计划的发起人之一,美国科学家莱诺伊·胡德(LeroyHood)创立了全世界第一个系统生物学研究所并成为系统生物学的创始人之一。根据胡德的定义,系统生物学是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科。胡德坚信系统生物学将是21世纪医学和生物学的核心驱动力(Iwasconvincedthatsystemsbiologywillbeacentraldrivingforceinbiologyandmedicineforthe21stcentury.)[3]。按照这个思路,要想让系统生物学真正有效推动生理学和临床医学的发展,就必须实现从基因到细胞、到组织、到器官、到个体的各个层次的整合。而这正是本文讨论的定量生理组学(QuantitativePhysiomics)所涵盖的内容。定量生理组学产生背景1993年,生理组计划(PhysiomeProject)在世界生理科学联合会(theInternationalUnionofPhysiologicalSciences,IUPS)第32次大会上被首次被提出[4]。1997年,在第33次IUPS世界大会后,由美国西雅图华盛顿大学Bassingthwaighte教授主持了有关生理组计划设计的卫星研讨会(satelliteworkshop)。2000年,IUPS成立生理组委员会,由新西兰奥克兰大学Hunter教授担任主席。2001年,在第34次IUPS世界大会上,生理组计划被确定为IUPS未来10年的工作重心。现在,生理组计划已经成为一个世界性的大科研计划。类似于从人类基因组计划到基因组学,在提出生理组计划10年来,生理组研究不断深入并且成果丰硕,一门新兴学科生理组学(Physiomics)已初现规模[5]。专业术语Physiome由“physio”和“ome”两部分组成,对应的中文意思即是“生命”和“整体”。在美国西雅图华盛顿大学生理组计划网站上()可以看到“生全”两个汉字嵌入在生理组计划的徽标中。按照生理组计划两位先驱Bassingthwaighte和Hunter教授的观点,生理组计划旨在提供一个可计算的框架平台:整合细胞、组织和器官等层次的生物化学、生物物理学和生理解剖学等知识,建立可计算的人体物理和生理模型[4,6]。由于生理组计划研究特别强调定量化和计算机密集性[7,8],本文将生理组学称之为定量生理组学(QuantitativePhysiomics)。定量生理组学能够应运而生,也是生命科学发展的一种必然。在过去的20年里,随着实验技术的改进及计算机技术的广泛使用,生命科学有了突飞猛进的发展。主要是如下三个方面重要进展促进了生理组学的产生[4,6]。第一,基因组学的发展;第二,医学成像技术的进步;第三,计算科学的进步。在微观上,以具有划时代意义的人类基因组计划的完成为标志,人类在基因组序列,蛋白质序列,蛋白质结构,细胞生理生化等方面所掌握的信息已经十分丰富;在宏观上,随着美国,中国和韩国的数字人计划的∗通讯作者:刘谦,qianliu@mail.hust.edu.cn开展,已逐步获取了人体从组织,器官到系统各层次的结构信息,并已实现信息的数字化和可视化。至于计算机科学的发展,既包含相关于计算性能的硬件的提高和特定于生物模型的算法的发展。定量生理组学研究内容在西雅图华盛顿大学生理组计划网站上()给出了生理组计划的研究目标主要有6个方面:1.发展数据库存储生理现象的观测结果并解释其机制;2.将实验信息整合到人类和其他有机体功能的定量描述中;3.为教育和科研传播实验数据和综合模型;4.在世界范围内培育研究者的协作,以加速揭示生物系统工作的原理;5.确定最有效的分子或系统药物、基因治疗靶点;6.提供组织工程设计和生物相容移植设计。从上面不难看出定量生理组学的第一个研究内容就是信息数据的建立,而这应该是一个巨大而完整的数据库,包含基因组学、生物化学、解剖和生理学信息,并要求能够通过英特网搜索和提取[9]。从这个角度来看,定量生理组学包含传统的生物信息学内容。为了胜任这一要求,几种可扩展标记语言(extensiblemarkuplanguage,XML)得到发展并被广泛采用,如:CellML(CellMarkupLanguage),AnatML(AnatomicalMarkupLanguage),FieldML(FieldMarkupLanguage),SBML(SystemsBiologyMarkupLanguage),MathML(MathMarkupLanguage)。将那些基因组学、生物化学、解剖和生理学信息运用标准化的计算机建模语言进行描述和存储,并提供一套完善的基于网络的生物学计算平台来管理各个层次间数据信息的交互及显示。第二个研究内容是信息的整合和模型的建立。要从海量数据库中获得有用的知识,要了解复杂生物系统各部分之间的相互关系,整合和模型理应成为定量生理组学研究的焦点。作为系统生物学的一个重要分支,定量生理组学的灵魂也是整合[10]。特别是,要揭示从基因到器官功能甚至是有机体个体行为之间的联系,整合在定量生理组学的研究中显得更加重要而且非常具有挑战性。Hunter教授指出定量生理组学的模型框架跨越了数个时间和空间尺度[4]:时间跨度为1微秒(布朗运动)到109秒(人生寿命),空间跨度为1纳米(蛋白质)到1米(人类躯体)。目前来看,还不具备建立一个完整的模型来涵盖整个人的生理活动。作为策略,定量生理组学不得不把整个人体作为多层次的研究体系和多个子模块来研究[6]。在生理系统这一级水平上,就已经形成12套系统,包括:循环系统,消化系统,呼吸系统,内分泌系统,淋巴系统,皮肤系统,肌肉骨骼系统,中枢神经系统,男性生殖系统,女性生殖系统,泌尿系统,特别感觉器官[4]。针对不同器官和系统,形成了诸如心脏组计划[9,11]、循环组计划[12,13]、肝脏组计划[14]和肾脏组计划。当然还包含在组织和细胞层次的各种建模和研究[4]。综合而言,定量生理组学研究是将计算机仿真建模被广泛应用于生命科学领域,构建从细胞、组织、器官到整个人体的生理结构;运用计算生物学的方法,在生理结构信息基础上,将已阐明的生理功能参数化,公式化,并在计算机上实现该生理功能的模拟与仿真。定量生理组学发展情况在生理组学的国内外研究方面,Hunter教授所在的新西兰奥克兰大学是国际生理组学计划的重要成员,其在心脏组织结构模型、人体解剖学模型的建立方面处于前列,主要工作是运用光学及电子显微镜对心脏组织的结构进行测量,运用核磁共振技术对临床及离体的心脏组织进行结构及功能的研究[15,16];Noble教授所在的英国牛津大学生理学实验室主要研究基于离子通道的心脏电生理及代谢模型[17,18];美国约翰霍普金斯大学生物医学工程部的Popel教授等正致力于微血管循环方面的人体生理组学研究,开展了心肌细胞电生理与钙离子动力学的计算机建模工作[12,13];美国西雅图华盛顿大学的Bassingthwaighte教授致力于血液循环、细胞代谢及生物化学相关计算机模型的建立[6];美国麻省理工学院的IanHunter等人正在开发与生理组学相关的电子仪器();由ForbesDewey领导的医学信息学小组,正开发生理组学数据库的新技术[19];美国圣地亚哥加利福尼亚大学AndrewMcCulloch小组研究心脏区域性力学及电动力学模型的构建[20];美国新泽西生理科学公司(=2573)专注于各种生物学计算机模型的建立,已与上述大多数研究小组合作完成了众多项目,该公司的工作重点在于研发基于XML语言的软件工具及建立心脏电生理学相关的数据库。以上国际上研究小组分别开始了一个或多个生理器官的建模工作,将信息技术应用于生理组学的研究正在成为生命科学发展的热点之一。在细胞与分子水平的生理学研究中,信息技术手段已引入生物学研究,并开发了相应的模拟计算软件,为生物学家提供辅助计算工具软件和生物仿真软件,如:HerbertMSauro等人开发的Jarnac用来对细胞系统模型进行描述和控制;UniversityofCalifornia的AdamArkin小组开发的BioSpice软件,对大肠杆菌的转录调节和感染态等方面进行计算研究();UniversityofCambridge的CarlFirth博士完成StochSim软件,它利用随机过程的原理来辅助分析调控通路,从而理解趋药性信号通路中的随机因素();OxfordBrookesUniversity的IgorGoryanin开发的DBSolve用于细胞代谢、酶促反应和受体/配体结合的模拟();CaliforniaInstituteofTechnology的M.A.Wilson开发的Genesis用来进行细胞信号传导网络的建模();还有很多类似的生物信息学软件如用于神经元模拟的Neuron(),用于分子动力学模拟的NAMD();此外,日本Keio大学提出的E-CELL()和美国NationalInstitutesofHealth(NIH)资助的VirtualCELL()的出现,在细胞层次提供了系统水平的仿真模型,它不同程度地模拟了代谢、基因调控、细胞信号转导及其相互关系,其所模拟的细胞表现出独立生存的生命特征。以上软件大部分是在分子或细胞的单个层次上对生化反应进行分析和模拟,E-Cell虽然提出了细胞层次的系统水平研究,但还没有从人体多层次体系结构的角度来进行研究。1994年世界上第一个数字化虚拟人在美国诞生;2000年韩国成为世界上第二个开展虚拟人项目研究的国家;2001年中国也加入了数字化虚拟人项目研究的行列,2003年中国数字化虚拟人初步构建成功[21]。2005年,由南方医科大学和华中科技大学合作构建的“高分辨数字人体三维结构数据集”被两院院士评为“2005年中国十大科技进展之一”。中国数字人研究开启了我国在定量生理组学研究的新领域。2006年,国家863重大项目“基于数字人体的生理组学研究与应用”获得立项支持。目前,以数字人结构数据为模板,构建数字辐射虚拟人模型,进行光子、中子、质子和电子的辐射模拟与仿真获得了一些有用的定量化结果[22,23]。定量生理组学发展前景定量生理组学是研究生