系统生物学和新兴的系统医学许秀竹2009.10.09引言系统生物学是一种把生物学看作系统科学的方法,它把生物系统看作一个整体来研究;功能是:识别现存系统中保存、传播、调整和被生物网络整合的生物信息。采用从上到下和从下到上相结合的方法。现代系统生物学的五个独特的特征:1)各种全局或可能的最大范围的生物信息的测量,如:测量所有基因的数字代码,所有蛋白质的浓度等等;2)不同层次的信息必须被整合,以便我们理解或获取环境如何改变每个生物信息层级(DNA,RNA,蛋白质,相互作用,生物网络,细胞,个体和生态学)中基因组的基本的数据信息,并且引起生物学反应;3)当系统获取、传播、整合和利用实现两个基本的生物体反应所必须的信息时,所有的生物学系统必须被动态的研究;4)所有的测量必须定量测量可能的最大范围;5)来自不同信息层级的全局和动态数据必须被整合和建立模型(这些模型必须产生生物功能和可以通过系统干涉的实验测试的致病机理的假设)。生物学的信息革命带来了系统医学的出现。这一变化的关键是:大量的生物学信息将会被利用。这些信息通过测量、可视化和计算技术的快速进步变得可用。最基本的两种生物信息:基因组的数据信息;周围环境的相互作用信息。这两种信息综合起来指定了5个生命的基本机制——进化、发育、生理反应、老化、疾病的发生和发展。两种技术:高通量DNA测序:能够快速测序每个个人的基因组,并以合理的成本提供个人的数据信息,可能对未来的健康作出越来越准确的预测;高通量测量技术:能够对产生于基因组和每个个体的环境信息整合的动态环境信息进行评估,提供了个体的实时健康评估。医学的系统方法的基本观点:疾病产生于基于干扰的疾病生物网络;干扰网络控制的基因表达的模式的动态变化和改变引起疾病的表现。一、在生物学和医学中的系统科学A、系统生物学生物学和医学的系统方法如何带来了革命性的医学观点?1.系统层次分析容易得到的生物学信息的两个主要方面是:基因组的静态数据信息;来自亚细胞、细胞、系统组织层次之间的环境相互作用的动态信息。2.数字信息编码两种类型的网络:蛋白质相互作用网络;基因调控网络。3.在生物系统中,这两种网络紧密结合。4.这些网络的组织可以用各种测量推断。有多个信息和组织层级。B、系统医学系统医学的中心前提是:1.基于干扰的疾病网络改变基因和蛋白质的表达模式;2.这些改变的模式编码动态疾病病理,并且必然导致能够被临床检测的分子指纹的改变。技术:1.组织和血液分析的测量技术和计算分析工具的进展,能够使我们阅读一些信号来做出区分健康和疾病的多重诊断;2.生物信息学的多参数分析;3.病理学过程的分子指纹。与健康和疾病相关的信号可以在多个位点发现,血液可能是含有信息最的多的器官。信息载体有:血液中分泌的生物分子,循环细胞的转录组和蛋白质组。这些动态变化的,基于干扰的疾病网络产生了两个重要结论:1.有关临床的或组织学的变化之前,某些重要的网络节点的变化是明显的。2.发病期间变化的许多蛋白质子网络影响与疾病病理一致的表型症状的变化。另一个需要解决的关键问题是:如何最好的分离疾病信息的两个方面,即:疾病分层(哪种类型的癌症是存在的);疾病进展(某一阶段的癌症的分层时间)。分子标记的变化可以表明不同疾病的存在和它们的状态。未来的挑战:开发分析工具,使得能够区分生理状态的位置,临床上关于临界点的两个方面。二、多参数血液标志物原则上,如何把血液样本用作区分健康和疾病状态的窗口应该是很明显的。实际存在的困难有:1.在大量的分泌蛋白阵列中识别疾病状态的标记物的任务是严峻的。由于:血液中存在上百万种不同的蛋白质;它们表达的不同层次太多(有1012)。2.区分来自背景噪音(生物学的或者测量的噪音)的信号的挑战也是重要的。噪音资源包括:测量错误、种群的多态性、环境的变化、随机变化、和通过混合和其他分子运输过程的信号稀释。因此,增强信号减少噪声将是预测医学研究的主要主题。减少遗传多态现象和健康史噪音的重要的策略:对单个病人实行动态的削减分析(对单个的病人在不同的时间点进行测量)A、特定器官血液的蛋白质指纹图谱在未来的10年中,诊断学中特定器官血液的指纹图谱方法将是预测医学的核心。它将是预测性和个性化医学的主要收集策略。这种方法的思想是:1)疾病产生于动态的疾病干扰网络;2)疾病器官将向血液中分泌蛋白质;3)如果蛋白质被疾病干扰网络编码,那么它们在血液中的表达水平将会改变。困难:1)对于特殊疾病状态,识别多个血蛋白的具体变化。因为多个器官控制大多数血蛋白的表达,并且这些器官对各种实验信号作出反应。2)不能确定哪个器官是变化的起源;如果疾病的生物标记物的起源不明确,它可能提出的问题比答案多。解决方法:选用具体器官的血蛋白标志物,这种标志物的变化只能反映器官本身的变化。具体器官血蛋白方法已经应用的几个方面:1)在前列腺癌中的应用,已经证明具体前列腺血蛋白的血浓度变化反映了前列腺癌的不同状态;2)在小鼠阮病毒疾病中,不同的脑血蛋白也反映了小鼠阮病毒疾病的过程。在每个指纹中单个蛋白质不同的表达水平代表了一个疾病干扰网络动态行为的多参数诊断指标。三、体内及体外的新兴技术(一)体外测量技术P4医学要求:在微型的血液样本,对于上千个血蛋白要实现快速、自动化、和廉价的体外测量。体外测量的技术要求:组织和血液净化和测量技术要微型化、平行化、整合和自动化,并且要求成本比较低。为了满足系统医学不断扩大的要求,体外测量不只要求是廉价的,还要求灵敏,定量,快速和在很小数量的组织或细胞中也能实现。未来几年中将会被开发的体外测量技术:1.芯片平台;在很少的血液中,从血清中分离血浆,定量的测量数量比较多的蛋白质或mRNA,有很高的灵敏度和特异性,速度较快。2.用纳米方法以大规模并行计算为基础测序DNA单链来确定个体完整的基因组序列。B、蛋白质组和血液蛋白生物标志物的挑战血液是检测生物标志物的主要器官。分析蛋白质混合物的两种一般方法:1.蛋白质捕捉代理的应用,在一定控制下这些方法可以量化蛋白质水平。包括:免疫印迹分析、酶联免疫吸附法、表面等离子体共振、蛋白质芯片。2.质谱法下面介绍这些技术的一些例子1、利用表面等离子共振成像的抗体芯片功能:对于大量的不同抗体能够实时的,免标签的蛋白质表达测量;能够播放大量蛋白质,不仅能够测量它们的存在,还有丰度和动态结合。特点:虽然检测的灵敏度较低,但空间分辨率比较好;局限性:依赖抗原的亲和性和特异性。2、DNA编码的抗体库功能:1.在微流控环境和很小数量的生物材料中,能够检测生物标志物小组;2.测量全血指纹的血清标志物;3.实施免疫测定;优点:1.比一般的ELISA灵敏度高,测量速度;2.能够多元化细胞分选和本地化;3.可以对每个孤立细胞分泌的蛋白测量;3.以质谱分析为基础的技术1)利用质谱的同位素标记相对和绝对定量蛋白质分析法(iTRAQ)通过质谱法稳定同位素标记能够定量分析蛋白质含量。iTRAQ使用稳定同位素标记蛋白肽。iTRAQ技术代表定量蛋白质组学的尖端技术,并且是一项采用蛋白质组学区分蛋白质网络主要差别的技术。2)糖肽捕捉——包含糖分残留的血蛋白浓缩前端介绍了鸟枪糖肽捕捉方法。这种方法能确定候选的,独特的,能做临床相关细胞亚群标志的细胞表面标志物。(二)体内分子诊断体内分子诊断需要开发分子成像探针的多样化样本库。分子工具的用途:1.确定病人疾病干扰网络的特定位置;2.连接病人的疾病组织的体内测量和体外测量3.快速评估个性化治疗的效能;4.证实药品打击它的目标和所需药物诱导的结果;四、系统医学中数学计算面临的挑战A、分子签名分类器计算方法需要降低全局数据集相关的高度数据维数来识别能够诊断疾病的分子签名。这就需要从两个或者多个类中收集样本,并且利用训练集和测试集。影响精确分类的因素:1)训练集相对于特征数量的大小;2)使用的计算方法;如:支持向量机,相对表达逆转3)选择的显型的内在特性;B、生物网络和相互作用组相互作用组:在真核生物中,复合调控、信号转到和当前的反馈网络中的所有个体生物分子之间的相互作用形成高阶分析的理论框架。包括:蛋白质之间的相互作用组、转录调控组、后转录基因噪声抑制组。高通量方法有:酵母双杂交系统、表面等离子共振。目前,一般研究生物分子之间成对的相互作用数据,这些生物网络的计算评价允许病理学的多元变量标记,传统的单参数研究是不足的C、生物系统的定量预测模型生物学中的定量网络模型分为两类:统计推理网络;生化反应网络。由统计推理网络产生的方法:1.模拟生物学网络的方法;2.利用高通量数据类型的相关性来推断预测性网络模型。D、个性化和预测性的基因组学和蛋白质组学在DNA,RNA,蛋白质,和细胞水平上,单个病人的指数增长的生物数据将能够被收集,并且对于多元参数和多尺度分析这些数据是可用的。计算挑战:比较人类个体的数十亿基因组提取它们之间的区别,并且联合健康和患病的区别。结论和展望1.未来的5-10年中,纳米技术和微流控传感芯片集成微流控输送设备将得到发展。2.未来的5-10年中,DNA单链测序纳米方法将产生能够快速、廉价、和简单的测序个体的基因组的仪器。3.体内成像将允许药物和信息分子在人体中的功能可视化。医学中的三个重要革命:1.在未来的10-20年中,P4医学将出现。2.随着测量灵敏度的增加将达到生物学和医学的数字化,也就是提取来自单个个体,单个细胞,直至单个分子的相关信息的能力。3.所有的这些变化将减少无情增加的健康保健成本。