生物网络的结构和动力学稳定性青岛理工大学樊嵘•引言•细胞中调控网络的特性,研究方法和领域•酵母细胞周期和生命周期网络的动力学稳定性•细胞中的蛋白质,DNA,和RNA之间的相互作用网络执行着并决定了细胞中的生物功能.相对于较为稳定的基因组,细胞调控网络针对不同的环境信号,通过不同的蛋白质的状态不断变化产生反应,完成细胞生长,繁殖,分化,发育等生理功能,即通过动力学过程完成生物学功能.1引言•在20世纪末到21世纪初的十多年里,分子生物学发生了令世人瞩目的变化:1,由于基因组测序,蛋白质组学的快速发展,生物学积累了大量的数据,如何挖掘出大量试验数据所蕴藏的生物基本规律成为生命科学研究的焦点;2,研究生物学系统的信息处理过程开始从单一信号传导通路的定性描述转移到对复杂蛋白质与基因调控网络的定量刻画.在此基础上产生出一个研究细胞调控网络整体性质的交叉学科:系统生物学系统生物学的研究可以分为以下几个层次:1.数据收集,分析;2.生物网络的建立;3.基于生物网络的理论模型建立;4.生物网络的拓扑与动力学性质;5.生物网络行为的预测与控制;6.生物网络的演化,设计原则,新网络或人工基因调控回路的设计细胞调控网络的系统生物学研究•细胞调控网络的系统生物学研究方法:1.把细胞内基因,mRNA,蛋白质,生物小分子等不同组分和它们之间的复杂相互作用整合简化为网络;2.建立理论模型,研究网络的结构与动力学性质及其间的关系,以及网络作为整体所呈现的协同作用;3.提出理论预言,进行科学假设驱动下的实验研究•细胞调控网络的系统生物学研究意义:在了解生物网络基本规律的基础上可以开展基于网络的疾病机理研究和药物设计等相关应用研究.生物分子医学:基因诊断,基因治疗等2细胞调控网络的特性,研究方法和研究领域细胞通过其中的DNA,RNA,蛋白质和蛋白质复合物之间的复杂相互作用,应对环境的变化,完成新陈代谢,细胞增殖,生长,发育等各种生理学功能.基因组中的遗传信息通过中心法则,从DNA转录RNA,由RNA翻译成蛋白质,最终通过蛋白质起作用,蛋白质是完成各种生物学功能的执行者.在活细胞中,不同种类蛋白质的数量和活化状态始终处于不断变化的动态过程中.2.1蛋白质网络和基因调控网络及其整体特性•生物网络主要研究以下四个基本性质:1.结构性质(networkstructure):包括基因调控网络,生物化学反应途径和网络的连接结构性质,网络中的基本结构模块(module)或模式(motif);2.动态特征(systemdynamics):即在不同条件下,生物系统随时间的演化过程和动态性质;对于连续变量的网络模型,可以利用非线形动力学中的相图,敏感性分析,分叉点分析等方法研究系统的动力学规律,以理解生物系统的内在动力学机制;3.控制方法(controlmethod):研究正反馈,负反馈和时间延迟等控制机制在生物调控网络中的作用;4.设计方法(designmethod)生物系统的网络表示•生物网络:把基因,蛋白质简化为节点,其间相互作用简化为节点之间的连线.在蛋白质-蛋白质相互作用网络中,常用无向连线表示两个蛋白之间存在物理相互作用.图2.1a海胆endo16基因的调控网络在基因调控网络中,A蛋白对B蛋白的调控作用常用A节点指向B节点的箭头来表示,还可以对箭头加上不同的权重或者颜色来表示不同强度的抑制或者激活作用图2.1b海胆endo16基因调控逻辑图2.1a海胆endo16基因调控序列的蛋白质-DNA相互作用图谱2.1b模块A和模块B之间的调控逻辑模型图2.2b调控芽殖酵母生命周期过程的调控网络图2.2a芽殖酵母蛋白质-蛋白质物理相互作用网络2.2a蛋白质-蛋白质相互作用图谱2.2b细胞周期调控网络•利用图2.2a中酵母细胞的蛋白质-蛋白质相互作用数据,A.L.Barabasi小组研究了酵母蛋白质作用网络的整体结构性质,发现其中蛋白质的连接度服从无尺度分布(scale-freedistribution),越是重要的蛋白与它连接的线段数目越多.对该网络中的节点进行随机敲除,发现网络具有稳定性;但如果敲除网络中的关键高连接度节点,网络很容易被破坏.•进一步研究发现,越是古老的蛋白,越具有高的连接度,这说明蛋白质网络结构上的无尺度网络分布性质可能与基因调控网络的形成和进化存在着一定的联系复杂网络的构建原则-网络基元(networkmotif)•U.Alon等科学家对基因调控网络中的基本结构单元(motif)进行了研究.•对于随机网络而言,基因调控网络中出现频率非常高的连接子图被称为网络基元(networkmotif),网络基元是基于网络的拓扑连接特征提出来的,被认为是构造网络的基本”砖块”.是网络中具有简单结构的单元,它表示的是转录因子和靶基因之间相互调控关系的特定小规模模式,通常由少量的基因按照一定的拓扑结构构成。ThreechainmotifFeedForwardLoopMotifBi-parallelMotifBi-fanMotif食物网食物网,神经元网络神经元网络,基因调控网络神经元网络,基因调控网络•大肠杆菌有3种调控网络motif:1.前馈回路(FeedForwardLoop,FFL)2.单输入motif(SingleInputMotif,SIM)3.密集重叠调控(DenseOverlappingRegulon,DOR);•而对于啤酒酵母转录调控网络,人们提出了6种网络motif:1.自调控(Auto-regulation)2.多组件回路(Multi-ComponentLoop)3.前馈回路(FeedForwardLoop,FFL)4.单输入motif(SingleInputMotif,SIM)5.多输入motif(Multi-InputMotif)6.调控链(RegulatorChain)。啤酒酵母转录调控网络的6种motif•网络基元是搭建网络的基本砖块,而自然界中的复杂网络是自组织形成的,那么自然界中的网络基元是怎样产生的,又是怎样被自然界选择并保留下来的呢?•W.Banzhaf等认为基元的产生可能与基因的复制/分歧(duplication/divergence)有关.细胞调控网络具备的整体性质•鲁棒性和稳定性•生物网络演化过程的可进化性•生物网络演化过程的适应性•细胞生活在复杂多变的内外环境中,某些基因可能出现突变或缺失,各种营养物质及温度,ph值会变化,细胞内部mRNA和蛋白的合成也存在着随机涨落.这就要求细胞在环境扰动的情况下,甚至某些基因缺失的情况下,重要的生物学状态和基本的生物学过程应该还是稳定的.•那么生物调控网络如何实现这种鲁棒性和稳定性的呢?通过网络的结构性质来实现鲁棒性1.基因的冗余性(generedundancy).对于重要的生物学过程,网络结构中常常出现具有相近功能的多备份节点.2.功能模块化(functionalmodule)生物网络中执行某一生物功能的子网络会出现模块化,也就是子网络相对独立,模块内部联系密切,模块之间相互作用较少.这样可以避免局部的失效可能导致的系统整体的崩溃.生物网络的功能模块化可能与网络的进化有关.3.网络中的反馈机制,尤其是负反馈可以提供稳定性.通过网络的动力学性质来实现稳定性环境中温度和酸碱度的变化都可能引起生化反应速率即相互作用强度的变化.生物网络常常通过正反馈,负反馈及其间相互耦合来实现以上的动力学稳定性.状态稳定性:研究网络中不同蛋白的数量浓度发生变化时,网络所执行的生物学过程是否能继续完成.结构稳定性:研究网络中相互作用强度发生变化时,生物学状态和过程的稳定性.生物网络的动力学性质•相对于较为温度的基因组,蛋白质调控网络是通过不同的蛋白质的状态对各种环境信号的不断变化产生反应来实现的,即通过动力学过程来完成生物学功能.2.2生物网络的动力学性质及研究方法动力学研究方法参见图2.3thedifferentlevelsofdescriptioninmodelsofgeneticnetworks图2.3动力学研究方法连续变量微分方程组模型离散模型随机过程模型流平衡分析法Whereassinglegenescanbemodeledinmoleculardetailwithstochasticsimulations(leftcolumn),adifferentialequationrepresentationofgenedynamicsismorepracticalwhenturn-ingtocircuitsofgenes(centerleftcolumn).ApproximatinggenedynamicsbyswitchlikeON/OFFbehaviorallowsmodelingofmidsizedgeneticcircuits(centerrightcolumn)andstillfaithfullyrepresentstheoveralldynamicsofthebiologicalsystem.Largegeneticnetworksarecurrentlyoutofreachforpredictivesimulations.However,moresimplifieddynamics,suchaspercolatingflowsacrossanetworkstructure,canteachusaboutthefunctionalstructureofalargenetwork(rightcolumn)动力学研究方法连续变量微分方程组模型离散模型随机过程模型流平衡分析法连续变量微分方程组模型适用条件:当参加反应的分子个数较多,在100~1000量级以上时,可以忽略分子个数的涨落,把蛋白质数目或者浓度变化作为连续变量.常用方法:利用反应动力学,建立连续变量的微分方程组.通过蛋白质的产生率,转移率和降解率,建立蛋白质浓度随时间变化的微分方程模型.优点:缺点:优点:1.利用反应动力学,较容易建立动力学模型;2.利用非线性动力学中的相图,敏感性分析,分叉点分析等方法,研究系统的动力学规律和内在动力学机制;3.得到的理论结果可以与实验结果直接相比较,并用实验结果修改理论模型中的反应项和参数4.进一步提出基于调控网络整体结构的,适合实验检验的定量理论预言缺点:1.现有的大量生物学实验研究集中在调控网络的稳态结果而非动态过程;2.大量的实验数据都是定性的,很少有定量的实验结果可以与理论模型相比较,这就使得连续模型中大量的参数估计和取值存在较大的不确定性,即模型的结果稳定性问题;3.细胞中的生化反应具有随机性,会受到细胞内外环境噪声的影响,相互作用也具有很强的非线性.对于非线性问题,尤其是网络的全局性,稳定性问题,非线性动力学中只有线性稳定分析和中心流形分析等局部分析手段,没有一个有效的全局稳定性的一般方法.离散模型适用条件:细胞调控过程中,蛋白质的作用常常处于激活或者未活化两种状态,类似于开关的开启和关闭状态.常用方法:布尔网络模型优点缺点离散模型的优点1.不需要定量的蛋白质浓度和反应速率参数,只需要”粗粒化”的蛋白质活性和相互调控关系2.能够方便的研究调控网络的全局动力学稳定性,包括状态稳定性和结构稳定性.即在演化规则下遍历不同的初始状态的演化过程,并得到最终的稳定态,可以了解网络的状态稳定性3.改变网络的相互作用强度或者权值,又可以得到网络的结构稳定性.成功案例离散模型的缺点由于离散模型把蛋白质状态,生化反应过程和反应时间都进行了粗粒化描述,所以得到的动力学性质常常只能定性地与实验结果相比较,比较难于提出定量或者精确的,可以被实验验证的理论预言.随机过程模型•适用条件:当研究少量转录因子与DNA相结合引起的mRNA转录和蛋白质翻译过程,就不得不考虑其中的随机涨落效应,这时就需要利用随机过程模拟生化反应.•优点:利用随机过程研究细胞中内外噪声(intrinsicandexternalnoise)可以得到基因转录,调控过程的动力学细节.流平衡分析法(f