国防科学技术大学硕士学位论文基于谱方法的蛋白质相互作用网络分析姓名:董蕴源申请学位级别:硕士专业:计算机科学与技术指导教师:王正华20071101基于谱方法的蛋白质相互作用网络分析作者:董蕴源学位授予单位:国防科学技术大学相似文献(8条)1.学位论文李栋大规模蛋白质相互作用网络的构建和分析2006本文对大规模蛋白质相互作用网络的构建进行了研究。文章以胎肝中鉴定蛋白质为研究对象,采用文献挖掘和生物信息学预测方法,并整合酵母双杂交实验数据,建立了小规模的胎肝蛋自相互作用网络,并在此网络中发现了一些胎肝中可能存在的对其发育和分化的分子机制有较强提示作用的功能模块。其中一个模块已经部分为实验证实,表明该项研究对实验有一定的理论指导意义。在胎肝蛋白相互作用网络的研究中,本文还发展了大规模蛋白质相互作用研究的生物信息学支撑平台,用以实现酵母双杂交实验数据的收集和存储、蛋白质相互作用的预测、蛋白质相互作用网络可视化等多种功能。该平台预测的人蛋白参考网络已成功用于指导国内大规模酵母双杂交实验的诱饵遴选。其次,本文引入了基因本体论(GO,GeneOntology)用于高通量蛋白质组数据的生物学功能分析。传统文献挖掘方法分析高通量蛋白质组数据耗时且低效。基于等级化、结构化的词汇表GO和蛋白质在数据库中的GO注释,本文发展了一种对高通量蛋白质组数据进行功能分析的策略。该策略可自动对蛋白质组数据进行功能注释和功能聚类,提供功能分析所需的基本信息;同时给出蛋白质功能分布和类别统计信息,有助于从整体上理解蛋白质集合的功能。本文基于该策略发展的网络分析工具GOfact已经在蛋白质表达谱分析、蛋白质相互作用数据可信度评估和胎肝蛋白网络功能模块分析方面都发挥了重要作用。第三,本文对蛋白质相互作用网络的拓扑结构进行了系统分析。分析网络拓扑结构往往是研究复杂蛋白质相互作用网络的第一步。本文通过对酵母、线虫和果蝇三个大的蛋白质相互作用网络的研究,在更大的范围内证明了蛋白质相互作用网络具有无尺度和模块化的性质,并且证明网络中蛋白质的等级组织形式是蛋白质网络无尺度和模块化性质的根源。本文指出网络直径是描述蛋白相互作用网络连通性的重要指标,并首次揭示了蛋白质相互作用网络的保守直径现象。通过模拟外界环境对蛋白质相互作用网络直径的随机扰动,本文发现了蛋白质相互作用网络的高度稳健性,并进而通过计算模拟的方法指出了蛋白质网络的稳健性来自于网络中少量高连接度蛋白的存在。该项研究有助于人们认识蛋白质相互作用网络的复杂性,对指导大规模蛋白质相互作用网络的构建和分析乃至今后的系统生物学研究都有重要意义。最后,本文将贝叶斯方法用于高通量蛋白质相互作用数据的可靠性分析并取得了很好的效果。高通量筛选蛋白质相互作用会产生大量的假阳性结果,因此,高通量蛋白质相互作用数据分析中非常关键的一步即是评估蛋白质相互作用数据的可信度,并得到一个可靠的核心数据集。本文使用似然比考察了不同蛋白质相互作用证据的可靠性,并使用朴素贝叶斯网络整合多种证据到一个统一的概率模型中。通过对该评估模型的测试,发现其相对于单一证据方法和简单投票方法具有更高的灵敏度和特异性。在建立的贝叶斯评估模型的基础上,本文还发展了一个用于蛋白质相互作用数据可信度评估的网络分析工具PICASSO。作为一个专门用于蛋白质相互作用数据可信度评估的网络分析工具,PICASSO将在大规模蛋白质相互作用网络研究领域发挥重要作用。2.学位论文张永新大鼠心肌肥厚过程中基因/蛋白质相互作用网络的构建2007心肌肥厚是心脏对多种刺激因素的一种适应性反应,是心衰的重要病理学基础,多种基因/蛋白质共同参与了心肌细胞肥大过程。儿茶酚胺,和血管紧张素是两种导致心肌肥厚的常见神经体液因素。在机械负荷诱导心肌肥厚过程中,同时涉及了这两大类因素。为从整体层面更好的理解不同因素刺激下心肌细胞肥大过程中的共同机制,本研究以苯肾上腺素(PE)诱导的心肌细胞肥大和主动脉缩窄(AB)诱导的心肌肥厚模型中的差异表达基因为基础,采用文献挖掘方法,构建不同模型下基因/蛋白质相互作用网络。通过对所构建的不同模型的网络进行对比分析,发现在两种模型导致心肌细胞肥大的机制中Gna12、Gna13、P38、ERK1/2、P13K、NFκB、RhoA、JNK等信号转导分子可能共同参与了此过程。与主动脉缩窄致心肌肥厚模型相比,Ras、PKC通路对苯肾上腺素诱导心肌细胞肥大的贡献更大。而TGFβ1、SMAD3、SMAD4可能是AB诱导心肌肥厚机制中,不同于PE模型中单纯由α,1-肾上腺素受体激动诱导心肌细胞肥大的机制之一。通过对PE诱导心肌肥大模型、AB诱导心肌肥厚模型的基因/蛋白相互作用网络共同基因子网络分析,推测甲状旁腺相关蛋白(PTHrP)所启动的信号转导通路可能也参与心肌肥厚过程。3.期刊论文梅娟.王正祥.石贵阳.李炜疆.MEIJuan.WANGZhen-gxiang.SHIGui-yang.LIWei-jiang复杂生物网络分析的图聚类方法研究进展-食品与生物技术学报2008,27(5)基因组学和高通量技术提供了大量生命系统组成元件(如蛋白质)之间相互关系的数据,由这些关系数据构成的复杂生物网络蕴含着丰富的生命系统运行机制的知识,挖掘这些隐蔽的知识成为当前系统生物学的主要任务之一.作为知识发现重要手段的图聚类方法,在复杂生物网络分析上受到了普遍关注,在远同源性探测、蛋白质功能预测、代谢途径发现等方面取得了令人瞩目的结果.同时也注意到,由于生命系统的高度复杂性,其他领域中卓有成效的方法往往在复杂生物网络分析中遇到困难.评述了近年来图聚类算法在复杂生物网络分析中的进展,简要分析了复杂生物网络研究的图聚类途径所面临的主要问题.4.学位论文冯子男细胞信号转导的复杂网络分析和灯盏花素注射液HPLC指纹图谱相似性评价2006本文第一部分主要是运用化学计量学方法对通过Internet采集到的数据进行整合,对细胞信号转导系统中发挥主导功能的蛋白质进行了聚类分析并讨论他们之间的相互关系,最后还尝试将结果进行可视化处理。现代生物学面临的一个重大挑战就是如何系统的描述一个活细胞内的所有分子和分子相互作用。细胞中有许多生物反应通路,比如物质代谢通路、基因表达通路、DNA复制通路、信号转导通路等等,其中最复杂的就是信号转导通路。信号转导通路是非线性排列的,许多信号转导通路可以通过一系列的蛋白质与蛋白质相互作用形成一个网络。京都基因和基因组百科全书KyotoEncyclopediaofGenesandGenomes(KEGG)提供了14条细胞信号转导通路的途径图,其中12幅具有蛋白质相应的Entry号,本文将这12幅图转换为邻接矩阵,再利用矩阵运算将这些邻接矩阵合并成一个总的邻接矩阵,得到共有933个节点,6825条边的细胞信号网络总图。通过计算此网络总图静态几何量,发现该网络系具幂律形式的度分布、遵循BA模型的无尺度网络(ScaleFreeNetwork),其核心节点正是信号转导途径中最为活跃的几种蛋白质。通过广度优先搜索算法得到距离矩阵进行系统聚类同样可以看到,多数蛋白质围绕几种核心蛋白质按照功能关系聚集成团,结果与先验知识较为吻合。本文第二部分主要是利用HPLC指纹图谱相似性评价对灯盏花素注射液进行中药质量评价,并采用系统聚类方法进一步研究样品之间的关系。中药是中医防病治病的物质基础,其质量的优劣直接影响中医的临床疗效和实验研究,对于中药质量的评价也一直是中药研究和生产领域里的重要研究课题。中药绝大部分来源于植物,少数来源于动物和矿物,每一味中药几乎都包含有很多种化学成分,中医运用中药治病实际上就是利用了这些化学成分,产生一种整体的疗效。随着科学技术的发展,中药的部分化学成分被明确,很多成分与疗效在一定程度上存在着明显的量效关系,成为中药品质评价的主要指标。然而中药的疗效是中药中所有化学成分综合作用的结果,单凭几种成分不能真正反映出中药品质的实际水平,在此基础发展起来的中药指纹图谱就能较好的解决这个问题。中药材指纹图谱系指中药材经适当处理后,采用一定的分析手段,得到的能够标示该中药材特性的共有峰的图谱。如原药材需经过特殊炮制(如醋制、酒制、炒炭等),则应制定原药材和炮制品指纹图谱的检测标准。本文通过对10批灯盏花素注射液的HPLC数据进行分析,讨论了相似度计算在中药质量评价中的应用,采用夹角余弦法和相关系数法计算相似度,并对其进行了系统聚类,得到了满意的结果。5.学位论文余鑫煜血管生成素相互作用蛋白质网络的构建2008血管生成素(ANG)是最初从人结肠癌细胞系HT-29培养液中分离纯化得到的生长因子,因其具有强烈的促血管新生活性而得名。它属于单链碱性蛋白质,由123个氨基酸残基组成,分子量约为14kDa。目前,已经知道血管生成素作为一个重要的血管生成因子,在肿瘤血管生成的过程中发挥重要作用,它可激活细胞外周的蛋白酶并降解基底膜和胞外基质、可活化信号通路、可进入靶细胞的细胞核并促进rRNA转录,从而促进血管内皮细胞及平滑肌细胞的迁移、增殖和粘附。但从总体上看,对血管生成素促进血管新生的分子机制认识还不全面,许多方面尚待深入研究。蛋白质是生命活动的体现者和执行者,蛋白质-蛋白质之间的相互作用几乎参与了每一个生物学过程,并在其中扮演极其重要的角色。由此,推测蛋白质之间的相互作用必定也介导或调节了血管生成素促血管新生的生物学过程,但目前对血管生成素相互作用蛋白质的了解较少。为了探索蛋白质相互作用在血管生成素功能活动中的作用,本实验室利用酵母双杂交技术,从人心肌cDNA文库和人肝脏cDNA文库中筛选得到21个与血管生成素可能具有相互作用的蛋白质,包括α辅肌动蛋白-2(ACTN2)、解整合素金属蛋白酶33(ADAM33)、Chordin(CHRD)、含表皮生长因子结构域的fibulin样胞外基质蛋白1(EFEMP1)、含表皮生长因子结构域的fibulin样胞外基质蛋白2(EFEMP2)、表皮生长因子样结构域7(EGF-like-domain,Multiple7,EGFL7)、Fibulin-1(FBLN1)、Fibulin-2(FBLN2)、纤粘连蛋白(FN1)、颗粒蛋白(GRN)、α干扰素诱导蛋白27(IFI27)、层粘连蛋白β链(LAMB2)、潜活TGF-β结合蛋白3(LTBP-3)、潜活TGF-β结合蛋白4(LTBP-4)、人类枯草溶菌素转化酶6(PCSK6)、磷脂混杂酶1(PLSCR1)、肌纤维膜结合蛋白(SLMAP)、sprouty同源物1(SPRY1)、滑膜细胞凋亡抑制物1(SYVN1)和PXDNL。为了在这些可能的血管生成素相互作用蛋白质中确定与血管生成相关的重要蛋白质、探索它们之间的内在联系、建立可能的促进血管生成的生物学通路,本学位论文计划从酵母双杂交的结果出发,采用系统生物学的方法和手段,寻找包括血管生成素在内的22个蛋白质之间的可能联系,尝试构建血管生成素相互作用蛋白质网络,以期为下一步的实验研究提供指导性线索。为此,利用DAVID系统和BiNGO系统,本研究首先调查了这22个蛋白质在结构上的相似性和功能上的相关性。从结构角度分析发现,这22个蛋白质中有10个蛋白质均包含一个表皮生长因子(EGF)结构域;而在这10个蛋白质中,有7个蛋白质均包含钙离子结合的表皮生长因子结构域(EGF-CA),提示EGF结构域在这些蛋白质与血管生成素之间的相互作用过程中扮演重要作用。随后,对7个均含有EGF-CA的蛋白质片段进行多序列比对,发现存在一条非常保守的EGF-CA模序,命名为ANG-EGF-CA-Motif,深入研究该模序在血管生成素与蛋白质相互作用中的功能是有意义的。分析显示,酵母双杂交筛选得到的相互作用蛋白中有四个是Fibulin家族蛋白,且从cDNA文库中筛选获得的片段均为该家族高度保守的EGF-CA重复序列。据此,预测Fibulin家族的最后一个成员Fibulin-5可能与血管生成素也有相互作用,可以用实验验证。功能分析显示筛选到的蛋白质大部分属于胞外基质蛋白,少部分属于膜蛋白、胞内基质