基因组研究自从开展以来已经取得了举世瞩目的成就。在过去几年中,已经陆续完成了包括大肠杆菌、酿酒酵母、拟南芥(T.Arabidopsis)等十多种结构比较简单的生物的基因组DNA的全序列分析。线虫(C.elegans)的基因组DNA测序工作已基本完成。规模更为庞大的人类基因组计划预期在本世纪初(2003~2005年)也将完成全部基因组DNA的序列分析。这些进展是非常令人振奋的。但是也随之产生了新问题。大量涌出的新基因数据迫使我们不得不考虑这些基因编码的蛋白质有什么功能这个问题。不仅如此,蛋白质作为生物功能的主要载体,拥有自身特有的活动规律,在细胞合成蛋白质之后,这些蛋白质往往还要经历翻译后的加工修饰、转运定位、结构变化、蛋白质与蛋白质间、蛋白质与其他生物大分子的相互作用等,也就是说,一个基因对应的不是一种蛋白质而可能是几种甚至是数十种。包容了数千甚至数万种蛋白质的细胞是如何运转的?或者说这些蛋白质在细胞内是怎样工作、如何相互作用、相互协调的?这些问题远不是基因组研究所能回答得了的。因为基因组学有这样的局限性,促使人们从整体水平上探讨细胞蛋白质的组成及其活动规律。为了充分了解和全面认识生命活动的奥秘,90年代中期,在人类基因组研究计划的基础上,萌发了一门新兴的学科¾蛋白质组学(proteomics),即从蛋白质组的水平进一步认识生命活动的机理和疾病发生的分子机制。科学家们预测,随着人类基因组全部测序工作的完成,21世纪生命科学的研究重心将从基因组学转移到蛋白质且学,生命科学领域内一个崭新的时代¾蛋白质组时代即将开始。1994年,澳大利亚Macquarie大学的Wilkins和Williams首先提出了蛋白质组(Proteome)的概念,最早见诸于1995年7月的“Electrophoresis”杂志上,它是指一个有机体的全部蛋白质组成及其活动方式。早期定义为:微生物基因组表达的整套蛋白质,在多细胞微生物中,整套蛋白质指一种组织或细胞表达的蛋白质,后来定义为:一个基因组所表达的蛋白质。但是,从基因表达的角度来看,蛋白质组的蛋白质数目总是少于基因组的基因数目。从蛋白质修饰的角度来看,蛋白质组的蛋白质数却多于其相应的ORF数目,因为mRNA的剪切和编辑可使一个ORF产生数种蛋白质,蛋白质翻译后的修饰,如糖基化、磷酸化同样增加蛋白质的种类,氨基酸序列一致的一级结构在一定条件下可以形成功能完全不一样的具有不同空间结构的蛋白质,如朊病毒。故蛋白质组内蛋白质数目要多于基因组内的基因数目。蛋白质组研究虽然尚处于初始阶段,但已经取得了一些重要进展。当前蛋白质组学的主要内容是,在建立和发展蛋白质组研究的技术方法的同时,进行蛋白质组分析。对蛋白质组的分析工作大致有两个方面。一方面,通过二维凝胶电泳得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱,相关数据将作为待检测机体、组织或细胞的二维参考图谱和数据库。一系列这样的二维参考图谱和数据库已经建立并且可通过联网检索。二维参考图谱建立的意义在于为进一步的分析工作提供基础。蛋白质组分析的另一方面,是比较分析在变化了的生理条件下蛋白质组所发生的变化。如蛋白质表达量的变化、翻译后修饰的变化,或者可能的条件下分析蛋白质在亚细胞水平上的定位的改变等。蛋白质组学(Proteomics)是以蛋白质组为研究对象的新的研究领域。它可分为:①表达蛋白质组学(expressionproteomics:即把细胞、组织中的蛋白,建立蛋白定量表达图谱,或扫描EST图。该方法依赖2-D凝胶图和图像分析技术,而且在整个蛋白质组水平上提供了研究细胞通路,以及疾病、药物相互作用和一些生物刺激引起的功能紊乱的可能性。②细胞图谱蛋白质组学(cell-mapproteomics):即确定蛋白质在亚细胞结构中的位置;通过纯化细胞器或用质谱仪鉴定蛋白复合物组成等,来确定蛋白质-蛋白质的相互作用。Humphery-Smith等总结了基因组结果后提出了功能蛋白质组(FunctionalProteome)的新概念。即细胞内与某个功能有关或在某种条件下的一群蛋白质。鉴于此,我国学者李伯良提出了功能蛋白质组学(FunctionalProteomics)的概念。即把功能蛋白质组作为主要研究内容。这一概念的提出,为蛋白质组研究的可能性奠定了理论基础。蛋白质组分析主要基于3条理由:①从mRNA表达水平并不能预测蛋白表达水平;②蛋白质的动态修饰和加工并非必须来自基因序列。在mRNA水平上有许多细胞调节过程是难以观察到的,因为许多调节是在蛋白质的结构域中发生的。许多蛋白只有与其他分子结合后才有功能,蛋白的这种修饰是动态的、可逆的,这种蛋白修饰的种类和部位通常不能由基因序列决定;③蛋白质组是动态反映生物系统所处的状态。细胞周期的特定时期、分化的不同阶段、对应的生长和营养状况、温度、应激和病理状态,这些状态所对应的蛋白质组是有差异的。蛋白质组学的研究可望提供精确、详细的有关细胞或组织状况的分子描述。因为诸如蛋白质合成、降解、加工、修饰的调控过程只有通过蛋白质的直接分析才能揭示。蛋白质组学强调的是针对蛋白质的一个整体思路。从整体的角度看,蛋白质组研究大致可以分为两种类型:一种是针对细胞或组织的全部蛋白质,即着眼点就是整个蛋白质组;而另一种则是以一个特定的生物学问题或机制相关的全部蛋白质为着眼点,在这里整体是局部性的。针对细胞蛋白质组的完整分析的工作已经比较全面地展开,不仅如大肠杆菌、酵母等低等模式生物的蛋白质组数据库在建立之中,高等生物如水稻和小鼠等的蛋白质组研究也已开展,人类一些正常和病变细胞的蛋白质组数据库也在建立之中。与此同时,更多的蛋白质组研究工作则是将着眼点放在蛋白质组的变化或差异上,也就是通过对蛋白质组的比较分析,首先发现并去鉴定在不同生理条件下或不同外界环境条件下蛋白质组中有差异的蛋白质组分。1999年11月在《Nature》杂志上发表了一篇用蛋白质组学方法研究蛋白质折叠的研究论文,揭示了蛋白质与分子伴侣GroEL相互作用的关键结构特征。这项工作很好地体现了蛋白质组学的思想方法和技术手段的应用。Rout等(JCellBiol,2000,148:635-651)通过使用蛋白质组学的手段鉴定了完整的酵母核孔复合体所有能检测到的多肽,并系统地对每种可能的蛋白质组分在复合体内定位并定量,从而揭示了酵母核孔复合体的完整分子结构,并在此基础上揭示了其工作原理。这个工作可以说是蛋白质组学解决结构生物学问题的一个典范,为揭示其它巨大分子机器的“构造”和工作原理指出了一条新路。从近期国际上蛋白质组学研究的发展动向可以看出,揭示蛋白质之间的相互作用关系,建立相互作用关系的网络图,已成为揭示蛋白质组复杂体系与蛋白质功能模式的先导,业已成为蛋白质组学领域的研究热点。2000年初,《Science》刊载了一篇应用蛋白质组学的大规模双杂交技术研究线虫生殖器官发育的文章,初步建立了与线虫生殖发育相关的蛋白质相互作用图谱,从而为深入研究和揭示线虫发育的机理等提供了丰富的线索。这一工作为以前专注于信号转导过程中单个蛋白质作用的科学家们提供了一个新的思路,即将整个途径的相关蛋白质一起考虑。如果说蛋白质学刚诞生时没有得到国际生物学主流的重视,那么近两年情况已有了巨大的改变。美国国立卫生研究院(NIH)所属的国立肿瘤研究所(NCI)投入了大量经费支持蛋白质组研究。同时,NCI和美国食品与药物管理局(FDA)联合开发可用于临床的蛋白质组技术。美国能源部不久前也启动了一个蛋白质组项目,旨在研究涉及环境和能源的微生物和低等生物的蛋白质组。欧共体目前正在资助酵母蛋白质组研究。英国生物技术和生物科学研究委员会最近也资助了三个研究中心,对一些已完成或即将完成全基因组测序的生物开展蛋白质组研究。在法国,五个研究不同模式生物的实验室得到为期三年的资助,每年约为500万美圆平均分配到基因组、转录组和蛋白质组研究中。德国也没有忽略蛋白质组研究,去年联邦政府投资了730万美圆开展蛋白质组和相关技术研究,并建立了一个蛋白质组中心。1998年澳大利亚政府着手建立第一个蛋白质组研究网APAF(AustralianProteomeAnalysisFacility)。APAF将为该国的有关实验室提供一流的仪器设备,并把他们整合在一起进行大规模的蛋白质组研究。我国关于蛋白质族研究的国家自然科学基金重大项目也从1999年开始启动。蛋白质组研究领域的另一个特色是,许多实验室、公司和药厂等很早就已经开始进行与应用前景有关的蛋白质组研究。如膀胱癌、早老年痴呆症的蛋白质组研究;利用蛋白质组技术筛选疫苗等。据报道,Myriad公司将与美国Oracle公司,日本日立股份和瑞士Friedli基金组织合作推出蛋白质组研究计划。由Myriad公司控股,四家公司共同投资一亿八千五百万美元成立的Myriad蛋白质组学股份有限公司将把鉴定人体中存在的30万种以上的蛋白质为目标,并力争弄清各种蛋白质之间相互作用的机制。对此,Myriad公司的首席执行官PeterMeldrum说:我们将力争在分子水平上去揭示生命过程的奥秘。Myriad公司的计划分为两个部分:第一部分,是在酵母中表达人体的每一种蛋白质的同时研究这些蛋白质的相互作用;第二部分则把目标放在分析人体蛋白质复合体的组成及其中各蛋白质组分的功能及调控机制上。总之,两个方面的研究将帮助科学家们了解蛋白质如何实现正常的细胞功能以及如何抵抗疾病的侵袭。同时,Myriad公司所面临的竞争也非常激烈,曾在人类基因组计划中发挥了重要作用的Celera公司也不甘示弱,他们也早就瞄准了蛋白质组学这一非常具有吸引力的研究领域。虽然蛋白质组学还处于一个初期发展阶段,但相信随着其不断地深入发展,蛋白质组(学)研究在揭示诸如生长、发育和代谢调控等生命活动的规律上将会有所突破,对探讨重大疾病的机理、疾病诊断、疾病防治、新药开发、植物生长发育调控机理等方面提供重要的理论基础。本学术方向的研究内容分两个方面,第一方面是蛋白质组(学)用于医疗研究。这方面的研究,将帮助人们寻找到一些用于医疗的可识别蛋白,这些蛋白可作为诊断标记或作为诊断靶分子提供给从事医药和诊断研究的机构。研究的重点主要有以下五个方面:(1)癌症针对研究的肿瘤类型包括:食道、肺、结肠、前列腺、胰腺、乳房以及成神经细胞瘤。(2)神经性疾病研究方向主要包括:脑损伤和感染性蛋白质疾病,如克雅氏病(CJD)、牛海绵状脑病(BSE)、帕金森氏病。(3)器官移植排异蛋白质组研究将寻求一种体外检测的方法,用于人体器官(心脏、肝、肺或肾)移植后的过敏和慢性排异性反应。(4)心血管疾病列入研究的心血管疾病有心力衰竭、高血压合肥大型心肌炎。(5)糖尿病、肥胖症通过蛋白质组学方法对于肥胖症及糖尿病相关的多肽进行识别,作为潜在的识别分子和治疗靶象。第二方面是用于植物生长发育及其调控机理研究。其主要研究的内容包括以下几个方面:(1)据于植物生长发育相关的蛋白质组学研究,如与植物光周期相关蛋白质组研究。(2)植物感应环境胁迫后细胞内蛋白质组谱的变化(3)种子发育过程中特异蛋白质的表达及其功能分析(4)信号识别、转导途径中蛋白组分分析(5)细胞器蛋白质组蛋白质组学研究尚处于一个起始阶段,我国在这方面的研究工作也才起步。目前国内许多大学和研究院所正在组织人员准备开展这方面的工作,希望在这方面有一席之地,但据了解,许多单位尚为建立一个合适的实验体系.