结构基因组学及其研究现状和展望

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

结构基因组学及其研究现状和展望摘要:大规模的全基因组测序计划正产生越来越多的序列信息,而理解这些信息的关键是理解基因产物——蛋白质的功能。在后基因组时代,蛋白质的三维结构解析是解释生命密码的重要部分。随着自动控制和基因组数据库的日益完善,结构生物学也进入了新的发展时代。现在,结构基因组研究迅速兴起并快速开展起来,它将大大加速蛋白的结构解析过程及与其紧密相关的蛋白功能的研究进程。结构基因组的研究将会带动生物科学各个领域及医药、农业、酶工程等许多方面的新发展。关键词:基因组结构基因组学蛋白质工厂生产线测定结构一.结构基因组学的起源:结构生物学以研究生物大分子的空间结构及其运动为基础来阐明其生物学功能,在生物学领域中占有重要地位,为揭示个体发育,生长,衰老,和死亡机理,神经活动和脑功能表现机理,细胞增值,分化和调亡机理以及几乎一切的生命科学问题提供必要的科学基础。近年的主要研究对象是蛋白质,包括受体蛋白,酶,通道以及与基因调控密接相关的核酸结合蛋白等的结构与功能的研究,还瞄准那些与功能密切相关的复合物的结构如酶和底物,酶与抑止剂,作用原与受体,DNA与其结合蛋白等。传统的结构生物学研究往往起始于生物化学对某个蛋白质的生物学功能有一定的了解,感觉到这个蛋白的重要性,需要进一步从结构和功能的关系上去理解蛋白质的功能调控机制,或者要从三维结构上去揭示其新的功能,这时生物化学家才把这个蛋白交给结构生物学家去解析它的精细结构。在后基因组时代,这种“作坊”时的结构生物学研究已经远远不能适应生物学的大发展和医学对生物学的迫切要求,它就笔削跨入到另一个更高的层次――工业化研究,既蛋白质结构工厂,这就是最新的结构基因组学。二.结构基因组学的概念结构基因组学(structuralgenomics)是基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图;根据使用的标志和手段不同,作图有4种类型,即构建生物体基因组高分辨率的遗传图、物理图谱、序列图以及转录图谱。三.结构基因组学的目标:(1).测定一些经过认真选择可能代表所有的折叠类型的蛋白。这样的工作量会大大减小,并且其他蛋白质的结构可以通过计算机技术模建出来。这对分析蛋白质结构特征在系统发生上的分布是有价值的,但是由于当前的模建技术还不能提供精确的原子结构信息,一些细微的差别无法确定,而这些微小的差别也许对蛋白质的功能有重要影响,所以这个目标正收到挑战。(2).测定相当数量的蛋白质结构,这些蛋白质结构来自几种模式生物的蛋白质表达谱或与疾病相关的蛋白质表达谱。这种方式能提供更精确的结构信息,为阐明生物大分子的结构与功能提供更详实的资料。尤其是,从与疾病相关的蛋白表达谱去测定蛋白质结构,可以为疾病机制的阐明和疾病治疗提供重要信心。四,结构基因组学的研究现状结构基因组的研究使结构实验室转向结构工厂。巨大的结构工厂将以一种前所未有的规模,将线性的基因组数据转化为最终的蛋白结构。与传统的结构解析方法相比,结构基因组研究中的生产线更添了自动化操作,使整个过程得以快速完成,这也使得大规模解析蛋白质结构得以实现。首先是基因组计划的圆满完成、cDNA文库的日趋完善等为结构基因组研究提供了的较好的基础,而与表达、纯化及结构测定相关的技术的发展与设备的改进也为这一过程自动化提供了良好的条件。此过程中的重要步骤,蛋白的结构测定技术———X光衍射和核磁共振光谱法(NMR)近年来也有了很多新的改进,出现了很多新的功能完善的仪器。这也为生产线的顺利完成提供了保障。利用自动化蛋白质结构生产线解析蛋白质结构是很简单快捷的,比如结晶过程的复杂步骤也可转入计算机控制的轨道,通过改变含有蛋白质溶液的成千上万个孔的微环境完成。然而此生产线中仍存在许多问题[2],比如:许多蛋白质在培养物中可能不能表达,或不能正确折叠,或聚集成块从溶液中析出。膜结合蛋白尤其麻烦,因为它们在水溶液中不能正确折叠。有时一些可溶性蛋白也很难结晶。但总体来说,结构基因组学的巨大优点现在已经很明显,前两年中,已有约70种蛋白用DNA序列数据作为起始信息获得了结构。世界结构基因组学中心正在全世界范围内推进整个生产线自动化方面的发展。五.结构基因组学面临的挑战(1)研究基础设施为先。蛋白质结构分析包含一系列复杂、困难的步骤。测定一个中等的蛋白质的结构要从相应的基因序列的简单知识开始,一般要花数周到几个月的时间。这种工作必须由博士级的科学家来做,要用高级仪器和高性能计算机。要对结构基因组学所提出的挑战的大小有个概念,不妨以低等生物为例,即使低等生物的基因组也对上万个不同的蛋白质编码(对人类而言,这个数字也许超过10万)。两个基本的实验方法——射线晶体学和核磁共振是要用到的。结构测定用的x射线用电子储存环产生。储存环成本可达数亿美元,由政府建造和运行,每台机器可同时服务十几个实验。大学的科学家的工作如得到政府有关机构的批准和资助,他们就不必负担.射线费。私营企业如能负担适当比例的运行费用,也可以在.射线设施上进行产权研究。几个国家正在研制自由电子激光器,这种激光器产生的X射线束强度可比电子储存环的%射线高几个数量级。虽然这种设施仍然极其费钱,但可向周围提供足够的X射线。(2)第二个大挑战与结构基因组学范围相关。因为结构分析非常费钱费时,所以在选择一组适于分析的蛋白质时必须慎之又慎。工业研究人员更喜欢关注与疾病有关的分子&如病毒霉’,因为这些分子可能是有希望的“药品靶子”。学术研究人员可能更倾向于研究能洞察更广泛的问题如细胞代谢作用或进化论的蛋白质。在这些不同类型的追求之间没有明确的界线。也许需要确定一些协调的机制来促进有关分析什么蛋白质的信息交流,并避免不必要的工作重复。同一蛋白质的遗传序.(3)知识产权构成第三个关键挑战。围绕着基因组研究成果的专利性产生的问题是有争论的、复杂的,在一套一致的条例出现之前,法院将要忙碌一段时间。蛋白质结构本身可申请专利的程度还没有完全解决。它们与有关列的基本专利毫无联系。从某种意义上说,知识产权体现着对结构基因组学进步的阻碍,因为许多研究人员不愿意将可赚钱的信息投入公共领域,这是可以理解的。尚不清楚的是,参加人类基因组计划的科学家和机构达成的标准&极强调原始数据的迅速公布’是否可以轻易地转移到政府资助的结构基因组学计划上。例如,美国、欧洲和日本三者的专利法规差异会使问题进一步复杂化,它们的发表成果和及其应用于专利保护之间的“宽限期”适用规定有所不同。六.结构基因组学继续解决的问题(1)蛋白表达和纯化许多重组蛋白表达出来成为包涵体,无法实现自动化纯化,因为每个蛋白的变性,复性条件不大一样。还有很多蛋白在现有的表达系统中不能得到有效的表达,也就无法获得大量的蛋白以测定其结构。而且,蛋白纯化本身就是生活化学中的一个难题。蛋白性质各异,纯化条件可能各有千秋,这样,在蛋白纯化的自动化实现上就存在很多困难。(2)晶体生长发展高通量的晶体生长技术就是结构基因组学的一个重要方面,但是长期以来,晶体生长就被认为是一门艺术,而不是科学。这是因为,晶体生长毫无规律可循。要得到衍射良好的晶体样本是一个很大的挑战。此外,膜蛋白的结晶一直令晶体学家们望而生畏,而膜蛋白占了细胞蛋白的近30%,许多的药物靶也是以膜蛋白,膜结合蛋白为主,如膜受体,离子通道等。由于膜蛋白固有的两亲性特征,因而极难在水溶性体系中结晶。而且,由于膜蛋白不溶于水和它们的分子量偏大,NMR结构测定技术也常常束手无策。所以,膜蛋白的结构测定也许是结构基因组学面临的最大挑战。还有,由于晶体生长的困难性,复杂蛋白,蛋白复合物的结构测定在目前的技术水平上也不可能实现工业化。(3)结构计算结构修正正是结构计算过程中的一个瓶颈,需要很多的脑力资源。(4)动态结构分析对于动态的结构分析,多维核磁共振是蛋白质溶液三维结构测定的最重要手段,近年来取得了飞速的发展,但是测定蛋白的大小仍然受到很大的约束,上限还不能突破35KD。在这一领域一直存在这个两个备受关注的问题,即NMR测定蛋白质溶液结构的分子量有无上限和蛋白质溶液NMR结构能否达到与X射线晶体结构相比拟的分辨率水平。对结构基因组学来说,NMR技术的数据收集时间过长(45-60天),尤其数据分析时间更长(6-12个月),对高通量结构测定同样是一个很大的挑战。七、结构基因组研究展望结构基因组学研究具有巨大的科学意义,也具有明显的应用前景和社会,经济效益。在生物学领域许多激动人心的发现中,有相当大的一部分是由于生物大分子晶体结构的解析进而在原子水平上对细胞功能活动的深入认识而取得的。生物大分子的改进和基于结构的合理药物设计都必须依赖于生物大分子的三维空间结构的精细测定。全基因组测序计划产生了大量的功能未知蛋白,功能基因组研究想要跟上其步伐,从结构基因组学研究入手是迅速而合理的途径,这是科学家明智的选择。三维结构信息可以获知未知蛋白质可能具有的辅基,金属配体等,还有酶的催化位点,调节区域等。根据结构特征,可能推断出酶的催化机制,蛋白和蛋白间的结合,蛋白和核酸的相互作用。这种对新蛋白的结构特性分析可以从结构上为其归类,根据其结构同类家族的功能特征确定其未知功能,为功能研究提供新的视野。随着结构基因组学的启动,产生大量的结构信息,必将带给生物学更多更深入的发现,从而把我们对生命的认识提高到一个更新更高的境界,并促进以高科技为特征的基因组工业的迅速发展。尤其是以重大疾病相关基因和功能基因的蛋白质表达谱为主要对象的结构基因组学的开展,在目前的条件下具有更现实和重要的意义。目前结构基因组研究还处于起步阶段,存在着技术上的障碍,但丰县投资家们都很自信,StructuralGenomiX公司打算把实验和理论计算机结合起来,去来发大量机诶构信息产生的巨大商业价值。现在很多机构在研究中有很大一部分精力要放在生产线的完善上,这种情形可能会持续5~10年。日本研究机构的领导人Yokoyama预言说:“在结构基因组学对生物产生巨大的冲击前至少还会有5年的时间,此后,它将迅猛发展起来。”随着研究的纵深发展,人们的研究对象也将从现在的蛋白单体转向蛋白多聚体或是蛋白DNA、蛋白-RNA等的复合物,结构检测也可能从现在的单结构域转向整个蛋白的结构或是研究其反应过程的动态变化。随着结构基因组工作的进展,绝大多数工作将交由新的蛋白工厂研究,结构生物学可能从此走向工厂化机械化操作。但这并不是意味着结构生物学家将无事可做。接下来还有更加困难更加重要的工作,即破译蛋白结构与生物功能的关系。那时,那些有远见,有创造力的结构生物学家将成为抢手人才。正如德国研究机构的领导人Heinemann所说,“工厂化科学并不是结构生物学的结束,一切都将会更好的。”参考文献[1]王大成.后基因组时代的结构生物学.生物化学与生物物理进展.2000,27(4):340-344[2]吴学军,柴建华.比较基因组学和人类基因组研究[J].生物工程进展,2002,20(1):5761.[3]BaxeviansAD,FrancisOuelletteBF著,李衍达,孙之荣等译.生物信息学:基因和蛋白质分析的实用指南[M].北京:清华大学出版社,2000.[4]张成岗,贺福初.生物信息学:方法与实践[M].北京:科学出版社,2002.[5]景志忠,才学鹏.模式生物基因组研究进展[J].生物医学工程学杂志,2004,21(3):506511.[6]解涛,梁卫平,丁达夫.后基因组时代的基因组功能注释[J].生物化学与生物物理进展,2000,27(2):166170.]

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功