书书书中国生物工程杂志 ChinaBiotechnology,2006,26(9):76~83檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪殏殏殏殏综 述环境微生物不依赖于培养的基因组学研究及应用王凤超1 刘巍峰1 陈冠军1 刘春朝2(1山东大学生命科学学院微生物技术国家重点实验室 济南 250100)(2中国科学院过程工程研究所生化工程国家重点实验室 北京 100080)摘要 微生物在生物圈中分布广泛,并且在地球物质循环中占有重要地位,但是约99%的微生物目前还不能通过传统的培养方法得到纯培养物(即未培养微生物),给这些未培养微生物的研究带来很大的困难。随着分子生物学的快速发展及其在微生物研究中的广泛运用,促进了以环境中未培养微生物为研究对象的新兴学科———环境基因组学的产生和发展。在不进行相关微生物培养分离的情况下,通过从环境样品中直接提取获得所有微小生物的全部遗传物质,并构建环境基因组文库;进一步利用功能基因组学研究策略,从文库中寻找编码产生新的有生物活性产物的基因;通过对系统发育相关锚定位点基因序列分析,从而确定特定生态环境体系中未培养微生物的种类结构组成及进化地位,并最终重建该体系中微生物群体的基本物质循环模式。此外,环境基因组学也可以在对未培养微生物生理生化特性深入了解的基础上,建立发展合适的培养体系,最终获得某些特定微生物的纯培养物。对环境基因组的构建及相关分析研究策略的进展进行了综述;同时介绍了其微生物分类及在生态学研究中的应用。关键词 未培养微生物 环境基因组学 基因组文库 功能分析筛选 微生物生态中图分类号 Q9399收稿日期:20060518 修回日期:20060629国家“973”计划资助项目(200413719700)通讯作者,电子信箱:weifliu@sdu.edu.cn 微生物在生物圈中占有统治地位,在地球物质循环(如碳,氮元素循环)中发挥着重要作用,对这些微生物的研究有助于了解生命的起源及进化。传统的微生物学研究是建立在分离得到纯培养物基础上,进而研究其生理生化特性及其进化地位。通过采用这种方法,使人们在对微生物的研究和利用方面取得了很大成就,但传统微生物学研究方法把对微生物的研究只局限于可培养的微生物,而它们仅占自然界微生物的一小部分。现在虽然可以在实验室条件下培养得到一些以前非可培养的微生物[1],但仍然远远不能代表自然界中全部的微生物。随着现代分子生物学技术的发展,特别是PCR技术和16SrRNA基因等特定锚定序列分析被用于微生物鉴定等,使人们可以从环境中通过PCR扩增出微生物的16SrRNA基因,进而与数据库中的序列比对而鉴定出微生物的种类,这种分析使人们更加认识到了微生物的多样性[2]。据估计,在一些环境中大约有99%,甚至更多的微生物目前是不可培养的[3],对这些微生物进行进一步的种系确定及功能的阐述,促进了一门新兴学科———环境基因组学的兴起和发展。环境基因组学最初致力于把微生物与环境中呈现出的其中的某种功能相联系,并研究环境中的基因组多样性及进化关系[4]。随着基因测序技术的迅速发展,使对某一特定环境的全部基因组进行序列测定,从而使重建整个环境基因组体系成为可能,这将有利于人们从群体角度研究特定环境中微生物的功能活动及相互关系;同时,随着环境基因组学的发展,其在利用微生物资源多样性,筛选获得新型活性物质方面展示了巨大的潜力。相关研究已从构建的环境基因组文2006,26(9)王凤超等:环境微生物不依赖于培养的基因组学研究及应用库中陆续筛选到了编码合成新抗生素[5],脂酶[6],以及具有多种降解活性的酶类[7]等功能基因。这些结果充分说明了环境基因组学的应用价值,使不经过传统的培养方法也可以分析利用微生物资源成为可能。本文主要介绍了环境基因组学相关研究方法,其最新的应用进展,并对环境基因组发展的某些限制因素及相应解决策略进行了讨论。1 环境基因组的构建 环境基因组学主要是指对某一特定环境中的所有微生物基因组直接进行分析。环境基因组学概念最早由Pace在1991年提出,并在同年构建了第一个通过克隆环境样品中提取的DNA而成的噬菌体文库[8]。环境基因组学发展中的另一个主要进展是Healy等[9]在1995年通过构建由木素纤维素底物富集后的微生物混合培养物的基因组文库,最终筛选获得了相关功能降解酶类;1996年,Stein等[10]通过构建海水中原核微生物基因组文库筛选获得了一个含有以前从未培养过的古菌16SrRNA基因的克隆,从而最终确立了环境基因组学在微生物学研究中的独特地位。环境基因组学研究的基本流程如图1所示,主要包括:从环境样品中提取及纯化微生物的基因组;构建环境基因组文库;环境基因组文库的筛选分析(图1)。图1 环境基因组文库的构建和分析[11]Fig.1 Constructionandanalysisofmetagenomiclibraries[11]1.1 从环境样品中提取并纯化微生物群体基因组 通过构建环境基因组文库来如实地反映环境中微生物的种类,首先要得到环境中全部微生物的基因组,这就要求建立从环境样品中提取基因组DNA有效的方法。到目前为止,已经发展建立了多种从不同环境中提取微小生物基因组的方法[12~14]。这些方法大致可以分为两类:一种是细胞抽提法,即先从环境中分离目的类群的微生物细胞,再提取其中的基因组DNA。Venter等[15]在构建Sargassosea基因组文库时,采用特定孔径的滤膜去除了真核细胞,从而提高了环境基因组文库中原核微生物基因所占的比率;此外,还可以通过富集培养基富集特定类群的微生物,如在培养基中添加纤维素可以有效地得到与纤维素降解相关的微生物基因组。因为这一方法破碎条件温和,所以得到的基因组DNA分子量较大,且纯度较高,适合较大片段文库的构建;但此方法获得的基因组DNA一般仅为原核生物来源且量较少[16];从环境样品中提取基因组的另一种方法是不经过微生物的分离,直接从样品中提取微生物的基因组[16]。与第一种方法相比,利用此方法能得到更有广泛代表性的DNA样品,所以其应用比较广泛,但因为该方法破碎细胞条件较剧烈,容易引起基因组的断裂,且得到的DNA样品容易污染一些抑制PCR及酶切反应的物质如腐殖酸等,因此需要进一步的纯化来满足文库构建要求。由于环境样品中的不同微生物有机体对各种细胞裂解方法具有不同的敏感性,所以获得的基因组DNA能否最大程度地反应样品中微生物的多样性,在一定程度上受到基因组DNA提取方法的影响,这也需要将来对各种提取方法进行系统的比较研究。1.2 载体的选择及所建文库的大小 根据研究目的,环境基因组文库可以被分成两类:克隆于质粒载体中小片段文库(插入片段<15kb)及克隆于cosmid、fosmid及BAC中的大片段文库(插入片段>40kb)。相应的对载体的选择取决于获得的基因组DNA的质量,所构建文库中插入片段的大小,载体拷贝数的要求以及所用宿主及筛选策略等。小片段文库一般适于筛选分离单个编码基因或小操纵子,而基于cosmid、fosmid及BAC的大片段文库则适合筛选获得由较大基因簇编码的复杂代谢途径或能够表征环境中未培养微生物基因组的较大基因片段[17~19]。无论构建上述何种环境基因组文库,其中一个无法回避的问题就是所构建的文库能最大程度地涵盖样品的所有微生物有机体。根据分析,如果所构建的文库要最大程度地反应土壤样品中分布稀少微生物(<1%)的基因组的存在,则文库必须包含1000Gb的土壤DNA(1011BAC77中国生物工程杂志ChinaBiotechnologyVol.26No.92006克隆)[20]。虽然许多已经报道的文库远没有达到这一推测的标准,但它们已经为人们了解某些特定的生态环境提供了许多有价值的信息。1.3 文库宿主的选择 宿主菌株的选择主要考虑其转化效率,能否为相关功能基因提供必需的转录表达体系,以及是否对异源表达基因产物有较强的相容性等[21]。大肠杆菌是自然界中人们最为熟识的原核生物,并且其遗传操作简单,能在廉价的培养基中快速生长,因此,大多已经报道的环境基因组文库都以大肠杆菌作为宿主。但是,自然界中并非所有的基因都可以在大肠杆菌中表达,比如有些GC含量高的基因启动子无法被识别而起始转录,或是宿主缺少合成某种物质(如抗生素)的中间体;有的基因的表达产物对宿主的生长有抑制或毒害作用,或是表达产物无法分泌到细胞外,这些问题的存在限制了通过环境基因组学手段发现新的功能产物,也使得发展、建立新的替代宿主系统成为必要。已经有研究报道构建了可以在大肠杆菌和链霉菌或假单孢菌间接合转移的cosmid和BAC载体,从而可以把在大肠杆菌中构建的基因组文库转移到链霉菌或假单孢菌中,以实现对某些特定功能基因的筛选[18]。Martinez等[22]以大肠杆菌为宿主,构建了环境基因组文库,通过穿梭质粒(BAC)的接合作用,继而构建了以Streptomyceslividans和Pseudomonasputida为宿主的表达文库。2 环境基因组学的相关分析方法及策略 在构建上述文库的基础上,既可以通过基于序列的方式,也可以通过功能基因组学的方式对基因组文库进行分析,获得相关功能序列信息或目的功能基因。基于序列的环境基因组分析或是通过对包括特定锚定基因序列的文库片段进行序列测定,从而在确定该片段的进化来源同时,进一步寻找与该锚定基因连锁的功能基因;或对基因组文库克隆进行随即测序,在探询到目标基因后再寻找与目标基因连锁的锚定基因序列,从而确定目标功能基因的系统发育来源,这一方法主要依赖于生物信息学的进步以便能有效分析已有的及新的数据资源[23]。Beja等[24]从海水细菌文库鉴定出一个含有γproteobacteria16SrRNA基因序列的克隆,进而在同一克隆片段中发现了与16SrRNA基因连锁的类细菌视紫质蛋白基因,从而证明细菌视紫质基因不仅仅存在于古菌中,在海洋proteobacteria中也可能大量存在。对文库克隆的大规模随机序列测定同样可以获得某一特定群体中不同功能特性的分布,连锁关系,基因组组成以及基因水平转移等信息[25]。基于序列分析的另一条途径是根据已知基因或基因产物的保守区域设计合成引物或探针,再通过PCR或原位杂交筛选目的基因,这种分析方法已被广泛应用于鉴定锚定标记如16SrRNA基因和具有保守功能域的催化酶类如聚酮合成酶,葡萄糖酸还原酶,腈脱水酶等[26~28],但此分析方法是基于对被筛选基因的部分了解,所以只能筛选鉴定已知基因家族的新成员,而无法获得全新的功能基因。基于功能分析的功能环境基因组学(functionalgenomics)在鉴别特定功能方面可以克服基于序列分析方法的局限。因为不需要任何序列信息,所以功能环境基因组分析是目前直接获得具有已知功能或未知功能的全新基因的唯一途径。研究表明,这种分析策略已经筛选获得了许多编码降解酶类、抗生素合成及抗性的全新基因,以及一些新型的药物[5]。Piel等[29]通过构建甲虫及海绵体共生微生物的基因组文库,筛选得到了新的大环内酯类抗肿瘤抗生素。Brady等[30]构建了土壤cDNA粘粒文库,并从中分离得到蓝色化合物Violacein和Deoxyviolacein,其中化合物Violacein具有抗菌和诱导成纤维细胞凋亡等生物活性。Riesenfeld等[31]也通过环境基因组学的方法发现了9个新的抗生素耐受基因,从而使人们可以更好地了解病源微生物耐受抗生素的机制,设计出抑制这种耐受性的化合物,以加强现有抗生素的使用效率。目前功能基因组学分析的一个很大的限制就是功能性克隆较低的筛选频率,如Hene等从土壤基因组文库的730000克隆中仅筛选到了一个具有脂肪水解酶活性的克隆;而另一个研究组则从1186200个克隆中仅筛选到了10个具有独特抗生素抗性的活性克隆。造成这种限制性的一个最可能的原因是被筛选的目的基因及其表达调控序列在异源宿主中能被忠实地转录表达,且表达产生的基因产物具有功能。因为目前构建文库所用的宿