宏基因组(Metagenomics)唐荧霜20162002016t1宏基因组简介2研究步骤3应用及研究现状1.产生背景人类基因组计划(humangenomeproject,HGP)的完成,从结构基因组学进入以功能性基因组研究为主的后基因组时代人体的生理代谢和生长发育不仅受自身基因控制,还与其他生物基因组相关。已证明体内菌群的组成和活动与人的生长发育、生老病死息息相关。要想了解生命的起源、本质、进化和相互作用及影响,就必须对彼此密切相关的生物进行各个基因组学及其相互关系的研究。一、宏基因组简介2.宏基因组(广义)广义宏基因组是指特定环境下所有生物遗传物质的总和,它决定了生物群体的生命现象。它是以生态环境中全部DNA作为研究对象,通过克隆、异源表达来筛选有用基因及其产物,研究其功能和彼此之间的关系和相互作用,并揭示其规律的一门科学3.宏基因组(狭义)狭义宏基因组学则以生态环境中全部细菌和真菌基因组DNA作为研究对象,它不是采用传统的培养微生物的基因组,包含了可培养和还不能培养的微生物的基因,通过克隆、异源表达来筛选有用基因及其产物,研究其功能和彼此之间的关系和相互作用,并揭示其规律4.宏基因组学宏基因组学是一种基于无需预先培养来利用环境样品基因组资源,获得活性物质和功能基因的新技术,因而绕过了菌种纯培养障碍,可直接从自然界获取遗传信息,极大拓宽了微生物资源的利用空间,正成为国际生命科学研究最重要的热点之一分离特定环境生物DNA纯化大分子量DNA进行克隆将带有宏基因组DNA的载体通过转化方式转入模式微生物建立各自的无性繁殖系对宏基因组文库的DNA进行分析二、宏基因组的研究步骤环境样品Environmentsamples富集培养EnrichmentCultivationDNA提取DNAisolation载体插入Vectorsligation小片段插入Smallsize(plasmid)大片段插入Largesize(Cosmid,Fosmid,BAC,YAC)构建宏基因组文库constructmatagenomiclibraries文库筛选Libraryscreening功能驱动法Function–drivenscreening序列分析法Sequence-drivenscreening其它方法CompoundConfigurationscreening底物诱导基因表达法SIGEXscreening插入寄主Insertintothehost1.样品中DNA的提取和富集采用合适的方法,既要尽可能地完全抽提出环境样品中的DNA,又要保持较大的片段以获得完整的目的基因或基因簇。所以提取原则是在最大提取量和最小剪切力之间折中常用的提取方法有直接裂解法和间接提取法(细胞提取法)(1)直接裂解法操作方法:将环境样品直接悬浮在裂解缓冲液中处理,继而提取DNA并纯化,包括:物理法(如冻融法、超声法、玻璃珠击打法、液氮研磨法)化学法(常用化学试剂有表面活性剂、盐类、有机溶剂)酶裂解法(加入裂解酶、蛋白酶K和溶解酶等)优点:操作容易、成本低、DNA提取率高、重复性好缺点:纯度低,腐植酸等污染严重,还需要经过纯化处理才能满足后续分子生物学操作的需要。此外,由于强烈的机械剪切作用,所提取的DNA片段较小(1—50kb))且多为平端,不利于建库。(2)间接提取法操作方法:采用物理方法将微生物细胞从环境中分离出来,然后采用较温和的方法抽提DNA,如先采用密度梯度离心分离微生物细胞,然后包埋在低熔点琼脂糖中裂解,脉冲场凝胶电泳回收DNA。优点:可获得大片段DNA(20—500kb)且纯度高缺点:操作繁琐,成本高,有些微生物在分离过程中可能丢失,温和条件下一些细胞壁较厚的微生物DNA也不容易抽提出来。所获得的DNA产率比原位裂解法少10—100倍2.载体选择载体系统的选择取决于所提取土DNA的质量及研究目的,需要考虑:欲插入目的片段的大小所需要的载体拷贝数使用的宿主筛选方法载体的选择要有利于目的基因的扩增、表达及在筛选细胞中目标物质的表达量的调控等。ComparisonofdifferentclonevectorsCloningvectorsSizeofinsersegmentsVectorstructureExpresslionhostsplasmid10circularEscherchiacoliλphage24linearEscherchiacoliCosmid,fosmid35~45circularEscherchiacoliBAC120~300circularEscherchiacoliPAC100~300circularEscherchiacoliYAC250~2000linearSaccharomycesMAC1000linearmammalia3.宿主系统的选择在构建文库的过程中,细菌、酵母、链霉菌等为主要的宿主。不同的宿主所产生的活性物质有明显的差异,目前构建的文库如果筛选新的酶,采用大肠杆菌为宜;若是抗菌抗肿瘤物质,选择链酶菌为宿主较为理想。宿主菌株的选择主要考虑:转化效率1重组载体在宿主细胞中的稳定性2宿主能否提供必需的转录表达体系3对异源表达基因产物是否有较强的相容性4目标性状(如抗菌性)564.宏基因组文库的筛选筛选技术大致可分为四类:①基于核酸序列差异分析;②基于目的克隆功能的特殊代谢活性;③基于底物诱导基因的表达;④基于包括稳定性同位素和荧光原位杂交在内的其他技术。(1)基于序列的筛选方法根据已知的基因和基因表达产物的保守序列设计引物和探针,通过杂交或PCR扩增鉴定出已知基因的同源物,进而筛选阳性克隆子对鉴定新的基因成员有一定的局限性,但它已被有效地用于鉴定系统发育学中的标志基因(如16SrRNA基因)和带有高度保守域的酶基因(如聚酮化合物合成酶、葡萄糖酸还原酶和腈水合酶等)①.随机鸟枪法(Shotgunsequencing)将一条完整的目标序列随机打断成小的片段,分别测序,然后利用计算机根据序列间的重叠关系进行排序和重新组装,并确定它们在基因组中的正确位置。(1)基于序列的筛选方法优点:为筛选新的天然产物提供了一种可选择的途径,从中挖掘上百万个新基因,揭示不可培养微生物的代谢途径.缺点:耗费大,需大量人力和物力;与个体微生物基因相比,对序列片段进行分析则极为困难。②.焦磷酸测序(Pyrosequencing)焦磷酸测序技术是在焦磷酸盐测序法的基础上结合一种乳胶材料和皮升级反应孔,将基因组DNA进行随机切割,批量地进行整个测序反应,能够在相同的时间内破译6×106组以上的基因组序列,比Sanger法要快100倍,提高了测序的效率。(1)基于序列的筛选方法测序过程:脱氧核苷酸三磷酸(dNTP)DNA聚合酶↓(能和DNA模板的下一个碱基配对)添加到测序引物的3’末端↓(释放)焦磷酸(PPi)ATP硫酸化酶↓加入APS特异的检测峰↓↗(微弱光检测)ATP→→→→氧化荧光素(产生可见)加入荧光素(2)基于功能的筛选方法以活性测定为基础,通过建立和优化合适的方法从基因组文库中获得具有特殊功能的克隆依赖于功能基因或编码功能蛋白在外源宿主中的表达能够在各种选择性平板上通过可见性状筛选的到产生脂酶、淀粉酶、七叶苷水解酶、甘油脱水酶及抗菌活性的克隆子方法一:对具有特殊功能的克隆子进行直接检测;方法二:基于异源基因的宿主菌株与其突变体在选择性条件下功能互补生长的特性进行(3)底物诱导基因表达筛选(substrate-inducedgene-expressionscreening,SIGEX)原理:SIGEX是用于能利用各种底物诱导的分解代谢型基因的检出,并结合生物发光技术用来筛选代谢相关基因及酶基因。由于编码相关代谢基因或酶基因通常呈簇存在,通常与该物质诱导的启动子和同源转录调控序列毗邻,往往在有底物诱导的条件下才表达,反之则不表达。第一步:以p18GFP为载体构建宏基因组文库;第二步:在无底物情况下以异丙基—β-D硫代半乳糖苷(IPTG)基因为诱导物去除阴性克隆和GFP表达的克隆子;第三步:在培养基中添加底物诱导代谢关基因的表达;第四步:根据gfp基因的表达从宏基因克隆库中筛选出表达代谢基因的克隆子,利用荧光激活细胞分离仪(FACS)从琼脂培养平板上将GFP表达的克隆子分离出来。p18GFP优点:提供了一个有效的和经济的检测手段增加了筛选的容量和效率为高通量筛选提供了保障不需要对在颜色筛选中使用的底物进行修改,勿需担心因修改底物而产生毒性可以从底物来推断得出未知的酶,继而推断基因的功能缺点:目标基因的结构性和适应性很敏感,无法用于分析不能进入细胞质的底物,FACS对进样设备的要求也比较高;代谢特定底物的调控子和操纵子在位置上不一定都相邻;有些基因的表达除了受底物诱导外,还可能受其他因子的诱导,有些基因并不需要诱导,是本底水平表达的,有些可诱导基因在新的宿主中有可能不可被诱导表达(4)其它筛选方法稳定性同位素技术:具有相同原子序数但不同中子数目且不具放射性的元素称为稳定同位素(stableisotopeprobing,SIP)。环境中的许多物质都可以用SIP来标记,鉴定和分析复杂样本中进行有特殊代谢功能的微生物荧光原位杂交技术:利用荧光标记的特异核酸探针与细胞内相应的靶DNA分子或RNA分子杂交,通过在荧光显微镜或共聚焦激光扫描仪下观察荧光信号,来确定与特异探针杂交后被染色的细胞。(4)其它筛选方法三、宏基因组的应用及研究现状1、海洋生物活性产物的痕量存在;2、海洋生物活性物质难于化学合成;3、产生活性物质的海洋微生物难于人工培养宏基因组工程与海洋生物学进行有机的结合,促使人类了解许多为培养海洋微生物的基因组序列及其功能产物,在海洋天然药物研究、海洋极端环境微生物研究、海洋微生物多样性探索中具有十分重要的应用前景。1.海洋微生物2.环境保护和污染修复挖掘降解基因和功能菌株,进行生物修复获取任何序列的基因或功能,由此合成新物质或发现新的生物物种。发掘极端环境为生物的新物种,了解其耐受机制,帮助极端环境的污染修复。从宏基因组中分离的重要基因元件组编成具有其他活性成分、或可降解污染物功能的基因簇,以替代原有不易降解化合物,或直接降解环境中石油烃、有害有害化合物、重金属。可以有效地从环境中分离新的基因、化合物和生物催化剂;所构建的工程菌可用于处理各种复杂污染物,是非常有前景的降解酶系基因筛选方法;所获取的多样性信息可以在废水处理的各种反应器系统、污染物降解过程中微生物的作用和调控、微生物对环境和气候的监测等研究中发挥作用分析微生物种群多样性,检测评价环境健康2.环境保护和污染修复3.开拓天然产物新资源2000年8月,Brady和Clardy等人构建了一个含有约7000000个重组子的环境DNA(eDNA)粘粒文库,筛选出具有抗芽孢杆菌活性的克隆65个,并从其中一个克隆发酵物中分离出一系列具有抗菌活性的长链N2酰基酪氨酸类新化合物12133.开拓天然产物新资源2000年3月,Wang等人首次以链霉菌为宿主构建了土壤样品宏基因组文库,并从中分离得到了外源基因的表达产物TerragigineA2E和Norcardamine。其中,Terragigine类为首次从eDNA重组微生物产物中发现的新类型的化合物。4.待解决问题文库的质量,目前已发表的文库很少能够覆盖整个宏基因组,这需要进一步优化DNA的提取及克隆方法。高通量的有效筛选平台,目前从几万或几十万个克隆中只能筛选到几个有活性的基因,这主要是由于微生物多样性高,宏基因组比较复杂,以及外源基因在宿主菌中的表达障碍等等。宏基因组学研究主要集中于原核生物,对真菌等真核生物研究较少,所构建文库多为DNA文库,cDNA文库较少。