Springer出版社微生物期刊《安东尼·范·列文虎克》(2012年)101卷::67~72页DOI号10.1007/s1048201196800Perspective综述论文3C准则引出基于基因组信息的新菌种概念——以沙门氏菌为例阐明唐乐,刘树林摘要困扰细菌分类和系统学的一个关键问题是缺乏生物学种的定义。以遗传和生物学为基础的定义菌种的标准应该能够显示不同细菌类群间清晰的边界。迄今,DNA杂交试验和核糖体RNA序列比对被用于测定细菌间的相对演化距离,但是这些实验数据都是连续的,因此不能够把细菌类群定义到物种这个分类学单位。我们以沙门氏菌作为模型,找出了一些具有遗传和生物学特征的细菌类群。我们发现每一个沙门氏菌系都有一种独特的基因组结构,同系菌株结构相同、不同系菌株结构不同,我们推断这个现象是遗传隔离所导致的结果,而遗传隔离与细菌分岐演化相随。我们猜想在基因组水平上不同的菌种间存在着遗传边界,这猜想有待更深层的基因组研究资料来证实。关键词菌种细菌系统学细菌分类学细菌命名法沙门氏菌基因组关于菌种概念的简要历史回顾1684年,安东尼·范·列文虎克——一个业余制作显微镜的荷兰人用极简单但在当时却最先进的显微镜首先看到了一直以来被人们怀疑存在的“极微小的动物”——即后来所说的细菌。现在大家都知道细菌无处不在、生活在各种环境中,并且细菌在生物圈中生物量最大、多样性最多。在过去的3个世纪里超过一万种不同的细菌被描述,其中大部分的作用活性未知,极少数对人类、动物和植物致病。有个问题一直没有答案:怎样才能把一组相似的细菌与其它细菌区分开来并定义为一个物种?科学家使用了大量的方法、根据各种标准把多种多样的细菌分类成不同的单位,形成了细菌分类学(研究如何把细菌分类)和细菌系统学(研究各类细菌间的亲缘关系)。人们最初把细菌按照表现型不同分为不同类群,并以种为单位,仿照了动植物的系统分类方法。1923年,第一版《伯杰氏细菌鉴定手册》出版,该手册基于细菌的形态和生理特征(例如细胞外形、革兰氏染色、运动性、需氧性、产能方式)提供了一种表现型分类鉴定方案。然而,根据此标准归类的细菌却在系统发育(即演化历史)上表现为高度异质化。后来,科学家认识到菌种应该是表示一个生态和演化意义上的独立的群体——即生物学种的概念,而不是表示一个表现型相似的群体。话虽如此,但当生物学种的概念要被实际应用到细菌分类时却很难操作,因为这个标准很明显地只适用于有性繁殖的生物。自1960年代以来凭借着诸如电子显微镜和计算机处理等技术创新,细菌分类学发生了很大的变化。1970年代实现了几个突破,其中包括全基因组DNA-DNA杂交技术,该技术被应用于测试菌株两两之间的基因组相似程度和相对进化距离。在这类试验中,DNA-DNA杂交率70%被武断地定义为区分菌种的临界值,到现在新世纪还在用这个旧标准。后来出现了分子测序技术,研究者们把它应用到细菌分类和演化的研究中。如今应用最多的分子序列是核糖体RNA和蛋白质编码基因序列,由于这些序列高度保守的而且是所有细菌共有的,所以相关研究方向就聚焦到细菌间的系统发育关系。鉴于上述情况,1984年版《伯杰氏手册》(书名已经由“细菌鉴定手册”改为“系统细菌学手册”了)根据系统发育学方法(尤其是核糖体RNA序列比对)被改编了,并成为现代细菌分类系统的基础。目前细菌分类学和系统学是以16SrRNA序列为基础的,16SrRNA序列一致性97%和基因组DNA-DNA杂交率70%这两个指标成为定义细菌种的现行标准。然而这些标准并不理想,因为无论是16SrRNA序列相似性还是基因组DNA-DNA杂交率都是连续的数据,不能把明确地细菌类群区分到种单位。所以一些备选的菌种概念被提出来,例如基因组-系统发育菌种概念和适应趋异菌种概念,但这些备选的菌种概念至今都不能得到广泛的一致认同。总体来讲,一类细菌在被定义为菌种这个生物学单位之前必须先满足几个必要条件:同一菌种的所有成员之间都有密切的亲缘关系,菌种之间不论是否亲缘都有明确的遗传边界,同一菌种的所有成员有共同的生物学特征(这三个定义菌种的必要条件合称3C要求)。3C要求背后的信息根本上源于细菌基因组分析。沙门氏菌作为菌种基因组模型以沙门氏菌作为研究菌种定义标准的基因组模型,我们以客观的方式(而不是现行标准的主观方式)检验了用3C要求来揭示离散的细菌生物学类群的可行性。沙门氏菌作为一种重要的人类和动物病原体已经被研究了超过一个世纪,有充足的研究资料,但它的分类却一直在变化而且容易混淆。以沙门氏菌作为本研究的基因组模型的最大优点是已知极大量有遗传特征的菌系,不同沙门氏菌系之间有密切的亲缘关系,以及不同的菌系有不同的致病性。沙门氏菌和埃希氏大肠杆菌有共同的祖先,约在1.2-1.6亿年前发生分歧演化。第一株沙门氏菌于1881年从伤寒病人中被分离出来,由于这株菌作为伤寒热的病原体经常被分离出来,于是它被起了很多名字,意思都是“这个菌会引起伤寒热”,例如Typhusbacillen,Eberth;Typhusabdominalis,Gaffky;Bacteriumtyphosum,Zopf;Bacillustyphosus,Zopf;Bacillustyphi,Schroeter;Bacillustyphiabdominalis,Flugge;Bacillustyphicus,DaCamaraMello;Bacteriumtyphi,Chester;Acystiatyphi,Enderlein;Bacterium(Eberthella)typhi,Buchanan;Eberthustyphosus,CastellaniundChalmers;Eberthellatyphi,Bergeyetal.;Eberthellatyphosa,Weldin;Salmonellatyphi,WarrenundScott;Salmonellatyphosus,White;TypusTyphus,Kauffmann;andSalmonellatyphosa,Haupt。1929年Salmonellatyphi这个名字第一次被使用,直到1980年代成为了这种病原体的正式学名。1881年后类似的菌株相继被分离出来,随后被分类为Salmonellaenteritidis,Salmonellatyphimurium,Salmonellacholeraesuis,等等。1934年,各种沙门氏菌系的数量多达44,Kauffmann–White鉴定法开始被应用于菌种分类——基于由O抗原(菌体抗原)和H抗原(鞭毛抗原)组成的抗原式。据此分类的所有沙门氏菌种,后来根据亲缘关系又被划分成8组,包括2个亚组——I、II、IIIa、IIIb、IV、V、VI和VII。混乱出现了——有可能几个不同的沙门氏菌种的抗原式都相同,例如Salmonellapullorum和Salmonellagallinarum的抗原式都是1,9,12:-:-,又如SalmonellaparatyphiB和Salmonellajava的抗原式都是1,4,[5],12:b:1,2。DNA-DNA杂交实验首次揭示了所有沙门氏菌种都有密切的亲缘关系,后来的物理图谱和再后来的基因组测序也揭示了这个现象。于是1980年代又有人把所有沙门氏菌种合并成两个种Salmonellaenterica和Salmonellabongori,先前所有的沙门氏菌种都变成了S.entrtica或S.bongori的血清型。结果两个最重要和区别最明显的病原体S.typhi和S.typhimurium竟成了同一个种(S.enterica)甚至同一个亚种(S.entericsubsp.enterica)的两个成员,虽然他们的遗传差异高达12-13%(注意:人和黑猩猩的遗传差异大约1%,两者不同种、不同属、不同科)、生存在不同的生态位、导致人类截然不同的疾病。另外,在S.typhi和S.typhimurium之间似乎有明显的遗传障碍,理由是S.typhi和S.typhimurium之间的重组频率比S.typhimurium内部菌株之间的重组频率少得多。那么S.typhi和S.typhimurium应该算是两个单独的菌种,还是仅仅同一个亚种S.entericsubsp.Enterica下的两个血清型?根据3C要求,他们明显是两个单独的菌种。首先,所有受试的S.typhi隔离群互相亲近,所有受试的S.typhimurium隔离群互相亲近,而S.typhi和S.typhimurium的隔离群彼此区分,物理图谱也揭示了相同现象;第二,根据分子序列S.typhi和S.typhimurium有着明显不同的遗传特征;第三,他们有不同的演化历史和致病性,有不同的基因组特征,有不同的宿主范围,致人不同的疾病。其它沙门氏菌系也有相似的情况,例如S.paratyphiA,S.paratuphiC,S.choleraesuis,S.gallinarum。总体来说,8组沙门氏菌的典型菌株都有一个共同的基因组结构,而组间又有一些精细的结构差异。特别要强调的一点是,高分辨率物理图谱解释了同系的所有沙门氏菌株都有一种共同的基因组结构,但该结构在系间就完全不同——这种菌系间的结构相似性不是随着遗传距离的增加而逐渐降低的。甚至连S.paratyphi和S.choleraesuis,或S.pullorum和S.gallinarum,这样亲缘深的两个沙门氏菌系之间也有绝对的基因组结构差异。这些研究发现说明根据血清学或物理图谱分类的每一个沙门氏菌系都是遗传独立的,彼此之间没有自由的基因交流。结果,根据物理图谱这种直观常用的方法来明确区分的每一个沙门氏菌系都各自积累遗传变化并表现出独有的表型特征,根据3C要求这些沙门氏菌系各个都可以被定义为一个物种,种内成员共享基因库。不同的生态位把每一个沙门氏菌系划分成一个独立的基因库:遗传壁垒的形成沙门氏菌和埃希氏大肠杆菌分歧演化,后来沙门氏菌内部又分歧演化成数千个独立的菌系,由此引出一个问题:是什么原因导致细菌分岐演化形成一个个不同的基因库?物理图谱揭示了一个普通的插入缺失集(包含原噬菌体和毒力岛等等可插入或缺失的染色体DNA片段),可以作为沙门氏菌菌种的基因组特征,例如S.typhi的SPI7。插入缺失在系统分类学方面的应用也曾被审议。由于获得新DNA片段可能带来新的潜在的适应或竞争的特征,在进化过程中细菌可能对特定的微生态位表现出更好的适应性。如果该生态位与众不同,这类菌就会定居在这个生态位并且很可能进化成一个菌种,有自己独有的菌种基因库。菌种在该生态位内持续地进化,适应性更强的菌株会不断增加,同时淘汰适应性较差的菌株。有一份可以支持上述隔离基因库假说的早期证据:沙门氏菌各菌种之间的杂交率很低。虽然沙门氏菌菌种之间通过几种特别途径也可以实现基因交换,例如以噬菌体P22为媒的转导途径,但杂交率仍然很低,除非细菌的错配机制被破坏。还有一系列说服力很强而且直观的证据:用脉冲场凝胶电泳图谱(PFGE)展示核酸酶内切图谱,同一沙门氏菌菌种的不同菌株之间图谱高度相似,而不同沙门氏菌菌种(即使是亲缘菌种)的菌株之间图谱毫不相似——说明不同的细菌基因库的突变积累是互相独立的。因此,获得新DNA片段和不断适应环境推动了新菌种形成,形成过程伴随着突变积累。环境持续变化,就有不同的细菌克隆系由共同的祖先进化成各种旁支并移居到不同的环境中,各自开始它们自己的进化历程。尽管发生的突变大部分都是有害的,但保留下来的突变都是有利的或至少是无害的。在积累突变的过程中,最初来自同一祖先的两个细菌克隆系最初可能是因为生态位不同而互相孤立,然后因为基因组差异而在遗传上互相孤立,最终彼此之间形成了遗传障碍并分属于不同基因库,此时错配机制就会对维持基因库稳定起重要的作用——阻止菌种间基因交换、阻止突变。展望菌种单位最终会用一个结合遗传学和生物学的准则来定义,而3C要求引出了一个关于菌种的新概念。由于表现型不能合适地描述菌种(例如,S.typhi的一个菌株可能导致一些