16srRNA序列同源性分析与细菌系统分类鉴定焦振泉刘秀梅综述孟昭赫审校中国预防医学科学院营养与食品卫生研究所(北京100050)摘要本文介绍了16srRNA序列测定及同源性分析的方法,并阐述了其在细菌系统分类鉴定中的重要作用。关键词16srRNA序列同源性分析细菌分类鉴定近10多年来,随着分子生物学理论和技术的迅速发展,特别是作为生物技术里程碑的聚合酶链反应(PCR)技术的出现及核酸测序技术的不断完善,产生了许多新的分类方法,如:质粒图谱、限制性片段长度多态性分析、脉冲场凝胶电泳、PCR指纹图、rDNA指纹图、16srRNA序列分析等。它们主要是对细菌染色体进行直接的DNA分析或对染色体外的DNA片段进行分析,从遗传进化的角度去认识细菌,从分子水平进行分类与鉴定,使细菌的分类越来越科学和精确,特别是16srRNA序列分析方法的出现使细菌进化可以通过试验研究来证实。这是细菌分类史上的一次革命,必将使人们对生物进化及其与其它生物学科关系的认识更加深入。一、16srDNA的结构和性质16srRNA为原核生物核糖体中一种核糖体RNA。目前,在细菌的系统分类学研究中最有用的和最常用的分子钟是rRNA,其种类少,含量大(约占细菌RNA含量的80%),分子大小适中,存在于所有的生物中,特别是其进化具有良好的时钟性质,在结构与功能上具有高度的保守性,素有“细菌化石”之称。rRNA在大多数原核生物中都具有多个拷贝[1],5s、16s和23srRNA的拷贝数相同[2],16srRNA由于大小适中,约1.5kb左右,既能体现不同菌属之间的差异,又能利用测序技术来较容易地得到其序列,故被细菌学家及分类学家所接受[3]。所以,“细菌系统学研究特设委员会”建议依据系统发育关系分类。通过对其序列的分析,可以判定不同菌属、菌种间遗传关系的远近。细菌的16srRNA的可变区位点结构如下[4]:可变区(variableregion,V1~10)V1:61~106bpV2:121~240bpV3:436~500bpV4:588~671bpV5:734~754bpV6:829~857bpV7:990~1045bpV8:1118~1160bpV9:1240~1298bpV10:1410~1492bp恒定区(constantregion)可变区序列因不同细菌而异,恒定区序列基本保守,所以,可以利用恒定区序列设计引物将16srRNA片段扩增出来,利用可变区序列的差异来对不同菌属、菌种的细菌进行分类鉴定。但较其它方法而言,16srRNA序列测定分析更适用于确定属及属以上分类单位的亲缘关系。216srRNA序列测定与分析方法对不同细菌的16srRNA序列进行同源性比较分析是推断细菌的系统发育及进化关系的一个重要方法。这些序列主要通过寡核苷酸编目(oligonucleotidecataloging)、克隆序列的测定、反转录直接测序、对PCR扩增产物的直接测序等方法获得。2.1寡核苷酸编目采用已知碱基专一性的核酸酶(如RNaseT1)彻底消化RNA,消化产物用层析和电泳双向分离,放射自显影记录结果得初级指纹图,再对初级指纹图上的每一个点进行序列分析,最后依字母顺序和链的长短将所试rRNA的所有寡核苷酸列出一个目录式清单进行编目,并据此计算不同rRNA间的相似数(SAB)SAB=2NAB/(NA+NB)NA、NB分别为两样品中各自具有的长度为L个核苷酸以上的寡核苷酸残基数目,NAB是两样品中共同具有的寡核苷酸残基数最后用SAB构建系统发育树[5]。Woese等[6]利用RNaseT1对16srRNA进行寡核苷酸编目,建立了原核生物系统发育的总体框架。寡核苷酸编目只利用了rRNA上40%的信息,现今,由于核酸快速测定技术的发展,该法已被其它的序列分析法所取代。2.2其它几种方法这些方法主要是利用16srRNA恒定区序列特别保守的特点,在恒定区上设计引物,将细菌16srRNA扩增出来,读取16srRNA序列,对不同细菌的16srRNA进行同源性比较及分析。目前比较通用的几种16srRNAPCR扩增引物见附表[7]。附表目前比较通用的几种16srRNAPCR扩增引物1引物缩写:f:正向r:反向D:远端P:近端。带f的包含ECoRⅠ和SalⅠ的位点;r包含HindⅢ和BamHⅠ和XmalⅠ识别序列;反向引物产生rRNA的互补序列;rP1、rP2、rP3除从3’端开始的第17个碱基不同外全部相同。2所有引物序列方向都从5’~3’,连接序列包含用小写字母写的克隆用酶切位点;由于细菌染色体上的rRNA基因以复数存在(约10个左右)[8],当译读PCR产物的直接序列时,复数拷贝如不全是相同序列就译读不出来,即使拷贝间有不同时,也只限于变异较大的区段,稳定区段拷贝间并无不同。rRNA基因拷贝间有不同时,只能克隆后再测序,而且克隆之后有利于重复测序及以后的工作,所以建议将PCR扩增的16srDNA序列进行克隆。克隆时可根据对大部分细菌16srDNA序列的检索,选择合适的酶切位点,在设计引物时在引物的5’端修饰进行粘端克隆。常用的克隆载体为PUC系列及M13系列。这样有益于产生单链进行测序,但如果所测序列为未知序列,难于找到合适的酶切位点进行粘端克隆时,可利用PCR扩增产物的3’端总带有一个A的特点,选择一个5’端带有一个T的载体,现在,T-Vec-tor易于制备且有商品出售,故一般采用PGEM-T-Vector系统进行克隆。另外还可以通过对16srRNA反转录产物进行直接测序。David等[9]阐述了一种用于细菌系统分离的快速rRNA序列测定方法,该法以rRNA为模板,以一个或多个寡核苷酸作引物,利用反转录酶合成cDNA,进行Sanger双脱氧链终止法测序。但由于RNA在RNase作用下极易降解,而且很难保证不受RNase的污染,所以采用测定16srDNA序列。即提取细菌总的染色体DNA,利用保守的16srRNA引物进行PCR扩增,得到细菌的16srDNA,这时可利用保守引物对扩增产物直接测序,亦可将此16srRNA克隆后再测序。由于16srRNA约1.5kb,一套反应不能全部读取,所以可利用所取得的核苷酸序列设计新的寡核苷酸,充当后一套反应的引物,从而循序渐进地获得所有16srRNA片段的序列[10]。2.3序列分析方法取得16srRNA序列后,从基因数据库中调取所需16srRNA序列,利用一些必要的计算机分析软件对它们进行同源性比较,进而绘制系统进化树。现在比较通用的核酸序列数据库有GenBANK(nationalinstitutesofhealth)、EMBL(Europeanmolecularbiologylabora-tory)、DDBJ(DNAdatabankofJapan)[11]。比较通用的序列分析软件有Squence、Philips、Treecon和GCG。计算不同菌属、菌种之间的遗传距离的方法主要有Jukes和Cantor方法[12]、Tajima和Nei方法[13]、Kimura方法[14]及Jin和Nei方法[15]。其中前两种方法为单一参数模式,后两种方法为双参数模式。在取得遗传距离之后构建进化树时有许多种方法,其中有4种方法主要是根据聚类分析来进行的[16],它们分别为利用算术平均数的加权配对分组方法(weightedpairgroupmethodusingarithmaticaver-ages,WPGMA),利用算术平均数的非加权配对分组方法(unweightedpairgroupmethodusingarithmaticaverages,UPGMA),单个连锁分析(singlelinkage)及完全连锁分析(completedlinkage)。316srRNA序列分析在细菌分类鉴定中的作用16srRNA的同源性分析最适用于属及属以上的远缘关系。目前,已对2000种(约相当于50%)以上的真细菌的16srRNA进行了测序,不同菌属的16srRNA序列同源性为70%~95%,对分类而言,至少需要测1000bp以上。通过同源性比较,可以了解不同菌属、菌种在遗传进化方面的距离。经过16srRNA同源性的比较,结果有时与传统分类结果不符,发现一些新的种属。Funke等[17]测定从人体分离到的棒杆菌依赖补体细胞毒性Ⅰ组及其类似棒杆菌的16srRNA序列。通过对这些序列的比较发现这两个棒杆菌组都属于放线菌属,再结合其它的分子实验结果及以前的生化试验结果,提出其为放线菌一个新种,即钮氏放线菌种(Actinomycesneuii.),包含钮氏放线菌钮氏亚种(Actinomycesneuiisubsp.neuii.)(棒杆菌依赖细胞毒性Ⅰ组)和钮氏放线菌无硝亚种(Actinomycesneuiisubsp.antitratus)(棒杆菌类似依赖细胞毒性Ⅰ组)。Bennasar等[18]测定并比较了14株施氏假单胞菌,其中包括模式株CCUG11256和Zobell株(ATCC14405),它们代表了已知的施氏假单胞菌的7个不同基因型(DNA-DNA杂交同源组),结果与DNA-DNA杂交所得到的基因型高度相关,并且鉴定了每个基因型的核酸特征位置,结果还发现第6基因型SP1402T(T=模式株)和SL401与施氏假单胞菌模式株明显不同,从而建议它们应该属于一个新种,命名为Pseudomonasbalearica。有时16srRNA序列同源性比较结果对传统的分类结果给予了证实并提供了更多的分类依据。Gaydos等[19]通过对肺炎衣原体的1554bp16srRNA序列与鹦鹉热衣原体及砂眼衣原体的16srRNA序列进行同源性比较并绘制了系统进化树,发现肺炎衣原体与后二者的同源性分别为96.19%和94.07%,证实了以前根据其它方法研究所得出的结论,同时说明从遗传进化角度来看,肺炎衣原体与鹦鹉热衣原体的进化关系比与砂眼衣原体的关系更近。蠕虫新立克次氏体是沙门氏菌中毒疾病的致病因子,它是唯一一种已知的通过蠕虫传播的专一性细胞内细菌,通过测定它的1453bp的16srRNA序列并与Protecobac-teria的α组的细胞内序列进行比较发现,蠕虫新立克次氏体与埃里希氏体属的两个种即里氏埃里希氏体和腺热埃里希氏体特别相似(相似性95%),而埃里希氏体属的其它种则与之相距较远。这个结果证实了以前通过超微结构和蛋白质印迹(Westernblot)所得的结论。埃里希氏体属可被分为3个相似的种,每一个种都与其它非埃里希氏体属的一个菌种相近。蠕虫新立克次氏体、里氏埃里希氏体和腺热埃里希氏体之间的相近及与埃里希氏族其它菌属的显著不同,意味着这些菌种将作为从埃里希氏体属中分离出来的一个新的细菌属而存在[20]。目前起确定微生物种决定作用的是DNA-DNA同源性的程度,一般的标准是70%以上同源定为种的范围。16srRNA序列和DNA-DNA同源性相关关系的研究表明[21]:序列的相同性不在99.8%以上就不能达到70%以上DNA-DNA的同源性。16srRNA总共约有1500bp,0.2%的不同相当于3个碱基。由于数据库中的数据不一定完全而且个人读取数据也可能出现错读,因此由16srRNA序列鉴定种是很难的,必须结合与近缘菌种的DNA-DNA杂交实验。利用16srRNA测序鉴定病原菌是很有必要的。Relman等[22]利用16srRNA序列中的保守区段设计了寡核苷酸引物,用来扩增杆菌性血管瘤病人的靶DNA序列。他们还发现在具有一定病症的病人的组织污染物中已发现有细菌形成,但并没有培养出致病菌,从这些样品的16srRNA扩增产物的序列分析可以看出:致病菌为一种立克次氏体属组织,现在称为汉氏巴尔通氏体[23,24]。近几年来,人欧利希氏病[25]、肠原性脂肪代谢障碍[26,27]和少菌性骨髓炎[28]的致病因子也是通过PCR扩增16srRNA进行序列分析发现的;同样,疏螺旋体的不同区域分离物根据此法也已被鉴定[29]。在北美洲和欧洲的蜱传染性螺旋体病人身上存在的不同疏螺旋体属的16srRNA序列分