DNA条形码技术在生物分类学中的应用DNABarcodingintheidentificationofmedicinalplants一、前言二、DNA条形码的概念及原理三、DNA条形码的标准及优点四、DNA条形码的操作及分析方法五、DNA条形码在植物中的研究现状六、DNA条形码在药用植物鉴定中的应用主要内容一、前言长期以来.生物分类学家一直在寻找能够迅速区分不同物种的方法。自卡尔-林奈对生物物种进行系统分类以来,生物学家利用各种各样的性状——颜色、外形和行为等形态或者解剖学特征的传统分类学来鉴定动物和植物,这些特征往往对形态近似种的鉴定较网难,且可能出现错误。最近数十年,研究者开始利用DNA中携带的遗传信息来完成这个任务。DNA条形码(DNAbarcoding)技术是一种利用短的DNA片段对物种进行识别和鉴定的新的分子生物学技术,是生物学近期研究的热点之一。二、DNA条形码的概念及原理DNABarcoding的概念由加拿大动物学家PaulHebert首次提出。DNA条形码技术(DNAbarcoding)是利用标准的、有足够变异的、易扩增且相对较短的DNA片段(DNAbarcode)自身在物种种内的特异性和种间的多样性而创建的一种新的生物身份识别系统,它可以对物种进行快速的自动鉴定。DNA条形码的原理:DNA是生物的遗传信息载体,遗传物质的不同,决定了生物的多样性。由于每种生物物种的DNA序列都是唯一的,就给DNA条形码提供了物质基础。由于部分碱基的保守性,几十个碱基的长度不能提供足够的编码信息,因此目前的DNA条形码分析都是基于几百个碱基长度的DNA序列。DNA条形码技术(2003年,Herbert)是通过对一个标准目的基因的DNA序列进行分析从而进行物种鉴定的技术。这个概念的原理与零售业中对商品进行辨认的商品条形码是一样的。简单地说,DNA条形码技术的关键就是对一个或一些相关基因进行大范围的扫描,进而来鉴定某个未知的物种或者发现新种。自从提出DNA条形码的概念以来,这种新兴分类学技术已经引起了越来越多的生物学家的关注。DNA条形码技术是分类学中辅助物种鉴定的新技术,它代表了生物分类学研究的一个新方向,因此它在生态、环境、食品等诸多领域都将会有广泛的应用。DNA条形码技术的产生和发展Tautz等首先提出运用DNA序列作为生物分类系统的主要平台,即DNA分类学(DNAtaxonomv)的观点。2003年初,Hebert等首次提出用一种基因的序列作为鉴别不同物种的条形码,并选中C01基因。随后探讨该技术在鸟类分类鉴定中的可行性.他们的工作推动了条形码技术在生物物种鉴定中的应用。2003年3月,20多位分类学家、分子生物学家和生物信息学家汇聚美国冷泉港.召开了题为“TaxonomyandDNA”的会议.提出对全球所有生物物种的某个特定基因进行大规模测序.以期实现物种鉴定的目标.进而推进生物进化历史的研究。同年9月,在冷泉港再次召开题为“Taxonomv.DNAandthebarcodeoflife”的会议.对DNA条形码鉴定所有真核生物的科学性、社会利益有了更深入的探讨。并且提出了组织策略及国际生物条形码计划(Internationalbareodeoflifeprojeet)的发展蓝图。2003年,加拿大圭尔夫大学(UniversityofGuelph)PaulHebert教授提出了“DNA条形码”概念。将条形码技术引入生物界。其思想产生于现代商品零售业的条形编码系统。将超市用以区分成千上万种不同商品的条形码概念引入,利用A、T、C和G4个碱基在基因中的排列顺序识别物种,他们把这种小片段基因序列称作物种的DNA条形码(DNAbarcodes),并提出为全球生物编码的计划。PaulHebert教授率先于2003年选取线粒体细胞色素C氧化酶亚基I(cytochromecoxidasesubunit1,c01)作为动物中通用的物种鉴定标记,并提出DNA条形码的定义:通过使用短的标准DNA片段,对物种进行快速、准确的识别和鉴定。PaulHebert等对动物界包括脊椎动物和无脊椎动物共11门13320个物种的线粒体细胞色素c氧化酶亚基1(CytochromecoxdaseI,COI)基因序列比较分析,发现98%的物种遗传距离差异在种内为0%-2%,种间平均可达到11.3%,据此提出可以用单一的小片段基因来代表物种。目前,DNA条形码技术在很多动物分类群中得到了成功应用2004年秋,美国国立生物技术信息中心(NCBI)与生命条形码联盟(CBOL)签署合作。物种条形码的标准DNA序列及其相关数据将存档于GenBank。随后,GenBank提供的C01序列数迅速增长.突出表现在除脊索动物之外各类群C01序列数量的剧增.目前脊索动物的分类基本上都已经完成。。2005年2月。伦敦举办了第一届全球DNA条形码会议.对DNA条形码的分类理念、实验技术的细节分析以及资料库建立等议题进行了讨论。最终目的是联合各个类群的DNA条形码数据库组建一个全球生物的DNA条形码数据库.将此数据库设置在GenBank中.让公众可以自由登录查询。DNA条形码技术的原理DNA条形码技术是通过对一个标准目的基因的DNA序列进行分析从而进行物种鉴定的技术。DNA序列由A,T,C。G4种碱基组成.如果有n个碱基,就会有4n种编码方式。如果按照这个公式计算。15个碱基位点就能出现近10亿种的编码序列.这个数字是现存物种的100倍。由于自然选择的原因。某些位点上的碱基是同定的.从而导致可能的编码组合数减少。这可以通过只考虑蛋白编码基因来解决.因为在蛋白编码基因里。由于密码子的简并性.其第三位碱基通常都不受自然选择作用的影响,是自由变化。一个长度300bp的蛋白质编码基因的核苷酸片段在第三密码子位点含有100个核苷酸.这些位点上发生的替代通常都是中性选择.并且大多数都是通过随机漂变在种群中固定下来的。在这100多个位点上就存在4100种可能性.为随后的序列比对分析提供了较大的可能性。随着分子生物学技术的飞速发展.获得100多个碱基序列变得非常容易。理想的DNA条形码应当符合下列标准①具有足够的变异性以区分不同的物种。②同时应具有相对的保守性,以便于用通用引物进行扩增。③必须是一段标准的DNA区来尽可能鉴别不同的分类群。④目标DNA区应当包含足够的系统进化信息以定位物种在分类系统(科,属等)中的位置。⑤目标DNA区应该足够的短,以便有部分降解的DNA扩增。三、DNA条形码的标准及优点三、DNA条形码的标准及优点Kress等(2005)和Taberlet等(2007)提出了理想的DNA条形码标准:(1)可以区分物种的足够变异和分化,同时种内变异必须足够小;(2)有高度保守的引物设计区以便于设计通用引物;(3)片段足够短,以便于DNA提取和PCR扩增,尤其是对部分降解的DNA的扩增。2004年,由AlfredSloan基金会赞助,在美国华盛顿特区举办了一个关于DNA条形码的大型研讨会,此次会议创立了生命条形码联盟(CBOL,theConsortiumfortheBarcodeofLife)。生命条形码联盟阐述了DNA条形码的优点:(1)以DNA序列为检测对象,生物的DNA是由遗传信息决定的,因此同种生物不同生长时期的DNA序列信息是相同的,即使经过加工,形态发生变化,DNA序列信息不会改变,较之传统的方法,扩大了检测样本范围;同时样本部分受损也不会影响识别结果。(2)可进行非专家物种鉴定。只要设计一套简单的实验方案,经过简单培训的技术员即可操作。(3)准确性高。特定的物种具有特定的DNA序列信息,而形态学鉴别特征会因趋同和变异导致物种的鉴定误差。(4)通过建立DNA条形码数据库,可一次性快速鉴定大量样本。分类学家新的研究成果将不断地加入数据库,成为永久性资料,从而推动分类学科更加快速深入地发展。四、DNA条形码的操作及分析方法DNA条形码的操作过程与分子生物学实验类似,包括采集材料并提取DNA、利用通用引物PCR扩增目的片段、纯化PCR产物、序序列测定与分析以及提交结果到相关数据库。条形码的应用目标是所有物种,并且每个物种需要多份材料。采集材料时应以传统的形态分类学知识为依据,尽可能地涵盖传统分类学中的变异式样。通常认为每个物种至少需要10份材料,并最好包括5个不同居群。DNA的提取根据样品的不同,可以采用不同的提取方法,例如CTAB法、TrizolQiagenDNeasykit等(DoyleJJ,DoyleJL.1987)设计通用引物一般情况下,可以通过分析NCBI和GenBank数据库中的DNA序列,在模板的保守区内利用专业软件设计引物。PCR扩增以样品DNA为模板,利用通用引物进行扩增。不同序列有不同的PCR程序。有时需要在实验中调整PCR程序,才能得到目标序列。一般而言,如果样品DNA纯度高且完整,则有利于PCR的进行。如果样品DNA有较为严重的降解现象,可以根据基因叶绿体trnL(UAA)内含子的短片段重新设计通用引物,有利于序列扩增。全新4通道实时荧光定量PCR仪•普通梯度PCR仪PCR扩增原理引物延伸延伸5’5’3’3’变性、退火变性、退火基因组DNA获取特定DNA片段扩增特定DNA片段基因组DNA引物DNA聚合酶DNA片段体外扩增琼脂糖凝胶电泳用于检测PCR扩增效率,选取扩增效果好的样品,进行单向或双向测序。测序原理目前用于测序的技术主要是Sanger于1977年发明的双脱氧核糖核酸链末端终止法。这种测序方法是根据核普酸在某一固定的点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核普酸,然后在尿素变性的PAGE胶上电泳进行检测,从而获得可见的DNA碱基序列。基本原理是每个反应含有所有四种脱氧核营酸三磷酸(dNTP)使之扩增,并混入限量的一种不同双脱氧核普三磷酸(ddNTP)使之终止。由于ddNTP缺乏延伸所需要的3’一OH基团,使延长的寡聚核普酸选择性地在G、A、T或C处终止,终止点由反应中相应的双脱氧而定。序列分析生物条形码工程的首要目标是建立可用来作为鉴定标本工具的基因序列数据库。目前只建立了动物条形码数据库,植物条形码尚处于评估阶段,只有该技术在植物中进一步完善后才有可能建立相应的数据库。序列数据分析是DNA条形码探索的最重要环节,由于植物的种间杂交现象比较普遍,因此植物条形码的分析方法也处于不断的摸索中。目前报道的序列分析方法基本分为以下几步:(1)序列比对和人工校正。一般采用ClustalW,生命条形码数据库中使用HiddenMarkovModels行序列比对,也可以BLASTsearch在Genbank中搜索相似的基因片段对比片段信息的可靠性。(2)遗传分析。植物条形码需要对不同片段的种间和种内变异进行对比,以选择最佳的片段或片段组合。种间距离基本采用Kimura-2-parameterdistance(K2P)模型计算。理想的DNA条形码检测到的种间遗传变异应明显大于种内遗传变异。(3)系统学分析。采用标准的系统学分析方法,建立系统发生树,检验同一个物种的不同个体能否聚在一起。五、DNA条形码在植物中的研究现状在植物中DNA条形码的研究进展相对缓慢,主要有两方面原因:(1)植物线粒体基因组进化速率较慢,遗传分化小,因此动物中的标准片段COI不适用于植物;(2)系统学研究中常用的片段变异较小,不适合用作条形码片段(Chaseetal.,2005;Kressetal.,2005)。由于核基因组通常具有多拷贝的特性,且物种内变异较大,引物通用性差,并且扩增时对模板DNA的质量要求高,不适用于存在DNA降解的材料(Kressetal.,2005),因此,植物中最可能的条形码还是从叶绿体基因组中选择(Chaseetal.,2005;Cowanetal.,2006)。生物条形码联盟(C