第二代测序技术及其法医学运用基因组DNA碱基序列差异是不同个体间最本质的遗传差异,对碱基序列的测定,人们一直在努力探索。到目前为止测序技术经历了三代发展。第一代测序技术以Sanger双脱氧核苷酸链终止法和Maxim降解法为代表,但由于Sanger双脱氧核苷酸链终止法比Maxim化学降解法需要更少的有毒化学药品,放射性同位素标记[1],因此它成为了DNA测序常用的技术,而且其测序准确性高,被认为是确定基因序列的金标准。第一代测序技术,因其操作简单,读长长,而被广泛运用。但第一代测序无法实现一次大样本测序,而且耗时长,成本高。以高通量、低成本为主要特点的第二代测序技术应运而生。二代测序技术(又称下一代测序技术,nextgenerationsequencing,NGS)主要包括Roche公司的454测序技术、Illumine公司的Solexa测序技术和ABI公司的SOLID测序技术。二代测序技术比起一代测序技术在测序通量、成本、时间等方面都有突破。二代测序技术最主要的特点就是通量高,一次能对多个样本同时测序,但是二代测序技术因其高通量的同时会带来相对短的读长,这是二代测序技术发展面临的主要问题。第三代测序技术(又称为next-next-generationsequencing)是以单分子测序为主要特征,而不经过前期文库的构建、PCR扩增目的基因片段,使测序更为精确。目前对DNA单分子直接测序的第三代测序技术还在研究。第二代测序技术操作简单、通量高、成本低,仍是目前应用较为广泛的技术。本文就二代测序技术及其法医学运用做简要介绍。1第二代测序技术Roche公司的454测序技术,利用焦磷酸测序的原理,通过DNA延伸时产生的焦磷酸盐来确定碱基顺序。即如果加入的未标记的dNTP与模板链互补,在DNA聚合酶的作用下产生等摩尔的焦磷酸盐(ppi),焦磷酸盐在硫酸化酶、荧光素酶的作用下转变成荧光,根据加入的dNTP的类型和荧光信号的强度,可以确定模板DNA核苷酸的序列。454测序技术优势在其读长相对于其他二代测序较长,可达400bp以上。Illumina公司的Solexa测序技术采用边合成边测序的技术,将不同荧光标记的带有可逆终止物的4种dNTP投入反应体系中,如果荧光标记的dNTP在聚合酶的作用下结合到引物末端,就会释放出焦磷酸盐,在一系列酶的反应下会产生荧光。而且其3'端可逆的终止物就会阻止下一个核苷酸的结合,这样就保证了一次只结合一个dNTP,当检测器读取到产生的荧光后,3'端的终止物就化学性的移开,随后加入第二个核苷酸。Solexa测序技术与454测序技术都是基于聚合酶合成测序的原理,不同的是454测序技术加入的核苷酸是未带有荧光标记的,而且一次加入一个核苷酸,如果加入的dNTP与模板链互补,产生ppi经过一系列反应产生荧光,如果不结合就不产生荧光,检测仪就没有信号。Solexa测序技术是在一个体系中一次加入4种不同荧光标记的dNTP,通过3'端可逆终止子来控制反应一次只加入一个dNTP。Solexa测序技术的优势在于高通量。ABI公司的Solid测序技术是通过连接酶进行的连接测序,而不是通过DNA聚合酶进行的合成测序。Solid测序技术采用“双碱基编码原理”,用带有4种不同荧光标记的8碱基单链荧光探针混合物与引物进行连接,其中探针3’端1-5位为随机碱基,可为“A、T、C、G”中任一种碱基,1、2位的碱基决定着探针颜色的类型,1、2位碱基共用16种组合,对应4种颜色,因此每种颜色对应4种碱基对。而6-8位为特殊碱基,能与任何碱基配对。单向Solid测序反应包括5轮测序反应,每轮有多次连接反应,每轮测序反应的第一次连接由连接引物介导,当引物连接一种8碱基荧光探针,Solid测序仪记录探针第1、2位代表的颜色信息,随后连接的8聚物在第5、6位碱基处裂开,暴露出探针第5位碱基的5’磷酸,为下一次连接反应做准备。第一轮第一次测序反应使合成链多5个碱基,得到模板序列1、2位碱基对应的颜色,由此,第二次反应得到模板序列第6、7位碱基颜色,依此类推。5轮测序反应的连接引物长度相同,但在引物区域的位置相差1个碱基,这种设计使每轮连接反应的起始碱基不一样,从而能检测出上一轮测序反应未检测的碱基。第一轮连接反应的引物为n,得到的是第1、2,第6、7位等碱基的颜色信息,第二轮引物为n-1,得到第0、1,第5、6位等碱基颜色信息。第三轮引物为n-2,得到第4、5,第9、10等碱基颜色信息。第四轮引物为n-3,得到第3、4位等碱基颜色信息,第五轮引物为n-4得到第2、3位等碱基信息。这样五轮反应后,按照第0、1位,第1、2位……的顺序把对应模板序列的颜色信息连接起来,就得到由0、1、2、3......组成的Solid原始颜色序列,通过SOLID分析软件就可以对得出所测基因的原始序列[2]。SOLID测序技因为采用了“双碱基编码”的原理,每个碱基被读两次,提高了测序的准确性。2法医学应用2.1SNPs分析SNPs(单核苷酸多态性)在基因组中数量多、分布广,基因组30亿碱对中SNPs基因座至少有300万个,SNPs被认为是继限制性片段长度多态性(RFLP)、短串联重复序列(STR)后第三代遗传标记。由于SNPs含量丰富,具有较高的遗传多态性,易于基因分型,它在法医物证方面越来越受到重视。但是SNPs仅具有两个等位基因,信息量有限,需要同时进行大量SNPs检测,才能达到较高的个人识别能力。二代测序技术最显著的特点就是高通量,一次能对几时到几百万条DNA分子同时测序,而且操作简单,成本低。二代测序还可以发现一些新的SNPs的位点。2.2常染色体STR分析STR(微卫星DNA、短串联重复序列)占人类基因组5%左右,重复单位短2-6bp,绝大数分布在非编码区,极少数分布在编码区。STR具有很好的多态性,其多态性来源于不同个体的重复单位的重复次数。STR是目前法医物证鉴定中运用最广泛的遗传标记。STR特别适合于亲子鉴定和个人识别案例中的分析。在大多数案例中分析一个STR遗传标记其多态性是不够的,需要几个STR同时分析。传统的基于毛细管电泳的STR分析,基于DNA片段长度的大小被区分[3],但是如果是等位基因的或是长度相同但是顺序不同的STR是不能被区分的,与基于PCR-毛细管电泳的长度分析技术不同,STR上顺序的不同才揭露了STR基因座真正的变异,因此对于常染色体STR顺序的分析变得越来越重要,二代测序技术对于STR的分析有很多优势,二代测序具有很高的通量,能一次对多个样本的多个STR基因座进行分析,这种特点使得二代测序能够分析超过一个个体的复杂DNA混合物,通过二代测序技术可以检测单核苷酸多态性,找到复合、复杂STR的变异,解决混合物中长度相同但序列不同的等位基因的区分,分析STR突变的复杂的父权鉴定的案例[4]。SarahL.Fordyce等通过运用RocheGenomeSequencerFLXplatform对STR进行测序[5]。MelissaScheele等通过454测序技术对STR进行分型,认为二代测序技术在法医物证分析方面具体很多优势[6]。随着二代测序技术的发展,其可测的读长也在不断增加,通过对STR序列的分析,为法医案件分析提供更可靠地数据[7]。2.3Y染色体分析Y染色体由两端的拟常染色区和中间的Y特异性区组成,拟常染色区可与X染色体进行交换、重组。而占Y染色体95%的特异性区即非重组区,呈单倍型独立向下遗传,由父亲遗传给儿子。这种特殊的遗传方式使得Y染色体分析在性犯罪及部分特定亲缘关系鉴定中具有重要价值。Y染色体的遗传标记中较为常用的就是Y-SNP、Y-STR。二代测序技术操作简单、成本低可用于进行Y染色体遗传标记的分析。M.Geppert等通过二代测序技术重新对Y染色体进行测序,发现了南美原居民人口新的SNP位点[8]。而Y-STR的分析对于混合斑迹的鉴定具有重要意义。因为Y染色体为男性所特有的,单拷贝的Y-STR基因座上每个男性个体只有一个等位基因,这种特性对于男性犯罪个体识别具有很高的价值。二代测序技术可用来分析Y-STR基因座上每个碱基的,而且准确性高、通量高给法医案件分析带来更多的信息[9–10]。2.3线粒体基因组分析线粒体DNA是细胞核外DNA,线粒体基因组具有一些特点,它属母系遗传,直接从母亲传递给她的孩子,这种严格的母系遗传使得线粒体DNA在失踪人口鉴定、某些亲子鉴定方面具有较高的价值。线粒体DNA具有高拷贝数,在多数细胞里线粒体DNA具有多达数百到数万个拷贝,这与核基因组在一个细胞里通常有两个拷贝不同。当法医物证检材遇到高降解、腐败的检材,生物检材中的核DNA量不足,无法进行分型时,线粒体DNA分型就具有很重要的价值。线粒体DNA具有异质性,异质性就是在同一个细胞、组织、或个体出现两种或更多的medina序列。异质性违背同一个体序列必然一致的前提,给个人识别鉴定增加了难度。在法医案件中混合DNA样本、高度降解的DNA样本常遇到,线粒体DNA高度多态性的可变区域可用来分析复杂混合的DNA样本[11]及高度降解的DNA样本。线粒体DNA是法医重要的一类遗传标记,但是线粒体DNA作为一个单倍型的遗传标记,需要增加多态性的位点来提高鉴别的能力。二代测序技术可用来分析线粒体全基因组的序列,可为的分析提供更多的信息。MartinMichelson[12]等采用454测序技术对线粒体基因组进行分析,并与传统的测序技术比较,发现二代测序技术无论是在检测混合物还是异质性,以及测序技术的再现性等方面都有较大的优势。而且随着二代测序技术的发展,测序成本在减少,可测读长增加,会给线粒体的分析带来更多的价值[13]。2.4法医微生物分析全世界范围内的生物恐怖、生物犯罪事件至今已达数百起,其中引发人们广泛关注的是2001年9月18日在美国发生的邮件携带炭疽芽孢杆菌粉末事件。病原体、毒素易于获得、容易生产、成本低而且危害大,因此常被犯罪分子作为生物武器,用于进行生物犯罪。微生物恐怖事件会导致人员死亡,引起群众恐慌、影响经济的发展[14]。法医微生物学的主要任务是检测生物犯罪中使用的微生物并追溯其来源、判断传染性疾病的暴发是自然发生还是人为所致。全基因组序列分被认为是提供菌株信息的一种有效的方法,二代测序技术是测序的常用技术,其操作简单、准确性高、可测读长也在不断提高。3.展望二代测序技术近年来飞速发展,不断提高。二代测序技术主要包括Roche公司的454测序技术、Illumine公司的Solexa测序技术和ABI公司的SOLID测序技术。二代测序技术主要的特点就是高通量,一次能对几十万到几百万条DNA分子测序,但是二代测序也有一些不足之处,二代测序技术前期文库构建复杂,仍是基于PCR扩增靶DNA片段的技术会带来误差,测序过程会利用一系列的酶,如DNA连接酶,DNA聚合酶等也会影响结果的准确性。二代测序技术一个共有的技术瓶颈就是读长短,读长短会影响二代测序技术在基因重头测序等方面的运用。二代测序技术由于操作简单、成本低、通量高,仍是法医运用较为广泛的测序技术。无论是对于常染色体STR分析、Y染色体分析、线粒体基因组分析还是微生物基因组分析都很有价值。随着二代测序技术的提高,读长的增加,在未来各邻域的应用将更加的广泛。参考文献[1]ErwinL.vanDisk,YanJaszczyszyn,ClaudeThermes.Tenyearsofnext-generationsequencingtechnology[J].Trendsingenetics,2014,30(9).[2]ElaineR.Maidis.Next-GenerationDNASquencingMethods[J].AnnulRevGenomicsHumGenet,2008,9:387-402.[3]YarnYang,BingingXiao,JingleYan.ApplicationofNext-generationSequencingTechnologyinForensicScience