生物通技术周刊+新一代测序技术专刊

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

放眼未来,看新一代测序在过去几年里,新一代DNA测序技术平台在那些大型测序实验室中迅猛发展,各种新技术犹如雨后春笋般涌现。之所以将它们称之为新一代测序技术(next-generationsequencing),是相对于传统Sanger测序而言的。Sanger测序法一直以来因可靠、准确,可以产生长的读长而被广泛应用,但是它的致命缺陷是相当慢。十三年,一个人类基因组,这显然不是理想的速度,我们需要更高通量的测序平台。此时,新一代测序技术应运而生,它们利用大量并行处理的能力读取多个短DNA片段,然后拼接成一幅完整的图画。2006年底,美国X大奖基金会设立了基因组ArchonX大奖,奖金高达1000万美元。这项大奖将颁给第一个能在10天之内,用不到100万美元的费用,完成100个人类基因组测序的民间团队。附加条件是覆盖率不小于98%,误差不大于1/10000bp。重赏之下,必有勇夫。454生命科学公司自2005年推出市场上首个新一代测序平台GenomeSequencer20以来,就成为该奖项的有力竞争者。之后,454公司、Solexa公司和Agencourt私人基因组学公司分别被罗氏、Illumina和ABI公司收购,都是瞄准了测序这个潜在的巨大市场。人类基因组测序的成本也在持续下降,也许,我们很快就能看到ArchonX大奖花落谁家。新一代测序技术的魅力新一代测序技术究竟有着什么样的魅力,引各大公司竞折腰?那就让我们先来看看它与Sanger测序流程的比较(图1)。Sanger测序大家都比较了解,是先将基因组DNA片断化,然后克隆到质粒载体上,再转化大肠杆菌。对于每个测序反应,挑出单克隆,并纯化质粒DNA。每个循环测序反应产生以ddNTP终止的,荧光标记的产物梯度,在测序仪的96或384毛细管中进行高分辨率的电泳分离。当不同分子量的荧光标记片断通过检测器时,四通道发射光谱就构成了测序轨迹。在新一代测序技术中,片断化的基因组DNA两侧连上接头,随后运用不同的步骤来产生几百万个空间固定的PCR克隆阵列(polony)。每个克隆由单个文库片段的多个拷贝组成。之后进行引物杂交和酶延伸反应。由于所有的克隆都是系在同一平面上,这些反应就能够大规模平行进行。同样地,每个延伸所掺入的荧光标记的成像检测也能同时进行,来获取测序数据。酶拷问和成像的持续反复构成了相邻的测序阅读片段。图1.Sanger测序与新一代测序的流程比较(图片来自NatureBiotechnology)。新一代测序技术备受关注的一个主要原因就是它的通量持续增长,潜力无限。ABI公司的2009年10月30日第六十八期第2页,共34页下一页返回SOLiD3系统是目前昀高通量的系统,单次运行能产生50GB的人基因组序列数据,相当于基因组的17倍覆盖度。遥想当年SOLiD刚刚发布时,通量也只有2.5GB。短短一年半的时间,随着SOLiD系统升级到SOLiD3,通量提高了20倍,这种可扩展性得益于独特的开放玻片形式和灵活的微珠设计。Illumina同样不甘落后,在它的宏伟蓝图中,今年将会实现单次运行获得95GB以上的高质量数据。而依靠近期试剂与软件的升级,GenomeAnalyzerIIx能够获得100bp以上的配对末端读长,并在每次运行中产生超过20GB的高质量数据。虽然与95GB的目标相距甚远,相信Illumina还会在硬件、软件、试剂上有大动作。新一代测序仪在准确性上也是绝不含糊。SOLiD系统原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前新一代基因分析技术中准确度昀高的。其秘密在于SOLiD系统采用专利的双碱基编码技术,在测序过程中对每个碱基分析判读两遍,能够在序列测定中减少原始数据错误,提供内在的校对功能。使用连接酶替代聚合酶方法获得更高的保真度,能够明显减少因碱基误配而出现的错误,可以消除相位不同步的问题。另外,测序过程中定期更换测序引物也能够减少背景噪音和错误率。虽然还无法与传统Snager方法的1000bp读长相抗衡,但新一代测序技术的阅读长度也在稳步提高。Roche的新一代测序平台GenomeSequencerFLX目前的读长为400bp,这也是昀让它引以为傲的地方。Roche应用科学市场部经理TimothyHarkins曾表示:“我们的平台与其他平台的昀大区别就在于测序的读长。其他平台只能产生几十个碱基的读长。”不仅仅是测序……新一代测序技术的应用也不再局限于单纯的测序。有了这些测序平台,研究者们能够对未知基因组的生物体样本进行基因表达研究。这意味着他们可以获悉哪些基因被转录,这些基因是否与其他已知的基因同源,抑或它们是全新的。另外,他们还能鉴定表达水平、体细胞突变和剪接变异体。这些都是上一代测序所无法实现的。有关人士认为,新一代的测序方法还会入侵芯片和其他技术领域,给芯片市场带来一定的冲击,但由于价格等问题,要完全取代表达谱芯片还需要一定的时间。深入的重测序还能让研究人员更多地了解与很多疾病相关的遗传作用。不久前,剑桥大学的研究人员就利用454的测序仪,发现一种致病基因的罕见突变有可能降低罹患I型糖尿病的风险。这项研究提出了一种从大量候选基因中识别更多I型糖尿病特异基因的方法。而高通量测序在耐药性方面的研究也使个性化药物的前景更广阔。数据分析与储存虽然测序速度提高了,费用也下降了,但测序产生的海量数据却为后续的分析与储存带来了巨大的挑战。除非你了解如何分析和储存新数据,增加新技术的通量和扩展应用才会变得有用。以千人基因组计划为例,他们不仅面临数据储存的问题,还面对如何比较两个不同个体的基因组的分析障碍。接着就是注释问题——课题组还要对人类基因组进行完整注释。第一个亚洲人基因组图谱的绘制者王俊博士也表示,测序产生的大量数据给后期的生物信息分析带来了巨大的压力,他们面临了现有的生物分析软件无法解决的问题,例如测序数据量较大增长了序列比对的时间、测序序列平均读长较短导致序列很难精确定位,为此,他们独立自主研发出SOAP、SOAPsnp软件,“这是我们完成这个项目时昀值得骄傲的地方之一”。页,共34页下一页返回新一代的测序平台运行一轮后往往产生TB数量级的信息,包括数据和图像。如果你想要存储所有图像,那么在计算机硬件上的花费可能会高于仪器运行所需的费用。Illumina公司研发副总裁TonySmith认为:“真正大的数据是图像。Illumina为客户提供储存所有图像的机会,因为有些客户想要这些图像。问题是你每轮获得的图像数据可能是上百GB甚至1TB。而未来数据只会增不会减。客户可以出于质量控制目的存储一组图像,或储存一轮特别重要的图像并备份归档。”现在的昀大挑战就是如何将每个样品的费用降低到更多更小的实验室都可以接受。长江后浪推前浪,所谓“第三代”或“下下一代”的单分子测序系统将成为新一代测序的有力竞争者。Helicos公司在去年推出了HeliScope测序仪。它的研制是基于Helicos公司的单分子测序技术,它可以通过合成互补链技术对数百万个DNA片断进行测序而无需对DNA链进行扩增。但目前HeliScope测序仪正遭受测序错误的困扰,而且其价格惊人,大约是其他测序仪的2倍。PacificBiosciences打算在明年将产品正式推向市场,它的目标是在2013年前实现三分钟读完人类基因组。扫清障碍新一代测序技术尽管优势多多,但价格高也是有目共睹的,一台新一代测序仪的价格大约在50万美元,除非实验室测序的工作量非常大,否则是不会考虑购买的。另外,每次开机的费用也不菲。对于KB到MB范围的小型项目,Sanger测序无疑还是昀佳的选择;但对于全基因组测序、鉴定体细胞突变等大型基因组计划,新一代测序技术则更有魅力。此时,Sanger测序就不仅仅是试剂的投入了,你还需要购买机器人、处理天文数字的96孔板或384孔板、维护毛细管测序仪、购置昂贵的生物信息学设备来处理信息流。显然,新一代测序仪就简单得多。新一代测序技术正在以惊人的速度向前发展,而多家公司你追我赶的竞争造就了目前百花齐放的局面。有人预言,五年后个人基因组图谱的价格将是100美元。让我们拭目以待吧。(生物通余亮)相关阅读:新一代测序技术之三国时代(上):Illumina新一代测序技术之三国时代(中):Roche/454新一代测序技术之三国时代(下):ABI2009年10月30日第六十八期第4页,共34页下一页返回新一代测序技术之三国时代(上):IlluminaIllumina公司的新一代测序仪GenomeAnalyzer最早由Solexa公司研发,利用其专利核心技术“DNA簇”和“可逆性末端终结(reversibleterminator)”,实现自动化样本制备及基因组数百万个碱基大规模平行测序。Illumina公司于2007年花费6亿美金的巨资收购了Solexa,就是为了促成GenomeAnalyzer的商品化。GenomeAnalyzer作为新一代测序技术平台,具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究。GenomeAnalyzer自上市以来,已经为千人基因组计划立下了赫赫战功。今年早期,荷兰科学家利用它首次绘出女性的基因组图谱。而就在前两周,《Nature》杂志上一连出现三个人类基因组图谱:炎黄一号-第一个亚洲人图谱;第一个癌症病人图谱;第一个非洲人图谱。它们全是依赖GenomeAnalyzer完成的。哗,一下就来仨!这和第一个人类基因组图谱的13年形成了多么鲜明的对照。根据去年底的数据,GenomeAnalyzer已售出约200台,估计是市场占有率昀广的。前不久,华大基因再添置了12台,准备放在香港和深圳的实验室,至此华大基因已经有29台GenomeAnalyzer。而著名的麻省理工学院和哈佛大学Broad研究院拥有47台Illumina测序仪。众多实验室之所以选择Illumina,看中的无疑是GenomeAnalyzer的高性价比。上个月,Illumina将GenomeAnalyzerII升级到GenomeAnalyzerIIx,距年底实现单次运行获得95GB数据的宏伟目标又近了一步。GenomeAnalyzerIIx有两个核心特征:其一是更大的试剂冷却器,支持超过100个测序循环,进一步提升了系统的易用性和自动化;其二是全新的流动池支架,让每轮运行所得的高质量数据增加20%。依靠系统软件和试剂的改进,GenomeAnalyzerIIx现在能够支持100bp以上的配对末端读长,并在每次运行中产生超过20GB的高质量数据。GenomeAnalyzer技术的基本原理:1.文库制备将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。2.产生DNA簇利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被“固定”住,形成“桥(bridge)“。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。3.测序GenomeAnalyzer系统应用了边合成边测序(SequencingBySynthesis)的原理。加入改造页,共34页下一页返回过的DNA聚合酶和带有4种荧光标记的dNTP。这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的

1 / 34
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功