高通量测序技术在动植物研究领域中的应用_岳桂东

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

中国科学:生命科学2012年第42卷第2期:107~124SCIENTIASINICAVitae英文引用格式:YueGD,GaoQ,LuoLH,etal.TheapplicationofHigh-throughputsequencingtechnologyinplantandanimalresearch.SCIENTIASINICAVitae,2012,42:107124,doi:10.1360/052011-634SCIENCECHINAPRESS评述高通量测序技术在动植物研究领域中的应用岳桂东†,高强†,罗龙海,王军一,许姣卉,尹烨*深圳华大基因研究院,深圳518083†同等贡献*联系人,E-mail:yinye@genomics.cn收稿日期:2011-09-09;接受日期:2012-01-16doi:10.1360/052011-634摘要高通量测序是核酸测序研究的一次革命性技术创新,该技术以极低的单碱基测序成本和超高的数据产出量为特征,为基因组学和后基因组学研究带来了新的科研方法和解决方案.在动植物研究领域,高通量测序引领了一次具有里程碑意义的科学研究模式革新,科研人员可利用该技术在基因组、转录组和表观基因组等领域展开多层次多方面多水平研究.本文就高通量测序技术应用于动植物基因组学和功能基因组学研究进展进行了系统阐述,并对当前高通量测序技术的现状和热点及未来的发展趋势作了深入剖析和讨论.关键词新一代测序基因组重测序转录组测序表观基因组学第二代测序技术,又称新一代测序技术(next-generationsequencing),相应于以Sanger测序法为代表的第一代测序技术而得名.第二代测序中3种主流测序技术分别为依次出现的Roche/454焦磷酸测序(2005年)、Illumina/Solexa聚合酶合成测序(2006年)和ABI/SOLiD连接酶测序(2007年)技术.与Sanger测序相比,3种新一代测序技术共有的突出特征是,单次运行(run)产出序列数据量大,故而又被通称为高通量测序技术[1].高通量测序技术一般由模板准备、测序和成像、序列组装和比对等部分组成.3种二代测序技术的原理各不相同,其数据量产出、数据质量和单Run运行成本也不一样[2].Roche/454测序序列读长(reads)在3种测序技术中昀长(600~1000bp),但其通量昀低(0.5~1Gb/run);Illumina/Solexa测序通量大,其新机型Hiseq2000产出量为600G/run,但读长比454测序短(通常为100bp);ABI/SOLiD读长昀短(50bp),但其创新之处在于双碱基编码的应用,降低了测序的错误率,而且由于其双碱基编码和校正系统的原理与重测序相似,所以SOLiD特别适用于具有高质量参考基因组序列物种的重测序.高通量测序技术的出现,使得获得核酸序列数据的单碱基测序费用相对于Sanger测序急剧下降,随之也给基因组学研究带来了更多的新方法和新方案.目前,高通量测序技术已广泛应用于动植物全基因组测序、基因组重测序、转录组测序、小RNAs测序和表观基因组测序等方面.本文分别对高通量测序技术在多研究水平的具体应用和昀新发表的文献进行了综述.1全基因组denovo测序通过对物种基因组序列进行系统的研究,可以获得该物种的基因组和重要功能基因的序列信息,阐述该物种的进化史,了解该物种生长发育和适应环境的分子机制.全基因组denovo测序也称为从头测岳桂东等:高通量测序技术在动植物研究领域中的应用108序,它不依赖任何现有的序列资料,而直接对某个物种的基因组进行测序,然后利用生物信息学分析手段对序列进行拼接、组装,从而获得该物种的基因组序列图谱.1990年人类基因组计划的启动,标志着生命科学研究向基因组学领域迈出了重要一步;多种实验室研究常用的模式生物物种如线虫(Caenorhabditiselegans)、拟南芥(Arabidopsisthaliana)、小鼠(Musmusculus)、水稻(Oryzasativa)等全基因组测序计划也得以实施;伴随着利用Sanger测序技术进行全基因组测序的热潮,人类基因组计划与多种重要模式动植物基因组计划相继顺利完成[3~7].在这些重要物种基因组计划顺利完成后,科学家们发现对于全面解析众多具有重要科研和经济价值的动植物物种的基因组序列信息来说,速度慢、通量低和成本高的第一代测序技术远远满足不了需求,这也使得全新测序技术的开发显得更为紧迫和必要.第二代测序技术出现后,科学家们开始选择使用新一代测序技术来进行全基因组denovo测序,Li等人[8]发表在Nature上的熊猫(Ailuropodamelano-leura)基因组文章,是第一次完全采用新一代测序技术完成大型物种的全基因组denovo测序.如表1所示,黄瓜(Cucumissativus)、苹果(MalusdomesticaBorkh)、金小蜂(Nasoniavitripennis,N.giraulti,N.表1已发表的采用高通量测序的动植物基因组物种名所属科基因组大小所用测序技术黄瓜[9]葫芦科350MSanger+Illumina/Solexa熊猫[8]熊科2.25GIllumina/Solexa金小蜂[10]金小蜂科295MIllumina/Solexa苹果[11]蔷薇科700MSanger+Roche/454弓背蚁蚁科300MIllumina/Solexa印度跳蚁[12]火鸡(Meleagrisgallopavo)[13]吐绶鸡科1.1GRoche/454+Illumina/Solexa野生大豆(Glycinesoja)[14]豆科915.4MIllumina/Solexa森林草莓[15]蔷薇科240MRoche/454+Illumina/Solexa+ABI/SOLID可可树[16]梧桐科430MSanger,Roche/454+Illumina/Solexa阿根廷蚁(Linepithemahumile)[17]蚁科250.8MRoche/454+Illumina/Solexa红色收割蚁(Pogonomyrmexbarbatus)[18]蚁科280MRoche/454火蚁(Solenopsisinvicta)[19]蚁科484.2MRoche/454+Illumina/Solexa麻风树(Jatrophacurcas)[20]大戟科410MSanger+Roche/454大头切叶蚁(Attacephalotes)[21]蚁科300MRoche/454顶切叶蚁(Acromyrmexechinatior)[22]蚁科300MIllumina/Solexa枣椰树(Phoenixdactylifera)[23]棕榈科685MIllumina/Solexa马铃薯(Solanumtuberosum)[24]茄科844MIllumina/Solexa中国猕猴(Macacamulatta)[25]猴科2.8GIllumina/Solexa珊瑚(Acroporadigitifera)[26]鹿角珊瑚420MRoche/454+Illumina/Solexa巨蟒(Pythonmolurusbivittatus)[27]蟒科1.4GRoche/454鳕鱼(Atlanticcod)[28]鳕鱼科830MRoche/454袋鼠(Macropuseugenii)[29]袋鼠科2.6GSanger+Roche/454+Illumina/Solexa+ABI/SOLID白菜(Brassicarapa)[30]十字花科485MIllumina/Solexa裸鼹鼠(Heterocephalusglaber)[31]鼹鼠科2.6GIllumina/Solexa食蟹猴(Macacafascicularis)中国恒河猴(Macacamulattalasiota)[32]猴科2.8GIllumina/Solexa大麻(Cannabissativa)[33]胡麻科534MIllumina/Solexa木豆(Cajanuscajan)[34]豆科833MIllumina/Solexa食蟹猴(Macacafascicularis)[35]猴科2.8GRoche/454猪蛔虫(Ascarissuum)[36]蛔科273MIllumina/Solexa帝王蝶(Danausplexippus)[37]凤蝶科273MRoche/454+Illumina/Solexa蒺藜苜蓿(Medicagotruncatula)[38]豆科500MBAC+opticalmapping+Roche/454中国科学:生命科学2012年第42卷第2期109Longicornis)、蚂蚁(弓背蚁Camponotusfloridanus,印度跳蚁Harpegnathossaltator)、森林草莓(Fragariavesca)、可可树(Theobromacacao)等多种物种基因组序列密码解析过程中都采用了新一代测序的序列数据.如今,应用第二代测序技术发表的基因组文章也越来越多,仅2011年就有20多篇关于不同动植物物种全基因组denovo测序的文章报道[17~38].随着新一代测序技术的飞速发展,基因组测序所需的成本较传统技术大大降低,时间周期也大大缩短,大规模地物种全基因组denovo测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破.2全基因组重测序全基因组重测序是对基因组序列已知物种的个体进行基因组测序,并进行差异信息分析的方法.基于全基因组重测序,研究人员能够快速的进行资源普查筛选,寻找到大量的遗传差异,实现遗传进化分析及重要性状候选基因的预测.随着测序成本降低和拥有参考基因组序列的物种增多,基因组重测序也成为育种研究中迅速有效的方法之一,在全基因组水平扫描并检测出与动植物重要性状相关的变异位点,具有重大的科研价值和产业价值.2.1核心种质资源品系基因组重测序核心种质是种质资源的核心子集,它们昀大限度地保存了整个资源群体的遗传多样性,同时代表了整个群体的地理分布.对核心种质资源进行重测序,可以深入了解其基因与基因型昀大范围的遗传多样性,同时对于促进种质交流、利用和管理具有重要的学术和实用意义.Lai等人[39]对6个玉米(Zeamays)骨干自交系(Zheng58,5003,478,178,Chang7-2和Mo17)进行了全基因组重测序.平均每个品系产出5.4X的数据,共发现1273124个单核苷酸多态性位点(singlenucl-eotidepolymorphisms,SNPs),得到30178个1~6bp的插入缺失位点(insertionanddeletion,InDels).新发现的这些SNPs和InDels提供了1个高密度的全基因组标记信息.同时鉴定出数百个基因获得与丢失变异(presence/absencevariations,PAVs),其中296个B73的基因在6个品系中的至少1个品系中发生丢失,而6个玉米品系中也有数百个基因在B73中不存在.推测这些骨干亲本组合基因组的组合可以弥补另一方功能元件的缺失,这种PAVs的多态变化和其他无义突变的互补作用可能与杂种优势有关.Zheng等人[40]对3个高粱(Sorghumbicolor)品系(1个美国甜高粱、1个中国甜高粱和1个中国籽实高粱)品系进行了全基因组重测序,每株测序深度为12X,以已测的美国籽实高粱基因组序列为参考进行信息分析;发掘出1057018个SNPs,99948个1~10bp长的InDels,16487个PAVs和17111个拷贝数变异(copynumbervariations,CNVs).同时,在甜高粱和籽实高粱序列中鉴定出近1500个序列结构差异基因,这些基因参与糖与淀粉代谢、木质素和香豆素合成、核酸代谢、胁迫应答和DNA修复等生物学过程.2.2群体基因组重测序在已知物种基因组的情况下,对种内群体中的不同个体进行基因组重

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功