全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。基于全基因组重测序技术,人们可以快速进行资源普查筛选,寻找到大量遗传变异,实现遗传进化分析及重要性状候选基因的预测。随着测序成本降低和拥有参考基因组序列物种增多,全基因组重测序成为动植物育种和群体进化研究迅速有效的方法。简化基因组测序技术是对与限制性核酸内切酶识别位点相关的DNA进行高通量测序。RAD-seq(Restriction-siteAssociatedDNASequence)和GBS(Genotyping-by-Sequencing)技术是目前应用最为广泛的简化基因组技术,可大幅降低基因组的复杂度,操作简便,同时不受参考基因组的限制,可快速鉴定出高密度的SNP位点,从而实现遗传进化分析及重要性状候选基因的预测。简化基因组技术尤其适合于大样本量的研究,可以为利用全基因组重测序技术做深度信息挖掘奠定坚实的基础。全基因组重测序和简化基因组测序技术可广泛应用于变异检测、遗传图谱构建、功能基因挖掘、群体进化等研究,具有重大的科研和产业价值。产品脉络图动植物重测序建库测序单个性状家系群体自然群体SNP/InDel/SV/CNV/转座子基因组DNA有效SNP性状定位群体进化群体进化(基于简化基因组测序)群体进化(基于全基因组重测序)变异检测(基于简化基因组测序)SNP检测/SSR检测遗传图谱全基因组关联分析(GWAS)功能基因挖掘变异检测(基于全基因组重测序)QTL定位BSA性状定位多个性状动植物重测序动植物重测序概述1SNP检测、注释及统计基因组DNA350bp小片段文库HiSeqPE150测序数据质控与参考基因组比对利用全基因组重测序技术对某一物种个体或群体的基因组进行测序及差异分析,可获得SNP、InDel、SV、CNV、PAV、转座子等大量的遗传多态性信息,建立遗传多态性数据库,为后续揭示进化关系、功能基因挖掘等奠定基础。基于全基因组重测序技术进行变异检测,可在全基因组范围内精确检测多种变异,与传统的分子标记和芯片相比,具有周期短、密度高、检测全面、性价比高等技术优势。诺禾致源使用的检测软件及参数为国际高影响因子文章通用标准,对获得的变异进行全方位评估以确保变异准确、验证率高。变异检测(基于全基因组重测序)技术路线技术参数DNA样品量:≥3μg测序策略:每个个体测序深度10-30X,推荐深度SNP、InDel(≥10X),SV(≥20X),CNV(≥30X)转座子(≥20X)。项目周期:SNP检测周期为30天;全部变异检测周期为40天,个性化分析时间需根据项目实际情况进行评估。变异检测变异分析InDel检测、注释及统计SV检测、注释及统计CNV检测、注释及统计转座子检测、注释及统计2辐射是进行水稻种质资源创新的一种有效手段。然而,通过辐射诱发突变的分子机制尚不清楚。该研究对由9311经γ-射线诱变而来,富含对人体有益成分的突变体Red-1进行全基因组测序(20X),并与参考基因组比对,全面揭示辐射诱导水稻突变体的序列情况。结果显示,9.19%的基因组序列发生改变,突变位于14,493个基因中,其中点突变是主要的变异类型。与结合功能、催化活性、代谢过程的相关的基因更易被γ-射线诱变。该研究首次将全基因组测序技术应用于辐射诱变机理研究,为诱变育种研究提供了新的思路。该研究对43个牛关键个体(代表Fleckvieh种群68%多态性)进行二代测序,测序深度为4.17-24.98X,平均深度7.46X。与参考基因组比对,检测出1700万个多态性位点,91,733个变异在18,444个基因编码区中,且46%为非同义突变。非同义突变中,575个变异可能与转录提前终止相关,3个变异出现在OMIA数据库中并与特定表型相关。结果表明,通过对能代表种群主要多态性的关键个体进行低、中深度测序,能够高效、准确地获得该物种大量多态性信息。案例解析案例一水稻辐射诱导突变体的全基因组变异分析[1]案例二牛种群关键个体中低深度测序评估基因组多态性[2]图1Red-1水稻基因组的变异特征图3变异注释参考文献[1]ChengZ,LinJ,LinT,etal.Genome-wideanalysisofradiation-inducedmutationsinrice(OryzasativaL.ssp.indica)[J].MolecularBioSystems,2014,10(4):795-805.[2]JansenS,AignerB,PauschH,etal.Assessmentofthegenomicvariationinacattlepopulationbyre-sequencingofkeyanimalsatlowtomediumcoverage[J].BMCgenomics,2013,14(1):446.图2SNPs、Indels和SVs三种变异类型相关基因的WEGO聚类动植物重测序3限制性内切酶酶切HiSeqPE150测序数据质控与参考基因组比对Tag聚类、局部组装SNP检测及统计参考基因组已知参考基因组未知利用RAD-seq或GBS技术对某一物种个体或群体的基因组进行测序及差异分析,获得SNP遗传多态性信息,开发分子标记,建立遗传多态性数据库,为分子遗传育种研究、揭示进化关系、功能基因挖掘等奠定基础。简化基因组技术不受参考基因组限制,基于SNPs的分子标记技术性价比高、稳定性好,在基因组中分布广泛,特别适合大样本量的分析。诺禾致源具有稳定的简化基因组实验和分析流程,以及严格的质量控制标准,检测的变异准确性好、验证率高。变异检测(基于简化基因组测序)技术路线技术参数基因组DNARAD文库构建GBS文库构建变异分析SNP检测、注释及统计变异分析InDel检测、注释及统计简化基因组技术RAD-seqGBSDNA样品量建库测序深度参考基因组周期≥3μgEcoRI酶切+随机打断组装样本≥5X,比对样本≥1X≥2μgMseI、EcoRI、NlaIII、HaeIII等单酶或组合酶切Tag数≥10万,平均8X/Tag有无参考基因组均可标准分析为40天,个性化分析需根据项目实际情况进行评估变异检测4利用RAD-seq技术,对8种不同种质类型的甘蓝型油菜自交系进行多态性检测和基因分型研究。共检测出20,835个SNPs和125个InDels。约三分之一的RADclusters和多态性标记能够比对到白菜基因组序列且均匀分布于各染色体,表明其在甘蓝染色体上也可能是均匀分布的,这对于GWAS分析以及绘制高清晰度连锁图谱等提供了重要资源。RAD-seq不仅是一种简单实用的高密度多态性标记检测方法,而且即使对于油菜这种复杂基因组,也可替代转录组测序和芯片进行SNP基因分型研究(表1)。案例解析案例一RAD-seq技术检测油菜多态性并进行基因分型研究[1]表1甘蓝型油菜自交系的RAD-seq结果统计参考文献[1]BusA,HechtJ,HuettelB,etal.High-throughputpolymorphismdetectionandgenotypinginBrassicanapususingnext-generationRADsequencing[J].BMCgenomics,2012,13(1):281.[2]JarquínD,KocakK,PosadasL,etal.Genotypingbysequencingforgenomicpredictioninasoybeanbreedingpopulation[J].BMCGenomics,2014,15:740.案例二GBS技术对大豆育种群体进行基因分型和基因组预测[2]随着基因分型技术的进步,如GBS技术,使分子遗传育种的周期和费用大幅下降。该研究评估了GBS技术在大豆育种中的应用前景,结果表明GBS技术在大豆育种选择中具有重要潜力(图1)。图1301株精选大豆品系的GBS分型结果动植物重测序5基因组DNAHiSeqPE150测序与参考基因组比对SNP频率差异分析目标性状相关区域定位候选基因功能注释350bp小片段文库数据质控SNP检测及注释针对研究的目标性状,选择表型极端差异的亲本构建家系。利用混池分组分析法(BulkSegregantAnalysis,BSA),对该家系目标性状表型极端的子代分别混合成的两个样本池进行测序,同时对亲本进行测序,检测与性状相关联的位点并注释,研究基因控制目标性状的机制。诺禾致源已完成多种动植物BSA性状定位项目,具有丰富的项目经验。BSA性状定位技术路线技术参数DNA样品量:≥3μg测序策略:亲本:10X/个子代:20X/池项目周期:标准分析时间40天,个性化分析需根据项目实际情况进行评估适用范围:1)单倍体、二倍体或多倍体物种(有参考基因组序列)2)家系群体(F2、RILs、DH等家系群体)BSA性状定位62011年地震和海啸导致日本大面积的稻田被海水污染,日本地方水稻品种Hitomebore不具耐盐性,急需培育耐盐性的水稻新品种。传统水稻品种培育约需10年时间。本研究采用对当地品种Hitomebore进行EMS诱变处理,产生耐盐性的突变体(hst1),运用BSA策略,取20株F2分离群体中的耐盐性个体进行混池,与野生型亲本(Hitomebore)一起进行全基因组重测序,结合Mutmap分析方法,找到水稻耐盐性的基因(OsRR22)。仅用两年时间培育出了耐盐性的水稻新品种。本研究采用BSA混样策略,对10株极端性状的样品(F2子代群体)混合的DNA池,及其亲本进行基因组重测序,通过全基因组扫描SNP,分析频率差异,检测F2群体早花性状的QTL,找到了一个位于早花QTLEf1.1中的候选基因。利用F2群体,SSR标记构建的遗传图谱进行QTL定位。两种策略结合,将Ef1.1缩小到980K,其中包含基因Csa1G651710,与FT基因同源。案例解析案例一MutMap加速水稻耐盐性品种培育[1]案例二QTL-seq定位黄瓜早花重要农艺性状[2]图1水稻耐盐性突变基因的鉴定图2黄瓜早花性状在亲本和F1代的表现及子代极端池SNP-index差异参考文献[1]TakagiH,TamiruM,AbeA,etal.MutMapacceleratesbreedingofasalt-tolerantricecultivar[J].Naturebiotechnology,2015.[2]LuH,LinT,KleinJ,etal.QTL-seqidentifiesanearlyfloweringQTLlocatednearFloweringLocusTincucumber[JTheoreticalandappliedgenetics,2014,127(7):1491-1499.动植物重测序]7350bp小片段文库功能基因挖掘是对地方驯化品种中不同品种或品系及其野生型,采用对DNA样品混池后建库,或者对所有单个个体DNA样品进行建库的方法,通过全基因组重测序,运用生物信息学方法全基因组范围内扫描变异位点,检测驯化性状相关的基因区域及其功能基因。诺禾致源拥有资深的信息分析团队,项目经验丰富,功能基因挖掘为我公司首推产品。功能基因挖掘技术路线基因组DNADNA样品混池DNA样品不混池HiSeqPE150测序数据质控与参考基因组比对SNP检测及注释选择消除分析驯化性状相关区域定位候选基因功能注释技术参数建库方式适用范围周期建库策略多个个体DNA混池测序单个个体建库自然群体DNA样品量≥3μgDNA池样本数目≥20个/池具有性状差异的有参个体每个群体≥8个个体60天20X/池测序策略5X/个功能基因挖掘82014年,诺禾致源科技服务团队与北京大学、四川农业大学合作,从全基因组水平揭示了人工驯化塑造遗传变异的规律。该研究应用二代测序技术,对3头巴克夏猪进行全基因组重测序,另外从已发表的数据库中下载38个猪的数据进行信息分析,鉴定出巴克夏猪人工驯化下重要经济性状(抗病、猪肉产量、生育、体长等)受选择的关