SLAF-seq技术原理及应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

从全基因组标记揭开遗传奥秘北京百迈客生物科技有限公司——简化基因组测序技术在基因定位等领域的应用从全基因组标记揭开遗传奥秘遗传学研究步入高通量测序时代Sequencingless,offeringmore(SLAF-seq)SLAF-seq——从功能基因到群体遗传学WhyBiomarker?遗传学研究步入高通量测序时代DNA变异是遗传学研究的核心功能基因遗传模式遗传育种自然/人工选择全基因组关联分析……过去基于电泳的分子标记反映了DNA序列的变异:SSR等标记数量少电泳分辨能力弱费时费力……从今以后高通量测序(NGS)直接读取DNA序列变异:检测所有变异准确性高机械化操作……NGS:Next/NewGenerationSequencing•研究酵母对17种化合物的抗性;•BY和RM株杂交,使用化合物处理杂交后代,挑选极端分离子代;•每个DNApool(混池)含酵母细胞107个,测序覆盖度为180×以上。高通量测序解析酵母极端分离群体复杂性状•a图为简单性状(质量性状)•b图为复杂性状(数量性状)该方法既适合简单性状又适合复杂性状高通量测序解析酵母极端分离群体复杂性状•定位精细,通过基因注释,可以直接确定候选基因;•定位灵敏、准确,将RM亲本中的RAD5RM替换为RAD5BY,重新杂交产生后代,RAD5峰消失(如RAD5Fixed所示)。高通量测序解析酵母极端分离群体复杂性状•野生型亲本,群体中100株突变子代DNApool,测序覆盖度25×;•鉴定出突变区域中存在一个碱基的InDel,造成了移码突变;•识别单碱基差异,可以直接获得突变位点信息,并预测蛋白质水平差异。高通量测序筛查拟南芥突变位点基因定位、群体遗传学领域发表的高通量测序技术重要文献:IanM.Ehrenreich,etal.Dissectionofgeneticallycomplextraitswithextremelylargepoolsofyeastsegregants.Nature.Vol.464:1039-1042.(2010)JaredW.Wenger,etal.BulkSegregantAnalysisbyHigh-ThroughputSequencingRevealsaNovelXyloseUtilizationGenefromSaccharomycescerevisiae.PLoSGenetics.Vol.6(5):e1000942.(2010)AkiraAbe,etal.GenomesequencingrevealsagronomicallyimportantlociinriceusingMutMap.NatureBiotechnology.Vol.30:174-178.(2011)ThomasLTurner,etal.PopulationresequencingrevealslocaladaptationofArabidopsislyratatoserpentinesoils.NatureGenetics.Vol.42:260-263.(2010)RoosaA.E.Laitinen,etal.IdentificationofaSpontaneousFrameShiftMutationinaNonreferenceArabidopsisAccessionUsingWholeGenomeSequencing.PlantPhysiology.Vol.153:652-654.(2010)……遗传学研究进入高通量时代遗憾!大多数物种基因组序列未知大基因组物种测序成本高昂高重复序列物种测序性价比低矛盾!不是所有的研究都需要全基因组信息•实现高通量测序技术在基因定位研究中的最佳使用方法,全面降低测序成本。•适用于所有物种。遗传学研究的新方法——简化基因组测序简化基因组测序技术作物蔬菜花卉林木水产……从全基因组标记揭开遗传奥秘遗传学研究步入高通量测序时代Sequencingless,offeringmore(SLAF-seq)SLAF-seq——从功能基因到群体遗传学WhyBiomarker?简化基因组测序技术的本质Sequencingless-简化基因组测序技术,部分片段代表全基因组。Offeringmore-SLAF-tag数量众多,10kb就有一个标签;-SLAF-tag均匀分布,不会遗漏染色体重要区段;-SLAF-tag避开重复序列,提高了测序性价比。SLAF-seq数据分析SLAF-seq文库构建及测序基于生物信息学进行方案系统设计SpecificLocusAmplifiedFragmentSequencingSLAF-seq技术流程SNP、InDel•weexpectedthat21,000and76,000SLAFswouldbeselectedbyHaeIIIandMseIdigestionandpurificationrestrictionfragments.•About25,000and83,000SLAFswereobserved.玉米谷子水稻SLAF片段均匀分布整个基因组桃大豆苹果有效避开多数重复序列水稻玉米大豆谷子高粱Repeatingenome42.20%85%57%46%61%RepeatinSLAF-tag0.22%7.22%2.43%5.22%6.31%0.00%10.00%20.00%30.00%40.00%50.00%60.00%70.00%80.00%90.00%重复序列比例简化前后重复序列对比从全基因组标记揭开遗传奥秘遗传学研究步入高通量测序时代Sequencingless,offeringmore(SLAF-seq)SLAF-seq——从功能基因到群体遗传学WhyBiomarker?•高密度遗传图谱构建辅助高精度QTL定位•结合混池技术快速筛选与单性状紧密连锁的分子标记•全基因组SNPs视角的群体遗传学研究SLAF-seq——从功能基因到群体遗传学利用作图群体进行分子标记开发根据标记间重组率进行连锁分析构建该物种高密度遗传图谱基于性状调查数据进行QTL精准定位高密度遗传图谱技术流程高密度遗传图谱信息分析内容1.筛选多态性标记4.基因定位2.绘制高密度图谱3.图谱质量评估雌性、中性和雄性共线性比较1.共线性评估遗传重组率准确性评估基因组和遗传图共线性比较大部分标记顺序保持一致,说明共线性较好,遗传重组率的计算准确度高。2.单体来源评估遗传重组率准确性评估遗传分离群体每个个体中较大区段的来源保持一致,表明遗传图谱准确性好。3.相邻标记连锁关系分析遗传重组率准确性评估相邻标记间重组率热图通过相邻标记间重组率大小可以评估排图准确性。遗传作图新策略SGSSmapJionmap4.0Jionmap4.1Algorithm:Spatialsampling,Gibbssampling,SimulatedannealingandSmoothSGSSmap与其它作图软件比较数据案例:大豆高密度遗传图谱构建及QTL定位*因涉及项目保密,Demo中位置信息、基因注释信息都已做处理。基本概况–群体类型RILs,2亲本+110株子代–完成时间:4个月高密度遗传图谱构建–Genotyping–ConstructionofLinkageMap高精度QTL定位–某性状QTL定位结果–QTL定位统计结果Genotyping——HighDepths,HighAccuracy父本母本子代标记基因型aabbaa、bb、ab(h)、--标签平均测序深度20×20×3×标记分型统计RecombinationMaps•识别RILs中的重组事件和重组位点;•标记分型纠错。ConstructionofLinkageMapLOD值两标记重组率标记1标记2重组率LOD值Marker1Marker20.2510Marker1Marker30.3042.714Marker1Marker40.2510Marker1Marker50.2526.415Marker1Marker60.2510Marker1Marker70.4940.003Marker1Marker80.40.7Marker1Marker90.4790.046Marker1Marker100.490.008Marker1Marker110.2086.091Marker1Marker120.4320.294Marker1Marker130.2953.582Marker1Marker140.08514.297Marker1Marker150.4260.486Marker1Marker160.0010Marker1Marker170.15810.603……JoinMap准确性:−大多数标记,连锁群上顺序与基因组顺序一致;−染色体上异染色区域重组较少,故遗传距离较小。特异性:−少量标记顺序不一致,反映了亲本与参考基因组序列的差异。ConstructionofLinkageMap——共线性比较连锁群和基因组序列的共线性比较SLAF标签数量多态性标记数量多态性比例图上标记数量总图距(cM)平均间隔(cM)151,3335,6133.70%4,5783,136.790.69•亲本间多态性仅为3.7%,SLAF-seq技术依然成功构建了4,578个标记的遗传图谱,标记间平均距离仅0.69cM。•这是大豆密度最高的遗传图谱,小于1cM的标记间隔可以将QTL锁定在一个相对较小的区间,从而实现QTL的精细定位。构建大豆最高密度遗传图谱某性状QTL定位结果•经过计算,这个QTL的95%置信区间为0.45cM,对应的物理距离仅为73.07kb,分布着7个基因,为下一步基因的克隆带来了极大便利。某性状QTL定位效果SLAF-seq技术构建的高密度遗传图谱可以显著提高QTL定位的精度。性状数量QTL位点数量QTL<1cM比例95%置信区间平均间隔(cM)平均物理图距(kb)154456.8%1.83397.26•多数QTL位点的95%置信区间都小于1cM。性状QTL定位效果统计SLAF-seq技术构建的高密度遗传图谱在高精度QTL定位方面具有巨大潜力。高密度遗传图谱案例集锦•高密度遗传图谱构建辅助高精度QTL定位•结合混池技术快速筛选与单性状紧密连锁的分子标记•全基因组SNPs视角的群体遗传学研究SLAF-seq——从功能基因到群体遗传学构建遗传群体构建DNA混合池SLAF-seq进行genotyping基因型频率差异分析质量性状:数量性状:结合混池技术快速筛选与单性状紧密连锁的分子标记SuperBSASuperBSA信息分析内容1.标记筛选2.关联分析基因定位及注释SLAF分布图Marker分布图差异标记分布图案例1:大豆抗病性状候选基因筛选项目概况:−群体类型:RILs群体−混池规模:抗病(30株)+感病(30株)−预计开发标签数量:50,000−完成时间:3个月您的研究与案例有相似之处吗?–抗性(病、虫、逆境)性状–大豆基因组较大(1.1Gb)–候选基因筛选的简单思路经SLAF-seq简化测序后,重复序列仅占2.43%,远低于大豆基因组中重复序列的比例(57%,J.Schmutzetal.Nature,2010,463:178-183)。黑色竖线表示此处有SLAF-tag覆盖(扫描窗口为100kb)SLAF标签均匀分布在大豆20条染色体上SLAF-seq简化效果共筛选到141个与抗病紧密相关的分子标记大豆抗病性状标记筛选抗病相关Hotregion确定Size=0.33MMarkerNum=3GeneNum=29Size=0.82MMarkerNum=8GeneNum=64Size=0.29MMarkerNum=4GeneNum=27候选基因的筛选和确定基因注释示意图对候选区域进行基因注释,获得候选基因120个抗病基因结构域分析根据抗病基因常见的结构域,从中筛选出9个候选基因qPCR定量分析9个候选基因在病害胁迫下的表达水平,筛选出2个差异表达基因

1 / 61
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功