小RNA测序测序介绍(含miRNA测序原理及案例分析)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

小RNA项目介绍Outline1.小RNA测序概述2.小RNA测序标准流程3.后续分析(个性分析)4.案例分享小RNA基础•小RNA是指在生物体中表达的,不编码蛋白,长度较短(18~30nt或40nt)的RNA分子,参与诱导基因沉默,参与细胞生长、发育、基因转录和翻译等诸多生命活动的调控过程。•microRNA,简称miRNA,是目前功能研究较为透彻的一类小RNA(20~25nt)。miRNA通过与特定mRNA的结合调节相应基因的表达,这些基因称为该mRNA的靶基因。miRNA的结构及其形成•miRNA•长度(集中在22nt附近);•首位碱基多数是U,是G的可能性较小;•2~4位点较少为U。抑制调控miRNA的调控作用剪切调控研究背景多见于植物多见于动物适用范围•模式物种,有参考基因组,miRNA数据库注释较多,找出新miRNA,研究miRNA的功能。•非模式物种,无参考基因组,miRNA数据库注释较少,研究物种中存在的与其他物种同源的miRNA。Outline1.小RNA测序概述2.小RNA测序标准流程3.后续分析(个性分析)4.案例分享小RNA测序技术简介•小RNA测序技术采用胶分离技术,收集样品中18-30nt或18-40nt的RNA片段,利用高通量测序技术,一次性获得单碱基分辨率的数百万条小RNA序列信息,依托强大的生物信息分析平台,鉴定已知小RNA,并预测新的小RNA及其靶标。•小分子RNA是生物体内一类重要的特殊分子,诱导基因沉默,参与细胞生长、发育、基因转录和翻译等诸多生命活动的调控过程。9样品要求样品类型:完整且无污染的总RNA;样品需求量(单次):≥10μg;样品浓度:≥200ng/μl;样品纯度:OD260/280=1.8~2.2、OD260/230≥2.0、28S:18S≥1.5、RIN≥8.0、23S:16S≥1.5(此项要求只针对原核生物);提取总RNA时请不要使用Qiagen等公司的过柱试剂盒,也不要使用LiCl沉淀;如果是使用mirVana™miRNAIsolationKit等试剂盒回收的200nt的SmallRNA(无法判断RNA的完整性),测序请提供浓度≥20ng/µl、总量≥1μg的RNA样品。10SmallRNA测序建库流程SmallRNA:是长度在18-40nt的非编码RNA,在基因表达调控中发挥着重要的作用。小RNA信息分析流程图测序结果过滤及tags统计已知miRNA新miRNA预测表达量注释小RNA注释富集分析靶基因预测小RNA测序信息分析内容•一.标准信息分析•1.数据产出统计,对原始测序数据去接头,去低质量,去污染•2.18~30ntsmallRNA的长度分布•3.样品间的公共序列和特异序列的分析•4.SmallRNA碱基偏好性分析•5.SmallRNA在选定的参考基因组上的分布(只能选定一个参考基因组)•6.SmallRNA与rRNA、tRNA、snRNA、snoRNA的比对信息•7.SmallRNA与重复序列的比对信息(需提供选定参考基因组对应的重复序列注释信息)•8.SmallRNA与exon/intron的比对信息(需提供选定参考基因组对应的基因注释信息)•9.SmallRNA与miRBase中指定范围的已知的miRNA的比对•10.按照优先级将smallRNA进行分类注释•11.未注释的smallRNA预测,预测新的miRNA,绘制新miRNA的二级结构图•12.已知miRNA的表达量统计•13.已知miRNA的家族分析(需要提供参考物种拉丁文名称)•(注:此处14-19条miRNA包括已知的miRNA和预测出的新的miRNA)•14.样品间miRNA差异分析(2个或2个以上样品)和聚类分析(3个或3个以上样品)•15.MiRNA靶基因预测(需要提供基因编码序列,可选择多做预测算法)•16.MiRNA靶基因GO注释和KEGG通路分析•17.MiRNA的碱基编辑分析(已知miRNA)•18.差异MiRNA靶基因预测•19.差异MiRNA靶基因GO注释和KEGG通路富集分析1.测序结果的过滤1.含有5’接头序列;2.不含3’接头序列;3.插入片段缺失序列;4.长度小于18nt的序列;5.含有polyA的序列;6.第1~30个碱基中含有N的序列;7.质量值低于10的碱基数超过4个,低于13的碱基超过6个。总测序tags(总测序量)全长小RNAtags(有效测序量)低质量tags=-小RNA的测序结果也可以叫reads(如结题报告帮助文档中),但为了与RNA-Seq区别,称其为tags,因其长度较短(18~30/40nt)。2.测序结果统计•长度分布:图A•同种小RNA的聚类;•样品间公共及特有序列:图BAB3.小RNA注释•小RNA的注释基于序列比对。比对参考基因组数据库注释1)小RNA比对基因组结果统计;2)小RNA在基因组上的位置信息。1)小RNA种类信息,找出已知miRNA;2)已知miRNA的结构、tag数及碱基偏好性。最终目的:从测序结果中筛除非miRNA的tags。比对参考基因组•小RNA基因组比对结果统计。内含子基因间区Exon_senseIntron_senseIntron_anti-senseexon_anti-sense重复序列上覆盖的tagstag各染色体上覆盖的tags基因区域上覆盖的tags小RNA数据库注释将得到的小RNA测序结果(tags)比对到小RNA数据库(miRbase、GeneBank、Rfam)中。miRBase储存miRNA信息最主要的数据库GeneBankNCBI上的DNA序列数据库RfamRNA家族信息数据库已知miRNArRNA,scRNA,snoRNA,snRNA,tRNArRNA,scRNA,snoRNA,snRNA,tRNA注释结果已知miRNA(1)*MaturemiRNAPre-miRNAtags序列、名称、长度、表达量(tag数)miRBase中有该物种miRNA信息miRbase已知miRNA(2)miRBase中无该物种miRNA信息采用与Unigene注释类似的方法,将tags和所有物种的pre-miRNA与成熟miRNA进行比对,得到tags的miRNA家族信息。miRNA家族:各物种中结构相似,功能相同的一类miRNA。注释为该家族的表达量最高的一条miRNA的序列已知miRNA的家族分析•已知的miRNA所归属的miRNA家族,在其他物种中是否存在?测得miRNA所归属的家族小RNA分类注释•综合以上基因组比对结果及数据库注释结果。•有冲突时,用rRNAetc(GenbankRfam)knownmiRNA(miRbase)repeatexonintron的顺序进行注释。种类数统计4.新miRNA预测•对象:小RNA分类注释后尚存的无注释小RNA。Unanntags比对区域前后一定长度序列1)二级结构;2)Dicer酶切位点;3)能量。Pre-miRNA预测5.(已知的与新的)miRNA的碱基偏好性TagsTACGAAGTGCGGC…TGCGCAAGTATGT…TCAGCGAGTAGCT……不同长度的tags首位碱基偏好性Tags上不同位点的碱基偏好性miRNA有其序列特点,首位是U(测序结果为T),长度为21~23nt。碱基偏好性可以验证得到的miRNA。miRNA表达差异分析•该步骤与RNA-Seq的差异表达分析完全相同。•对已知与新miRNA在各样品中的表达量进行假设检验,计算p-value,并使用多重假设检验校正P值,得到错误发现率(FDR)。•miRNA在两样品中的表达量差异倍数越大,FDR越小,表明表达差异越显著。我们将差异倍数大于2倍,且FDR≤0.001的miRNA作为差异miRNA(可以根据需要调整)。miRNA聚类分析•以各样品中miRNA的表达量为基础,进行聚类分析和热图分析。与RNA-Seq表达谱测序中差异基因表达模式聚类分析方法类似。7.miRNA靶基因预测•序列互补,能量。(植物、动物需分开做)•miRanda、Targetscan、Mireap、三程序交集动物mRNACDS3’UTR5’UTRAAAA…miRNA植物mRNAAAAA…miRNA紧密结合到CDS或UTR,引起mRNA降解片段互补到3’UTR,抑制mRNA翻译CDS3’UTR5’UTRmiRNA-靶基因关系网络图红色的圆角矩形代表在样品之间有差异表达的并且是老师关心的miRNA;绿色的圆圈符号代表了样品之间有差异表达并且是老师关心的Gene。红色的抑制线表示了miRNA和Gene的靶向关系。8.miRNA靶基因相关分析•得到miRNA的靶基因后,可以用与RNA-Seq类似的方法对这些基因的功能进行分析,如GO、KEGG注释等;对于样品间差异miRNA,同样可以对其靶基因进行GO、KEGG富集分析。GO富集分析结果•结果:根据富集显著性排序的GOterm及其包含的基因。9.靶基因的pathway富集分析及结果•按同样方法找出差异miRNA的靶基因中富集的pathway。圆点:反应物方框:酶或效应分子。红绿各半的方框:该酶的同源基因中存在上调基因(红)和下调基因(绿)。Outline1.小RNA测序概述2.小RNA测序标准流程3.后续分析(个性分析)4.案例分享样品间差异miRNA比较•找出多样品间差异基因的交集和并集,并绘制成VENN图。•寻找有生物学意义的特定基因集(如只在某两个样品中差异表达的基因)。趋势分析•数据来源:梯度样品,差异miRNA并集的表达量数据。•所得结果:显著表达趋势及包含的miRNA。Outline1.小RNA测序概述2.小RNA测序标准流程3.后续分析(个性分析)4.案例分享案例-猪骨骼肌miRNA综合研究LijunQin,YaoshengChen,XiaohongLiu,SanxingYe,KaifanYu,ZhengHuang,JingweiYu,XingyuZhou,HuChen,DelinMo.IntegrativeAnalysisofPorcinemicroRNAomeduringSkeletalMuscleDevelopment.PLoSONE8(9):e72418.doi:10.1371/journal.pone.0072418中山大学生命科学学院•找出miRNA在猪骨骼肌发育的不同阶段中所起的调控作用。转录组研究材料:猪的骨骼肌的10个不同发育阶段的样品;(交配后35,49,63,77,91天,出生后2,28,90,120,180天)测序策略:181M数据量(IlluminaHiseq2000))1.得到了181224007条reads,其中96%可以比对到miRNA数据库。由此获得了猪骨骼肌miRNA组结果:247条(32.76%)已知miRNA,210条(27.85%)已知miRNA前体和297条(39.39%)候选新miRNA。2.找出了表达量较高,可能参与骨骼肌发育调控的miRNA及功能。3.对骨骼肌发育各阶段中差异表达的miRNA的表达模式进行了分析。目的与意义实验设计研究成果各样品测序所得reads的成分分析如图所示。A图表示10个样品的reads长度分布。B图表示10个样品总reads的注释结果在长度上的分布。C图:左图为10各样品的总reads的注释结果统计,右图为唯一比对的reads的注释结果统计。各样品miRNA组的表达量及功能分析Figure2.Comparisonofdifferentiallyexpressed(DE)miRNAamongthreedatasets.ThenumbermarkedintheoverlappingareasshowsthecommonDEmiRNAs.差异表达的miRNA在样品间的分布统计miRNATargetGenes的KO分析图A是全部样品的miRNA靶基因的KEGG显著性富集结果,图B为三个阶段里的KEGG显著性富集结果。从图中可以得到miRNA疑似调控的基因在骨骼肌生长

1 / 44
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功