RNA-seq技术原理及应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1、RNA-seq技术简介2、RNA-seq技术原理3、RNA-seq结果分析4、RNA-seq技术应用1.诞生于20世纪70年代的Sanger法是最早被广泛应用的DNA测序技术,也是完成人类基因组计划的基础。2.2005年以来,以Roche公司的454技术、Illumina公司的Solexa技术和ABI公司的SOLiD技术为标志的新一代测序技术相继诞生,又称作深度测序技术。3.把高通量测序技术应用到由RNA逆转录生成的cDNA上,从而获得来自不同基因的RNA片段在特定样本中的含量,这就是RNA测序或RNA-seq。Illumina/Solexa测序技术的基本原理是边合成边测序,即测序过程是以DNA单链为模板,在生成互补链时,利用带荧光标记的dNTP发出不同颜色的荧光来确定不同的碱基。新加入dNTP的末端被可逆的保护基团封闭,既保证单次反应只能加入一个碱基,又能在该碱基读取完毕后,将保护基团除去,使得下一个反应可继续进行。为了增加荧光强度,使之更易被成像系统所采集,该技术在测序之前还需要对待测片段做桥式扩增。ShotGun文库构建DNA片段固定簇序列读取反应图像获得和处理序列组装和比较单条模板扩增1234TTTT…TGCT…RNA-seq实验流程图为了便于测序数据的发布和共享,高通量测序数据以FASTQ格式来记录所测的碱基读段和质量分数。NCBI、EBI、DDBJ等数据中心建立了大容量的数据库SRA来存放共享的测序数据。RNA-seq数据的基本处理1.序列定位算法(1)空位种子索引法:首先将读段切分,并选取其中一段或几段作为种子建立搜索索引,再通过查找索引、延展匹配来实现读段定位,通过轮换种子考虑允许出现错配的各种可能的位置组合(Maq)。(2)Burrows-Wheeler转换技术:通过B-W转换将基因组序列按一定规则压缩并建立索引,再通过查找和回溯来定位读段,在查找时可通过碱基替代来实现允许的错配(Bowtie)。(3)改进的SmithWaterman动态规划算法:随着读长的增加,允许读段序列中存在插入删除(indel)的定位(BFAST、SHRiMP、Mosaik)。2.基因表达水平估计RNA-seq数据最基本的应用是检测基因的表达水平,与基因芯片数据相比,RNA测序得到的是数字化的表达信号,具有灵敏度高、分辨率高、无饱和区等优势。RNA测序数据是对提取出的RNA转录本中随机进行的短片段测序,如果一个转录本的丰度高,则测序后定位到其对应的基因组区域的读段也就多,可以通过对定位到基因外显子区的读段计数来估计基因表达水平。3.选择性剪接事件识别和剪接异构体表达水平推断只要测序深度足够深,就能检测到所有转录本的全部序列,包括来自剪接接合区的序列。Tophat等软件定位剪接接合区读段的策略能标定出剪接事件中的两个剪接位点:供体位点和受体位点。通过比较供体位点和受体位点的组合,就能识别选择性剪接事件。进一步,通过对供体和受体位点的读段计数,结合外显子其他区域的读段数据,还能定量地计算选择性剪接事件之间的比例。两类样本RNA-seq数据比较分析的框架1、转录本结构研究利用单碱基分辨率的RNA-Seq技术可极大地丰富基因注释的很多方面内容,包括5′/3′边界鉴定、UTRs区域鉴定以及新的转录区域鉴定等。RNA-Seq还可对可变剪接(Alternativesplicing)进行定量研究。2、转录本变异研究在发现序列差异方面,如融合基因鉴定、编码序列多态性研究等,RNA-seq也具有很大的潜力。3、非编码区域功能研究转录组学研究的一个重要方面就是发现和分析ncRNA,在表观遗传、转录及转录后等多个层面调控基因表达。4、基因表达水平研究RNA-Seq一个特别强大的优势是它可以捕捉不同组织或状态下的转录组动态变化而无需对数据集进行复杂的标准化。高通量测序技术的应用面非常广,RNA-seq只是其中一个方面,除此之外,基因组的从头测序和重测序、染色质免疫沉淀测序、甲基化测序等技术都同样有着广泛的应用。

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功