转录组的研究技术方法及当前进展郑忠巧生物工程一班20114129什么是转录组?广义转录组(Transcriptome)系指从一种细胞或者组织的基因组所转录出来的RNA的总和,包括编码蛋白质的mRNA和各种非编码RNA(rRNA,tRNA,snoRNA,snRNA,microRNA和其他非编码RNA等)。狭义转录组系指所有参与翻译蛋白质的mRNA总和。为什么研究转录组?转录组是连接基因组遗传信息与生物功能的蛋白质组的纽带,转录水平的调控是最重要也是目前研究最广泛的生物体调控方式。转录组的研究比基因组的研究能给出更高效的有用信息。比如,人类基因组包含有30亿个碱基对,其中大约只有5万个基因转录成mRNA分子,而转录后的mRNA仅部分被翻译生成功能性的蛋白质。与基因组不同,转录组更有时间空间性。比如,我们人体大部分细胞具有一模一样的基因,而即使同一细胞在不同的生长时期及生长环境下,其基因表达情况也是不完全相同的。所以,除了异常的mRNA降解现象(如转录衰减)以外,转录组反映的是特定条件下活跃表达的基因。研究转录组的基本方法目前研究转录组的方法主要有:(1)基于杂交技术,如cDNA芯片和寡聚核苷酸芯片;(2)基于测序技术,如早先给予Sanger测序的SAGE(SerialAnalysisofGeneExpression)和MPSS(MassivelyParallelSignatureSequencing),全长cDNA文库和EST文库的测序分析.现在对cDNA、EST等的测序工作已升级为代测序技术,第一代测序技术较Sanger测序技术通量更高,运行时间更短,测序片段更长;(3)基于新一代高通量测序技术的转录组测序,现在通常将基于第二代测序技术的转录组测序分析称为RNA-Seq。转录组的各个研究方法的特点(1)基于杂交技术的特点基于杂交技术的DNA芯片技术只适用于检测已知序列,却无法捕获新的mRNA。细胞中mRNA的表达丰度不尽相同,通常细胞中约有不到100种的高丰度mRNA,其总量占总mRNA一半左右,另一半mRNA由种类繁多的低丰度mRNA组成。因此由于杂交技术灵敏度有限,对于低丰度的mRNA,微阵列技术难以检测,也无法捕获到目的基因mRNA表达水平的微小变化(2)SAGE法的特点SAGE是以Sanger测序为基础用来分析基因群体表达状态的一项技术。SAGE技术首先是提取实验样品中RNA并反转录成cDNA,随后用锚定酶(Anchoringenzyme)切割双链cDNA,接着将切割的cDNA片段与不同的接头连接,通过标签酶酶切处理并获得得到SAGE标签,然后PCR扩增连接SAGE标签形成的标签二聚体,最后通过锚定酶切除接头序列,以形成标签二聚体的多聚体并对其测序.SAGE可以在组织和细胞中定量分析相关基因表达水平。在差异表达谱的研究中,SAGE可以获得完整的转录组学图谱以及发现新的基因并鉴定其功能、作用机制和通路等。(3)MPSS法的特点MPSS是SAGE的改进版,MPSS技术首先是提取实验样品RNA并反转录为cDNA,接着将获得的cDNA克隆至具有各种adaptor的载体库中,并PCR扩增克隆至载体库中的不同cDNA片段,然后在T4DNA聚合酶和dGTP的作用下将PCR产物转换为单链文库,最后通过杂交将其结合在带有Anti-adaptor的微载体上进行测序。MPSS技术对于功能基因组研究非常有效,能在短时间内捕获细胞或组织内全部基因的表达特征。MPSS技术对于鉴定致病基因并揭示该基因在疾病中的作用机制等发挥了重要作用(4)高通量测序技术的特点SAGE及MPSS技术的低通量模式切换至RNA-seq的高通量模式。作为蛋白质组研究的基础,RNA-seq可以识别比蛋白组高一两个数量级的基因,从而帮助科学家构建完整的基因表达谱以及蛋白质相互作用网络。RNA-seq对于真核生物的基因表达调控,癌症等疾病的发生机制和新治疗方案确定,遗传育种等方面的研究具有不可估量的潜力。二代测序在转录组的研究上越来越普遍,大有替代先前的基因芯片(microarrays)和基因表达系列分析技术(serialanalysisofgeneexpression,SAGE)之趋势。由于测序深度的优势,RNA-seq更能全面地揭示生物个体在特定时刻和特定组织的全局基因表达情况,如发现新的转录本、了解基因表达量、挖掘单核苷酸的多态(single-nucleotidepolymorphisms,SNPs)、选择性剪接(alternativesplicing)和结构性变异(structuralvariation)。对于序列信息有限的非模式生物,RNA-seq更偏重编码区域。由于相比于基因组,重复元件和高GC区比较少,使得拼接相对容易,所以转录组研究在许多非模式植物中得到了广泛应用。RNA-seq的特点及应用(1)数字化信号:直接测定每个转录本片段序列,单核苷酸分辨率的精确度,可以检测单个碱基差异、基因家族中相似基因以及可变剪接造成的不同转录本的表达,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题,能覆盖信号超高的动态变化范围。(2)高灵敏度:能够检测到细胞中少至几个拷贝的稀有转录本。(3)任意物种的全基因组分析:无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析,这对非模式生物的研究尤为重要,例如Wang等、Xiang等和Vera等利用RNA-Seq技术分别对白粉虱、海鲈鱼和蝴蝶转录组进行了研究。同时能够检测未知基因,发现新的转录本,并精确地识别可变剪切位点及cSNP,UTR区域。RNA-seq技术的优势(4)更广的检测范围:高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本;而芯片对过低或过高表达的基因缺乏敏感性,因而动态检测范围小。此外,RNA-Seq重复性好,无需技术重复,而且起始样品比芯片技术要少得多,尤其适用于来源极为有限的生物样品分析,如癌症干细胞。测序技术的改进和测序费用的高;生物信息学分析软件的开发不彻底,测序虽然得到了大量的数据,但基于有限的生物信息学分析软件,经常导致人们所对要分析的东西不能得到很好的结果,造成测序数据的浪费;平台测序长度不够大,目前虽然发展起来的454FLX测序平台测序长度能达到700hp以上,但测序费用的昂贵使得许多科研工作者望而却步RNA-seq技术的缺陷虽然RNA一seq技术还面临着种种困难,相信随着相关学科的进一步发展和测序成本的进一步降低,RNA一seq必将为基因的研究提供强有力的手段,并在转录组学研究领域占据主导地位“也相信随着测序技术的不断进步,人们能够对转录组开展更为深人的测序工作,能够发现更多、更可靠、更有用的转录本。对RNA-seq未来的展望转录组前沿的一些研究(1)单细胞转录组的分析转录组分析应该以单细胞为研究模型,科学家应用单细胞RNA-seq技术即可获得单细胞的转录组信息。2009年SuraliAzim和LaoKaiqin领导的课题组通过对单个小鼠卵裂球细胞的RNA-Seq数据进行分析,分析发现至少5个测序所获得的reads比微阵列技术多出75%(5270)的表达基因,并鉴定了1753个崭新的剪切位点。除此以外,单细胞的RNA-seq结果表明了在相同的卵裂球或卵母细胞中,至少有8-19%的基因存在两个以上的转录异构体,该现象清楚表明了在胚胎发育过程中单细胞转录组的复杂性。最后,通过对单个Dicer1-/-和Ago2-/-卵母细胞的转录组测序,相对野生型来说,Dicer1-/-和Ago2-/-卵母细胞分别发现1696和1553个基因异常上调,1571和1121个基因异常下调,而619基因是相同的。这种单细胞RNA-Seq技术检测将大大提高我们对单个细胞在哺乳动物发育中转录复杂性的理解。(2)转录组测序确定RNA结构2010年12月份美国加州大学圣克鲁兹分校霍华德·休斯医学研究院SofieSalama教授所领导的课题组描述了一种通过转录组高通量测序方法测定RNA结构的方法(Fragmentationsequencing,FragSeq),该方法发表在《自然—方法学》。该方法利用核酸酶P1只切割单链RNA的特性对小鼠RNA进行片段化,片段化RNA的大小在20–100nt之间,然后在片段的5’和3’端分别加上测序接头,再进行逆转录和PCR扩增,最后构建FragSeq文库并对其进行高通量测序。同时作者通过生物信息学分析大量的高通量测序结果,并辅以实验数据成功测定了小鼠的非编码RNA的二级结构。(3)转录组测序在疾病方面的应用转录组测序(RNA-seq)是最近发展起来的利用高通量测序技术进行转录组分析的一种技术,可全面快速地获得特定细胞或组织在某一状态下的几乎所有的成熟mRNA和ncRNA。相对于传统的基因芯片技术,RNA-seq技术不需要针对已知序列设计探针,即可检测细胞或组织的整体转录水平。RNA-seq技术具有更灵敏的数字化信号更高的通量以及更广泛的检测范围。在疾病的机制研究以及疾病治疗领域,转录组测序作为一个有力的工具已经被广泛使用。2010年7月,密歇根大学ArulMChinnaiyan实验室分析了15例前列腺癌样本的转录组测序结果,研究发现其中有两例前列腺癌样本的ETS基因没有发生融合,进一步的研究表明存在于Raf信号途径中的BRAF和RAF1基因会发生融合现象,作者同时利用q-PCR和FISH技术验证了上述现象的存在。除此以外,作者通过对大批不同的癌症样本进行荧光原位杂交实验,并精确统计了BRAF和RAF1基因的重排频率,统计结果表明了各种癌症样本如胃癌,肝癌,黑色素瘤和前列腺癌的研究结果具有高度的一致性。此项成果证明了RAF信号途径在一系列癌症如前列腺癌、胃癌和黑色素瘤发病过程中起到了非常重要的角色,同时研究成果也表明了RAF信号途径中的融合基因有潜力成为抗肿瘤治疗与抗肿瘤药物筛选的靶标。小结:转录组是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。RNA-Seq作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。RNA-Seq利用高通量测序技术对组织或细胞中所有RNA反转录而成的cDNA文库进行测序,通过统计相关读段(reads)数计算出不同RNA的表达量,发现新的转录本;如果有基因组参考序列,可以把转录本映射回基因组,确定转录本位置、剪切情况等更为全面的遗传信息,已广泛应用于生物学研究、医学研究、临床研究和药物研发等。对于转录组的研究未来将更加深入。谢谢观赏