第八章药物转录组学第一节转录组学概述•2000年是基因组之年,完成了人类基因组的工作框架图,完成了一系列模式生物和微生物的基因组序列分析。基因的功能是什么?不同的基因参与了哪些细胞内不同的生命过程?基因表达的调控、基因与基因产物之间的相互作用、以及相同的基因在不同的细胞内或者疾病和治疗状态下表达水平?任务与目标一、转录组(transcriptome)广义是指某一生理条件下某个物种或者特定细胞类型产生的所有RNA的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合。•以DNA为模板合成RNA的转录过程是基因表达的第一步,也是基因表达调控的关键环节。所谓基因表达,是指基因携带的遗传信息转变为可辨别的表型的整个过程。1.转录组来自于基因组,量小得多但重要(人类基因组包含有30亿个碱基对,其中大约只有3万个基因转录成mRNA分子,转录后的mRNA能被翻译生成蛋白质的也只占整个转录组的40%左右)。2.转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。二、转录组与基因组的关系三、转录组学(一)概念•转录组学(transcriptomics),是一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。简而言之,转录组学是从RNA水平研究基因表达的情况。(二)转录组学研究方法•基于测序:全长cDNA文库、EST文库、SAGE•基于杂交:cDNA芯片(GeneChip,microarray)1.基因芯片技术•基因芯片(genechip)又称DNA芯片,指将大量(通常每平方厘米点阵密度高于400)探针分子固定于支持物上后与标记的样品分子进行杂交,通过检测每个探针分子的杂交信号强度进而获取样品分子的数量和序列信息。DNAChipTechnology•Solidsupport(glass,plastic,metal,silicon)•MiniaturizedarrayofDNA(geneticmaterial)•WorkonthebiochemicalprincipleofDNA/DNAhybridization•Hybridizedprobes(DNAmolecules)arefluorescentlylabeled通常用计算机硅芯片作为固相支持物,所以称为DNA芯片。生物芯片包括:DNA芯片:寡核苷酸和cDNA蛋白质芯片其它芯片•按用途分–表达谱芯片–诊断芯片–指纹图谱芯片–测序芯片–毒理芯片•芯片实验室是生物芯片技术发展的最终目标制备靶片段结果观察,信息分析制备固相探针对照组(组织,细胞)实验组(组织,细胞)提取mRNA提取mRNACy5标记Cy3标记杂交基因芯片的特点:1.操作简单2.自动化程度高3.序列数量大4.检测效率高5.应用范围广6.成本较低DNA芯片技术步骤芯片制备实性材料:硅芯片、玻片和瓷片需进行预处理,使其表面衍生出羟基、氨基活性基团。膜性材料:聚丙烯膜、尼龙膜、硝酸纤维膜通常包被氨基硅烷或多聚赖氨酸原位合成(InSituSynthesis)Lightdirectedoligonucleotidesynthesis.Asolidsupportisderivatizedwithacovalentlinkermoleculeterminatedwithaphotolabileprotectinggroup.Lightisdirectedthroughamasktodeprotectandactivateselectedsites,andprotectednucleotidescoupletotheactivatedsites.Theprocessisrepeated,activatingdifferentsetsofsitesandcouplingdifferentbasesallowingarbitraryDNAprobestobeconstructedateachsite.样品制备样品分离纯化DNA,mRNA扩增PCR,RT—PCR,固相PCR标记荧光标记(常用Cy3、Cy5),生物素、放射性标记分子杂交样品与DNA芯片上的探针阵列进行杂交。与经典分子杂交的区别:1.杂交时间短,30分钟内完成2.可同时平行检测许多基因序列影响杂交反应的因素:盐浓度、温度、反应时间、DNA二级结构④检测分析1.激光激发使含荧光标记的DNA片段发射荧光2.激光扫描仪或激光共聚焦显微镜采集各杂交点的信号3.软件进行进行图象分析和数据处理目录基因芯片工作流程示意图DNA测序;杂交测序(SBH)基因表达谱分析:基因组研究:作图、测序、基因鉴定、基因功能分析基因诊断:寻找和检测与疾病相关的基因及在RNA水平上检测致病基因的表达药物研究与开发:DNA芯片技术的应用2.基因表达系列分析•基因表达系列分析(SerialAnalysisofGeneExpression,SAGE)是通过快速和详细分析成千上万个EST(expresssequencedtags)来寻找出表达丰富度不同的SAGE标签序列,从而比较完整地获得基因组的表达信息。•SAGE能够快速、全范围提取生物体基因表达信息,对已知基因进行量化分析。SAGE也能应用于寻找新基因。•EST(ExpressedSequencetags,表达序列标签)是从已建好的cDNA库中随机抽取克隆,从5’末端或3’末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA序列。SAGE的主要依据有两个。•第一,一个9~10碱基的短核苷酸序列标签包含有足够的信息,能够唯一确认一种转录物。•第二,如果能将9碱基的标签集中于一个克隆中进行测序,并将得到的短序列核苷酸顺序以连续的数据形式输入计算机中进行处理,就能对数以千计的mRNA转录物进行分析。SAGE的主要过程第一阶段:SAGE文库的构建•①以biotin-oligodT为引物将mRNA反转录合成双链cDNA,经锚定酶(AnchoringEnzyme,AE)酶(如NlaⅢ、Sau3AⅠ等)切后收集cDNA的3’端部分。anchor锚,靠山synthesis综合物zyme酶,病菌enzyme酶•②将收集的3’端cDNA等分为两部分,分别同接头A、B相连接。每一种接头的结构都由PCR扩增引物A或B的序列、标签酶识别位点和锚定酶识别位点三部分组成。•标签酶(TaggingEnzyme,TE)是一种IIS类限制性内切酶,如BsmFI等,它在距识别位点下游约20bp的位置切割DNA双链。•③连接产物以标签酶酶切后用Klenow酶补平5’突出端,得到两组分别带有接头A、B的短cDNA片段(约50bp)。混合并连接两组短cDNA片段,形成一个约100bp的双标签体(ditag)群,并以引物A和B对其进PCR扩增。ample充足的amplifiy增强放大•④用锚定酶切割扩增产物,分离纯化去除接头后的双标签体(约26bp),并使之相互连接成为大片段的连接体,克隆至质粒载体内形成一个SAGE文库以备集中测序。第二阶段:SAGE文库的测序第三阶段:标签序列的提取对测序得到的标签数据进行分析处理。在所测得序列中的每个双标签体之间由锚定酶序列相间隔,每一标签序列是否出现以及出现的频率将代表基因是否表达以及表达的水平。一般一个测序反应的结果可得到约20个双标签体,亦即包含了约40个转录本的信息。•SAGE用于定量地、平行地分析大量的转录本。若要知道一种组织,器官或细胞的基因表达谱,首先从组织细胞里分离出短的诊断性Tags,归类并克隆。测定数千个克隆的DNA序列就可以了解代表这种组织、器官或细胞的功能的基因表达谱。所以SAGE提供了一种广泛应用的工具,定量地分析比较各种正常组织细胞,各种发育状态和各种病理状态下的基因表达谱。3.大规模平行信号测序系统•大规模平行信号测序系统MPSS(massivelyparallelsignaturesequencing,MPSS)是以基因测序为基础的新技术,其方法学基础是一个标签序列(10-20bp)含有能够特异识别转录子的信息,标签序列与长的连续分子连接在一起,便于克隆与序列分析。通过定量测定可以提供相应转录子的表达水平,也就是将mRNA的一端测出一个包含10-20个碱基的标签序列,每一个标签序列在样品中的频率(拷贝数)就代表了与该标签相应的基因表达水平。技术方法•(1)首先将cDNA模板体外“克隆”到直径5μm的微球体上。“克隆”的方法主要是利用人工设计长度不同的两类互补寡核苷酸,分别与cDNA模板和微球体连接之后,再将cDNA模板与微球体连接起来。为了能装载下细胞内所有的cDNA模板(若以3~4×104个基因计算),寡核苷酸的数量至少应该要比模板的量多100倍以上。•(2)用DpnII酶切处理微球体上的cDNA模板,形成粘性末端。•(3)用含有II型限制性内切酶Bbv1识别位点的不同寡核苷酸接头与连接在微球体上的cDNA模板相连接,另外每一种接头的3’端还带有一个荧光标记,可与荧光探针杂交,产生荧光信号,该信号可以反映出接头5’端与模板cDNA杂交的不同位置上的碱基信息,从而获取模板cDNA的序列信息。•(4)分别加入能产生红黄蓝绿杂交信号的四套荧光探针,进行杂交,每次杂交完毕用洗脱液清洗微球体阵列,除去上一轮杂交的荧光探针。用显微拍照的方法记录荧光信号,并将四种信号的图像输入计算机储存。•(5)用II型限制性酶Bbv1进一步消化cDNA模板,Bbv1能在距识别位点约13个碱基的位置切割cDNA双链,并在cDNA模板上产生下4个碱基末端。•(6)洗脱除去寡核苷酸接头,经过Bbv1酶切后的cDNA模板,进入下一轮分析。重复(3)~(5)的步骤4~5次后,分析所得到的16~20张荧光显微照片,就可以读出微球体阵列中每一个微球体上长度为16~20bp的cDNA模板序列。应用•MPSS一方面可提供某一cDNA在体内特定发育阶段的拷贝数,另一方面还可测定出相应cDNA16~20bp的序列,所以这就为在转录水平上进行基因表达分析提供了强有力的定性和定量手段,很明显这一技术首先可以应用于不同丰度基因的差异表达分析,制作基因转录图谱三者比较•芯片无法同时大量地分析组织或细胞内基因组表达的状况,而且由于芯片技术需要准备基因探针,所以可能漏掉那些未知的、表达丰度不高的、可能是很重要的调节基因。SAGE是近年来发展的以测序为基础的分析特定组织或细胞类型中基因群体表达状态的一项技术。其显著特点是快速高效地、接近完整地获得基因组的表达信息。SAGE可以定量分析已知基因及未知基因表达情况,在疾病组织、癌细胞等差异表达谱的研究中,SAGE可以帮助获得完整转录组学图谱、发现新的基因及其功能、作用机制和通路等信息。•MPSS是对SAGE的改进,它能在短时间内检测细胞或组织内全部基因的表达情况,是功能基因组研究的有效工具。因其需要配套的软硬件较为昂贵,目前国内外的相关应用报道不多。MPSS技术对于致病基因的识别、揭示基因在疾病中的作用、分析药物的药效等都非常有价值,该技术的发展将在基因组功能方面及其相关领域研究中发挥巨大的作用。4.RNA测序技术•RNA-seq即转录组测序技术,就是把mRNA,smallRNA,andNONcodingRNA等或者其中一些用高通量测序技术把它们的序列测出来。反映出它们的表达水平。•优点:(1)避免亚克隆引入的偏差;(2)测定序列更长更精确;(3)可得到转录可变剪接序列;(4)准确检测低表达基因,定量转录水平。(三)转录组学的意义•以DNA为模板合成RNA的转录过程是基因表达的第一步,也是基因表达调控的关键环节。与基因组不同的是,转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。通过测序技术揭示造成差异的情况,已是目前最常用的手段。第二节转录组学在药学中的应用一、药靶候选基因的鉴定•药物靶标是指体内具有药效功能并能被药物作用的生物大分子,如某些蛋白质和核酸等生