LncRNA芯片分析-自己总结

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

lncRNA芯片分析lncRNA芯片分析修改时间2010/6/1613:57:12点击3210次1.归一化lncRNA芯片采用的归一化的方法为quantilenormalization。2.差异LncRNA的筛选lncRNA芯片中既有lncRNA的探针又有mRNA的探针,分别做差异基因的筛选,筛选方法同表达谱的筛选方法是一致的,参见表达谱的差异基因筛选。3.差异lncRNA的重注释lncRNA芯片注释不完善,因此需要将筛选出来的lncRNA进行重注释。将差异lncRNA在基因组上位置上下游延伸,以寻找lncRNA附近的有功能的基因。差异lncRNA重注释示例4.差异lncRNA靶基因的预测lncRNA可能通过调控相应的mRNA发挥功能,因此有必要预测lncRNA的靶基因。我们提取差异lncRNA和mRNA的序列,首先用blast进行初筛,之后用RNAplex进行进一步筛选,以预测lncRNA可能调控的mRNA。差异lncRNA靶基因预测结果示例5.差异lncRNA与靶基因共表达网络预测出lncRNA的靶基因后,并可进一步在mRNA的数据中探寻该mRNA是否发生表达量的变化。由此构建差异lncRNA与靶基因相互作用网络图。差异lncRNA与靶基因相互作用网络图。方框代表lncRNA,圆形代表mRNA。连线表示可能的调控关系。节点面积越大,表示调控的mRNA越多,预示该lncRNA在调控网络中所起的作用可能越大。6.差异lncRNA与差异mRNA的共表达分析SBCHumanlncRNA芯片能同时检测出差异表达的lncRNA和mRNA。我们将差异lncRNA和差异mRNA在一组样品中进行共表达分析,可以发现与某个lncRNA具有相同表达模式的mRNA。要求:每组数据3个或3个以上生物学重复实验组:对照组:lncRNA与mRNA共表达分析作用图,圆形带圈代表lncRNA,圆形代表mRNA。红色为上调基因,绿色为下调基因。7.差异lncRNA靶基因的GOanalysis对lncRNA的靶基因进行GOOntology的生物学的分类,根据Fisher'sExactTest,得到p-value,得到lncRNA靶基因对应的显著性功能,从而了解lncRNA的功能。8.差异lncRNA靶基因的pathwayanalysis对lncRNA靶基因按照Pathway的主要公共数据库KEGG和Biocarta来进行分类,对Pathway中的基因进行基于离散分布的显著性分析,得到与实验目的有显著联系的Pathway分类,由这些pathway对应相应的靶基因,从而获得该分类即导致lncRNA差异的最重要Pathway。9.差异lncRNA的转录因子的预测提取lncRNATSS的上游2000bp,下游500bp,利用HMM的算法根据TRANSFAC8.1数据库预测其转录因子。1)芯片数据预处理:对实验数据质量评估,预处理及均一化处理。2)差异表达lncRNA及mRNA的筛选:根据客户提供样本量的大小与分布或实验目的,应用倍数法、多重假设检验等手段,对两条件或多条件下的表达差异的lncRNA和mRNA分别进行计算和筛选。※表达模式聚类分析:针对芯片结果进行样本及差异表达lncRNA和mRNA的聚类,寻找属于同一表达趋势的基因或样本。※GO和pathway显著性富集分析:差异基因,应用数据库进行功能富集分析,挖掘具有统计学意义的差异表达基因的功能类别。显著性P值越小,则它随机聚集差异表达基因的概率越小,其功能相关性的非随机性就越小,该功能模块有较大的可能与疾病(或药物作用)相关。※蛋白互作网络分析:研究与指定蛋白质相互作用的其他蛋白质的信息,以使研究人员能够更加深入地认清相关蛋白质的功能,更清楚地理解其调控机制。3)lncRNA-mRNA共表达分析:对于每一个差异表达的lncRNAs,计算得到与之共表达的编码基因。4)lncRNA表达模式分析:考察差异表达LncRNAs的表达模式,将LncRNAs以及与该LncRNAs显著共表达的编码基因的表达模式绘制heatmap。5)lncRNA功能预测:筛选出表达显著相关的lncRNA-mRNA关系对,利用成熟的mRNA的功能来推导lncRNA的功能,对异常表达lncRNA显著相关的mRNA进行功能富集分析。6)lncRNAcis作用机制研究:对于感兴趣的差异表达lncRNAs,搜索其上下游100K范围内的所有编码基因,并与该lncRNAs有显著共表达的基因取交集。这些在基因组上临近、且表达模式上共表达的基因很可能被该lncRNAs所调控。7)lncRNAtrans作用机制研究:计算LncRNAs共表达的编码基因,集合与转录因子/染色质调控复合物的靶基因集合的交集,利用超几何分布计算该交集的富集程度,得到与lncRNAs显著相关的转录因子,从而识别可能与lncRNAs联合发挥调控作用的转录因子/染色质调控因子。※lncRNA--转录因子二元关系及网络分析※lncRNA--转录因子--靶基因三元关系及网络分析[综述]长链非编码RNA(lncRNA)来源:新药筛选中心/点击:1464lncRNA长链非编码RNA(longnoncodingRNA,lncRNA)是一类不编码蛋白的RNA分子,长度在200bp以上,起初被认为是RNA聚合酶II转录的副产物,不具有生物学功能;近期的研究表明lncRNA具有保守的二级结构,可以与蛋白、DNA和RNA相互作用,参与多种生物学过程的调控,尤其在肿瘤当中发挥了重要的调控角色,如染色质修饰、转录激活和抑制、转录后调解以及作为miRNA的诱导分子干扰基因的表达等。随着高通量测序技术的发展,越来越多的lncRNA被注释,但是绝大多数的lncRNA的功能仍然不清楚,因此lncRNA的研究是一片非常广阔的未知领域,具有极大的研究价值和意义。lncRNA介绍长链非编码RNA(longnon-codingRNA,lncRNA)是一类转录本长度超过200nt、不编码蛋白的RNA。lncRNA起初被认为是基因组转录的“噪音”,不具有生物学功能。然而,近年来的研究表明lncRNA能在表观遗传、转录及转录后水平上调控基因表达,参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,与人类疾病的发生、发展和防治都有着密切联系。为何细胞不惜耗费能量对这些非编码RNA的表达和定位进行严格调控呢?这些RNA分析究竟有何功能?RNA测序技术的发展使人们得以初窥这一神秘分子,现在lncRNA的许多相关信息都可以再新数据库中查到,例如Broad研究所、哈佛大学和麻省理工共同开发的HumanBodyMaplincRNAscatalog。虽然近年来关于lncRNA的研究进展迅猛,但是现在人们了解到的lncRNA只是冰山一角,绝大部分的lncRNA的功能仍然是不清楚的。随着研究的推进,各类lncRNA的大量发现,lncRNA的研究作为RNA研究的新领域,已经成为一个非常吸引人的方向,有待广大科学家去探寻。lncRNA研究当前面临的一个主要挑战是,研究工具还在不断开发和改进中,而lncRNA研究中非常关键的一步就是发现与特定疾病相关的lncRNA。现阶段,基因芯片技术发展趋于成熟稳定,在此平台上,通过设计不同检测lncRNA探针筛选lncRNA是一种准确快捷的方法。lncRNA特征lncRNA通常较长,具有mRNA样结构,有些具有poly(A)尾巴,有些没有poly(A)尾巴,分化过程中有动态的表达与不同的剪接方式,与编码基因相比,lncRNA表达量更低。※组织特异性:不同组织之间的lncRNA表达量不同。※时空特异性:同一组织或器官的不同生长阶段,其中的lncRNA表达量也会变化。※lncRNA启动子同样可以结合转录因子,如Oct3/4,Nanog,CREB,Sp1,c-myc,Sox2与p53,局部染色质组蛋白同样具有特征性的修饰方式与结构特征。※大多数的lncRNA在组织分化发育过程中,都具有明显的时空表达特异性,如有人针对小鼠的1300个lncRNA进行研究,发现在脑组织中的不同部位,lncRNA具有不同的表达模式。※在肿瘤与其他疾病中有特征性的表达方式。※lncRNA的亚细胞位置上也呈多样化,在细胞核、细胞质和细胞器均有分布,甚至某些lncRNA具有独特的亚细胞位置,有可能是全新的亚细胞构成。lncRNA功能lncRNA可从染色质重塑、转录调控及转录后加工等多种层面实现对基因表达的调控:a)lncRNA通过招募染色质重塑复合物至特定的基因组位点使其发生催化活性。如HOTAIR21,Xist、RepA和Kcnqot1招募Polycombcomplex至HoxD位点,使得X染色体或Kcnq1功能域的组蛋白H3第27位赖氨酸发生3甲基化(me3K27),诱导异染色质形成,从而抑制该区域基因表达。b)lncRNA通过多种机制进行转录水平调控。lncRNA结合到基因cyclinD1上,招募RNA结合蛋白TLS来调控蛋白CBP和p300的组蛋白乙酰转移酶活性,进而抑制cyclinD1转录。c)超保守增强子转录出lncRNA-Evf2,该lncRNA能激活转录因子DLX2,进而调控基因Dlx6转录。d)DHFR次要启动子区域转录出的lncRNA与该基因主要启动子区域结合形成三聚体,抑制转录因子TFIID结合,从而使基因DHFR发生沉默。e)反义lncRNA能够与剪接体(splicesome)中锌指同源mRNAZeb2的5'剪切位点结合,使内含子未被剪切掉,而该内含子序列中保留有内部核糖体进入位点(IRE位点),翻译过程中识别并结合该位点,导致Zeb2基因表达和翻译。lncRNA分子机制随着lncRNA功能逐步显现,其与靶点的作用机制成为进一步的热点。早期认为原位调控是LncRNA作用的唯一机制,它通过招募形成染色质修饰复合物而沉默邻近基因转录,例如IGF2R反义RNA(antisenseofIGF2RRNA,AIR)、XIST等。而Hox基因反义基因间RNA(HoxantisenseintergenicRNA,HOTAIR)的发现提示LncRNA可能存在远程调控。同源异型基因(homeoticgenes,HOX)在细胞增殖与定向分化中起关键作用,人类Hox基因簇约含100个ncRNA基因,其中HOTAIR定位于HOXC基因座12q13.13。HOTAIR的5'端可招募结合多梳蛋白抑制复合物2(polycombrepressivecomplex2,PRC2),借助PRC2上三个H3K27甲基化酶EZH2、SUZ12和EED,使另一基因座HOXD上长约40kb的序列转录沉默,从而在乳腺上皮细胞内使细胞内转录倾向于胚胎成纤维细胞样表型。超过20%的LncRNA能够通过结合PRC2或其他类似复合物发挥作用,提示LncRNA的远程调控机制在生物体内广泛存在。其作用机制如下图所示,主要包括以下几种情况:1)在编码蛋白基因的上游启动子区(橘色)转录,从而干扰邻近蛋白编码基因(蓝色)的表达(如酵母SER3基因);2)抑制RNA聚合酶Ⅱ,或介导染色质重构和组蛋白修饰,而影响基因(蓝色)表达;3)lncRNA(紫色)与编码蛋白基因的转录本形成互补双链,干扰mRNA的剪切,进而产生不同的剪切形式;4)lncRNA(紫色)与编码蛋白基因的转录本形成互补双链,在Dicer酶作用下产生内源性的siRNA,调控基因的表达水平;5)lncRNA(绿色)结合在特定蛋白质上调节相应蛋白的活性;6)作为结构组分与蛋白质形成核酸蛋白质复合体;7)结合在特定蛋白上从而改变该蛋白的胞质定位;8)可作为小分子RNA(如miRNA)的前体分子。lncRNA芯片数据分析策略1)芯片数据预处理:对实验数据质量评估,预处理及均一化处理。2)差异表达lncRNA及mRNA的筛选:根据客户提供样本量的大小与分布或实验目的,应用倍数法、多重假设检验等手段,对两条件或多条件下的表达差异的lncRNA和mRNA分别进行计算和筛选。※表达模式聚类

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功