长片段非编码RNA在肿瘤领域的研究进展人类基因组研究显示仅有约20000个蛋白编码基因,占总的基因组序列不到2%[1,2]。然而90%的基因组序列都处在活跃转录中[3,4]。研究者发现人类转录组不仅仅是蛋白编码基因及其剪接变异体的简单组合,还存在广泛的转录反义RNA、重叠RNA和非编码RNA(non-codingRNA,ncRNA)的基因[5-10]。这些最初被认为是基因组中的“暗物质”,近期研究显示在细胞发育和代谢中发挥重要的作用[11-17]。新近发现的长链非编码RNA(longnon-codingRNA,lncRNA)基因就是其中备受关注的一种,lncRNA的表达具有时空特异性,其异常调控广泛见于包括癌症在内的多种疾病。ncRNA可以根据其长短简单分为短链非编码RNA(smallncRNA)(18-200nt)和lncRNA(200nt-100kb以上)。SmallncRNA包括我们熟知的miRNA,以及新近发现的转录起始RNA(transcriptioninitiationRNAs,tiRNAs)等。lncRNA像mRNA一样由RNA聚合酶Ⅱ生成,并且在平均长度及多聚A尾和多聚A尾信号所占的百分比等方面都与mRNA分子有很大的相似之处,但是它们缺乏长的进化保守的开放阅读框,没有编码蛋白质的功能[47,48]。通常而言,lncRNA基因的表达水平要低于蛋白编码基因[52-55],而某些lncRNAs特定地表达在某些组织中[21]。然而,近期研究显示新发现的lncRNAs可能是前面提到的转录组“暗物质”中的重要组成部分[56,57]。与miRNA和蛋白编码基因,某些转录活跃的lncRNA存在5’末端三甲基化的组蛋白H3K4和基因主体部分的三甲基化的组蛋白H3K36[8,58,59]。目前发现的少量人类lncRNAs参与了一系列的生物过程,包括表观遗传学调控,选择性剪切,入核转运,作为结构元件,作为小RNA前体,甚至作为mRNA衰变的调控子等[4,60-70]。更重要的是越来越多的研究表明lncRNA的异常调控广泛参与了多种人类疾病,包括肿瘤的发生和发展。一、lncRNA与肿瘤的发生、发展研究者在lncRNA发现初期即提出肿瘤组织与正常组织中lncRNAs的表达存在差异的猜想,但一直缺乏有力的证据[86]。随着肿瘤转录组以及lncRNAs功能学的进展,目前已发现一系列在肿瘤中差异表达的lncRNAs。lncRNA参与调控多种生物功能,这些功能如基因组印迹和转录调控的异常在肿瘤发生中发挥重要的作用。在此,我们重点介绍研究较清楚的与肿瘤生物相关的一些lncRNAs。印迹lncRNA基因印迹是指来自父母一方的基因备份被转录后沉默[87,88]。癌症的一个重要特点是由于印迹的丢失导致了基因表达的改变[90,91]。而其中最为人所知的基因实际上均为lncRNAs。H19基因编码了一个仅表达在母体等位基因的长2.3kb的lncRNA。H19在脊椎动物胚胎发育期高表达,而出生后在除了骨骼和软骨组织外的大部分组织中表达明显下降[20,93,94]。在人类肿瘤中,印迹的丢失和随后的基因高表达现象十分常见。例如,H19位点印迹的丢失导致H19表达的上调广泛见于食管癌、结肠癌、肝癌、膀胱癌及肝脏转移瘤中[95-97]。H19在不同癌症中显示致癌或抑癌作用。H19在肝癌,膀胱癌和乳腺癌中均高表达,提示其致癌作用[97-99]。在结肠癌中,原癌基因转录因子c-Myc直接激活H19,提示H19直接参与c-Myc对下游基因表达的调控[98]。相反,抑癌基因和转录激活因子p53能下调H19的表达[100,101]。有趣的是,也有研究显示H19同样具有肿瘤抑制作用[104,105]。Xist(Xchromosomeinactivespecifictranscript)RNA,长约16500nt,能并同X染色体一起移动,改变染色体的结构和活性,抑制相应的基因转录,从而使x染色体失活[106]。XIST的表达水平与某些肿瘤的预后密切相关,如卵巢癌的治疗反应[118],但XIST在人类肿瘤的发生中的作用还未明确。肿瘤转移HOTAIR是一个位于人类12q13.13染色体哺乳动物HOXC位点的长2.2kb的基因,其编码的lncRNA是最早发现与肿瘤转移相关的lncRNA之一[18]。HOTAIRRNA在原发和转移乳腺癌中均高表达(高出正常组织2000倍以上)[68]。高表达的HOTAIR与肿瘤侵袭、转移和患者预后不良密切相关[68]。如将表达HOTAIR的细胞种植到小鼠乳腺脂肪垫中,会一定程度加快原发肿瘤的生长[68].有趣的是,从HOX位点中能转录出多个lncRNAs,提示HOTAIR可能只是这一个调控现象的其中一个已知的lncRNA,可能还有多个lncRNAs发挥类似的作用[58]。MALAT1RNA是一个位于人类1lql3染色体上,长约8600bp的lncRNA,它可通过与其他分子(如转录因子等)相结合而发挥基因调控作用。Lin等[119]研究发现MALAT1与肝癌的发生、发展密切相关。在肝细胞型肝癌中其表达量是正常肝脏的6倍,同时该转录子在肝细胞型肝癌发展的各个阶段,包括早期阶段,均有显著的表达增加,而且在其他非肝细胞型肝癌中也有类似的差异表达。通过原位杂交技术又发现在50%~80%的乳腺癌、胰腺癌、结肠癌以及25%的前列腺癌组织中均有MALAT1的高表达,而在对照的正常组织中却仅有低表达或没有表达。另外,Ji等[120]发现相对于非转移性的非小细胞肺癌,转移性非小细胞肺癌中MALATl的表达更多。Yamada等[121]报道在子宫内膜间质肉瘤中有比正常的子宫内膜更多的MALAT1的表达。因而,MALAT1可能是一个潜在的广谱的人类肿瘤标志物。通过激活p53介导肿瘤抑制作用MEG3是最早报道的具有肿瘤抑制作用的lncRNA。MEG3基因表达与人类多种正常组织中,而在脑和垂体组织中表达最高[156,157]。MEG3在脑肿瘤及大多数肿瘤细胞系中均不能检出,提示其具有肿瘤抑制作用。更重要的是,过表达MEG3RNA能抑制多种肿瘤细胞系的增殖,进一步支持MEG3的肿瘤抑制作用[157]。在非功能性的垂体瘤中,MEG3调控区域的超甲基化与MEG3的失活有关,为MEG3的失活提供了直接证据[157]。功能上,MEG3是有关高水平的调控性RNA,因为它能激活P53依赖性和非依赖性途径。MEG3介导的p53激活依赖于MEG3RNA的二级结构而不是一级结构[158]。相反,新发现的lncRNA-p21被认为是p53转录反应的下游抑制子,提示p53转录网络包含了多个lncRNAs[164]。通过诱饵或miRNA海绵作用清除miRNA拷贝数改变和转录后沉默等机制会导致肿瘤miRNA表达的异常[165-168]。两个新发现的lncRNAs被认为能通过自然miRNA海绵(natural‘miRNAsponges’)作用降低miRNA表达水平。HULC基因位于6p24.3染色体上,其编码的lncRNA具有典型的mRNA特点。尽管HULC与核糖体共同纯化,却没有任何翻译产物,因此它属于非编码转录子[170]。除了肝癌以外,HULC在结直肠癌肝脏转移瘤和产乙型肝炎病毒的肝细胞癌细胞系均高表达[171]。最近研究初步揭示肝癌细胞HULC高表达及其作用的机制[172]。HULC是复杂的自主调控网络的一部分,该网络调控异常会导致HULC表达的上调HULCRNA可能是通过分子诱饵(moleculardecoy)或miRNA海绵(miRNAsponge)作用清除miR-372。miR-372能转录抑制作用于cAMP反应元件结合蛋白(CREB)的一种激酶——PRKACB。CREB一旦激活,CREB能通过维持HULC启动子区域的一个开放读码框架促进HULC的转录[172]。假基因对(Pseudogenepairs)——PTEN和PTENP1抑癌基因PTEN及其相应的lncRNA——PTEN假基因1(PTENP1)的相互作用机制类似于HULCRNA[173]。PTEN/PTENP1的转录子具有类似的3’非翻译区(UTRs),使两者均结合于相同的miRNAs。通过结合于miRNAs,PTENP1能减少miRNAs对PTEN的抑制作用而上调其表达。在癌症中,特异性突变使PTENP1的miRNA结合位点失活将减少抑癌基因PTEN的转录,从而促进肿瘤细胞的增殖[173]。这种机制有重要的意义,因为PTEN1水平的轻微改变即可影响癌症的易感性[173]。介导肿瘤抑制因子的异常表达ANRIL基因位于人类9p21.3染色体上,是42kb的INK4b-ARF-INK4a位点的一部分。ANRIL是由RNA多聚酶II转录,并被剪切成不同的异型体,包括一个名为p15AS的长34.8kb的非剪切转录子[175,176]。ANRIL的异常表达及单核苷酸多态性与包括癌症在内的多种疾病发生的易感性关系密切[181,182]。在白血病、黑色素瘤、肺癌和膀胱癌中,INK4b-ARF-INK4a位点容易发生高频突变和超甲基化[181]。研究显示ANRIL能够转录后沉默抑癌基因p15,尽管其机制尚未完全清楚[175]。癌症类型特异性表达尽管上述大部分lncRNAs均在多种人类组织中表达,但有极少数lncRNAs到目前为止只发现表达于某种组织中。例如HOTAIR只在乳腺癌表达,而lncRNAsPCGEM1,DD3和PCNCR1仅与前列腺癌有关[68,186,187]。其次,肝脏相关性lncRNAs——HULC仅高表达于原发性肝细胞癌和结直肠癌肝转移瘤中,而不在原发性结直肠癌或非肝转移瘤表达[171]。RNA多聚酶III转录到目前为止,上述lncRNAs均由RNA多聚酶II转录,但仍然有很多ncRNAs是由RNA多聚酶III(RNApolIII)转录[191]。重要的是RNApolIII在癌症细胞常常异常调控而导致其活性的增加[192,193]。促使肿瘤细胞中RNApolIII活性增加的机制包括RNApolIII转录因子的高表达,RNApolIII抑制子逃避和直接的原癌基因激活[193-195]。RNApolIII功能异常会影响由此多聚酶转录的lncRNAs的表达。例如,BC200是灵长类神经系统神经元及人类非神经元癌症细胞的胞浆内的lncRNA[20,50,51,196,197]。与上面我们提到的lncRNAs不同的是,BC200是由RNApolIII所转录,并与人类Alu元件有独特的同源性。BC200是eIF4A依赖性翻译启动的负性调控子[199]。由于大部分全转录组测序均应用富集多聚A纯化转录子的方法,RNApolIII转录子可能会从这些分析中排除。这提示,其他尚未确定的RNApolIII转录的lncRNAs在恶性肿瘤中的高表达可能参与了肿瘤的发生。二、lncRNA在癌症诊断和治疗的应用与非编码的miRNA一样,lncRNAs是具有广阔的疾病诊断和治疗应用前景。在某种癌症中特异性表达的lncRNAs的差异表达或高表达可用以开发新型的肿瘤标志物,这些lncRNAs可能与病人对化疗的敏感性密切相关。加深对lncRNAs作用机制的理解将提供调控基因表达的新方法,例如开发与miRNA结合位点竞争的类似物,染色质重塑因子或DNA。研究者指出介导转录基因沉默(transcriptionalgenesilencing,TGS)途径,尤其是抑癌基因和原癌基因TGS途径有可能为开发新型治疗方法的提供新的思路[205]。三、结语最近的研究表明,一些长片段ucRNA的高表达或低表达与某些肿瘤的发生、发展有关。然而研究尚处于初级阶段,利用长片段ncRNA进行肿瘤的诊断和治疗还有许多尚未解决的问题。在诊断方面,如何确定不同临床分期的特征性长片段ncRNA谱,以达到早期诊断的目的;如何确定不同病理类型的特征性长片段ncRNA谱,以达到病理分型的目的;如何寻找无创手段进行检测等。在治疗方面,如何设计持续高效表达的载体;如何有效导入至活体内;如何在特定组织