MicroRNA基因上下游分析报告

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

结直肠癌相关的miR-10000的上游和下游调控关系分析样例背景基因的上下游分析是做生物医学研究必要的分析之一,但需要整合各种调控数据库以及多样本基因表达数据,某些研究人员可能无从下手。只需要提供感兴趣的基因(或者miRNA,TF)名称,云生信整合全世界公共数据库所有样本数据,从众多基因上下游的分析结果中,挑选出与疾病最相关的结果。结果作为实验的理论支持,大大降低实验的假阳性。基因的上下游分析分析内容:转录因子调控靶基因分析(TF-target);microRNA调控靶基因分析(miRNA-Target);蛋白质与蛋白质相互作用分析(PPI);其他如TF-miRNA、TF-lncRNA、lncRNA-mRNA、miRNA-lncRNA等。整合的全球公共数据库所有样本数据:各个物种的转录调控数据库(TRANSFAC、JASPAR、TRED、PAZAR、AGRIS、RegulateDB、CHIPBASE等);各种miRNA调控靶基因的算法工具(miRBase、miRWalk、TargetScan、miRanda、PicTar、PITA等);蛋白互作数据库(如HPRD、STRING、DIP、BioGRID、MINT等);TCGA数据库的RNA-seq、small-RNA-seq等;GEO数据库的基因芯片、miRNAx芯片等。分析目的:通过对结直肠癌公共芯片数据的分析,获得与结直肠癌相关的mir-10000(此处数字为代指,下同)调控的上游、下游基因。分析过程:1、公共芯片数据的选择下载。本分析使用的数据下载自GEO(GSE410000)[1],样本来自1992年至2004年期间在MSK肿瘤中心接受诊治的结直肠癌患者,包括10000例结直肠癌样本,与510000例正常结直肠组织对照。芯片平台使用的是AffymetrixHG-U133A,能够检测超过10000个人基因的转录表达水平。2、差异表达基因分析我们使用R软件包Limma[2]中的经验贝叶斯模型识别110000例结直肠癌与50000例正常结直肠组织之间的差异表达基因,以logFC绝对值大于或者等于0.585(相当于1.5倍的平均表达水平改变)和adj.P.Val小于0.05为基因显著差异表达的阈值。adj.P.Val是Benjamini&Hochberg方法[3]进行多重检验校正的结果。我们一共发现了522个显著上调基因和653个显著下调基因。3、miRNA靶基因关系分析使用miRecord数据库[4]的实验验证数据,以及miRecord数据库的预测数据。其中,miRecord预测工具我们使用了miranda[5],mirtarget2[6],pita[7],rnahybrid[8],targetscan[9]这5中预测方法进行分析,然后选择预测结果出现4次及以上的关系对作为miRNA调控靶基因关系对。最后,我们将这些预测得到的靶基因与结直肠癌差异表达基因进行交集分析,得到了miRNA调控的差异表达基因信息。miRecordValidatedTargets数据库中,经过实验验证的miR-10000调控靶基因只有一个结果,即MTA1基因。miRecordPredictedTargets数据库中,选择大于等于4次的关系对,最终得到了2214个靶基因。将实验验证结果+预测结果共计2215个靶基因与522个显著上调基因和653个显著下调基因取交集后,分别得到了49个上调靶基因和58个下调靶基因。如图1所示。图1miR-10000的靶基因与差异表达基因的venn图4、TF调控miRNA分析我们使用CHIPbase[10]数据预测分析调控miR-10000的转录因子(TF)信息,然后从中筛选出属于差异表达基因的TF。利用CHIPbase数据库我们得到,调控miR-10000的转录因子共有10000个,其中属于结直肠癌差异表达基因的共有2个,即MYC,CEBPB。5、构建整合网络图。结合miR-10000的上游和下游分析结果,使用cytoscape[11]软件做图,结果如图2所示。图2整合网络图。菱形代表转录因子(TF);六边形代表miRNA;椭圆代表靶基因。红色代表差异上调基因,绿色代表差异下调基因。结论通过以上的分析,我们能够得到与疾病(结直肠癌)相关的差异表达基因列表,miR-10000调控的靶基因以及被调控的转录因子,并从中获得与结直肠癌相关的miR-10000的上游和下游关系。我们可以从中获得重要的转录因子,并挑选合适的靶基因。参考文献1.Sheffer,M.,etal.,Associationofsurvivalanddiseaseprogressionwithchromosomalinstability:agenomicexplorationofcolorectalcancer.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2009.106(17):p.7131-6.2.Smyth,G.K.,Limma:linearmodelsformicroarraydata,inBioinformaticsandComputationalBiologySolutionsUsing{R}andBioconductor,R.G.a.V.C.a.S.D.a.R.I.a.W.Huber,Editor.2005,Springer:NewYork.p.397--420.3.Benjamini,Y.H.,YosefControllingthefalsediscoveryrate:apracticalandpowerfulapproachtomultipletesting.JournaloftheRoyalStatisticalSociety,SeriesB,1995.57(1):p.289-300.4.Xiao,F.,etal.,miRecords:anintegratedresourceformicroRNA-targetinteractions.Nucleicacidsresearch,2009.37(Databaseissue):p.D105-10.5.John,B.,etal.,HumanMicroRNAtargets.PLoSbiology,2004.2(11):p.e363.6.Wang,X.,miRDB:amicroRNAtargetpredictionandfunctionalannotationdatabasewithawikiinterface.RNA,2008.14(6):p.1012-7.7.Kertesz,M.,etal.,TheroleofsiteaccessibilityinmicroRNAtargetrecognition.Naturegenetics,2007.39(10):p.1278-84.8.Kruger,J.andM.Rehmsmeier,RNAhybrid:microRNAtargetpredictioneasy,fastandflexible.NucleicAcidsRes,2006.34(WebServerissue):p.W451-4.9.Agarwal,V.,etal.,PredictingeffectivemicroRNAtargetsitesinmammalianmRNAs.Elife,2015.4.10.Yang,J.H.,etal.,ChIPBase:adatabasefordecodingthetranscriptionalregulationoflongnon-codingRNAandmicroRNAgenesfromChIP-Seqdata.NucleicAcidsRes,2013.41(Databaseissue):p.D177-87.11.Smoot,M.E.,etal.,Cytoscape2.8:newfeaturesfordataintegrationandnetworkvisualization.Bioinformatics,2011.27(3):p.431-432.

1 / 3
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功