帮助文档基本思想...........................................................................................................................................1工作流程说明...................................................................................................................................21.实验流程................................................................................................................................22.信息分析流程........................................................................................................................4结果说明...........................................................................................................................................4�数据处理及数据评估........................................................................................................41.原始数据........................................................................................................................42.数据处理及长度分布....................................................................................................53.样品间小RNA公共及特有序列分析...........................................................................7�标准信息分析....................................................................................................................81.基因组比对....................................................................................................................82.已知miRNA鉴定:统计信息.......................................................................................93.已知miRNA鉴定:表达谱信息.................................................................................124.重复序列比对..............................................................................................................145.Genbank比对...............................................................................................................156.Rfam比对.....................................................................................................................167.外显子、内含子比对..................................................................................................178.小RNA分类注释.........................................................................................................179.候选miRNA预测:表达谱信息.................................................................................1810.候选miRNA预测:统计信息...................................................................................2111.已知miRNA家族分析...............................................................................................21�高级信息分析..................................................................................................................211.miRNA差异分析..........................................................................................................212.聚类分析......................................................................................................................223.已知miRNA碱基编辑.................................................................................................234.miRNA靶基因预测......................................................................................................245.GO富集分析................................................................................................................256.KEGG通路分析............................................................................................................28参考文献:.....................................................................................................................................30基本思想HiSeq深度测序所得的小RNA(sRNA)几乎涵盖所有类型的小片段RNA,包括miRNA、siRNA、piRNA、rRNA、tRNA、snRNA、snoRNA、repeatassociatesRNA、exon或intron降解片段等,其中miRNA、siRNA以及piRNA是研究的热点。对于测序所得的序列的鉴定,生物信息分析一般通过与各类已知的数据库进行比对、寻找样品与数据库之间在基因组位置上的覆盖等方法,对sRNA进行注释分类,同时选取没有被注释上的sRNA,使用华大自主开发的软件Mireap预测novelmiRNA。在miRNA鉴定的基础上,针对实际样品信息采用灵活的差异分析策略可以找到生物体不同时期不同组织或不同个体间的表达差异的miRNA,针对这部分miRNA通过靶基因预测软件进行靶位点确认,然后可通过对靶位点所在基因的GO功能注释以及KEGGpathway注释,最终可以得到miRNA在生物体中参与的生命活动的一个清晰的生物信息图谱。工作流程说明1.1.1.1.实验流程小RNA是生物体内一类重要的特殊分子,诱导基因沉默,参与细胞生长、发育、基因转录和翻译等诸多生命活动的调控过程。基于HiSeq高通量测序技术的小RNA数字化分析,采用边合成边测序(SBS-sequencingbysynthesis),可减少因二级结构造成的一段区域的缺失。并具有所需样品量少,高通量,高精确性,拥有简单易操作的自动化平台和功能强大等特点,一次性获得数百万条小片段RNA序列,能够快速全面地鉴定该物种在该状态下的小RNA并发现新的小RNA,构建样品之间的小RNA差异表达谱,为小RNA功能研究提供有力工具。其实验流程如图1:2.2.2.2.信息分析流程HiSeq测序所得50nt序列,通过去接头、去低质量等过程完成数据处理得到可信的备用分析的目标序列,对其进行序列长度分布的统计及样品间公共序列统计。将清理后的目标序列分类注释,可以获得样品中包含的各组分及其表达量信息。将所有小RNA片段注释后,用剩下的未注释片段来进行:1.novelmiRNA的预测;2.已知miRNA的碱基编辑预测。对于鉴定得到的miRNA进行靶基因预测,然后对靶基因进行GO功能注释以及KEGG_pathway注释,整个流程如下图:图1.实验方法UnannotatedsRNAExon,intronKnownmiRNAPotentialmiRNAwithseededitRepeatassociatedRNAsrRNAs,tRNAs,snRNAs,snoRNAsNovelmiRNAFilterlowqualitytagsCommon/SpecificsequencesLengthdistributionFull-lengthsmallRNAtagsSolexa50nttagsHighqualitytags1.Trim3’adaptor2.Cleanuptoosmalltagsandcontaminationformedbyadaptor-adaptorligationDatacleaningDatacleaningDatacleaningDatacleaningStandardanalysisStandardanalysisStandardanalysisStandardanalysisDifferentialexpressionClusteranalysisTargetpredictionGOenrichment&KEGGpathwayanalysis结果说明����数据处理及数据评估1.原始数据原始数据:测序得到的原始图像