在线宏基因组扩增子分析系统-AILVA

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

在线宏基因组扩增子分析系统——AILVA微生物扩增子数据库整理RDP数据库全称“RibosomalDatabaseProject”,是由密歇根州立大学开发维护的在线工具,包括数据库和分析工具两部分。两者都很好,但都没有做到最好。SILVA最大最全的数据库,全的缺点是假阳性率会更高。SILVA是一个rRNA基因序列的综合数据库,收录原核和真核微生物的小亚基rRNA基因序列(简称SSU,即16S和18SrRNA)和大亚基rRNA基因序列(简称LSU,即23S和28SrRNA)。GreenGene虽然多年没有更新,但是使用该数据库进行物种注释依然是很多科研工作者不变的选择,而且16S功能分析工具PICRUSt也是基于该数据库的,可想而知其影响力。QIIME的默认数据也是它。主要是人工整理,比较准确。分类采用常用的七级界门纲目科属种,方便理解和阅读。RDPSILVAGreenGeneUNITEUNITE数据库是专门针对真菌ITS序列(包括ITS1和ITS2区)最全的数据库,不用考虑ITS注释数据库的选择,UNITE就是近乎唯一的存在!SILVA基本介绍SILVAngs是著名rDNA数据库SILVA刚上线的一个功能插件,可以实现基于rDNA(包括16S/18S/ITS/23S/28S)扩增子高通量数据的在线自动化分析,SlivaNGS,使用详见SILVAngs:扩增子16S/18S免费在线分析。唯一的问题是它的物种注释采用的是14级,且与常用的七级不同,不能转换和比较。在线分析SILVAngs登陆首页实例:可点击进去下载实例数据进行测试SILVAngs中demo帐号可以先用网站的demo帐号查看分析过程和结果。SILVAngs中demo帐号点击openproject之后,再点击result,就可以看到分析结果。主要分为ChartGallery(主要图表)、Figerprints(差异菌比较)、原始数据、参数和流程运行相关信息。SILVAngs中demo帐号Exampleofthecontentofademoproject.ThisprojectcontainstenindividualMulti-Fastafilesreflectingtendifferentsites.SILVAngs中demo帐号Demo数据pipeline接受Multi-Fasta格式的输入数据,每个输入文件代表一个样本。属于一个项目的样本(横断面,时间序列等)应作为单个SILVAngs项目上传。当前版本的pipeline仅接受Multi-Fasta文件;支持上传Gzip压缩的Multi-Fasta文件。不支持.Gzip的FASTQ文件。SILVAngs中demo结果分析下图为ChartGallery中的统计图形结果。包括各步统计结果的可视化,如序列长度分布、序列分类、稀释曲线、OTU与参考序列相似度、比对相似度/质量等;每个图都可以放大查看或下载矢量图svg格式。SILVAngs中demo结果分析样品稀释曲线及其标准误差SILVAngs中demo结果分析FigerprintsFigerprints面板可选择不同分类级别(Taxonomicdepth),采用气泡图显示各组间的相对丰度(颜色)和数据量(大小)。直接展示了样品或组间的差异菌种类或分类单元,气泡图一目了然。最右侧结果导出类型有4种,支持HTML,PDF,在线交互KRONA分类圈图,及所有文件下载。结果已经比较全面了。SILVAngs中demo结果分析右侧的控制面板提供对所有数据的访问。提供有关项目的概述分类的交互式可视化首先查看有关分析的最重要信息提供管道在其中生成的所有文件SILVAngs中demo结果分析下载并解压ArchiveZIP文件,以下是解压之后的文件目录。(具体的报告详解可参考后文中的pdf文件)SILVAngs中demo结果分析下图为在KRONA分类学组成圈图,可操作展示不同分类级别。SILVAngs工作流程本系统的主要分析流程如下:比对质量控制去冗余OTU聚类OTUs表生成和物种注释输入数据要求:建议每个样品使用cleanfasta文件,支持.gz压缩格式加速上传SILVAngs使用1.帐号注册打开SiLVAngs主页:。第一次使用,请按要求注册,如果有学术邮箱(大学或科研单位邮箱)最好,因为本系统对学术免费。注册成功会收到激活邮件,点击邮件中链接即激活帐户并登陆。SILVAngs使用2.新建项目点击主页最上方MyProject,再点Creatnew新建项目;比如我创建名为”test001”的项目;sequencetype选择16S/18SSSU;Sequencetechnolog选择Illumina(MiSeq/HiSeq);expectsequence我填写100000(根据项目数据量实际添写,数量越小分析越快),序列长度填写300(根据引物区域计算);SILVAngs使用3.上传文件点击Upladefile,选择本地cleandata文件*.fa.gz(双端合并,且去除barcode和引物的序列),并点击upload。文件可在上面的demo账号中下载。SILVAngs使用4.参数设置点击Setting选项卡,可以常用分析参数,如聚类相似度,默认98%;物种注释相似度最小值93%等,如下图。SILVAngs使用5.执行分析流程点击右侧的execute按扭,弹窗中再点击execute即开始分析。开始后你会收到任务开始的邮件。并且点击Notifications可以实时查看数据分析的过程。可能需要等一会。运行进展SILVAngs使用6.结果查看等待分析结束后会再次收到邮件通知,点击链接,结果选项卡中会出现showresult按钮;点击查看详细结果。具体详情可查看以下参考文档。ReferenceChristianQuast,ElmarPruesse,PelinYilmaz,JanGerken,TimmySchweer,PabloYarza,JörgPeplies,andFrankOliverGlöckner.TheSILVAribosomalRNAgenedatabaseproject:improveddataprocessingandweb-basedtools.NucleicAcidsResearch,41(D1):D590-D596,2013.doi:10.1093/nar/gks1219.软件主页地址英文原版使用手册下载=SILVAngs_User_Guide_15_12_15.pdf谢谢!

1 / 23
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功