HMMER教程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

博耘生物MainmenuSkiptoprimarycontentSkiptosecondarycontent首页生物信息学的阶梯生物信息学的阶梯-初级生物信息学的阶梯-高级生物信息学的阶梯-初中级生物信息学的阶梯-中级生物信息学的阶梯-初高级生物信息的学人才需求关于版权声明留言板hmmer的安装与使用从功能基因研究的角度来讲,相关的搜索,比如从序列数据库中,找同源的序列,或者对一个对一个新的基因功能进行鉴定,使用hmmer比使用blast有着更高的灵敏度已经更高的搜索速度,但其应用还远没有blast普及,这里是一篇入门级的介绍文章。hmmer下载与安装对于MacOS/X,Linux,UNIX系统,用源代码编译安装:%wget系统,直接下载二进制压缩包,解压就可以使用,下载地址:包含的程序phmmer:与Blastp类似,使用一个蛋白质序列搜索蛋白质序列库;phmmertutorial/HBBHUMANuniprotsprot.fajackhmmer:与psiBlast类似,蛋白质序列迭代搜索蛋白质序列库;jackhmmertutorial/HBBHUMANuniprotsprot.fahmmbuild:用多重比对序列构建HMM模型;hmmsearch:使用HMM模型搜索序列库;hmmscan:使用序列搜索HMM库;hmmalign:使用HMM为线索,构建多重比对序列;hmmalignglobins4.hmmtutorial/globins45.fahmmconvert:转换HMM格式hmmemit:从HMM模型中,得到一个模式序列;hmmfetch:通过名字或者接受号从HMM库中取回一个HMM模型;hmmpress:格式化HMM数据库,以便于hmmscan搜索使用;hmmstat:显示HMM数据库的统计信息;使用HMM模型搜索序列数据库1.使用hmmbuild构建HMM模型,输入为Stockholm格式或者FASTA格式的多重比对序列文件(如:tutorial/globins4.sto),命令如下:hmmbuildglobins4.hmmtutorial/globins4.stoglobins4.hmm为输出的HMM模型2.使用hmmsearch搜索蛋白质序列数据库,蛋白质序列数据库为FASTA格式,命令如下:hmmsearchglobins4.hmmuniprotsprot.fastaglobins4.outglobins4.out为输出的结果文件,如下:*示例使用官方教程中的示例使用蛋白质序列搜索HMM数据库1.构建HMM数据库,HMM数据库是包含多个HMM模型的文件,可以从Pfam、SMART、TIGRFams下载,也可以自己由多重比对序列集中构建,如:hmmbuildglobins4.hmmtutorial/globins4.stohmmbuildfn3.hmmtutorial/fn3.stohmmbuildPkinase.hmmtutorial/Pkinase.stocatglobins4.hmmfn3.hmmPkinase.hmmminifam2.使用hmmpress格式化数据库,包括压缩以及创建索引,命令如下:hmmpressminifam这个步骤可以很快的执行完成,输出的内容如下:Working…done.Pressedandindexed3HMMs(3namesand2accessions).Modelspressedintobinaryfile:minifam.h3mSSIindexforbinarymodelfile:minifam.h3iProfiles(MSVpart)pressedinto:minifam.h3fProfiles(remainder)pressedinto:minifam.h3p3.使用hmmscan搜索HMM数据库,命令如下:hmmscanminifamtutorial/7LESS_DROME输出如下:后记这里主要是一个入门式的教程,介绍了hmmer的安装,以及最常用功能使用的命令示例。其他程序的使用,以及每个程序的详细参数说明,请参看官方手册,官方文档手册(pdf):新书推荐»转载文章请注明,转载自:博耘生物»《hmmer的安装与使用》»原文链接:=1753相关文章:RNA-seq差异表达基因分析之TopHat篇CummeRbund的安装与使用(forlinux)存文本文件及其字符编码blast+与blast的差异Thisentrywaspostedin数据分析andtaggedHMM,hmmer,功能基因研究,同源基因预测,结构域,软件安装byboyun.Bookmarkthepermalink.23THOUGHTSON“HMMER的安装与使用”1.boyunon2011年10月25日at18:30said:需要注意的几点:蛋白质序列,基因组数据方面,hmmer操作的对象是蛋白质数据,而不是基因组或者转录组的数据;FASTA格式,就输入序列而言,格式就是FASTA格式;hmm模型格式,多重比对格式Stockholm格式;与blast结果类似的输出结果的解读。Reply↓2.Pingback:构建批量基因结构域鉴定分析平台|博耘生物3.aguion2013年4月20日at19:14said:为什么我在运行./configure后,生成里makefile,但是不能执行make,显示make:commandnotfound,请问怎么回事?Reply↓boyunon2013年4月24日at09:26said:你用的是什么操作系统,是不是make没有安装?输入whichmake,看是否可以找到make命令。Reply↓4.来自中国on2013年7月27日at00:48said:你好。我到现在还是不了解hmmalign是什么意思,有什么意义,和一般的多重序列比对有何不同?它会产生数字,这又是为什么?我同学为了做hmm模型,用hmmbuild把每个序列已知是domain的部分拼接起来,形成新多重序列,然后再用hmmscan,你说可行吗?我觉得不行,因为这些domain并不是连在一起的,测得的新序列肯定有问题。Reply↓boyunon2013年7月27日at22:16said:多重序列比对可以由不同的算法实现,hmmalign是基于hmm模型的多重比对。我不太情况你讲的数字指的什么,我估计你指的的每个位置碱基出现的概率模型结果。将domain进行拼接再hmmscan,我认为是多余的步骤,可能造成负面的影响,不过也许ta有另外的目的,许多时候只能用数据说话。Reply↓5.xndlesson2013年8月14日at11:19said:请问HMMER程序能利用一段基因序列.fa搜索出对应的蛋白序列嘛?怎么处理的~~Reply↓boyunon2013年8月20日at00:29said:不可以,如果想用一段基因序列搜索对于蛋白质可以使用blast。对于相似度高的序列,都可以达到很好的效果。hmmer的出现是因为两条蛋白质相似性很低,但是却有着近似的功能,为什么,是因为其有着相似的特征,而hmm模型就是这个特征的一种表示,所以要把这些相似度低,但是确实是同一家族的蛋白质,进行建模,然后通过模型再去找其他家族的成员。Reply↓cuitaoon2015年6月29日at14:05said:可以,使用phmmer程序Reply↓6.小强on2013年8月19日at22:54said:您好,我目前想搜索Pfam数据库中含有目标结构域的所有基因,并输出,这个需要使用哪个软件,如何实现,若楼主知道,麻烦告知一下。谢谢Reply↓boyunon2013年8月20日at00:22said:pfam就是一个结构域数据库,找到你要的结构域,详细信息就会看到,也可以下载到构建该结构域的所有基因。通常需要做的就是新的物种测序,对于远源蛋白进行预测,下载到指定格式的结构域序列,然后使用hmmer的搜索结构域搜索蛋白质库的命令对库进行搜索。Reply↓7.董楚河on2013年8月21日at13:38said:请问楼主,为什么我下载的windows版,的所有文件都没法运行?我的系统目前还是windowsXP.Reply↓boyunon2013年9月1日at21:35said:你是如何运行的,没有任何输出吗?Reply↓cocaon2013年9月2日at10:53said:windows版下载解压后,没法打开,双击就直接跳掉了,进入不了程序里面说明是这样介绍的,我把两个DLL文件,复制到WINDOWS文件荚是,还是不行,请问怎么回事儿,要安装什么么?谢谢HMMER3.0forWindowsThissuiteofHMMER3.0moduleshasbeencompiledunderCYGWINenvironmentandtestedtorunproperlyunderWindowsXPandWindows7operatingsystems.InordertorunHMMERprograms,oneneedtoplacetwodllfiles,cygwin1.dllandcyggcc_s-1.dllintodirectory,wherethosefilescanbeseenbyWindows,i.e.placeitinwindows/system32folder,orappendthepathtothosefilestoPATHenvironmentvariable.Note,thatwhenyourunHMMERmodulesandindicatefilepathasaparameter,youshouldusepatheitherrelativetotheplace,whereHMMERmoduleslocatedorusenotation/cygdrive/c/mypath/myfileinsteadofc:\mypath\myfile.Otherwise,youwilleverytimegetanannoingwarninglikethisbelow:cygwinwarning:MS-DOSstylepathdetected:c:\temp\filePreferredPOSIXequivalentis:/cygdrive/c/temp/fileCYGWINenvironmentvariableoption“nodosfilewarning”turnsoffthiswarning.Reply↓boyunon2013年9月2日at12:59said:我已经想到了,你犯了一个错误,界面到命令行转变必经之路,不是每个程序双击都有窗口的,因为他没有窗口界面,是一条命令,只能在命令行(dos窗口)调用。在开始-运行,中输入cmd,回车,进入dos窗口,切换磁盘,比如D:,在切换目录到你hmmer的bin目录,比如cdhmmer\bin,输入命令,按照hmmer的手册Reply↓刘雄on2013年10月22日at22:04said:我已经想到了,你犯了一个错误,界面到命令行转变必经之路,不是每个程序双击都有窗口的,因为他没有窗口界面,是一条命令,只能在命令行(dos窗口)调用。

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功