福建农业生物技术通讯1生物信息基因序列分析软件DNAStar简介郑伟文,林营志,刘波,曹宜,苏明星,朱育菁,蓝江林,车建美,郑斯平,陈坚(福建省农科院生物技术中心)1.设计公司SequenceAnalysisSoftwareforMacintoshandWindows,GETTINGSTARTED,IntroductoryTouroftheLASERGENESystem,MAY2001,LASERGENEforWindows&Macintosh,DNASTAR,Inc.,1228SouthParkStreet,Madison,Wisconsin53715,(608)258-7420,Copyright.2001byDNASTAR,Inc.,Allrightsreserved.Reproduction,adaptation,ortranslationwithoutpriorwrittenpermissionis,prohibited,exceptasallowedunderthecopyrightlawsorwiththepermissionofDNASTAR,Inc.,SixthEdition,May2001,PrintedinMadison,Wisconsin,USA,TrademarkInformation。2.应用程序在安装Lasergene网络系统之前要熟悉以下术语:应用程序:指EditSeq,GeneMan,GeneQuest,MapDraw,MegAlign,PrimerSelect,Protean,andSeqManII。应用程序服务器:是指存储应用程序的电脑,通常与dongle服务,器是同一个服务器,但也可以不同,当在局部硬盘上安装网络程序,时,也可以在同一个网络系统中同时存在多个不同的应用程序服务,器,而且应用程序服务器不一定是苹果机,储存应用程序的机器也不一定必须能够运行该程序,仅仅是储存而已。3.安装方式3.1通过英特网升级如果您以前已经安装了Lasergene而且目前有升级和服务联系,您就可以通过英特网来升级您现有的版本,各种模块(module)都是以自解压形式存储的,你可以选择性的下载安装。必备条件您的用户名和会员号是必需的,可以在安装盘上找到。3.2程序升级备份您已有的Lasergene,找到您要升级的执行程序,并把它转移到备份的文件夹中。连接到DNAstar网站的主页(),从菜单中的Customers中点击LasergeneUpdates点,安提示输入密码和用户名(与会员名相同),这样就会打开下载页面。找到windows软件(Windows95/98/NTSoftware.),就可以下载您想要的模块了。模块下载完毕以后,双击文件将其解压缩完毕。看到“Applicationname”hasbeenupdated.说明升级完毕。3.3软件安装从CD在PC机(Windows)上安装Lasergene。注意安装是尽量关闭所有其它程序以保证安装顺利进行。必备条件,一张个人的Lasergene安装盘;一张Lasergene软件光碟;足够的硬盘空间和内存:至少30Mb的硬盘,32Mb的RAM。从光盘安装Lasergene,插入安装盘和安装光盘,双击安装图标,则出现下面的窗口,点击继续,则出现安装窗口。随后一次出现下面窗口,请按照提示做出选择然后点击Next,直至完成安装(图1)。2第6卷2004(4)图1软件安装福建农业生物技术通讯3基因序列编辑软件EditSeq的使用技术刘波,郑伟文,林营志,曹宜,苏明星,朱育菁,蓝江林,车建美,郑斯平,陈坚(福建省农科院生物技术中心)1.EditSeq功能简介EditSeq是能够迅速、正确地输入,并且修改DNA或蛋白质序列工具。每个EditSeq文件都可以分为三个可编辑的部分,上边的一部分为序列文件,中间的一部分里是评论,底部是序列的注释。EditSeq能读取大部分的序列格式——包括FASTA,GenBank,ABI、GCG和ASCII格式。你可以使用菜单命令或拖拽方式输入序列文件。另外,序列也许通过使用键盘输入,或者从其他地方复制、粘贴得到。经Entrez或BLAST检索得到的序列可以直接从因特网或企业内部互联网服务器下载。序列被打开后,EditSeq能使用标准或者指定的遗传密码进行翻译,或者反翻译,寻找开放读框,还可以进行阅读校对。另外,EditSeq能以GenBank,FASTA和GCG格式输出序列。如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,传真:(608)258-7439,电子信件:support@dnastar.com,或者经。2.打开已有序列用Windows打开“tethis21.seq”开始。假设序列的末尾有载体序列污染。我们在用EditSeq打开序列的同时,用SetEnds命令去除5’和3’污染序列。从文件菜单(FILEMENU),选择Open。打开文件夹“DemoSequences”单击选定序列“TETHIS21”。单击位于对话框右下角的SetEnds按钮。SetEnds被打开(如右)。在5’框和3’框中键入50和850,点击OK。单击Open打开序列。当EditSeq窗口打开时,序列长度显示在右上角。通过“settingends,”现在你只有昀初序列中的801bp的片段。SetEnds选择在全部Lasergene应用程序中都可以使用(图1)。图1选择Open。打开文件夹“DemoSequences”单击选定序列“TETHIS21”3.寻找开放读框在这入门的一部分中,我们将确定序列中昀大的ORF,并翻译它。从SEARCHMENU找到ORF,点4第6卷2004(4)击打开会出现右边的对话框。单击FindNext寻找第一个ORF的位置。继续点击FindNext直到你把ORF的位置选定在位置183-455。ORF的坐标会出现在EditSeq窗口的顶端附近(图2)。图2单击FindNext寻找第一个ORF的位置4.DNA序列翻译这一节中我们介绍如何翻译我们的ORF,不过任何序列中的读框内部分都可以用下面的方法进行翻译。如果你的选择是在三联码的读框内,三联码指示棒显示为实心黑线(如左图)。如果你的选择是不在三联码的读框内,左边的箭头和右面的箭头显示向左或向右移动一个bp,以使所选序列成为三的倍数。选定ORF,从GOODIESMENU菜单中选择翻译(Translate)。翻译的蛋白质序列出现在一个新的未命名窗口中(如右图)。它是使用标准的遗传密码翻译的。福建农业生物技术通讯5图3图45.使用其它遗传密码根据你的序列的来源,你可以选择使用非标准的遗传密码进行翻译等操作。在这节中,我们将标准的遗传密码转换成CiliateMacronuclear密码。从GOODIESMENU菜单选择GeneticCodes打开,子菜单显示如左。单击“CiliateMacronuclear”就实现了遗传密码的转换,EditSeq现在使用的就是CiliateMacronuclear的遗传密码。同样可以将遗传密码转换为其它类型。图56.遗传密码的编辑这一节中我们修改CiliateMacronuclear的遗传密码。从GOODIESMENU菜单选择EditSelectedCode。这将打开右面的窗口,窗口显示遗传密码是怎样翻译DNA和RNA序列的。如以DNA形式展示密码,点击DNA按钮。编辑时,单击任何要编辑的密码,从其目前的位置拖到新氨基酸对应的位置则可。如使用不同的启始密码子,单击SetStarts按钮。第二的遗传密码窗就会被打开,可以进行起始密码子选择。单击任何氨基酸(或者codon位置),该密码子就会变成绿色,而且旁边出现一个箭头,它就被设定为起始密码子了。如要去除,只需单击它即可。如不保存,则单击取消;如要保存,单击保存为。图66第6卷2004(4)7.序列的反向互补及反向转换下面的步骤可以用于反向测定的序列的正确输入。选定序列。从GOODIESMENU菜单,选反向互补序列(ReverseComplement),或者把序列颠倒过来(ReverseSequence)命令,则被选定的序列就被翻转互补或翻转过来了。8.BLAST检索下面我们将在NCBI的BLAST服务器上对TETHIS21序列进行相似性比较。注意为了进行BLAST查找必须保证因特网的连接。如果你没有连接因特网,跳过这部分,继续下一部分。选定序,或者从EDIT菜单中选择SelectAll。从网络检索菜单(NETSEARCHMENU),选择BLAST查找。BLAST对话框就会出现。程序默认为blastn,数据库默认是nr,参数转换请参照帮助。单击OK开始查找。寻找结果显示为两部分(如下)。上边的部分是按可能性的顺序显示检索到的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)比较的具体结果。图7图8有关“score”和“expectation”的详细的信息在NCBI’s网点可以找到。一般来说,更主要的score和更低的expectation提示较好的相似性。BLAST结果窗昀上边的3钮被用来打开,或者保存检索到的序列,或者让你了解更多的有关信息。下面我们从用“CreateDocument”钮来打开评分昀高的5序列开始:单击CreateDocument。一个小的对话框出现。在左上角有一个下拉菜单显示默认(default)。单击下拉菜单,选顶端(Top)。并在右面的文本框中写入5。单击OK,EditSeq自动查对多余序列。如果EditSeq提示至少2序列是同一个,请点击OK。EditSeq将从因特网数据库下在单一的序列,并分别打开一个单独的EditSeq窗口。下面我们用“BatchSave”钮将3-10序列保存为EditSeq文件:选定从顶端起第3个序列。单击BatchSave。小的灰色的对话框出现。图9图10单击下拉菜单,选Next。并在右面的文本框中写入8。点击SetLocation,显示文件夹对话框。选定福建农业生物技术通讯7你要保存序列的位置。单击OK回到灰色的对话框。单击OK保存序列,文件扩展为“.seq”。下载过程期间,EditSeq自动查对重复的序列。如果EditSeq提示至少2序列是同一个,请点击OK。除非你收到错误信息,否则可以认为你的序列已经成功下载。昀后我们可以使用“LaunchBrowser”钮查看序列的详细信息选定序列。选择LaunchBrowser。你的网络浏览器将打开右面的窗口。9.序列信息查看现在我们要使用EditSeq菜单指令查看有关打开的TETHIS21序列的信息。选定序列的一部分。如果你倒是希望全选序列,从EDITMENU菜单,选择SelectAll。从GOODIESMENU菜单,选DNAStatistics。就会出现右面的窗口,显示序列信息。图1110.序列校读在我们学习保存和输出序列之前,下熟悉一下EditSeq的校读功能这功能能帮助你校正测序胶中的错读。选定序列。单击校对发音图标(序列窗口底部张开的嘴),或者从SPEECHMENU,选Proof-ReadSequence。电子的音声就会开始朗读所选的序列。(注:如果你听不见任何声音,检查你的计算机的喇叭是否已经打开。)要改变音声read-back的速度,从SPEECHMENU菜单,选择FasterorSlower。要停止校读,点击图标(手),或者从SPEECHMENU菜单,选择Proof-ReadSequence。序列的保存与输出首先创建一个用于保存的序列。从文件菜单,选New中的NewDNA,或者NewProtein。将序列写入出现的窗口。如果你输入非法字符,计算机会发出警告。然后,我们将序列保存为EditSeq文件:从文件菜单,选Save。选定保存位置。给序列命名。单击保存则可。以GenBank或GCG格式保