综合序列分析软件BioEdit2003级高芳銮BioEdit简介•BioEdit是一个性能优良的免费的生物序列编辑器,可在Windows95/98/NT/2000中运行,它的基本功能是提供蛋白质、核酸序列的编辑、排列、处理和分析。•与DNAMAN相比,其分析内容相对丰富一些,而且提供了很多网络程序的分析界面和接口,与DNAMAN等软件配合使用更好。•尤其值得一提是利用BioEdit能够十分方面地根据指定的核酸序列绘制相应的质粒图谱。序列的常规操作:序列输入:多种序列输入方式;序列分类:按标题、位置、定义、参数、注释等分类;成对排列:两序列的最佳排列及计算同一性和类似性;序列屏蔽:仅采用联配中部分区域进行分析而排除其他。核酸分析:组成、互补、反转、翻译、质粒、限制性内切酶;蛋白质分析:氨基酸成分、疏水性轮廓、疏水力矩平均数翻译或反翻译:把DNA或RNA翻译成蛋白质;切换翻译:在核酸和编码蛋白质序列中切换核苷酸序列;点图[成对比较]:相互比较两序列的矩阵,生成一个点图。•BLAST本地使用BLASTo创建本地数据库o本地BLAST搜寻BLASTINTERNET客户端程序•ClustalW•使用互联网工具HTMLBLAST网络浏览器PSI-BLASTnnPredict…•进化分析主要内容•绘制质粒图•限制性内切酶图•蛋白质分析–组成分析–熵图–疏水性轮廓–联配中搜寻保守区–根据密码子的使用翻译核苷酸•RNA比较分析–共变–潜在配对–互交信息分析一、绘制质粒图(Plasminddrawing)使用BioEdit质粒绘图功能,序列可以通过自动的位置标记,自动修改成环形质粒。特征、多连接位点和限制性位点可以通过使用对话框增加。当将一个序列进入质粒图时,在背景上出现一个限制性内切酶图谱,所以可以通过对话框选择可以增加限制性位点。它们自动增加到当前的位点。质粒功能提供简单的绘制和标记工具。标签和绘图可以通过鼠标移动和缩放。想要编辑目标性质,双击目标。想要从一个DNA序列产生一个质粒,从“Sequence”菜单中“NucleicAcid”子菜单中选择“CreatePlasmidfromSequence”选项。选择这个选项时,限制性内切酶图谱将会使用通常商业化的,储存在存储器中的限制性内切酶。质粒第一次产生时,它显示成有10个位点标记的圆圈,中央是标题。1.Restrictionsites:(限制性位点)想要增加限制性位点,从“Vector”菜单中选择“RestrictionSites”选项。将会显示一下对话框:想要显示图谱中的限制性内切酶,从右边(“Don'tShow”中)选择任何想要的酶,用按钮将它们移动到左边。按下“Apply&Close”时,这个位点就会增加到图谱中。指定的酶如果只有一个酶切位点,就会在酶切位点上出现一个“U”。如果没有“U”,将会显示第一个酶切位点。想要移动图谱中酶的位置,在“Show”中增加选择的酶的亮度,按下按钮将它们移动另一边。2.Positionalmarks(位置标记):点击“Vector”菜单中的“PositionalMarks”选项,可以出现以下对话框:可以通过移动位置标记到“Show”中,单独增加位置标记,或者设定应用的分割标记数量。想要没有标记,选择“Divideinto:”中的下拉菜单顶端的“None”。3.Features(特征):想要增加一个特征,如抗生素抵抗标记,从“Vector”菜单选择“AddFeature”。将显示以下对话框:选择的类型是“NormalArrow”、“WideArrow”、“NormalBox”和、“WideBox”。在上面例子中的所有特征是“常规”宽度的。如果特征是一个箭头,箭头的方向将是从起点位置到终点位置。增加特征或酶时,他们各自的标记增加在外面,中心是可能的尺寸。标记可以被选择工具选择、移动、编辑和缩放。4.GeneralVectorproperties载体属性可通过选“Vector”菜单中的“Properties”来更改:可以通过指定起点和末端位置,来增加多接头按钮。多接头显示为“CourierNew”字体。在这个对话框中,特征可以被编辑、增加或者删除。想要编辑或删除一个现存的特征,在“Features”下拉式菜单中选择特征,并点击合适的按钮。点击“AddNew”按钮,可以增加一个新的特征。现在只有一个圆形、单链质粒是有效的。在以后的版本中中将会改进。“Font”按钮改变指示的默认字体。特征标记的字体将可以单独改变,但是位置标记不能单独改变。二、RestrictionMaps(限制性内切酶图)BioEdit提供两种方法产生核苷酸序列的限制性内切酶图。一种内在的限制性内切酶图功能允许产生序列最多为65,536个核苷酸的限制性内切酶图。实际上,只能检测大约35Kb,而且在速度慢的计算机上会要消耗很长的时间。你也可以通过万维网直接链接到WebCutter限制性内切酶图上。1.WebCutter:点亮你想要图谱的序列标题,从“WorldWideWeb”菜单中选择“Auto-fedWebCutterRestrictionMapping”2.BioEdit:点亮你想要图谱的序列标题,从“Sequence”菜单选择“RestrictionMap”。以下选项将会显示在一个界面窗口:—显示图谱:显示或省略序列的全图谱,互补链显示每个酶的酶切位点.默认值:yes—按照字母顺序排列名称:显示关于所有内切酶、它们的识别序列、切割频率和所有位置(5’末端开始是1)的列表.默认值:yes—位置数:关于酶切位点的列表.默认值:no—唯一位点列表:在全部序列中只有一个酶切位点的内切酶列表.默认值:no—切割5次或更少的酶.默认值:yes—频率汇总表:关于所有正确选择的内切酶和它们切割序列的次数。默认值:no—不能切割的内切酶。默认值:yes—4-碱基内切酶:想要包括这些酶,必须点击这个选项.默认值:no(不包括本身)—5-碱基内切酶:与4-basecutters相同.—非严格识别序列的酶:有时你可排除它们.默认值:yes—大的识别位点:通常用于克隆,只有共同的6-碱基识别酶被使用.—同裂酶:若只显示一个特殊识别位点的一个内切酶,不选(默认值=不选择).—翻译:显示沿着排列中的序列翻译(5’端到3’端的由左到右的翻译)—互补翻译:互补链的翻译方向相反.—编号方式:是酶切位点的核酸的号码,而不是识别位点的起点.3.RestrictionEnzymeBrowser(限制性内切酶浏览器)从核酸序列中得到内切酶谱时,显示酶的生产公司是很有用的。通过在内切酶图谱中选择制造厂商和按下按钮,可以手动浏览内切酶。你也可以通过选择“Options”菜单中的“ViewRestrictionEnzymesbyManufacturer”选择,在任何时候检查内切酶。显示如右对话框:在这个例子中,所有来源于Stratagene的限制性内切酶显示在左边的列表中,KpnI的亮度增加。KpnI的识别序列显示在顶端,同裂酶显示在它的下方,其他提供KpnI的公司显示在同裂酶的下方。BioEdit使用ReBase提供的gcgenz表,限制性内切酶数据在万维网的地址是:。可以从ReBase下载最新的gcgenz表,将其命名为“enzyme.tab”,并且替代在BioEdit安装文件夹中“tables”目录下的旧文件。注意:表必须是gcgenz格式的。你可以从tables文件夹中打开“enzyme.tab”文件查看格式,或者查看“RestrictionMaps”。限制性内切酶表格文件名必须是“enzyme.tab”,而且必须在BioEdit的“tables”文件夹里。1.氨基酸的组成从“Sequence”菜单下进入“Protein”,再进入“aminaacidcomposition”,可对序列的氨基酸组成分析,结果以摘要和图例的形式给出。图例中的柱形条表示每种氨基酸在序列中的摩尔比,如下图:三、蛋白质分析以RGDV的minoroutercapsidprotein-AAS66885为例:2.熵图在联配文件中有专栏用熵图来衡量可变性。它衡量的是在联配中每个位置的“信息量”的缺乏。准确地说,是每个位置的可预测性的缺乏。3.疏水性轮廓(profile)平均疏水性轮廓采用Kyte&Doolittle的方法,平均分值(总和/窗口大小)作为序列中各个位置的疏水性值,并以窗口中中间残基的疏水性值作图。4.瞬间疏水性轮廓(hydrophobicmomentprofile)5.平均瞬间疏水性轮廓6.在联配中搜寻保守区有时,即使序列之间的变化很大时,在几个序列中搜寻保守区是有用的。例如,根据一系列同源序列发现通用的PCR引物。BioEdiot查找的是低平均“熵”的区域。首先选择你的序列,从“Aligment”-“FindConservedRegion”,对话框中各选项的内容:BioEditversion5.0.9ConservedregionsearchAlignmentfile:Q:\Ribosomal_RNA\some_methanos.bio5/10/048:57:33PMMinimumsegmentlength(actualforeachsequence):15Maximumaverageentropy:0.2Maximumentropyperposition:0.2Gapslimitedto2persegmentContiguousgapslimitedto1inanysegment2conservedregionsfoundRegion1:Position755to774Consensus:755AUUAGAUACCCGGGUAGUCC774SegmentLength:20Averageentropy(Hx):0.0155Position755:0.0000Position756:0.0000Position757:0.0000Position758:0.0708Position759:0.0000Position760:0.0000Position761:0.0000Position762:0.0000Position763:0.0000Position764:0.0708Position765:0.0000Position766:0.1679Position767:0.0000Position768:0.0000Position769:0.0000Position770:0.0000Position771:0.0000Position772:0.0000Position773:0.0000Position774:0.0000Region2:Position1206to1222Consensus:1206ACACGCGGGCUACAAUG1222SegmentLength:17Averageentropy(Hx):0.0182Position1206:0.0000Position1207:0.0000Position1208:0.0000Position1209:0.0000Position1210:0.0708Position1211:0.0708Position1212:0.0000Position1213:0.1679Position1214:0.0000Position1215:0.0000Position1216:0.0000Position1217:0.0000Position1218:0.0000Position1219:0.0000Position1220:0.0000Position1221:0.0000Position1222:0.0000BioEditversion5.0.9ConservedregionsearchAlignmentfile:G:\Ribosomal_RNA\some_methanos.bio5/10/999:34:06PMMi