第十二章-序列串接

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十二章序列串接109第十二章 序列串接 使用VectorNTI中的ContigExpress程序(图12.1)可利用序列相似度,将小片段序列进行串连。此程序可以将单纯序列文本文件或是由定序出来的讯号档案直接进行分析,串接后的片段称为Contigs,在进行长片段的序列定序或是genomiclibrary定序时非常实用。图12.1使用ContigExpress将小片段序列串接将小片段的序列串接成完整大片段序列的方式如下之操作过程。可以直接开启或是从主程序项目开启ContigExpress程序(图12.2-3):图12.2利用程序集开启ContigExpress程序VectorNTI教育训练手册110图12.3利用主程序开启ContigExpress程序开启此程序后会出现一个操作的画面,此画面会分为左右两个区块:图12.4ContigExpress程序产生的两个区块 在此窗口中,用户要先加入序列的档案。一般序列的文本文件格式都可以加入程序中,而含有定序讯号的序列档案一般都为abi的文件格式,如果没有相关的程序是无法读取进行分析,而ContigExpress可以读取和分析这种类型的档案。要将序列档案或是定序的abi档案加载程序中的话,只要选择Project→AddFragments就可以选择要加载程序的档案了(图12.5):第十二章序列串接111图12.5选择Project→AddFragments加载程序的档案用户可以从窗口的左边的Fragments(图12.6)按下右键后选择AddFragments加入序列档案:图12.6在Fragments右键单击加入序列档案VectorNTI教育训练手册112接下来由文件夹中选择欲加入的序列,可按住Ctrl键后用鼠标进行复选(图12.7):图12.7可利用Ctrl键,选取多个档案点选开启后,如果程序出现一连串的警告声并出现是否的寻问,那只是文件名一致性的修正询问,使用者可以忽略该状态并持续点选“是”的选项直到所有档案加载全程序为止(图12.8)。图12.8载入序列后的结果想要看每个abi档案的讯号可以将加载的讯号文件用鼠标点选打开(图12.9):第十二章序列串接113图12.9右边为该档案序列,下方为序列定序的讯号打开档案后会出现一个窗口(图12.9),右边是该档案的序列;下面是序列在定序过程时的讯号。用户可以把光标移到讯号上方的文字,就可以看到该讯号每个碱基A、T、C、G的讯号强度(图12.10):图12.10将光标移置讯号上方,可看到该讯号的每个碱基强度VectorNTI教育训练手册114在讯号的图谱上面,每个颜色代表不同的碱基判读。如果只想看单一个碱基的讯号可以用上方的按钮关掉不想让系统显示的讯号:图12.11判读单一个碱基图12.11为关掉T和G讯号后的范例。讯号的部分可以放大观察,用户只要在讯号图谱上面选取要观看的序列后,并按下鼠标右键选择ZoomIn就可以把选择的区域放大(图12.12):图12.12放大或缩小图谱第十二章序列串接115序列串接:要进行序列串接时首先要把欲串接的档案(图12.13)用鼠标选取(可复选),选好之后按下就会进行串接的动作:图12.13选取要串接的序列串接完成以后会出现一个名称叫Contig的档案(图12.14),下方会显示此档案所包含的串接序列:图12.14串接完后产生Contig档案,而下方显示其包含的序列点选此档案后就会看到串接好的画面(图12.15):VectorNTI教育训练手册116图12.15串接的结果,产生的箭头方向为串接的方向在这画面中使用者可以看到串接的情况,会以右上方的图片表示,图片上面的两个长条形是每个串接的序列,箭头是串接的方向。图片下面是整个接起来的全长,红色网格线区域则是串接迭合(overlap)的部分。最下面Contig的部分是整个串接后全长的文字序列;上面则是串接的部分档案的文字序列。串接好的序列大部分会出现序号干扰的问题,此问题在于定序的讯号在定序开始和结束的时候会特别不稳定,这些不稳定的部分大都会造成序列判断的错误,用户首先需先了解讯号图谱可以相信的部分,此部分的讯号峰值相当尖且单纯;讯号不稳定的部分峰值平缓且有许多噪声重迭:第十二章序列串接117图12.16串接好的讯号,较为平缓的讯号较容易判断错误CCTGTTCCGACCCTGCCGCTTAACAGGATACCTGTCCGCCTCCTGTTCCGACCCTGCCGCTTAACAGGATACCTGTCCGCCT9991001100310051007100910111013101510171019102110231025102710291031103310351037103923570FragmentE12_T7以图12.16为例讯号不稳部分发生在定序开始跟结束的地方。图12.17为一个讯号稳定的例子GATAGCAGGAAGATGTGGAGTGTTTGCGGAGTCTGATGATAGCAGGAAGATGTGGAGTGTTTGCGGAGTCTGAT30030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533623570FragmentE12_T7以图12.17范例而言,讯号极为稳定,其峰值相当尖且单纯。在串接时候每个串接序列的重迭区域序列如果不相符合的话,在Contig的窗口中图片的下方绿色线部分会呈现凹陷(图12.18);下方序列也会将不符合的部分标示出来:图12.18不符合的重迭区域位在绿色线凹陷的地方VectorNTI教育训练手册118首先,修改的第一步要先观察重迭区域的讯号,用户可以在下方序列窗口中点选序列后按下鼠标右键(图12.19):图12.19先观察区域重迭的部份,将其讯号打开做调整使用者可以选择打开讯号或是打开所有讯号:图12.20打开所有的讯号第十二章序列串接119用户可以发现在图12.20上方部分的讯号很正常,而下方讯号则是非常的不稳定。因此可采用上方的序列修改。若要关掉讯号只要按下鼠标右键再点选,或是就可以将讯号关掉。进行序列修正时首先要点选窗口左上方的后才能进行修改的操作。最快速的修改方法是直接采用正确的序列,使用者首先点选不采用的序列,接着按下鼠标右键后选择ReferenceSequence:图12.21利用ReferenceSequence修正使用此功能后,重迭的部分就会完全采用上方窗口的序列(图12.22):VectorNTI教育训练手册120图12.22使用图上方的序列修正,因其有较好的峰值第二种方式是使用拖曳或是反转,将序列拖曳或反转将不相符合的区段进行修正,此种问题大部分出自于程序做overlap运算时,所采取的运算方法不兼容所造成。在拖曳或是反转前同样要先按下才能操作,要进行拖曳时先将鼠标点选到欲拖曳的序列后按住Ctrl键不放就可以进行鼠标拖曳(图12.23):图12.23利用拖曳或反转进行修正拖曳好以后放开鼠标就可以改变位置并观察重迭情形(图12.24-25):第十二章序列串接121图12.24拖曳或反转修正后的结果使用者可以发现拖曳后重迭部分的地方有明显的改善。此外要进行比较细部的移动时可以用上方的做细部移动,按下或是可以让序列一个一个前进或后退;可以指定移动的距离:图12.25拖曳范围的设定如果要把序列反转只要按下上方就可反转序列了:VectorNTI教育训练手册122图12.26利用手动直接修改最后一个修改的方式是直接手动修改序列(图12.26-27),一样要先按下。用户可以直接在最下面Contig文字序列的部分进行序列编辑,首先把要修改的部分用鼠标选取:图12.27选取要修改的部分,直接输入修改的内容选取的部分可以用键盘直接打字进行修改或者按Delete键删除:第十二章序列串接123图12.28被删除的地方会出现红色的线条,代表已删除删除的地方上方会出现红色的线条表示有遭到删减(图12.28),如果要插入序列的话把鼠标点在要插入的部分形成光标后直接用键盘打字(图12.29):图12.29将要插入的部分直接由键盘输入在增加的部分不会有讯号的出现。但如果要修改小范围序列的话,使用者可以利用复制贴上的功能进行取代。先把要取代的序列用鼠标选取,然后按下鼠标右键进行复制:VectorNTI教育训练手册124图12.30修改完后可以利用PrintPreview观看修改的结果接者选取下方Contig想要取代的区域(图12.31):图12.31选取要取代的Contig区域然后从上方Edit部分选择贴上取代(图12.32):第十二章序列串接125图12.32利用贴上,取代原来的部份进行修改用户可以依照此模式进行小范围的修改(图12.33):图12.33直些修改小范围的ContigNOTE:使用者修改串接的序列,需依不同的情况来采用不同的修改方式,不过所有的共同点都在于要先观察重迭部分的讯号后,再决定如何修正。VectorNTI教育训练手册126串接序列的分析:1.寻找OpenReadingFragments用户只要将鼠标点击串接的图形窗口,窗口上方会出现的按钮,按下按钮后图形就会将分析出的OpenReadingFragments以绿色范围显示(图12.34):图12.34使用ORF按钮寻找OpenReadingFragments2.序列转译:把鼠标点在下方的序列窗口时,上方会出现按钮,只要按下后面的三个按钮,串接的序列就会以前三个基因当作三个不同的起始位置进行转译(详见序列转译部分。)最前面的按钮则是决定胺基酸的显示方式(图12.35):图12.35以前三个基因当作不同的起始位置,进行串接也可以在选择序列的时候按鼠标右键后进入ConsensusTranslation来进行转译(图12.36):第十二章序列串接127图12.36以ConsensusTranslation进行转译3.串接序列的输出储存:用户只要把想要输出的串接部分用鼠标选取以后,按下鼠标右键选择Copy或是Camera的指令就可以将序列复制到其他的档案中(图12.37):图12.37将序列复制到其他的档案VectorNTI教育训练手册128取消串接:在ContigExpressProject窗口中,在左边窗口选择要取消的Assembly后按下,就可以将串接取消(图12.38):图12.38取消序列的串接串接操作的储存:在ContigExpressProject的窗口之下,只要按下或是选择Project→Save或者是Saveas就可以完成串接操作之储存功能,下次使用时就可以直接开启。

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功