如何分析测序结果

a441283206
1 ℃
2020-07-13

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

软件和文件用Sequencher软件Demo版看序列，Demo版不能保存序列，但其实绝大部分时候并不需要保存，只要简单看一下测序结果是否正确即可，用这个软件是最方便的。测序返回两种格式的文件，ABI和SEQ。ABI是原始文件，SEQ是根据ABI结果导出的，未必完全正确，建议只看ABI，有需要再拿SEQ去修改、拼接。1、选择同一个载体的所有测序ABI文件，拖拽到Sequencher窗口释放即可导入序列文件2、在Sequencher窗口中双击序列文件打开，可见序列质量：蓝色越深表示序列越不可信。2、点击ShowChromatogram可查看峰图：不可信不可信可信3、因此，先把序列前后深蓝色的部分都删掉这一条序列可信的长度只有880bp，而相应的SEQ文件并没有删除前后不可信的序列，仍然给出了1225bp的长度，因此不能用SEQ去判断测序结果。同时，在可信的序列中仍然存在个别深蓝色的碱基，这些碱基是否可信，也要根据峰图自行判断。4、所有序列都只留下可信区段之后，全选，点击第二个按钮AssembleAutomatically则可将序列比对到一起，形成一个Contig文件。4、Contig文件打开就是下图的overview形式，如果序列之间能连通，说明目标序列完整测通了，如果有缺口则需要加测。要把Contig文件拆散重组，则点击菜单栏的Contig→DissolveContig…即可4、第一个按钮AssemblyParameters是调整比对的参数，右图表示至少有85%相似性和20bp的overlap才能比对到一起，如果要比对引物且引物少于20bp，则要调低minimumoverlap的值；如果序列有某一段差异较大比对不上，也可调低minimummatchpercentage的值，但调得太低可能会比对到错误的位置。5、点击Bases按钮，可查看具体的序列信息5、一个载体挑至少两个克隆去测序，两个之间相互比，有不一样的就会在底下出现一个点（按Ctrl+D可以快速定位到有点的地方），这些点就是需要我们自己判断正误的地方。以上两个点的出现是由于测序质量下降导致，因为四条序列，1和2号克隆各测到两次，其中三条序列一样，说明两个克隆是相同的。左图四个克隆中，第四个与另外三个不同，说明第四个在PCR扩增中有碱基错配。也有发生碱基缺失的、碱基插入的。以上出现差异的点都是位于浅蓝色的可信区段，通常不会有读峰错误的问题，可以不用理会峰图。如果点出现在深蓝色的区段，则要打开峰图自己解读。如右图，第三个克隆多了一个G，且此处是深蓝色，表明仪器对此处的解读存在疑问。打开峰图比较三个克隆的差异，发现第三个克隆在GG处的两个峰拖得比较开，导致仪器误判为GGG，但又不及三个峰的宽度，原序列应该是正确的GG。6、若需导入模板和引物进行比对，可将模板和引物序列按以下格式保存在txt文档中，直接将txt拖拽到Sequencher窗口释放即可：16666-NIP-gDNAATCGATCG……16666-Pro-FATCGATCG……16666-Pro-RATCGATCG……注意区别错配与SNP位点的差异！一个载体挑至少两个克隆，如果它们之间有不一样的位点，则说明是PCR过程中引入的错配，发生错配的克隆就不要用了。我们从HHZ中扩出来的序列跟NIP比，会有很多SNP、InDels，表现为几个克隆之间一模一样，但都与NIP模板序列不一样。