核酸序列的一般分析分子量(molecularweight)确定DNA序列的分子量和碱基组成单链DNA(singlestrandDNA,ssDNA)双链DNA(doublestrandDNA,dsDNA)碱基组成(composition)各种碱基数量各种碱基比例分析举例从美国NorthCarolinaStateUniversity微生物系的网页()下载BioEdit分析工具在本地计算机上利用BioEdit工具进行分析打开要分析序列的文件并copy序列,在BioEdit分析工具的“File”栏目选择“NewfromClipboard”粘贴序列选择被粘贴序列的名称,在“Sequence”栏目点击“NucleicAcid→NucleotideComposition”文字分析结果和图形结果(二)序列变换AAAAATGGCCATGGGTCCACACGCAGTGAGATGAATGCTAGATCTCACGAGA原始DNA序列TTTTTACCGGTACCCAGGTGTGCGTCACTCTACTTACGATCTAGAGTGCTCT互补序列(complement)AGAGCACTCTAGATCGTAAGTAGAGTGACGCACACCTGGGTACCGGTAAAAA反向序列(reverse)TCTCGTGAGATCTAGCATTCATCTCACTGCGTGTGGACCCATGGCCATTTTT反向互补序列(reversecomplement)AAAAAUGGCCAUGGGUCCACACGCAGUGAGAUGAAUGCUAGAUCUCACGAGARNA序列DNA-DNA序列之间变换DNA-RNA序列之间变换分析方法(举例)在本地计算机上利用BioEdit工具进行分析打开要分析序列的文件并copy序列,在BioEdit分析工具的“File”栏目选择“NewfromClipboard”粘贴序列选择被粘贴序列的名称,在“Sequence”栏目点击“NucleicAcid→Complete”获得互补序列、“NucleicAcid→ReverseComplete”获得反向互补序列、“NucleicAcid→DNA-RNA”获得RNA序列在“Edit”栏目选择“CopySequencetoclipboard(FastaFormat)”将获得的序列粘贴到另一个文件DNA-蛋白质序列之间变换AAAAATGGCCATGGGTCCACACGCAGTGAGATGAATGCTAGATCTCACGAGKNGHGSTRSEMNARSHE阅读框1KMAMGPHAVR*MLDLTR阅读框2KWPWVHTQ*DEC*ISR阅读框3分析方法-翻译全长DNA序列(举例1)在本地计算机上利用BioEdit工具进行分析打开要分析序列的文件并copy序列,在BioEdit分析工具的“File”栏目选择“NewfromClipboard”粘贴序列选择被粘贴序列的名称,在“Sequence”栏目点击“NucleicAcid→Translate→Frame1”获得氨基酸序列分析结果利用BioEdit软件示例分析方法-翻译选择的DNA序列区段(举例2)在SRS检索主页()点击“Tools”在Tool网页选择“NucleicTools→NucleicTranslation→Transeq”,点击“Launch”在Transeq网页选择阅读框和遗传密码类型,输入编码区,粘贴序列分析结果选择阅读框和遗传密码类型分析方法-翻译选择的DNA序列区段,显示DNA和氨基酸序列(举例3)在SRS检索主页()点击“Tools”在Tool网页选择“NucleicTools→NucleicTranslation→ShowseqN”,点击“Launch”在ShowseqN网页在“displayformat”栏目选择“oneframetranslation”、选择阅读框和遗传密码类型,输入编码区,粘贴序列分析结果序列格式转化各种软件为了自己的需要,通常对序列格式有一定的要求,给我们的使用带来了一定的困难。格式转换软件可以将不同格式数据转换以方便使用。很多综合性软件可以进行序列格式转换,如DNAstar,seqverter等。常见序列格式:(1)FASTA格式:又称Pearson格式。是比较简单而使用最多的序列格式。序列以“”号开头,其后是单行的关于序列的描述信息,最后是序列。例子:10KD_VIGUNP18646vignaunguiculata10kdaproteinprecursorMEKKSIAGLCFLFLVLFVAQEVVVQSEAKTCENLVDTYRGPCFTTGSCDDHCKNKEHLLS(2)plaintext格式是一个形式最简单的格式,没有任何的注释,每行60个字母,使用标准核甘酸符号或标准的氨基酸的单字母符号。例如:MEKKSIAGLCFLFLVLFVAQEVVVQSEAKTCENLVDTYRGPCFTTGSCDDHCKNKEHLLS(3)GCG格式是商业性的GCG软件包的专用格式,例如:1ggagactttcctgtcactggctactactactcccaaccctcctcaaagccgccggagcaa61cccccaggtctttactttacaatcggcaatttgacttgctctgctgcatgtctggaggga121ccaaggaaagtgtggagacgctccaaggattaggtgatcggagcttgaaaagaaaaaaag(4)Genbank格式例如:LOCUSAB094638_1146bpDNA13-APR-2006BASECOUNT38a17c43g48t0othersORIGIN1gttttaatgtgttgccttggttgagtggtgaagctggttagggtagcgtgtaaaacatgg61tgggtagattaatgctttgtgtcaccatgccgtttggttcgattaatgtaatcataagga121gagaccataagttatgaatacgcaga(5)PIR格式DL;OsNIP1-1ATGGCAGGAGGTGACAACAACTCCCAGACCACCAATGGCGGCTCAGGTCACGAGCAGAGAGCCATGGAGGAAGGCAGGAAGCAGGAGGAGTTCGCCGCCGACGGCCAGGGCTGCGGCCTCGCCTTCTCCGTCCCTTTCATCCAGAAGATCATCGCGGAGATCTTTGGGACATACTTCTTGATCTTCGCGGGGTGCGGGGCGGTGACGATCAACCAGAGCAAGAACGGGCAGATCACGTTCCCGGGGGTGGCGATCGTGTGGGGGCTGGCGGTGATGGTGATGGTGTACGCCGTGGGGCACATCTCCGGCGCGCACTTCAACCCCGCGGTGACGCTGGCGTTCGCGACGTGCCGGAGGTTCCCTTGGCGGCAGGTGCCGGCGTACGCGGCGGCGCAGATGCTGGGCGCCACCCTCGCCGCCGGCACGCTCCGGCTCATGTTCGGCGGCCGCCACGAGCACTTCCCCGGCACGCTCCCCGCCGGCTCCGACGTGCAGTCGCTCGTCCTCGAGTTCATCATCACCTTCTACCTCATGTTCGTCATCTCCGGCGTCGCCACCGACAACCGAGCCATCGGGGAGCTGGCAGGGCTGGCCGTTGGTGCAACCATCCTGCTTAACGTGCTGATTGCTGGGCCGATCTCGGGAGCATCGATGAACCCGGCTCGGAGCCTGGGGCCGGCGATGATCGGCGGCGAGTACAGGTCGATCTGGGTGTACATCGTCGGGCCGGTCGCCGGCGCGGTGGCCGGAGCTTGGGCCTACAACATCATCCGCTTCACCAACAAGCCCCTCCGGGAGATCACCAAGAGCGGCTCCTTCCTCAAGAGCATGAACCGGATGAACTCCTCCACCTAA*最新下载*下载后直接安装即可SeqverterPIR——Ka/KsPhylip——phylogenetictreeMSF——GeneDocPAUP——PAUPtreeconstruction序列翻译、ORF查找对于一条新的核酸序列,除了对数据库进行类似性检索和同源性比较外,还有许多其他分析内容。例如:计算DNA的碱基组成、检索内部重复序列、检索DNA的特殊位点或信号、开放读框的查找、鉴定DNA的编码区和翻译基因序列等。基因编码区是指可以由核糖体翻译成蛋白质的序列,它的5’端有转录和翻译的起始位点,3’端有终止位点。基因的起始位点通常是ATG,终止位点为TAA、TAG、TGA。一个起始和终止密码子之间的序列称为一个开放阅读框(OpenReadingFrame,简称ORF),它是一个潜在的蛋白质编码区。序列翻译、ORF查找Generunner在线的ORFfinder://cbi.labri.fr/outils/Pise/getorf.htmlPlotorf://linux1.softberry.com/berry.phtml?topic=bestorf&group=programs&subgroup=gfind最新下载*下载后直接安装即可*为共享软件Generunner功能:序列编辑与类似序列查找、建立自己的序列数据库进行查找、序列比较、序列翻译、蛋白序列分析等,还包括DNA分析常用到的一些功能,如碱基百分组成、分子量计算等。Generunner输入序列在EnterGIorACCESSION后面的框中输入公共序列的gi号或ACCESSION号在orsequenceinFASTAformat后面的框中输入完整的序列设置序列范围在FROM:TO:后面的框中输入进行ORF查找的序列范围Geneticcodes可以选择采用何种遗传编码按OrfFind按钮即可执行根据预测结果,同时参考序列比对(blastx)结果。一般选择最长的ORF可选择特异的物种限制性内切酶是在许多细菌体内发现的能识别和切割外源DNA的核酸酶。细菌自身的DNA因其限制型内切酶的识别位点被相应的DNA甲基化酶所甲基化,而不被内切酶所水解。限制型内切酶的这种作用使之成为遗传工程实验的重要工具酶之一。限制性内切酶分析每一种限制性内切酶都有特定的DNA识别顺序,并且呈回文排列。确定DNA酶切位点是基因操作的必不可少的步骤:(1)在进行限制性片段长度多态性(RFLP)和cDNA扩增片段长度多态性(cDNA-AFLP)分析时,试验前要对所有目的基因进行限制性核酸内切酶酶切的理论分析,初步确定条带的长度和多态性;(2)在基因克隆时,要对目的基因片段和载体进行酶切分析,以选择适当的限制性核酸内切酶对克隆位点进行酶切;(3)可以通过序列分析,预测酶切位点的位置和酶切位点的特征。因此DNA序列分析软件包大多整合有检索酶切位