基因分子进化

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生物信息学分析-基因分子进化为什么研究进化研究从何而来,到哪里去的问题物种演化过程中基因的产生、复制、丢失基因的进化速度、动力为研究功能提供线索课程内容1序列比对-分析工作前的准备2遗传变异参数及计算3自然选择检测序列比对ClusterW是否为编码序列否:直接排序是:由蛋白指导核苷酸排序Mega软件序列比对ClusterW是否为编码序列否:直接排序是:由蛋白指导核苷酸排序保存类型.megMega软件1序列比对2遗传变异参数及计算3自然选择检测2遗传变异参数2.1核苷酸差异2.2同义、非同义替换率常用计算软件MEGA(Tamuraetal.2011)PAML(Yangetal.2007)DnaSP(Rozasetal.2010)2遗传变异参数2.1核苷酸差异2.2同义、非同义替换率2.1核苷酸差异两条序列核苷酸差异AATCGATCCGTCAATCGACTGACGATTAGGCCTAGCTTCGTTAACGM1AATCGAACCGTCAATCGAATGACGATTATGCCTAGCTTCGTTAACGM2序列全长(n):46bpSNPs(nd):3个两条序列之间不同核苷酸位点的比例(p):p=nd/n=3/46=0.065p是一个简便的描述DNA序列分歧度大小的指标。Kij是任两条序列间的SNP个数1+2+3L序列长度12ntn是序列个数3*(3-1)/2=3p=Kij/{L*[(n*(n-1))/2]}比对次数ATTGCCGCCTAAATTGCCGCCTAGAATGCCCCCTAAp=(1+2+3)/(12*3)=0.167多条序列核苷酸差异使用mega计算核苷酸差异打开.meg文件(排好序列)2遗传变异参数2.1核苷酸差异2.2同义、非同义替换率2.2同义、非同义替换率同义、非同义替换同义、非同义替换率Ka非同义核苷酸替换率Ks同义核苷酸替换率Ka,Ks的计算方法(Nei-GojoboriMethod)Ka=非同义变异位点/总非同义位点Ks=同义变异位点/总同义位点也存在多种模型的校正使用mega计算同义、非同义替换率必须是编码序列!同义核苷酸替换率Ks非同义核苷酸替换率Ka1序列比对2遗传变异参数及计算3自然选择检测3自然选择SignaturesofnaturalselectioninthehumangenomeBamshadM&WoodingSP.(2003)Nat.Rev.Genet.4:99-1113自然选择中性选择NeutralSelection对物种适应性没有影响;大多数突变正选择PositiveSelection有利突变的选择作用负选择NegativeSelection有害突变的选择作用自然选择的检验原理同义/非同义突变Ka/Ks(Yangetal.2000;Kosakovskyetal.2005)Ka/Ks=1,neutralselection;Ka/Ks1,negativeselectionKa/Ks1,positiveselection位点频率分布•Tajima’D(Tajimaetal.1989)•FuandLi’stest(FuandLi1997)自然选择的检验方法软件MegaPAML特点计算序列Ka/Ks的平均值检测特定位点或/和分支是否受到正选择同义核苷酸替换率Ks3.1使用mega计算同义/非同义替换率非同义核苷酸替换率KaKa/Ks3.2PAML-codemlBranchmodel检测特定分支是否受到正选择Sitemodel检测特定位点是否受到正选择Branch-sitemodel检测特定分支的某些位点是否受到正选择codeml程序运行需要以下4个文件,最好将他们放在一个目录下:1)比对好的序列文件(Phlip或者PAML格式)2)tree文件3)codeml.ctl配置文件4)codeml程序第1步序列文件准备1Phylips格式或者PAML格式第一行是序列号和序列长度,下面就是序列名+序列2序列长度是3的整数倍(密码子)3不能出现终止密码子将比对好的fasta文件a手动转化b在线转化=fasta-paml在线转化时,序列长度会长1bp,需手动改为1830第2步tree文件准备在线的Clustal工具序列提交-ExecuteMultipleAlignment-下载dnd文件-改名为自己想要的文件+后缀名“.trees”对树的节点加标记#11g0726101g0726001g072630Gy4Gy5Gy2Gy1Gy3Gy6Gy7#1第3步配置codeml.ctlCodeml文件配置可以参考:~yinyb/codeml.html比较重要的参数有seqfile=n1.txt*自己制作的比对好的序列名称treefile=n1.trees*树文件名称outfile=mcl*结果文件名称runmode=0*0:usertree;1:semi-automatic;2:automaticseqtype=1*1:codons;2:AAs;3:codons—AAsmodel=0*在使用branchmodels或branch-sitemodels时需要修改这个数值NSsites=0*改变的是sitemodels的类型Branchmodel分支模型2(branch1-branch0)=2△lnL=5.65*所以w0≠w12(branch1-branch2)=2△lnL=1.47所以不能否定w1=1模型参数-lnLnpw(dN/dS)零假设2△lnLbranch0model=0NSsites=03881.2519w=0.435.65branch1model=2NSsites=03878.4320w0=0.39,w1=138.25w1=w0branch1model=2NSsites=03878.4320w0=0.39,w1=138.251.47branch2model=2NSsites=0fix_omega=13879.1619w0=0.40,w1=1.00w1=1df=1p0.053.841p0.016.6351g0726101g0726001g072630Gy4Gy5Gy2Gy1Gy3Gy6Gy7背景枝$1、$2依次Sitemodel位点模型M1a:M2a2△lnL=0M7:M8同M1a:M2a如果结果显著可以在M2a,M8的BEB中找具体哪些位点受到正选择模型参数-lnL2△lnLsite1model=0NSsites=13852.77200site2model=0NSsites=23852.7722site7model=0NSsites=7site8model=0NSsites=8df=2p0.055.991p0.019.210site-branchmodel位点-分支模型site-branchmodel位点-分支模型模型参数-lnLsiteclass012a2bmodelAmodel=2;NSsites=2;3848.26proportion0.330.210.280.18fix_omega=0;omega=1.5backgroundw0.2210.221foregroundw0.221999999modelA-fixmodel=2;NSsites=2;3849.75proportion0.130.090.450.32fix_omega=1;omega=1backgroundw0.2210.221foregroundw0.221112△lnL2.98df=1p0.052.71p0.015.41双尾测验2△lnL=2.98不显著结果分析实例练习-任选两题1)用ML法构建ATG4.fas的系统进化树(bootstrap1000;Jukes-Cantormodel),并标出每个节点的bootstrap值;2)计算ATG4.fas所有序列平均的核苷酸差异、Ka及Ks;3)使用PAML计算Gy_li.fas是否存在正选择位点?写出计算过程。(提示用model7和model8)未完成作业请发20140517何小红老师:hestat@njau.edu.cn20140518王娇:wjiao@njau.edu.cn谢谢大家!

1 / 51
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功