4-第五章---分子进化和系统发生

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

分子生态学第五章分子进化和系统发生OrangutanGorillaChimpanzeeHuman分子进化(molecularevolution):生物在分子水平上的进化,即核酸和蛋白质等生物大分子在生物传代过程中的演变。特点―进化速率的相对恒定性―进化速率的不均衡性(或保守性)分子进化的概念生物大分子在相当长的时间内速率进化保持稳定以相同的同源生物大分子在不同生物中进化速率大致相同进化速率的相对恒定性分子进化速率:蛋白质或核酸等大分子中的氨基酸或核苷酸在单位时间内的替换率,以年为单位,可表示为:K=d/2tNK:分子进化速率d:生物大分子发生氨基酸或核苷酸替换的数目N:生物大分子总的氨基酸或核苷酸的数目t:进化分歧时间X:ACTGATCGAA-TTCAGATTTCAGGA25Y:ACAGATCGCAGTGC-GCTTGCAGGA25已知两条序列的分歧时间t=20Mad=7N=25(比对后的序列长度)K=d/2tN=7/(2×20×106×25)=7×10-9•进化速率恒定性的实例血红蛋白α链:7种动物以及人两两之间的血红蛋白α链氨基酸差异数与物种分歧时间呈线性相关关系,即进化速率大致相同。进化速率的相对恒定性指的是以年为单位的进化速率即每年每个位点的替换数,而不是以生物的世代为单位的进化速率即每代每个位点的替换数以世代为单位―世代时间长的生物进化速率慢―世代时间短的生物进化速率快进化速率恒定性说明生物大分子的进化不可能是由自然选择引起的,如果是由自然选择引起的,替换率应该随着选择系数的改变而改变适合度和选择系数―Darwinianfitness(W):某个基因型的繁殖能力=后代数量/具有该基因型的亲本数量―Selectivecoefficient(S):该基因型受到的选择压力=1-w选择作用GenotypeG1G1G1G2G2G2161020#ofbreedingadults1284040#ofoffspringOffspring/adultratio128/16=840/10=440/20=2FitnessW(relativetothebest)8/8=14/8=0.52/8=0.251-1=01-0.5=0.51-0.25=0.75SelectioncoefficientS=1-WUnpollutedtreePollutedtree进化速率的不均衡性功能不同的生物大分子具有不同的进化速率功能上重要的大分子或大分子的局部比较保守,在进化速率上明显低于那些功能上不重要的大分子或大分子局部蛋白水平上进化速率不均衡性的体现不同蛋白一般进化速率不等同一蛋白不同区域进化速度不等核酸水平上进化速率不均衡性的体现非编码区进化速率高于编码区密码子中的同义替换比变义替换发生的频率高;内含子内的碱基替换速率明显高于外显子;外显子内部功能不重要的部分进化速率一般快于功能不重要的部分;假基因进化速率也较快。进化速率的不均衡性说明功能上重要的生物大分子的进化并非是完全随机的,而是存在着某种的制约因素或控制机制(选择压)中性突变理论的提出1968年,日本遗传学家木村资生(MotooKimura)在《Nature》杂志发表了“论分子水平上的进化速率”的评述,根据不少核苷酸和氨基酸的替换并不影响生物大分子的生物学功能的事实,提出了生物进化在分子水平上的“中性理论”;次年,美国学者金和朱克斯(J.K.King&T.H.Jukes)在《Science》杂志上刊出“非达尔文主义的进化”一文,呼应木村资生的观点。中性突变理论的主要内容在分子水平上,多数(不是全部)突变是选择中性或非常接近选择中性的,不影响个体的适合度中性突变在生物群体中通过一代又一代的遗传漂变被随机消除或固定保留,从而形成进化性的结果,因而进化的动力是遗传漂变中性突变理论的主要论据分子层次上的大多数变异是选择中性的―在生物基因组中,非编码的DNA占绝大部分―同义突变―不改变蛋白功能的异义突变―不影响适合度的异义突变自然界中广泛存在“过量”的遗传多态性―多态性是突变和遗传漂变平衡的结果不是适应性进化的结果按群体遗传学的数学模式计算出来的自然选择代价过高,不符合实际情况。―根据自然选择学说,不利突变占很大比例,使群体的适合度总量下降,造成种群数量不断减少。分子进化速率恒定,即进化速率与种群大小、世代寿命和物种的生殖力均无关,也不受环境因素所影响。中性学说对此能作出既简明又合理的解释。―假设种群数量为N的一个二倍体群体中,每个配子每代的突变率为υ,则每代将产生2Nυ个新突变。―假设一个突变最终被固定的概率为μ,则每代每位点的突变替换数(进化速率)为:K=2Nυμ―由于群体中有2N个配子,在随机交配的情况下,每个配子中的突变被遗传的机会都相同,即μ=1/2N―于是2Nυ个突变中仅有υ个被保留,即:K=υ―可见,在中性突变情况下,进化速率是一个恒定值且等于其突变率。功能越重要的大分子保守性越强―功能重要的大分子中的突变大多数是有害的,少量是中性的,有害突变在进化过程中被快速清除(负选择Negative或PurifyingSelection),导致其进化速率减慢―功能重要的大分子中极少数突变是有益的,有益突变增加个体适合度,在进化过程中会被快速固定(正选择PositiveSelection),导致进化速率加快蛋白编码序列选择压力评估•Ka/Ks•Ka:non-synonymousmutation•Ks:synonymousmutation•Ka/Ks1negativeselection•Ka/Ks=1neutralselection•Ka/Ks1positiveselection自然选择理论个体和种群表现型、种群进化的规律——自然选择相互补充中性理论生物大分子分子水平的进化规律——遗传漂变系统发生树(phylogenetictree):描述任何生物实体之间系统发生关系假说的树状图,也可以叫做进化树(evolutionarytree)。AEDCB系统发生和系统发生树系统发生(或系统演化、系统发育phylogeny):是指任何生物实体(基因、个体、种群、物种或种上高级阶元)的起源和演化(进化)关系。系统发生树的要素拓扑结构(Topology):即树的分枝型式ABCDE外部节点:称为操作分类单元,可以是基因、个体、种群、物种或种上高级阶元内部节点:代表进化事件发生的位置,或分类单元进化历程中的祖先分支和支长1009510075节点支持度一种拓扑结构可以有多种表现型式=AEDCBEDCBAAEDCBAEDCB==AEDCBAEDCB=AEDCBAEDCBBifurcationTrifurcation=/一个节点与大于3个以上的分枝相连接称为多歧分枝(polytomy):表示该分支的系统发生关系未完全解析。系统发生树的类型•无根树(unrootedtree):只反映分类单元之间的距离,而不涉及谁是谁的祖先问题。ABCDRootRootedtree•有根树(rootedtree):反应了树上物种或者基因进化的时间顺序,通过分析有根树的长度,可以了解不同的物种或者基因以什么方式和速率进化。OUT(4)OUT数目与可能的有根数和无根树数目之间的关系UnrootedTree(3)RootedTree(15)ACBDADCBTaxa(n)rooted(2n-3)!/(2n-2(n-2)!)unrooted(2n-5)!/(2n-3(n-3)!)21133141535105156954105710,3959548135,13510,39592,027,025135,1351034,459,4252,027,025OUT数目与可能的有根数和无根树数目之间的关系•系统发生分析一般要求构建一颗有根树,但是构建系统发生树的计算机软件通常产生的是无根树,因此需要对其进行准确的赋根以转换为有根树。•最常用的方法是利用外群(outgroup)来确定树根。•外群选择:与内群具有较近的系统发生关系,但是要比内群分类单元相互之间的系统发生关系远。系统发生树的类型AEDCB未标度树(unscaledtree):各分枝的长度不表示遗传变异的量,但在有根树中,节点的位置仍可以与相对分歧时间相对应。标度树(scaledtree):各分枝的长度代表遗传变异的量。•NJ:遗传距离•MP、ML和BI:碱基替换数AEDCBunit构建系统发生树的理论基础•生物进化论——生物共祖地球上的一切生命形式,不管是现存的还是灭绝了的,都有一个可以追溯到30亿年以前生存的共同祖先。亲缘关系越近的物种相似程度越高。•每个生物个体都有自己的直接祖先,遗传物质DNA在从祖先到后代的遗传过程中伴随着突变。•大多数遗传变异发生在不同的位点上,并且能够在进化过程中保留下来。•越早期发生的核苷酸替换在所有后代中分布越广;越近期发生的核苷酸替换,分布越局限于近期分歧的类群中。•越早发生分歧的DNA序列,累积的核苷酸替换越多,相似性越低。基本假设构建系统发生树的步骤获得同源DNA数据序列比对选择构建系统发生树的方法和核苷酸替换模型构建系统发生树及其可靠性评估获得同源DNA数据测序GenBankOUT要有代表性多基因(或多位点)同源性直系同源(Orthologs)vs旁系同源(Paralogs)直系同源:由共同的祖先基因进化而产生的同源基因。旁系同源:由基因复制而产生的同源基因。直系和旁系同源是两个不同的进化事件,用于分子进化分析的序列必须是直系同源的,才能真实反映进化过程Species1Species2基因树和物种树物种树:代表一个物种或群体进化历史的系统发生树,各个节点代表物种发生分歧(生殖隔离)的时间或事件基因树:由来自各个物种的一个基因构建的系统发生树,各个节点代表基因分离的时间基因树不完全等同于物种树基因或DNA片段的选择根据研究对象之间的亲缘关系远近选择进化速率适中的基因或DNA片段―亲缘关系近——选择进化速率快的基因或DNA片段―亲缘关系远——选择进化速率慢的基因或DNA片段DNA序列比对目的:找出同源序列演化过程中的同源位点。重要性:只有正确的比对结果才会能推出正确的系统发生。空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位ATGAGGTTGTTTTCATATATGAGGTT---TTCATATDNA序列比对程序自动比对(Clustal,Muscle等)手工校正编码蛋白基因序列ATGAGGTTGTTTTCATATATGAGGTT---TTCATATATGAGGTTGTTTTCATATATGAGGTTT---TCATAT编码tRNA和rRNA基因的序列tRNA二级结构rRNA二级结构基于距离(distances)数据的方法:―UPGMA非加权分组平均法(unweightedpairgroupmethodwitharithmeticmeans)―Fitch-Margoliash法―ME最小进化方法(minimumevolution)―NJ邻接法(neighborjoiningmethod)基于特征(characters)数据的方法:―MP最大简约法(maximumparsimonymethod)―ML最大似然法(maximumlikelihoodmethod)―BI贝叶斯推断法(Bayesianinference)构建系统发生树的方法基于距离数据的方法根据一定的假设(核苷酸替换模型)推导出分类单元两两之间的遗传距离,构建遗传距离矩阵。根据遗传距离矩阵,依次将分类单元聚类,从而构建出系统发生树。遗传距离的计算未校正的遗传距离(p-distance)P=nd/nn为比对后的序列长度;nd为序列之间的差异位点数。因为在序列的同一位点可能发生过不止一次的变化,大多数观察到的替换数都会显著低估真正替换的数目―如在第7位点,一条序列观察到G,另一条为A,实际上存在多种变化的可能GA(单一替换

1 / 81
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功