第一章:群体遗传学的基本概念与原理2008基本内容基因频率与基因型频率1Handy-Weiberg平衡定律2亲属对基因型联合分布3常染色体位点连锁相不平衡4影响群体结构的因素(迁移,突变,选择)5一、基因频率与基因型频率1、群体的遗传结构孟德尔群体(Mendelianpopulation):一个孟德尔群体,是一群能够相互繁殖的个体,它们享有一个共同的基因库。在有性繁殖的生物中,一个物种就是一个最大的孟德尔群体。一、基因频率与基因型频率2、等位基因频率(allelesfrequency):在一个二倍体的某特定基因座上某一等位基因占该座位上等位基因总数的比率为该等位基因的频率。这是群体遗传结构的一个最基本的测度(p,q)。一、基因频率与基因型频率3、基因型频率(genotypefrequency):群体中某特定基因型个体的数目,占个体总数目的比率。D,H,R一、基因频率与基因型频率4、基因频率计算P(AA)=D;P(Aa)=H;P(aa)=R;p=P(A)=P(A|AA)P(AA)+P(A|Aa)P(Aa)+P(A|aa)P(aa)=D+(1/2)Hp=D+(1/2)Hq=R+(1/2)H一、基因频率与基因型频率5、基因频率计算例1(记数法):Greenland血型数据(据569个体):M83.5%,MN15.6%,N0.9%.计算基因频率解:定义M、MN和N的频率为D、H和R;等位基因M、N的频率为p和q。我们有p=D+1/2H=0.835+0.5X0.156=0.913q=R+1/2H=0.09+0.5X0.156=0.087注意:如果是频数资料,则:p=(2D+H)/2N;q=(2R+H)/2N。二、Hardy-Weinburg定律1、基本概念随机交配(Panmixia):在有性生殖生物中,一种性别的任何一个个体有同样的机会和相反性别的个体交配的方式称随机交配(randommating)。即各种类型的个体交配的频率完全取决于自身频率的大小,而不受任何其他因素的影响。实行随机交配的结果是所有的基因型都是孟德尔式分离所产生的配子随机结合而形成的。二、Hardy-Weinburg定律2、Hardy-Weinburg定律①在随机交配下的孟德尔群体中,若没有其他因素(基因突变、选择、迁移)的干扰,基因频率世代相传不变。②无论群体的起始成分如何,经过一个世代的随机交配之后,群体的基因型频率的平衡建立在下列的H-W公式之中:(pA+qa)2=p2(AA)+2pq(Aa)+q2(aa),平衡群体的基因型频率决定于它的基因频率。③只要随机交配系统得以保持,基因型频率保持上述平衡状态不会改变。二、Hardy-Weinburg定律(1)P(AA)=p2;P(Aa)=2pq;P(aa)=q2(2)只要随机交配系统得以保持,基因型频率保持上述平衡状态不会改变,子代频率仍为:P(AA)=p2;P(Aa)=2pq;P(aa)=q2二、Hardy-Weinburg定律3、Hardy-Weinburg定律证明二、Hardy-Weinburg定律4、Hardy-Weinburg平衡检验二、Hardy-Weinburg定律5、Hardy-Weinburg平衡检验例三、亲属对基因型联合分布1、基本概念亲属(relative):有血缘关系的人,有血缘关系意味着基因来源相同,即有相同的祖宗。遗传学中的血缘关系是相对的,一般指三代以内的亲属关系,一对夫妻如果不是近亲结婚则不是亲属。而父子、兄弟、祖孙则称之为亲属对(relativepair)三、亲属对基因型联合分布2、父子对与兄弟对(同父女、母女等;并假定满足随机婚配与哈代-温伯格平衡定律;二等位基因A,a频率分别为p,q;符号:父亲F,儿子S,母亲M)父子总和AAAaaaAAp3p2q0p2Aap2qpqpq22pqAa0pq2q3pq2总和p22pqpq21三、亲属对基因型联合分布父子总和AAAaaaAAp3p2q0p2Aap2qpqpq22pqAa0pq2q3pq2总和p22pqpq21F×MP(F×M,S=AA)AA×AAAA×AaP4p3qP(F=AA,S=AA)=P(F=AA,M=AA,S=AA)+P(F=AA,M=Aa,S=AA)=P4+p3q=p3推导:三、亲属对基因型联合分布3、兄弟对兄弟总和AAAaaaAA(1/4)p2(1+p2)(1/2)p2q(1+p)(1/4)p2q2p2Aa(1/2)p2q(1+p)pq(1+pq)(1/2)pq2(1+q)2pqAa(1/4)p2q2(1/2)pq2(1+q)(1/4)q2(1+q2)pq2总和p22pqpq21推导同理,需要考虑父母的六种婚配型四、常染色体位点连锁相不平衡1、基本概念(1)连锁:如果在同一条染色体上的两个基因座相邻比较近,那么同源于父亲(母亲)的等位基因更倾向于一起传递给后代,这种现象叫连锁(2)交叉:在交换时一对染色体出现的交叉型结构。在有丝分裂的双线期可以在显微镜下看到。(3)互换(crossover):(4)重组(recombination):奇数次互换导致一个重组交叉之后开始互换4AaBb123AaBbccCC1234AAaaBBbbccCC1234AAaaBBbbccCC1234AAaaBBbbccCC四、常染色体位点连锁相不平衡注:①交换发生是随机的,距离越长交换的机会越多,因此交换值的大小可以用来表示基因间的距离长短。②由于交换并不一定导致重组,因此重组值要小于或等于交换值。③由于无法直接测定交换率,只有通过标记基因的重组来估计交换的频率。(5)重组率(recombinationfraction):用θ来表示两个基因座之间发生奇数次交换的概率重组率θ=重组/(重组+非重组)四、常染色体位点连锁相不平衡重组率取值范围[0,1/2]四、常染色体位点连锁相不平衡(6)连锁分析(linkageanalysis):考察两个基因座的位置是否临近,通过对一些基因数据的分析来寻找一些感兴趣的基因位置,也称为基因作图(geneticmapping)。两个连锁的基因座上的等位基因更易于作为一个单位由父母传递给后代,即更易于共分离。四、常染色体位点连锁相不平衡(7)连锁平衡(linkageequilibrium):两个基因座的等位基因组合的频率等于组成组合的等位基因各自频率的积,不存在优势组合,称为连锁平衡.(8)连锁不平衡(linkagedisequilibrium;LD):两个位点的某两个等位基因不是独立出现的,则称这两个位点处于连锁不平衡状态。注:连锁只与两个位点有关,而连锁不平衡是与两个位点上的等位基因有关。四、常染色体位点连锁相不平衡(9)连锁不平衡计算中的几个量:①连锁不平衡参数:1111222212122121()()ABABABABABABABABDPPPPPPPPPPPP四、常染色体位点连锁相不平衡②若一个群体初始状态D≠0,假定重组率为θ,则第二代D2=(1-θ)Dn代:Dn=(1-θ)nD当重组率比较小的时候趋于零的速度比较慢当重组率比较大的时候趋于零的速度比较快该公式为关联分析的理论基础四、常染色体位点连锁相不平衡③关联分析原理:假设一个疾病基因位点有两个等位基因D,d;引起疾病的等位基因位D,于是疾病群体中的D的频率要高于对照群体的,但是我们不知道该疾病位点的位置,如果在疾病位点附近的某个标记位点为A,a,如果D与A关联,因此连锁不平衡,即疾病群体中的A的频率要高于对照群体的,即疾病与A关联。因此我们寻找疾病于对照中差异较大的标记位点,在标记位点附近可能存在着疾病基因。四、常染色体位点连锁相不平衡④max1221min,ABABDPPPPmaxDDD0Dmax1122max,ABABDPPPP0DD四、常染色体位点连锁相不平衡1212AABBDrpppp2r⑤四、常染色体位点连锁相不平衡注:连锁与连锁不平衡的区别:连锁描述两个位点的位置关系,可通过重组率来度量,需要重组的数据,因此需要家系资料。连锁不平衡描述的是群体中两个位点上的等位基因的关联性,需要群体数据。五、影响群体结构的因素当一个群体是大的,随机交配,不受进化力量的影响时,群体的基因频率并不因为遗传而改变。然而对很多群体而言并不是理想群体。在这种情况下,基因频率会发生改变。影响群体平衡的主要因素包括:突变、选择、迁移、遗传漂变和交配系统(非随机交配)。五、影响群体结构的因素1、突变:突变是一切新遗传变异的来源,等位基因的新组合可以通过重组而产生,但新的等位基因只有当突变发生时才能产生。突变提供了进化作用的遗传原料。大部分的突变将受到损伤,并从群体中被排除。然而少数的突变可能对个体是有利的,会被保留下来,并在群体中传播开。突变有害还是有利取决于特殊的环境,若环境改变了,先前有害的突变可以变成有利的突变。例如在使用杀虫剂DDT之后,昆虫产生了对DDT的抗性突变,这样昆虫在喷有DDT的环境中不仅可以生存还能繁殖。五、影响群体结构的因素突变对进化还有一种潜在的作用:通过突变改变群体中等位基因频率。例如:一个群体中某个位点包含等位基因A,a,当A突变为a时,将会降低A的频率,若持续代数过多将会使得A消失。五、影响群体结构的因素突变分为正向、回复突变:相对概念A突变为a称为正向突变(forwardmutation)。部分基因也会发生反向突变,即a突变A,这些突变称为回复突变(reversemutation)。在一般情况下正向突变的频率要大于回复突变的频率。五、影响群体结构的因素2、遗传漂变哈代-温伯格定律的一个主要的假定就是群体无限大。实际的群体不可能无限大,但它们要大到足以能预期基因频率和基因型频率。但有些群体很小,这些群体的几率因子可使基因频率产生随机变化。由于样本的机误(chanceerrors)导致群体基因频率的随机改变称为遗传漂变(geneticdrift)或简称为漂变。此是由群体遗传学家S.Wright于1930年提出的,有时人们也把漂变称S.Wright效应。五、影响群体结构的因素例:。设想在南太平洋群岛上住着人类的最小群体,假设只有10个人组成,5个人绿眼睛,5个人棕色眼,假设眼睛的颜色是由单基因决定的(实际上眼睛的颜色是由多基因控制的),且绿色眼的等位基因b对棕色眼的等位基因B是隐性的(BB和Bb为棕色眼,bb为绿色眼)。此岛上的群体中绿眼等位基因的频率是0.6。一次台风袭击了这个岛,群体中50%的人死亡了,也就是5位居民死于风暴。正巧这死去的5个人是棕色眼。台风之后这个岛上绿色基因的频率是1.0。在这个群岛上的群体中所发生的突变是绿眼基因的频率从0.6变成了1.0,这完全是机会所造成。五、影响群体结构的因素几率使实际结果和预期比产生偏差的这种现象被称为取样误差(samplingerror)。设群体产生一个无穷大的配子库,其含有的等位基因比分别为p和q。若发生随机交配,所有的配子都结合成合子,那么基因型的比将是:p2,2pq和q2,而在合子中等位基因的频率仍保持为p和q。也许后代的数目是有限的,但这些与配子结合形成的后代构成了潜在的无限大配子库中的一个样本。由于随机性,或由于样本的机误,样本可能偏离大库,样本越小,偏差越大。五、影响群体结构的因素所有的遗传漂变都是由于取样误差而产生的,但在自然群体中取样误差的发生有各种途经。几种漂变的发生:在大西洋南部有三个很小的火山岛(Tristandacwnha),1817年开始由苏格兰人WilliamGlass和他的家族到岛上居住。后来又迁来几个失事的水手和几个来自远处岛上的妇女,但这个岛是保持着遗传隔离的状态。1961年岛上火山爆发,岛上的群体几乎有300个居住者组成的群体到英格兰。他们在英国呆了2年,遗传学家研究了他们,并重建了这个群体史。五、影响群体结构的因素岛上的群体在突变中发生了三种类型的遗传漂变。①建立者效应发生在开始定居者中。到1855年这个岛的群体扩大到约100人,但这个群体26%的基因