分子遗传学2(1w)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二节基因组基因组(genome)(1922年出现在遗传学的文献中):一个细胞或病毒所包含的全部基因。通常在真核生物中指一个物种的单倍体染色体组所含有的一整套基因,所以,genome被译作染色体组,指的是单倍体细胞中所含的整套染色体,但现在基因组这个名词逐渐替代了染色体组。原核生物一般只有一个环状的DNA分子,其上所含有的基因为一个基因组。真核生物细胞中的细胞器如叶绿体、线粒体中的DNA一般也为环状,构成叶绿体基因组和线粒体基因组基因组DNA测序的结果表明基因组中不仅包含着整套基因的编码序列,同时还包含着大量非编码序列,即基因之间的序列。这些序列同样包含着遗传指令(geneticinstruction)。因此,基因组(应该)是整套染色体所包含的DNA分子以及DNA分子所携带的全部遗传指令。Genome:Thetotalcomplementofgenescontainedinacellorvirus;commonlyusedtorefertoallgenespresentinonecompletehaploidsetofchromosomesineukaryotes.1、基因组的大小与C值悖理基因组的大小一般用碱基对(bp)的数量来表示。千碱基对表示103个碱基对,英文简写1kb.百万碱基对表示106个碱基对,英文简写Mb。大多数真核生物的基因组都比原核生物的基因组大,比原核生物的基因组复杂,对病毒、细菌、低等真核生物和高等真核生物的基因组DNA含量的进行测定后,使我们得到这样一个概念:基因组的大小大致上与进化的复杂性有关(见表2—1)基因大小和内含子——外显子结构细菌基因较小平均lkbp大小上变化不大高等真核生物基因较大平均16kbp且大小变化很大哺乳动物中最小的基因,如人类的—干扰素基因lkbp与细菌基因相当,但很多超过100kbpDNA目前发现的最大基因:人类的肌营养不良蛋白基因,有2500kbp长。高等真核生物基因一般比细菌基因大得多,但从它们中得到的mRNA并不比细菌mRNA大。差异是由内含子(introns)引起的:内含子是打断转录单位的间插序列,必须在RNA水平上去除。转录单位余下部分通过剪接结合起来并表达称为外显子(exons)。基因大小与基因中外显子比例成反比。细菌基因一般缺乏内含子,100%是外显子。内含子在很多真核微生物中也很少如酿酒酵母,它们基因一般大小为1~2kbp与细菌类似。在人类中,最小的基因有很少的内含子且内含子很小(如500bp组蛋白H4基因没有内含子)。相反,最大的基因有95%的内含子。上面提到的肌营养不良蛋白基因有78个内含子,平均大小是30kbp;只有基因的0.5%是外显子。然而高等真核生物的内含子大小和数量变化很大,外显子大小则在一狭窄的范围内。如人类的不连续基因中,外显子平均长度为170bp,在50bp和300bp范围内变化。有一些值得一提的例外,如载脂蛋白B基因的26号外显子有7.6kb长度,但这样的例子很少。无脊椎动物与脊椎动物相比有更大的外显子,因为它们的内含子极少。表8-3不同真核生物中内含子—外显子的组织。酿酒酵母很少有被打断的基因,基因长度与mRNA长度一致。高度真核生物基因大小逐步加大,但mRNA大小保持恒定。一般基因大小与内含子数量成正比例与外显子含量成反比物种基因平均长度(kbp)平均内含子/基因平均mRNA长度%外显子酿酒酵母1.595%不被打断1.5100线虫43--4377果蝇113--4325人类166--72.513注:线虫与果蝇有类似的内含子数量,但内含子更小,使基因平均大小要小一些。基因数目和密度几种微生物基因组测序计划已完成。细菌基因数目变化有一个数量级:枝原体473个基因粘液球菌大约8000大肠杆菌大约有4400个基因在基因数目上:最大的细菌基因组与低等真核生物相差不多酿酒酵母有6340个基因果蝇和线虫:预计有酿酒酵母两倍的基因数量脊椎动物:预计有大约70000个基因维持一个独立生命有机体所需的最小基因数目是多少?细菌基因组比较发现了一系列必需生化途径,并有256个基因编码其中的成分。真核生物细胞建立复杂的细胞内结构似乎需要更多的途径多细胞生物调节发育和分化细胞的功能就需要更多。然而关键生化途径的数目在所有后生动物中类似,因为脊椎动物中大量基因被认为是通过整个基因组的两轮重复,加上不同染色体区域和单个基因的重复产生的。起初过剩的基因被用于特殊的功能,经常是因为表达模式的分化,但途径是高度保守的。生物体的单倍体基因组所含DNA总量称为C值每种生物各有其特定的C值不同物种的C值之间有很大差别能营独立生活的最小的生物——枝原体(Mycoplasma)的C值不到106bp一些显花植物和两栖类动物的C值则可多达1011bp,相差10万倍。C值同生物的进化有什么关系?生物的C值,即基因组的DNA总量是不是随着生物的进化而相应地增加?图2—1概括地回答了这两个问题。一方面:在一些低等生物中,随着生物进化,增加了生物体的结构和功能的复杂性,基因组也相应地增大即C值↑。如蠕虫的C值大于霉菌、藻类、真菌、细菌和支原体。另一方面:随着进一步的进化,在其他生物中则看不到这种规律。显花植物和两栖类动物的基因组最大两栖类动物C值小的109bp大的1011bp软骨鱼、硬骨鱼甚至昆虫和软体动物的基因组都大于包括人类在内的哺乳动物的基因组。爬行类和棘皮动物的基因组大小同哺乳动物几乎相等。因此,从总体上说:生物基因组的大小同生物在进化上所处的地位及复杂性之间无严格的对应关系,这种现象称为C值悖理(C—valueparadox)。C-valueparadox:thelackofdirectrelationshipbetweentheCvalueandphylogeneticcomplex2、序列复杂性(sequencecomplexity)同一类生物中基因组大小相差悬殊,其主要差别在于“多余”(excess)DNA的量的差别。“多余”DNA量多,则基因组大;反之,则小。所谓“多余”DNA主要是重复序列,即这种DNA序列在基因组中可以有不止一个拷贝。不同序列的总长度称为序列复杂性或者说:DNA分子中不重复碱基的总量(用bp来表示)或者说:最长的没有重复序列的核苷酸对的数值例()其总长为160bp,但不重复的碱基:AT所以序列复杂性x=2(bp)而()序列复杂性x=4(bp)若一个DNA分子长度为106bp,完全不含重复顺序,则x=106(bp)ATATTATA40ATCGTAGC40由此可见,序列复杂性的高低反映了序列包括的遗传信息量的多少。此外,生物体基因组的复杂程度还表现在基因的外显子数目的多寡(见图5—3)。哺乳动物基因的外显子数目远远多于其他生物,原核生物的基因基本上没有外显子和内含子之分。外显子数目多表现在RNA剪接时可以有更多种剪接方式,一个基因可以产生更多种的RNA,编码更多种蛋白质分子,也就是一个基因可以不止有一种功能。从进化角度看,更多的外显子有助于形成更多的外显子组合,生成新的基因,对生物在多种环境下生存是有利的。因此C值悖理可以用很多真核生物基因组中主要是非编码DNA来解释。非编码DNA可能是重复DNA或单一顺序DNA。基因组的复杂性(complexity)由单一顺序DNA的总和来定义,可以用物理单位(参见碱基对、皮克)或更经常是总基因组的百分比来表示。重复DNA的存在最早是通过复性动力学被发现并部分解释了C—值悖理。同一门类中C—值的差异主要反映了对基因组复杂性没有贡献的重复顺序DNA的含量的差异。当将重复顺序DNA考虑在内时,在有类似生物复杂性的物种间仍存在基因组大小的不一致性,特别是在一群单细胞有机体中间进行比较时。例如:酿酒酵母:C—值大约为13.5Mb裂殖酵母:C—值接近20Mb这两种酵母有类似的结构复杂性和较少的重复序列DNA。差异反映了非编码的单一顺序DNA之间的不同如基因间DNA片段和内含子:裂殖酵母40%的基因有内含子而酿酒酵母只有4%基因有内含子在更高等的真核生物中,基因间区域和内含子更大,内含子数量更多,使基因的平均大小和基因间距离增加。3、DNA复性动力学基因组内单一序列和重复序列的组成情况,可通过DNA复性动力学研究来确定。DNA复性:当变性DNA的两条互补链在除去变性因素后,可以重新或部分恢复成双螺旋结构。复性的必要条件:足够的盐浓度;温度适中(低于Tm20-25℃)复性过程缓慢:成核作用→拉链作用当两条单链DNA接触时,如果某个区段可以互补配对,就先形成一个双链核心区,然后扩展其互补配对区段而复性形成双链。复性过程很复杂,但基本符合二级反应动力学dSDNA2SSDNA复性的速率可用下列公式表示:dC/dt=-kC2k1k2这里,C是在t时单链DNA的浓度,k是二级反应常数。上述公式可以重排为-dC/C2=kdt对上式积分整理得:C/C0=1/(1+kC0t)这里C0是t=0时DNA的初始浓度这个公式表明反应中单链DNA所占百分数(C/C0)是DNA浓度(C0)同反应时间(t)乘积的函数,通常用C0t来表示。在一个特定的实验中,C0是已知的,C是可以测定的,如C/C0对C0t作图可以得到下图的曲线,称为Cot曲线(见图5—4)。当C/C0=0.5即复性反应完成一半时(t1/2)的Cot值定义为C0t1/2当条件一定时:C0t½的大小与DNA的分子量及复杂性有关(1)C0t½越大,表示复性速度越慢,DNA的分子量越大DNA总量一定时,基因组越复杂,任何特定顺序的拷贝数就越少。例如,DNA起始总量为12pg,一种细菌基因组大小为0.004pg,则它的各种顺序有:12/0.004=3000拷贝。另一种真核生物基因组大小3pg,12/3=4拷贝。尽管测得的Co绝对量相同12pg(核苷酸mol/L)。而事实上后者各顺序的浓度比前者低了3000/4=750(倍)。要使该真核生物基因的拷贝数也达到3000,则要多加750倍的DNA.因此,该真核生物DNA复性反应的C0t½是细菌DNA反应C0t½的750倍。(2)在不存在重复序列的情况下,C0t½值与基因组的大小成正比,也即与反应体系中的复杂度成正比:X=K’C0t½A.在一般标准条件下(阳离子浓度为0.18mol/L,片段大小为400bp)K’=5x105则有:X=5x105C0t½B.在非标准条件下,通常用大肠杆菌DNA作为标准测定未知DNA的复杂度:C0t½(欲测基因组DNA)复杂度(欲测基因组DNA)C0t½(大肠杆菌DNA)4.2x106bp(3).在有重复顺序的复性中,在同一个复性曲线上的各动力学组分的C0t1/2并不因基因组的大小而增减,而是与DNA序列的重复频率成反比:C0t½(1):C0t½(2)=f(2):f(1)式中(1)和(2)代表两个不同的动力学组分,f代表其重组频率(拷贝数)复性动力学研究表明=原核生物基因组的C0t曲线是单一的S形曲线真核生物基因组的C0t曲线是多S形曲线,由若干个(一般2-3个)S形加合成的曲线。整个基因组:7.8x108bpA:25%C0t(A)1/2=0.0013B:30%C0t(B)1/2=1.9C:45%C0t(C)1/2=630以上数值是从复性动力学曲线上查得。求A、B、C的复杂性和各自的重复频率?根据:f=S’(A)S’(B)S’(C)化学复杂长度(在某一S’曲线内的总长度)动力学复杂长度(在相应S’曲线内的每个拷贝长度)以大肠杆菌的C0t½为标准时有:待测样品的DNA复杂性=4.2x106(E.coliC0t½=4.0)样品DNAC0t1/2E.coliDNAC0t1/2求每一S’的动力学复杂性:C0t(C)’1/2=630x45%=283CDNA复杂性=4.2x106x283/4.0=3.0x108(bp)C0t(B)’1/2=1.9x30%=0.57BDNA复杂性=4.2x106x0.57/4.0=6x105(bp)C0t(A)’1/2=0.0013x25%=0.000325ADNA复杂性=4.2x106x0.00

1 / 91
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功