分子生物学 第二章 基因与基因组-新

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章基因与基因组第一节基因与基因组的概念一.基因概念的发展从遗传学史的角度看,基因概念的发展大致分以下几个阶段:孟德尔的遗传因子阶段,摩尔根的基因阶段,顺反子阶段,操纵子阶段和现代基因阶段。(一)孟德尔的遗传因子1865年,奥地利的孟德尔在《植物杂交试验》的论文中提出生物体的各种特定性状受遗传因子所控制,一个因子决定一种性状。作为基因雏形名词的遗传因子,只是一种逻辑推理概念,没有任何物质内容。(二)摩尔根的基因概念染色体遗传学之父摩尔根和他的学生们通过果蝇研究把基因定位在染色体上,首先使基因物质化了。1953年沃森-克里克DNA双螺旋结构模型的提出,这个模型表明基因实际上就是DNA分子的一段核苷酸序列。20世纪40年代末至50年代初,基因是通知控制特定蛋白质合成来控制代谢,进而决定生物性状的原理变得清晰起来。(三)顺反子1957年,法国遗传学家本兹尔的噬菌体重组试验结果表明:基因可被分为更小的单位;一个顺反子就相当于一个基因,它是一个功能单位,决定一个酶或一条多肽链的表达。(四)操纵子及其基因1961年,法国分子生物学家雅各布和莫诺基于细菌酶诱导的研究,提出了关于原核生物基因表达调控的“乳糖操纵子模型”。作为原核生物基因表达调控单元的操纵子,其基因根据功能可分为结构基团、调节基团(?)和控制基团(包括启动基因和操纵基团)三类。(五)现代基因概念的扩展1.重叠基因重叠基因即一个基因包含或部分包含另一基因。重叠基因的发现揭示了遗传物质的一种经济而巧妙的编排——密码子共用核苷酸序列,通过不同的三联体密码子读框编码不同的多肽链。2.断裂基因出现在成熟的mRNA上的DNA序列是不连续的,它们被一些间隔区DNA序列所分隔。这些间隔区序列在RNA的转录后的加工成熟过程中被切除。这种基因内部的间隔区DNA序列称为内含子,出现在成熟RNA中的各个DNA区段称为外显子。由若干个外显子和内含子互相间隔而组成的嵌和体称为断裂基团。3.跳跃基因跳跃基团又称为转座元件,它是指那些可从染色体的一个位置跳到另一个位置,或从一条染色体跳到另外一条染色体上的可移动遗传元件。4.假基因假基因也称“拟基因”,是一类没有功能的特殊基团。假基因的核苷酸序列与其相应的有功能基因基本相同,原来也可能是有功能的基因,由于缺失或点突变等原因失去活性,成为无功能基因。二.基因的概念(一)基因的概念基因(gene)是生物体传递和表达遗传信息的基本单位。从化学角度观察,基因则是一段具有特定功能和结构的连续的脱氧核糖核酸序列,是构成巨大遗传单位染色体的重要组成部分。•指表达一种或多种蛋白质或功能RNA的遗传物质的基本单位。•一段制造功能产物的完整的染色体片段(acompletechromosomalsegmentresponsibleformakingafunctionalproduct.*)。包含基因的产物、基因的功能性及完整性(包括一个蛋白质或RNA的全部编码序列和编码区之外对编码区转录功能所必要的非编码的调控区。)基因的分子生物学定义一个基因不仅是编码有功能的蛋白质多肽链或RNA所必需的核酸序列(通常指DNA序列),而且还包括为保证转录所必需的调控序列、5’端非翻译序列、内含子以及3’非翻译序列等核酸序列。根据基因是否具有表达功能可以将其分为三类第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶、其他功能蛋白和结构蛋白的结构基因以及编码阻遏蛋白的调节基团。第二类是只有转录功能而没有翻译功能的基团,包括tRNA基因和rRNA基因。第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因,这类基因也称控制基因。(二)基因的命名法目前对基因的命名一般根据种属习惯,方法并未统一。基因的命名一般用斜体字,按种属字母和数学符号来表示。如果表示蛋白产物和表型,就用大写字母。如果表示隐性突变,用小写字母。表示显性突变,第一个字母要大写。在其它一些种属包括人的基因命名中,基因全由大写字母表示。大肠杆菌和其他细菌三个小写字母表示一个操纵子,接着的大写字母表示不同基因座。例如:lac操纵子;基因座:lacZ,lacY,lacA。蛋白质:LacZ,LacY,LacA。另外还采用特殊惯例命名B.subilis的孢子发生基因。这些基因以spo后加上表示孢子发生的形态阶段的罗马数字表示,再用大写字母表示表示操纵子,而后为基因座,例如,spoⅡGA就表示在第二阶段表达的操纵子G的第一个基因座。酵母•三个字母表明基因功能,而后的数字表示不同的基因座。•啤酒酵母基因GAL4,CDC28;•蛋白质:GAL4,CDC28。•非洲蜀酒酵母基因gal4,cdc2;•蛋白质:Gal4,Cdc2。线虫•用三个小写字母表示突变表型,如存在不只一个基因座,用连字符号接数字表示,•例如,基因unc-86,ced-9;蛋白UNC-86;CED-9。果蝇•来自突变表型的描述可以用1-4个字母表示。•例如,基因white(w),tailless(tll),hedgehog(hh);而蛋白为White,Tailless,Hedgehog。植物虽然没有适用于所有植物的惯用法,但大多数用1-3个小写字母表示。Arabidopsis基因用果蝇的方法命名,但使用大写字母,例如,基因AGAMOUS(AG),蛋白AGAMOUS。脊椎动物一般以描述基因功能的1-4个小写字母和数字表示其基因功能。例如,基因sey,myc,蛋白Sey,Myc。人类方法如脊椎动物但需大写。例如基因MYC、ENO1。二.基因组的概念基因组(genome)是细胞或生物体的全套遗传物质。Thegenomeisthecompletesetofsequencesinthegeneticmaterialofanorganism.ItincludesthesequenceofeachchromosomeplusanyDNAinorganelles.是一种生物染色体内全部遗传物质的总和,包括构成基因和基因之间区域的所有DNA。就细菌和噬菌体而言,它们的基因组是指单个染色体上所含的全部基因;而二倍体真核生物的基因组则是指维持配子或配子体正常功能的最基本的一套染色体及其所携带的全部基因。(即由一个物种的单倍体的染色体构成。/任一生物染色体的单个单倍体组。)基因组在个体水平代表一个个体所有遗传性状的总和,在细胞水平代表一个细胞所有不同染色体(单倍体)的总和,在分子水平代表一个物种所有DNA分子的总和。简而言之,它表示一种生物的DNA或RNA所含的全部遗传信息。基因组与基因,一般以DNA的长度和序列来表示。生物的复杂性与基因组内的基因数量有关,进化程度越高,基因组越复杂。第二节病毒(噬菌体)基因组病毒(virus)是一类没有细胞结构但有遗传、变异、共生和干扰等生命现象的微生物。在结构上,没有细胞结构,因此称为病毒颗粒而非病毒细胞;在化学组成上,完整的病毒颗粒通常由一种或几种蛋白质和一种核酸组成,有些种类还含有一定量的脂类物质和碳水化合物,而类病毒仅仅以核酸形式存在;在生命活动上,这种最简单的生命形式需借助其他生物细胞完成其生命过程,基因组信息的遗传与变异是其生命活动的最主要内容。一.病毒基因组核酸的主要类型病毒(virus)是最简单的生物,外壳蛋白包裹着里面的遗传物质核酸。1、双链DNA多数动物病毒,如腺病毒、疱疹病毒、痘病毒,环形、线形。2、单链DNA动物病毒中仅微小病毒为单链病毒;噬菌体中仅含单链DNA。RNA病毒基因组所携带的遗传信息一般在同一条链上,序列与mRNA相同的为正股(+),与mRNA互补的为负股(—)3、双链RNA以负链RNA为模板转录出mRNA如呼肠孤病毒及噬真菌体。4、单链负股RNA5、单链正股RNA:如逆转录病毒二.病毒基因组结构与功能1、不同病毒的基因组的大小差异很大。比细菌基因组小,只能编码少数蛋白,遗传信息量较小。2、不同病毒的基因组可以是不同结构的核酸;每种病毒基因组由DNA或RNA中的一种组成。核酸的结构可以是单链或双链,闭合环状或线状分子。根据基因组的核酸类型,病毒可分为DNA病毒和RNA病毒。3、病毒基因组有连续的也有不连续的;噬菌体的基因是连续的。而多数真核细胞的病毒常含有不连续基因。除正链RNA病毒外,真核细胞病毒的基因先转录成mRNA前体,再加工为成熟的mRNA。故病毒基因的特性更像真核生物基因。4、病毒基因组的编码序列大于90%;大部分序列用来编码蛋白,基因之间的间隔序列(spacersequence)非常短。如ΦX174的非编码区只占217/5386.5、一般属单倍体基因组;7、功能上相关的基因往往集中成簇,在基因组的特定部位构成一个功能单位或转录单元。转录产物往往是多顺反子的RNA,然后加工成各蛋白质的mRNA。8、病毒的DNA复制及基因表达往往依赖于宿主细胞的系统。根据宿主不同,病毒又可分为动物病毒、植物病毒和噬菌体。9、常有基因重叠现象.一个基因可以完全在另一基因内,或者部分重叠,甚至两个基因之间只有一个核苷酸重叠。重叠基因可能使用共同的核苷酸序列,但转录成的mRNA有不同的阅读框架(openreadingframe,ORF),产生的蛋白质分子大不相同。有些重叠基因会使用相同的阅读框架,但起始或终止密码子不同。基因重叠时,共同序列上发生的突变可能影响一个基因甚至两个基因的功能。重叠基因现象反映了原核生物利用有限遗传资源表达更多生物功能的能力。真核生物基因组中极少重叠基因现象。例如,φ×174DNA全部5386个核苷酸序列的11个基因中,除了基因B完全在基因A内,基因D和E部分重叠外,特别有趣的是蛋白D的终止密码子最后一个核苷酸是蛋白J起始密码子的第一个核苷酸。剑桥的分子生物学家D.C.Show和J.E.Walker等,在测定G4噬菌体DNA的核苷酸序列时,又发现了一种三重重叠基因。图3-6φ×174噬菌体DNA中基因D和E(以及相应的编码蛋白质)的起点与终点第三节原核生物基因组一.染色体基因组原核生物是一些由无细胞核的细胞组成的单细胞或多细胞的低等生物,主要包括细菌、支原体和植物中的蓝藻门。原核生物无真正的细胞核,无核膜,遗传物质存在于整个细胞中。DNA有时相对集中,以裸露的形式存在。可与蛋白质结合,但不构成染色体结构,此结构又叫类核体,习惯上仍将其基因组DNA与支架蛋白组成的结构称为染色体,有时也将其核酸分子称做原核生物染色体。原核生物基因组都很小,如大肠杆菌,整个基因组由4.6(也有说4.2的)×106bp组成,相对分子质量为2.4×109,大约包括3000~4000个基因。所有原核生物的遗传物质均为DNA。与病毒相比,原核生物有较完整的代谢系统,进行较复杂的代谢活动,如从外界环境摄取营养物质、对外界环境的改变做出反应等。故原核生物基因组结构基因的数量和功能远多于病毒基因组。二.染色体基因组的特点1.常仅由一条环状双链DNA分子组成细菌染色体的环化性使得在缺少端粒(telomere)的情况下,仍能够完整的复制。这条环状双链DNA分子在细胞内形成一个较为致密的区域,称为类核。类核无核膜与胞浆分开,其中央部分由RNA和支架蛋白组成,外围是呈超螺旋状的双链闭环染色体DNA。但现在也发现有线形基因组。2.只有一个复制起始点,一个复制起点。3.具有操纵子(operon)结构。DNA序列中功能相关的RNA或蛋白质基因往往前后排列在一起形成一个转录单位,从同一启动子开始转录形成一个多顺反子mRNA,再被分别表达成不同的RNA或蛋白质。4.基因组的序列绝大部分是用来编码蛋白质的,只有极少部分不转录,而不转录部分通常是控制基因表达的序列。越是简单的生物,其已知基因数越接近于从其DNA分子量所估计的基因数。5.基因是连续的,无内含子,转录后不需剪接。6.编码区在基因组中所占比例远远大于真核基因组,小于病毒基因组。编码蛋白质的结构基因是单拷贝的,而rRNA基因往往是多拷贝的。7.存在着少量基因重叠的现象。编码顺序一般不会重叠。8、基因组中重复序列很少,一般为单拷贝,如结构基因。但编码rRNA的基因往往是多拷贝。9、具有编

1 / 275
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功