第一节“基因”概念*第二节蛋白质的结构和功能第三节染色体的结构特征*第四节基因组的结构与特点1第三章基因、染色体与基因组I.基因概念的产生II.经典基因概念的建立与发展III.现代基因概念的多元化*IV.现代基因概念剖析第一节“基因”概念1857年,奥地利的一名神父孟德尔在他所在的修道院后院开始进行长达8年的豌豆杂交实验1865年,孟德尔根据豌豆杂交实验的结果,发表了著名论文《植物杂交试验》,首次提出了遗传因子控制生物性状假说:一个遗传因子决定一个性状,阐述了他所发现的显性、隐性遗传现象和两个重要遗传学规律——分离规律和自由组合规律他所指的遗传因子,即基因概念的萌芽I.基因概念的产生2/2/202031900年是遗传学史乃至生物科学史上划时代的一年,荷兰的德弗里斯(HugoDeVries,1848~1935)、德国的柯灵斯(CarlErichCorrens,1864~1933)和澳大利亚的契马克(ErichvonTschermak-Seysenegg,1871~1962)三人分别在月见草、玉米和豌豆的杂交实验中证实了孟德尔定律,标志着遗传学的诞生,从此,遗传学进人了孟德尔时代“重新发现”孟德尔2/2/202041909年,丹麦遗传学家约翰逊(Johannsen)在《精密遗传学原理》一书中根据希腊语“给予生命”之义,创造“基因”(Gene)一词来代替孟德尔假定的“遗传因子”,并提出“基因型”和“表现型”。从此基因便成为遗传因子的代名词一直沿用至今不过此时的基因仍然是一个未经证实的、仅靠逻辑推理得出的概念,“基因”只是一个抽象的符号2/2/20205II.经典基因概念的建立与发展(基因与染色体)2/2/202061.经典基因概念的建立2.“一个基因一个酶”假说3.顺反子、突变子和重组子4.操纵子模型5.跳跃基因在孟德尔的成果获得承认后,生物界都知道是遗传因子(即基因)决定了生物的遗传。但是,基因究竟在细胞内的什么地方?摩尔根以果蝇为试验对象回答了这一问题,基因在染色体上1.经典基因概念的建立2/2/20207《基因论》里,首次提出“三位一体”的基因概念:1)基因首先是一个功能单位,能控制蛋白质的合成,从而控制生物性状发育2)一个突变单位,在一定条件下,野生型基因能突变成相应的突变型基因,从而表现出各种变异类型3)一个重组单位,两个不同基因可重组,产生与亲本不同的新类型2/2/202082.“一个基因一个酶”假说1941年,Beadle和Tatum等以红色链孢霉为材料,在研究基因的生理生化功能时,提出了“一个基因一个酶”假说,认为生物的性状可分为许多单位性状,每个单位性状均受一种酶影响,而酶决定于基因的表达2/2/20209生化遗传及早期分子遗传研究在两个重要方面发展了基因的概念:基因是DNA分子上带有遗传信息的特定核苷酸序列区段,并且在染色体上位置固定、序列连续;遗传信息就存在于核苷酸(碱基)序列中“一个基因一个酶”,基因表达为蛋白质;基因的核苷酸序列决定蛋白质氨基酸序列2/2/2020103.顺反子、突变子和重组子1955年,Benzer在研究E.coliT4噬菌体rII区基因的精细结构时,首次提出了顺反子、突变子和重组子的概念,对经典的基因概念的第一次重要修正与发展:1)顺反子(cistron)是一个遗传功能单位,一个顺反子决定一条多肽链2)突变子(muton)是能发生突变的最小单位,可以是一个或几个核苷酸,其中任一核苷酸的改变都可形成一个突变子3)重组子(recon)是能够交换的最小单位,有起点和终点,各个重组子之间均有一定的距离,彼此间能发生交换2/2/202011从而提出“一个顺反子一条多肽链”假说座位与位点经典遗传学认为:基因是染色体上的一个点,称位点(Site)现代基因概念认为:1)基因是DNA分子带有遗传信息的碱基序列区段2)基因是由众多碱基对构成,此时将一个碱基对称为基因的一个位点(Site)3)而将基因在染色体上的位置则称为座位(Locus)2/2/2020124.操纵子模型1965年,法国科学家Jacob和Monod提出了著名的乳糖操纵子模型。他们将乳糖操纵子的基因分为结构基因、调节基因、操纵基因和启动子1)结构基因直接控制蛋白质合成,是决定一条多肽链的功能单位2)操纵基因居结构基因之前,能同阻遏物结合,可间接控制结构基因的表达3)启动子又居操纵基因之前,为RNA聚合酶结合位点4)调节基因编码的可扩散性阻遏蛋白,通过与操纵基因结合来调控操纵子2/2/2020135.跳跃基因(转座子)2/2/202014A.发现与概念B.转座子类型C.转座作用机制美国女遗传学家麦克林托克于1951年提出了可移动的遗传基因(即“跳跃基因”或“转座子”)学说─基因可从染色体的一个位置跳跃到另一个位置、甚至从一条染色体跳跃到另一条染色体。为研究遗传信息的表达与调控、生物进化与癌变提供了线索。于1983年获诺贝尔奖跳跃基因的发现使人们认识到基因不是稳定、静止不动的实体,而是一段在结构上有明确界限的DNA序列,可通过自身运动调节相关基因活性2/2/202015A.发现与概念概念DNA的转座:由可移位因子介导的遗传物质重排现象转座子(transposon):存在与染色体DNA上可自主复制和位移的基本单位2/2/202016B.转座子类型a.插入序列(InsertionalSequence,IS)IS是最简单的转座子,不含有任何宿主基因,它们是细菌染色体或质粒DNA的正常组成部分b.复合转座子(CompositeTransposon)复合转座子是一类带有某些抗药性基因(或其他宿主基因)的转座子,其两翼往往是两个相同或高度同源的IS序列2/2/202017C.转座作用机制2/2/202018a.复制性转座子b.非复制性转座子IS-两端有IR,只编码转座酶类转座因子-结构同IS,但不能独立存在,仅作为复合转座子的两端组件复合转座子-两端由IS或类IS构成,可编码抗抗菌素物质原核TnA转座子家族-两端为IR,可编码转座酶、解离酶和抗性物质AC-Ds-植物(玉米)中的激活-解离因子转座子P因子-果蝇中父本因子,在M♀×P♂中导致杂种不育反转录病毒、RNA→DNA→整合宿主靶DNATyCopia病毒超家族LINSL1(1)有长末端重复序列(2)编码反转录酶或整合酶(3)可含内含子SINSB1/Alu(1)无重复序列(2)不编码转座子产物(3)无内含子转座因子真核反转录转座子非病毒超家族假基因2/2/202019III.现代“基因”概念的多元化1.断裂基因**2.重迭基因*3.重复基因4.假基因5.印记基因6.基因家族2/2/2020201.断裂基因1977年,Roberts和Sharp在研究腺病毒的mRNA合成时,在其5’端首先发现了断裂基因的存在,打破了每个结构基因是一段连续DNA片段的传统观念,使人们对基因结构的认识产生了一次新的飞跃,因而他们两人分享了1993年诺贝尔生理学与医学奖目前已经证实,不仅高等真核生物绝大多数基因都是断裂基因,而且低等真核生物的线粒体和叶绿体内的基因组也存在断裂基因2/2/202021定义:指基因的编码序列在DNA分子上是不连续排列的,而是被不编码的序列所隔开编码的序列称为外显子,对应于mRNA序列的区域,是一个基因表达为多肽链的部分不编码的间隔序列称为内含子,内含子只转录,在前mRNA(pre—mRNA)时被剪切掉大多数真核生物的基因为不连续基因(Interrupted或DiscontinuousGene)或断裂基因(SplitGene)2/2/202022发现:1973年,Weiner等在研究E.coli的RNA病毒Q时,首次提出了重迭基因的概念定义:它是指两个或两个以上的基因共有一段DNA序列,或是指一段DNA序列为两个或两个以上基因的组成部分2.重迭基因2/2/2020233.重复基因它是指在真核生物基因组中具有一份以上拷贝的基因。这些拷贝或在一条染色体上串联排列,或分散在多条染色体上,包括寡拷贝和多拷贝基因,前者有人的珠蛋白基因、癌基因,后者包括组蛋白基因、rRNA基因等重复基因:指在基因组中有多份拷贝的基因,往往是生命活动中最基本、最重要的基因2/2/202024发现:1977年,Jacq等在研究非洲爪蟾的5SRNA基因时,首次发现假基因的存在定义:即与正常功能基因顺序基本相同却不具有控制蛋白质合成的功能的基因包括已知功能基因的残存拷贝、散在分布的长细胞核因子和短细胞核因子真核生物中普遍存在形成原因:基因组中因突变而失活,如碱基对缺失或插入以致不能正常编码,或这些突变使启动子出现问题4.假基因2/2/202025假基因的结构特点1)不同部位有不同程度的缺失或插入2)缺少正常基因的内含子和启动子3)5’端都有真核生物mRNA分子特有的AATAAA信号,造成转录启动区的缺陷4)两侧有顺向重复序列2/2/202026定义:它是指功能受到双亲基因组的影响而被打上雌雄亲本特异性标记的基因。它为哺乳动物的基因组所特有,实质上是双亲相应基因的甲基化程度不同5.印记基因2/2/2020271)印记基因遍布于整个基因组中2)有些印记基因聚集成簇,形成染色体印记区3)不同印记基因表现出不同的印记效应4)印记基因的内含子一般较小,“内含子/外显子”长度之比也较小5)表达具有组织特异性印记基因的结构特点2/2/2020286.基因家族真核生物的基因组中有很多来源相同、结构相似、功能相关的基因,将这些基因称为基因家族如:编码组蛋白、免疫球蛋白和血红蛋白的基因都属于基因家族(GeneFamily)同一家族中的成员有时紧密地排列在一起,成为一个基因簇(GeneCluster)2/2/202029IV.现代“基因”概念剖析1.基因组时代的基因定义2.蛋白质组时代的基因定义2/2/2020301.基因组时代的基因定义1990年,“人类基因组计划”的实施标志着生命科学步入基因组时代基因组:携带生物体全部遗传信息的核酸量在这个时代,基因的定义主要基于“三种方法”和“五个标准”2/2/202031三种方法1)cDNA克隆和poly(A)mRNA的表达序列标签(EST)测序2)比较基因组分析鉴定各种生物的保守编码区3)计算机预测各种基因的结构2/2/202032五个标准1)开放阅读框:通过基因组中大的开放阅读框的鉴定来发现蛋白编码基因2)序列特征:密码偏好和剪接位点等特异序列特征有助于锁定基因3)序列保守性:通过不同生物的序列对比来鉴定基因,它是估计基因重要性的一个理想方法4)转录实况:RNA或蛋白质的表达搜索,是一种非序列基础的基因鉴定,通过微阵列杂交、基因表达的序列分析、cDNA作图或EST作图来完成5)活性丧失:突变基因使它的产物失去活性也是鉴定基因的一种方法,主要通过基因干扰或RNAi来实现2/2/202033基因的定义:DNA分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。合成有功能的蛋白质或RNA所必需的全部DNA序列(除部分病毒RNA)即一个基因不仅包括编码蛋白质或RNA的核苷酸序列,还包括为保证转录所必需的调控序列2/2/2020342.蛋白质组时代的基因定义1994年,澳大利亚分子生物学家Wilkins和Williams等首次提出了蛋白质组的概念,并将其定义为“基因组编码的全部蛋白质”蛋白质组概念的提出为在细胞和整体水平上阐明生命现象的本质和活动规律奠定了基础2/2/2020351994年,Davis等首次提出切除肽(Intein)和显现肽(Extein)的概念,他认为这些蛋白在翻译后自动删除切除肽,连接显现肽,才形成有功能的蛋白显现肽的出现使得基因指导合成的蛋白与最终的功能蛋白不一致显现肽的存在不仅促进蛋白质分子的自我剪接(Cis-splicing),而且还能把两个蛋白质分子连接成一个新的蛋白质分子(Trans-splicing),这就在蛋白质水平上大大增加了基因表达的多样性2/2/202036鉴于从基因到蛋白质要经过各种各样的修饰和加工,如断裂基因的RNA剪接、模糊基因RNA编辑等。即使稳