24人类基因组24.1人类基因组及其组成24.2人类遗传性疾病24.3癌基因与恶性肿瘤24.4人类基因组计划主讲老师:杨丽英2009年4月24.1人类基因组及其组成24.1.1人类基因组的DNA序列组成1.基因组及基因组学(1)基因组:在《遗传学名词》第二版中对“基因组”的释义:是指一个单倍体细胞核中、一个细胞器(如动、植物细胞质中的线粒体,植物细胞质中的叶绿体)中或一个病毒毒粒中所含的全部DNA(或RNA)分子的总称。基因组(Genome)可分为核基因组、线粒体基因组、叶绿体基因组及病毒基因组。一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。可是基因组测序的结果发现基因编码序列只占整个基因组序列的很小一部分。因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。说的更确切些,核基因组是单倍体细胞核内的全部DNA分子;线粒体基因组则是一个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。不同的生物,基因组的大小差别很大基因组是原核细胞内构成染色体的一个DNA分子(霍乱菌有一大一小两个环状DNA分子)。而真核生物有细胞核和细胞质,染色体在细胞核内,细胞器在细胞质中。真核生物的基因组是指单倍体细胞核内整套染色体所包含的DNA分子。而细胞器中的基因组则应区分线粒体的基因组(动、植物均有)和叶绿体基因组(行光合作用的植物)。人类的核基因组是指单倍体细胞核中整套染色体上(22+X+Y)所具有的全部DNA分子。(2)基因组学基因组学(英文genomics)台湾译作基因体学,基因组学出现于19世纪80年代,19世纪90年代随着几个物种基因组计划的启动,基因组学取得长远发展。20世纪末基因组研究的迅猛发展而形成的一个新的遗传学分支学科,其研究基因以及在遗传中的功能。基因组学的分类:基因组学是研究生物基因组和如何利用基因的一门学问。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学和工业领域的重大问题。基因组学分成结构基因组学(structuralgenomics)和功能基因组学(functionalgenomics)。结构基因组学和功能基因组学的概念:结构基因组学:是研究基因和基因组的结构,各种遗传元件的组成物质的序列特征,基因定位和基因组的作图等。功能基因组学:旨在是基因组水平上阐明DNA序列的功能,着重研究不同的序列结构所具有的不同功能,基因的表达与调控,基因与环境之间的相互作用等。基因组学能为一些疾病提供新的诊断和治疗方法。例如,对刚诊断为乳腺癌的女性,一个名为“OncotypeDX”的基因组测试,能用来评估病人乳腺癌复发的个体危险率以及化疗效果,这有助于医生获得更多的治疗信息并进行个性化医疗。基因组学还被用于食品与农业部门。基因组学的主要工具和方法包括:生物信息学、遗传分析、基因表达测量和基因功能鉴定。近年来基因组学研究如雨后春笋般蓬勃兴起,该领域的研究成果已经包括599种病毒和类病毒(viroid),205种天然质粒,185种细胞器,31种真细菌,7种古细菌,1种单细胞真核生物,2种动物和1种植物的全基因组序列的测定。2.人类基因组的DNA序列组成人类基因组有总长约3.2×109bp的DNA,只有3.4—3.5万个基因,涵盖编码各种蛋白,也包括编码tRNA和rRNA的基因。基因内存在大量的非编码序列,如内元和调节序列(如启动子区)等。人类基因组拥有数量巨大的基因外DNA,约占总数的80%~90%。主要包括各种类型的重复序列,如卫星DNA,小卫星DNA和微卫星DNA等等。24.1.2人类基因组各组成成分的基本特征1.基因(Gene,Mendelianfactor)是指携带有遗传信息的DNA或RNA序列,也称为遗传因子,是控制生物性状的基本遗传单位,在染色体上呈线性排列。基因通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表现。2.基因外DNA大多数基因外DNA序列(70%~80%)是以单一或低拷贝数的形式存在的,其余(20%~30%)是中度或高度重复序列。重复序列(repetitivesequence)是指在基因组中重复出现的DNA序列。人类基因组中有大量的重复序列。高度重复序列:重复几百万次,一般是少于10个核苷酸残基组成的短片段。如异染色质上的卫星DNA。它们是不翻译的DNA片段。在小鼠中约占基因组的10%。中度重复序列:重复次数为几十次到几千次。在小鼠中约占20%。如rRNA基因、tRNA基因和某些蛋白质(如组蛋白、肌动蛋白、角蛋白等)的基因。重复序列分成两大类根据重复序列在基因组中的组织形式,分为分散重复序列(dispersedrepetitivesequence)和串联重复序列(tandemrepetitivesequence)两类。单一序列是在整个基因组里只出现一次或少数几次的DNA序列,基因序列多半是单一序列,但有些基因在基因组内的拷贝数也不止一个,同时基因序列也有单一序列。单一序列在小鼠中约占基因组的70%。如珠蛋白基因、卵清蛋白基因、丝心蛋白基因。实验证明,所有真核生物染色体可能均含重复序列而原核生物一般只含单一序列。高度和中度重复序列的含量随真核生物物种的不同而变化。3.分散重复序列这些DNA序列一般属于中度重复序列,以散在的方式分布于基因组中。依重复单位的长度又分为长分散重复序列(LINE)和短分散重复序列(SINE)。人类基因组中最典型的SINE的代表是Alu家族,由于这种DNA序列中有限制酶AluⅠ的识别序列ACCT,故称为Alu重复序列。Alu家族的结构和功能Alu家族是人类基因组中含量最丰富的中度重复序列,在整个人类基因组中散布有100万份拷贝,平均每4~6kb就有一个Alu序列,每个序列的平均长度为282bp。Alu重复序列较集中在染色体的基因转录最活跃的区段。其功能可能与转录调节及DNA复制的起始有关。LINE的结构和功能LINE有更长的序列,重复单元的长度在1000bp以上,在人类基因组中有上万份拷贝。LINE是一类反转录元件(或称因子),这些序列在人类基因组中通过转座(transposition)而移动位置。人类基因组中著名的LINE是LINE-1(L1)。4.簇状重复序列人类基因组中有广泛的区域含有首尾相连成长串联状的重复序列。这些序列称为串联重复序列或称簇状重复序列。根据重复单元的大小或重复序列簇的长度,分为卫星DNA、小卫星DNA和微卫星DNA3种。卫星DNA是一类重复单元很大的高度重复序列,其长度为100~5000bp。一般分布在染色体的异染色质区(端粒、着丝粒)。小卫星DNA的长度通常在9~70kb之间。重复单元的数目(n)为几个至几百个。主要存在于染色体末端靠近端粒的区域。由于同一物种不同个体间,在给定的基因座上,重复数目是可变的,所以小卫星DNA串联重复又称数目可变串联重复。微卫星DNA分布于染色体的任何区域,由1-4个核苷酸的单元重复串联而成,可长达几十个碱基对地几百个碱基对,在基因的间隔区和内元等非编码区内广泛存在。在人类基因组中至少有3万个微卫星序列基因座。基因组中两个核苷酸的重复(如CA重复)非常普遍,平均每30~60kb就存在一个这类重复序列,其重复次数(n)大约为15~60。这类短序列的微卫星DNA又称短串联重复(shorttandemrepeat,STR)。24.2人类遗传性疾病人类遗传性疾病humangeneticdiseases是指遗传物质发生改变或者由致病基因所控制的疾病,通常具有垂直传递和终身性的特征。遗传病具有由亲代向后代传递的特点。这种传递不仅是指疾病的传递,最根本的是指致病基因的传递。所以,发病表现出一定的家族性。父母的生殖细胞(精子或卵细胞)里携带的致病基因,通过生殖传给子女并引起发病,而且这些子女结婚后还可能把致病基因传给下一代。24.2.1染色体病chromosomedisease由于染色体的数目或形态、结构异常引起的遗传性疾病。迄今已知的染色体病约300余种。染色体病的典型实例是第5号染色体缺失导致的“猫叫综合征”(criduchat,“cat-cry”)。患有“猫叫综合征”的新生儿,表现出智力迟缓,头小,耳位低,眉间宽,眼裂外斜,通贯手,哭声像小猫的咪呜咪呜叫。患者往往在幼年或童年早期死亡。染色体病的种类和临床表现常染色体病由常染色体异常引起,临床表现先天性智力低下、发育滞后及多发畸形。如“猫叫综合征”和21三体。性染色体病由性染色体异常引起,临床表现性发育不全、智力低下、多发畸形等。如原发性小睾丸症、卵巢退化症、XXY、多Y男人(XYY、XXYY)、多X女人(XXXY、XXXXY、XXX)和XO、性染色体嵌合体如46(XX)/47(XXY)嵌合体和46(XY)/45(X)嵌合体等。唐氏综合征21三体综合征,又称先天性愚型或唐氏综合征(Down’ssynrome)是人类21条染色体在减数分裂Ⅰ时发生不分离,那么一半配子会携带一条多余的21号染色体。当这些带有一条多余的21号染色体的配子与正常的配子结合时,21三体就产生了。发病率为1/600-1/800,不会生育。Klinefeler综合征男性携带一条多余的X染色体(XXY),发病率为1/1000-1/2000。多数患Klinefeler综合征,外貌男性,具有男性性器官,但是睾丸异常缩小并且导致不育,身长比一般男性高。这种综合征伴有乳房增大和其他女性身体的轮廓,患者智力往往正常。携带超过一条多余的性染色体的个体也会患Klinefeler综合征,如XXYY、XXXY、XXXXY。Turner综合征具有一条多余的X染色体的女性称为“超雌”(XXX),表现正常但生殖力有问题。缺少一条X染色体的女性(XO)不育,因为卵巢完全缺失,原发性闭经,她们成年后性器官仍未成熟。这些女性患有Turner综合征,她们身材矮小,不能发育第二性征。发病率为1/3500。性染色体的影响多一条或少一条性染色体,常使性腺发育不全,失去生育能力。少一条性染色体的影响比多一条性染色体的影响要大。XO个体远比XXY少见。Y染色体有强烈(特殊)的男性化作用。有Y染色体存在,性别分化趋向男性,体内出现睾丸等男性器官,外貌像男性(因为Y染色体上存在决定雄性睾丸的发育基因,能产生H-Y抗原)。而没有Y染色体存在时,性别分化趋向女性,体内出现卵巢,外貌像女性,不能产生H-Y抗原。24.2.2单基因病(monogenicdisorder):主要与一对致病基因有关,它们按简单的孟德尔方式遗传。至今已知有6000多种遗传性疾病是由单基因显性或隐性突变引起的。人类的体细胞核中染色体是成对的,其染色体上的基因也是成对的。如果一种遗传病的发病涉及一对基因,这对基因就成为主基因,它所导致的疾病就成为单基因病。突变基因可在常染色体上或性染色体上根据致病基因所在的染色体和显、隐性关系,可有6种遗传方式:常染色体显性遗传,常染色体隐性遗传,X连锁显性遗传,X连锁隐性遗传和Y连锁遗传及线粒体病。线粒体病:致病基因在细胞质中,只有母系(母亲)遗传。1.隐性遗传病(1)常染色体隐性遗传病:已发现千余种,如白化病、苯丙酮尿症、黑尿症、先天性聋哑、镰刀型细胞贫血症、半乳糖血症和呆小症等。(2)X连锁隐性遗传病:已发现两百余种,如红绿色盲、血友病、肛门闭锁症、血鳞癣症、进行性肌肉营养不良等。2.显性遗传病(1)常染色体显性遗传病:已发现1000多种,如多发性结肠息肉、软骨成骨发育不全侏儒症、享氏舞蹈症、秃头、并指、多指(趾)、偏头痛症等。(2)X连锁显性遗传病:目前只发现十余种,如遗传性肾炎、钟摆型眼球震颤症、抗维生素D佝偻症等。3.X连锁遗传病包括X连锁显性遗传病和X连锁隐性遗传病。血友病X连锁遗传病的特点:只有XX