第三章基因组的结构与功能基因组的结构与功能基因(gene)是核酸分子中储存遗传单位,是指储存有功能的蛋白质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序列。基因:编码蛋白质肽链或RNA的核酸序列保证转录所必需的调控序列及位于编码区5’端上游的非编码序列内含子位于3’端下游的非编码序列。基因组:是指细胞或生物体中,一套完整单倍体的遗传物质的总和。病毒基因组核酸的主要类型1、双链DNA多数动物病毒,如腺病毒、疱疹病毒、痘病毒,环形、线形。2、单链DNA动物病毒中仅微小病毒为单链病毒;噬菌体中仅含单链DNA。病毒基因组RNA病毒基因组所携带的遗传信息一般在同一条链上,序列与mRNA相同的为正股(+),与mRNA互补的为负股(-)3、双链RNA以负链RNA为模板转录出mRNA,如呼肠孤病毒及噬真菌体。4、单链负股RNA5、单链正股RNA:如逆转录病毒病毒基因组结构与功能的特点1、不同病毒基因组大小相差较大2、不同病毒的基因组可以是不同结构的核酸3、病毒基因组有连续的也有不连续的4、病毒基因组的编码序列大于90%5、单倍体基因组除逆转录病毒外6、基因有连续的和间断的7、相关基因丛集病毒基因组核酸序列中功能相关的蛋白质基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。8、基因重叠同一段核酸序列能够编码2种或2种以上蛋白质。重叠基因虽然共用一段核酸序列,但转录成的mRNA链的读框不同,产生的蛋白质分子大不相同。SV40病毒基因组动物病毒中以SV40研究较多,由从恒河猴细胞分离。无包膜,直径45nm,双链环状DNA,DNA长5243bp。在自然界不引起疾病和肿瘤,当大量接种于免疫缺损动物或新生动物时,引起肿瘤发生。SV40基因编码两种抗原。原核基因组1、常仅由一条环状双链DNA分子组成2、只有一个复制起始点。3、具有操纵子(operon)结构。4、编码顺序一般不会重叠。5、基因是连续的,无内含子,转录后不需剪接。原核生物蛋白质因子——操纵子(operon)机制特异DNA序列编码序列启动序列操纵序列其他调节序列(promoter)(operator)6、编码区在基因组中所占比例(约为50%)远远大于真核基因组,小于病毒基因组。7、基因组中重复序列少。一般为单拷贝,但编码rRNA的基因往往是多拷贝。这主要是有利于核糖体的组装。8、具有编码同工酶的基因(isogene).9、细菌基因组中存在可移动的DNA序列,包括插入序列和转座子。10、在DNA分子中具有多种功能的识别区域。质粒(plasmid)质粒是细菌细胞内携带的染色体外的DNA分子,是共价闭合的环状DNA分子(covalentclosedcircularDNAcccDNA),大小在1~200kb,能独立进行复制。质粒“友好”地借居于宿主细胞内。靠宿主细胞才能完成自己的复制,而质粒对宿主细胞的生存不是必需的。质粒不是单纯的寄生,所携带的遗传信息能赋予细菌特定的遗传性状。质粒的分类按功能:R质粒:抗药性质粒F质粒(fertilityfactor):性质粒(sexplasmid)可决定细菌的性别Col质粒:大肠杆菌素质粒,合成大肠杆菌素,杀死不含大肠杆菌素质粒的亲缘细菌。根据质粒能否在细胞间进行传递:接合型质粒(conjugativeplasmid):如F质粒,雌雄细胞通过性纤毛相互接触而结合,质粒便从一个细胞传递给另一个细胞。非接合型质粒:按复制机理:严紧型质粒(stringentplasmid):即低拷贝数质粒松弛型质粒(relaxedplasmid):高拷贝数质粒。质粒的特性1、能自主复制。2、质粒的不相容性(incompatibility)两种亲缘关系密切的不同质粒不能共存于一个宿主菌。3、质粒可以转移。质粒DNApBR322EcoRⅠ、PstⅠ、HindⅢ、BamHⅠ、SalⅠ只有一个酶切位点,便于外源基因的插入。真核生物基因组1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。2.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小真核细胞基因转录产物为单顺反子。3.一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。。4.存在重复序列,重复次数可达百万次以上5.基因组中不编码的区域多于编码区域。6.断裂基因,大部分基因含有内含子,因此,基因是不连续的。原核生物与真核生物的基因组比较真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。原核生物的基因组基本上是单倍体,而真核基因组是二倍体。细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子,基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列。用复性动力学等实验表明有三类重复序列:①高度重复序列(highlyrepetitivesequences),这类序列一般较短,长10-300bp,在哺乳类基因组中重复106次左右,占基因组DNA序列总量的10-60%,人的基因组中这类序列约占20%,功能还不明了。②中度重复序列(moderatelyrepetitivesequences),这类序列多数长100-500bp,重复101-105次,占基因组10-40%。例如哺乳类中含量最多的一种称为Alu的序列,长约300bp,在哺乳类不同种属间相似,在基因组中重复3-×105次,在人的基因组中约占7%,功能也还不很清楚。在人的基因组中18S/28SrRNA基因重复280次,5SrRNA基因重复2000次,tRNA基因重复1300次,5种组蛋白的基因串连成簇重复30-40次,这些基因都可归入中度重复序列范围。③单拷贝序列(singlecopysequences)。这类序列基本上不重复,占哺乳类基因组的50-80%,在人基因组中约占65%。绝大多数真核生物为蛋白质编码的基因在单倍体基因组中都不重复,是单拷贝的基因。高度重复序列:高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快。在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。高度重复顺序又按其结构特点分为三种。(1)倒位(反向)重复序列这种重复顺序复性速度极快,即使在极稀的DNA浓度下,也能很快复性,因此又称零时复性部分,约占人基因组的5%。反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构。倒位重复(即两个互补拷贝)间可有一到几个核苷酸的间隔,也可以没有间隔。没有间隔的又称回文(palimdr-ome),这种结构约占所有倒位重复的三分之一。若以两个互补拷贝组成的倒位重复为一个单位,则倒位重复的单位约长300bp或略少。两个单位之间有一平均1.6kb的片段相隔,两对倒位重复单位之间的平均距离约12kb,亦即它们多数散布非群集于基因组中。(2)卫星DNA卫星DNA(satelliteDNA)是另一类高度重复序列,这类重复顺序的重复单位一般由2-10bp组成,成串排列。由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。在人细胞组中卫星DNA约占5-6%。按照它们的浮力密度不同,人的卫星DNA可分为Ⅰ、Ⅱ、Ⅲ、Ⅳ四种。果蝇的卫星DNA顺序已经搞清楚,可分为三类,这三类卫星DNA都是由7bp组成的高度重复顺序:卫星Ⅰ为5'ACAACT3',卫星Ⅱ为5'ACAAATT3'。而蟹的卫星DNA为只有AT两个碱基的重复顺序组成。(3)较复杂的重复单位组成的重复顺序这种重复顺序为灵长类所独有。用限制性内切酶HindⅢ消化非洲绿猴DNA,可以得到重复单位为172bp的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成。有人把这类称为α卫星DNA。而人的α卫星DNA更为复杂,含有多顺序家族。(4)高度重复顺序的功能a.参与复制水平的调节反向序列常存在于DNA复制起点区的附近。另外,许多反向重复序列是一些蛋白质(包括酶)和DNA的结合位点。b.参与基因表达的调控DNA的重复顺序可以转录到核内不均一RNA分子中,而有些反向重复顺序可以形成发夹结构,这对稳定RNA分子,免遭分解有重要作用.c.参与转位作用几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp到1400bp。由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。d.与进化有关不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。如人的α卫星DNA长度仅差1个碱基(前者为171bp,后者为172bp),而且碱基序列有65%是相同的,这表明它们来自共同的祖先。在进化中某些特殊区段保守的,而其他区域的碱基序列则累积着变化。e.同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹f.α卫星DNA成簇的分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。