第一章人类基因和基因组HumanGeneandgenome1.基因的化学本质(Chemicalcomposition)2.基因组的组成(humangenome)3.割裂基因的结构及表达(splitgene)4.人类基因组计划(HGP)Page15第一节基因的概念基因(gene)是具有特定遗传效应的DNA片段。基因决定细胞内RNA和蛋白质或酶的合成,从而决定生物的遗传性状基因的修饰如DNA甲基化(DNAmethylation)和组蛋白乙酰化也可能导致基因的活性发生改变,使基因决定的表型出现变化,且可传递少数世代。通过有丝分裂(mitosis)或减数分裂(meiosis)来传递非DNA序列信息的现象表观遗传(epigeneticinheritance)Page16第二节基因的化学本质基因化学本质是DNA,仅含RNA的病毒,RNA是遗传物质Page17第三节人类基因组的结构1Mb(兆碱基对)=1000kb(千碱基对)=1000,000bp(碱基对)核基因组=3000Mb=3.0×106kp=3.0×109bp核基因组是指人类体细胞中24条DNA的全部遗传信息线粒体基因组=16569bp≈16.6kb人类基因组(genome)是人体所有遗传信息的总和,包括核基因组(nucleargenome)和线粒体基因组(mitochondrialgenome)3.0×109bp16569bp37个基因2.1万个结构基因13种与细胞氧化磷酸化相关多肽链一、基因的分类(重点)1.单一基因(solitarygene)2.基因家族(genefamily)⑴基因簇(genecluster)⑵超基因家族(genesuperfamily)3.假基因(pseudogene)4.串联重复基因(tandemrepetitivesequence)2.基因家族(genefamily):基因组中功能相似的基因成簇地排在一起。这些基因可同时发挥作用也可在不同发育阶段表达,基因家族的类型有两种:1.单一基因(solitarygene):在单倍体基因组中只有一份。⑴基因簇(genecluster):基因家族成员成簇地排列在同一条染色体上,同时或差次表达的蛋白质在功能上相关。⑵超基因家族(genesuperfamily):基因家族的不同成员成簇地分布在不同对的染色体上,编码的蛋白质在功能上相同或紧密相关。例:人类类α珠蛋白基因簇位于16p13,含1个ζ基因、2个α基因和2个假基因(ψζ和ψα)ζ—zetaΨ—psai例:人类类β珠蛋白基因簇位于11p15,含5个功能基因(ε、Gγ、Aγ、δ、β)1个假基因(ψβ)ε—epsilonδ—deltaζ—zetaΨ—psaiβ基因簇(11p15)α基因簇(16p13)例:人类珠蛋白超基因家族的成员分布在16号和11号染色体上,共同构成珠蛋白超基因家族ζ—zetaΨ—psaiε—epsilonδ—delta3.假基因(pseudogene):基因序列与具有编码功能的基因序列类似但不能表达基因产物的基因。例Ψα是类α珠蛋白基因簇中的假基因,其编码顺序与α基因相似ζ—zetaΨ—psaiε—epsilonδ—delta4.串联重复基因(tandemrepetitivesequence):45SrRNA、5SrRNA以及各种tRNA基因呈串联重复排列,编码同一种或近乎同一种的RNA或蛋白质,他们的每个拷贝完全或几乎相同,但基因间间隔DNA(linkerDNA)相差很大每个单倍体基因组有200个rRNA基因,串联排列在5条染色体的核仁组织者上。rRNA基因(rDNA)是染色体上伸出的DNA袢环rRNA基因串联排列在核仁组织者上高速转录产生rRNA组织核仁DNA环袢rRNA基因㈠单拷贝序列(uniquesequence):在基因组中仅单一拷贝或少数拷贝,长度在800~1000bp。编码蛋白质和酶的结构基因只是单拷贝中的很小部分。单拷贝或低拷贝DNA序列占人基因组的45%二、基因组的组成非基因序列也有单拷贝序列㈡重复多拷贝序列(repetitivesequence)指在基因组中重复出现的DNA序列,分散穿插于整个基因组占人类基因组的55%。1.串联重复:约占基因组的10%,主要有卫星DNA、小卫星DNA和微卫星DNA。2.散在重复:约占基因组的45%,有短散在重复元件(SINE)和长散在重复元件(LINE)。占人类基因组10%%重复单位重复次数拷贝数重复长度备注串联重复序列卫星DNAsatelliteDNA5bp10bp20bp200bp串联重复很多次几百kb着丝粒染色体异染色质区端粒-TTAGGG-重复250~1500次小卫星DNAminisateliiteDNA可变数目串联重复variablenumberoftandemrepeat,VNTR15~100bp富含GC20~50次0.1~20kb短DNA微卫星DNAmicro-satelliteDNA短串联重复序列shorttandemrepeat,STR1~6bp(CA)n(TG)n(CCG)n(CGG)n多态性多态性小于100bp多态遗传标志(polymorphism)占人类基因组45%重复长度重复次数(拷贝数)散在重复序列短散在重复元件(SINE)Shortinterspersednuclearelement100~500bp106以上长散在重复元件(LINE)longinterspersednuclearelement6000~7000bp102~104如D5S8185’GGGTGATTTTCCTTTTGGTAGATAGATAGATAGATAGATAGATAGATTGTGGCTATGATTGGAATCA3’(重复7次)5’GGGTGATTTTCCTTTTGGTAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATAGATTGTGGCTATGATTGGAATCA3’(重复14次)具有广泛的多态性,适合于记录短期的进化事件微卫星DNA即短串联重复序列(STR,Shorttandemrepeats)微卫星DNA与亲子鉴定(parentagetest)亲子鉴定的样本1、血液2、精液3、口腔黏膜細胞4、毛发(毛囊)5、怀孕期胎盘组织(CVS):怀孕10~13周內抽羊水:怀孕14~24周內6、脐带血液孩子出世时收集脐带血液样本Page20第四节基因的生物学特性一、DNA分子蕴藏的遗传信息一个DNA分子有n个碱基,就有4n种排列序列。在DNA分子长链上,四种碱基以三联体(triplet)形式组合成43=64种遗传密码(geneticcode),61种编码20种氨基酸,3种终止密码子。遗传信息以不同的碱基编码和排列次序贮藏在DNA序列中DNA3’CCATACAAACTAGGGCAGCAGTTGGGGACAATC5’mRNA5’GGUAUGUUUGAUCCCGUCGUCAACCCCUGUUAG3’多肽链-甲硫氨酸-苯丙氨酸-天冬-脯-缬-缬-天酰-脯-半胱起始密码↓GTAG剪切信号终止密码真核生物的结构基因是割裂基因(splitgene),外显子(exon)编码序列被内含子(intron)非编码序列分割。第一个外显子的上游和最末一个外显子的下游是非编码区为侧翼序列(flankingsequence)二、基因表达(geneexpression)转录起始点转录终止点内含子内含子侧翼顺序侧翼顺序增强子启动子终止子与RNA聚合酶结合控制转录频率CAAT框TATA框与RNA聚合酶结合识别转录起点RNA裂解信号GC框增强转录效率GC框增强转录效率外显子GT-----AG外显子GT-----AG外显子AATAAA回文顺序编码区GT-AG法则:外显子和内含子接头区是高度保守序列(consensusseqence)5′端GT-AG3′端是基因表达时剪切内含子和拼接外显子的剪接识别信号侧翼序列(flankingsequence):每个基因5′端和3′端的两侧是一段不转录的DNA序列,5′端启动子、增强子;3′端终止子等,调控基因表达5′3′5′3′转录起始点转录终止点内含子内含子侧翼顺序侧翼顺序增强子启动子终止子与RNA聚合酶结合控制转录频率CAAT框TATA框与RNA聚合酶结合识别转录起点RNA裂解信号GC框增强转录效率GC框增强转录效率外显子GT-----AG外显子GT-----AG外显子AATAAA回文顺序编码区启动子(promoter):位于基因转录起始点上游100~200bp范围能与转录因子结合,启动基因转录。增强子(enhancer):位于转录起始点的上游或下游,能特异性地与转录因子结合、增强基因转录活性的一段DNA序列。终止子(terminator):由AATAAA和回文序列组成,AATAAA是多聚腺苷酸(polyA)附加信号。回文序列转录后形成发夹结构,阻碍RNA聚合酶的移动而终止转录。5′3′5′3′3′5′模板链,反编码链,反义链5′3′非模板链,编码链,有义链1、转录(transcription)在RNA聚合酶的催化下,以DNA的3′→5′单链(反编码链)为模板,按照碱基互补配对原则(A=U,C三G)进行转录转录起始点转录终止点内含子内含子侧翼顺序侧翼顺序增强子启动子终止子与RNA聚合酶结合控制转录频率CAAT框TATA框与RNA聚合酶结合识别转录起点RNA裂解信号GC框增强转录效率GC框增强转录效率外显子GT-----AG外显子GT-----AG外显子AATAAA回文顺序编码区5′3′5′3′内含子内含子RNA裂解信号外显子GU-----AG外显子GU-----AG外显子AAUAAA发夹结构3′5′转录的RNA称核内异质RNA(hnRNA)含外显子、内含子和部分侧翼顺序。hnRNA要经过剪接、戴帽和加尾等加工过程才能形成成熟的mRNAhnRNA⑴戴帽(capping):在hnRNA的5′端加一个7-甲基鸟苷酸(7-甲基鸟嘌呤核苷酸),封闭RNA5′端保护转录本被核酸酶消化,利于mRNA从细胞核运到细胞质,有助于胞质中的核糖体识别mRNA内含子内含子RNA裂解信号外显子GU-----AG外显子GU-----AG外显子AAUAAA发夹结构3′5′hnRNAm7GpppN…⑵加尾(tailing):在3′端AAUAAA下游15~30bp部位切除一段序列后,在polyA聚合酶催化下,加上200个左右多聚腺苷酸polyA的尾封闭RNA3′端AAAAA-Poly(A)内含子内含子RNA裂解信号外显子GU-----AG外显子GU-----AG外显子AAUAAA3′5′hnRNAm7GpppN…⑶剪接(splicing):剪接酶将内含子切除,连接酶将外显子拼接形成成熟的mRNA分子。GT-AG序列是剪接识别并切割的位点3′5′GU-----AG外显子和内含子在结构基因的表达过程中可发生转换。选择性剪接:同一基因中,其剪接位点和拼接方式可以改变,从而导致一个基因产生多个具有明显差异的相关蛋白产物例:降钙素基因在不同的细胞中产生不同的激素2、翻译(translation):以mRNA为模板合成蛋白质的过程。蛋白质分子的空间结构由翻译后修饰决定Page24第五节人类基因组计划(humangenomeproject,HGP)一、HGP的启动1985年,美国生物学家诺贝尔奖获得者RenatoDulbecco在《Science》上发表文章首次提出人类基因组计划的设想,并建议组织国家级和国际级的项目进行研究。1988年4月国际人类基因组织(HUGO)成立。1990年10月由美国国会批准正式启动HGP,预计用15年时间,投入30亿美元完成HGP。逐渐地HGP扩展为多国协作计划。继美英日法德之后,我国于1993年加入HGP,承担其中1%的任务,即人类3号染色体短臂上约30Mb区域的测序。2000年6月26日人基因组框架图完成,美2001年《自然》、《科学》杂志报道了人基因组的完整序列图2004年10月国际人类基因组计划合作组织在《Nature》杂志上宣布误差小于10万