Genome一词是1920年Winkles从基因Gene和染色体chromosome铸成的。单倍体细胞中的全套染色体为一个基因组。定义:细胞中单倍体遗传物质的总和称为基因组。基因组又称为染色体组。研究基因组Genome核基因组Nucleargenome线粒体基因组Mitochondrialgenomes基因组与C值C值(Cvalue):基因组大小称为C值。指生物体的单倍体基因组所含DNA总量。DNA含量越大C值越高。每种生物各有其特定的C值,一般是恒定的。不同物种的C值之间有很大差别。不同生物基因组大小(C值)注:基因组的长度由公式10bp=3.4nm计算出C值与C值矛盾C值和生物结构或组成的复杂性不一致的现象称为C值悖论(C-valueparadox)。两栖类动物,例如两栖鲵的C值是84,其c值竟然比包括人类(3.2)在内的哺乳类的c值还高近30倍。牛与人的DNA含量相等。而豌豆与蚕豆均属豆科,又都有12条染色体,可是DNA含量却相差7倍基因组DNA含量与物种形态复杂性并不对应N值与N值矛盾N值(Nvalue):生物体所含有的基因数目N值矛盾:(Nvalueparadox)处于不同进化阶梯,复杂性不同的生物种属所具有的基因数目与其结构的复杂性不成比例的现象。原核、真核生物与病毒基因组特征DNA分子片段大小的单位有:bp、kb、mb等。最常用的就是bp和kb。bp:basepair,碱基对kb:kilo-basepair千碱基对,即1000碱基对mb:mega-basepair百万碱基对一、原核生物基因组Prokaryoticgenome原核生物是细菌、放线菌、衣原体、支原体和蓝细菌等比较原始的生物的总称.一、原核生物基因组结构和特点原核生物基因组几乎没有浪费的空间1.单一染色体、单一DNA复制起点,基因数量较少.平均1个Mb含950个基因。一个自由存活的原核细胞需要的最少基因数是为265-350个基因2.功能相似的基因往往定位在同一区域。操纵子是原核生物基因组的特征。3.多为单拷贝基因(单一顺序基因)Mostofthemaresinglecopygene(singleordersequence).4.绝大多数基因都是可表达的,非表达基因少.Massofthemareexpressional,fewofnon-expressionalgene5.转录产物为多顺反子mRNA(polycistronicmRNA).6.编码顺序一般不重叠Generallydonotoverlapcodingsequence7.基因序列是连续的,无内含子。Thesequenceareuninterruptedandnointronsremainingenes.大肠杆菌K12基因组大肠杆菌基因组一段50kb片段(少量插入序列(IS).IS1、IS186是可移动元件)嗜热菌基因组中一个典型的操纵子大肠杆菌色氨酸操纵子二、真核生物基因组真核生物是核质与细胞质之间存在核膜的生物的总称。Eukaryotesaredefinedbytheirpossessionofkaryothecaenclosingnucleus•真核生物由真核细胞构成。Mosteukaryotesconsistofcomplicatedmulti-cellorganism真核基因组特点characters1.多个染色体(酵母除外),基因数相对较多,在染色体上分布不均匀。染色体数目是生物物种的特征性标志之一不同的真核生物基因组大小拟南芥最大染色体上基因密度2、功能相关的基因大多分散在不同的染色体上。即使成簇排列也不存在操纵子结构。转录产物为单顺反子。3、非编码顺序(NCS)远远多于编码顺序。noncodingsequence(NCS)areexcessivetocodingsequence酵母、果蝇和人基因组的紧凑性4、含有大量重复顺序。所谓重复顺序是指在基因组中多次反复出现的DNA序列。高度重复顺序(重复频率105,中度重复10-104。人、酵母、果蝇和玉米基因组比较5、真核基因是断裂基因(splitgene)ExonisDNAsequenceencodingprotein1977年Broker和Sharp等人对真核生物基因结构的研究发现了断裂基因,使基因的概念发生了演绎,一系列的研究证实大部分真核生物的结构基因是断裂基因。至此,基因的本质、功能及结构才逐渐为人们所认识。6.相关的基因构成各种基因家族(Genefamily)基因家族指核苷酸序列或编码产物的结构具有一定相似性的一组基因。提示有共同的进化起源假基因Pseudogene:类似于基因但不表达的DNA序列。不表现任何功能,是基因的退化形式。假基因和其他进化遗迹人α和β珠蛋白基因簇含5个假基因三、病毒基因组viralgenome病毒种类很多,人们更关注感染细菌的病毒和真核病毒病毒基因组类型(typesofviralgenome)1.双链DNA(doublestrandedDNAdsDNA)2、单链DNA(singlestrandedDNAssDNA)3、双链RNA(doublestrandedRNAdsRNA)4、单链负股RNA(singleminusstrandedDNA,ss-RNA)5、单链正股RNA(singleplusstrandedRNAss+RNA)6、双链DNA并有RNA中间体(doublestrandedDNAwithRNAintermediate)7、正股RNA并有DNA中间体(plusstrandedRNAwithDNAintermediate)乙肝病毒(HBV)乙肝病毒(HBV)的基因组DNA结构很奇特,是一环状的部分双螺旋结构,长约3.2kb。其中的2/3为双螺旋结构,1/3为单链。含有HBV逆转录酶HBV含4个部分重叠的开放读码框(ORF),即前S/S区、前C/C区、P区和X区HIV是1983年法国巴斯德研究所LucMontagnier等分离出的逆转录病毒的RNA病毒,电镜下病毒内部有核心是由两条相同单股RNA构成,双体结构及包裹其外的衣壳蛋白组成。HIV基因组全长约9200bp,其5′端与3′端各有一段相同核苷酸序列,称为长末端重复序列(longterminalrepeat,LTR)。中间为gag、pol、env三个结构基因及tat等6个调节基因病毒基因组的特点(characteristicofviralgenome)1.基因组小,结构简单。但不同病毒基因组相差甚大Genomeissmallandstructureissimple.Thereisquitevariantindifferentviralgenome乙肝病毒:3.2kb,几种蛋白质痘病毒:300kb,几百种蛋白质。2基因组由DNA或RNA组成genomeconsistsofDNAorRNA双链或单链doublestrandorsinglestrand环形或线形annuliformorfilate3、基因重叠多见Mostofthemareoverlappinggene完全重叠completelyoverlapping部分重叠partialoverlappingGeneticmapofbacteriophagex174重叠基因(overlappinggene)是指两个或两个以上的基因共有一段DNA序列,或是指一段DNA序列成为两个或两个以上基因的组成部分。ThetermoverlappinggenemeanstwoorovertwogenesownasegmentDNAsequence,orasegmentDNAsequenceiscomposedoftwoorovertwogenes4、重复顺序少littlerepetitivesequence5、非编码区少,编码区多(大于90%)littlenoncodingregion,Muchcodingregion(exceed90%)6、除逆转录病毒基因组有两个拷贝外,其它都是单倍体Exceptretrovirusgenomewhichhastwocopies,othersarehaploids可以移动的遗传与元件一些RNA和DNA病毒还可将基因组整合到真核生物染色体中,如病毒逆转录元件。可以在基因组转座,但不能从细胞中逃逸DNA序列。真核生物和一部分原核生物基因组中存在有散在的重复序列,全基因分布模式是由于转座引起(内源逆转录病毒)。人类基因组稳定性不同民族、群体、个体具有相同数目的染色体,相同数量的基因,相同的基因分布以及基本相同的核苷酸顺序。Stability:Differentnations,folksandindividualshavethesamenumberofchromosomeandgene,thesamedistributionofgene,andbasicallythesamenucleotideacidsequence基因组稳定性与多样性多样性长期进化过程中基因组的变异产生多样性。Polymorphism:Mutationofgenomeresultingenomicpolymorphisminlongevolution.种族多样性种族又称做人种,是在体质形态上具有某些共同遗传特征的人群族群多样性族群在民族学中指地理上靠近、语言上相近、血统同源、文化同源的一些民族的集合体,也称族团个体多样性一般指一个人或是一个群体中的特定主体。每一只动物、一颗植物、甚至一个能以单细胞生存的生命形式都可称为单一个体。1、人细胞核单倍体基因组DNA含量3×109(30亿bp),约3万个编码基因。出人意料,仅比果蝇多1.3万,人有鼠没有的基因只有300个。人基因组结构分析如此少的基因数目,而能产生如此复杂的功能,说明基因组的大小和基因的数量在生命进化上可能不具有特别重大的意义,也说明人类的基因较其他生物体更‘有效’,人类某些基因的功能和控制蛋白质产生的能力与其他生物的不同?这将对我们目前的许多观念产生重大的挑战。其他包括蛋白质折叠、免疫应答、生化转运等。2、目前已经发现和定位了26000多个功能基因,,在已知基因中酶占10.28%,核酸酶占7.5%,信号传导占12.2%,转录因子占6.0%,信号分子占1.2%,受体分子占5.3%,选择性调节分子占3.2%,等。发现并了解这些功能基因的作用对于基因功能和新药的筛选都具有重要的意义。已确认的人类蛋白质编码基因分类3、基因组中非编码基因占90%以上;大量重复序列使得对“垃圾基因”的重新认识;基因组研究的结果,使分子生物学家越来越不敢自信宣布,基因组哪个部分是不重要的。因目前不知道它们的潜在功能是什么。两种类型的重复DNA4、基因在染色体上的分布存在“热点”和“荒漠”。基因密度在17、19、22号染色体上最高,X、Y、4和18、13号染色体相对贫瘠。基因组约1/4的区域没有基因片段。135.人类99.9%的基因密码是相同的,人与人之间的变异为万分之一。从而说明人类不同“种属”之间并没有本质上的区别。6、人类单核苷酸多态性的比例约为1/1250bp,发现了大约一百四十万个单核苷酸多态性,并进行了精确的定位,初步确定了30多种致病基因。7、男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。所以,可能男性在人类的遗传中起着更重要的作用。(Y染色体从3亿年前包含有1500个基因,退化到现在只掌管几十个基因,给人的感觉就像是“风烛残年”的老人。一向被认为很脆弱的性染色体的自我保护能力比人们想象的更强。2003年06月19日出版的英国《自然》杂志报告说,Y染色体内部存在一种独特的结构,使它能够自我修复有害的基因变异。新的科学发现却为Y染色体迎来了新的春天)8、人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的。可能是在我们人类的免疫防御系统建立起来前,寄生于机体中的细菌在共生过程中发生了与人类