基因组学元素周期表的发现奠定了二十世纪物理、化学研究和发展的基础元素周期表“基因组序列图”将奠定二十一世纪生命科学研究和生物产业发展的基础!“基因组”----生命科学的“元素周期表”人体解剖图奠定了现代医学发展的基础生命的奥秘蕴藏于“四字天书”之中…GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCATCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCTCCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTCGCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT…基因组学§1基因组学概述§2基因组图谱的构建§3基因组测序§4功能基因组学基因组学概念及范畴基因组(genome)是德国遗传学家H.Winkler在1920年将gene(基因)和chromosome(染色体)两个词缩合而创造的一个新词,意思是指染色体上的全部基因。几十年来,随着分子生物学的发展,其含义扩展为在个体水平代表一个个体所有遗传性状的总和,在细胞水平代表一个细胞所有不同染色体(单倍体)的总和,在分子水平代表一个物种所有DNA分子的总和。基因组学概述基因组(genome),又称染色体组一个物种单倍体的染色体数目,物种全部遗传信息的总和物种遗传信息的“总词典”控制发育的“总程序”生物进化历史的“总档案”基因组(genome)基因组(genome)是德国遗传学家H.Winkler在1920年将gene(基因)和chromosome(染色体)两个词缩合而创造的一个新词,意思是指染色体上的全部基因。几十年来,随着分子生物学的发展,其含义扩展为在个体水平代表一个个体所有遗传性状的总和,在细胞水平代表一个细胞所有不同染色体(单倍体)的总和,在分子水平代表一个物种所有DNA分子的总和。基因组学(genomics)就是发展和应用DNA制图、测序新技术以及计算机程序,分析生命体(包括人类)全部基因组结构及功能的科学。1986年提出,至今20年,已经发展成为遗传学中最重要的分支学科。对物种的所有基因进行定位、作图、测序和功能分析基因组学的基础理论研究基因组学是要揭示下述四种整合体系的相互关系:•基因组作为信息载体(碱基对、重复序列的整体守恒与局部不平衡的关系)•基因组作为遗传物质的整合体(基因作为功能和结构单位与遗传学机制的关系)•基因组作为生物化学分子的整合体(基因产物作为功能分子与分子、细胞机制的关系)•物种进化的整合体(物种在地理与大气环境中的自然选择)基因组学是一个大学科•“界门纲目科属种”,地球上现存物种近亿,所有生生灭灭的生物,无一例外,都有个基因组。•基因组作为信息载体,它所储存的信息是最基本的生物学信息之一;既是生命本质研究的出发点之一,又是生物信息的归宿。•基因组学研究包括对基因产物(转录子组和蛋白质组)的系统生物学研究。•基因多态性的规模化研究就是基因组多态性的研究。•基因组学的研究必然要上升到细胞机制、分子机制和系统生物学的水平。•基因组的起源与进化和物种的起源与进化一样是一个新的科学领域。•基因组信息正在以天文数字计算,规模化地积累,它的深入研究必将形成一个崭新的学科。基因组学是一门大科学•基因组的信息是用来发现和解释具有普遍意义的生命现象和它们的变化、内在规律、和相互关系。•基因组的信息含量高。基因组学的研究又在于基因组间的比较。•基因组学的复杂性必然导致多学科的引进和介入(各生物学科、医学、药学、计算机科学、化学、数学、物理学、电子工程学、考古学等)。•基因组学研究的手段和技术已经走在生命科学研究的最前沿。•基因组信息来自于高效率和规模化所产生的实验数据。•人类基因组计划证明了基因组研究的迫切性和可行性。基因组与生命之谜•基因组的产生与进化。•基因组DNA组分的变化、GC百分比、嘌呤:嘧啶守恒。•遗传密码的发生、发展和进化。•内含子(尤其是大于100,000核苷酸的大内含子)剪出后的运输和降解。•最小内含子的生物学意义。•动物基因组与植物基因组在基因分布上的共性和个性。•物种衍变过程中基因组水平的变化。•基因组大小变化与遗传、分子、细胞机制的关系。•“JUNKDNA”的发生、分类、进化与功能。基因组学研究的最终目标获得生物体全部基因组序列鉴定所有基因的功能明确基因之间的相互作用关系阐明基因组的进化规律经典遗传学在20世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。第二个环节:通过连锁分析确定新基因与已知基因的相互关系,绘制遗传连锁图。几个代表物种的基因组大小物种基因组大小/bpT4噬菌体2.0×105大肠杆菌(Escherichiacoli)4.2×106酵母(Sccharomycescerevisiae)1.5×107拟南芥(Arabidopsisthaliana)1.0×108秀丽小杆线虫(Caenorhbditiselagans)1.0×108果蝇(Drosophilamelanogaster)1.65×108水稻(Oryzasativa)3.89×108小白鼠(Musmusculus)3.0×109人类(Homosapiens)3.3×109玉米(Zeamays)5.4×109普通小麦(Triticumaestivum)1.6×1010基因组学的分类3基因组学(根据所研究的生物体种类分类)结构基因组学功能基因组学1基因组学(根据系统特征分类)2基因组学(根据与其它学科的关系分类)基因组绘制和测序基因和基因组组织基因组调节网络结构蛋白质结构特征转录组学蛋白组学代谢组学基础基因组学应用基因组学生化基因组学遗传基因组学进化基因组学生理基因组学计算基因组学生态基因组学工业基因组学农业基因组学环境基因组学医学基因组学植物基因组学动物基因组学人类基因组学微生物基因组学基因组学的研究内容结构基因组学功能基因组学蛋白质组学结构基因组学(structuralgenomics)基因定位基因组作图测定核苷酸序列功能基因组学(functionalgenomics)又称后基因组学(postgenomics)基因的识别、鉴定、克隆基因结构、功能及其相互关系基因表达调控的研究蛋白质组学(proteomics)鉴定蛋白质的产生过程、结构、功能和相互作用方式遗传学与基因组学的里程碑图中所示的螺旋展示了遗传学和基因组学重要进展的里程碑,从孟德尔遗传法则的发现和其在20世纪初被重新发现[1]开始。DNA被确立是遗传的物质基础[2]、DNA结构的确定[3]、遗传代码的阐明[4]、DNA重组技术的发展[5,6]、以及自动化程度日益提高的DNA测序技术的建立[7-10],为1990年启动人类基因组计划(HGP)奠定了基础研究功能基因组学的挑战阐释基因功能鉴别和表征生命的分子机构描绘基因调节网络系统水平上而非单个细胞水平上对生物系统的认识计算机上的挑战多学科协作基因组的进化(1)基因组大小的进化包括基因组的含量、基因组的结构以及基因的数量等几个方面。(2)基因组的分子进化DNA序列的进化:基因的不同区域进化速率不同。内含子中碱基对趋异进化速率大于外显子;编码序列中同义突变的进化速率大于非同义突变,非同义突变的进化速率最低。假基因的进化速率最高。多基因家族的进化:通过基因扩增和不均等交换形成多拷贝基因,在通过突变积累、基因重排和自然选择等因素形成多基因家族或新的基因。如珠蛋白基因家族的进化。外显子混编:来自不同基因的多个外显子相互连接,或基因内部的外显子重复。基因水平转移:遗传物质从一个物种通过各种方式转移到另一个物种的基因组中。如转化、转导、接合、转染等。范围和一般方法结构基因组学转录物组学蛋白质组学代谢物组学基因组学的发展历程年里程碑和事件参考文献1985-1988美国科学院和研究委员会讨论、辩论制定人类基因组计划(HGP)Albers,19981990人类基因组计划在美国正式开始Burris,19981995第一个自由存活生物,Haemophiusinfluenzae鸟枪法测序完成Fleischmann,19951996芽殖酵母测序完成——第一个真核生物基因组Goffeau,199619981998第一个多细胞生物秀丽线虫测序完毕微阵列和基因组学一起列入最高十项科学突破C.Elegans,1998新闻编委会,19982000全基因组鸟枪法完成果蝇的全基因组测序Adams,20002000美国前总统克林顿宣布即将完成的HGP是人类描绘最奇妙的图谱Marshall,20002000第一个模式植物拟南芥全基因组测序完成GenomeIntiative2001人类基因组序列草图的两个版本分别在nature和science上发表Venter,20012002两个水稻亚种基因组序列草图完成Yu,2002§2基因组图谱的构建基因组计划的主要任务是获得全基因组序列但是,现在的测序方法每次只能测800~1000bp大量的测序片段要拼接要知道序列在Chr上的位置才能正确拼接基因组计划的第一个环节:构建基因组图谱基因组图谱遗传图谱(geneticmap)物理图谱(physicalmap)遗传图谱(geneticmap)采用遗传分析的方法将基因或其它DNA序列标定在染色体上构建连锁图。遗传标记有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。构建遗传图谱就是寻找基因组不同位置上的特征标记。包括:形态标记细胞学标记生化标记DNA分子标记多态性(polymophism)所有的标记都必须具有多态性!花色:白色、红色株高:高、矮血型:A、B、O型淀粉:糯、非糯所有多态性都是基因突变的结果!形态标记形态性状:株高、颜色、白化症等又称表型标记数量少很多突变是致死的受环境、生育期等因素的影响最早建立的果蝇连锁图,就是利用控制果蝇眼睛的形状、颜色,躯体的颜色、翅膀的形状等形态性状作为标记,分析它们连锁关系及遗传距离,绘制而成的。控制性状的其实是基因,所以形态标记实质上就是基因标记。果蝇连锁图细胞学标记明确显示遗传多态性的染色体结构特征和数量特征染色体的核型染色体的带型染色体的结构变异染色体的数目变异优点:不受环境影响缺点:数量少、费力、费时、对生物体的生长发育不利生化标记又称蛋白质标记就是利用蛋白质的多态性作为遗传标记。如:同工酶、贮藏蛋白优点:数量较多,受环境影响小缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息DNA分子标记简称分子标记以DNA序列的多态性作为遗传标记优点:不受时间和环境的限制遍布整个基因组,数量无限不影响性状表达自然存在的变异丰富,多态性好共显性,能鉴别纯合体和杂合体限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)DNA序列能或不能被某一酶酶切,相当于一对等位基因的差异。如有两个DNA分子(一对染色体),一个具有某一种酶的酶切位点,而另一个没有这个位点,酶切后形成的DNA片段长度就有差异,即多态性。可将RFLP作为标记,定位在基因组中某一位置上。人类基因组中有105个RFLP位点,每一位点只有两个等位基因。RFLP分析RFLP标记位共显性标记微卫星(microsatellite)标记微卫星又称为简单重复序列(simplesequencerepeat,SSR)。这种重复序列的重复单位很短,常常只有2个、3个或4个核苷酸如一条染色体TCTGAGAGAGACGC另一染色体TCTGAGAGAGAGAGAGAGACGC,就构成了多态性。遗传图谱的构建方法理论基础:连锁与交换基本方法:两点测验法和三点测验法植物遗传图谱的构建选择研究材料(亲本)构建分离群体遗传标记检测标记间的连锁分析选择亲本要求亲缘关系远,遗传差异大但又不能相差太大以导致引起子