第八章基因组学和后基因组时代研究热点•MolecularBiologyCourse第一节基因组和基因组学第二节蛋白组学第三节代谢组学第四节人类元基因组计划本章内容安排重点掌握:HGP计划的进展及重要意义;鸟枪法序列分析技术;HapMap计划内容;人类元基因组计划基因组、基因组学、蛋白质组、蛋白组学及代谢组学概念及进展基因研究是20世纪生命科学的主线★20世纪的上半叶,以遗传学为代表,生命科学通过对基因分离、独立分配、连锁及化学属性等的研究,最后以作为遗传信息载体的DNA双螺旋结构的提出而告捷。★20世纪下半叶,以分子生物学为代表,生命科学通过对基因复制、转录、翻译及遗传密码的分析与破译,最终以统一生命世界各层次,生命科学各分支的“中心法则”的问世而集成。★20世纪90年代,随着全球基因组计划,尤其是人类基因组计划(HGP)规模空前、速度惊人的推进,基因研究已接近“登峰造极”,人类对生命世界的理性认识达到了前所未有的深度与广度。第一节基因组和基因组学(GenomeandGenomics)1.1基因组(Genome):基因组一词是从genes和chromosomes合成而来,用来描述生物的全部基因和染色体组成的概念。★1986年,美国科学家ThomasRoderick首先提出了基因组学(genomics)的概念。指对所有基因进行基因组作图(包括遗传图谱,物理图谱和转录图谱),核苷酸序列分析,基因定位和基因功能分析。★基因组学应该包括两方面内容:以全基因组测序为目标的结构基因组学(structuralgenomics)和以基因功能鉴定为目标的功能基因组学(functionalgenomics),后者又称后基因组研究(post-genome).1986年3月7日,美国科学家、诺贝尔奖获得者、肿瘤病毒专家雷托·杜伯克在美国《科学》杂志上发表了一篇题为《癌症研究的转折点—人类基因组的全序列分析》的短文,提出有关分析人类基因组全序列的重要科学构想。杜伯克在这篇文章后来被称为“人类基因组计划课题标书”,成为日后国际人类基因组计划启动和实施的重要推动力。经过反复讨论,数易其稿,1990年美国国会正式批准了人类基因组计划。1.2人类基因组计划(humangenomeproject,HGP)★1990年十月,国际人类基因组计划启动,美、英、日、法、德、中六国相继加入其中。计划用15年时间、30亿美元的经费,测定大约30亿碱基对的DNA序列和识别其中所有的基因。中国完成1%的任务。★HGP的本质是对人类基因组进行作图和序列测定,旨在破译人类所有的遗传信息。In1998,CraigVenter挑战国际人类基因组计划GREATEXPECTATIONS26thJUNE2000Thefullysequencedhumangenome:Withoutadoubtthisisthemostimportantandmostwondrousmapeverproducedbymankind.Thiswillsymbolisethestartofaneweraofmedicaltreatmentanddiagnosiswhichwillhaveaprofoundeffectonhumankindforcenturiestocome.★2001年2月12日,美,日,德,法,英,中六国科学家和美国赛莱拉公司联合公布了人类基因组图谱(草图)及初步分析结果.文特尔小组所做的人类基因组测序报告发表在《科学》杂志上(99%),科林斯带领的公共资金支持的实验室联合体的报告同时发表在《自然》杂志上(85%)—两个研究组织同时公开他们的研究成果,但不是联合研究的成果。私人公司公开与公共研究机构叫板,最后与对手一起站在领奖台上。ShotgunsequencingdeterminatethegenomesequenceofHaemophilusinfluenzae(H.influenzae)“鸟枪法”测定流感嗜血杆菌(H.influenzae)基因组步骤将1.8Mb的基因组DNA剪成很多随机片段,平均长度1kb;将这些片段重组克隆到质粒DNA载体;从单个重组DNA菌落中制备DNA;双脱氧法测序;用计算机程序对所测序列组装。MechanismofDNAshotgunsequencingSequencingStrategyofHumangenome★人类基因组精细序列图于2003年4月23日宣告完成,完成,但其中大量基因的结构和功能尚不清楚。★与人类同步进行基因组测序的模式生物有:大肠埃希菌、酵母、线虫、果蝇、小鼠、拟南芥及一些与人类关系密切的哺乳动物。Yeastisthefirstsingle-cellulareukaryotesequenced(1996),酵母是第一个完成测序的单细胞真核生物(1996),Elegansisthefirstmulticellularorganismssequenced(1998),线虫是第一个完成测序的多细胞生物(1998)。其他生物基因组的研究狗2003.9玉米200310蜜蜂2004.1小鼠(Musmusculus)2004.10腔棘鱼2004.11稻瘟病菌(MagnaportheGrisea)2005.4海藻栽培品种——坛紫菜2005.4变形虫“阿米巴”(Dictyosteliumdiscoideum)2005.5Sino-DanishPigGenomeProject2005.6黑猩猩2005.9牛的全基因组2006.8石油去污菌的基因组2006.8聚羟基脂肪酸酯类(Polyhydroxyalkanoates,PHAs)产生菌富养罗尔斯通氏菌(RalstoniaeutrophaH16)基因组2006.915种小鼠品系2006.10黑曲霉基因组测序2007.2Syntrophusaciditrophicus一种极端厌氧菌基因组2007.4恒河猴2007.4第一张马基因组图谱草图公布一种灰色短尾负鼠(Monodelphisdomestica)的基因组,首个有袋动物基因组家猫基因组测序完成九种灵长类动物分别为黑猩猩、大猩猩、倭黑猩猩、猩猩、长臂猿、短尾猿、狒狒、狨和狐猴。屠志坚等人参与完成伊蚊基因组测序工作葡萄基因组测定完成阿联酋生技中心将测序海枣基因组烟草基因组计划抗药TB(结核杆菌)基因组序列公布黑曲霉基因组测序计划完成人类基因组差异图谱:在美国《科学》杂志评出的今年十大科学进展中,有关“人类基因组差异”的研究被列为年度最重要的科学进展。人类DNA碱基对因人而异,差异约为0.1%。这种差异使人有可能患癌症等疾病,而且会影响药物的疗效。DNA双螺旋结构发现者之一的詹姆斯·沃森成为世界上首个拥有这种图谱的人。比较基因组学(ComparativeGenomics):是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。国际人类基因组单体型图计划(Theinternationalhumangenomehaplotypemapproject,HapMapproject)是描述人类基因组中最常见差异(SNP)的图谱,将大大促进疾病和人类进化的研究。启动于2002年10月29日,由加拿大、日本、尼日利亚、中国、英国和美国六国11个研究中心的科学家共同承担。其中,美国完成31%,日本完成25%,英国完成24%,加拿大完成10%,中国完成10%的任务。此外,亚、非、欧裔各提供90份样本。除了上世纪80年代在美国采集的欧裔样本,亚裔样本由中国和日本各提供一半,非裔样本由尼日利亚提供。全部血样品送到美国国立卫生院下属的人类遗传细胞存储中心,转化成细胞株后统一提取成DNA分送至各参加中心进行SNP分型检定。中国承担的具体研究任务是3号、21号和8号染色体短臂单体型图的绘制,以及提供45份亚裔样品。该计划“中国卷”的实施得到科技部、中国科学院、香港创新科技署和香港大学教育资助委员会的高度重视,2002年列入科技部“十五”国家重大科技攻关项目,拨款5000万元。同时香港特区政府对参与HapMap“中国卷”的三所香港大学给予资助。2003年3月,中华单体型图协作组在北京成立。中科院北京基因组研究所所长杨焕明博士任主席。从美国得州大学休斯顿医学院回国,在基因组研究所担任SNP研究项目的首席科学家及科研部部长的曾长青博士被委以重任,负责国际“人类基因组单体型图”计划的“中国卷”的实施与协调。中科院北京基因组研究所负责3号染色体的大部分及其8号染色体短臂,约占整个基因组长度的6%。香港小组的港大平台负责3号染色体短臂的70MB的一段区域,约占整个基因组的2.5%。国家人类基因组南方中心负责21号染色体的HapMap构建,占整个基因组的1.1%。Nature:“Andnowfortheproteome”(409:747,2001)Science:“Proteomicsingenomeland”(291:1221,2001)第二节蛋白质组学(Proteomics)蛋白质组(proteome):根据WilkinsMr等的定义,Proteome一词源于PROTEin与genOME的杂合,意指一种基因组所表达的全套蛋白质;Swinbanks则指出proteome代表一完整生物的全套蛋白质;KahnP则认为proteome反映不同细胞的不同蛋白质组合。由此可见,proteome的含义:一个基因组、一种生物或一种细胞/组织所表达的全套蛋白质。WhatareProteomics?„StudyoftheProteome“„proteincomplementofthegenomeinacell,tissueororganism“•proteinscanbealternativelysplicedand/orpost-translationallymodified(PTMs)GenomeProteomeCell-specificexpressionstressdrugsMetabolicstateCultureconditions蛋白质组研究的开端Proteome一词由MareWilkins于1994年在意大利Siena的一次2-DE会议上首次提出。1995年,悉尼大学HumpherySmithI实验室与Williams等4家实验室合作,对至今已知最小的自我复制生物Mycoplasmagenitalium(一种支原体)进行了蛋白质成分的大规模分离与鉴定,并在文献中首次公开使用“proteome”一词。Thesmallestgenome:Mycoplasmagenitaium★1995年,分离和鉴定了一种最小的能自我复制的生物Mycoplasmagenitaium(580kb,468ORFs)的全部蛋白质,并首次提出蛋白质组(Proteome)的概念。一个独立生存的细胞生命至少需要多少个基因和表达蛋白?蛋白质组研究的重要历史事件★1994年,MarcWilkins最早提出了蛋白质组(Proteomics)的概念。★1995年,悉尼大学HumpherySmith实验室与Willams等四家实验室共同分离与鉴定Mycoplasmagenitaium的蛋白质组,“Proteome”首次出现。(Electrophoresis,1995,16:1090-4)★2001年,国际人类蛋白质组组织(HumanProteomeOrganization,HUPO)宣告成立。★2002年,第一次国际人类蛋白质组大会召开。“人类血浆蛋白质组计划(HumanPlasmaProteomeProject,HPPP)”和人类肝脏蛋白质组计划(HumanLiverProteomeProject,HLPP)首批执行计划启动。ElevenHUPO-