人类基因组计划摘要:综述了人类基因组计划的主要研究内容、研究历程和成果、人类基因组计划的研究对人类社会的意义以及我国人类基因组研究的概况等。关键词:人类基因组计划研究进展成果后基因组学人类基因组计划(humangenomeproject,HGP)是由美国科学家于1985年率先提出,1986年,诺贝尔奖得主杜尔贝科(RenatoDulbecco)在《科学》周刊撰文回顾肿瘤研究的进展,指出要么依旧采用“零敲碎打”的策略,要么从整体上研究和分析人类基因组。[1.DulbeccoR.Aturningpointincancerresearch:sequencingthehumangenume[J].Science,1986,231:1055—1056.]1990年10月,美国政府正式启动了HGP工程,投资30亿美元,预期于2005年完成人类基因组约30亿个碱基对的全序列测定。美国、英国、法兰西共和国、德意志联邦共和国、日本国和中国科学家共同参与了这一价值达30亿美元的人类基因组计划,6国科学家组成的国际人类基因组中心主要研究比例如表1。这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。与曼哈顿计划和阿波罗计划并称为三大科学计划。表1六国科学家组成的国际人类基因组中心主要研究比例:国家研究中心贡献率美国WASH&MIT等7家研究中心54%。英国SANGER一家研究中心33%日本RIKEN等两家研究中心7%法国GENOSCOPE研究中心2.8%。德国IMB等3家研究中心2.2%中国北京华大研究中心、国家南北方基因研究中心等三家1%1.研究内容1993年马里兰州Hunt,Valley会议上,经美国人类基因组研究中心(CHGR)修订后的HGP内容[[2]CollinsFS,GalasD.Anewfive-yearplanfortheU.S.HunanGenomeProject[J].Science,1993,262:43—46.]包括:人类基因组作图及序列分析;基因的鉴定;基因组研究技术的建立、创新与改进;模式生物(主要包括大肠杆菌、酵母、果蝇、线虫、小鼠、水稻、拟南芥等)基因组的作图和测序;信息系统的建立,信息的储存、处理及相应的软件开发;与人类基因组相关的伦理学、法学和社会影响与结果的研究;研究人员的培训;技术转让及产业开发;研究计划的外延等几方面,这些内容构成了20世纪到21世纪最大的系统工程[3李晋楠.人类基因组计划研究进展综述[J].浙江师大学报(自然科学版),1999,22(3):69—72.].总之,HGP的主要任务是人类的DNA测序,主要包括四张谱图:遗传图谱(geneticmap)、物理图谱(physicalmap)、序列图谱、基因图谱,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。1.1遗传图谱(geneticmap)又称连锁图谱(linkagemap),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。1.2物理图谱(physicalmap)物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。1.3序列图谱随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。大规模测序基本策略:①逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。②全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。1.4基因图谱基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。基因图谱的意义在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。1.5基因的鉴定和分析通过基因的表现型来鉴定基因是最有效的手段之一。至今为止,已克隆了大约1000多个人类基因。这些技术主要包括以下几类:1、定位克隆(positionalcloning):例如ob基因和Huntington舞蹈症的基因(1)、通过疾病家系,进行染色体缺失或平衡易位以及连锁分析将结果转化为物理信息,在染色体上进行物理定位。(2)、利用邻近的DNA标记,构建contig。(3)、编码序列的筛选可采用cDNA文库直接筛选的方法或外显子捕获(exontrapping)。(4)、疾病基因的鉴定分析基因突变和缺失以及突变的规律。最后,可用基因敲除(knock-out)技术来验证基因的功能。2、候选克隆(candidatecloing):包括定位候选克隆和功能候选克隆(1)、定位候选克隆:指疾病基因以连锁分析或染色体分析定位后,再从基因组资料库(GDB)中检索邻近区域中所有已知的基因包括已证明与疾病有关的或尚未建立关系的基因、已知的EST,参考已知的模式生物对应的同源序列上的已知EST用它们来直接进行致病突变的筛选。(2)、功能候选克隆:根据致病基因的功能,从GDB或基因库(GenBank)中寻找功能相近的基因,用于致病的改变。这些方法充分利用了HGP的成果,可起到事半功倍的效果。如用该法发现了神经退行性疾病--DRPLA症基因。还发现了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因【4.人类基因组计划的现状[EB/OL].】,为这些疾病的基因诊断和基因治疗奠定了基础。通过利用此法的全基因组关联分析发现了人类9号染色体9p21.3区域和冠心病显著相关,而该区域在既往的研究中较少关通过全基因组关联分析发现了人类9号染色体9p21.3区域和冠心病显著相关,而该区域在既往的研究中较少关【5.WellcomeTrustCaseControlConsortium.Genome—wideassociationstudvof14,000casesofsevencommondiseasesand3,000sharedcontrols[J].Nature,2oo7,447(7145):661-6786.McPhemonR,PertsemlidisA,KavaslarN,eta1.Acommonalleleonchromo.some9associatedwithcoronaryheartdisease[J]Science,2007,316(5830):l488.】491.7.HelgadottirA,ThorleifssonG,ManolescuA.eta1.Acommonvariantonchromo—some9p21affectstheriskofmyocardialinfarction[J]Science,2007,316(5830):1491·1493.】。该区域尤其是rs1333049SNP多态性和冠心病明确相关【8.Farzaneh-FarR,NaB,SchillerNB,etalLackofassociationofchromosome9p21.3genotypewithcardiovascularstructureandfunctioninpersonswithstg—blecomnaryanerydisease:TheHeartandSoulStudy[J].Atherosclerosis,2008.205(2):492-496.9.Summariesforpatients.Doesmeasuringgeneticvariationsatchromosome9p21.3helptopredictcardiovasculardiseaseinwomen[J]?AnnInternMed,2009.150(2):I-36.10.SjorckHM,LanneT,AlehagenU,eta1.Associationofgeneticvariationonchromosome9p21.3andarterialstiffness[J].JInternMed,2009,265(3):373.381.11.Rodriguez-MenocalL,PhamSM,MateuD,eta1.Agingincreasespl6Ink4aex—pressioninvascularsmoothmusclecels[J].BiosciRep,2009,30(1):11-18.12.SchunkertH,GotzA,BraundP,eta1.Repeatedreplicationandaprospectivelneta—analysisoftheassociationbetweenchromosome9p21.3andcoronaryar_terydisease[J].Circulation,2008,117(13):1675-1684.13.PaynterNP,ChasmanDI,BuringJE,etalCardiovasculardiseaseriskpredic—tionwithandwithoutknowledgeofgeneticvariationatchromosome9p21.3[J].AnnInternMed,2009,150(2):65-72.14.ZhouL,ZbaugX,HeM,eta1.Associationsbetweensinglenucleotidepolymorphismsonchrmnosome9p21andriskofcoronaryheartdiseaseinChineseHanpopulation[J].ArteriosclerThrombVascBiol,2008,28(11):2085-2089.】3、功能克隆(functionalcloning):如镰刀状贫血基因的发现就是利用此法最早采用的基因克隆策略。生化缺陷可能与某一类蛋白的功能缺陷有关,从相关的蛋