微生物基因组学一、概述1、微生物基因组学:是在微生物全基因测序的基础上,对单个基因或多个基因的作用、功能以及它们之间的相互关系的一门学科。2、微生物基因组学是人类基因组学的一部分:1994年美国首先发起微生物基因组研究计划,称为MGP计划(microbialgenomicproject,MGP),它是人类基因组计划的一个重要组成部分。3、微生物基因组学的主要研究内容⑴从研究工作的内容而言①结构基因组学②功能基因组学③比较基因组学⑵从工作顺序而言①微生物基因序列的测定②微生物基因组的注释③微生物基因组的功能研究二、微生物基因组的序列测定㈠测序目的研究基因组的前提和基础。㈡测序策略1.应根据待测序列的长度、要求测序的精确度和现有的条件来制定测序策略。2.测序类型分为两类:①确认性测序②从头测序大规模基因组测序的几个支撑技术Sanger双脱氧末端终止法PCR技术1、克隆2、水生栖热菌(Thermusaquaticus)3、罗氏制药DNA自动测序仪的发展AppliedBiosystems美国应用生物系统公司生物信息学分析软硬件设施DNA测序有几种方法,但到目前为止最常用的是20世纪70年代中期发明的链终止(Sanger法)SangeristheonlychemisttohavereceivedtwoNobelPrizesinChemistry,thefirstasthesolerecipientin1958forhisworkoninsulin,andthesecondin1980,sharedwithPaulBergandWalterGilbert,forthesequencingofnucleicacids.“双脱氧末端终止”的含义Sanger双脱氧末端终止法测序原理自动化测序荧光染料标记物的发明:使链终止法用于自动化测序,用不同的荧光色彩标记ddNTP,如ddATP标记红色荧光,ddCTP标记蓝色荧光,ddGTP标记黄色荧光,ddTTP标记绿色荧光。由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基。第一代测序技术:Sanger等发明的双脱氧核苷酸末端终止法和Gilbert等发明的化学降解法。第二代测序技术——循环阵列合成测序法第三代测序技术(单分子测序,直接测序)近期出现的Helicos公司的Heliscope单分子测序仪、PacificBiosciences公司的SMRT技术和OxfordNanoporeTechnologies公司正在研究的纳米孔单分子技术,被认为是第三代测序技术。测序技术展望非光学显微镜成像:将核苷酸的空间线性排列方式可视化。美国X奖基金会2006年10月4日宣布设立一项金额高达1000万美元的奖金,激励科学家“多快好省”地绘制出人类基因图谱。规则:在30天内以高精确度测序100个百岁老人基因组样本,并覆盖98%的基因组,每个基因组的测序费用控制在1000美元或以下。㈢微生物基因组测序的策略1.随机测序法即不考虑方向性,随机对靶DNA进行测序,最后采用计算机拼装而得到完整的序列信息。该方法又包括两种方法。⑴鸟枪法它包含有三种消化法①限制性内切酶消化法②超声波处理法③胰DNA酶消化法⑵人工转座子法转座子是具有跳跃功能的DNA元件,是细菌或酵母染色体上的特定基因区,利用转座酶可使转座子随机插入靶DNA。优点:①一次体外反应即可形成大量转座子的插入。②可以在其上加入更有利于DNA测序(或制图)的基因元件。③人工合成的转座子两头带有特殊的引物位点,所以插入位点的两侧序列可有效迅速地得以确定。一段DNA顺序可以从原位上单独复制或断裂下来,环化后插入另一位点,并对其后的基因起调控作用,此过程称转座。转座子(transposons)在原核生物与真核生物基因组中存在着可从一个染色体位点转移到另一位点的一些DNA序列。(文献上有时形象地称其为是跳跃基因,jumpinggene)。1951.BarbaraMcClintock提出转作和跳跃基因的概念DNA1967年Shapiro才在E.coli中发现了转座因子2.定向测序法是指特定地从目的片段的某一端开始测序,直至把靶片段测完。定向测序法包括引物测序法和定向缺失测序法。⑴引物测序法即在第一次测序结果的基础上,设计新的寡核苷酸,来充当下一次测序反应的引物,并依次类推,从而循序渐进获得靶DNA的全部序列。⑵定向缺失法定向缺失法是将一个靶DNA变成若干套嵌套的缺失突变体,使靶序列中远不可测的区段逐渐落入可用通用引物进行测序的方法。作图法测序与序列组装两种大规模基因组测序策略的比较项目策略全基因组霰弹法逐步克隆法遗传背景不需要需要(需构建精确的物理图谱)速度快慢费用低高计算机性能高(以全基因组为单位进行拼接)低(以BAC为单位进行拼接)适用范围工作框架图精细图代表测序物种果蝇、水稻人、线虫24目前常用的人造染色体载体细菌人工染色体载体(BAC)酵母人工染色体载体(YAC)黏粒载体(cosmid)P1人工染色体载体(PAC)pYAC4CEN4EcoRIURA3TELBamHITELoriAprTRP1ARS1YAC载体的复制元件和标志基因YAC载体应含有下列元件:酵母染色体的端粒序列酵母染色体的复制子酵母染色体的着丝粒序列酵母系统的选择标记大肠杆菌的复制子标记YAC载体的装载量为250-400kb酵母人工染色体(Yeastartificialchromosomes简称YAC),是一种能够克隆长达400Kb的DNA片段的载体,含有酵母细胞中必需的端粒、着丝点和复制起始序列。细菌人工染色体(Bacterialartificialchromosome,BAC)是指一种以F质粒(F-plasmid)为基础建构而成的细菌染色体克隆载体,常用来克隆150kb左右大小的DNA片段,最多可保存300kb个碱基对。(四)影响测序的因素不管采用随机测序还是定向测序都可碰到下列影响因素。1.计算机的设备。2.靶DNA的性质。3.完成测序所需的时间。4.采用测序策略。三.微生物基因组的注释(一)概念:在微生物基因测序的基础上,对其基本结构和部件进行认定,以进一步研究其功能。(二)微生物基因组注释的内容1.碱基组成分析,即G+CMol%测定。G+C含量是物种的一个重要特征,在微生物的分类上具有重要意义,是重要参数之一。2.开放阅读框的鉴定:3.编码序列分析4.tRNA基因检索:根据特异的三叶草结构来鉴定,可采用专门的分析软件。5.rRNA基因检索:利用现有已知16srRNA序列来鉴定基因组含的rRNA基因。6.特殊序列检索7.复制原点鉴定(1)鉴定目的复制原点即微生物基因组1号碱基的位置。(2)鉴定原理复制原点有其特殊的结构。如E.coli的复制原点为为一段245个bp的序列,其中包含有四个核苷酸的9聚体“TTATCCACT”。(3)鉴定方法可采用特殊的分析软件。8.同源性基因检索(1)目的对每一未知基因均进行同源性搜索以确定其基因的初步特性。(2)搜索原理根据其结构、排列的同源性。(3)搜索方法采用美国的BLAST软件。四.微生物的基因组图谱微生物的基因组图谱主要包括两种,即遗传图谱和物理图谱。(一)遗传图谱1.概念是通过突变表型鉴定出来的其基因组上的一系列基因图,包括各个基因在基因组中的排列顺序和精确定位。2.建立基因遗传图谱的方法(1)中断杂交法即将两个菌株共同培养,并每隔一段时间中断培养,以鉴定其基因型,并以鉴定某些基因的转化顺序和位置。(2)噬菌体转导试验PI噬菌体是普遍性转导噬菌体。它可在供体菌的DNA断裂时,误将DNA片段包装于自身而带入受体菌的基因组中,并形成稳定的转导子。也可将紧密联锁的几个基因也转导过去(此为共转导)。(二)物理图谱1.物理图谱的概念:是在DNA分子上指出限制性内切酶的限制性位点、数目及其限制性片段大小与排列顺序的图谱,又叫限制性图谱。2.构建微生物基因物理图谱的意义(1)用于基因克隆;(2)用于序列分析;(3)用于southern杂交和RFLP多态性分析。3.构建物理图谱的方法(1)限制性内切酶部分消化法(2)双酶消化法(3)内外切酶混合消化(4)分子杂交(5)Southern十字杂交法五、微生物基因组功能分析1、根据目的基因组的性状而推测可能的基因组功能。如致病岛的G+Cmol%与细菌本身的G+Cmol%有很大差异。致病岛或耐药岛等。2、根据已知的数据库进行同源性搜索。美国NIH的GenBank;欧洲的分子生物学实验数据库(FMBL)日本的DNA数据库(DDBJ)3、利用不同条件、不同作用因素的影响而鉴定未知基因的功能。如用过氧化氢酶处理沙门氏菌而获得该菌的对H2O2氧化应激反应的基因。4、采用基因敲除的方法来推测或确定基因的功能。六、研究基因组功能的意义1.加速致病基因的研究2.寻找灵敏而特异性的病原分子标记病原微生物的特异性DNA序列可以作为分子标记用于疾病的诊断。3.促进新药的发现和疫苗的发展(1)促进新药的发现(2)疫苗的研究4.促进微生物分类的发展5.提高对人类相关基因功能的认识(1)一些人类的遗传性疾病,如结肠癌、肝豆状核变性、肾上腺脑白质营养不良等,在细菌的基因组分析中,也存在类似的蛋白物。(2)可以利用微生物做模拟,去检测高等生物的基因性状和功能。(3)从基因水平去揭发人类疾病与病原微生物之间关系,如发病机理,人类与病原微生物之间相互作用的基因机理等。七、微生物基因组功能学研究现状(一)微生物基因组序列测定1.病毒的基因组序列测定2.原核细胞微生物的序列测定1994年美国发起微生物基因组计划,实质上就是以细菌基因组计划为开始的生物工程(不包括病毒)。3.真核细胞微生物的序列测定1996年第一个完成酿酒酵母的测序,至目前为止,已有数种真菌测序完毕,尚有246中正在测序之中。(二)微生物基因组测序碱基数1.病毒基因碱基数:最小的病毒,如乙肝病毒,只有3kb碱基数,而最大的痘病毒则有300kb碱基数。2.细菌基因组的碱基数:细菌基因组的碱基数同样差异很大,小至支原体为50万bp,大至黄色粘球菌为900万bp。3.真菌的碱基数:目前测定的微孢子虫为300万bp。4.人类的碱基数为31.647亿bp。(三)微生物的基因组数1.病毒的基因组数由数个至数百个。2.细菌的基因组数由数百个至数千个。如百脉根中间根瘤菌为8000个基因组。3.真菌的基因组数基本上同细菌。如酿酒酵母为6000个。附:人类基因组数为2-2.5万个,线虫2万个,果蝇1-1.5万个。人类基因组计划HGP(HumanGenomeProjects)凯克加州大学•2000年6月26人类基因组工作草图绘制成功。•2000年3月果蝇。12月拟南芥基因组的完整图谱。•2001年:HGP和美国塞莱拉公司将各自测定的人类基因组工作框架图分别发表在Nature和Science上。•2002年,12月《Nature》小鼠的基因组。•在人类基因组计划中,包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。2000,4以杨焕明在Science水稻全基因组框架序列图。基因总数:约为人类的2倍;其中10000个基因的功能已确定;水稻的“垃圾”序列多位于基因外,人类的“垃圾”序列多位于基因内;水稻的基因平均4500bp,人类基因平均72000bp。拟南芥约有25000个基因,80%在水稻中都存在,二者之间有关信号传导的基因差别最大。中国家蚕基因组计划项目主持人、中国工程院院士向仲怀中国家蚕基因组计划主要攻关专家,西南农业大学教授夏庆友正在做测试。2003年人类表观基因组计划(HumanEpigenomeProject)于10月7日正式启动。这是世界上首项针对控制人类基因“开”和“关”的主要化学变化进行的图谱绘制工作,它将帮助科学家建立人类遗传与疾病之间的关键联系。2004年10月国际人类基因组计划合作组织在《Nature发了杂志上宣布误差小于10万分之一的人类基因组完成图已成功绘就。已将原来15万个“缺隙”减少到341个。完成图