第三章基因组作图GenomeMapping这条轨道上的信息中蕴藏多少金钱呢?基因组学领域的风险投资前景我国能在竞争中占据多少地盘呢?与基因组作图有关的诺贝尔奖TheNobelPrizeinPhysiologyorMedicine1933摩尔根:遗传的染色体理论TheNobelPrizeinChemistry1962沃森和克里克:DNA双螺旋结构限制性内切酶的应用TheNobelPrizeinPhysiologyorMedicine1978forthediscoveryofrestrictionenzymesandtheirapplicationtoproblemsofmoleculargeneticsTheNobelPrizeinChemistry1958/1980桑格研究蛋白质的结构,成功地测定了胰鸟素的精细结构,因而获得了1958年的诺贝尔化学奖。60年代后他致力于RNA和DNA结构研究,其测定RNA和DNA序列的方法,1980年再度获诺贝尔奖。ArberWNathansDSmithHSangerF与基因组作图有关的诺贝尔奖TheNobelPrizeinPhysiologyorMedicine1993forhisinventionofthepolymerasechainreaction(PCR)method发现PCR方法MullisF染色体研究获诺贝尔医学奖美国人伊丽莎白·布莱克本、卡萝尔·格雷德和杰克·绍斯塔克,以表彰他们“发现端粒和端粒酶是如何保护染色体的”。伊丽莎白·布莱克本是卡萝尔·格雷德的导师。基因组作图的概念O应用界标或遗传学标记对基因组进行精细的划分,进而标示出DNA的碱基序列或基因排列的工作。主要有遗传图、物理图、序列图、基因图。一、基因组遗传图1、遗传图(geneticmapping)概念O通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图,简称遗传图。O计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即减数分裂的重组频率为1%)来表示。2、遗传作图的基础连锁分析是遗传作图的基础。摩尔根总结了连锁和交换定律。然而一个重大发现是在实验工作的一名大学生(Sturtevant,1913)发现的:基因间交换(去连锁)的概率与它们在染色体上的距离成正比例。因而重组频率是衡量两个基因间距离的单位。少数例外:重组热点区域3、遗传作图标记O结构基因和DNA多态性标记可以满足要求:O限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)。O简单序列长度多态性(simplesequencelengthpolymorphism,SSLP):小卫星DNA、微卫星DNA。O单核苷酸多态性(singlenucleotidepolymorphism,SNP):人类基因组中至少有400万个SNP,其中只有10万个可以形成RFLP。总之:它们是可以识别的结构。4、遗传作图的方法①对果蝇和小鼠等物种的连锁分析,进行有计划的育种实验:观察后代重组率。②对不发生减数分裂的细菌的连锁分析:诱导同源片段交换,观察子代细胞重组率。O接合:DNA从一个细菌到另一个细菌。O转导:通过噬菌体转移小片段DNA。O转化:受体菌从环境中摄取供体细胞释放的DNA片段③对人的连锁分析,只能通过家系分析完成:分析家庭连续几代成员遗传标记与某基因(或某疾病)共同出现的频率。家系连锁分析(PCR--电泳))人类家系谱显示了小卫星DNA等位基因的分离。在这张家系谱中有六对等位基因,但是任何一个人仅有一个(纯合)或两个(杂合)等位基因。遗传标记系谱连锁分析图,“1”片段与疾病基因连锁5、遗传图谱的用途O提供基因在染色体上的坐标,为基因识别和基因定位创造了条件。O例如,6000多个遗传标记能够把人的基因组分成6000多个区域,连锁分析找到某一疾病基因与某一标记紧密连锁的证据,可把这一基因定位于这一已知区域。O遗传图的分子座标也是基因组物理图绘制的基础。基因及多态性位点的分布图距连锁图人类1号染色体连锁图二、基因组物理图(physicalmapping)O物理图—更精细的图谱。物理图的构建是基因组测序的基础,有承上启下的作用。物理图与遗传图比较:基因间关系更准确(啤酒酵母3号染色体)。(一)基因组物理图作图方法①限制酶切作图:根据重叠序列确定酶切片段间连接顺序,以及遗传标志之间物理距离的图谱。②荧光原位杂交图:将分子标记与完整染色体杂交来确定标记的位置。③序列标记位点(STS)图:通过对基因组片段进行PCR和杂交分析,来对短序列进行定位作图。物理图作图方法Ⅰ:限制性酶切图O有什么方法知道酶切片段之间的关系呢?答案是:重叠片段。O重叠群:相互间存在重叠序列的一组克隆,可根据重叠顺序的相对位置将各个克隆首尾连接,构成连续顺序图。O以连续的重叠群为基本框架,通过遗传标记将重叠群排列于染色体上。限制酶切作图基本方法ODNA分子被两种识别不同靶序列的限制性酶切和控制条件的部分酶切片段。部分酶切法测定DNA片段位置①完全降解:获得完全酶切片段的数目和大小的图谱。②部分降解:避免所有切口断裂的完全降解发生。部分酶解产物同样进行电泳分离及自显影。③比较上述二步的自显影图谱,根据片段大小及彼此间的差异即可排出酶切片段在DNA链上的位置。ODNA分子被两种识别不同靶序列的限制性酶切和控制条件的部分酶切片段。限制酶切作图基本方法两种限制酶切完全酶切如图如果控制反应条件避免完全酶切发生,因仅有A或B酶切,可产生部分重叠的片段。即:这个体系中既有7kb片段,又有8kb片段,两种片段中有5kb是重叠的。两种限制酶切点之间的片段为重叠的片段限制酶切图技术路线ODNA片段→酵母人工染色体(YAC)重叠群→筛选阳性YAC酶切→cosmid人工染色体重叠群→阳性cosmid酶切→质粒亚克隆→随机测序→计算机分析串连得大片段。酵母人工染色体(YAC)YAC载体是利用酿酒酵母的染色体的复制元件构建的载体。YAC载体必须含有以下元件:①端粒重复序列②着丝粒③自主复制序列Cosmid粘粒cosmid是英文cossite-carryingplasmid的缩写,也称粘粒、柯斯载体。是人工建造的含有λ噬菌体DNA的cos序列和质粒复制子的特殊类型的质粒载体。疾病基因物理图构建和测序(靶基因产物的功能研究)疾病基因筛查:基因芯片。对阳性基因用生物信息学方法和实验手段验证。基因芯片技术检测分析图像分析Detector1Detector2False-colordifferentialimage筛查后进行结构学和功能学验证物理图构建O低精度物理作图:构建覆盖每条染色体的数百kb的大片段的图谱。O高精度物理作图:构建覆盖每条染色体的几十个kb的图谱。物理图作图方法Ⅱ:荧光原位杂交(FISH)作图O将一组不同颜色的荧光标记探针与单个变性的染色体杂交,分辨出每种杂交信号,从而测定出各探针序列的相对位置。O探针间位置关系提供了DNA序列与基因组图谱间的联系。物理图作图方法Ⅲ:序列标记位点(STS)作图OSTS来源于基因的编码序列,是染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断位点,片段长200-500bp。O基本特征:唯一性。STS作图方法①酶切和部分酶切的制作重叠DNA片段。②分析两个STS位点共存于一个片段的概率(位置越近,共存机会越大),计算STS位点的距离(分离率)绘制图谱。物理图谱的用途•①基因组物理图谱是DNA顺序测定的基础,它是测序工作的第一步。•②为基因的定位、克隆与基因之间的相互关系分析提供了有效的途径。三、基因组测序O两种不同的战略:O全基因组随机测序战略(美国Celera公司)。O以物理图为基础的以大片断克隆为单位的定向测序战略(公共领域测序计划)。O两者的最大区别在于是否依赖基因组作图。1、全基因组鸟枪法O随机先将整个基因组打碎成小片段进行测序,最终利用超级计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置。O优点:速度快,简单易行,成本较低。O缺点:最终排序结果的拼接组装比较困难,尤其在部分重复序列较高的地方难度较大。2、逐个克隆法O对连续克隆系中排定的YAC克隆逐个进行亚克隆测序并进行组装:O遗传图-物理图-亚克隆测序-计算机拼装。O理想状况下,整条染色体就是由一个完整的重叠群构成。基因组“草图”和“完成图O草图绘制的是整个基因组的框架,完成图则是基因组序列测定的完成结果和最终目标。O完成图完全覆盖所测物种的基因组,准确率超过99.99%的全DNA序列图。完成图将为人们提供更详尽、更准确的基因图谱。四、基因图谱O在识别基因组所包含的蛋白质编码序列的基础上,绘制的有关基因序列、位置及表达模式等信息的图谱。1.基因图谱制作方法:通过基因的表达产物mRNA反追到染色体的位置。用cDNA或EST作为“探针”进行分子杂交,鉴别出与转录有关的基因。2.结构基因的分布在人类DNA中有基因密集的“城市中心”,GC含量很高(浅带)。而在基因稀少的“沙漠”区,AT含量很高(深带)。紧邻基因富集区处常有GC重复区,可能调节基因活性。3.人类基因组重复序列O重复顺序没有编码功能,参与染色体的结构形成和动态变化。O重复顺序比较:人类:50%、拟南芥:11%、线虫:7%、果蝇:3%、细菌:0。4.人类基因组的特色①一个基因可产生多种蛋白质,原因是人类mRNA“可变剪接”和蛋白质化学修饰增强。人类基因数约为线虫或果蝇两倍,蛋白质为三倍以上。②每个基因家族的成员较多,尤其是与发育和免疫相关的基因家族。③人类在5千万年前已停止积累重复DNA,但啮齿类似乎还在继续积累。5、不同人种的基因组图O对白、黑、黄三人种进行大样本的全基因组测序和序列比较,探索人类基因组在不同人群中的多态性分布和变化规律。O是国际合作进行的千人个体基因组多态性研究的一部分。O世界上第一个黄种人基因组序列图由华大基因研究院完成。命名为炎黄一号。黄种人的基因组图黄种人突变位点与白种人不尽相同,不能完全照搬国外的诊断标准。开展黄种人基因与疾病关系的研究,将为黄种人的疾病治疗提供更准确和更有针对性的“基因标准图库”,“好比为你的基因做了一张参考CT”。6、个人基因组图谱O2020年后,每个人都可能拥有自己的基因组图谱,这意味着实现个体化诊断、个体化治疗。已经完成个人基因组图谱的有:“DNA之父”詹姆斯·沃森、基因组研究先锋CraigVenter的个人基因组序列图(均为白人)。根据投资者预测,这些重量级人物的基因组图谱的绘制,预示着个人基因组时代的大幕已经拉开。将来可达到1000——2000美元/人。7、基因组单体型单体型(haplotype):每条染色体上带有各个基因座上的某个等位基因。一条染色体上这些不同的等位基因组合就是不同的单体型。(1)单体型图的基础OHapMap的科学基础是染色体上的SNP的“板块”(block)结构。SNPs在一段染色体上是成组遗传的,每个板块在进化上非常保守,在多世代的传递中极少发生DNA重组,其SNPs的构成在单个染色体上的模式,即单体型。(2)人类基因组单体型图计划是人类基因组研究领域的又一重大研究计划。将在已完成的人类全基因组序列图的基础上,确定人类不同族群中经世代遗传仍保持完整的单体型图。并将这些不同的单体型标上标签。(3)基因组单体型图)------中国卷第一届国际人类基因组单体型图计划战略会议确定了5个国家的任务:美国31%,日本25%,英国24%,加拿大10%,中国10%。“中国卷”的具体内容是构建3号、21号染色体和8号染色体短臂的人类基因组单体型图。样品将分别取自亚、欧、非裔人群,我国将提供一半的亚裔样品,占到研究样品总数的1/6。这意味着我国虽然只做10%的构建工作,但可以得到几十份全基因组规模的单体型图,并且获得与其它族裔的比对结果。我国样品将在北京师范大学进行采集。(4)中国10%单体型图计划O北京、香港和台湾地区的科学家将共同参加这一重大国际合作科研项目,进行国际交流