基因组测序的原理与方法.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

大规模基因组测序的原理与方法胡松年husn@big.ac.cn元素周期表的发现奠定了二十世纪物理、化学研究和发展的基础元素周期表“基因组序列图”将奠定二十一世纪生命科学研究和生物产业发展的基础!“基因组”----生命科学的“元素周期表”人体解剖图奠定了现代医学发展的基础生命的奥秘蕴藏于“四字天书”之中…GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCATCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCTCCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTCGCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT…基因组学的基础理论研究基因组学是要揭示下述四种整合体系的相互关系:•基因组作为信息载体(碱基对、重复序列的整体守恒与局部不平衡的关系)•基因组作为遗传物质的整合体(基因作为功能和结构单位与遗传学机制的关系)•基因组作为生物化学分子的整合体(基因产物作为功能分子与分子、细胞机制的关系)•物种进化的整合体(物种在地理与大气环境中的自然选择)基因组学是一个大学科•“界门纲目科属种”,地球上现存物种近亿,所有生生灭灭的生物,无一例外,都有个基因组。•基因组作为信息载体,它所储存的信息是最基本的生物学信息之一;既是生命本质研究的出发点之一,又是生物信息的归宿。•基因组学研究包括对基因产物(转录子组和蛋白质组)的系统生物学研究。•基因多态性的规模化研究就是基因组多态性的研究。•基因组学的研究必然要上升到细胞机制、分子机制和系统生物学的水平。•基因组的起源与进化和物种的起源与进化一样是一个新的科学领域。•基因组信息正在以天文数字计算,规模化地积累,它的深入研究必将形成一个崭新的学科。基因组学是一门大科学•基因组的信息是用来发现和解释具有普遍意义的生命现象和它们的变化、内在规律、和相互关系。•基因组的信息含量高。基因组学的研究又在于基因组间的比较。•基因组学的复杂性必然导致多学科的引进和介入(各生物学科、医学、药学、计算机科学、化学、数学、物理学、电子工程学、考古学等)。•基因组学研究的手段和技术已经走在生命科学研究的最前沿。•基因组信息来自于高效率和规模化所产生的实验数据。•人类基因组计划证明了基因组研究的迫切性和可行性。基因组与生命之谜•基因组的产生与进化。•基因组DNA组分的变化、GC百分比、嘌呤:嘧啶守恒。•遗传密码的发生、发展和进化。•内含子(尤其是大于100,000核苷酸的大内含子)剪出后的运输和降解。•最小内含子的生物学意义。•动物基因组与植物基因组在基因分布上的共性和个性。•物种衍变过程中基因组水平的变化。•基因组大小变化与遗传、分子、细胞机制的关系。•“JUNKDNA”的发生、分类、进化与功能。测序设备的垄断和高速度换代8199020052020Year2015201020001995Mb1000Mb4000ABI373ABI377ABI3130ABI3730ABI3730xlGA-IGA-IILessThan5yrsHiSeq1000/2000Mb4500ABI3700ABI3700xlSOLiDSOLiD2SOLiD35500xlSOLiDABI3130xlGA-IIx5500SOLiD测序设备发展现状9第一代(稳定需求)ABi3130xL3730xL3500xL第三代(即将面市)HelicosBiosciencesHelicosGeneticAnalysisSystemPacificBiosciencesRSSystem第二代(高速发展)RocheGenomeSequencerFLXSystemGSJuniorSystemIlluminaGenomeAnalyzerIIxMiSeqHiSeq1000HiSeq2000LifeTechnologies(ABi)5500SOLiD™System5500xLSOLiD™SystemIonTorrentPGM™DanaherMotionPolonatorG.007CompleteGenomics无锡艾吉因生物信息技术有限公司AG-100深圳华因康基因科技有限公司Pstar-1中科院北京基因组所/半导体所BIGIS-1BIGIS-4大规模基因组测序的几个支撑技术Sanger双脱氧末端终止法PCR技术DNA自动测序仪的发展生物信息学分析软硬件设施“双脱氧末端终止”的含义PCR(聚合酶链式反应)原理反应所需物质:DNA模板、引物、DNA聚合酶、dNTP、缓冲液每个循环包括:变性(90℃)、退火(54℃)、延伸(72℃)Sanger双脱氧末端终止法测序原理大规模基因组测序的两种策略•逐步克隆法(ClonebyClone)•全基因组霰弹法(WholeGenomeShot-gun)………ATGCCGTAGGCCTAGCTAGGCCTAGCTCGGA……………ATGCCGTAGGCCTAGCTCGGA……基因组DNABAC文库根据物理图谱正确定位的BAC或contig用于霰弹法测序的候选克隆用于霰弹法测序的亚克隆测序并组装完整的基因组序列逐步克隆法(ClonebyClone)全基因组霰弹法(WholeGenomeShot-gun)基因组DNA霰弹法克隆测序并进行全基因组序列组装完整的基因组序列两种大规模基因组测序策略的比较项目策略全基因组霰弹法逐步克隆法遗传背景不需要需要(需构建精确的物理图谱)速度快慢费用低高计算机性能高(以全基因组为单位进行拼接)低(以BAC为单位进行拼接)适用范围工作框架图精细图代表测序物种果蝇、水稻人、线虫BACbyBACWholeGenomeShotgun…thesequencingofthehumangenomeislikelytobetheonlylargesequencingprojectcarriedtocompletionbythemethodsdescribedinthisissue.MaynardV.Olson,Themaps:Clonebyclonebyclone,Nature409,816-818(2001)“WorkingDraft”(90%;4X)FinishedGenome(99.99%;8X)Gap1Gap2Chromosome工作草稿(框架图)与完成图BACbyBACThesequenceofthehumangenomeC.Venteretal.Science16Feb.291:1304–1351,2001人类基因组计划研究的主要成果和进展表现在这“四张图”上•遗传图谱又称为连锁图谱(linkagemap),指基因或DNA标志在染色体上的相对位置与遗传距离•物理图谱以定位的DNA标记序列如STS作为路标,以DNA实际长度即bp、kb、Mb为图距的基因组图谱。•转录图谱利用EST(expressedsequencetags表达序列标签)作为标记所构建的分子遗传图谱•序列图谱通过基因组测序得到的,以A、T、G、C为标记单位的基因组DNA序列逐步克隆法(ClonebyClone)物理图谱的构建大片段克隆的筛选霰弹法测序与“工作框架图”的构建序列的全组装与“完成图”构建物理图谱的制作物理图谱的制作——序列标签位点(STS)作图物理图谱是以特异的DNA序列为标志所展示的染色体图。标志之间的距离或图距以物理距离如碱基对(basepair;bp,Kb,Mb)表示。最精细的物理图是核苷酸顺序图,最粗略的物理图是染色体组型图。STS图谱是最基本和最为有用的染色体物理图谱之一,STS(SequenceTaggedSite)本身是随机地从人类基因组上选择出来的长度在200~300bp左右的特异性短序列(每个STS在基因组中是唯一的,STS图谱就是以STS为路标(平均每100Kb一个),将DNA克隆片段有序地定位到基因组上。STS的来源随机基因组序列表达基因序列,如EST遗传标记序列,如微卫星标记有关STS的信息可在基因组数据库GDB中找到物理图谱构建的步骤确定各STS序列及其在基因组中的位置大插入片段基因组文库的构建(BAC文库)以特定STS为标记筛选并定位克隆含有STS的克隆在基因组中排序基因组数据库(GDB)中至少含有24568个STS路标信息关于文库作为载体的基本要求能在宿主细胞中进行独立的复制具有多克隆位点,可插入外源DNA片段有合适的筛选标记,如抗药性大小合适,易于分离纯化拷贝数多文库的概念含有某种生物体全部基因的随机片段的重组DNA克隆群体载体:能携带外源DNA进入宿主细胞的工具,常用的载体有质粒载体、噬菌体载体、细菌人工染色体等宿主:能容纳外源DNA片段的生物体,常用的有大肠杆菌、酵母等BAC文库的构建NotI、SacI脉冲场凝胶电泳得200Kb左右的大片段DNA纯化后与载体连接电转化,将连接产物导入大肠杆菌感受态细胞插有外源DNA片段的BAC载体在含有氯霉素的固体培养基中培养每一个菌落为带有相同外源DNA片段的单克隆BAC克隆的筛选“STS-PCR反应池”方案筛选种子克隆特定的STS标记相互间具有重叠片段的BAC克隆根据STS信息组装成contig,并定位于基因组上Contig每一个菌落为带有相同外源DNA片段的单克隆RegionalmappingRegionalmappingMinimaltilingpathselectedforsequencing.RegionalmappingstSG50796WI-21858WI-20982SGC-34652EST325005Bda37h09sts-N34454stSG-22642stSG22463IB262SGC-100057SGC-11218SGC-77734SGC-12613SGC-79997D3S4170WI-13469SGC-104744WI-7400SGC-82788sts-N30615SGC-106678WI-3006D3S4125stSG31571SGC-86097SGC-104738sts-T03421stSG81116DM1-2b11sA004Q43WI-10858SGC-15279stSG3143WI-8499D3S3525D3S3630SGC-11976WI-6116WI-2053SGC-84074SGC-77858D3S3706SGC-102094WI-13611NRU18-13sWI-21921CHLC.GATA44a05D3S1304sts-T58150SGC-82964WI-1341D3S3591605m01229e21279b12299n03198p1741l18233p0137i04324k11163m22BeijingCenterMappedon3pbysequencefromothercenter114k09204c23728k15429p24499n06399k19106b10129j10113l1013f06600o17322f0976o22263j0830m15320c08250a15294h24140b10137g22SouthcenterMappedon3pbyfingerprintfromothercenter265o10717m12762o12156h01324k15283k15572b0261i09534j21166f03497i24121d03211k13161d20274o146i21116k05255k15812i02NorthcenterMappednoton3pbyfish1120h22566o1463o01757o1626f10453a03586c02483g20507d0625c11344o05Mappednoton3pbyfish260k16263p03341o12560g03772p01344l093d22489o22794g03Beijingan

1 / 125
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功