2020/1/211人类后基因组时代(Post-genomeera)2020/1/212基本概念•基因(Gene):生物体的遗传单位,由脱氧核糖核酸(DNA)组成。DNA由4种核苷酸(A、T、C、G)组成。2020/1/213人类基因组的23对染色体2020/1/214从DNA到蛋白质2020/1/215FromDNAtoHuman2020/1/2162020/1/217•2000年是基因组之年,完成了人类基因组的工作框架图,完成了一系列模式生物和微生物的基因组序列分析。2020/1/218•我国94年启动“中华民族基因组若干位点基因研究”“重大疾病相关基因研究”课题,99年承担了人类基因组1%序列的测序任务,负责第3号染色体3千万核苷酸的序列测定工作。2020/1/219人类后基因组时代的特点•人类首次了解了自身的基因序列,了解了很多远亲生物的基因序列•人类正在面对指数扩增的基因序列资料和各种数据库•人类面临的挑战是如何将基因序列资料转变为有用的知识,进而让这些知识服务于人类,使之能够造福于人类的健康。2020/1/2110前基因组时代的“钓鱼”和后基因组时代的“捞鱼”2020/1/2111后基因组时代研究的重要方向1.单基因遗传病的致病基因研究和基因诊断我国有丰富的疾病资源,特别是一些我国特有的单基因遗传病家系,可提供良好的基础发现新的致病基因.2020/1/2112单基因遗传病和复杂疾病2020/1/21132.复杂性疾病的相关基因研究和疾病易感性分析在复杂性疾病的中,由于基因的变异加环境和生活习惯等因素的共同影响,使得每个人对不同的疾病的易感性不同。基因变异的一个重要的指标是单核苷酸多态性。2020/1/2114单核苷酸多态性(SingleNucleotidePolymorphisms,SNPs)不同个体间在基因水平上的单核苷酸变异,平均每1000对硷基出现一个SNP,2个无关个体间有300万SNPs.2020/1/2115•SNP研究为了解疾病的发病机理,疾病的诊断及疾病易感性研究提供基础。•位于外显子区并改变氨基酸序列的SNP以及位于基因表达调控区的SNP可能具有重要临床意义和功能意义•生物信息学可提供SNP的数据库和功能预测2020/1/2116可能具有重要功能意义的SNP•位于外显子区并改变氨基酸序列的SNP•位于基因表达调控区如启动子、增强子、转录因子结合区、加尾信号的SNP•位于外显子和内含子交界区域的SNP2020/1/21173.药物基因组学研究与个体化治疗在临床上对同样一种疾病使用同一种药物,不同的个体对药物的敏感性和毒性反应有很大的区别,这种区别主要由基因决定的,特别是药物靶点基因、药物代谢基因等的单核苷酸多态性,影响了药物作用的强弱和药物代谢的不同。2020/1/2118影响CYP3A表达的SNP对药物代谢产生不同作用2020/1/2119疾病诊断药物1药物2药物3疾病诊断药物1药物2药物3药物敏感性测定目前的疾病治疗将来的疾病治疗2020/1/21204.人类功能基因组学研究以全基因组为背景,开展人类基因及其编码蛋白的功能研究。目前虽然完成了绝大部分基因的序列分析,但约60%的人类基因的功能未知。目前认为人类有3.2万个基因,其中1.5万已知功能,1.7万未知功能。2020/1/2121•人类功能基因组学研究涉及众多的新技术,包括生物信息学技术、生物芯片技术、转基因和基因敲除技术、酵母双杂交技术、基因表达谱系分析、蛋白质组学技术、高通量细胞筛选技术等。•人类功能基因组学必须多学科协作•生物信息学是人类功能基因组学研究的必要工具2020/1/2122人类功能基因组计算机科学家生物化学家细胞生物学家结构生物学家生理学家遗传学家临床和病理学家2020/1/21235.基于基因组的新型药物(Genome-baseddrug)利用反向生物学原理,根据人类基因序列数据,经生物信息学分析、高通量基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物。2020/1/2124人类基因序列生物信息学重组蛋白质表达高通量生物活性筛选功能研究药物靶标研究先导化合物筛选基因工程药物开发化学新药基因组药物开发流程蛋白质序列基因治疗2020/1/2125人类基因组与生物技术产业•一个人类基因有可能带动和形成一个生物技术产业。例如基因工程的胰岛素、干扰素等•基因的开发研究基因组药物、基因芯片、基因诊断、基因治疗、实验室仪器试剂、基因数据库和分析软件等2020/1/2126•人类基因组为药物开发提供了新源泉迄今已应用的人类药物靶标约500种,包括受体、酶、信号转导分子等。开发成功的药物约2000种。估计人类基因组中3-4万个基因中,约5000个基因产物可成为潜在的药物靶标2020/1/21272020/1/2128基因组药物的种类1。基因工程重组蛋白质药物2。以人类基因编码蛋白为靶标的化学药物3。以人类基因编码蛋白为靶标的人源化抗体4。反义核酸类和RNA类药物5。基因治疗2020/1/2129国际新药开发的三个浪潮•基因组学药物靶标发现、反义治疗、基因治疗•蛋白质组学药物靶标评价、药物筛选、抗体治疗、重组蛋白质治疗•分子设计蛋白质结构确定、蛋白质工程、以结构为基础的小分子药物设计2020/1/21306.基因治疗将人类基因导入人体,纠正缺陷基因或辅助机体抵抗疾病。具有良好开发前景,但近期离产业化尚有距离。2020/1/2131AshantideSilva,Now13,wasthefirstpatienttobetreatedwithgenetherapy.•重症联合免疫缺陷的基因治疗腺苷脱氨酶基因治疗(1990)2020/1/21327.生物信息学(Bioinformatics)•生物信息学需要处理指数扩增的海量基因和蛋白质序列资料摩尔定律2020/1/2133核酸序列的生物信息学分析•结构域分析(基因组序列注释)包括启动子、转录因子结合序列、内含子、外显子、重复序列、开放读码框架等。•同源分析和检索,包括Nr数据库、EST数据库、STS数据库、Unigene数据库、Swissprot数据库、HTGS数据库等。•基因突变分析包括EST数据库,SNP数据库等•Data-mining从基因数据库发掘重要的功能基因2020/1/2134蛋白质一级结构分析:•结构特点分析,包括等电点、信号肽、穿膜区、DNA结合序列等•同源分析和检索,包括Nr数据库、Swissprot数据库等•功能区分析,包括Prosite、Emotif、Identify分析等。2020/1/2135•蛋白质空间结构分析:•蛋白质晶体结构数据库检索,如PDB数据库。•蛋白质空间结构预测,如Homology等软件分析。2020/1/2136人类功能基因研究的二级数据库要求•提供未知功能的靶基因cDNA、基因组DNA、编码区蛋白质序列,应有EST序列的支持。•提供蛋白质一级结构信息数据,包括等电点、穿膜区、核定位信号、DNA结合域、功能区、特殊结构分析结果等•提供核酸和蛋白质序列同源性分析的结果(应定期更新)•提供外显子、内含子、启动子等基因组结构的图谱•提供表达谱分析2020/1/2137cDNA序列Nr数据库EST数据库HGP数据库Unigen数据库SNP数据库同源序列检索序列拼接;新剪切体分析基因组序列结构表达谱分析基因变异cDNA序列的数据库分析2020/1/21388。蛋白质组学(Proteomics)研究细胞或组织的基因组表达的全部蛋白质(表达蛋白质组学,Expressionproteomics)通过细胞内蛋白质复合物研究蛋白质与蛋白质的相互作用(细胞作图蛋白质组学,Cell-mapproteomics)双相电泳技术和质谱技术是蛋白质组学研究的最重要技术2020/1/21392020/1/2140蛋白质2D电泳分析2020/1/21419。结构基因组学高通量的蛋白质三维结构分析,为蛋白质的功能研究和药物设计提供基础2020/1/214210。模式生物和病原生物基因组学对其它生物进行全基因组序列分析,开展比较基因组学(comparativegenomics)研究。迄今至少已有5种真核生物,38种微生物完成全基因组序列分析2020/1/2143•模式生物的基因敲除(Knockout)小鼠、酵母、果蝇等生物的基因敲除2020/1/2144•我国在人类基因组计划中取得了重要成果,但在功能基因组研究中尚处滞后阶段•人类功能基因组研究必须多学科、多实验室协作完成,必须吸引功能实验室和临床实验室参加•对人类未知功能的基因进行系统性的功能和开发研究将成为我国生命科学知识创新和技术创新的新生长点我国在人类基因组计划中的研究现状2020/1/2145北京大学人类疾病基因研究中心•研究重点人类基因的功能研究疾病相关基因研究(以SNPs研究为主)•首期启动课题33项功能基因组和疾病相关基因的课题疾病DNA样品库的建立病理组织标准化样品库的建立2020/1/2146北大基因中心人类功能基因研究的部分成果1。促进凋亡的新基因TFAR192。抑制凋亡的新基因TFAR153。新的细胞因子CKLF1(chemokine-likefactor1)及其变异体CKLF2、CKLF3、CKLF44。新细胞因子CKLF-H1(CKLFHomolog1)5。已知基因Thioredoxin的新变异体2020/1/2147人类分泌蛋白二级数据库的建立•由于细胞因子、生长因子、蛋白质激素等具有重要功能及应用价值的生物学活性物质均为小分子的分泌蛋白质,从人类基因组中寻找未知功能的小分子分泌蛋白及编码基因有可能发掘出新的细胞因子类生物活性物质,为进一步的功能研究和基因工程药物的开发研究提供源头创新的靶基因。2020/1/21482020/1/2149新细胞因子cDNA克隆化策略2020/1/2150•细胞因子(Cytokine):由机体各种细胞分泌的具有调控细胞生长分化、调节免疫功能和生理活性并参与病理反应的小分子肽或蛋白质。包括:白细胞介素(IL)集落刺激因子(CSF)肿瘤坏死因子(TNF)趋化因子(Chemokine)转化生长因子-(TGF-)生长因子(GrowthFactor)干扰素(IFN)等2020/1/21511.细胞因子的常规克隆化策略活性筛选发现细胞因子的活性线索细胞因子表达细胞提取mRNA逆转录成为cDNA克隆化至真核表达载体转化大肠杆菌细胞因子活性筛选鉴定2020/1/2152例1:IL-3猴T细胞系UCD-144MLA,可刺激CML细胞增殖。提取UCD-144MLA细胞mRNA,构建含30000个克隆的cDNA表达文库,提取质粒DNA,分成100份,每份200个克隆,分别转染COS-7细胞,上清测定刺激活性,8份具有活性,其中只有1份不被抗GM-CSF抗体所抑制,进一步有限稀释法筛选,获得猴IL-3cDNA,再经杂交筛选人的基因文库,获得人IL-3序列(Cell1986,47:3,)。2020/1/21532.细胞因子产生细胞cDNA的大规模测序和生物信息学分析细胞因子产生细胞cDNA文库大规模随即测序基因和蛋白数据库同源性比较与已知细胞因子有同源性的克隆全长cDNA克隆化真核原核表达活性筛选鉴定2020/1/2154例1:MPIF(MyeloidProgenitorInhibitoryFactor-1):从动脉内皮细胞cDNA文库大规模随机测序,发现其中之一编码氨基酸与MIP-1有51%同源性,昆虫细胞表达蛋白具有趋化T细胞和单核巨噬细胞的活性,抑制骨髓细胞集落形成活性。(J.Exp.Med.1997,185:1163)。现已作为造血细胞保护剂进入II期临床实验。2020/1/2155例2:新白细胞介素的克隆化2020/1/2156•国内第二军医大学曹雪涛,军事医学科学院贺福初,复旦大学余龙,毛裕民等均利用此策略发现一些新细胞因子。2020/1/21573.染色体中细胞因子聚集区的大规模测序•例1:17对染色体存在CC趋化因子Clus