第九章蛋白质组学的研究方法和进展背景基因数量有限性和基因结构的相对稳定性vs生命现象的复杂性和多变性从genomic到proteome对蛋白质的数量、结构、性质、相互关系和生物学功能进行全面深入的研究已成为生命科学研究的迫切需要和重要任务。第一节蛋白质组学的概念及其发展史第二节蛋白质组学研究方法概述第三节蛋白质组学在疾病研究中的应用主要内容第一节蛋白质组学的概念及其发展史蛋白质组是澳大利亚学者Williams和Wilkins于1994年首先提出,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指proteinsexpressedbyagenome,即“一个细胞或一个组织基因组所表达的全部蛋白质”。一、蛋白质组学的概念对应于基因组的所有蛋白质构成的整体,不是局限于一个或几个蛋白质。同一基因组在不同细胞、不同组织中的表达情况各不相同。在空间和时间上动态变化着的整体。蛋白质组是:蛋白质组学(proteomics)指应用各种技术手段来研究蛋白质组的一门新兴科学,其目的是从整体的角度分析细胞内动态变化的蛋白质组成成份、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律。主要研究内容了解某种特定的细胞、组织或器官制造的蛋白质种类;明确各种蛋白质分子是如何形成类似于电路的网络的;描绘蛋白质的精确三维结构,揭示其结构上的关键部位,如与药物结合并且决定其活性的部位。研究对象基础技术研究层次功能蛋白质组学(functionalproteomics)的提出功能蛋白质组:细胞在一定阶段或与某一生理现象相关的所有蛋白质。介于对个别蛋白质的传统蛋白质化学研究和以全部蛋白质为研究对象的蛋白质组学之间。从局部入手研究蛋白质组的各个功能亚群体。将多个亚群体组合起来,逐步描绘出接近于生命细胞的“全部蛋白质”的蛋白质组图谱。二、蛋白质组学的产生与发展背景基因组时代→后基因组时代研究重点的转移及其标志功能基因组学的主要任务mRNA水平的基因表达研究取得进展,但mRNA与蛋白质间的相关系数仅为0.4~0.5蛋白质自身特点难以从DNA和mRNA水平得到解答进展各国政府支持,国际著名研究和商业机构加盟:1996年澳大利亚建立了世界上第一个蛋白质组研究中心(AustraliaProteomeAnalysisFacility,APAF)美国国立癌症研究院(NCI)投资1000万美元建立肺、直肠、乳腺、卵巢肿瘤的蛋白质组数据库。NCI和FDA共同投资数百万美元建立癌症不同阶段的蛋白质组数据库。英国建立三个蛋白质组研究中心对已完成或即将完成全基因组测序的生物体进行蛋白质组研究。Celera公司投资上亿美元独自启动了全面鉴定和分类汇总人类组织、细胞和体液中的蛋白质及其异构体,构建新一代的蛋白质表达数据库的工作。1997年召开了第一次国际“蛋白质组学”会议1998年在美国旧金山召开了第二届国际蛋白质组学会议1999年1月在英国伦敦举行了应用蛋白质组会议我国也于1998年启动了蛋白质组学研究,在中科院上海生物化学研究所举办了两次全国性的蛋白质组学研讨会2003成立了中国人类蛋白质组组织(CHHUPO),并分别于2003年9月、2004年8月以及2005年8月召开了中国蛋白质组学首届、第二届及第三届学术大会,2004年10月在中国北京召开了第三届国际蛋白质组学会议。科技部已将疾病蛋白质组研究列入我国“973”计划项目和“863”计划项目;国家自然科学基金委员会也将“蛋白质组研究”列为重点项目。我国在鼻咽癌、白血病、肝癌和肺癌蛋白质组研究方面取得了较大的进展。第二节蛋白质组学研究方法概述蛋白质组研究更为复杂和困难:蛋白质数目大大超过基因数目。蛋白质随时间和空间而变化。发展高通量、高灵敏度、高准确性的研究技术平台是现在乃至相当一段时间内蛋白质组学研究中的主要任务。当前主要任务一、蛋白质组表达模式的研究方法研究蛋白质组的组成成分支撑技术主要有双向凝胶电泳、以质谱为代表的蛋白质鉴定技术及生物信息学分析。蛋白质组表达模式(expressionprofile):(一)蛋白质组研究中的样品制备通常可采用细胞或组织中的全蛋白质组分进行蛋白质组分析。也可以进行样品预分级,即将细胞或组织中的全体蛋白质分成不同部分,分别进行研究。样品预分级的主要方法蛋白质溶解性:可溶性蛋白、非溶性蛋白等蛋白质定位:膜蛋白、核蛋白等蛋白质细胞器定位:线粒体、高尔基体、叶绿体等样品预分级主要作用在于提高低丰度蛋白质的上样量和检测灵敏度。组织水平上的蛋白质组样品制备临床样本都是各种细胞或组织混杂,而且状态不一,如肿瘤中癌变的上皮类细胞总是与血管、基质细胞等混杂。激光捕获显微切割(lasercapturemicrodissection,LCM)可直接在显微镜下从组织切片中精确分离特定的细胞或细胞群。(二)蛋白质组研究中的样品分离双向凝胶电泳two-dimensionalelectrophoresis,2-DE):利用蛋白质的等电点和分子量,结合凝胶化学特性,分离各种蛋白质的方法。原理第一向在高压电场下对蛋白质进行等电聚焦(IEF),再在第一向垂直方向上进行第二向SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)。1975年首先由O’Farrell等创立。特点可分离10~100kD分子量的蛋白质高灵敏度和高分辨率便于计算机进行图像分析处理与质谱分析匹配第一向IEF电泳传统O’Farrell系统双向电泳的缺陷。Bjellgvist等发展并完善了固相pH梯度等电聚焦技术,GÖrg等成功地将之应用于双向电泳。优点固相pH梯度等电聚焦的优点克服了载体两性电解质阴极漂移等缺点。稳定的可以随意精确设定的pH梯度。尤其可在较窄的pH范围内进行第二轮分析,大大提高了分辨率及重复性。第二向SDS-PAGE电泳垂直板电泳水平超薄胶电泳2-DE技术的缺点极酸、极碱性蛋白质,疏水性蛋白质,极大蛋白质、极小蛋白质以及低丰度蛋白质用此种技术难于有效分离。胶内酶解过程费时、费力,难于与质谱联用实现自动化。新型非凝胶技术液相色谱法liquidchromatography,LC毛细管电泳capillaryelectrophoresis,CE液质联用技术(LC-MS/MS)蛋白质混合物直接通过液相色谱分离以代替2-DE的分离,然后进入MS系统获得肽段分子量,再通过串联MS技术,得到部分序列信息,最后通过计算机联网查询、鉴定蛋白质。根据蛋白质带电性及疏水性不同,用MS分离多肽复合物。多维色谱技术(LC/LC-MS/MS)多维蛋白质鉴定技术(multidimensionalproteinidentificationtechnology)(三)蛋白质组研究中的样品分析鉴定传统方法:蛋白质微量测序氨基酸组成分析新型蛋白质鉴定技术——质谱(MS)法基本原理:样品分子离子化后,根据离子间质荷比(m/z)的差异来分离并确定样品的分子量。“软电离”的特点分子电离时保留整个分子的完整性,不会形成碎片离子。灵敏度高、快速、能同时提供样品的精确分子量和结构信息、既可定性又可定量、并能有效地与各种色谱联用来分析复杂体系。基质辅助激光解吸/电离飞行时间质谱(matrix-assistedlaserdesorption/ionizationtimeofflightmassspectrometry,MALDI-TOFMS)电喷雾质谱(electrosprayionizationmassspectrometry,ESI-MS)主要质谱类型鉴定和注释蛋白质的路线通过肽质谱指纹图(peptidemassfingerprinting,PMF)和数据库搜寻匹配通过测出样品中部分肽段二级质谱信息或氨基酸序列标签和数据库搜寻匹配目录仪器MALDI-TOF质谱仪:灵敏度高(可达fmol),分析速度快,谱图简单易于解析以及受缓冲液、盐份的干扰小肽质谱指纹图在数据库中匹配不成功的可能原因样品量太少,PMF图信噪比太低,输入库中搜寻的数据质量不好。2-DE胶上所取的一个蛋白质点并非单一蛋白质,所获PMF图实际上是两个以上蛋白质的混合图。操作中角蛋白或其他蛋白质的污染蛋白质发生了较多的转译后修饰,数据库中未有记载所用胰蛋白酶质量不够好,蛋白酶自酶解片段多未知的新蛋白质数据库规模太小续:组织切片或印片原位质谱分析技术两级飞行时间串联质谱(MALDI-TOF/TOF)傅里叶转换回旋共振质谱(FTMS)表面增强激光解吸/电离飞行时间质谱(SELDI-TOF-MS)联合技术精确鉴定蛋白质(四)蛋白质组学研究的生物信息学生物信息学是蛋白质组学研究的一个不可缺少的部分。构建和分析双向凝胶电泳图谱数据库的搜索与构建应用蛋白质组数据库是蛋白质组研究水平的标志和基础瑞士的SWISS-PROT拥有目前世界上最大、种类最多的蛋白质组数据库。目前应用最普遍的数据库是NRDB和dbEST数据库。dbEST数据库由美国国家生物技术信息中心(NCBI)和欧洲生物信息学研究所(EBI)共同编辑,包括许多生物体的表达序列标签(EST)肽序列标签(PST)或部分序列信息最适合查寻概念:把一个基因组表达的全部蛋白质或一个复杂体系中所有的蛋白质进行精确的定量和鉴定。(五)定量蛋白质组学研究低丰度蛋白质检测困难蛋白质表达量差异很小,如在50%以下时,精确定量成为瓶颈蛋白质表达的瞬时变化蛋白质定量的难点1.基于双向凝胶电泳的定量蛋白质组研究策略双向凝胶电泳(2-DE)是目前唯一能分离展示大量蛋白质并进行蛋白质定量分析的一种方法。荧光差异显示双向电泳(F-2D-DIGE)2.基于生物质谱的定量蛋白质组研究策略原理:对于具有相同离子化能力的蛋白质或多肽,可以通过比较质谱峰的强度(或峰面积)得到待比较蛋白质的相对量。二、蛋白质组功能模式的研究方法揭示蛋白质组成员间的相互作用、相互协调的关系,并深入了解蛋白质的结构与功能的相互关系,以及基因结构与蛋白质结构功能的关系。主要研究目标(一)蛋白质翻译后修饰的研究翻译后修饰糖基化乙酰化甲基化羧基化二硫键修饰肽的检测的高灵敏度方法蛋白质翻译后修饰的定量分析合适的修饰状态下处理和电离条件测定工作量巨大研究面临的困难:(二)蛋白质相互作用研究技术生命的基本过程是不同功能蛋白质在时空上有序和协同作用新陈代谢以蛋白质复合体或多蛋白质网络协同作用实现细胞信号转导及病原体感染和免疫反应1989年Field和Song等人在酵母细胞中设计的分析蛋白质相互作用的方法。以真核细胞转录激活因子的结构和活性特点为基础的。1.酵母双杂交系统(yeasttwo-hybridsystem)转录激活因子GAL4的特点N端含NLS和与酵母GAL1基因启动子上游激活序列(UASG)结合的结构域C端含GAL1转录激活结构域功能上相互独立又互相依赖,只有通过某种方式结合在一起才具有完整的转录因子活性系统构建分别构建含GAL4BD和AD的两个酵母融合蛋白表达载体;建立含特殊基因型、适用于双杂交体分析的酵母菌株主要特点和优势使蛋白质表现型和基因型相联系筛选cDNA文库真实反应体内蛋白质间相互作用情况不需分离靶蛋白敏感性高缺点1.假阳性结果2.假阳性结果3.限于核内表达的蛋白质的相互作用2.噬菌体表面显示技术(phagedisplay)三个基本因素:在噬菌体pⅢ和pⅧ衣壳蛋白N端插入外源待筛基因编码的蛋白,形成的融合蛋白表达在噬菌体颗粒的表面;同时其保持的外源蛋白天然构象能被相应的抗体或受体识别利用固相支持物上的抗体或受体,采用亲和筛选法(panning),从噬菌体文库中筛选出能结合筛选分子的目的噬菌体。外源多肽或蛋白质表达在噬菌体的表面,其编码基因可通过分泌型噬菌体的单链DNA测序推导出来。主要应用筛选与特异抗体或受体相互作用的蛋白质研究抗体或受体的结合位点构建随机肽库、抗体库和蛋白文库改造和提高蛋白质的生物学和免疫学特性研究新型多肽药物、疫苗和抗体研究