第一讲:蛋白质组学基本原理第一章绪论15February2001一、蛋白质组研究的开端及蛋白质组含义--2001年,人类基因组序列草图的完成,宣告了“后基因组时代”的到来,其主体是功能基因组学(functionalgenomics),而蛋白质是基因功能的执行体;2.人类基因组计划的完成并不表明人类基因组的所有基因及间隔序列已完全确定;3.基因组计划即使已确定某生物基因组内的全部基因,也不能确定哪些基因在何时、何地、以何种程度表达;4.生物的基因组只表达部分基因(30~80%),表达的基因类型及其表达程度随生物生存环境及内在状态的变化而表现极大的差别;5.基因虽是遗传信息的源头,而蛋白质是基因功能的执行体;6.以往的蛋白质研究只是针对生命活动中某一种或某几种蛋白质,难以系统透彻地阐释生命活动的基本机制;因此,无论是从基因组计划的局限、还是蛋白质研究的自身发展而言,大规模、全方位的蛋白质研究均是势在必行。Proteome:Protein+Genome(蛋白质组)Genome:一个细胞或一个生物体包含的所有遗传信息;Proteome:一种细胞/组织/生物体某个时间段所包含的所有蛋白质的存在形式及其活动方式。蛋白质组及蛋白质组学的含义Proteomics(蛋白质组学):研究蛋白质组的科学,阐明生物体全部蛋白质的表达模式及功能模式,其内容包括蛋白质的定性鉴定、定量检测、细胞内定位、相互作用研究等,最终揭示蛋白质功能网络。基因微阵列(microarray)提供了细胞中大量或全部基因表达的快速检测手段,然而从mRNA水平不一定能预测细胞中相应蛋白质的水平。因为:1.各种mRNA不同的稳定性和不同的翻译效率能够影响新蛋白质的产生;二、研究mRNA作为基因产物2.蛋白质形成后在稳定性和转换速度上有很大不同,许多参与信号转导、转录因子调节和细胞周期控制的蛋白质迅速转换,这是其活性调节的一种方式;3.mRNA水平没有告诉我们相应蛋白质的调节状态,蛋白质的活性和功能常有一些内源翻译后的改变,也会因环境因素而改变。三、蛋白质组学研究的内容①结构蛋白质组学:主要研究蛋白质的氨基酸序列、三维结构的解析、种类分析、数量确定等;蛋白质结构测定主要是应用X-光衍射技术,蛋白质种类和数量测定主要是应用双向电泳,蛋白质鉴定的手段是质谱法;②功能蛋白质组学:研究蛋白质的功能,确定蛋白质在亚细胞结构中的定位,蛋白质-蛋白质的相互作用等。蛋白质组学比较注重研究蛋白质类型与数量在不同种类、不同时间和条件下的动态本质。四、蛋白质组学对分析的挑战用DNA微阵列和相关方法分析基因表达依赖于两个重要工具:PCR和寡核苷酸与互补序列的杂交。但是没有类似的工具用于蛋白质分析。1)没有PCR等价物。目前不可能有多肽分子以类似于核苷酸通过PCR复制的方式复制。第二,蛋白质不能专一地与互补氨基酸序列杂交。第三,细胞中每一个蛋白质产物并不一定只有一种分子实体。因此,蛋白质组的分析需要一套不同于基因表达分析的工具,能够对修饰和非修饰的蛋白质进行检测和定量分析。五、蛋白质组学的工具四种重要工具的发展和结合使用给我们提供了灵敏性和专一性较高的识别和鉴定蛋白质的方法。1)数据库:蛋白质、EST(expressedsequencetags)、和基因组序列数据库共同提供了生物表达全部蛋白质的完整数据库目录。2)质谱(MS):目前认为MS是肽序列分析中的最新技术。MS数据为蛋白质鉴定提供了最有力和最精确的方法。3)对数据库中特定蛋白质序列与MS数据进行比对的各种软件。4)蛋白质的分析分离技术,2D-SDS-PAGE是最广泛用于蛋白质组学的技术,蛋白质分辨率达到成千上万种,完全可以用于组织与细胞中的大规模蛋白质分离。EST(ExpressedSequenceTag)表达序列标签EST(expressedsequencetags)是cDNA克隆的末端序列,平均长度为300~500bp,称为表达序列标签,通常是从已有的cDNA文库中随机取出几百到几千个克隆一次测序产生,一般使用载体多克隆位点互补序列作为通用引物。一个EST代表生物体某种组织在某一时期的一个表达基因。采用生物信息学方法延伸表达序列标签(ESTs)序列,获得基因部分乃至全长cDNAycg,将为基因克隆和表达分析提供空前的动力,并为生物信息学功能的充分发挥提供广阔的空间。TheidentificationofESTshasproceededrapidly,withapproximately52millionESTsnowavailableinpublicdatabases(e.g.GenBank5/2008,allspecies)六、蛋白质组学的应用范围根据目前的实践,蛋白质组学包括三项主要应用:1)蛋白质表达谱:蛋白质表达谱是鉴定生物或细胞特定状态下蛋白质的表达或药物、化学或物理刺激下蛋白质的表达,获得蛋白质组图、蛋白质组成成分鉴定、新型蛋白质发掘、蛋白质差异显示。2)蛋白质修饰谱:蛋白质修饰谱是鉴定蛋白质在何处、怎样被修饰的。许多蛋白质翻译后的修饰控制着蛋白质的靶向、结构、功能和转换。此外,许多环境化学因素、药物、和内源化学因素可产生修饰蛋白质的活性亲电体。3)蛋白质网络谱:蛋白质网络谱是在生物系统中测定蛋白质之间相互作用的蛋白质组学方法。这些相互作用决定蛋白质功能网络。获得:阐释重要生命活动的分子机制,包括细胞周期、细胞分化与发育、细胞凋亡、肿瘤发生与发展、环境反应与调节,物种进化等。医药靶分子寻找与分析,包括新型药物靶分子、肿瘤恶性标志、人体病理介导分子、病原菌毒性成分等。每种疾病与~10个基因相关;每个基因又与3~10个蛋白质相关;人类主要的100~150种疾病,则应该有3000~15000种蛋白质具有成为药靶的可能性。因此,可能有几千或上万种新的药物靶标将被发现,将是功能基因组学有可能带来一笔巨大的科学和经济财富。第二章蛋白质组学的基本研究方法Outline一、概述二、蛋白质的提取与样品制备三、蛋白质的分离与二维电泳技术四、蛋白质的检测技术五、生物质谱技术与蛋白质的鉴定六、蛋白质构象解析技术1、蛋白质组学研究远比基因组学研究复杂(1)一个生物对象的蛋白质数量远大于基因数量如人的基因组有3-5万个基因而蛋白质则有30-100万;(2)基因组的组成是固定的,蛋白质组组成是动态的;(3)细胞内蛋白质的拷贝数(108)远比基因拷贝数大(最多105)(4)基因可采用PCR扩增和自动测序,而蛋白质还没有扩增和自动测序技术2、蛋白质组学研究技术进展(1)1975年,2-DE技术建立,上世纪80年代,固相化pH梯度凝胶问世,使2-DE的重复性和加样量改善;(2)上世纪末期,MALDI-TOF-MS和ESI-MS可精确测定相对分子量和微量蛋白质的测定;(3)快速多肽序列分析;(4)90年代,多图象分析与大规模数据处理软件问世,复杂蛋白质图谱处理成为现实;MALDI-TOFMS:matrixassistedlaserdesorptionionization-timeofflightMassSpectrometry;ESI/MS/MS:electrosprayionization3、蛋白质组分析的首要要求•将来自于全细胞、组织或生物体中所包含的多达几千种混合蛋白质进行分离、检测、分析;•2-DE技术依然是大多数蛋白质组研究中分离复杂蛋白质混合物的首选技术。生物学问题的提出实验模型的设计实验组和对照组样品的制备蛋白样品的IEF和PAGE电泳分离图像扫描和初步分析感兴趣蛋白点的切取胰酶对脱色后蛋白质的消化质谱的多肽指纹图、微测序分析质谱结果的生物信息学分析和比对新蛋白质的发现其它实验的进一步验证蛋白信息的初步获得4.蛋白质组研究的基本技术路线蛋白质样品的制备双向电泳图像分析转印至膜上的蛋白凝胶中的蛋白混合肽蛋白质质量N端测序肽序列质谱数据肽指纹图数据搜索新的或已知蛋白蛋白转录后修饰的鉴定二、蛋白质的提取与样品制备二维电泳分析中的样品制备制备原则:•应使所有待分析的蛋白样品全部处于溶解状态(包括多数疏水性蛋白),且制备方法应具有可重现性。•防止样品在聚焦时发生蛋白质的聚集和沉淀。•防止在样品制备过程中发生样品的抽提后化学修饰(如酶性或化学性降解等)。•完全去除样品中的核酸和某些干扰因素。•尽量去除起干扰作用的高丰度或无关蛋白质,从而保证待研究蛋白质的可检测性。样品制备原则1、尽可能采用简单方法进行样品处理,以避免蛋白质的损失。(1)明确研究目标,获得尽可能多的感兴趣蛋白质;(2)不同类型的蛋白质需要不同的方法;(3)考虑目标蛋白性质,细胞破碎选择温和和激烈两种方法;2、细胞和组织样品的制备应尽可能减少蛋白质的降解,从特殊亚细胞器提取蛋白还需分级分离。3、样品裂解液新鲜制备,并且分装冻存于-80°C,不要反复冻融样品;4、通过超速离心清除所有的杂质,主要去除盐、小分子化合物、脂类、离子去污剂、核酸、多糖、脂类、酚类等5、加入尿素之后,加温不要超过37°C,以防蛋白质氨甲酰化。(一)细胞裂解的方法1、温和裂解的方法:适用于组成比较简单的样品或分析特定的细胞器(1)渗透裂解:通常用于血细胞、组织培养细胞等低渗溶液细胞;(2)冻融裂解:液氮快冻融,然后在37°C融化,反复几次,适合于细菌、组织培养细胞;(3)去污剂裂解:溶解细胞膜释放内含蛋白质,主要针对组织培养细胞;(4)酶裂解:在等渗溶液中用酶去细胞壁,常用的酶有溶菌酶(细菌)、纤维素酶+果胶酶(植物)、溶细胞酶(酵母)。2、剧烈的细胞裂解方法主要针对难破碎的细胞、酵母细胞和细胞亚组织(1)超声裂解法:利用超声波产生的切应力破碎细胞,但要注意产生热量和气泡;(2)研磨法:加液氮和沙进行研磨,适合于固体组织和微生物细胞;(3)机械匀浆法:破碎固体软组织和动物组织(切成小片),同时要加入预冷的匀浆溶液;(4)玻璃珠匀浆法:适用细胞悬液或微生物,目的在于破碎细胞,提取内含蛋白质。3、蛋白酶抑制剂防止蛋白酶裂解防止细胞裂解时蛋白酶释放出来降解蛋白质。低温、pH9的裂解液可降低蛋白酶活性,但不能真正消除,故得加酶抑制剂(以下一种或数种的混合物)(1)PMSF:苯甲磺酰氟,工作浓度1mM,能不可逆灭活丝氨酸蛋白酶、半胱氨酸蛋白酶,但在水溶液中失活。(2)AEBSF:可在水溶液中使用,工作浓度4mM,能不可逆灭活丝氨酸蛋白酶、半胱氨酸蛋白酶,但可能改变蛋白质的等电点。(3)EDTA、EGTA:乙二氨四乙酸和乙二醇双四乙酸的工作浓度为1mM,作用对象为金属蛋白酶。4、蛋白质沉淀步骤(1)硫酸铵盐析原理:高盐将蛋白质沉淀出来,从而与核酸分离;步骤:蛋白质浓度1mg/ml,缓冲溶液浓度50mM(含EDTA),缓慢加入(NH4)2SO4,搅拌10-30min,离心分离。注意点:只用作预分离和富集,且(NH4)2SO4会干扰IEF(2)TCA沉淀三氯乙酸(终浓度10-20%)加到提取液中混均,置冰上30min,最后用丙酮或乙醇清洗沉淀除TCA。该法不易造成蛋白质变性和化学修饰。(3)丙酮沉淀提取物加入3倍体积的冰丙酮,-20℃沉淀2小时,离心空气干燥去丙酮。(4)丙酮/TCA沉淀用丙酮在10%的TCA中重悬样品溶液(含有0.01的ß-巯基乙醇或20mmol/L),-20℃沉淀45min,离心分离,丙酮清洗沉淀,空气干燥。(5)苯酚提取蛋白质提取到饱和酚中,加到甲醇溶液中NH4CA沉淀,然后先用NH4CA洗涤,再用丙酮洗涤,空气干燥去丙酮。本法适合于高杂质的植物样品。5、清除影响二维电泳图谱的杂质(1)盐、残留的缓冲液和电性小分子盐等带电物质会干扰电泳过程、增大溶液电导率,通常用透析、凝胶过滤、沉淀/重悬的方法脱盐,但易使样品丢失。(2)内源性小分子这些物质通常带负电,使阳极侧的聚焦不全,可采用丙酮/TCA沉淀去除。(3)离子去污剂SDS等离子去污剂,易和多肽形成复合物而干扰IEF,-200C的丙酮溶液可除去。(4)核酸核酸增加样品黏度,导致二维电泳背景发散;能与蛋白质结合,阻碍聚焦;银染时出现高背景。加0.1V的核酸酶溶