ATAD2B保守核蛋白的生物信息分析作者:许媛媛联系方式:876346605@qq.com单位:德州学院生命科学学院生物科学专业摘要:为了研究该基因的特性,本研究运用生物信息学的方法对ATAD2B(是在神经元分化和肿瘤发生表达了进化上很保守核蛋白)F1SHA1基因及其氨基酸序列的同源性、理化性质、保守结构域、亚细胞定位、信号肽、跨膜结构域、亲水性/疏水性、二级结构、功能预测以及磷酸化位点等进行预测分析。结果表明在在神经元分化和肿瘤发生表达保守核蛋白,F1SHA1基因共编码1465个氨基酸。相对分子量为165453.8Da,带负电,偏酸性。F1SHA1在280nm的波长下的消光系数为85980M-1·cm-1,其半衰期为30小时,其结构不稳定。根据信号肽假说,可以推测出此蛋白不是分泌蛋白。F1SHA1只含有1个属于GNS1/SUR4家族的保守结构域,运用PSORT工具预测F1SHA1的亚细胞定位,该基因可能位于细胞骨架、细胞质、核上。该基因蛋白的最可能的功能是运输和结合。它的蛋白质的二级结构是指多肽链主链骨架盘绕折叠而形成的构象,借氢键维系。关键词:多克隆抗体ATAD2B:F1SHA1;信号肽;生物信息学1、生物信息学分析运用NCBI和ProtParam进行核酸和氨基酸序列组成和理化性质分析;运用NCBI、PSORT、SignalP、TMHMM、ProtScale和KinasePhos、ProFun等在线工具进行保守结构域、亚细胞定位、信号肽、跨膜结构、亲水性/疏水性和激酶磷酸化修饰位点、蛋白质功能预测;利用PSIPREDPhyre2进行二级结构预测和三级结构预测,并用Pymol绘制三级分子结构图;运用NCBI和MEGA进行氨基酸序列的序列比对和同源性分析。所用软件或在线网站有关信息见[表1]。表1预测基因结构和功能应用的网站及软编号名称网址主要功能1ProtParam.expasy.org/protparam/对蛋白质理化性质的预测2NCBI.ncbi.nlm.nih.gov/gorf/orfig.cgi分析并找到序列的ORF区3NCBI.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi保守结构域预测.st-va.ncbi.nlm.nih.gov/Blast.cgi氨基酸序列相似性分析4PSORT[7].hgc.jp/form.html亚细胞定位预测5SignalP[8].cbs.dtu.dk/services/SignalP/信号肽预测6TMHMM[9].cbs.dtu.dk/services/TMHMM/跨膜结构域预测7ProtScale.expasy.org/protscale/亲水性/疏水性分析8KinasePhos[10].mbc.nctu.edu.tw/index.html激酶磷酸化修饰位点分析9ProtFun[11].cbs.dtu.dk/services/ProtFun/蛋白质功能预测10PSIPRED[12].cs.ucl.ac.uk/psipred/蛋白质二级结构预测2.1F1MEY1基因序列2.2F1MEY1氨基酸一级结构及理化性质预测通过ExPASyProtParam在线预测F1MEY1基因编码的氨基酸序列的组成成分和理化质。结果显示这1465个氨基酸原子组成式为C7176H11537N2111O2263S58共23145个原子,相对分子质量为165453.8Da。其带正电荷氨基酸数目(215)大于其带负电荷氨基酸数目(228),等电点(PI)为6.42,偏酸性。F1MEY1在280nm的波长下的消系数为85980M-1·cm-1,其半衰期为30小时,脂肪数为76.57,不稳定系数分值为57.22,大于40,推测此蛋白质结构不稳定。2.3F1MEY1信号肽预测根据SignalP4.1Server软件预测F1MEY1信号肽的结果如表2所示。其中C代表剪切位点的记分,越高表示出现剪切位点的可能性就越大。S表示信号肽记分,高分位置表示相应的氨基酸位于信号肽部分概率较大,低分位置表示位于成熟蛋白部分。Y是基于C和S的综合记分,通常被视为最理想的剪切位点,具有最高的C值,同时又是S值由高转低的位点。D记分值是S和Y的加权平均值。ELOVL7的C、S和Y的最高得分分别为0、33、0.82和0.32,均远低于0.5,因此可以推测出F1MEY1基因所编码的蛋白不存在信号肽。根据信号肽假说,可以推测出此蛋白不是分泌蛋白。表2F1SHA1信号肽预测指标位点分值MaxC510.33MaxY50.32MaxS10.82MeanS1-40.472.4F1MEY1保守结构域预测通过NCBI保守结构域数据库(ConservedDomainDatabase,CDD),分析F1MEY1中的保守结构域,结果显示F1MEY1只含有1个属于GNS1/SUR4家族的保守结构域(见图2)。2.5F1MEY1亚细胞定位预测运用PSORT工具预测F1MEY1的亚细胞定位,F1MEY1可能位于细胞骨架、细胞质、核上(见表2)。其在核上的概率最高为0.783,而定位在细胞骨架0.13和细胞质0.087相差不大2.6F1MEY1跨膜结构域预测和分析跨膜结构域是膜内在蛋白与膜脂相结合的主要部位,它固着于细胞膜上起锚定作用,一般由1641个左右的疏水氨基酸组成。通过Expasy软件中的TMHMMServerv.2.0工具预测F1MEY1基因的跨膜螺旋区(见图6)。预测结果显示,F1MEY1基因氨基酸序列中不存在跨膜螺旋区,蛋白质整体11465个氨基酸残基全部在膜外,为非跨膜蛋白。2.7F1MEY1亲水性/疏水性分析通过ExPASyProtScale在线软件,对F1MEY1氨基酸序列的疏水性/亲水性预测结果如图4,通过分析发现,在整条链中,最高的分值为4.500,为排在位的ILe,代表其疏水性最强;最低的分值为-4.500,为排在123位的Arg,代表其亲水性最强。GRAVY(Grandaverageofhydropathicity)值为0。GRAVY是测蛋白质的亲疏水性标准,其定义为序列中所有氨基酸亲水值的总和与氨基酸数量的比值,通常GRAVY值分布在2至-2之间,负值越大表示亲水性越好,正值越大表示疏水性越强另外从整体看整条肽链的疏水性氨基酸残基多于亲水性氨基酸残基,因此可以推测出F1MEY1是一种非溶性蛋白。2.8F1MEY1激酶磷酸化修饰位点分析蛋白质的磷酸化则是指在蛋白激酶催化作用下把ATP或GTP的磷酸基转移到底物蛋白质氨基酸残基的过程。蛋白质链的磷酸化一般只发生在丝氨酸(serine,S),苏氨酸(threonine,T)或酪氨酸(tyrosine,Y)这三个残基上。通过KinasePhos网站预测,结果显示F1MEY1有35个丝氨酸激酶、11个苏氨酸激酶和6个酪氨酸激酶潜在磷酸化位点。2.9F1MEY1蛋白的功能预测F1MEY1蛋白功能预测结果如表4所示,该蛋白的最可能的功能是运输和结合,但也有一定可能参与翻译、嘌呤与嘧啶的合成、能量新陈代谢等过程。2.10F1MEY1二级结构预测蛋白质的二级结构是指多肽链主链骨架盘绕折叠而形成的构象,借氢键维系。主要有α-螺旋、β-折叠、β-转角、无规卷曲。3结论:本研究通过生物信息学手段,系统地研究了ATAD2B保守核蛋白的F1MEY1基因及其编码蛋白质的特征,为多克隆抗体ATAD2B提供理论依据。F1MEY1基因共编码1465个氨基酸。其结构不稳定,分子量为165453.8Da,带负电荷,偏酸性。根据信号肽假说,可以推测出此蛋白不是分泌蛋白。F1MEY1基因氨基酸序列中不存在跨膜螺旋区,蛋白质整体513个氨基酸残基全部在膜外,为非跨膜蛋白。〖参考文献〗:外文期刊EffectofIronDeficiencyonHeterocystDifferentiationandPhysiologyoftheFilamentousCyanobacteriumAnabaenasp.PCC7120-2003外文期刊EducatingtheInternet-of-ThingsGeneration-2013外文期刊IncreasedAbundanceofIncP-1{szligbeta}PlasmidsandMercuryResistanceGenesinMercury-PollutedRiverSediments:FirstDiscoveryofIncP-1{szligbeta}PlasmidswithaComplexmerTransposonastheSoleAccessoryElement-2006OA论文AMethodtoBuildCoreArticleRankedListsinInterdisciplinaryDepartmentsandJournal-2012OA论文SynopsisArticlesinthePlanningofaTrilingualDictionary:Yilumbu-French-English-2012