1RibosomalproteinL11基因和蛋白质序列的生物信息学分析1、前言从20世纪80年代探索核糖体的结晶开始,在1980年,Yonath研究组报道了Bacillusstearothermophilus(现称为Geobacillusstearothermophilus,嗜热脂肪地芽孢杆菌)核糖体50S亚基的结晶。1987年他们又报道了可以衍射到6Å分辨率的50S亚基晶体。同年,另一个研究组报道了30S和70S的Thermusthermophilus核糖体的结晶,而Yonath研究组也大约在同时报道了T.thermophilus核糖体的结晶。1991年,Yonath研究组首先得到了高分辨率的核糖体晶体——3.0Å分辨率的Haloarculamarismortui核糖体50S亚基晶体。20世纪90代以来一系列大分子晶体学技术方面的进展为核糖体结构解析提供了重要的基础。例如,在液氮温度下收集衍射数据极大地提高了核糖体抗辐射性能,而核糖体也是最早应用这一技术的晶体。1991年,Yonath研究组报道了在3Å分辨率下对H.marismortui核糖体50S亚基的结构尝试性初步分析,这是这个领域里的一个重要突破。2000年,一系列高分辨率核糖体晶体结构被发表。Steitz研究组报道了H.marismortui核糖体50S亚基的2.4Å分辨率结构,Ramakrishnan研究组报道了T.thermophilus核糖体30S亚基的3.0Å分辨率结构,而Yonath研究组也报道了同一个分子的3.3Å分辨率结构。2005年,美国加州大学的一个研究组报道了大肠杆菌核糖体全分子(70S)的3.5Å分辨率结构。这些高分辨率的晶体结构为核糖体酶学机理的研究提供了坚实的基础.2、数据来源和分析方法ribosomalproteinL11[MucilaginibacterpaludisDSM18603]GenBank:EHQ28438.1IdenticalProteinsFASTAGraphicsGoto:LOCUSEHQ28438146aalinearBCT18-MAR-2015DEFINITIONribosomalproteinL11[MucilaginibacterpaludisDSM18603].ACCESSIONEHQ28438VERSIONEHQ28438.1GI:373892541DBLINKBioProject:PRJNA43733BioSample:SAMN02256535DBSOURCEaccessionCM001403.1KEYWORDS.SOURCEMucilaginibacterpaludisDSM186032ORGANISMMucilaginibacterpaludisDSM18603Bacteria;Bacteroidetes;Sphingobacteriia;Sphingobacteriales;Sphingobacteriaceae;Mucilaginibacter.REFERENCE1(residues1to146)AUTHORSLucas,S.,Han,J.,Lapidus,A.,Bruce,D.,Goodwin,L.,Pitluck,S.,Peters,L.,Kyrpides,N.,Mavromatis,K.,Ivanova,N.,Mikhailova,N.,Held,B.,Detter,J.C.,Tapia,R.,Han,C.,Land,M.,Hauser,L.,Markowitz,V.,Cheng,J.-F.,Hugenholtz,P.,Woyke,T.,Wu,D.,Tindall,B.,Brambilla,E.,Klenk,H.-P.andEisen,J.A.CONSRTMUSDOEJointGenomeInstitute(JGI-PGF)TITLEThepermanentdraftgenomeofMucilaginibacterpaludisDSM18603JOURNALUnpublishedREFERENCE2(residues1to146)AUTHORSLucas,S.,Han,J.,Lapidus,A.,Bruce,D.,Goodwin,L.,Pitluck,S.,Peters,L.,Kyrpides,N.,Mavromatis,K.,Ivanova,N.,Mikhailova,N.,Held,B.,Detter,J.C.,Tapia,R.,Han,C.,Land,M.,Hauser,L.,Markowitz,V.,Cheng,J.-F.,Hugenholtz,P.,Woyke,T.,Wu,D.,Tindall,B.,Brambilla,E.,Klenk,H.-P.andEisen,J.A.CONSRTMUSDOEJointGenomeInstitute(JGI-PGF)TITLEDirectSubmissionJOURNALSubmitted(01-SEP-2011)USDOEJointGenomeInstitute,2800MitchellDrive,WalnutCreek,CA94598-1698,USACOMMENTMethod:conceptualtranslation.FEATURESLocation/Qualifierssource1..146/organism=MucilaginibacterpaludisDSM18603/strain=DSM18603/isolation_source=theacidicSphagnumpeatbogBakchar/culture_collection=DSM:18603/db_xref=taxon:714943/country=Russia:westernSiberiaProtein1..146/product=ribosomalproteinL11Region1..1413/region_name=rplK/note=50SribosomalproteinL11;Validated;PRK00140/db_xref=CDD:234661Region9..139/region_name=Ribosomal_L11/note=RibosomalproteinL11.RibosomalproteinL11,togetherwithproteinsL10andL7/L12,and23SrRNA,formtheL7/L12stalkonthesurfaceofthelargesubunitoftheribosome.Thehomologouseukaryoticcytoplasmicproteinisalsocalled60Sribosomal...;cd00349/db_xref=CDD:100101Siteorder(10,30,74..76,80,87,112,117..119,123,126..127,130..131,133..135)/site_type=other/note=23SrRNAinterface[nucleotidebinding]/db_xref=CDD:100101Siteorder(10,57,59..62,66,68..69,113..114,117..118)/site_type=other/note=L7/L12interface[polypeptidebinding]/db_xref=CDD:100101Siteorder(26,30)/site_type=other/note=putativethiostreptonbindingsite/db_xref=CDD:100101Siteorder(93,96)/site_type=other/note=L25interface[polypeptidebinding]/db_xref=CDD:100101CDS1..146/locus_tag=Mucpa_4348/coded_by=CM001403.1:5057618..5058058/note=PFAM:RibosomalproteinL11,RNAbindingdomain;RibosomalproteinL11,N-terminaldomain;TIGRFAM:50SribosomalproteinL11;4COGs:COG0080RibosomalproteinL11;InterProIPR020784:IPR020783:IPR000911:IPR006519;KEGG:shg:Sph21_2402ribosomalproteinL11;PFAM:RibosomalproteinL11,C-terminal;RibosomalproteinL11,N-terminal;SMART:RibosomalproteinL11;SPTR:50SribosomalproteinL11;TIGRFAM:RibosomalproteinL11,bacterial-type/transl_table=11/db_xref=InterPro:IPR000911/db_xref=InterPro:IPR020783/db_xref=InterPro:IPR020784/db_xref=InterPro:IPR020785ORIGIN1makevgalvklqvkggaanpsppigpalgakgvnimefckqfnartqdkpgkvlpvvitv61yvdksfdfiiktppvaiqllevsglksgsaepnrkkvanvsweqvetiakdkmtdlnaft121vesamkmvagtarsmgitvsgtapwn//563、结果3.1序列的查询情况3.2序列的比对情况ribosomalproteinL11在数据库中只有1条记录,即:HomoloGene:74409.GeneconservedinEukaryota,其中有18个物种的19条蛋白质序列。3.2序列的比对情况从19条蛋白质序列的比对结果可以看出,这些序列的高度同源区较多,大致可分为7个区域。这些区域的序列有较高的保守性,是蛋白质的功能区。个别序列有十几到几十个长度不等的插入序列,这可能与蛋白质的外显子剪接或编码基因的突变有关,这一区域在功能上的作用较小。以蛋白质的起始氨基酸为例,19条序列的起始氨基酸均为甲硫氨酸,但比对的结果却是有5条序列的的前几个氨基酸被认为是插入的。这可能的原因是如果认为19条序列的起始氨基酸均为甲硫氨酸,则其中有5个因为会给比对体系带来过多的空位,从而降低了整个体系的评分。73.3序列之间的遗传距离DescriptionDataType:AminoacidAnalysis:Pairwisedistancecalculation-Compute:DistancesonlyIncludeSites:-Gaps/MissingData:CompleteDeletionSubstitutionModel:-Model:Amino:Poissoncorrection-SubstitutionstoInclude:All-PatternamongLineages:Same(Homogeneous)-Ratesamongsites:UniformratesNo.ofSites:284d:Estimate[1]Homo_sapiens[2]Pan_troglodytes[3]Canis_familiaris[4]Bos_taurus[5]Mus_musculus[6]Rattus_norvegicus[7]Danio_rerio[8]Drosophila_melanogaster[9]Anopheles_gambiae[10]Schizosaccharomyces_pombe[11]Saccharomyces_cerevisiae[12]Kluyveromyces_lactis[13]Ashbya_gossyp