肿瘤研究的分子生物学数据库资源一篇论文的题目ZhuF,ZykovaTA,KangBS,WangZ,EbelingMC,AbeY,MaWY,BodeAM,DongZ.BidirectionalsignalstransducedbyTOPK-ERKinteractionincreasetumorigenesisofHCT116colorectalcancercells.Gastroenterology.2007;133(1):219-31.主要内容NCBI的相关数据库资源肿瘤学和血液学的细胞遗传学ExPASy的数据库资源和工具NCBI的相关资源NationalCenterforBiotechnologyInformation单基因遗传病的站点–介绍多个系统的遗传病,可下载PDF文件。–图示遗传病相关基因在染色体的定位–与相关数据库相互链接Genesanddisease页面染色体的图谱SKY—SpectralKaryotyping–多色标记的探针与染色体杂交M-FISH—MultiplexFluorescenceInSituHybridizationCGH—ComparativeGenomicHybridization–肿瘤和对照细胞的基因组DNA标记不同颜色荧光探针等量混合后分别与肿瘤和对照细胞的染色体杂交。SKY的原理CGH的原理CGH比较工具–输入染色体片段和得失,如:7[gain]或3p[loss].比较工具比较结果CGH图示大规模分析基因表达的方法–对某一组mRNA中基因表达定量检测–一群mRNA中的每一个mRNA的同一位置取9-10bp的一段序列,(从统计学上说这样的序列可以代表95%的人类基因),每一种9-10bp的序列的拷贝数则代表基因表达的拷贝数,也就可以说明基因表达活性的高低。方法–RNA反转录为cDNA,同时用生物素标记cDNA末端–随后用一种限制性内切酶(NlaIII(CATG))切割cDNA分离酶切位点3‘端的序列–另一种酶再切割cDNA片段,去除带生物素的3’端–用PCR扩增每一个标签片段,将30-50个不同的标签片段连成一个单一的DNA分子–最后克隆并测序这些分子–酶切位点3'端的序列出现的拷贝数就代表了基因表达活性的高低流程图选择细胞磁珠分离RNA并合成cDNA锚定内切酶(NlaIII)酶切NlaIII3’端序列为标签,再用BsmF1酶切后释放标签将标签相互连接并连入质粒载体测序并计算标签的拷贝数计算机分析查询方式–...bytag–...bysequence–...bylibrary–...bygenename输入序列先查询序列中的Tag根据Tag来查询在SAGE文库中出现的频率输入GenBank号或序列进行查询查询结果查询结果CancerGenomeAnatomyProject()由NationalCancerInstitute(NCI)管理目的是研究肿瘤细胞的分子改变CGAP主页Genes每个基因————一个Geneinfo页面–UniGene、LocusLink、OMIM、DTPsearch、cDNALibraries、ClusterAssemblies、和SNPs等数据库的链接–细胞遗传学定位和Mitelman断裂点信息–蛋白相似性–人类和小鼠的同源组–IMAGE(IntegratedMolecularAnalysisofGenomesandtheirExpression)协议来源的序列链接–全长MGC(MammalianGeneCollection)克隆链接–GeneOntology功能分类Genes工具列表–Genefinder:按照特定标准查找单个或多个基因的工具–GeneOntologyBrowser:通过分子功能、生物学过程和细胞组分对人和小鼠的基因分类–NucleotideBLAST:通过CGAP界面,查找给定核苷酸序列的代表基因–ListsofCandidate,Validated,andConfirmedSNPs:包含单核苷酸多态性的基因信息–CGAPSNPIndex:通过基因名称、符号和GenBank序列号查找代表SNPs–SNPGeneViewer:将人类SNPs定位于参考序列和MGC序列,预测蛋白编码的变化GeneinfoChromosomesMitelmanDatabaseofChromosomeAberrationsinCancer(肿瘤染色体畸变数据库)–RecurrentChromosomeAberrationsSearcher用来查找重复出现的染色体畸变SNP500CancerDatabase–用于查找SNP的工具–可以通过基因名称、SNP号、染色体和基因功能查询查找肿瘤重复出现的染色体畸变Tissues来源于组织的基因表达信息–LibraryFinder工具可以帮助查找组织特异性的文库。–GeneLibrarySummarizer(GLS):在特定的cDNA文库中查找所有基因。–cDNAxProfiler:用于在两个cDNA文库之间比较基因表达。–DifferentialGeneExpressionDisplayer(DGED):用于在两个cDNA文库之间比较基因表达的统计学差异。–SAGEmapxProfiler:xProfiler程序比较一个cDNA在不同cDNA文库中的表达情况。–SAGEmapVirtualNorthern:以图形形式显示一个基因在不同cDNA文库中出现的频率,代表其表达丰度。cDNAxProfilerSAGESAGEAnatomicViewer查询结果Tissueonly查询结果SAGE的数据RNAiPATHWAYSBioCarta公司信号转导途径图谱KEGG代谢途径和信号转导途径图谱PathwaySearcherCGAP基因表达分析工具的汇总Tools肿瘤学和血液学的细胞遗传学收集了各种在肿瘤中具有染色体异常的基因,包括其基因名称、产物、在肿瘤中的异常情况,以及与各种数据库的链接收集了白血病、实体瘤、癌前病变的细胞遗传学数据以染色体来分类描述各种肿瘤中的染色体异常包括了许多高水平的综述(DeepInsight)和病例报告22号染色体t(9;22)(q34;q11)t(2;8)(p12;q24)t(8;22)(q24;q11)IGKChr2IGLChr22t(8;14)(q24;q32)MYCChr8IGHChr14BurkittLymphoma2123434121234512654321213211231234567312342123421112345612345PromoterCodingsequencesPromoterCodingsequencesPromoterCodingsequencesDeregulatedgeneConsequencesofBalancedChromosomeRearrangementsIGH,IGK,IGLMYCDeregulatedtranscriptionETV6/NTRK346FusionGenesinBenignandMalignantSoftTissueTumors19921993199419951996199719981999EWSR1/ATF1FUS/DDIT3PAX3/FOXO1AEWSR1/ERGEWSR1/WT1PAX7/FOXO1ASS18/SSX2EWSR1/NR4A3HMGA2/LPPSS18/SSX1EWSR1/DDIT3EWSR1/ETV4COL1A1/PDGFBEWSR1/FEVEWSR1/FLI120002001200220032004200520062007HMGA2/LHFPSS18/SSX4TAF15/NR4A3COL1A2/PLAG1EWSR1/ZNF278FUS/ATF1HAS2/PLAG1TCF12/NR4A3TPM3/ALKTPM4/ALKASPSCR1/TFE3CLTC/ALKLPP/C12ORF9CARS/ALKHMGA2/CMKOR1ATIC/ALKFUS/CREB3L2FUS/ERGRANBP2/ALKSS18L1/SSX1ACTB/GLITGF/NR4A3PAX3/NCOA1FUS/CREB3L1CIC/DUX4COL6A3/CSF1EWSR1/CREB1HMGA2/EBFSEC31A/ALKEWSR1/SP319921993199419951997199820002001200320042006EwingtumorAlveolarRMS,Clearcellsarcomaofsofttissue,MyxoidliposarcomaDesmoplasticsmallroundcelltumor,SynovialsarcomaExtraskeletalmyxoidchondrosarcoma,LipomaDermatofibrosarcomaprotuberansInfantilefibrosarcomaAFH,Lipoblastoma,InflammatorymyofibroblastictumorAlveolarsoftpartsarcomaLowgradefibromyxoidsarcoma,SofttissuechondromaPericytomaTenosynovialgiantcelltumorSoftTissueTumorswithSpecificGeneFusionsFrequenciesoffusiongenesinAMLt(8;21)(q22;q22)RUNX1/RUNX1T14.3%t(15:17)(q22;q21)PML/RARA4.1%der(11)(q23)MLLrearrangement2.4%inv(16)(p13q22)CBFB/MYH112.3%t(9;22)(q34;q11)BCR/ABL10.7%inv(3)(q21q26)RPN1/EVI10.6%t(6;9)(p22;q34)DEK/NUP2140.3%t(1;22)(p13;q13)RBM15/MKL10.2%t(8;16)(p11;p13)MYST3/CREBBP0.1%t(7;11)(p15;p15)NUP98/HOXAgenes0.1%DeepInsightExPASy(ExpertProteinAnalysisSystem)综合的蛋白质分析工具网站大量、使用的蛋白质分析工具链接Databases–本地服务器维护的数据库–与其他大型数据库的链接Toolsandsoftwarepackages–Proteomicsandsequenceanalysistools综合了大量的蛋白质分析软件–Melanie4——二维电泳的分析软件(商业)–RocheAppliedScience'sBiochemicalPathways精美的代谢途径和细胞分子处理过程Educationandservices–ExPASy的FTP服务和日内瓦大学提供的蛋白组学方法培训DocumentationLinkstolistsofmolecularbiologyresourcesLinkstosomemajormolecularbiologyserversSWISS-2DPAGE查询SWISS-2DPAGE的数据HumanlymphocytePROSITE–DatabaseofproteinfamiliesanddomainsEnzyme–EnzymenomenclatureCD40Lbase–CD40liganddefects–CD40配体缺陷与X连锁的IgM增多ExPASyProteomicstool