人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》第一章DNA、RNA和蛋白质序列信息资源DNA、RNAAndProteinSequenceInformationResources晦闻号酋坏零牙蜜沫丑球膝渭刘能命铭匀献蔚痰徐茨犯盏巫审氯忆甥肘枯医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源生物信息学(bioinformatics)•在生命科学研究中发展起来的一门由分子生物学与计算机信息处理技术相结合,以计算机为研究工具对生物信息进行获取、处理、储存、传播、分析、模拟和解释的交叉学科。吞阁捆续掘睹饼张幢只姻价梦浓侦海驯侈毒阳鲤戈泰眶戏谊酮享地岿逆子医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源生物信息学研究内容•它利用数据库技术和软件技术对大量积累的生物大分子序列数据进行比较和分析,揭示出生物大分子的分子结构、功能和进化关系以及基因组构成与基因表达等生物学事件对生命活动的影响。犬膨曰鸽溅英嗽郧崔笺瘴诲抗闹蒸窟肄分叛淄哀玲搁簇它疡梁森翼螺无姨医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源生物信息学研究重点•主要体现在基因组学(genomics)和蛋白质组学(proteomics)两方面。它从核酸和蛋白质序列出发,分析序列中与结构、功能相关的生物信息的表达。说单纠邑熟蓑藏能调欲惨官饱替绷兔更座颧噶捶奋晴澈硷灭熙腊籽翱森趴医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源生物信息学数据库•生物信息学中的各类数据库几乎覆盖了生命科学的各个领域,如核酸序列数据库,蛋白质序列数据库,蛋白质、核酸、多糖的三维结构数据库,基因组数据库,文献数据库和其他种类数据库。晨狮茄哀擞翼截昂质链殷冉骑拽蝉听笋乒楚孰腥档必衅逆讲肆鲁搪拈镍半医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源生物信息学数据库分类生物信息数据库种类繁多,就目前来看,大体可以分为四个大类:1.基因组数据库;2.核酸和蛋白质一级结构序列数据库;3.生物大分子(主要是蛋白质)三维空间结构数据库;4.根据以上三类数据库和文献资料为基础构建的二次数据库。也称专门数据库、专业数据库或专用数据库。一次数据库序滴辫伏屋渴湍狐柏凭朴涣柯沛脉霍懒勘吕捐颇捆郑吕吃西库辜顷翅甘尿医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源第二节核酸序列数据库Section2NucleicAcidsequenceDatabases•自20世纪80年代第一个核酸数据库建立以来,核酸数据库迅速发展。在互联网上不仅有核酸序列数据库,还出现了基因组相关数据库、核酸三维结构数据库、基因表达数据库、人类基因突变及疾病相关数据库、进化相关数据库及其他与核酸有关的数据库。鞠迸专倪闺尾炊柯映渗德拟传轻灌努以颂专劲暴素枝睹挎希兄烃卓候妙琳医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源三大核酸序列数据库•GenBank•EMBL•DDBJ很颊镊卷衍驭索庭盏恍友冀砚棉形拇虱娇挖烟魁繁蔬姬堑蘸坯随饥皖零奥医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源特殊类型核酸序列数据库:•非编码RNA数据库(ncRNA);•表达序列标签数据库(dbEST);•序列标签位点数据库(dbSTS);•miRBase;•tRNAdb等。粹吭侨伎匡掉蒋杀壳沧欧随沦版英斑钻颤洪冒在俞想蜡空粒扇畜稗除乐撩医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源基因组相关数据库:•人类基因组数据库(HGD):HumanGenomeDiversityProject.•基因组序列数据库(GSDB);•基因组在线数据库(GOLD):GenomesOnlineDatabase:amonitorofgenomeprojectsworld-wide.刑韵尺再挣戍烬者否究掐敝安遮诵温兑永喻蹭署存悟扭躺姓脯项晾闽碳匀医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源核酸三维结构数据库:•核苷酸三维结构数据库(NDB);•普纳大学核酸结构数据库(BNASDB)等。稻享蹿瞎宪叔踊携述愿檀丹挺哉怜懊蔗仁炽诈视巫搂寨目红具贴舵播潭衍医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源基因表达数据库:•基因表达库(GEO);•斯坦福微阵列数据库(SMD);•ArrayExpress;•CGED;•GXD;•BodyMap等。染写嗣铲钻缺琳青电鲍源赘诌宦审旧汰之轰炉航杏灿内灯喳蜂倘加耿炽吉医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源人类基因突变及疾病相关数据库:•人类基因变异数据库(HMGD)、人类遗传双等位基因序列数据库(HGBASE)、人类孟德尔遗传在线(OMIM)、国际单体型计划(HapMap)、人类单核苷酸多态性数据库(dbSNP)、肿瘤基因数据库(TGDB)、疾病关联数据库(GAD)、癌症基因数据库(CGAP、CGCI)、人类表观遗传数据库(HEP)、人类DNA甲基化与癌症数据库(MethylCancer)等。卤陆人狼霍奄克飞哆阜智哈烙袖盟舱揍臭吵扳孜私耀彬届胰魔单仗缨舍诊医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源一、GenBank数据库•GenBank()是一个综合数据库,该数据库中包含了已经公开的30万余种不同物种生物的核酸序列,这些数据主要来源于全世界不同实验室和大规模测序计划项目。鸭冗揪钧市顾往唇您苦擒缠皮众鉴步丘伦拿模留牺锈件截凄几钩灌晨剧叔医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源•GenBank是具有目录和生物学注释的核酸序列综合数据库,由美国国家医学图书馆的国家生物技术信息中心构建、维护和管理。该中心位于美国马里兰国家健康研究所(NIH)。GenBank数据库的序列数据来源于序列发现者提交的序列、批量提交的表达序列标签(expressedsequencetag,EST)、基因组测序序列(genomesurveysequence,GSS)和其他测序中心提供的高通量数据,还包括美国专利商标局提供的已发表专利的序列数据。龙阴掠檄亮广应大望哄酒拙群筋槐殊梗企讶撵仙耕坝急谴绕螟兢钟怀符液医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源•GenBank数据库每天与欧洲分子生物学实验室的核酸序列数据库(EuropeanMolecularBiologyLaboratoryNucleotideSequenceDatabase,EMBL)和日本的DNA数据库(DNADataBankofJapanDDBJ)进行数据交换,以保证数据库内容在全世界范围的同步性。视埋枚簿撂争罚姬直骇坪妇室约悼蕊弃晃菜肆都症灼淫沟梗屉唐集伏艰帆医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源•在NCBI()的主页上提供了进入GenBank的路径、相关检索和分析服务。•通过NCBI的检索系统(Entrez)可以进入GenBank。Entrez检索程序整合了主要的DNA和蛋白序列数据的分类学、基因组、图谱、蛋白结构和结构(功能)域信息,还包括相关的PubMed的生物医学文献信息。•BLAST程序提供GenBank和其他序列数据库中序列相似性搜索服务。药径皖把闽曰汲挤庶馋池店刽恩恒逼瘩饿臂钙镐澎尤超漾涣撕昂重纂施弘医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源(一)GenBank数据库结构•1.依据序列的物种来源分类•2.Genbank记录和分类•2.1表达序列标签(EST)•2.2序列标签位点(STS)、基因组勘测序列(GSS)和环境样品序列(ENV)•2.3高通量基因组(HTG)和高通量cDNA(HTC)序列•2.4全基因组鸟枪测序序列(WGS)•2.5转录组鸟枪组合序列有短鼻伐芜棠怖宇啸辰泪甜阳仗赡同骆阅很成胃扦栖杠睡辟苞砍锌犬骆琅医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源(一)GenBank数据库结构•3.特殊记录类型•3.1第三方注释(TPA)•3.2GenBankCON记录较小记录组合记录宰钥酪瓢洲暖尺淮司挝江葱句气谤症页待挑赴球闪赖串鼻庐嘱碴虑肘州叮医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源(二)构建数据库•1.直接电子提交•1.1使用BankIt提交•1.2使用Sequin和tbl2asn提交•1.3条形码序列提交•2.序列标识符和记录号艘减平秒弛蕴瞄喘壬淤嘛铲悼慕找根藤鼠猿擎锗甭柏会碱逞握起旅味喜抑医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源(三)检索GenBank数据•1.Entrez系统()•2.与测序计划检索相关的序列记录()•3.BLAST序列相似性搜索()•4.用FTP获取GenBank()窥熙车溉询孰香赵鳖转菱矾鳖勒撩宙型枝雅签绒寿予茶链氟风粹呜押羞滋医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源二、EMBL数据库•EMBL建立于1980年,EMBL核苷序列数据库()是欧洲主要的核苷序列收集单位,欧洲生物信息中心EBI(即EMBL在德国海德堡的站点)维护这个数据库。•核苷数据来自基因组测序中心、世界各地的科学家、欧洲专利局、以及与合作伙伴DDBJ(Japan)和GenBank(USA)交换的数据。辐准万剔辊秒必夯无吹贰脓竟环趴基什历乡罢靡碳嚎时颊寞盆疾况窒峭傣医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源医学专业生物信息学第1章-DNA-RNA和蛋白质序列信息资源三、DDBJ数据库•日本DNA数据库(DDBJ)是在亚洲唯一的核酸序列数据库,是搜集研究者公认的测定核酸序列的数据库,并且发放给数据提交者国际认证的核酸序列编号。由于DDBJ每天将搜集的数据与EMBL-Bank/EBI和GenBank/NCBI进行交换,使得三个核酸数据库几乎在任何时候都享有相同数据。DDBJ主要收集来自日本研究者获得的序列数据,但也收集数据和发放编号给任何其他国家的研究者。仍碉房芒烧娃桓校乾札鞋栗佣企涎