核酸_蛋白序列比对分析_百替生物

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

@100biotech.comservice@100biotech.comservice@100biotech.comservice@100biotech.com核酸\\\\蛋白序列比对分析生物技术02级021402198曾彪摘要生物信息学————————是一门新兴的交叉学科,是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、存储、传递、检索、分析和解读的科学,是现代生命科学与计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。核酸与蛋白质序列分析是生物信息学的基本研究方法。核酸与蛋白质序列分析是生物信息学的基本研究方法。关键词核酸////蛋白质序列分析生物信息数据与查询序列比较DNADNADNADNA芯片质谱隐马尔可夫模型正文人类基因组计划完成了人类基因组的测序与分析工作,也积累了大量的核酸和蛋白质序列数据,从而导致了分子数据库的建立。分子生物学家在此基础上依靠计算机进行核酸和蛋白质序列分析。大量生物学实验的数据积累,形成了当前数以百计的生物信息数据库。它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理。这些生物信息数据库可以分为一级数据库和二级数据库。一级数据库的数据都直接来源于实验获得的原始数据,只经过简单的归类整理和注释;二级数据库是在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步整理。国际上著名的一级核酸数据库有Genbank数据库、EMBL核酸库和DDBJ库等;蛋白质序列数据库有SWISS-PROT、PIR等;蛋白质结构库有PDB等。国际上二级生物学数据库非常多,它们因针对不同的研究内容和需要而各具特色,如人类基因组图@100biotech.comservice@100biotech.comservice@100biotech.comservice@100biotech.com谱库GDB、转录因子和结合位点库TRANSFAC、蛋白质结构家族分类库SCOP等等。要在如此庞大的数据库中找到所需要的目标序列,必须建立数据库查询系统。数据库查询(也称为数据库检索)是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。常用的数据库查询系统有Entrez,SRS等。数据库搜索是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。常用的数据库搜索系统有BLAST、FASTA和BLITZ。面对大批由测序仪产生的序列数据,通过序列分析,人们能够了解这些序列的生物学信息和意义。线性核酸序列的分析主要包括同源比较,读框分析,酶切位点查找,GC比例分析,序列翻译,引物设计等;蛋白质序列分析包括同源比较,疏水性分析,序列模体识别,结构域识别,高级结构预测等。核酸序列分析核酸序列分析核酸序列分析核酸序列分析核酸序列的基本分析核酸序列的基本分析核酸序列的基本分析核酸序列的基本分析1.测定分子质量、碱基组成、碱基分布等基本数值;2.序列变换:反向序列、互补序列、互补反向序列;3.限制性酶切分析:限制酶的所有信息,包括甲基化酶、相应的微生物来源、识别序列位点、裂解位点、甲基化特异性、酶的商业来源以及参考文献。4.克隆测序的分析:测序峰图的查看、核酸序列中载体的识别和去除、其@100biotech.comservice@100biotech.comservice@100biotech.comservice@100biotech.com他人工序列的分析和去除核酸序列的电子延伸---GenBank的UniGene数据库、意大利Tigem的ESTMachine、EMBL的ESTClusterProject等基因的电子表达谱分析---将待分析序列与EST数据库进行序列对库的检索,用与待分析核酸序列具有高同源性的EST序列所对应的组织来源进行推断,进而得到该基因的组织表达谱。SAGE数据库、UniGene、Tigem等。核酸序列的电子基因定位分析---染色体定位。–通过序列标签STS数据库定位–利用UniGene/RH放射性杂交定位–直接利用基因组序列定位cDNA对应的基因组序列分析---EST和cDNA的基因组序列查询了解该基因的基因组结构:外显子/内含子结构、转录调控区。基于核酸序列对齐分析的功能预测–利用数据库的核酸序列的同源性分析–两条核酸序列之间的同源性分析–核酸序列之间的多重比对分析及进化分析可读框架分析1)cDNA序列的可读框架分析@100biotech.comservice@100biotech.comservice@100biotech.comservice@100biotech.com2)基因组序列中的编码区/内含子结构分析3)cDNA序列与基因组序列的对齐及显示,Sim4程序。5)基因启动子及其他调控位点分析---启动子、增强子、转录因子结合位点、内含子与外显子。6)重复序列分析7)引物设计蛋白质序列分析1.蛋白质序列检索2.蛋白质基本性质分析1)氨基酸组分、分子质量、等电点2)疏水性分析3)跨膜区分析4)前导肽和蛋白质定位5)卷曲螺旋分析蛋白质功能预测6)基于序列同源性分析的蛋白质功能预测。Blast、Blast2、FASTA。7)基于模体、结构位点、结构功能域的蛋白质功能预测@100biotech.comservice@100biotech.comservice@100biotech.comservice@100biotech.com蛋白质结构预测8)蛋白质二级结构预测9)蛋白质三级结构预测——与已知结构的序列比较、同源模建、threading算法和折叠识别DNA芯片技术与脱氧核糖核酸序列分析在分子生物学的许多研究领域,都需要对DNA分子进行序列分析,阐明DNA分子的一级结构是进一步认识其功能的基础。因此,分析测定DNA序列的能力在很大程度上决定着人们获取遗传信息、认识生命奥秘的能力。人类基因组计划的根本目标是分析人类基因组DNA的全部核苷酸顺序,这项计划的实施极大地促进了DNA序列分析技术的发展,各种新的高速测序技术不断出现。在这些新的DNA序列分析技术中,DNA芯片(DNAchip):技术以其新颖的构思和诱人的应用前景而受到人们的广泛关注,它综合应用了生物学、化学以及工程技术科学等学科的众多相关技术,在微型芯片上合成了高密度的寡核苷酸探针阵列,将探针阵列与待分析DNA序列同步杂交,用高分辨率的检测装置进行扫描检测,再结台计算机系统分析处理,可以快速获取所需的遗传信息这是一种全新的DNA序列分析技术,与传统测序技术相比,它的突出优点是整个检测过程快速高效。由于探针阵列具有高度的序列多样性,它可以同时对大量基因、乃至整个基因组进行扫描分析,从而能够使人们从一个更高的层次来全面研究基因的功能,分析不同基因之间的生物相关性这些是传统的序列分析技术所无法企及的。随着这项技术的广泛应用,将会给分子生物学的发展带来深远的影响,特别是将在以研究基因定位和基因功能为主的后基因组计划中发挥越来越太的作用。@100biotech.comservice@100biotech.comservice@100biotech.comservice@100biotech.comDNA芯片是生物芯片的一种,也称为微阵列(Microarray),是指由大量探针按一定的顺序排列在固相载体表面而形成的探针阵列,目前DNA芯片主要包括eDNA芯片和寡核苷酸芯片。探针阵列的合成目前主要有两种方式:(1)离片合成法(Off-ChipSynthesis);(2)在片/原位合成法(On—Chip/insituSynthesis)。DNA芯片是通过核酸杂交原理来进行序列分析的,将标过的未知序列与芯片上的探针阵列进行杂交,严格控制反应条件,如靶序列浓度、杂交温度及缓冲溶液浓度等,那么与靶序列完全互补的探针显示比较强的杂交信号,利用高分辨率的检测装置检测出完全互补的探针,经过计算机系统分析处理,即可确定待测序列。DNA芯片可广泛应用于涉及DNA序列分析的众多研究领域。目前DNA芯片技术主要应用于比较分析特定基因的遗传多样性,检测多态性位点用于基因定位,检测突变位点诊断遗传病,监测基因的表达水平,DNA测序以及进行其它的序列比较等方面的研究。1检测多态性/突变位点利用DNA芯片技术,可以同时检测众多基因乃至整个基因组的多态性/突变位点。在用寡核苷酸芯片扫描分析特定基因时,针对不同的检测目的,可以设计台成出不同形式的探针阵列,将待分析序列与这四个探针同时杂交,严格控制杂交条件,那么完全互补探针的杂交信号最强,从而可以确定位点;2DNA测序SBH(SequencingbyHybridizati0n)法是近年来提出的一种新的DNA测序方法,它用一系列较短的已知序列的寡核苷酸探针,与较长的待分析序列杂交,寻找其互补序列,根据杂交结果分析待测DNA序列。人类基因组计划的实施,对现代分析科学提出了严峻挑战,同时也给分析科学的发展带来了巨大的机遇,促进了分析科学与众多相关学科的渗透融@100biotech.comservice@100biotech.comservice@100biotech.comservice@100biotech.com合。DNA芯片技术正是在此基础上发展起来的一种全新的DNA序列分析技术,这一技术已在分子生物学的许多研究领域显示了巨大的潜力和诱人的应用前景。目前DNA芯片技术的研究与应用正处在一个迅猛发展、日趋完善阶段,在不断拓展其新的应用领域的同时,还需要进一步提高探针阵列的合成密度以及检测系统的分辨率与灵敏度,更重要的是要使这项技术逐步实现常规化与自动化。随着这一技术的逐步完善与广泛应用,将会在二十一世纪的分子生物学中发挥更大的作用。质谱及隐马尔可夫模型在肽和蛋白质序列分析中的应用了解肽和蛋白质的序列对理解其功能具有重要意义,测定其序列也是当前生命科学研究中的重要内容之一.质谱作为高灵敏度的测定分子结构的仪器,其高灵敏度、广泛的适用性及快速性等特性使它具有很大潜力发展成为辅助传统测序方法的新方法,并得到了广泛的关注.肽和蛋白质序列的质谱测定方法质谱用于肽和蛋白质的序列测定主要可以分为三种方法.一种方法叫蛋白图谱(proteinmapping),即用特异性的酶解或化学水解的方法将蛋白切成小的片段,然后用质谱检测各产物肽分子量,将所得到的肽谱数据输入数据库,搜索与之相对应的已知蛋白,从而获取待测蛋白序列;第二种方法是利用待测分子在电离及飞行过程中产生的亚稳离子,通过分析相邻同组类型峰的质量差,识别相应的氨基酸残基.其中亚稳离子碎裂包括“自身”碎裂及外界作用诱导碎裂;第三种方法与FAman法有相似之处,即用化学探针或酶解

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功