序列比较的生物学基础构成生命的基本单位是蛋白质;20种氨基酸组成的多肽折叠而成;什么决定蛋白质的氨基酸序列?DNA由4种脱氧核苷酸组成:ATGCRNA由4种核肝酸组成:AUGC重要特征:互相配对4种核苷酸组成64个三联密码子形成6个开放读码框序列测定斤瘩姨午谈寨盒屉菏核敢匹善烩寒劫茵秆毙朵馁隆躁鸟姆仙弓蚂骇竿锭迷序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础构成生命的基本单位是蛋白质。而作为在细胞中催化各种化学反应的分子机器的酶,也是蛋白质。另外,细胞的许多结构也是蛋白质组成的。连非蛋白质的构成部分也是由属于蛋白质的酶所催化生产的。一个人体含有大约100,000种不同的蛋白质,正是这100,000种蛋白质的特性及其相互作用使我们无所不能。粤蝗怀舞灰召舱雕由罚决句咳国秽铺歹持猫凭盲点葛豌樟擎铀涪子斌侦沦序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础蛋白质由20种氨基酸组成的多肽折叠而成。蛋白质由20种不同的氨基酸组成不同长度的聚合体,也称为肽或多肽。由这种线性拓朴结构的聚合体折叠起来产生形状各异的不同蛋白质,不同的形状以及20种氨基酸的化学特性决定了蛋白质的功能。现代生物学中的一个很主要的概念是,蛋白质的功能特性主要决定于线性多肽链中20种氨基酸的序列。由于大多数蛋白质都是自身折叠而成,所以理论上知道了一个蛋白质的序列后即可推导出其功能。资冒谜卷殷啪芜脑擞苞稠青抬趋测距怯顽菊鼓族隐贼壕参非闲陌屿虑质伪序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础什么决定蛋白质的氨基酸序列?分子生物学的中心内容就是描述我们从父母获得的遗传信息是如何储存于DNA中,它们是如何被用于复制相同的DNA副本,如何从DNA转录到RNA再翻译到蛋白质的。捏投砧冬架挚肇雾谢艺柠缨罢艺稠烙扳茫盯拷鸡朝挪讣陛轻浅试总改于毕序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础DNA由4种脱氧核苷酸组成:ATGC。DNA是由4种脱氧核苷酸形成的线性多聚体,这4种核苷酸是:腺嘌呤脱氧核苷单磷酸(deoxyAdenosinemonophosphate,A)、胸腺嘧啶脱氧核苷单磷酸(deoxyThymidinemonophosphate,T)、鸟嘌呤脱氧核苷单磷酸(deoxyGuanosinemonophosphate,G)、胞嘧啶脱氧核苷单磷酸(deoxyCytidinemonophosphate,C)。甘挤虫孰诱核义棚街乃稿枕兵蔽小棱辟摘育方诅悉盏斯得笨匙合孟赴吮罪序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础RNA则是由A、U、G、C,4种核苷酸形成的相似线性多聚体,这4种核苷酸是:腺嘌呤核苷单磷酸(Adenosinemonophosphate,A)、尿嘧啶核苷单磷酸(Uridinemonophosphate,U)、鸟嘌呤核苷单磷酸(Guanosinemonophosphate,G)胞嘧啶核苷单磷酸(Cytidinemonophosphate,C)。翟拦仙致镜律睁翼龟剿吱忍绞扰韦褥婿悠惺裸泪煮答谱扰增岩鸳怔月阎抢序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础DNA和RNA的重要特征:互相配对DNA和RNA的一个重要特征是线性多聚体可以互相配对,其配对是序列特异的,由此而形成的双链聚合体因其特殊的形状而被称为“双螺旋”(doublehelix)。双链中G与C配对,A与T或U配对,其中一链可以作为合成另一链的模板,这就是DNA复制以至所有遗传学的基础。由DNA转录为RNA也使用类似的模板合成方式,而由RNA序列转化为蛋白质序列则较为复杂,这是通过三联密码子翻译成氨基酸的过程完成的,这一过程有转移RNA和核糖体(tRNA和ribosomes)的参与。绒龋蓖办驾被存较樱文淬只组吗默茵篡核褂飘精遣密殖壬马洗铬丝钡氨怀序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础遗传密码——三联子mRNA上每3个核苷酸翻译成蛋白质多肽链上的一个氨基酸,这3个核苷酸就称为一个密码,也叫三联子密码。翻译时从起始密码子AUG开始,沿mRNA5’→3’的方向连续阅读直到终止密码子,生成一条具有特定序列的多肽链。mRNA中只有4种核苷酸,而蛋白质中有20种氨基酸,若以一种核苷酸代表一种氨基酸,只能代表4种(41=4)。若以两种核苷酸作为一个密码(二联子),能代表42=16种氨基酸。而假定以3个核苷酸代表一个氨基酸,则可以有43=64种密码,满足了编码20种氨基酸的需要。钒晰弯坪魂孵固薯剑奈诣丙氏汹渺嫡状搭连贵演援决珊拨鸥惊喝淀环扎衔序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础4种核苷酸组成64个三联密码子。4种核苷酸可以组成64个不同的三联密码子(tripletcodes),用于编码20种氨基酸绰绰有余。其中三个为终止密码子,代表多肽序列的末端,一种氨基酸可以由1~6个三联密码子编码。由多个密码子编码的氨基酸,不同密码子的使用频率并不相等,这种使用频率的不同分布称为“密码子偏好”(codenusage)。不同种的生物密码子偏好不同。纬废迈毫论啊搓下夜供骚滨棵析牧荡衅兰滤弯董奖返硝裴剧沾沏痘椽盗熏序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础4种核苷酸组成61个编码氨基酸的密码子和3个终止密码子,它们不能与tRNA的反密码子配对,但能被终止因子或释放因子识别,终止肽链的合成。由一种以上密码子编码同一个氨基酸的现象称为简并(degeneracy),对应于同一氨基酸的密码子称为同义密码子(synonymouscodon)。邵寓绢康陷实阳晴乙迫呼隔粥粟瑶煮沂腻棕苑丝裸力歉赣科烂告溃侧佃快序列比较的生物学基础序列比较的生物学基础碎酒框味染网料刘呈考日梦歌键品戴辙班瞬伊席熄杉槛前氢京翻惑粉齐拭序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础形成6个开放读码框由于氨基酸是由三联密码子编码的,因此DNA序列就包含三个不同的开放读码框,取决于从第一、第二或第三位核苷酸开始(第四位和第一位同框)。而双链DNA的两条链都可以转录RNA,后者翻译蛋白质。因此,一个DNA序列及其互补链可以有6个不同的读码框(readingframes)。渺枫鞠悠乓匝舔吮球宽茁黑唁当拒穷坏似报牛销盖护缀区墓郑惮耪肄惧蝉序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础基因一般概念基因作为唯一能够自主复制、永久存在的单位,其生理学功能以蛋白质形式得到表达。DNA序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成mRNA,翻译生成蛋白质的过程控制所有生命现象。编码链(codingstrand)又称sensestrand,是指与mRNA序列相同的那条链。非编码链(anticodingstrand),又称antisensestrand,是指那条根据碱基互补原则指导mRNA生物合成的DNA链。诈赶方迪铰保恶检婉侨纯液持椅隔师钥鲁形椿息遮转粥攻韵弟羡国累赁菏序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础基因表达的一般概念基因表达包括转录(transcription)和翻译(translation)两个阶段。转录是指拷贝出一条与DNA链序列完全相同(除了T→U之外)的RNA单链的过程,是基因表达的核心步骤。翻译是指以新生的mRNA为模板,把核苷酸三联子遗传密码翻译成氨基酸序列、合成蛋白质多肽链的过程,是基因表达的最终目的。只有mRNA所携带的遗传信息才被用来指导蛋白质生物合成,所以人们一般用U、C、A、G这4种核苷酸而不是T、C、A、G的组合来表示遗传性状。它殿楷锥谓泉糠稽遣贡直院岂烛参旬拖眨篆猾侧惋班哈适案廓眯瘪阂冬泛序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础序列测定。可以用化学方法测定蛋白质的氨基酸序列以及DNA和RNA的核苷酸序列。可是,就目前来说,测定DNA的核苷酸序列比测定RNA序列和蛋白质序列容易的多。由于蛋白质序列可以由编码它的DNA序列推导出来,许多已知的蛋白质序列其实就是从DNA序列推导出来的。将mRNA转为DNA(cDNA)是一个简单的实验技术,因此RNA分子的序列通常是以cDNA序列测定的。序列分析其实就是从已知蛋白质、RNA、DNA序列作出生物学推论的过程。峦爵几咨迎椿俩后塞奋仑洼叭撰诣柱耐居悸巳林净壮锄桥猿栽畜豌音惑黔序列比较的生物学基础序列比较的生物学基础序列分析的困难技术欠缺DNA非编码区比编码区多编码区不连续:内含子、外显子mRNA非编码区、tRNA、SnRNA从DNA序列推导蛋白质序列从蛋白质序列推导结构和功能二级结构:alphahelix、betasheet超级二级结构、三级结构、四级结构为什么结构命名如此复杂?结构决定功能、实验方法欠缺蛋白质三级结构推导的基础目前不能从结构推导功能疙诅描个匹乃纹吟屡科是岂麦宽追旋们翼佳另粥稻晴爵昂动拦天涵劫颗跃序列比较的生物学基础序列比较的生物学基础序列分析的困难技术欠缺。尽管从理论上来说,知道一个蛋白质的序列后,完全可以推导出它的特性,可是目前的生物学技术还远远不能做到这一点。当前的序列分析手段实际能做的与希望做到的还相去甚远。下面就谈谈序列分析困难在哪里。另外,上面也已提到,由于蛋白质序列测定的困难,目前大多数的蛋白质序列其实都是由编码它的DNA推导出来的。遗憾的是,从DNA转录RNA再翻译蛋白质的细胞学途径所具有的特点使这种推导难度大增。挂致膜萨种笼环汇南袖齿欠帅撇佛磷雾播稀军史葛焰蘑臆丑浅纲珍仕萌瞳序列比较的生物学基础序列比较的生物学基础序列分析的困难DNA非编码区比编码区多。许多蛋白质是由一个片段的DNA编码的,所以当分析DNA序列时,生物学家只需要知道蛋白质编码区从哪里开始,到哪里结束。然而在人类基因组中情况就不是那么简单了,因为人类基因组中包含着远远多于编码区的非编码区序列,随机获取的一个片段很可能并不编码任何蛋白质。瘩雇范匝殿柴伶历圃秸握籽翘川谨梅锚帖磨眼陶午得洞笺峪巢街亦愉殿反序列比较的生物学基础序列比较的生物学基础序列分析的困难编码区不连续:内含子、外显子。编码蛋白质的DNA并不是连续的,而是在其中分布有许多叫做“内含子”的分隔区。大多数情况下,这个问题可以通过测定mRNA(cDNA)的序列来解决,因为cDNA中所含的非编码的额外部分很少,而原来被分隔开的外显子(exons)在mRNA(cDNA)中已经被连接成为一个连续的片段。当然,在某些特殊情况下,难以分析RNA而只能分析DNA本身。巾纠笆列蹄殉蟹赖货宪罢导委搭冬悯吭览帮夫号古井污哼炼痹逢失求桔阶序列比较的生物学基础序列比较的生物学基础序列分析的困难mRNA非编码区、tRNA、SnRNA。虽然RNA分子中编码蛋白质的区域相对非编码区的比例远大于DNA分子,然而RNA分子中也还存在非编码区,如编码区的上游和下游,有时甚至比编码区还大。许多RNA分子并不编码任何蛋白质。例如,核糖体RNA(RibosomalRNA,rRNA),转移RNA(transferRNA,tRNA)以及一些核仁小分子RNA(smallnuclearribonucleoproteins,SnRNA)等就属于非编码的RNA。给泄楔柑迢拒借召课葡斯扬据戍菇泡陛度叫铣曼沫墩迈谍民拆愈除圆篮盖序列比较的生物学基础序列比较的生物学基础序列分析的困难从DNA序列推导蛋白质序列。就目前来说,从DNA序列推导编码的蛋白质序列还没有一个总体的、通用的、完全的解决办法。不过,通过各种计算方法以及一些实验生物学,人们已经比较成功的做到这一点。目前,这个问题仍然是计算生物学最重要的问题之一。挎轻茄霍寺卞弯赎烽泄羞撇蔚搅勤喜潍褪珠价藤枫携改棘宗满卿镀阅而户序列比较的生物学基础序列比较的生物学基础序列分析的困难从蛋白质序列推导结构和功能。当我们得到一个蛋白质序列之后,从序列推导它的结构和功能遇到的困难更大。上面提过,蛋白质的结构是通过多肽链本身的折叠,有时还有多个多肽链的组合。这种折叠通过组成肽链的