基因组学复习

11550008
2 ℃
2020-01-03

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

联合基因：一段连续的DNA序列编码一组关联的彼此重叠的功能产物遗传图谱：利用遗传学的原理和方法，以遗传图距为单位绘制的染色体上基因与遗传标记之间相对位置物理图谱：采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实际位置表观遗传学调控基因表达的方式包括DNA甲基化，组蛋白的共价修饰,染色体结构的重塑以及小RNA介导的基因沉默等多个方面。研究证明表观遗传学机制在基因组防御、进化、基因调控等方面都发挥着重要作用。大量研究表明，DNA甲基化能引起染色质结构、构象、染色体DNA稳定性及蛋白质与DNA相互作用方式的改变，从而影响基因表达。一般认为DNA甲基化抑制基因的表达。印记的基因只占人类基因组中的少数，不超过5%，但在胎儿的生长和行为发育中起着至关重要的作用。大量研究表明这些修饰与染色体构象、基因组稳定性及基因转录活性相关。组蛋白甲基化的位点是赖氨酸和精氨酸，组蛋白H3K4的甲基化主要聚集在活跃转录的启动子区域。组蛋白H3K9，K27的甲基化与基因的转录抑制及异染色质有关。连锁群:在染色体中具有不同的连锁程度并按线性顺序排列的一组基因座位(存在于同一染色体上)物理连锁图:DNA分子标记在同源染色体上有具体的物理位置，因此采用DNA分子标记绘制的遗传连锁图又称物理连锁图连锁不平衡:群体遗传学中有关两个或多个不同座位的等位基因成员出现在个体中的非随机关联性序列间隙:因覆盖度的原因而留下的未能测序的序列，仍存在于克隆文库中，这类间隙称为序列间隙。物理间隙:因克隆载体自身的限制或DNA序列特殊的组成等原因造成某些序列丢失或未能克隆，这些间隙称为物理间隙复制子是DNA的复制单位,由复制起始点,复制序列和复制终点组成DNA复制的意义：1子代保留了亲代DNA的全部信息；2DNA通过复制和基因表达决定生物特性；3体现了遗传过程的相对保守性；保守性是相对的，不能忽视其变异性DNA拓扑异构酶（DNATopisomerase）的作用：通过切断、旋转和再连接作用，理顺DNA链各种酶与蛋白质的作用小结解螺旋酶：解开DNA双螺旋DNA拓朴异构酶：理顺DNA链单链DNA结合蛋白：稳定维持DNA单链状态前导链的合成：在聚合酶III与滑动夹子结合下连续合成。后随链的合成：解旋酶（DnaB）和引物酶（DnaG）沿着模板移动。每1000-2000bp合成一个引物。聚合酶III延伸引物，一直达到前一个冈崎片段为止。聚合酶I去除RNA引物，并填补留下的空隙。连接酶封闭最后缺口。引物酶：复制是在一段RNA引物上加入脱氧核苷酸，而引物酶是一种催化引物合成的RNA聚合酶目的：尽量减少DNA复制起始处的突变冈崎片段在DNA复制过程中，后随链合成是不连续的，即先按5’-3’方向（与复制叉移动方向相反）合成若干片段，即为冈崎片段端粒酶：由蛋白质和RNA两部分组成，是一种特殊的反转录酶半不连续复制：在生物中普遍存在的这种前导链的连续复制和滞后链的不连续复制方式，称为DNA合成的半不连续性复制miRNA：真核生物中一类内源性的长约20-25个核苷酸的非编码RNA，通过RNA诱导的沉默复合体，通过碱基互补配对的方式识别靶mRNA，并根据互补程度的不同指导沉默复合体降解靶mRNA或者阻遏mRNA的翻译siRNA:由人工合成的，转录的或病毒来源的双链RNA生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播，分析和解释等各方面的学科，也是随着生命科学和计算机科学的迅猛发展，生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学，计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。数据库（Database）是按照数据结构来组织、存储和管理数据的仓库，它产生于距今六十多年前，随着信息技术和市场的发展，特别是二十世纪九十年代以后，数据管理不再仅仅是存储和管理数据，而转变成用户所需要的各种数据管理的方式。数据库有很多种类型，从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。开放阅读框：是基因序列中的一段无终止序列打断的碱基序列，可编码相应的蛋白。系统发育进化树Phylogenetictrees用一种类似树状分支的图形来概括各种（类）生物之间的亲缘关系，进化树由结点（node）和进化分支（branch）组成，每一结点表示一个分类学单元（属、种群、个体等），进化分支定义了分类单元（祖先与后代）之间的关系，一个分支只能连接两个相邻的结点。序列拼接为了保证测序结果的准确性，单基因短片段（700pd左右）测序一般应采用双向测序，然后将双向测序的结果拼接在一起，从而获得一致性序列。直系同源(orthology))在进化上起源于一个始祖基因并垂直传递的同源基因；分布于两种或两种以上物种的基因组；功能高度保守乃至于近乎相同，甚至于其在近缘物种可以相互替换；结构相似；组织特异性与亚细胞分布相似。系统发育树构建的方法最大似然法：是一种具有理论性的点估计法，此方法的基本思想是：当从模型总体随机抽取n组样本观测值后，最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大，而不是像最小二乘估计法旨在得到使得模型能最好地拟合样本数据的参数估计量。简约法：根据离散型性状包括形态学性状和分子序列（DNA，蛋白质等）的变异程度，构建生物的系统发育树，并分析生物物种之间的演化关系。邻接法：一种快速的聚类方法，不需要关于分子钟的假设，不考虑任何优化标准，基本思想是进行类的合并时，不仅要求待合并的类是相近的，而且要求待合并的类远离其他的类，从而通过对完全没有解析出的星型进化树进行分解，来不断改善星型进化树。序列比对的意义生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发,分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物分析序列进行分析,也就是研究新的计算机方法,从大量的序列信息中获取基因结构、功能和进化等知识。而在序列分析中,将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定,拼接,基因的表达分析,到RNA和蛋白质的结构功能预测,物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义。判断1、直系同源的序列因物种形成（speciation）而被区分开（separated）：若一个基因原先存在于某个物种，而该物种分化为了两个物种，两个物种中的相同的基因功能未变化，那么新物种中的基因是直系同源的；旁系同源的序列因基因复制（geneduplication）而被区分开（separated）：若生物体中的某个基因被复制了，功能改变了，那么两个副本序列就是旁系同源的。因此，旁系同源基因存在于同一个物种。直系同源的一对序列称为直系同源体（orthologs），旁系同源的一对序列称为旁系同源体（paralogs）。