生物信息学常用基本词汇表A英文名词中文名词解释A(Adenine)腺嘌呤作为碱基的两种嘌呤中的一种。activesite活化位点蛋白质三维表面催化作用发生的区域。alignment比对为了确定两个同源核酸或蛋白质序列的累计差异而进行的配对称为比对。alignmentofalignments比对的比对即比对的对象不是简单的序列,而是序列的比对。alleles等位基因一个基因的不同版本。alphacarbonα碳在氨基酸中与侧链(R-基团)相连的中心碳原子。alternativesplicing可变剪接从一个单独的hnRNA生成两个或多个mRNA分子的过程。aminoterminus(N-terminal)氨基端(N端)在一个多肽中,具有自由氨基的分子端,对应于基因的5'-端。anti-parallel反向平行表示相反的方向;在双链DNA中,这意味着如果一条链是5'到3'的,则其互补链方向是3'到5'的。Bbasepair碱基对(1)在双链DNA中嘌呤和嘧啶之间的相互作用(特别指A和T之间,G和C之间);(2)双链DNA序列长度的基本单位。betaturnsβ转角在反向平行的β折叠片中,当β链反转方向的时候蛋白质内部形成的U型结构Bioinformatics生物信息学应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。Biocomputing生物计算本书中特指用计算机技术分析和处理生物分子数据。BasicLocalAlignmentSearchTool(Blast)基本的局部比对搜索工具(Blast)一种常用的序列数据库搜索工具。blottingandhybridization印迹和杂交将分子(通常是核酸分子)从凝胶转移到膜上,接着用绑定有特定感兴趣的分子的标记探针进行洗脱的过程。bootstraptest自举检验对置信程度进行量化的检验。branchandboundmethod分支约束法一种空间搜索方法,通过约束条件减少搜索空间,提高搜索效率。branches分支在系统发生树中,通过分支连接两个节点。CC(Cytosine)胞嘧啶作为碱基的两种嘧啶中的一种。CAATboxCAAT盒大多数真核启动子具有的一段短序列,其片段模式为C-A-A-T,通常出现在转录起始位点上游80个核苷酸的地方。许多因子可以与CAAT盒结合。carboxyterminus羧基端在多肽链中,含有羧酸基团(—COOH)的分子端,对应于基因的3'-端。cDNA(ComplementaryDNA)cDNA(互补DNA)通过逆转录酶从RNA模板合成的DNA。cDNAlibrarycDNA文库从mRNA序列中产生的所有DNA序列的集合。这种类型的文库只包含编码蛋白质的DNA(基因)。centraldogma中心法则从基因的核酸序列中提取信息并以此合成蛋白质的过程(DNA?RNA?protein)。character特征在系统发生树中,具有有限状态数的特征。chargedaminoacid带电氨基酸在一定的生物pH值下,带有正电或负电的氨基酸。chromatin染色质在真核生物细胞核内部由大量DNA以及与此相关的组蛋白组成的近似均匀混合物。chromosome染色体在原核生物,包含一个细胞基因组的DNA分子称为染色体。在真核生物中,与蛋白质复合在一起、包含大量遗传信息的线型DNA分子。clone克隆无性繁殖,如生物体克隆、基因克隆等。cloning克隆在类染色体载体中插入特定的DNA一段,使得它们可以在活细胞中得以保存并复制。Codingsequence编码序列DNA序列中为蛋白质编码的部分。Codon密码子基因编码部分的三核苷酸组合,对应于一个特定的氨基酸。Complementary互补的(1)通过氢键连接的核苷酸对(G和C;A和T;A和U);(2)核苷酸链的反向平行对。ComputationalMolecularBiology计算分子生物学主要研究分子生物学数据的分析方法,开发分析工具。conformation构象蛋白质的空间构象。consensussequence一致序列在两个或多个同源序列的每一个位置上多数出现的核苷酸或氨基酸组成的序列conservedsequence保守序列在进化过程中基本保持不变的核酸与蛋白质序列,它们往往与特定的功能相对应。Contig连续交叠群基因组测序过程中将许多短的序列片段链接成很长的连续片段。convergentevolution趋同进化指相似基因型或表型性状的独立进化。例如,眼睛在各种生物体(如哺乳动物、软体动物以及昆虫)中独立进化,结构各异。corefold核心折叠构成蛋白质空间形状的基本模式。CpGislandCpG岛在哺乳类动物基因组中的一个500bp到3000bp的区域,该区域中的二核苷酸CpG的含量比其他区域的正常水平要高。通常,与此相关的是真核生物管家基因的启动子区域。crystal晶体由分子的规则排列组成的固体结构。Ddegeneracy简并性指某些氨基酸可以被一个以上的三联密码子编码的特性。denaturedprotein变性蛋白质指蛋白质因为受热作用或者去污剂或尿素等化学作用而失去了正常的三级结构和四级结构的结果。deoxyribonucleicacid(DNA)脱氧核糖核酸(DNA)由相连的核苷酸组成的双链生物二聚体,其核苷酸含有脱氧糖基。DNA是遗传的分子基础。dipeptide二肽由一个肽键连成的两个氨基酸。disulfidebond二硫键二硫键是蛋白质中两个半胱氨酸侧链之间形成的化学键。DNADNA参见脱氧核糖核酸。domain域(结构域)指蛋白质结构中相对独立的、具有特定功能的空间区域。dotplot点阵图对两条序列进行图形化比较的方法。图形中的一系列的斜线对应于序列相似的区域。dynamicprogramming动态规划一种可以有效地探求一定复杂问题的各种可能的解决方案的程序;它将一个问题合理分解成一些小的子问题,然后利用部分计算解得到最终答案。Eenhancer增强子可以与真核转录因子特异性结合的DNA序列片段。增强子序列可以在任何一个方向上起到逐渐增加转录水平的作用。enzyme酶一种生物催化剂(通常是蛋白质),能通过降低活化能使特定的化学反应可以更快地进行。EST(Expressedsequencetags)EST表达序列标签从cDNA的5'或3'端获取的短的DNA片段。euchromatin常染色质指真核生物中组蛋白高度甲基化(乙酰化?)并且DNA低度甲基化的开放染色质。exhaustivesearch穷举搜索对问题所有可能的解进行评估。exon外显子一个hnRNA分子的各个部分,它们被剪接后连在一起形成mRNA。expressionprofile表达谱基因在不同时空的表达模式。Ffamily家族在整个长度范围内有多于50%的氨基酸序列相同的蛋白质称为一个家族。fold折叠通常和术语“结构模体”有近似的含义,但是特别暗示在两个或更多的蛋白质中具有相似二级结构的大区域。fourfolddegeneratesite四重简并位点指那些改变一个核苷酸为任何其它三个中的一个都对核糖体将氨基酸插入到蛋白质没有影响的密码子位点。GG(Guanine)G(鸟嘌呤)两种嘌呤中的一种。gappenalty空位罚分为了减少序列比对中出现的空位,对空位进行减分的操作。gaps空位在两个具有共同祖先序列的比对中,为了反映插入或删除所引入的一个或一些破折号。GCcontentGC含量在DNA序列中,核苷酸G、C的组成相对于A、T的比例。gelelectrophoresis凝胶电泳指在电场的作用下,使带电分子穿过聚丙烯酰胺、淀粉或者琼脂糖凝胶,从而根据其大小和带电性进行分离的过程。gene基因DNA或RNA中,代表特定功能的某一段核苷酸序列;一种遗传的功能单元,它控制着一个或多个性状的传递和表达。genecontent基因内容一个基因组所包含的所有基因称为该基因组的基因内容。geneexpression基因表达利用存储在DNA中的信息来合成RNA分子,进而生成相应蛋白质的过程。geneidentification基因识别利用各种方法识别基因组中的基因序列。geneontology基因本体论关于基因和蛋白质知识的标准词汇,是今后实现各种与基因相关数据的统一、进行数据转换、开展数据挖掘的基础。geneorder基因次序基因在染色体上的排列顺序。genetree基因树基于同源基因分析得到的系统发生树。geneticmap遗传图谱以具有多态性的遗传标记为“路标”,以遗传学距离为图距的基因组图谱。genome基因组一个生物体全部遗传物质的总和。genomics基因组学研究基因组序列,研究序列与功能的关系,研究基因组中所包含的遗传信息。genomiclibrary基因文库包含有基因组DNA插入的克隆片段集合。genotype基因型一个个体或群体全部或部分的基因组成。globalalignment全局比对在全局范围内对两条序列进行比对打分的方法。GU-AGruleGU-AG规则这是一条与真核生物蛋白质编码基因相关的规则,说的是RNA内含子序列5'端的起始两个核苷酸总是5'-GU-3',并且其3'端的最后两个核苷酸总是5'-AG-3'。Hhairpinturn发夹环在RNA链中自身反转允许形成分子内碱基配对的位置。HashtableHash表一种数据结构,可以存储多个数值;不像矩阵要用整型索引获取存在其中的数,hash表可以用任何类型的值(包括字符串)作为索引。HiddenMarkovModels(HMM)隐马尔柯夫模型(HMM)在序列分析中常用的一种数学模型。heterochromatin异染色质指转录停滞、紧密包裹着的染色质;和高度DNA甲基化以及低度的组蛋白乙酰化有关。heuristicmethods启发式方法反复试验,利用经验解决问题的一种方法。homologs同源序列具有公共祖先的序列。horizontalgenetransfer基因水平转移基因从一个物种传递到另一个物种的过程。虽然病原体和转座子通常被疑似为导致它的原因,但是基因这种运动的机制仍然未知。HumanGenomeProject,HGP人类基因组计划通过全球合作,绘制人类基因组的全部序列图谱。housekeepinggene管家基因发育过程中在任何时间、在任何器官都高度表达的基因。H-P(hydrophobic-polar)modelH-P(疏水极性)模型以固定半径的单个原子表示蛋白质中的一个氨基酸残基的简单网格模型。hydrogenbonding氢键由于极性共价键的作用,使得电荷作用发生轻微分离而形成的分子相互作用。hydrophilic亲水的很容易在水性溶剂中溶解;字面上理解,就是和水易处的。hydrophobic疏水的难以和水分子相互作用,字面上就是厌水的。hydrophobicaminoacid疏水氨基酸含有一个全部由碳和氢组成的R基团的氨基酸;它不可能和水分子形成氢键hydrophobiccollapse疏水折叠将一个多肽链折叠成一个压缩的构象,从而使疏水残基远离溶剂的过程,简单的说,是由疏水作用而引起的肽链折叠。Iindel插入或删除插入或删除。inferredancestor25推断祖先通过系统发生树推断而得到的祖先。inferredtree推断树对三个或三个以上的同源序列的系统发生关系的描述,是它们真正关系的一个近似。informative有信息(位点)在简约性分析中的提供有用信息位点;与此对应的是无信息位点。ingroup内群(或内部物种)一个物种或一个分歧不大的物种系列;与此相对应的是外群。Inhibitor抑制剂任何可以降低酶促反应速度的物质。initiationcomplex起始复合物一系列自身相互作用的转录因子形成复合体,作用与一个基因的启动子区域,从而促进基因的转录启动。initiator(Inr)sequence起始序列真核基因中与转录起始位点密切相关的核苷酸;在人类中,该一致序列是5'-YYCARR-3'