生物信息学综述[摘要]:生物信息学(Bioinformatics)是建立在数学,计算机科学和生命科学基础之上的一门交叉学科.早在1956年美国田纳西州的Gatlinburg召开的首次生物学中的信息理论讨论会上就已产生了这一概念.随着相关生物技术的革命性发展和生物学相关信息量呈现的革命性爆炸,生物信息学已成为当今最具发展前途的学科之一.生物信息学极大的推动了分子生物学,基因组学,蛋白质组学和代谢组学等的发展,已成为医学,农学,生物学等学科发展的强大推动力,也是药物设计,环境监测等的重要技术支撑。生物信息学在基因的功能发现,疾病基因诊断,蛋白质结构预测,基于结构的药物设计,药物合成和制药工业中起着重要的作用,生物信息学的应用大大加快了药物的研究开发进程。[关键词]:生物信息学、产生背景、主要研究内容、发展现状、发展前景一、生物信息学的产生21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。二、生物信息学研究内容(一)序列比对比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。(二)结构比对比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。(三)蛋白质结构预测从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。(四)计算机辅助基因识别给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。(五)非编码区分析和DNA语言研究在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。三、国内生物信息学的现状与未来展望生命科学与信息科学是目前发展最快的两大领域,作为这两大学科的交叉产物之一,生物信息学同样发展迅速,并在基因组学研究中发挥巨大的作用。国外一直很重视生物信息学的发展,各种专业研究机构和公司涌现很多,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增。由于对生物信息学人才的需求迅猛,发达国家也面临着供不应求,人才匮乏的局面。国内对生物信息学领域也越来越重视,取得了一定的成绩,甚至在国际上还占有一席之地,但从全国总体水平来看和国际水平还是有很大差距,需要努力。生物信息学将会揭示人类及重要动植物种类的基因信息,为生物大分子结构模拟和药物设计提供巨大帮助.生物信息学不仅对认识生物体和生物信息的起源、遗传、发育与进化的本质有重要意义,而且将为人类疾患的诊治开辟全新的途径,还可以为动植物的物种改良提供坚实的理论基础.生物信息学不仅具有重大的科学意义,而且具有巨大的经济效益.一只小鼠的肥胖基因都值上亿美元,关系到人类自身生老病死的基因的价值就更高了.生物信息学的许多研究成果可以较快地产业化,成为价值很高的产品.生物信息学的这一特点在现有的许多学科中几乎是独一无二的.目前生物信息学的发展已经超越了它的最初目标.现在可以说生物信息学的重要目标在于理解生物学数据和揭示生命本质,但是它的前景仍是不可估量的可以的.可以肯定,在不远的将来,生物信息学的研究成果不仅被应用于生物、医学等相关领域,同时它将对其他学科,包括信息科学、数学、计算机科学、物理学等的研究产生巨大的影响.经过十几年或更长的时间的努力,逐渐使我国成为生物信息学研究强国,是完全有可能的。信息学的商业价值十分显著。国外很多大学,研究机构,软件公司甚至政府机构纷纷成立各种生物信息机构,建立自立的生物信息集成系统,研制这方面的软件,重金招聘人才,期望从中获取更多的生物信息和数据加以研究和利用,缩短药物开发周期,抢注基因专利,获取更大利润。我国如不加大资金投入力度,将来可能会花更多的钱去购买别人的软件,使用专利基因或购买新的药物。所幸,我国也开始重视这一学科:南、北方人类基因组中心的相继建成,北大生物城的破土动工等,标志着我国对生物信息学的重视。我们有理由相信,我国的生物信息学在21世纪会有巨大的飞跃。