生物信息学导论ppt

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生物信息学导论IntroductiontoBioinformatics朱怀球力学与工程科学系湍流与复杂系统国家重点实验室理论生物学中心Tel:62767261(Office)62759647(Lab)E-mail:hqzhu@pku.edu.cn课程安排1、时间:每周二晚11~12节(19:10~21:00)教室:一教208教室学时:每周2学时(总计162=32学时)2、学分:2学分3、成绩考核方式(无笔试):1次调研报告(分2次在课堂讨论),占总成绩50%1次学习研究论文(期末完成),占总成绩40%其它占总成绩10%4、E-mail:hqzhu@pku.edu.cnTel:62767261(office)(办公室地址:力学系力学楼503室)5、课程大纲和讲义可在北大理论生物学中心网站下载。()参考资料1.Westheadetal.,Bioinformatics(英文原版),科学出版社,2003年2.Pevzner,ComputationalMolecularBiology,MITPress,20003.Salzberg,etal.,ComputationalMethodsinMolecularBiology,ElsevierScience,19984.Waterman,IntroductiontoComputationalBiology,Chapman&Hall,19955.Durbin等,Biologicalsequenceanalysis(英文原版),清华大学出版社,20026.Brown著,袁建刚等译,基因组,科学出版社,2002年7.Campbell等著,孙之荣等译,探索基因组学、蛋白质组学和生物信息学,科学出版社,2004年8.郝柏林、张淑誉,生物信息学手册(第二版),上海科学技术出版社,2002年9.Attwood等著,罗静初等译,生物信息学概论,北京大学出版社,2002年10.Mount,Bioinformatics—SequenceandGenomeAnalysis,科学出版社,2002年(中文版由钟杨等译、高等教育出版社2003年出版)第一章前言§1.1从人类基因组计划(HGP)说起曼哈顿原子弹计划(1942-46)阿波罗登月计划(1961-69)人类基因组计划(1990-2003)1961年,美国总统Kennedy提出两个科学计划:登月计划攻克肿瘤计划人类遗传信息的复杂性人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘1、曼哈顿原子弹计划遗留问题的产物2、对生命科学和医学的科学影响“我们选择登月”(1962年Kennedy在Rice大学演讲)为什么提出HGP?生命活动三要素:物质、能量、信息DNA:遗传物质(遗传信息的载体)双螺旋结构A,C,G,T四种基本字符的复杂文本基因(Gene):具有遗传效应的DNA分子片段DNA、基因、基因组基因组(Genome):包含细胞或生物体的全套遗传信息的全部遗传物质原核生物(细菌、病毒等)真核生物(真菌、植物、动物等)人类基因组:3.2×109bp,含有约3万个基因1984.12犹他州阿尔塔组织会议,初步研讨测定人类整个基因组DNA序列的意义1985Dulbecco在《Science》撰文“肿瘤研究的转折点:人类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987美国能源部和国家卫生研究院(NIH)联合为“人类基因组计划”下拨启动经费约550万美元1989美国成立“国家人类基因组研究中心”,Watson担任第一任主任1990.10经美国国会批准,人类基因组计划正式启动JamesWatsonWalterGilbertHGP历史回顾尽管比之于人类登月,HGP的投入资金要少得多,但HGP对人类生活的影响要更为深远。因为随着这个计划的完成,DNA分子中编码的遗传信息将对人类存在的化学基础作出最终的回答。这将不仅帮助我们理解我们是如何作为健康的人发挥正常功能的,而且也将在化学水平上解释遗传因子在各种疾病,如癌症、早老痴呆症、精神分裂症等一些严重危害人类健康的疾病中的作用。毕竟对人类自身更深入的了解是人类活动中最重要的一个部分。——Watson,1990,《Science》HGP的最初目标通过国际合作,用15年时间(1990~2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。4张图:遗传图物理图序列图基因图HGP的终极目标阐明人类基因组全部DNA序列;识别基因;建立储存这些信息的数据库;开发数据分析工具;研究HGP实施所带来的伦理、法律和社会问题。1995第一个自由生物体流感嗜血菌(H.inf)的全基因组测序完成1996完成人类基因组计划的遗传作图启动模式生物基因组计划H.Inf全基因组Saccharomycescerevisiae酿酒酵母Caenorhabditiselegans秀丽线虫1997大肠杆菌(E.coli)全基因组测序完成1998完成人类基因组计划的物理作图开始人类基因组的大规模测序Celera公司加入,与公共领域竞争启动水稻基因组计划1999.7第5届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因组水稻基因组计划2000Celera公司宣布完成果蝇基因组测序国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作2000.6.26公共领域和Celera公司同时宣布完成人类基因组工作草图2001.2.15《Nature》刊文发表国际公共领域结果2001.2.16《Science》刊文发表Celera公司及其合作者结果Drosophilamelanogaster果蝇Arabidopsisthaliana拟南芥2001年2月15日《Nature》封面2001年2月16日《Science》封面AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.2001年8月26日人类基因组“中国卷”的绘制工作宣告完成。2002年水稻、小鼠、疟原虫等基因组测序完成2003年4月14日中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。2003年10月,2004年10月人类基因组完成图公布。种类数目备注古细菌(Archaea)26真细菌(Bacteria)282其中有的测定了2个以上的菌株真核生物(Eukaryo)47包括酵母、线虫、果蝇、蚊子、拟南芥、人等病毒(Virus)1087包括不同亚类或不同株系类病毒(Viroid)41包括不同亚类或不同株系噬菌体(Phage)254包括不同亚类或不同株系细胞器(Organelle)803包括线粒体和叶绿体质粒(Plasmid)407(,2006年2月)已完成测序的3,000个基因组1、大协作研究:以学科为中心以问题为中心,多学科合作2、研究的计划性和有序性:正反双方共同参与,制定更科学、更全面的研究计划4、政府与国家的作用:美:领导与推动英:始于1989年2月,贡献为1/3左右法:始于1990年6月,贡献为3%左右日:始于1990年,贡献为7%左右德:始于1995年,贡献为7%左右中:始于1999年9月,贡献为1%左右3、商业竞争促进基础研究:1998年Celera公司的加入HGP的研究特色5、可持续性:太空观测和基因组计划都是科学上出色的计划,每一个都是科学上迈出的一大步。但是两者之间存在着一个刺眼的差别:开支方面有四十倍的差别。开支的差别是至关重要的,因为这意味着可持续性。当一个计划足够便宜到成为一条可以无限向未来延伸的系列的第一个时,它是可持续的。而当一个计划太昂贵,以至不经过重大的政治斗争就无法重复时,它就是不可持续的。可持续计划带来新计划的开始,不可持续计划则标志着老时代的结束。《TheSun,theGenome,andtheInternet——ToolsofScientificRevolution》——FreemanDyson各学科参与、协作:生命科学、数学、物理学、化学、计算机科学、材料科学以及伦理、法律等社会科学……HGP带来的科学挑战HGP:Pandora'sBox首要科学问题如何找到记载在基因组DNA一维结构上控制生命时间、空间的调控信息的编码方式和调节规律。应用数学、复杂系统理论、信息论、非线性科学……催生生物信息学、计算生物学、系统生物学DNA芯片技术交叉性技术领域:物理学、微电子信息技术、生化技术、信息技术……结构生物学前沿领域之一:生物物理学、生物化学、晶体学、波谱学、光谱学以及X射线晶体衍射技术、核磁共振技术……§1.2计算生物学和生物信息学——后基因组时代的呼唤物理科学发展对生命科学的启示面对堆积如山的生物学数据…………新的生物学研究模式的出发点应该是理论的。科学家将从理论推测出发,然后再返回到实验中去,追踪或验证这些理论假设。……生物学家不仅必须成为计算机学者,而且也要改变他们研究生命现象的途径。——W.Gilbert,TowardsAParadigmShiftinBiology,Nature,349(1991)99传统生物学:实验科学现代生物学的发展:1、高通量数据获取日益实现自动化、半工业化从数据库中实现数据挖掘、知识发现2、海量数据难以完全依赖实验手段对新数据进行分析,必须借助计算机实现分析和筛选3、更复杂层次的生物学问题复杂的基因调控网络、代谢网络;细胞间信号转导过程;生物个体全部基因表达变化……分析、筛选大量新数据生物中的复杂网络、复杂过程、复杂现象理论生物学计算生物学21世纪生命科学理论计算实验数学与物理科学计算生物学/理论生物学与传统生物学的关系实验永远起着决定作用计算/理论生物学的发展离不开实验生物学的贡献实验生物学日益依赖计算/理论生物学的指导美国国家卫生研究院(NIH)的定义:Bioinformatics(Research,development,orapplicationofcomputationaltoolsandapproachesforexpandingtheuseofbiological,medical,behavioralorhealthdata,includingthosetoacquire,store,organize,archive,analyze,orvisualizesuchdata.)为拓展生物学、医学、行为学和卫生学数据的用途,而进行有关计算机方法手段的研究、开发与应用,包括此类数据的采集、存贮、整理、归档、分析与可视化。ComputationalBiology(Thedevelopmentandapplicationofdata-analyticalandtheoreticalmethods,mathematicalmodelingandcomputationalsimulationtechniquestothestudyofbiological,behavioral,andsocialsystems.)开发和应用数据分析、理论方法、数学模型和计算机仿真技术,用于生物学、行为学和社会群体系统的研究。BioinformaticsComputationalBiologyWhatisBioinformatics/ComputationalBiology?生物信息学(Bioinformatics)的来源Dr.H

1 / 67
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功