生物資訊學:未來醫藥研究的利器蔡少正國立成功大學醫學院生理學研究所©2000SeanTsai,Ph.D.NationalChengKungUniversity大綱一、生物資訊學的發展二、研究生物資訊學的工具三、生物資訊學的應用四、國內生物資訊學的現況五、國內生物資訊的的未來六、生物資訊學的展望定義:利用電腦輔助資料管理系統從基因體(Genomic)、蛋白質體(proteomics)或藥物篩選資料庫中蒐集、整合、及分析大量的生物序列或資訊。生物資訊學(Bioinformatics)與人類基因組解讀計劃(HumanGenomeProject)生物資訊學的發展#bpinbillions1231982-2000涵蓋分子生物、資訊工程、統計等學門的新科學計算生物學(computationalbiology):處理生物(序列)資料的科學蘊涵無限寶藏的科學---序列取得、結構分析、功能預測、模擬驗證。生物資訊學的發展後基因體分析紀元(Post-genomeEra)人類基因組解讀計劃(HumanGenomeProject)已於今年六月完成基因體序列“初稿”定序工作基因體序列“初稿”涵蓋了97%的人類基因體序列,其中85%已經組合起來成為連續的序列,正確率為99.9%。總計有39億個序列存放在公用資料庫中其他物種如老鼠、果蠅、線蟲、阿拉伯芥、水稻、霍亂弧菌的基因體序列也已經被完全解讀出來或接近完成解讀階段後基因體分析紀元(Post-genomeEra)功能性基因體(FunctionalGenomics)世代來臨下一階段的目標:組合一個沒有“間隙”(Gap)的染色體圖譜,並且提高序列正確率至99.99%---基因註解---基因預測---蛋白質功能研究(proteomics)---單核甘酸多樣性(singlenucleotidepolymorphismsorSNPs)功能性基因體(FunctionalGenomics)辨認所有的基因並瞭解他們的功能:研究生物資訊學的工具資料庫(database)序列分析、搜尋系統文獻查詢基因註解(geneannotation)高速計算能力的軟、硬體資料探勘(datamining)工具生物資訊學的搜尋與分析工具文獻查詢工具:序列查詢工具:序列分析工具:NCBI(PubMed),NHRI(Hint),NCKU(Medline)NCBI(Entrez),EBI(SRS),GenomeNet(DBGET),GCG(Blast),GenWeb(Smith-Waterman)Server:GCG,SeqWebPC/Mac:VectorNTI(PC),MacVectorDatamining工具-序列搜尋方法Blast系列:搜尋速度很快,但在序列相似性較低時會有失誤,有可能會漏掉一些相關的序列。在GCG的環境下使用私有的資料庫,兩個月才更新一次。而NetBlast則可以選用美國NCBI的資料庫,這樣比對的資料庫才較完整。Smith-Waterman系列:靈敏、但速度慢到必須用硬體加速才實用。以一未知的DNA序列去搜尋資料庫中相似的所有序列(包括DNA、protein)生物資訊學的應用基因組地圖繪製(GenomeMapping)藥物設計(DrugDesign)分子演化樹建立(MolecularEvolution)新基因的辨認(GeneIdentification)生物資訊學與生物科技生物晶片(Bio-chip):微陣列(Micro-array)cDNAchipOligonucleotidechipProtein(peptide)chipInsilicon-PCR:微毫米科技(Nanotechnology)藥物基因體學(Pharmacogenomics)定義:功能性基因體學與分子藥理學的結合目的:發現個別遺傳差異與對藥物反應的關係例子:Zyflo®(Zileuton):Asthmatherapy,livertoxicity利用單核甘酸多形性(SNP)找出與hepatotoxicity有關的基因型單核甘酸多形性(SNP)任何非同卵雙胞胎的個體間核甘酸的相似程度為99.9%,也就是說,每1000個核甘酸中便有一個是不同的,即所謂的DNAvariants。這些DNAvariants大部分位於非蛋白質表現區(nonecodingregion),但其對蛋白質的表現及功能的影響還是相當的大。SNP的寓意:種源的追溯、疾病的診斷、量身定做的藥物GGATTTACTAlleleSpecificOligonucleotide(ASOassay)SequencevariantGGATTTACAGGPCRProductGGATTTACC(A/T)IndividualgenotypeHTR5AHTR7EnzymaticCleavageMethodologyBaseExcisionSequenceScanning(BESS)system–T&GscanFluorescent-labeledprimersandABI310GeneticAnalyzerPossibleSequenceVariantsTAGCT/Ascan:10/12=83%AGCGCTACTAGTBESST&G-Scananalysis基因與人類疾病目前已知有91個與人類疾病相關的基因被定位出來,其中有91%(83個)在EST資料庫中找到相對應的序列。卵巢癌與乳癌:BRCA1(17),BRCA2(13)大腸癌:MLH1(3),MSH2(2),MSH6(2)阿茲海默症:PS2(1),PS1(14)易脆X染色體症:FMR1(X)苯丙酮尿症:PHA(12)裘馨肌萎縮症:DMD(X)例如:資訊引導研究-發現b-secretase1999年末,四家藥廠幾乎同時宣佈找到了導致老人痴呆症(Alzheimer’sdisease)發病的蛋白脢Amgen:Expressioncloningstrategy(screened860000clones)Pharmacia&Upjohn:Bioinformaticsapproach(C.elegansaspartylproteases---humanorthologs---4newgenes)ElanPharmaceutical:Biochemicalapproach:Purifiedproteinwithaspartylenzymeactivity---.inhibitor---verifySmithKlineBeecham:Protein-microsequence-cDNA-screeningEST(expressedsequencetag):5‘and3’cDNAsequence,300-400bases,98%accuracy資訊引導研究-ESTdataminingMorethan1,000putativenewhumansignalingproteinsrevealedbyESTdatamining--NatureGenetics,June2000dbEST序列數目(至Aug4,2000止):over4.5millionHomosapiens(human)2,212,489Musmusculus+domesticus(mouse)1,600,227Rattussp.(rat)188,622利用微陣列研究基因表現15,000mousegenesarray300highlyexpressedinplacenta420higherinembryo80%ofthegeneswerepreviouslyunidentified預測人類的基因利用其他物種的基因利用某一染色體上的基因數利用EST資料庫中的序列傳統的方法微毫米科技(Nanotechnology)建立原子大小的檢測設備SemiconductormicrochipDrugdeliverymachineSinglecellanalysissystemDNAcomputer國內生物資訊學的現況需求:目前的需求量不高–生物研究學者不知如何使用生物資訊或序列分析工具做研究(不會用所以沒有需求)–沒有自己的資料庫或分析工具–沒有足夠的運算資源研究:沒有真正生物資訊學出身的研究者陽明大學、中央大學、台灣大學、成功大學、清華大學、中央研究院資源:異常有限國家衛生研究院高速電腦中心國內生物資訊學的現況經費:稍有進步國家衛生研究院國科會教育訓練:迎頭趕上短期訓練課程生物資訊學課程生物資訊學程國內生物資訊學發展的方向微陣列(micro-array)製作技術、分析方法的提升–發展新的檢驗試劑–發展新的檢測法(腸病毒)建立加值型資料庫–發現新基因–發現新藥或新療法(中、草藥)蛋白質體(proteomic)–二維蛋白分析(2Dgel)–與LC-mass,EC-mass等微量分析法結合何謂加值型資料庫?原始資料庫Genebank,ESTdatabase加值型資料庫初步或未加整理的序列資訊比對、計算、整理只擷取部分有用的資訊加以歸類儲存重複序列資料庫、訊息傳遞因子資料庫(Smartdatabase)實用價值較低具高附加價值未來10年將是生物資訊學最蓬勃發展的世紀國父:二十世紀是三民主義的世紀@@:二十一世紀是生物資訊的世紀基因醫藥的研發、基礎或臨床研究唯有藉助生物資訊學的幫助才能有發展的空間以提供生物資訊諮詢或服務的公司將是未來市場的主力生物資訊學的展望生物資訊學的展望-生技產業最賺錢的行業行業市場(1998)市場(2002)E-basedB-to-Bmarket$800$220,000B-to-Bbiomedicalinformation$300$1,000Pharmacogenomicsdatagathering&analysisalliances$1,000$3,5000Biochip-baseddatagathering&analysisalliances$500$4,000單位:百萬美元資料來源:CogniaCorp;Biovista基因戰爭與基因恐慌一滴血或一根頭髮醫、病關係的變革基因歧視訂做一個他?序列及蛋白質資料庫一、公用資料庫:NCBI(美國)EBI(歐洲):DDBJ(日本)二、私人公司資料庫:CeleraDoubletwistDatabasesinNationalCenterforBiotechnologyInformationPDB(ProteinDataBank):蛋白質資料銀行,最重要的蛋白質資料庫。ExPASy:ExPASy位於瑞士日內瓦大學,共有六個資料庫。(l)Swiss-Prot:(4)Swiss-3DImage:(2)PROSITE:(5)ENZYME:(3)Swiss-2DPage:(6)SeqAnalRef:蛋白質資料庫二維電泳資料庫2DGel越來越多造成遺傳疾病的缺陷基因,它們在染色體上的位置被決定出來了。引起追蹤治病基因聖戰的著名的亨丁頓氏舞蹈症(Huntington‘sdisease)它的對應基因位在第四對染色體上。成立地點:國立成功大學成立宗旨:提供南部地區生物資訊教育訓練課程及相關服務成立南區生物資訊教育訓練課程推廣服務中心成立南區生物資訊教育訓練課程推廣服務中心一、常設性學期課程二、短期性研討會課程三、特殊專題性研討會四、生物資訊學程教育訓練課程規畫1.成立生物資訊核心實驗室2.提供硬體設備協助生物資訊軟體之研發3.專任助理提供咨詢服務成立南區生物資訊教育訓練課程推廣服務中心(推廣服務項目規畫)一、在地性服務1.專屬網站及電子郵件信箱2.設立FAQ專門網頁二、遠端性服務SemiconductorDNAchipSemiconductorDNAchipSequenceHomologySearchingStructure-BasedDrugDesignViewingProteinStructuresGettingproteinStructuresRetrievingDNAsequenceUsingProteinToolsAlzh