基因芯片数据的聚类分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

基因芯片数据的聚类分析作者:王富刚,陈先农作者单位:300192,天津,中国医学科学院,中国协和医科大学生物医学工程研究所刊名:国外医学(生物医学工程分册)英文刊名:BIOMEDICALENGINEERINGFOREIGNMEDICALSCIENCES年,卷(期):2004,27(2)被引用次数:8次参考文献(17条)1.DudoitS.YangYH.CallowMJStatisticalmethodsforidentifyingdifferenctiallyexpressedgenesinreplicatedcDNAmicroarrayexperiments20022.BozinovD.RahnenfuhrerJUnsupervisedtechniqueforrobusttargetseparationandanalysisofDNAmicroarrayspotsthroughadaptivepixelclustering20023.JainAK.MurtyMN.FlynnPJDataclustering:areview19994.van'tVeerLJ.DalH.vandeVijverMJGeneexpressionprofilingpredictsclinicaloutcomeofbreastcancer20025.HorimotoK.TohHStatisticalextimationofclusterboundariesingeneexpressionprofiledata20016.MedvedovicM.SivaganesanSBayesianinfinitemixturemodelbasedclusteringofgeneexpressionprofiles20027.GolubTR.SlonimDK.TamayoPMolecularclassificationofcancer:classdiscoveryandclasspredictionbygeneexpressionmonitoring19998.MavroudiS.PapadimitriouS.BezerianosAGeneexpressiondataanalysiswithadynamicallyextendedself-organizedmapthatexploitsclassinformation20029.XuYing.OlmanV.XuDongClusteringgeneexpressiondatausingagraph-theoreticapproach:anapplicationofminimumspanningtrees200210.MclachlanGJ.BeanRW.PeelDAMixtureModel-basedApproachtotheClusteringofMicroarrayExpressionData200211.LukashinAV.FuchsRAnalysisoftemporalgeneexpressionprofiles:clusteringbysimulatedannealinganddeterminingtheoptimalnumberofclusters200112.SmetFD.MathysJ.MarchalMAdaptivequality-basedclusteringofgeneexpressionprofiles200213.WhitfieldCW.CzikoAM.RobinsonGEGeneexpressionprofilesinthebrainpredictbehaviorinindividualhoneybees200314.NguyenDV.RockeDMTumorclassificationbypartialleastsquaresusingmicroarraygeneexpressiondata200215.RhodesDR.MillerJC.HaabBBCIT:identificationofdifferentiallyexpressedclustersofgenesfrommicroarraydata200216.SturnA.AlatkoJQGenesis:clusteranalysisofmicroarraydata200217.XiaXu-hua.XieZhengAMADA:analysisofmicroarraydata2001相似文献(10条)1.期刊论文朱小锋.毕树生.王浤西.刘红星.ZhuXiaofeng.BiShusheng.WangHongxi.LiuHongxing微阵列PCR基因芯片扫描仪的研制-军民两用技术与产品2007(4)介绍了微阵列PCR基因芯片扫描仪的基本结构、工作原理和关键技术,给出了光学系统的参考标准构型,重点讨论了PCR反应温度控制系统的特性和特点,以及扫描仪中CCD的选用原则.实验采用cNDA为模板的反应体系进行PCR反应,通过实验前后检测样品荧光变化的强弱测定微阵列PCR基因芯片扫描仪的检测性能.实验结果初步表明,该扫描仪可用于微阵列PCR基因芯片的检测.2.学位论文李笑基于神经网络的微阵列基因芯片数据分析2006微阵列技术的到来将对生物学和医学产生一场革命,通过它可以同时观测成千上万个基因的表达水平,从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。微阵列基因表达数据已经应用到肿瘤分型、肿瘤分类、基因功能研究、基因之间调控网络构建以及药物靶位识别等许多方面,对表达谱数据的分析已成为生物信息学研究的焦点。本文主要研究基于基因表达数据的数据分析方法,并针对已有的算法与模型当中所存在的问题,提出对算法的改进。本文在介绍了微阵列数据原理的基础上,首先介绍了数据预处理和特征提取过程,之后讨论了两个紧密相关的应用领域:肿瘤分类和聚类。在肿瘤分类中,主要研究了基于BP神经网络的方法和基于支撑向量机(SupportVectorMachine,SVM)用于多类别分类的方法。实验结果表明,BP网络设计适当的情况下能够得到很好的分类结果,识别率高。而用两类支撑向量机构造多类别分类器,应用到14个类别的基因表达数据中,取得了较好的实验效果,同时与KNN方法进行比较,可以看出基于SVM构成的分类系统尤其适合于多类别的基因表达谱数据集分类。在基于SVM的方法用于多类别问题中,对比了两种构造方法OnevsAll(OVA)以及AllPairs(AP)的结果,两种结合方法中OVA方法的识别率优越于其他方法,性能稳定。分类性能均达到或超过了公开发表的实验结果。在研究组织样本的聚类分析过程中,实现并对比了以下几种方法:层次聚类法、k均值法,同时本文采用了一种非常新颖的自组织特征映射神经网络的改进模型-DoubleSelf-OrganizingMap(DSOM)方法。实验证明DSOM网络应用到癌症基因表达谱数据分析中是很有效和可靠的,而且此方法具有可视化的优点,将高维的数据投射到二维平面上,更清楚地观测到聚类效果。聚类结果可以辅助病理学家进行进一步的有关肿瘤诊断和治疗。3.会议论文阴启明.叶嘉明.谢永元.周勇亮超亲疏水图案改善微阵列质量2007虽然以基因芯片为代表的微阵列(Microarray)技术已经在生物、检疫、制药等领域得到较广泛的应用,但其数据的不精确性仍然是阻碍应用普及以及获得卫生医药部门认可的重要障碍之一。本文提出以超疏水的基底上制作超亲水的微图案作为微阵列的基底,减轻“咖啡效应”,提高微阵列样品点的均匀性,并进行了免疫蛋白微阵列的制作及免疫反应等初步试验。4.学位论文骆婷婷用户化的微阵列数据库平台研究2006随着近代分子生物学实验技术和计算机技术的迅猛发展,以及人类基因组草图(HGD)绘制的顺利完成,标志着现代生命科学研究已经进入了后基因组时代,研究者把关心的焦点由结构基因组学转向了功能基因组学。基因芯片(genechip,microarray)作为一种新型的高通量的检测技术方法,可以同时测量成千上万个基因的表达水平,已成为“后基因组时代”研究基因与基因间相互作用的一个强有力的工具。如何对该技术产生的海量实验数据进行准确而合理地管理和分析已成为是否能有效应用该项技术的主要问题,并决定着当前生物信息学的重要研究内容和主要研究方向。虽然目前已有许多学术性或商业化的微阵列系统软件应运而生,但具有全面解决方案的系统却尚属罕见,并时常会出现缺少实用性、可扩展性或标准界面等情况。另外,开发一种整合系统,往往需要一个统一、先进的软件架构来加强其安装和维护。所以,为满足上述需求,本课题在生物科学、微电子学以及计算机科学等学科相互交叉的基础上,提出了一个名为MDME的微阵列数据分析软件架构,此数据库拥有较完善的研制方案,可根据特定的实验环境、样本环境为用户提供全面的检索服务。本文研究工作如下:1.研制了该微阵列数据库系统的整体架构,在此基础上提出了数据库存储后端、用户验证、管理及访问控制模块、数据分析及其可视化模块、数据标注模块的实现方法。2.在数据分析及其可视化模块的实现过程中,引入了一种新的聚类算法和一个用于分析multi-variable微阵列基因表达数据的通用3-D可视化工具,有效地提高了系统的分析效率。3.开发并研制了一个基于关系数据库中persistence层的代码产生器ODBI,详细阐述了该代码产生器的数据模式结构、各组成模块、通信协议以及ODBI设计器的实现过程。4.对ODBI代码产生器的运行状况进行评估,达到了预期的效果,并提出改进措施。研究结果表明,该课题为用户提供了从数据存储、分析、解析到共享等一系列全面的服务,有效地避免了微阵列数据分析过程中的某些不连贯情况,从而帮助用户能够更快、更准确地得到相应的生物学信息。另外,系统中的ODBI代码产生器也很好地解决了我们在将面向对象编程与关系数据库进行关联时,两者处理对象不一致的矛盾,使系统可以在一个较高的层次上对关系数据表进行操作,增强了系统的通用性及可维护性。通过对基于生物信息学的微阵列数据库平台的研制和开发,为基因数据的存储、分析和结果的交流提出了一种更为广泛的方法,从而对基因芯片数据分析的发展起到了重要的推动作用。5.期刊论文余志文.于军.徐静平.周文利.YUZhi-wen.YUJun.XUJing-ping.ZHOUWen-li基因芯片中点阵的微电子加工技术-微电子学2001,31(2)基因芯片是运用微电子加工技术以及基因分子的自组装技术在微小芯片上组装成千上万个不同的DNA微阵列,实现以基因为主的生命信息的大规模检测。文章利用氧化、光刻、蒸发、溅射等一系列集成电路工艺技术,研究了适于电化学检测的基因芯片微阵列的制备,提出了这种芯片中微流路的制备方案。6.学位论文张瑾基因微阵列数据的双向聚类算法研究2008基因芯片是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列。基因芯片上探针与经荧光标记的目标样品进行生物反应,利用专用芯片检测系统并借助于一定的软件即可得到基因表达数据。这个技术应用于不同发展阶段,不同人体组织,不同临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生命科学研究、疾病诊断、新药开发、食品卫生监督等领域带来二场革命。本文的贡献主要体现在以下几个方面:首先,对基因数据分析中的一种双向聚类方法—格子模型法进行了深入的分析,并对其进行了改进。格子模型是一个混合有二进制变量和连续变量的模型。对于该模型,传统的用于连续变量的优化算法不再适用。为此,本文提出了一种新颖的神经网络方法来解决这种混合有二进制变量和连续变量的优化问题,并将该方法应用于酵母数据分析,实验结果表明使用这种方法后双聚类的精度得到了很大的提高。其次,本文还对基因数据分析的另一种方法非负矩阵分解方法进行了改进。传统的非负矩阵分解算法有一定缺陷,其初始值是随机设定的,因此在迭代过程中会出现微小的抖动。为此本文在迭代计算过程中加入了数据平滑处理,并将该方法用于一组白血病微阵列数据分析。实验结果

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功