数据挖掘期末论文

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

医学数据挖掘期末论文数据挖掘技术在中医方剂研究中应用的探讨学生姓名________专业_________________学院__________________2016年6月数据挖掘技术在中医方剂研究中应用的探讨湛薇摘要:现有的中医方剂数据存在冗余大的、不一致的、无效的噪声数据,降低了中医方剂数据的利用,且其方剂数据需要更加高效的存储、查询以及共享。而数据库技术融汇了人工智能、模式识别、模糊数学、数据库、数理统计等多种技术方法专门用于海量数据的处理[1],从而解决中医方剂研究中所存在的问题,提高利用效率并且发掘潜在信息。本文利用关联规则、聚类分析、分类模式等数据挖掘方法,揭示方剂配伍规律的研究,对中医方剂信息的问题进行探讨。关键词:中医方剂;数据挖掘技术;关联规则;聚类分析;分类模式DataminingtechnologyappliedinthestudyofprescriptionoftraditionalChinesemedicineZhanWei【Absract】:ExistingintraditionalChinesemedicineprescriptiondataredundancy,bignoise,inconsistent,invaliddata,reducestheuseoftraditionalChinesemedicineprescriptiondata,andtheprescriptiondataneedtobemoreefficientstorage,queryandsharing.Andthedatabasetechnologyofartificialintelligence,patternrecognition,fuzzymathematics,database,mathematicalstatisticsandsoonthemanykindsoftechnicalmethodsspecificallyformassdataprocessing[1],soastosolvetheproblemsintheresearchofTCMprescriptionsandimprovetheutilizationefficiencyandexplorepotentialinformation.Basedonassociationrule,clusteringanalysisanddataminingmethodssuchasclassificationmodel,revealsthelawofherbalresearch,discussestheproblemofprescriptionoftraditionalChinesemedicineinformation.【Keywords】:PrescriptionsoftraditionalChinesemedicine;Dataminingtechnology;Associationrules;Clusteringanalysis;Classificationmodel1引言中医学信息化在这几年来发展迅速,大量中医方剂数据库已被构建与完善,但中医方剂的数据挖掘方面依然有很多亟待解决的问题。虽然众多已经构建的方剂数据库都是经过一系列的校正后的结构化数据库,但由于在浩瀚的中医历史之中,其年代跨度实在太大、朝代变更下使用的文字、记叙方式与特点的差异悬殊,使得方剂信息依然不可避免的会出现方剂数据不一致、错误、冗余等问题。数据挖掘技术在数据中正规地发现有效的、新颖的、潜在有用的,并且最终可以被读懂的模式的过程。具有善于挖掘超大型数据库、非手工地发现隐含知识、增进人类知识的特点[2],因此,数据挖掘技术对于中医方剂研究所存在冗余的、不一致的、错误的等一系列噪声数据的解决具有重大意义。另一方面,而中医方剂配伍从本质上来说表现在方与方、药与药、方与药、药与剂量,以及方药与病、症之间的交叉错综的关联与对应。数据挖掘正是通过数据特征、关系、聚类、趋向、偏差和特例现象深层的多维分析,来揭示数据间复杂特殊的关系,发现隐含规则模式和规律。2方剂配伍研究中的数据挖掘方法2.1关联规则关联规则是数据挖掘中的一项重要技术,反映大量数据中项目集之间的关联和相关联系。关联规则也是目前用于中医方剂配伍研究中最经典的一种方法,一般通过降维处理将复杂的病、症、方、药关系分解,研究药与药、方与方、药与症状等两者之间的关系。基于关联规则的研究呈现如下特点:主要研究药与药之间的关联关系,其他病症、病方之间的关系研究得较少,研究对象包括某一类方或者治疗某一病症的方剂。研究方法不能证明具有普遍适用性;关联规则的算法参数,即最小支持度大部分为10%左右,支持度偏小,使得发现的关联关系的可信度不高。2.2聚类分析聚类分析即按照相似性和差异性的分布,将数据对象按照不同的属性特征聚集为不同的类,然后结合领域知识对方剂的配伍规律进行分析。聚类分析的算法有很多种,如基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于网格的聚类算法等,不同算法在不同领域以及数据集上得到应用。在方剂配伍规律分析领域,使用较多的事层次聚类方法,也可采用模糊聚类方法建立模糊相似矩阵类分析药物之间的相似度。模糊聚类方法以模糊数学中的聚类方法为理论基础,通过建立模糊矩阵最终获得聚类结果,其方法简单易行,在处理小数据量上可以收到较好效果。层次聚类算法可以对给定的数据集进行层次的分解,直到某种条件满足为止,具体分为凝聚和分裂两种方法。该算法简单快捷而且能有效地处理大数据集,但是合并或者分裂点的选择至关重要,直接决定了聚类结果的质量。采用模糊聚类的研究对象多是古代经典名方,研究内容是具体方剂的组成原则,即方中君臣佐使药物的确定,验证结果的方法是中医方剂的传统理论,此种研究尚处于探索阶段。而其结果的准确性未被广泛验证,但是该方法对于方剂配伍规律的理解以及配伍规范化具有重要作用。层次聚类算法的研究对象为治疗某一病症的复方,依据单味药功效进行聚类,获得若干个药物组合类别,结合病的临床症状推断证型和用药,这种研究方法在一定程度上研究了药证与药方之间的关系,并对临床治疗疾病具有指导意义。2.3分类模式分类模式是根据数据集的特点构造一个分类器,利用分类器对未知的样本赋予类别的一种技术。分类算法主要有决策树、人工神经网络、贝叶斯网络等。不同分类方法会产生不同的分类器,分类器的优劣直接影响数据挖掘的效率与准确性。通过分类模式可以实现多角度的方剂分类和方剂功效的判定。在方剂的分类模式研究当中,目前常用的分类算法有人工神经网和支持向量机方法。运用这些方法基于已知的方剂分类标准,可以将大量方剂按照组方药物的功效、性味或归经等众多维度、多角度分成若干类,或判定单个方剂的功效,从而对理解方剂中药与药、药与法、药与证等之间的关系奠定研究基础。着方面的研究虽然取得某些成果,形成了多个方剂分析系统,但是涉及的训练集仅是治疗某些病症或者一部著作记载的方剂,缺乏选取大量数据对这些系统的分析结果进行验证。因此分类模式研究方剂配伍规律有待选择多种算法开展深入研究。2.4研究方法的分析首先,从采取的数据来源看,主要有三类。一类是以现有的中医文献数据库或者辞典为基础选取治疗某类疾病的方剂作为研究的数据;一类是以某段时期的文献为基础选取治疗某类疾病的方剂作为研究的数据;还有一类是以一些名医的临床治疗处方作为研究数据。总体来看,方剂文献的来源趋向于多样性,这给方法的有效性和深入性地研究带来了难度。其次,基于当前的文献研究,可以依据拟解决的问题对前面提到的三种数据挖掘方法的适用范围归类。关联规则所解决的问题包括:治疗某一病症的用药规律,即药物间的关系;症状间的关系;药和症状的关系;药和证的关系。聚类分析所解决的问题包括:方剂中药物君臣佐使的配伍关系;治疗某一病或证的基础方法。分类模式所解决的问题包括:方剂的功效归纳,方剂的属性归纳。最后,从挖掘对象来看,呈现多样性。从单味药到一类药;从单个复方剂或治疗某一病症的复方。其中关联规则挖掘的对象包括治疗某一病症的复方、某一类复方、某一类药等,分类模式挖掘的对象包括某一类方[3]。3数据挖掘以分类关联规则为例,在分类关联规则挖掘中,支持度和置信度是描述分类关联规则兴趣度的两项重要指标。支持度反映规则的普遍性,置信度反映规则的可靠性[4]。若最小支持度阈值取2%,犹豫《伤寒杂病论》中的方剂数量为286首,286×2%>5,意味着要选择频次大于5的要不进行分析。综合仲景标准DB数据库,认为此最小支持度阈值的取值对研究可行。置信度的公式Confidence(A-B)=P(A∣B),揭示了A出现时,B是否也会出现或有多大的概率出现。如果置信度为100%则说明A出现时B必定会出现;如果置信度太低,则说明A的出现于B是否出现关系不大,故最小置信度阈值为50%。数据挖掘部分结果如表1至3所示。通过数据挖掘,发现以下规律:按病性归类时,多选用麻黄、桂枝、生姜、大葱等辛热之品来治疗寒证;多选用黄苓与其他补虚或泻火实药配伍来治疗热证;多用茯苓、甘草、附子、白术等来治疗虚证;多用甘草、麻黄、杏仁等药来治疗在表的疾病;病位在里的疾病,如治疗病位在脾胃的疾病则多选用细辛、五味子、半夏、干姜等;治疗病位在胆的则多选用柴胡、黄苓等。按病势归类时,发现治疗太阳病时一般选用桂枝、生姜、甘草、大枣、大黄;治疗阳明病一般选用黄连、柴胡等;治疗少阳病一般选用桂枝、白芍、大枣、甘草、厚朴等;治疗少阴病一般选川乌、人参、白芍、黄芪等。综上,得出《伤寒杂病论》中的条文在治疗疾病时。多根据所治疾病的病性、病位和病势的不同来选择、搭配使用不同药物。4总结本文分析了数据挖掘技术在中医方剂研究中应用的探讨,对几种方剂配伍研究中的数据挖掘方法进行详细的分析,也利用数据挖掘技术研究《伤寒杂病论》中的方剂药物配伍规律,通过数学计算的新方法对《伤寒杂病论》中的方剂进行挖掘研究,是未来完善此项课题努力的方向之一。参考文献:[1]王静,崔蒙.数据挖掘技术在中医方剂学研究中的应用[J].中国中医院信息杂志.2008(15):103-104[2]崔雷,刘建炜,马敬东等.医学数据挖掘[M].北京:高等教育出版社.2011:4-5[3]张林,梁茂新,宫俊等.基于数据挖掘技术的方剂配伍规律研究述评[J].现代诗生物信息进展.2010(20):3945-3955[4]林端宜.基于分类关联规则的仲景方剂挖掘研究[J].福建中医药大学,2008,8(1):24-26

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功