朴素贝叶斯分类模型的研究与应用作者:王峻学位授予单位:合肥工业大学参考文献(34条)1.赵斌关联规则分布式挖掘算法研究和实现[学位论文]硕士20032.UFayyadM.Piatetsky-Shapiro.GSmythFromDataMiningtoKnowledgeDiscovery;AnOverview19963.王德兴基于量化概念格的关联规则挖掘模型研究[学位论文]硕士20034.姜卯生数据挖掘中基于贝叶斯技术的分类问题的研究[学位论文]硕士20045.WJFrawley.GPiatetsky.CShapiro.J.MatheusKnowledgeDiscoveryinDatabases:AnOverview19916.APerspectiveonDatabasesandDataMining7.谈恒贵.王文杰.李游华数据挖掘分类算法综述[期刊论文]-微型机与应用2005(2)8.HanJiaweiKamberM.范明.孟小峰数据挖掘概念与技术20019.张海笑.徐小明数据挖掘中分类方法的研究[期刊论文]-山西电子技术2005(2)10.于莉基于高校学生信息库的数据挖掘200411.郭亚光基于粗糙集合和朴素贝叶斯模型的分类问题研究[学位论文]硕士200512.JiaweiHan.MichelinsKamberDATAMININGConceptsandTechniques200113.TomM·Mitchell.曾华军.张银奎机器学习200314.张云涛.龚玲数据挖掘原理与技术200415.MiaKStern.JosephE.BeverlyParkWoofNativeBayesClassifiersforUserModeling16.PedroDomingos.MichaelPazzzaniOntheOptimalityoftheSimpleBayesianClassifierunderzero-oneLoss199717.CElkanBoostingandNaiveBayesianLearning199718.张璠多种策略改进朴素贝叶斯分类器[期刊论文]-微机发展2005(4)19.石洪波.王志海.黄厚宽.励晓健一种限定性的双层贝叶斯分类模型[期刊论文]-软件学报2004(2)20.林士敏.田凤占.陆玉昌用于数据采掘的贝叶斯分类器研究[期刊论文]-计算机科学2000(10)21.MehranSahamiLearningLimitedDependenceBayesianClassifers199722.LiorRokach.OdedMainonTheoryandApplicationsofAttributeDecomposition23.张剑飞贝叶斯网络学习方法和算法研究[学位论文]硕士200524.罗宁.穆志纯基于贝叶斯网的分类器及其在CRM中的应用[期刊论文]-计算机应用2004(3)25.MauricePagnuccoReasoningUnderUncertaintyandBayesianNetworks200226.DavidMaxwell.DavidHerkerman.ChristopherMeekTechnicalReport:ABayesianApproachtoLearningBayesianNetworkswithLocalStructure199727.宫秀军.刘少辉.史忠植一种增量贝叶斯分类模型[期刊论文]-计算机学报2002(6)28.宫秀军.孙建平.史忠植主动贝叶斯网络分类器[期刊论文]-计算机研究与发展2002(5)29.王大玲.于戈.鲍玉斌.王国仁一种基于关联性度量的决策树分类方法[期刊论文]-东北大学学报(自然科学版)2001(5)30.韩家新.王家华一种以相关性确定条件属性的决策树[期刊论文]-微机发展2003(5)31.张静.王建民.何华灿基于属性相关性的属性约简新方法[期刊论文]-计算机工程与应用2005(28)32.WittenIH.FrankEDataMining:PracticalMachineLearningToolsandTechniqueswithJavaImplementations200033.LuRQArtificialIntelligence198934.ZhengZ.WebbGILazylearningofBayesianrules2000(01)相似文献(10条)1.期刊论文董立岩.刘光远.苑森淼.李永丽.孙铭会.DONGLi-yan.LIUGuang-yuan.YUANSen-miao.LIYong-li.SUNMing-hui混合式朴素贝叶斯分类模型-吉林大学学报(信息科学版)2007,25(1)为了降低朴素贝叶斯分类模型的独立性假设约束,提出一种混合式朴素贝叶斯分类模型(MBN:MixedNaiveBayes).通过分析贝叶斯定理,把条件属性集合划分成若干个独立的属性子集,用树增广朴素贝叶斯分类对属性子集分别进行分类学习,通过公式进行整合.将该模型算法与朴素贝叶斯及树增广朴素贝叶斯进行实验比较,实验结果表明MBN分类器在多数数据集上具有较高的分类正确率.2.学位论文程岚岚面向领域的中文搜索引擎若干关键技术研究2006面向领域的搜索引擎已成为为信息检索领域的一个重要研究课题.虽然该领域已经取得许多研究成果,但目前相应的系统应用和检索效果却并不乐观.本文就面向领域的搜索引擎的若干问题,包括爬取算法、文本关键词提取和文本分类,进行了较深入研究.Web信息采集是搜索引擎的基础,也是一个核心组成部分.本文讲解了Web爬取的基本原理和策略,并对常用的Web爬取算法进行了深入的分析.最后提出了改进的基于Shark算法的新算法.关键词提取是文本处理的一个重要环节.本文以朴素贝叶斯定理为基础,以文本中词语的传统权重、第一次出现位置、出现位置的样本标准差为特征项,构建了关键词提取的朴素贝叶斯模型.实验结果表明,相对于传统的基于权重的关键词提取算法,该算法具有较高的准确度.另外,本文针对特征项取值离散化对模型的不利影响,对该算法做了修正,重新调整了上述三个特征项在模型中的相对重要性,从而进一步提高了算法的准确度.文本分类是某些搜索引擎中对Web文本进行组织、实现高效检索的一项关键技术.本文改进了传统的朴素贝叶斯分类模型,考虑进了文本长度和文本结构两个影响因素,修正了分类模型的计算公式,同时在特征项选择算法中,综合考虑了频度、集中度、分散度三项指标,使得选出的特征项更为合理,从而使分类结果在精确度、召回率和F-Measure值方面均获得了一定程度的提高.3.期刊论文王峻.WANGJun一种基于强属性限定的贝叶斯分类模型-计算机技术与发展2007,17(2)朴素贝叶斯分类模型一种简单而高效的分类模型,但它的条件独立性假设使其无法将属性间的依赖表达出来,影响了它分类的正确率.属性间的依赖关系与属性本身的特性有关,有些属性的特性决定了其他属性必然依赖于它,即强属性.文中通过分析属性相关性的度量和贝叶斯定理的变形公式,介绍了强属性的选择方法,通过在强弱属性之间添加增强弧以弱化朴素贝叶斯的独立性假设,扩展了朴素贝叶斯分类模型的结构.在此基础上提出一种基于强属性限定的贝叶斯分类模型SANBC.实验结果表明,与朴素贝叶斯分类模型相比,SANBC分类模型具有较高的分类正确率.4.学位论文李方关于朴素贝叶斯分类算法的改进2009数据挖掘是机器学习领域中的一门技术,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用上的需求。贝叶斯分类器是数据挖掘分类算法中其中之一。它是以贝叶斯定理、最大后验假设、贝叶斯网络和信息学理论为基础。该算法利用先验统计知识具有简单易于计算、能有效处理混合指标属性的分类问题和较好的分类能力等特点,已经成为目前数据挖掘技术的理论和应用研究方法之一。br 本文主要工作是朴素贝叶斯分类模型的研究和应用。br ⑴首先介绍了贝叶斯分类的基本理论。br ⑵其次总结了几种常用的贝叶斯分类模型:朴素贝叶斯分类模型、CB分类模型、基于属性相关性的分类模型、EANBC分类模型、基于特征加权的朴素贝叶斯分类模型和强属性限定的贝叶斯分类模型。br ⑶本文的重点是对朴素贝叶斯分类算法的进行改进。将卡方统计量的构造思想用于构造属性的相关性度量公式,以此改进贝叶斯分类算法。并通过实验证明了本文提出的改进算法能有效地提高分类效果。br 最后,对全文进行了总结和展望。5.期刊论文石洪波.王志海.黄厚宽.励晓健一种限定性的双层贝叶斯分类模型-软件学报2004,15(2)朴素贝叶斯分类模型是一种简单而有效的分类方法,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系,影响了它的分类性能.通过分析贝叶斯分类模型的分类原则以及贝叶斯定理的变异形式,提出了一种基于贝叶斯定理的新的分类模型DLBAN(double-levelBayesiannetworkaugmentednaiveBayes).该模型通过选择关键属性建立属性之间的依赖关系.将该分类方法与朴素贝叶斯分类器和TAN(treeaugmentednaiveBayes)分类器进行实验比较.实验结果表明,在大多数数据集上,DLBAN分类方法具有较高的分类正确率.6.学位论文刘鸣鸣几类复杂体系的分类及属性选择问题研究2009生命科学技术的快速发展产生了大量的生物数据,形成了多种多样的复杂体系,如何从这些数据中发现有价值的知识及规律,成为目前理论与实践研究的热点与难点。为了快速且全面的处理如此多的生物数据,数据挖掘技术成了大部分研究者的首选,旨在利用数据挖掘的方法,在已有数据的基础之上发现相应的规律和知识进而指导与解释生物实验与生命现象,加速对生命本质特征的认识。br 分类是数据挖掘中重要的内容,也成为各学科研究的重点。朴素贝叶斯分类器是一种简单且高效的分类器,它是在贝叶斯定理的基础上,通过条件独立性假设,将计算消耗降低,预测未知数据样本,并且对高维数据分类有良好的表现。但朴素贝叶斯限制条件较强,影响其在现实应用中的分类性能。通常对朴素贝叶斯的改进一般从两方面进行,即属性间的依赖关系和分类器的整体技术。本文着眼于分类器整体技术和属性选择,提出了二次建模的加权朴素贝叶斯,结果表明该算法在相对较大的样本集中取得了较好的效果。br 属性选择作为一种数据预处理的技术,有着重要的意义。研究表明大部分数据集中存在的冗余和噪音数据严重影响了分类的效果,一般采取的方法是属性选择或属性提取。本文提出了基于ReliefF的打包算法,结合了过滤(Filter)属性选择与打包(Wrapper)属性选择的方法,其效果比单独使用其中的一种更好。经测试,通过与三个Filter方法和两个Wrapper方法比较,该算法体现了其优越性。7.期刊论文李大鹏.胡莹数据库信息分类中贝叶斯网络模型的应用-山东大学学报(工学版)2004,34(5)数据库信息分类中,朴素贝叶斯分类模型是一种简单而有效的分类方法,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系,影响了它的分类性能.而一般贝叶斯网络模型则由于能表达属性变量之间的依赖关系而越来越受到人们的重视,但一般贝叶斯网络分类模型结构的学习算法是一个NP完全问题.本研究在一种简化的贝叶斯网络分类模型的基础上,利用其多项式时间复杂度的结构学习算法,将其应用于数据库信息分类,实现了学习效率和分类精度的一种折衷.实验结果表明,这种分类方法有着比较高的数据库信息文本检索性能.8.学位论文刘静规则与贝叶斯相结合的分类方法研究2005文本分类(TextCategorization)是自动将一组文本分类到预先定义的类别中的任务。自动文本分类可以帮助人们从繁重的大量文本手工组织中解放出来,而且结合了信息检索与机器学习技术,准确率已经达到人们手工分类类似的水平。自动文本分类目前有许多分类方法,本文中将其分为三类:基于内容的文本分类方法、基于