武汉科技大学硕士学位论文改进的基因表达式编程算法的研究及其应用姓名:费红霞申请学位级别:硕士专业:控制理论与控制工程指导教师:潘炼20090512改进的基因表达式编程算法的研究及其应用作者:费红霞学位授予单位:武汉科技大学相似文献(10条)1.学位论文李曲基因表达式编程在分类规则挖掘中的应用研究2005数据挖掘是当今计算机应用技术和理论研究中最热门的领域之一。数据挖掘技术经过十多年的发展,已经逐渐建立起系统的挖掘理论和成熟的挖掘技术。形成了以关联规则挖掘、分类规则挖掘、聚类规则挖掘为主要形式的,以数据库技术、统计学、人工智能、可视化技术和信息技术为主要工具的多学科交叉的应用技术。从最初的商业应用逐渐扩展到医疗、金融、生物、电信、军事、体育等诸多领域。数据挖掘成为越来越多的科学家、研究人员、工程应用人员、商人、医生所关注的对象。分类规则作为数据挖掘的一个重要分支,在过去的十多年中引起很多来自不同领域的学者的注意,学者们提出了以信息论为基础的决策树算法、以概率论为基础的贝叶斯分类方法,以神经科学为基础的神经网络方法等等,这些算法基本上都是确定性算法。以自然进化为基础的演化计算技术因为其智能性、并行性、不确定性等诸多特点成为其中一个特殊的分支。演化计算模拟自然演化的特点,借鉴达尔文的物竞天择、优胜劣汰、适者生存的自然选择和自然遗传的机理,采用高效并行全局搜索方法,在许多领域取得了良好的效果,从而确立了它在21世纪的智能计算技术中的重要地位。演化计算中最重要的分支是遗传算法。遗传程序设计是遗传算法的一个变体。遗传算法和遗传程序设计两种技术虽然都遵循自然界优胜劣汰的基本原理,但是它们最初在工程应用领域具有不同的功能:遗传算法主要用于函数优化,而遗传程序设计则主要用于建模。以遗传算法和遗传程序设计为代表的演化计算在工程应用等优化问题中与传统的数学方法相比,表现出非常明显的优势。近年来演化计算在数据挖掘,特别是分类规则挖掘中的应用研究已经取得了相当大的发展。虽然很多学者认为演化计算只是优化和搜索算法,但是它在数据挖掘领域的良好效果已经使其成为数据挖掘中不可或缺的一个重要工具。基因表达式编程是C.Ferreira发明的一种新的遗传算法。基因表达式编程结合了遗传算法和遗传程序设计的优点,并克服了它们的缺点,在数学建模方面取得了非常好的效果。正因为其优点和良好的效果,使得基因表达式编程在并不漫长的时间里引起了演化计算领域的广泛关注甚至争议。本文详细介绍了基因表达式编程的基本技术,分析了其具有较高效率的根本原因在于其编码方式所具有的独特优势。本文通过分析演化计算中的多种技术,特别是遗传程序设计及基于语法的遗传程序设计等技术的特点,充分证明了基因表达式编程具有更好的特性和更高的效率。本文以基因表达式编程和分类规则挖掘作为主要对象,研究基因表达式编程在分类规则挖掘应用中的几个重要问题。本文在第一章介绍了论文的选题及其研究意义、选题的国内外研究现状、主要的研究内容。然后在第二章中概述了基因表达式编程技术,内容包括演化计算的起源、基本分类,基因表达式编程的起源和基本算法、关键技术以及发展方向。第三章基因表达式编程的应用是本文的一个主要内容,在这一章里面,首先回顾了遗传程序设计等技术在符号回归等技术中的应用状况,然后探讨了基因表达式编程在符号回归中的应用,并以预测为例对该技术的优势进行了分析。第四部分是分类规则挖掘研究现状介绍部分,首先对数据挖掘技术和分类规则技术作了一个简单的介绍,然后给出现有分类规则挖掘技术的基本方法,分类规则挖掘中的基本问题和需要解决的问题。第五章是本文的另一部分主要工作,用基因表达式编程技术挖掘简洁的分类规则,本部分对现有数据挖掘技术的优劣进行分析,提出了一种用基因表达式编程技术挖掘简洁的分类规则的方法。并通过试验结果说明了该方法与现有数据挖掘方法相比的优势和缺点。在第六章,总结了论文的主要工作和后续工作。2.期刊论文李太勇.唐常杰.吴江.邱江涛.LITai-yong.TANGChang-jie.WUJiang.QIUJiang-tao基于差分进化基因表达式编程的全局函数优化-计算机科学2009,36(11)为了提高基因表达式编程(GeneExpressionProgramming,GEP)在函数优化时的效率,将差分进化(Differ-entialEvolution,DE)引入到GEP中,提出了基于差分进化的基因表达式编程的全局优化算法DEGEPO.主要工作包括:(1)针对全局函数优化问题,根据GEP和DE的特点设计了新的基因编码;(2)设计了新的变异和交叉算子;(3)提出了DEGEPO算法并进行了算法分析;(4)实验验证了算法的有效性.相对于传统GEP,DEGEPO,优化结果精度平均提高了2~4个数量级.3.学位论文林海基于基因表达式编程的决策树研究2006随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息。数据挖掘就是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中、事先未知、但又潜在有用的信息和知识的过程,建立数据间关系模型,并用其做出预测。近年来,数据挖掘受到了国内外的普遍关注,己经成为信息系统和计算机科学领域研究中最活跃的前沿领域。数据挖掘已广泛应用于生物医学、金融、零售业、电信业等领域,并产生了巨大的效益。分类是数据挖掘中的一种非常重要的方法。它是在已有数据的基础上学会一个分类函数或构造出一个分类模型(即通常说的分类器)。该函数或模型能够把数据库中的数据项映射到给定类别中的某一个,从而可以应用于数据预测。目前,分类已广泛应用于许多领域,如医疗诊断、天气预测、信用证实、顾客区分、欺诈甄别。现已有多种分类的方法,其中决策树分类法在海量数据环境中应用最为广泛。其原因如下:1、决策树分类的直观的表示方法较容易转化为标准的数据库查询。2、决策树分类归纳的方法行之有效,尤其适合大型数据集。3、决策树在分类过程中,除了数据集中己包括的信息外,不再需要额外的信息。4、决策树分类模型的精确度较高。决策树分类器是一个类似流程图的树型结构,其中树的每个内部结点代表对一个属性(取值)的测试,其分支就代表测试的每个结果,而树的每个叶结点就代表一个类别。决策树很容易用IF-THEN规则进行表达。决策树模型是数据挖掘中最常用的一种方法。它能够直接体现数据的特点,便于理解,具有较好的分类预测能力,并能方便提取决策规则。决策树的生成过程也就是知识发现的过程,决策树模型的复杂度和预测精度决定了决策树的好坏。决策树是根据启发规则生成的,常见的决策树生成算法有基于信息论的ID3、C4.5算法以及基于最小GINI指标的CART、SILQ、PUBLIC方法。演化计算中最重要的分支是遗传算法。遗传程序设计是遗传算法的一个变体。遗传算法和遗传程序设计这两个算法虽然都遵循自然界优胜劣汰的基本原理,但是它们最初在工程应用领域具有不同的功能:遗传算法主要用于函数优化,而遗传程序设计则主要用于建模。一般而言,这两者都要优于传统的统计学方法。今年来,演化计算以及成功应用于数据挖掘,尤其是分类规则挖掘。演化计算已成为数据挖掘的一种不可或缺的工具。基因表达式编程是C.Ferreira发明的一种新的遗传算法。基因表达式编程结合了遗传算法和遗传程序设计的优点,克服了它们的缺点,在数学建模方面取得了非常好的效果。正因为其优点和良好的效果,使得基因表达式编程在并不漫长的时间里引起了演化计算领域的广泛关注甚至争议。本文简要介绍了基因表达式编程的基本技术,分析了其具有较高效率的根本原因在于其编码方式所具有的独特优势。本文以基因表达式编程和决策树作为主要对象,研究如何利用先进的基因表达式编程技术来构造决策树,以及这种决策树在实际分类中效果如何。本文在第一章首先介绍了论文的选题及其研究意义、选题的国内外研究现状、主要的研究内容。然后在第二章中概述了数据挖掘和分类技术,内容包括分类的主要方法、分类的比较和评估以及分类技术中存在的若干问题。在第三章中首先介绍了有关决策树的基本概念,然后介绍了基本ID3决策树算法,以及针对决策树算法的有关讨论。第四章概述了当前两种主要的基因表达式编程分类器,以及它们各自的特点。第五章是本文的主要工作,对现有的基因表达式编程分类器的优劣进行分析,提出了一种基于基因表达式编程技术的新的决策树算法,并通过试验结果说明了该方法与现有的基因表达式编程分类器方法相比的优势。在第六章结论中,总结了论文的主要工作和后续工作。4.期刊论文李太勇.唐常杰.吴江.乔少杰.姜玥.陈瑜.LITai-yong.TANGChang-jie.WUJiang.QIAOShao-jie.JIANGYue.CHENYu基因表达式编程种群多样性自适应调控算法-电子科技大学学报2010,39(2)为了解决基因表达式编程GEP种群多样性控制问题,提出了一种新的带权种群多样性的自适应调控方法.设计了带权的种群多样性测度方法,详细分析了选择、交叉及变异算子对种群多样性的影响.提出了初始种群的多样化算法DAIP,以保证初始种群多样性的最大化.设计了自适应的交叉和变异算子,提出了种群多样性自适应调控算法APDTA,使种群在进化过程中维持合适的种群多样性,进而提高进化效率.实验验证了APDTA的有效性.5.期刊论文胡建军.唐常杰.段磊.左劼.彭京.元昌安.HUJian-Jun.TANGChang-Jie.DUANLei.ZUOJie.PENGJing.YUANChang-An基因表达式编程初始种群的多样化策略-计算机学报2007,30(2)基因表达式编程(GeneExpressionProgramming,GEP)算法是遗传家族的新成员,被广泛用于知识发现,其初始种群的质量对进化效率和进化结果至关重要.为了产生优势初始种群,提出了基因空间均匀分布策略(GeneSpaceBalanceStrategy,GSBS),证明了描述编码空间量化性质的GEP编码空间定理.实验表明,GSBS提高进化效率超过20%.GSBS算法的思想还可以应用于其它进化计算中.6.学位论文左劼基因表达式编程核心技术研究2004进化计算是当前人工智能,知识工程,数据挖掘中的研究热点.遗传算法和遗传编程,是众多进化计算模型中的两个最典型的模型.本文在前人工作的基础上对基因表达式编程的核心技术进行了研究,主要结果和贡献如下:(1)对基因表达式编程的基因编码进行了理论分析.(2)提出了更有理论背景的基于复相关系数的适应度函数.(3)对基因表达式编程建立了上下文无关文法模型.(4)根据基因表达式编程的上下文无关文法模型,指出,基因表达式编程不能处理包含多个非终结符的上下文无关文法.提出了扩展的基因表达式编程方法,解决了基因表达式编程的这一重大不足.(5)提出了新的概念谓词关联规则,和基于基因表达式编程的挖掘系统.分析挖掘系统的特性,证明了传统关联规则是谓词关联规则的特例.(6)提出了两种基于GEP的方法进行时间序列预测.滑动窗口预测法直接发现时间序列中历史数据到未来数据的函数关系,并以此进行预测.7.期刊论文陈春香.胡光道.李悦乔适用于函数发现的遗传算法设计开发-计算机应用2006,26(z2)用VC++开发适用于函数发现的遗传算法程序.在基因表达式编程(GEP)算法的基础上,对基因编码进行改进,用头、身、尾三部分表示基因,选择和设计了有效的适应函数,编制了基因创建和遗传算子操作类、用面向对象结构实现了可视化的基因表达式程序设计.经测试和应用,程序函数发现能力强,输入输出简便,计算速度快.为在数据挖掘和函数发现领域的遗传算法应用研究提供了条件.8.学位论文陈春香基于演化计算的地学数据挖掘技术应用研究2006我国的地学工作进入数字化时代,地学信息库集成了地质、物探、化探、遥感信息等多学科的地学数据,信息资源丰富。但地学数据具有时间跨度大,空间范围广,数据类型多,数据不确定性等特点,一些常规的数据挖掘技术无法满足地学数据的特征。在智能计算领域中的演化计算