粗糙集的简单应用.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

粗糙集的简单应用作者专业主要内容1、粗糙集理论基本概念2、粗糙集的应用工作成绩粗糙集的相关基本概念粗糙集理论由波兰科学家Z.Pawlak于1982年提出,它是一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗糙集的相关基本概念1.信息系统2.知识约简粗糙集1.信息系统定义1.1信息系统是一个四元组,其中:(1)是对象的非空有限集合,即,称为论域,中的每个称为一个对象;(2)是属性的非空有限集合,即,中的每个称为一个属性;(3),是属性的值域;(4)称为信息函数,它为每个对象关于每个属性赋予了一个信息值,且对于任意,有。在不引起混淆的前提下,信息系统通常可简写为。),,,(fVAUSU},,{21nxxxU,U)(nixiA},,,{21naaaAA)(mjajaAaVVaVVAUf:AaUx,aVaxf),(),(AUS粗糙集1.信息系统定义1.2若,且,则中全部等价关系的交集称为上的不可分辨关系,记为:且有RPPPP}),(),(,),{()(qyfqxfPqUUyxPindPPindPind)()(,PHHPindxX][][)(设是上的一个等价关系,表示的所有等价类,或上的划分构成的集合,表示包含元素的等价类。RURU/URUXRX][R粗糙集1.信息系统定义1.3设为一知识表达系统,,称为条件属性集,称为决策属性集。具有条件属性和决策属性的知识表达系统称为决策表。),,,(fVAUSDCDCA,CD条件属性决策属性患者头痛肌肉痛体温流感a是是正常否b是是高是c否否高是d否是很高否一个信息系统的例子粗糙集1.信息系统定义1.5若则为粗糙集。否则称为精确集。XRXRXRXR定义1.4设为一知识表达系统,,一个等价关系。称为关于的下近似。称为关于的上近似。),,,(fVAUSUXX且)(AindR}/{XYRUYXRXR}/{XYRUYXRXR粗糙集2.知识约简定义2.1设为一个信息系统,,如果,则称在中是不必要的,否则称是必要的。),,,(fVAUSAa)(}){(AindaAindaA定义2.2设为一个信息系统,如果在中都是必要的,则称属性集是独立的,否则称是相关的。),,,(fVAUSAaAA定理1如果是独立的,,则也是独立的。APAP粗糙集2.知识约简定义2.3设为一个信息系统,,如果是独立的,且,则称是的一个约简。),,,(fVAUSAPP)()(AindPindPA定义2.4设为一个信息系统,中所有必要属性组成的集合称为属性集的核,记为。),,,(fVAUSAA)(Acore定理2,其中表示的所有约简。)()(AredAcore)(AredA粗糙集2.知识约简定义2.5设为一个信息系统,是非空属性集,,为决策属性相对于的相对正域。),,,(fVDCAUSCDdCB,})}(/{)({)(dindUXXBdposBdB定义2.6设和都是等价关系族,如果则称是上可约去的;否则是上不可约去的。PQ))(())((}){()(QindposQindposRpindPindPRPPQQR粗糙集2.知识约简定义2.7如果上的每一个等价关系都是不可约去的,则是独立的或者关于是独立的。PPRQQQP定义2.8所有中不可约去的等价关系的集合称为的核,记为。PQQP)(PcoreQ粗糙集2.知识约简定义2.9设有信息系统,是记录在属性上的值,表示分辨矩阵中第行,第列的元素,被定义为:其中Sj)(xaxia)()(,)()(},)()({jijijiijxDxDxDxDxaxaAaCUnnji;,,2,1,ijCijC定义2.10区分函数是从分辨矩阵中构造的。约简算法的方法是先求的每个属性的析取,然后再求所有的合取。分辨矩阵是一个对称矩阵。在实际运用中,一般只列出它的下三角阵。nnijCijC工作成绩粗糙集的应用———基于粗糙集的小型电子商务挖掘模型粗糙集建立模型数据挖掘的一般过程包括:数据采集、数据清洗、挖掘算法确定、数据挖掘、模式解释及知识评价。从理论研究到应用实现,设计的技术主要有分类技术、聚类技术、粗糙集技术、统计技术和关联技术等。这里,结合粗糙集建立如图所示的挖掘模型。数据采集粗糙集数据清洗(预处理)粗糙集数据挖掘粗糙集规则提取解释模型得出结论粗糙集数据清洗下表是某电子商店的购物记录,P、Q、R、S代表四种商品;CustomerNo.为客户号;“Y”表示购买了某商品;“N”表示没有购买某商品粗糙集数据清洗条件属性决策属性CustomerNo.PQRSYYNNYYYYYYYYNYNNNNYNNYYYNNYYNYYY1t2t3t4t5t6t7t8t根据粗糙集理论,论域,条件属性集,决策属性集。},,,,,,,{87654321ttttttttU},,{RQPC}{SD粗糙集数据清洗一、利用正域约简计算正域:},,,,,{)(864321ttttttDposC)(},,,,,{)(864321}){(DposttttttDposCPC)(},,,{)(4321}){(DposttttDposCQC)()(}){(DposDposCRC)(},{)(41}),{(DposttDposCQPC)()(}),{(DposDposCRPC)()(}),{(DposDposCRQC粗糙集数据清洗二、利用区分矩阵约简RPRQQRPQRQRPRPQPQPRPRRRQRRQQRQRQPRPQPRPRPRQPRPRR)())()()()()()((粗糙集数据挖掘因此,的约简为{Q,R}。经过粗糙集数据清洗得到下表CD条件属性决策属性CustomerNo.QRSYNNYYYYYYYNNNYNYYYNYYYYY1t2t3t4t5t6t7t8t粗糙集规则提取定义决策规则为:其中,为对等价类的描述。定义规则的确定性因子显然当时,是确定的;当时,是不确定的jijiijYXYdesXdesr),()(:()desijrijijiXYXYX),(1),(0jiYX1),(jiYX1),(0jiYXijrijr粗糙集规则提取提取决策规则可以得到以下确定性规则:(购买Q)且(不购买R)——(不购买S)(购买Q)且(购买R)——(购买S)不确定规则为:(不购买Q)且(购买R)——(购买S)(不购买Q)且(购买R)——(不购买S)5.0)(SRQ,买买不买5.0)(SRQ,不买买不买粗糙集经过挖掘可得到大量的模式和规则,需对规则作进一步的筛选、合并。上述例子经合并后最终得到两条确定性规则。对于不确定规则,可作参考或直接删除均可。基于上述规则,可作决策:在电子商店中,可将商品P,Q,R按顺序相邻摆放在一起,可提高销售。知识评价粗糙集通过以上分析,所建立的基于粗糙集的小型电子商务挖掘模型是有效、可行的。已经提出很多可行的粗糙集算法,在实现挖掘时可参考。上述只举出决策规则的例子,根据电子商务的实际,开发挖掘系统时可确定更多的挖掘目标,从而揭示小型电子商务网站的运营状况以及潜在的经济活动及规律。讨论谢谢!

1 / 25
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功