weka_Apriori

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Apriori算法--使用weka操作姓名:陈小康学号:2015216081算法核心算法核心算法核心综上所述:连接和剪枝实例:contact-lenses(隐形眼镜)实例:contact-lenses(隐形眼镜)表中数据:age(年龄)spectacle-prescrip(眼睛处方)astigmatism(散光人群)tear-prod-rate(眼睛撕裂生成速率)contact-lenses(隐形眼睛分类)实例:contact-lenses(隐形眼镜)假设最小支持度计数为min_sup=12,通过对候选1项集,可以确定频繁1项集L11-项集支持度计数spectacle-prescrip=myope12spectacle-prescrip=hypermetrope12astigmatism=no12astigmatism=yes12tear-prod-rate=reduced12tear-prod-rate=normal12contact-lenses=none15实例:contact-lenses(隐形眼镜)使用频繁1-项集L1连接产生候选2-项集C22-项集支持度计数spectacle-prescrip=myope,astigmatism=no6spectacle-prescrip=myope,astigmatism=yes6spectacle-prescrip=myope,tear-prod-rate=reduced6spectacle-prescrip=myope,tear-prod-rate=normal6spectacle-prescrip=myope,contact-lenses=none7实例:contact-lenses(隐形眼镜)使用频繁1-项集L1连接产生候选2-项集C22-项集支持度计数spectacle-prescrip=hypermetropeastigmatism=no6spectacle-prescrip=hypermetropeastigmatism=yes6spectacle-prescrip=hypermetropetear-prod-rate=reduced6spectacle-prescrip=hypermetropetear-prod-rate=normal6spectacle-prescrip=hypermetropecontact-lenses=none8实例:contact-lenses(隐形眼镜)使用频繁1-项集L1连接产生候选2-项集C22-项集支持度计数astigmatism=no,tear-prod-rate=reduced6astigmatism=no,tear-prod-rate=normal6astigmatism=no,contact-lenses=none7astigmatism=yes,tear-prod-rate=reduced6astigmatism=yes,tear-prod-rate=normal6实例:contact-lenses(隐形眼镜)使用频繁1-项集L1连接产生候选2-项集C22-项集支持度计数astigmatism=yescontact-lenses=none8tear-prod-rate=reducedcontact-lenses=none12tear-prod-rate=normalcontact-lenses=none3实例:contact-lenses(隐形眼镜)利用候选2-项集,经过剪枝得到频繁2-项集2-项集支持度计数tear-prod-rate=reducedcontact-lenses=none12获得关联规则:眼睛撕裂产生速率降低,不需要隐形眼镜tear-prod-rate=reducedcontact-lenses=none置信度:12/12=100%WEKA实现数据挖掘算法AprioriWEKA简介Weka的全名是怀卡托智能分析环境(WaikatoEnvironmentforKnowledgeAnalysis),是一款免费的,非商业化的,基于JAVA环境下开源的机器学习以及数据挖掘软件。存储数据格式为ARFF(attribute-relationfileformat),这是一种ASCII文本文件WEKA实现数据挖掘算法AprioriWEKA实现数据挖掘算法AprioriWEKA实现数据挖掘算法Apriori参数名称含义car如果设为真,则会挖掘类关联规则而不是全局关联规则classindex类属性索引。如果设置为-1,最后的属性被当做类属性delta以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则lowerBoundMinSupport最小支持度下界metricType对规则进行排序的度量依据minMtric度量的最小值numRules要发现的规则数outputItemSets如果设置为真,会在结果中输出项集removeAllMissingCols移除全部为缺省值的列WEKA实现数据挖掘算法Apriori参数名称含义significanceLevel重要程度。重要性测试upperBoundMinSupport最小支持度上界。从这个值开始迭代减小最小支持度verbose如果设置为真,则算法会以冗余模式运行WEKA实现数据挖掘算法AprioriWEKA实现数据挖掘算法AprioriWEKA实现数据挖掘算法Apriori练习题:以下是用户访问WEB日志的事务数,通过Apriori算法发掘其中的关联关系。谢谢

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功