数据挖掘第三版第八章课后习题答案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

6.2(a)能确定项集A是否频繁,并且能确定项集A的支持度6.3(b)因为s包含s’,则项集s的频数小于或者等于s’的频数,所以项集s的任意非空子集s’的支持度至少与s的支持度一样大。设任务相关的数据D是数据库事务的集合,|D|是D的事务量,由定义得:||)(_sup)(supDscountportsport.设s’是s的非空子集,由定义得:||)'(_sup)'(supDscountportsport.由频繁项集的所有非空子集一定也是频繁的可知:support(s’)support(s)(d)因为d中的频繁项集都是来自d的所有分区之内的,所以在d中频繁的项集至少在d的一个分区中是频繁的。6.6(a)Apriori算法最小支持度计数=3C1C2C3C4C5项集支持度计数项集支持度计数项集支持度计数项集支持度计数项集支持度{M}3{M}3{M,O}1{M,K}3{O,K,E}3{O}4{O}4{M,E}2{O,K}3{N}2{K}5{M,K}3{O,E}3{K}5{E}4{M,Y}2{K,E}4{E}4{Y}3{O,E}3{K,Y}3{Y}3{O,K}3{D}1{O,Y}2{A}1{K,E}4{U}1{K,Y}3{C}2{E,Y}2{I}1FP-growth树算法K5E4O3M3Y3Null{}K:5E:4M:1O:3OM:1OY:1M:1OY:1Y:1项条件模式基条件FD模式产生的频繁模式Y{K,E,O,D:1}{K,E,O:1}{K,M:1}K:3{K,Y:3}M{K,E,,O:1}{K,E:1}{K:1}K:3{K,M:3}O{K,E:3}K:3,E:3{K,O:3}{E,O:3}{K,E,O:3}E{K:4}K:4{K,E:4}6.146.14(a)支持度=2000/5000*100%=40%25%,置信度=2000/3000*100%=66.7%50%则该关联规则是强规则(b)P(AUB)=40%P(A)p(B)=2500/5000*3000/5000*100%=30%P(AUB)P(A)p(B)所以不是独立的,两者之间是正相关的。(c)全置信度=0.67最大置信度=0.80Kulczynski=0.57余弦=0.73提升度=1.33根据数据显示,都表示两者之间存在正相关的关系。

1 / 2
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功