广东工业大学硕士学位论文分布式数据挖掘隐私保护问题研究姓名:曲懿恒申请学位级别:硕士专业:管理科学与工程指导教师:刘洪伟20090501分布式数据挖掘隐私保护问题研究作者:曲懿恒学位授予单位:广东工业大学相似文献(10条)1.期刊论文聂茹.田森平.NIERu.TIANSen-pingWeb数据挖掘及其在电子商务中的应用-计算技术与自动化2006,25(4)随着互联网信息的增长,Web数据挖掘已经成为数据挖掘研究的热点之一,尤其是应用于电子商务领域.阐述了电子商务中的Web数据挖掘资源、Web日志挖掘的处理流程和几种技术,最后分析了Web数据挖掘在电子商务中的应用.2.学位论文赵华生基于SAS数据挖掘的C2C信用评价研究20082007年中国C2C电子商务市场保持健康增长,交易规模为410.4亿元人民币,较2006年增长90%。预计未来两年我国C2C电子商务网站的总营业收入规模将分别为678亿元和1023亿元。C2C交易在快速发展的同时,其交易体系的信用问题也逐渐暴露出来,成为阻碍C2C交易发展的主要问题之一。因此本论文的主要分析内容是C2C交易信用评价系统。本论文的研究内容主要是研究当前的C2C信用评价系统是否有效及相关的建议措施。对于信用评价系统的有效性,本论文从默认评价和买家行为模式的角度进行分析。对于默认评价,本论文使用SASEnterpriseMiner的决策树建模分析,得出买家做出默认评价的规则,并利用这些规则提高信用评价有效性。对于买家行为模式,本论文使用SASEnterpriseMiner的关联规则进行分析,得出买家的购物模式,分析得出信用评价系统有效。同时基于信用评价系统有效性,利用SASEnterpriseMiner进行序列分析,预测买家的未来购物模式。本论文还分析了影响信用评价的因素,以此来提高信用系统有效性和可靠性。第一章是绪论,包括研究背景和研究意义,当前研究现状,本论文的主要研究内容、研究方法和创新点。当前研究现状从国内外的角度对相关文献进行阐述,指出虽然有众多的研究,但对信用评价缺乏更有效的研究。本部分也对SAS软件进行了介绍,指出其数据挖掘功能是商务智能软件中最强大的。第二章是C2C交易信用评价的发展及现状,包括有关电子商务及C2C信用和信用评价的相关理论。本章的重点是信用评价的基本原理和其运行机制,指出了其在推动C2C交易中的重要作用。同时,本章分析了当前C2C交易中存在的关键问题,从而为后面的分析做好准备。第三章是数据挖掘及其在电子商务中的应用,包括数据挖掘的概述,数据挖掘工具分析和数据挖掘在电子商务中的应用。本论文分析了数据挖掘在数据爆炸时代的重要作用,指出了其在海量数据分析中的重要作用。同时也说明了数据挖掘与传统数据分析的区别。本章通过比较分析流行的数据挖掘工具来说明SAS的优势性。最后本章研究了数据挖掘已经应用于哪些方面的电子商务研究。第四章是C2C交易信用评价有效性研究,包括决策树分析、关联规则、序列分析和回归分析。这一章是本论文的核心部分,是整篇论文最重要的部分。本章首先对使用的数据进行了描述,接着利用SASEnterpriseMiner进行了决策树分析、关联规则分析和序列分析,从不同的角度对C2C交易信用系统有效性及改进策略进行分析。最后分析了影响信用评价的因素,并利用这些因素来提高信用评价。第五章是本论文的结论和建议,是论文的最后一部分。通过前面的分析,本论文得出了相关的建议。并阐述了论文的局限性和未来研究方向。本论文从C2C信用评价的角度对论文进行了深入的分析,主要观点包括以下五个方面:(1)当前主流C2C交易平台的信用评价系统有效。当前研究主要着眼于对信用评价系统指标的批评,根据信用评价指标的不合理之处,提出具体指标设定,但这些指标过于复杂,不利于买家进行有效的信用评价,因此本论文从默认评价的角度分析当前信用评价系统,说明其有效性。(2)信用评价系统可以利用决策树模型进行改进。虽然当前信用评价系统是整体有效的,但仍存在改进的空间。利用SASEnterpriseMiner进行数据挖掘,使用决策树建模的方法提出买家进行默认评价的规则,通过决策树规则来预测买家进行默认评价可能性,淘宝卖家和C2C交易平台可以根据得出的可能性的大小来对买家评价进行预警,以提高主动评价的比例。(3)从关联规则的角度分析得出C2C交易信用评价系统是有效的。信用评价若有效则其对买家的购物决策有导向性作用。利用数据挖掘的关联规则得出买家总是购物于高信用度的卖家,因此信用评价系统是有效的。(4)基于信用评价系统的有效性,利用序列分析预测买家未来购物行为模式。因为信用评价系统有效,其有效性引导买家购物于高信用度的卖家,同时序列分析可以预测买家购物于卖家的顺序,从而为买家及淘宝网等提供一个预测结果,利用预测结果提高交易的成功率和效率。(5)分析信用评价的影响因素,以提高信用评价水平。这里分析了除传统因素外还有哪些因素会影响信用评价,分析得出价格及买家作为买家的信用是主要影响因素。本论文创新点主要有两个方面:一是信用评价研究内容的创新,二是使用的研究工具的创新。(1)内容创新。本论文是对电子商务交易信用评价系统的研究,尽管已经有众多论文关于信用评价,但总体来说,这些论文的研究是基于电子商务交易信用评价体系的指标的,是对各种评价指标的设定,主要是建立了一个更合理的指标评价体系。更合理的指标体系意味着更复杂的买家操作过程,其可操作性较差。这就可能成为阻碍电子商务交易的一大障碍。当前论文对于当前信用评价系统的有效性没有进行研究,实际上电子商务网站诸如淘宝网及易趣网等已经注意到评价体系的缺陷性,但如果设定复杂的信用评价指标,买家可能无所适从。不如在当前的信用体系的基础上进行改进。因此,本论文并没有对信用体系设定新的指标体系,而是对当前的信用评价系统进行研究,在已有信用评价的基础上提高信用评价系统的有效性,即研究默认评价的比重,预测买家的评价模式,提高主动评价的比例,这是一创新点。当前的研究主题主要是对电子商务的交易商品质量,卖家服务质量及商品运输情况进行研究,而没有对除去这些因素以外的其他因素进行研究。本论文研究了除去传统的能够影响信用等级评价的因素外,还有哪些因素会影响买家对卖家的信用评价,进而影响信用等级。这是一个创新的方面。(2)研究工具创新。本论文采用SASEnterpriseMiner(企业数据挖掘)工具进行数据挖掘,使用决策树,关联规则和序列分析来进行信用评价系统的有效性研究,同时使用SAS编程进行其他的统计分析以研究信用评价,具有创新性。数据挖掘在中国的发展仍处于开始阶段,随着各行各业的数据累积量的日益增多,数据挖掘的发展必然是一个趋势。而数据挖掘的最重要工具—SAS在中国的普及率并不高,需要有更多的利用SAS数据挖掘进行商务智能的研究。本论文就是利用SASEnterpriseMiner数据挖掘进行的创新性研究。虽然当前有一部分有关数据挖掘在电子商务中应用的研究,但研究的范围主要集中于对电子商务的智能推荐系统,而且使用的工具诸如sql等,并没有使用世界上公认的最强大的数据挖掘工具—SASEnterpriseMiner。因此,本论文的不仅从内容上有创新,而且从使用的数据分析和数据挖掘工具上也有创新。3.会议论文聂茹.田森平Web数据挖掘及其在电子商务中的应用2006随着互联网信息的增长,Web数据挖掘已经成为数据挖掘研究的热点之一,尤其是应用于电子商务领域.本文阐述了电子商务中的Web数据挖掘资源、Web日志挖掘的处理流程和几种技术,最后分析了Web数据挖掘在电子商务中的应用.4.学位论文王飞面向电子商务的web数据挖掘的研究与设计2006数据挖掘是指从大量的数据中自动地提取出有价值的知识和信息。数据挖掘己成为数据库技术和机器学习方面的重要的研究课题。当前,WorldWideWeb正向应用的深度和广度方面迅速发展。将数据挖掘的思想和方法应用到Web上,解决中遇到的一些问题,从而形成了Web数据挖掘(Webmining)这样一个新的研究方向。Web数据挖掘是指针对包括Web页面内容、页面之间的结构、用户访问信息、电子商务信息在内的各种Web数据,应用传统数据挖掘方法以发现有用的知识,帮助人们从中提取知识,改进站点设计,更好地开展电子商务。电子商务是指个人或企业通过Internet网络,采用数字化电子方式进行商务数据交换和开展广告、推销、购买商品或服务等商务活动。相对于传统商务活动,电子商务具有不受地域限制、节省成本等众多优点本文对Web数据挖掘在电子商务中的应用进行了研究,主要做了以下工作:1.总结了数据挖掘研究现状及最新进展。提出了数据挖掘逻辑模型及存在的一些问题。2.描述了Web数据挖掘技术,Web数据挖掘的过程、数据源及用途。3.讨论了在电子商务中如何有效地利用几种可行的数据挖掘技术,如、关联规则分析、序列模式分析、分类分析和聚类分析等挖掘出用户的购买模式及浏览模式,并就其中的路径分析和序列模式分析提出了实现的方法。4.论述了Web访问信息挖掘的一般过程,将传统数据挖掘过程中的各种关键技术,如数据预处理,聚类算法,关联规则、序列模式发现等引入到对于Web信息的挖掘活动中,并通过一系列的实验进行验证及评价,在以上工作的基础上,设计并实现了一个Web数据挖掘原型系统(EWMiner)。web数据挖掘在电子商务里表现为在大型数据库里面搜索有价值的商业信息。数据仓库、数据挖掘技术和Internet/intranet的完美结合,使其在21世纪的电子商务中有广泛的应用前景。5.期刊论文娄迎红数据挖掘及其在电子商务中的应用-科技信息2009,(29)随着网络技术的发展和计算机使用的日益广泛,电子化数据越来越多,人们面临数据丰富而知识贫乏的问题.如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识,提高信息利用率呢?八十年代末兴起的数据挖掘技术,为解决此问题开辟了一条道路.本文简单阐述了数据挖掘技术、Web数据挖掘及电子商务,分析了Web数据挖掘在电子商务中的应用和展望.6.学位论文曹杨数据挖掘在电子商务客户关系管理中的应用研究2008电子商务环境下客户关系管理是近几年来的一个研究热点,已引起学术界和企业界的广泛关注。企业通过应用电子商务环境下客户关系管理建立与客户沟通的便利渠道,为客户创造更高的价值,来提高客户的满意度和忠诚度,从而实现更高的利润并有利于企业的长远发展。数据挖掘技术是实施客户关系管理的关键技术之一。企业在收集大量的客户基本资料和详细的交易数据的基础上,利用数据挖掘能够发现客户特征、客户购买模式等有价值的客户信息和新的商机,可以有效地指导电子商务环境下客户关系管理实践。本文首先通过分析和总结国内外学者研究成果,提出数据挖掘在电子商务环境下客户关系管理应用方面的研究不足之处;之后,对客户关系管理、电子商务理论与数据挖掘技术进行了阐述与分析,研究并讨论了数据挖掘在客户关系管理中尤其在电子商务环境下的应用,论证了数据挖掘在电子商务环境下客户关系管理系统中应用研究的必要性;最后,在理论分析框架内容的基础上,通过构建电子商务客户关系管理数据挖掘系统,运用实例分析完成了对数据挖掘在电子商务环境下客户关系管理应用的研究。本文采用了理论分析和案例比较等研究方法,并运用实例进行验证。主要创新点在于采用ID3决策树算法通过电子商务和客户关系管理的结合构建了电子商务客户关系管理数据挖掘系统并通过实例加以验证。通过本文的研究,为电子商务环境下客户关系管理实践提供有益的参考,同时为数据挖掘在电子商务环境下客户关系管理中的应用研究提供一些新思路。7.期刊论文沈先钊.饶燎原.SHENXianzhao.RAOLiaoyuan电子商务中的数据挖掘技术应用-湖南农机2006,(z1)本文结合电子商务中的数据挖掘技术应用,提出选择数据挖掘技术的几个重要方法,以便开发出有效、实用的数据挖掘系统;讨论了将数据挖掘技术应用于电子商务数据挖掘的最终目的和目前尚需解决的问题.8.学位论文王亮数据挖掘技术在电子商务中的应用研