数据挖掘技术课程论文

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

I目录[摘要]..................................................................................................................11.绪论..............................................................................................................11.1题目背景及目的..........................................................................................11.2题目研究方法..............................................................................................12.数据挖掘技术介绍......................................................................................12.1数据挖掘与电子商务概述.........................................................................12.2数据挖掘技术.............................................................................................22.2.1统计技术.............................................................................................22.2.2关联规则.............................................................................................22.2.3基于历史的分析MBR(Memory-basedReasoning).................22.2.5聚集检测.............................................................................................32.2.6连接分析.............................................................................................32.2.7决策树.................................................................................................32.2.8神经网络.............................................................................................32.2.9粗糙集.................................................................................................32.2.10回归分析.............................................................................................43.数据挖掘阶段分析......................................................................................43.1项目理解阶段.............................................................................................43.2数据理解和数据准备.................................................................................4II3.3建立模型阶段.............................................................................................53.4模型评估阶段.............................................................................................53.5模型发布阶段.............................................................................................54.数据挖掘技术在电子商务中的应用.........................................................64.1电子商务中数据挖掘技术的适用价值.....................................................64.1.1客户细分................................................................................................64.1.2客户获得................................................................................................64.1.3客户保持................................................................................................74.2数据挖掘技术在电子商务推荐系统的具体应用.....................................74.2.1推荐系统在电子商务活动中的作用...................................................74.2.2数据挖掘技术应用于推荐系统具体表现...........................................85.结束语..........................................................................................................9数据挖掘技术—课程论文第1页(共9页)数据挖掘技术在电子商务中的应用[摘要]电子商务在现代商务活动中的正变得日趋重要,随着大数据时代的到来,商务信息显得尤为重要,在电子商务中谁掌握了有利的市场信息,谁就能在这个竞争激烈电商行业中占据绝对的优势。而数据挖掘技术是获取信息的最有效的技术工具。本文讨论了数据挖掘的主要方法,具体阐述了数据挖掘技术在电子商务中的作用及应用。1.绪论1.1题目背景及目的随着社会的进一步发展,互联网技术日新月异的发展和政府对信息技术大力扶持,电子商务已进入高速而稳定的增长期。如何在日渐激烈的电商市场竞争中脱颖而出,电商企业从数据挖掘找到突破口。客户是企业得以持续生存的基础,运用数据挖掘技术,掌握客户的未来消费趋势,就可以预见未来,赢得未来。1.2题目研究方法通过对数据挖掘技术的详细介绍,以及以电子商务中的数据挖掘案例分析,体现电子商务中数据挖掘技术的作用和针对性。2.数据挖掘技术介绍2.1数据挖掘与电子商务概述数据挖掘(DataMining)起源于数据库中的知识发现(KnowledgeDiscoverinDatabase,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡且最终可理解的及有潜在应用价值的信息或模式。数据挖掘技术是计算机技术发展的热点之一。通过对历史积累的大量数据的有效挖掘,可以发现隐藏的规律或模式,为决策提供支持,而这些规律或模式是不能够依靠简单的数据查询得到,或者是不能在可接受的时间内得到。这些规律或模式可以进一步在专业人员的识别下成为知识,并可以应用到以客户为中心的企业决策分析和管理的各个不同领域和阶段。电子商务(E-Commerce)是以指利用电子数据交换(ElectronicDataInterchange,EDI)、电子邮件(E-mail)、电子资金转账(ElectronicFundsTransfer,EFT)和数据挖掘技术—课程论文第2页(共9页)Internet等主要技术在个人、企业和国家之间进行无纸化的信息交换,包括商品信息及其订购信息、资金信息及其支付信息、安全及其认证信息等,即以现代信息技术为手段,以经济效益为中心的现代化商业运转模式。其最终目标是实现商务活动的网络化、自动化与智能化。随着Internet的迅速发展,电子商务的应用不断深入。在电子商务应用系统中,相关的用户数据日益增多,数据挖掘技术具有从大量复杂数据中发现特定规律的能力。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。2.2数据挖掘技术2.2.1统计技术统计技术对数据集进行挖掘的主要思想是:统计的方法对给定的数据集合假定了一个分步或者概率的模型(比如一个正态分布),然后根据模型采用相应的方法进行挖掘。2.2.2关联规则数据关联是数据库中存在的一类很重要的可以发现的知识。若两个或者多个变量的取值之间存在某种规律性,就成为关联。关联可分为简单关联,时序关联,因果关联。关联分析的目的是找出数据库中隐含的关联网,优势并不知道数据库中的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。2.2.3基于历史的分析MBR(Memory-basedReasoning)MBR的本质是:现根据经验知识寻找相似情况,然后再将这些情况的信息应用于当前的例子中。使用的三个问题是:寻找确定的历史数据;决定表示历史数据的最有效方法;决定距离函数、联合函数和邻近的数量。2.2.4遗传算法GA(GeneticAigorithms)该算法是基于进化理论,并采用遗传结合、遗传变异及自然选择等方法优化结果。主要思想是:根据适者生存的原则,形成由当前群体中最适合的规则组成新的群体,以及这些规则的后代。规则的适合度(Fitness)是对训练样本分类准确性的评估。数据挖掘技术—课程论文第3页(共9页)2.2.5聚集检测将物理或者抽象对象的集合,分组成为由类似的对象组成的多个类的过程被成为聚类。在由聚类生成的数据对象集合中,这些对象具有相似性,并与其他集合中的对象具有相异性。这种相异度是根据描述对象的属性值来计算的,距离是经常被采用的度量方法。2.2.6连接分析它的基本理论是图论,图论的思想是寻找一个可以得出好的结果但不是完美结果的算法。这种不完美但是可行的思想模式,可以使之运用到更广的用户群中。2.2.7决策树决策树是能够被看成一棵树的预测模型。树的每个分支都是一个分类的问题,内部节点表示在一个属性上的测试,树叶代表类或者分布。决策树算法是目前应用最广泛的归纳推理算法之一,是一种逼近离散值函数的方法,也可将它看作是一个布尔函数。它是以实例为基础的归纳学习算法,通过对一组训练数据的学习,构造出决策树形式的只是表示,在决策树的内节点进行属性值的比较并根据不

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功