数据挖掘在电子商务中的应用学号:姓名:班级:摘要:随着数据挖掘技术的发展和电子商务的普及,将数据挖掘技术应用到电子商务中可以解决电子商务中数据量庞大的问题,从而获得真正有价值的信息。通过分析电子商务应用数据挖掘的必要性和可行性,概述数据挖掘的一些挖掘技术,重点介绍了数据挖掘在电子商务中的实际应用,包括营销、电子商务系统规划和系统安全、客户关系管理以及网络广告方面的应用。关键词:数据挖掘技术;电子商务;客户关系管理引言:电子商务是网络时代的一种全新的商务模式,其由于Internet的迅速普及和发展而引起了越来越多的学者关注,研究人员希望充分发挥电子商务优势,从而获取更大的经济效益。在电子商务中采用数据挖掘的方法和思想,帮助电子商务网站把真正有价值的知识从海量的信息提取出来,从而更好地为电子商务网站的客户提供更方便的服务以及指导企业决策已经成为了当前研究的热点。数据挖掘是一种全新的信息技术,其是伴随着数据库技术的发展而出现的,其融合了统计学、人工智能以及数据库等众多学科内容,借助从大量的数据中挖掘出未知、有用和有效的信息,从而更好地为电子商务网站服务。随着计算机技术、因特网技术、通讯技术的发展推动着电子商务的迅速发展,电子商务过程产生大量的电子数据,通过运用数据挖掘技术可以发现和提取这些信息中隐含的未知的有价值的信息,形成知识。如何对这些数据进行分析和挖掘,以充分了解客户的喜好、购买模式,甚至是客户一时的冲动,进而设计出满足于不同客户群体需要的个性化网站,增加自己的竞争力,似乎已变得势在必行。若想在竞争中生存和获胜,你就得比你的竞争对手更了解客户。数据挖掘是从大量的数据中自动地抽取潜在的、有价值的知识、模型或规则的过程。在网络时代,数据挖掘技术当然也自然而然地被应用到对电子商务网站的海量数据进行分析和处理中来。在对电子商务网站进行数据挖掘时,所需要的数据主要来自两个方面:一是客户的背景信息。这部分信息主要来自客户的登记表;二是浏览者的点击流。这部分数据主要用于考察客户的行为表现。但是,有时客户对自己的背景信息十分珍重,不肯把这部分信息填写在登记表上,这就会给数据分析和挖掘带来不便。在这种情况之下,就不得不从浏览者的表现数据中来推测客户的背景信息,进而再加以利用。一、数据挖掘在电子商务中应用的必要性和可行性电子商务就是采用数字化电子方式进行商务数据交换和开展商务业务活动。电子商务由于应用了计算机网络技术,特别是因特网之后,以其本身的优势对传统的商务活动产生巨大的冲击。具体的优势主要有:(1)服务不受时间的限制,一般可以实现的商务活动。(2)能实现全球的资源共享,特别B2B的电子商务模式的发展,使得在全球采购原材料和全球销售变得更加简单和方便。(3)大大降低了成本。首先可以免去高昂的房租,可减去旅行费用,减少广告宣传费用,也能减少时间成本。(4)方便进行客户关系管理和维护。(5)电子商务中能够减少库存,方便供应链管理。电子商务一般都是由一些系统组成,在电子商务过程中产生了大量的数据,有了这些数据就有了进行数据挖掘的基础。电子商务活动中产生数据有其自身的特点,把数据挖掘技术和电子商务相结合,选用适合电子商务数据的挖掘方法,可以提高数据挖掘的效率,让数据挖掘更好地为电子商务服务。在电子商务中进行数据挖掘具有以下条件:(1)收集信息更加便利,例如通过网上电子购物系统可以记录客户的行为,包括哪些客户将哪些商品放进购物车,哪些商品被最终购买。(2)收集信息的准确性、完整性提高。电子商务中有各种系统进行数据的收集,一般地,用计算机自动记录的数据比手工收集的数据出现的噪音和错误要少得多。(3)在电子商务系统上构建数据挖掘较为简单。因为电子商务已经实现自动化,网络数据挖掘系统也容易和电子商务系统相结合。二、数据挖掘技术在电子方法及在电子商务中的应用(1)数据挖掘的概念数据挖掘(DataMining),又称数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。比较典型的数据挖掘方法有关联分析、序列模式分析、分类分析、聚类分析等。它们可以应用到以客户为中心的企业决策分析和管理的各个不同领域和阶段。数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间的关系的过程,使用这些模型和关系可以进行预测,它帮助决策者寻找数据间潜在的关联,发现被忽略的因素,是解决当今时代所面临的数据爆炸而信息匮乏的问题的一种有效方法。它是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其它模型化处理,从中提取辅助商业决策的关键性数据,是一种深层次的数据分析方法。(2)数据挖掘分析方法及应用1.关联分析关联分析,即利用关联规则进行数据挖掘,关联分析的目的是挖掘隐藏在数据中的相互关系。它能发现数据库中的顾客在一次购买活动中购买商品A的同时购买商品B之类的知识。关联规则在电子商务中主要有以下两个方面的应用:第一,发现群体用户访问页面之间的关联规则,即挖掘访问页面之间的关联关系,从而对电子商务嘲站的设计进行优化。主要通过对Web日志进行预处理,挖掘Web日志文件中的有效信息,从而利用关联分析整理原始日志文件得到的事务数据库,最后挖掘出访问频繁的项集。第二,研究发现客户有可能一起购买的商品组合集合,把这些商品组和集合的页面链接放在一起向客户推荐。集中可能同时购买的商品链接,这是典型的购物篮分析事件,把可能同时购买的商品链接放在一起有利于销售量的提高。2.序列模式分析序列模式分析和关联分析相似,但侧重点在于分析数据间的前后序列关系。它能发现数据库中形如在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商品C,即序A-B-C出现的频度较高之类的知识。序列模式分析描述的问题是在给定交易序列数据库中,每个序列是按照交易时间排列的一组交易集。序列模式分析数据挖掘在电子商务中的应用。电子商务的组织者可以方便地利用发现序列模式对客户行为进行预测,从而能够更有效第为客户提供更具个性化的服务。我们可以通过序列模式分析挖掘Web日志,从而有效发现客户的访问序列模式。例如:当访问者链接到电子商务网站时,通过发现访问者的访问序列模式后,网站管理员可以将访问者未访问但极有可能访问的页面推荐到相对显眼的位置便于访问者对页面进行访问。此外,序列模式分析还可以向客户推荐其购买某件商品后有可能购买的另外一些商品。3.分类分析设有一个数据库和一组具有不同特征的类别(标记)。该数据库中的每一个记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集。分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类。电子商务中分类分析的作用,我们可以通过分类分析得到电子商务刚站的客户分类模式,对不同类客户的爱好、特点有详细的了解,根据不同类客户的爱好以及特点开展针对性更强的商务活动,为他们提供更具个性化的服务;此外,可以通过分类分析对新客户进行分析,将新客户归纳到相应类别,提供针对性更强的服务信息。4.聚类分析:聚类分析输入的是一组未分类记录,并且这些记录应分成几类事先也不知道。通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。采用不同的聚类方法,对于相同的记录集合可能有不同的划分结果。电子商务中聚类分析的作用,管理员可以通过聚类分析将浏览行为相似的客户聚合分析,从而能够更加深入地了解客户需要,为客户提供更加优质的服务。采用聚类分析我们能够发现客户访问频率最高的页面,假如客户经常性第访问关于手机的页面,那么我们可以通过Web自动将关于手机新产品信息的邮件发送给特定的客户聚类。三、数据挖掘在电子商务中的具体应用在电子商务中应用数据挖掘技术可以直接跟踪数据,分析顾客的购买行为并辅助商家快速做出商业决策。(1)在电子商务营销方面的应用它是以市场营销学的市场细分原理为基础,其基本假定是消费者过去的行为是其今后消费倾向的最好说明。通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为。1.产品生命周期策略分析。通过对购买时间上的挖掘也就是通过对商品的访问和销售情况进行分析,从而获得客户的访问规律,确定顾客消费的生命周期,在特定的时间开展促销活动,制定商品的优惠策略。2.市场细分。通过客户聚类分析可以找出顾客需求的相同之处,使得属于同一类别的客户之间的需求距离尽可能小,而不同类别的客户群体之间的距离尽可能大。通过对聚类的客户特征的提取,把客户群分成更细的市场,提供针对性的服务。3.制定合理的产品策略和定价策略。可以利用关联分析,如分析网上顾客的购买行为,分析客户购买产品的相关度,对某些品牌的喜好和忠诚,价格接受范围,及包装要求方面来帮助管理者规划市场,确定商品的种类、价格和新产品的投入等等。4.制定产品营销策略,优化促销活动。通过对商品访问情况和销售情况进行挖掘,企业能够获取客户的访问规律,确定顾客消费的生命周期,根据市场的变化,针对不同的产品制定相应的营销策略。(2)在电子商务网站系统和安全方面的应用1.通过文本挖掘,对客户邮件内容进行挖掘首先将电子邮件中非结构化的数据转化成结构化的数据,再选取最能区分出垃圾邮件的一些特征,对垃圾邮件进行过滤,再利用词典的正向匹配,逐词遍历的方法进行,经过特征提取和模式匹配工作后,就可以进行智能决策,对挖掘进行归纳和评价,并依可视化的形式将挖掘结果以直接明了地呈给决策领导。2.对网站系统中搜索引擎的应用电子商务网站中一般都有搜索引擎来帮助客户进行查询商品和信息,通过数据挖掘在搜索引擎方面的应用可以提高查全率和查准率。通过数据挖掘和机器学习技术对索引数据库的信息进行整理,实现文档的自动分类,还可以用文本总结技术对web页面中提取重要的信息,形成文档摘要,使用户可以全面了解文档。检索结果聚类,把检索结果进行聚类,由客户选择自己感兴趣的一组,将大大减少浏览的页面数量。3.改善系统性能,提高网站的安全性(1)提高反应速度。在Web服务器上每天记录了大量有关客户访问页面的文件。数据挖掘可以通过客户的拥塞记录发现站点的性能瓶颈,从而提示管理者改善有关的策略,提高网站的稳定性,优化客户的购物环境,保证电子商务购物快速进行。(2)挖掘网页之间的关联性。如果客户在一次访问行为中,访问了页面page1时,一般也会访问页面page2。进行Web上的数据挖掘,构建关联模型,我们可以更好地组织站点,建立网站之间的关联性。4.提高站点点击率通过挖掘客户的行为记录和反馈情况为站点设计者提供改进的依据,进一步优化网站组织结构以提高网站的点击率。比如利用关联规则的发现,可以针对不同客户动态调整站点结构,使客户访问的有关联的文件间的链接更直接,让客户容易地访问到想要的页面,就能给客户留下好的印象,增加下次访问的机率。5.增强安全。同时对网站上各种数据的统计分析有助于改进系统性能,增强系统安全性。通过对经常攻击系统数据的IP地址等进行分析来对某些IP地址的用户进行限制。通过对攻击系统的数据类型进行分析来设置防火墙,提高安全性。(3)在客户关系管理方面的应用1.分析客户的购买行为:在客户与企业进行交易的时候,主要是由客户来引起的,即客户在购买的某种商品以后他会相应的购买一些其他的产品。比如客户在购买篮球以后通常会购买篮球鞋。因此,根据根据客户关联购买行为,企业可以在客户购买某产品的同时,或在该产品被购买的一段时间t1(对某种产品客户的再购买时间)t2(产品已经使用的时间)的时间里想客户推销这个产品的关联产品。这就需要利用数据挖掘技术中的关联分析来寻找产品之间的有效关联规则。2.获取新客户:用数据挖掘技术可以揭示客户的行为习惯,发现一些不