摘要:本文在对数据挖掘的概念概述的基础上,着重介绍了数据挖掘在物流业中的应用。关键词:数据挖掘;物流业;信息系统一、数据挖掘概述数据挖掘,是指从大量的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。它是数据库研究中的一个新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,把人们对数据的应用从低层次的查询,提升到从数据中挖掘知识,提供决策支持的层级。从商业角度看,数据挖掘是一种商业信息处理技术,特点是对商业数据库中的数据进行抽取、转换、分析等,从中提取可用于辅助商业决策的关键数据。数据挖掘的目标是从大量数据中,发现隐藏于其后的规律或数据间的关系,从而服务于决策。数据挖掘一般有以下几类任务:1、分类。分类分析就是通过分析样本数据库中的数据,为每个类别做出准确的描述,或挖掘出分类规则,然用这个分类规则对其他记录进行分类。2、聚类。聚类是把一组个体按照相似性归成若干类别,即“物以类聚”。聚类将没有分类的记录,在不知道应分成几类的情况下,按照数据内在的差异性,合理地划分成几类,并确定每个记录所属类别。3、关联分析。数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联,关联分析的目的是找出数据库中隐藏的关联网。4、预测。预测是根据对象属性之过去观察值来预测该属性未来之值。数据挖掘自动在大型数据库中寻找预测性信息。5、偏差检测。数据库中的数据常有一些异常记录,称之为偏差。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例等。二、数据挖掘在物流业中的应用现代物流系统是一个庞大复杂的系统,特别是全程物流,包括运输、仓储、配送、搬运、包装和再加工等环节,每个环节信息流量十分巨大,使企业很难对这些数据进行及时、准确的处理。为了帮助决策者快速、准确地做出决策,提高企业的运作效率,降低物流成本、增加收益,就需要一种新的数据分析技术来处理数据。数据挖掘技术能帮助企业在物流信息系统管理中,及时、准确地收集和分析各种信息,对客户的行为及市场趋势进行有效的分析,了解不同客户的爱好,从而为客户提供有针对性的产品和服务,提高各类客户对企业和产品的满意度。物流决策系统是一种结合了数据挖掘和人工智能的新型经营决策系统,主要通过人工智能对原料采购、加工生产、分销配送到商品销售的各个环节的信息进行采集,并利用数据仓库和数据挖掘对其进行分析处理,确定相应的经营策略。数据仓库作为数据挖掘的基础,它具有面向主题的、集成的、随时间变化的特性。各个联机事务处理系统作为数据仓库的原始数据源,以文件方式提供企业在日常活动中收集的数据资料和报表,同时还有大量的外部信息等数据。基于数据挖掘的物流信息的体系结构主要由以下几部分组成:1、采购进货管理系统。主要功能是面对供货商的作业,包括向厂商发出订购信息或接收厂商的出货信息、采购决策、存货控制、采购价格管理等信息管理子系统。2、销货出货管理系统。其功能是收集客户需求信息、记录客户购买信息、管理销售价格、处理应收货款及退款等。3、库存储位管理系统。该系统包括储存管理、进出货管理、机械设备管理、流通加工等功能子系统,负责相关信息的处理。4、财务管理和结算系统。财务管理系统主要功能是对销售管理系统和采购系统所形成的应付、应收帐进行会计操作,同时对物流中心的整个业务与资金进行平衡、测算和分析,编制财务报表,并与银行进行转帐。结算系统主要功能是利用现有的业务信息管理系统和计算机处理能力,自动为客户提供各类业务费用信息,为广大物流企业的自动结算提供一套完整的解决方案。5、运输配送管理系统。该系统包括出货配送管理、运输调度计划、分配计划等功能子系统。6、物流分析系统。其主要功能是应用GIS技术与运筹决策模型,完善物流分析技术。7、物流决策支持系统。此系统的功能获取内部各系统业务信息,取得外部信息,并结合内部和外部信息编制各种报告,提供分析图表。通过建立决策支持系统,及时地掌握商流、物流、资金流和信息流所产生的信息并加以利用,在数据仓库技术、运筹学模型的基础上,运用数据挖掘工具对历史数据进行多角度、立体的分析,实现对物流中心的资源的综合管理,为决策提供科学决策的依据。随着物流信息化水平的提高,物流战略已从内部一体化向外部一体化转变,数据挖掘有效地促进企业的业务处理过程重组,改善并强化对客户的服务,强化企业的资产,负债管理,促进市场优化,加速资金周转,实现企业规模优化,有效地提高企业的竞争力。