2012届本科生毕业设计数据挖掘技术在电信计费系统中的应用摘要随着网络的高速发展,一些大型厂商推出了服务器出租这项业务。为了使得出租商快捷、方便以及高效的统计出用户的登录信息及应缴费情况,本文开发了一个电信计费系统。本系统采用C/S架构,在UNIX环境下以C++为主要的开发语言开发完成。客户端的功能包括定时从非结构型服务器日志文件采集用户数据,匹配登入/登出信息,向服务器发送数据;服务端的功能包括接收客户端发送过来的数据,存储数据和整合数据等。从海量用户数据中匹配登入/登出信息采用了数据挖掘技术,所提取到的有效计费信息存储在Oracle数据库中。关键词:电信计费系统;数据挖掘;数据匹配;数据整合2012届本科生毕业设计TheApplicationofDataMiningTechnologyintheTelecomTollSystemABSTRACTWiththerapiddevelopmentofthenetwork,somelargecompaniessuchasChinaTelecomlaunchedtheserverrentbusiness.Inordertostatisticuserlogininformationandchargemorefastly,convenientlyandefficiently,aTelecomtollsystemisdevelopedinthispaper.ThissystemisprogrammedbyC++languagewithC/SarchitectureinUnixoperatersystem.Thefunctionsinclientportincludereadinguserinformationfromunstructurallogfile,matchingdataandsendingdatatoaserver;Thefunctionsinseverportincludereceivingdatafromclient,datastorageandintegratingdata.DataminingtechnologyisusedinthehugeamountofdatamatchingprocessingandalltheresultfuldataareallstoredinOracledatabase.Keywords:theTelecomtollsystem;Datamining;Datamatching;Dataintegration2012届本科生毕业设计目录1引言.................................................11.1课题来源及意义..........................................11.2国内外发展状况..........................................11.2.1数据挖掘技术的基本知识.................................11.2.2数据挖掘技术的基本应用................................21.2.3数据挖掘技术的发展....................................21.3本文的主要工作...........................................21.3.1设计思想和实现目标....................................21.3.2论文结构安排..........................................22系统分析.............................................22.1可行性研究...............................错误!未定义书签。2.1.1技术可行性............................错误!未定义书签。2.1.2经济可行性............................错误!未定义书签。2.2需求分析...............................................42.2.1项目业务需求..........................错误!未定义书签。2.2.2功能模块..............................................42.2.3用例描述..............................................53概要设计............................................113.1业务流程................................................113.1.1业务流程中几个存储文件的命名规则......................112012届本科生毕业设计3.1.2业务规则说明..........................................113.2系统模块................................................113.3接口设计................................................133.3.1用户接口..............................................133.3.2外部接口..............................................143.3.3内部接口..............................................143.4数据结构设计............................................143.4.1登入/登出记录数据类...................................153.4.2匹配的用户登录记录类..................................153.5数据库设计..............................................164详细设计和实现.......................................184.1客户端模块..............................................184.1.1数据读取模块设计......................................194.1.2数据匹配模块设计......................................214.1.3数据发送模块设计......................................274.2服务端模块..............................................314.2.1数据接收模块设计.....................................324.2.2数据存储模块设计.....................................354.2.3数据缓冲池...........................................374.3异常设计...............................................394.3.1异常类结构图.........................................394.3.2客户端异常类说明.....................................392012届本科生毕业设计4.4数据库具体实现.........................................405结论.................................................41参考文献...............................................42致谢...............................................432012届本科生毕业论文(设计)11引言1.1课题来源及意义随着计算机及互联网技术的高速发展,一些大的厂家例如电信,推出了服务器出租这项业务,选择这项业务的用户可以通过远程登录服务器上进行自己的工作。服务器出租就是指用户不需要自己购买服务器,只需要根据自己的业务要求,向运营商申请一个帐号通过远程登录,便可以轻松享用服务器。由于服务器的价格相当昂贵,所以更多的用户更倾向于选择租用,而不是购买。这样服务器出租便得到了广泛的发展。这时就需要一款运行在服务器上的计时软件,来统计用户的使用情况来做出相应的收费依据。在此背景下,电信计费系统便应运而生了,电信计费系统是专门为服务器租赁商开发研究的,租赁商只需要在各地区出租的服务器上安装本系统,就会有相应的数据从客户端源源不断发送到服务端,这样便可以轻松的了解各地服务器的运营状况,以及盈亏情况,同时也可以作为用户缴纳费用的依据。电信计费系统是专门为电信制作的一款计费程序,可以非常方便、快捷、实时查询出用户需要缴纳的费用。方便运营商在后续阶段进行合理的计划调整。通过对这一课题的学习和研究,可以将电信计费系统的基本原理、实现流程等展现出来,并可作为新的综合电信计费系统来学习和研究,也可以顺带了解实际电信实时计费的工作流程,具有一定的现实意义。1.2国内外发展状况由于用户数量巨大,所有用户信息交错保存在非结构型日志文件中。如何从海量数据中找到某一用户的计费信息,就需要数据挖掘技术的支持。1.2.1数据挖掘技术的基本知识数据挖掘(DataMining,简称DM),又称为数据库中知识发现(KnowledgeDiscoveryfromDatabase,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程[1]。整个知识挖掘(KDD)过程是由若干挖掘步骤组成,而数据挖掘仅是其中的一个主要步骤。尽管数据挖掘仅仅是整个知识挖掘过程中的一个重要步骤,但由于目前工业界、媒体、数据库研究领域中,“数据挖掘”一词已被广泛使用并被普遍接受,因此也可以广义地使用“数据挖掘”一词来表示整个知识挖掘过程,即数据挖掘就是一个从数据库、数据仓库或其它信息资源库的大量数据中发掘出有趣的知识。2012届本科生毕业论文(设计)21.2.2数据挖掘技术的基本应用实际上数据挖掘技术从一开始就是面向应用的。目前,在很多重要的领域,数据挖掘都可以发挥积极促进的作用。尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业应用领域。数据挖掘能够帮助解决许多典型的商业问题,其中包括:数据库营销、客户群体划分、背景分析、交叉销售等市场分析行为,以及客户流失性分析、客户信用评分、欺诈发现等等。1.2.3数据挖掘技术的发展数据挖掘的目的就是为企业决策提供的正确依据,利用计算机及信息技术辅助完成从分析数据、发现问题、作出决策到采取行动这一系列操作。因此人们将这种机构行为和手段称这为“事务智能”(BusinessIntelligent,简称BI),BI能极大地改进决策的质量和及时性,从而改进机构的生产率或发挥竞争优势。所以近年来,一些大公司将数据分析和数据挖掘工具及其有关技术组合起来形成所谓BIS(BusinessIntelligentSoftwave)。其中SAS公司的的EnterpriseMinter就是将数据源、数据预处理、数据存贮、数据分析与发掘、信息表示与应用等方面技术有机形成一个复杂数据挖掘系统有机整体。1.3本文的主要工作1.3.1设计思想和实现目标设计思想