泰山学院本科毕业论文(设计)开题报告题目贝叶斯分类算法在反垃圾邮件系统中的应用与改进年级08级专业信息与计算科学姓名胡俊杰学号2008060208指导教师签字学生签字年月日题目来源指导教师推荐□自选□其它□题目类别基础研究□应用研究□其它□开题报告内容包括调研资料的准备,选题依据、目的、要求;进度安排;完成任务所需条件、主要参考文献与资料情况等,字数1500—2500字。(可根据内容适当调整版面)论文题目:贝叶斯算法在反垃圾邮件系统中的应用与改进调研资料的准备(查阅过的文献资料及调研情况,需要的仪器设备情况等):[1]JonPostel,OntheJunkMailProblem,RFC706,Nov1975。[2]中国教育和科研网垃圾邮件处理小组,垃圾邮件的文化与历史,H。[3]中国互联网协会反垃圾邮件中心,《2005第三次中国反垃圾邮件状况调查报告》,2005。[4]中国互联网协会,中国互联网协会互联网公共电子邮件服务规范,。[5]曹麒麟、张千里,垃圾邮件与反垃圾邮件技术,人民邮电出版社,2003。[6]赵英、黄九梅,计算机工程与应用,2003。[7]中国互联网络信息中心[R]。第22次中国互联网络发展状况统计报告,2008。[8]TheChineseAnti-SpamAlliance,。[9]中国互联网协会,中国互联网协会互联网公共电子邮件服务规范,。[10]。[11]江河,对抗垃圾邮件[J],网管员世界,2005。[12]陈华辉、薛春阳,一种基于贝叶斯网的垃圾邮件过滤器[J],微机发展,2004。[13]王新梅,基于内容挖掘的垃圾邮件过滤技术,2006。[14]边肇祺、张学工,模式识别(第2版),2000。[15]AndrewMcCallum,KamatNigam.AComparisonofEventModelforNa?veBayesTextClassification.。[16]I.Adnroutsopoulos,G.Paliouras,E.Michelakis,LearningtoFilterUnsolicitedCommercialE-Mail.Thchnicalreport2004,2,NCSR“Demokritos”,2004。[17]谢希仁计算机网络(第5版)电子工业出版社2008.1选题依据:随着电子邮件的广泛应用,垃圾邮件的增长也越来越快,反垃圾邮件已经成为全世界共同关注的问题,电子邮件成为一种快捷、经济的现代通信技术手段,极大地方便了人们的通信与交流。然而,垃圾邮件的产生,影响了正常的电子邮件通信,占用了传输带宽,对系统安全造成了严重的威胁。因此,研究反垃圾邮件问题已经成为全球性的具有重大现实意义的课题。选题目的:根据中文垃圾邮件的特点,对垃圾邮件进行了比较系统的分析和研究,结合贝叶斯(Bayes)理论,构造基于贝叶斯分类的垃圾邮件过滤模型。论文要求:在特征提取方面,寻找一种互信息值的方法,在分类方法上,找到适合本文的分类方法,并找到一种更加适合于贝叶斯计算的表示方法。进度安排:(1)2011年12月5日参加毕业论文开题报告会确定论文题目.(2)2011年12月2日——2011年12月6日准备完成开题报告书(3)2011年12月7日——2011年12月12日完成开题报告书(4)2011年12月15日——2012年4月30日完成论文初稿(5)2012年5月1日——2012年5月30日修改论文初稿,并完成论文定稿完成任务所需条件:(1)操作系统WindowsServer2003操作系统。(2)开发平台MicrosoftVisualStudio2005开发工具,它提供了一个集成开发环境(IntegratedDevelopmentEnvironment,IDE),用于构建和部署基于Microsoft.NET的软件。(3)语言环境主要采用C#[30]语言。(4)数据库平台SQLServer2000论文目录第一章绪论........................................................................................................11.1引言.........................................................................................................11.2垃圾邮件的定义及其危害........................................................................................11.2.1垃圾邮件定义.............................................................................................11.2.2垃圾邮件危害[5]...........................................................................................21.3国内外反垃圾邮件现状..........................................................................................31.4研究目标与内容................................................................................................4第二章电子邮件工作原理简介........................................................................................52.1电子邮件的概述.............................................................................................52.2电子邮件的格式.............................................................................................62.3邮件传送过程...............................................................................................62.4相关协议...................................................................................................7第三章常用反垃圾邮件技术..........................................................................................133.1非技术手段反垃圾邮件.......................................................................................133.2客户端垃圾邮件过滤技术....................................................................................133.3服务器端垃圾邮件过滤技术..................................................................................14第四章垃圾邮件分类向量与特征向量..................................................................................174.1垃圾邮件分类向量概述.........................................................................................174.2垃圾邮件分类向量与特征向量的定义.............................................................................174.3分类方法.....................................................................................................194.3.1文本量的表示方法........................................................................................14.3.2关键词的选择............................................................................................204.3.3特征提取的方法..........................................................................................204.3.4分类方法介绍............................................................................................234.4基于垃圾邮件特征向量判断垃圾邮件的算法的设计.................................................................244.4.1贝叶斯定理[28]............................................................................................244.4.2贝叶斯过滤系统的工作原理................................................................................244.4.3算法的介绍..............................................................................................25第五章基于标准邮件集构造垃圾邮件分类向量..........................................................................265.1标准邮件集...................................................................................................265.1.1标准邮件