问答系统第1页共49页1目录引言....................................................3第一章研究背景..........................................41.1问答系统研究背景............................................................................................................41.2传统的问答系统的不足.....................................................................................................41.3问答系统研究现状............................................................................................................41.4问答系统的类型区分.........................................................................................................51.5问题的类型进行区分.........................................................................................................61.6中文问答系统研究............................................................................................................61.7相关评测...........................................................................................................................7第二章系统分析..........................................82.1市场调查...........................................................................................................................82.2问答系统的问题分析.........................................................................................................82.3问题分类...........................................................................................................................82.4问题相似性判定................................................................................................................92.5关键词扩展.....................................................................................................................10第三章数据库设计.......................................123.1数据库的需求分析..........................................................................................................123.2数据库表结构设计..........................................................................................................123.3E-R模型...........................................................................................................................14第四章系统详细设计与实现...............................174.1系统工作原理介绍..........................................................................................................174.2系统数据流图..................................................................................................................184.3系统的实现算法..............................................................................................................184.4注册模块的设计与实现...................................................................................................21问答系统第2页共49页4.5注册模块的设计与实现...................................................................................................334.6系统首页的设计与实现..................................................................................................364.7用户提问模块的设计与实现............................................................................................394.8问题显示模块的设计与实现............................................................................................424.9问题回答模块的登录与实现............................................................................................444.10后台管理模块的设计与实现..........................................................................................45第五章系统测试.........................................47第六章总结.............................................48致谢....................................................49参考文献................................................50问答系统第3页共49页引言问答系统的设计目标是用简治、准确的答案回答用户用自然语言提出的问题。在人工智能和自然语言处理领域,问答系统都有着较长的历史。1950年英国数学家图灵(A.M.Turin8)在论文“ComputingMachineryandIntelligence”中形象地指出了什么是人工智能,以及机器应该达到的智能标准。也就是通过自然语言问答的方式,判断机器是否具有智能。20世纪70年代随着自然语言理解技术的发展,出现了第一个实现用普通英语与计算机对话的人机接口LUNAR,该系统是伍德(W.Woods)于1972年开发用来协助地质学家查找、比较和评价阿波罗一号飞船带回的月球岩石和土壤标本的化学分析数据的系统。本文将简要介绍国内外问答系统研究的进展情况。并且针对问答系统中的一个难点以及实现方法进行了讨论。并给出如何识别用户搜索关键字的方法。问答系统第4页共49页第一章研究背景1.1问答系统研究背景随着因特网的快速发展,网络上流通的信息日益增加,它已俨然成为巨大的讯息流通交换平台,要在如此大量的数据库中找寻有用的数据着实不易,通常会藉助于搜索引擎的功能来达成,然而以关键词为主的搜索引擎常会找出所有相关的信息,但是其中也包含许多无用的数据,用户浪费很多时间浏览不相关的网页。随着互联网的发展,网络已成为人们获取信息的重要手段。目前,世界上最大的搜索引擎Google能够搜索的网页数量已经超过了百亿。传统的搜索引擎存在很多不足的地方,其中主要有三个方面:一是以关键词的逻辑组合来表达检索需求二是返回的相关性信息太多三是以关键词为基础的索引,停留在语言的表层,而没有触及语义,因此检索效果很难进一步提高。以上两点使得人们在互联网上的海量信息中快速准确地找到自己所需要的信息变得越来越困难。1.2传统的问答系统的不足传统的问答系统虽然可以对用户提出的问题给出确定的答案,但是这些问答系统的数据源是基于一个固定的文档集合,尚且不能满足用户的各种各样的需求。利用互联网上的资源是有效的解决之道互联网上具有丰富的信息,是问答系统数据源的理想资源,因此将问答系统与互联网结合起来,就变得非常必要。这也就促使了基于互联网的问答系统的出现和发展的问答系统的出现和发展。1.3问答系统研究现状问答系统的概念虽然提出的时间并不长,但已经形成发展出了一些比较成熟的系统。美国麻省理工学院人工智能实验室于1993年开发出来的START,系统()是全世界第一个基于Internet的问答系统。START系统旨在为用户提供准确的信息,它能够回答数以百万的英语问题,主要包括与地点相关的问题(城市、国家、湖泊、天气、地图、人口统计学、政治和经济等)、与电影相关的问题(片名、演员和导演等)、与人物相关的问题(出生日期、传记等)以及与词典定义相关的问题等。该系统采用基于知识库和基于信息检索的混杂模式,系统还保留着原来的两个知识库,STARTKB”和“InternetPublicLibrary。如果用户提出的问题属于这两个知识库的范畴,START就直接利用知识库中的知识返回比较准确的回答。反之,START系统将问题解析得到查询的关键词,通过搜问答系统第5页共49页索引擎得到相关信息,通过后续处理得到准确而简洁的回答返回给用户。比如提出一个问题“WhowasBillGates?,START系统回答“Cofounder,Microsoft.BornWilliamH.GatesonOctober28,1955,Seattle,Washington.。同时系统还返回一个关