学位论文论文题目:姓名:学号:学习中心:专业:指导教师:二〇〇年月毕业论文承诺书提示:根据北京语言大学网络教育学院论文写作的规定,如发现论文有抄袭、网上下载、请人代写等情况,毕业论文一律不及格。同时取消学士学位申请资格。毕业论文不及格者,可申请重写一次,并按重修缴纳费用。本人承诺:本人已经了解北京语言大学的毕业论文写作的有关规定;本人的论文是在指导教师指导下独立完成的研究成果。整篇论文除了文中已注明出处或引用的内容外,绝没有侵犯他人知识产权。对本论文所涉及的研究工作做出贡献的个人和集体,均已在文中以明确方式注明。签名:_____________日期:________________北京语言大学本科生毕业论文评阅书论文题目学生姓名学号所在院系专业国籍(留学生)指导教师指导教师意见评语:成绩:指导教师签字:日期:年月日评阅人意见评语:成绩:评阅人签字:日期:年月日1北京语言大学本科生毕业论文指导记录表论文题目学生姓名国籍(留学生)所在院系专业入学时间指导教师姓名指导教师职称/学历指导时间指导地点第一次指导:指导方式:(请选择)面谈电话电子邮件指导教师签字:日期:年月日第二次指导:指导方式:(请选择)面谈电话电子邮件指导教师签字:日期:年月日2第三次指导:指导方式:(请选择)面谈电话电子邮件指导教师签字:日期:年月日第四次指导:指导方式:(请选择)面谈电话电子邮件指导教师签字:日期:年月日第五次指导:指导方式:(请选择)面谈电话电子邮件指导教师签字:日期:年月日教务处制3北京语言大学本科生毕业论文答辩记录表论文题目学生姓名学号所在院系专业国籍(留学生)答辩时间答辩地点指导教师答辩记录答辩小组成员成员姓名职称/学历专业研究领域所在单位签名答辩小组评议意见/成绩:组长签字:院(系)学位委员会审核意见:签字:日期:年月日教务处制2目录目录..........................................................2摘要.............................................................2Abstract.........................................................3第一章绪论....................................................11.1前言...........................................11.2研究背景.......................................11.2.1信息抽取概述........................................................................................................11.2.2基于内容的文本信息提取....................................................................................21.3开发人机交互的标注工具的意义....................31.4任务描述.......................................31.5论文的组织和安排................................4第二章标注工具的设计原则和设计思想..............................42.1研究方法和指导思想..............................42.2标注工具的设计原则..............................42.2.2文本标注工具的设计原则...................................................................................52.3人机交互界面设计原则...........................5第三章标注工具的具体开发........................................53.1开发环境的选择..................................53.2标注工具的设计..................................53.2.1标注工具的界面算法............................................................................................53.2.2结构设计................................................................................................................53.3标注工具的详细设计.............................53.3.1人机交互界面详细设计........................................................................................53.3.2菜单和工具栏的设计............................................................................................533.4标注过程文本的处理..............................63.4.1实体标注详细设计................................................................................................63.4.2关系标注详细设计................................................................................................63.4.3事件标注详细设计................................................................................................63.5标注结果.......................................63.6技术难点讨论....................................6第四章标注工具的缺陷分析和功能展望............................6结束语...........................................................2致谢.............................................................3参考文献........................................................42人机交互文本标注工具开发作者:***指导教师:*****(指导教师职称)摘要:基于内容的文本信息提取是当前的一个研究热点,无论搜索引擎还是问答系统,其根本的基础是有效的获取文本中的信息。使用机器学习的方法从语料库中获取有效的知识,以支持文本信息的处理已经成为计算语言学的一个主流技术,而带标语料库则是这一技术的基础。带标语料库的建设的基础就是对大量的文本进行标注,并以一定的结构来存储。这样一来就需要开发一个具有友好的人机交互界面的文本标注工具来辅助文本标注,在一定程序上减轻标注工作者的负担。这次文本标注工具的设计,处理的目标是纯文本文件,以一篇文档为单位提供用户进行实体,事件,关系的标注,并在标注过程中给出标注的中间结果,最后在保存标注文件的时候进行处理,以xml语言格式进行输出存储。标注工具的功能包括对文本的实体,事件,关系三大类的标注,对标注过的文本进行标记,提醒用户标注进度,最后对标注中间结果的处理与保存。本文是对这次人机交互文本标注工具的设计与实现的详细的阐述。首先对背景及理论知识作了具体的介绍。然后,分别进行文本标注工具的系统分析、总体架构分析,并对每个模块的具体实现做详细地讲解。最后,本文还介绍本次文本标注工具设计的缺陷以及未来改进的方案,并对本次标注工具的开发作总结。关键词:人机交互,文本标注,MFC编程3TheInteractiveTexttaggingToolDevelopmentAuthor:*****Tutor:*****Abstract:Thetextinformationextrationbasedoncontentisacurrentstudyhotspot.Regardlessofthesearchengineortheinterrogator-respondersystem,theirbasicfoundationisgaintextinformationineffective.UsethemethodofmachinelearningtogainstheeffectiveknowledgefromCorpus,supportingthetextinformationprocessingisalreadybecomecomputaionallinguisticsamainstreamtechnology.Thetaggedcorpusisthetechnicalfoundation.Thetargetofthistexttaggingtooldesignistheprocessedcorpora(text).Takingthesinglepieceoftextforuserstotagentities,relations,events,andshowintermediateresultsduringtaggingprocess.culminatinginthepreservationoftaggingdocumentsprocessedxmllanguagetotheoutputformatforstorage.Thetool'sfunctionalannotationincludingtaggingtheentities,theevents,therelationslabeledthetaggingofftext,remindusersthetaggingprogress,anddealingtheintermediateresultsprocessingandpreservation.Thepaperwilldescribeanddiscussoverthedesignandrealizationofthisinteractivetexttaggingtool.Firstly,detailedtheoreticalbackgroundswillbegiven;secondly,analysisofthistoolandgeneralstructureforitandthefulldescriptionsabouttherealizationofeachmodelwillbeintroduced;finally,thedefectsofthedesignofthetoolandimprovementtoitsfuturedevelopmentwillbegivenandasummaryofthestructureandtheperformanceofthesystemwillbedeliveredaswell.Keyword:HumancomputerIntera