大学毕业论文计算机专业

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

毕业论文论文题目:姓名:学号:学习中心:专业:指导教师:二〇〇年月毕业论文承诺书提示:根据北京语言大学网络教育学院论文写作的规定,如发现论文有抄袭、网上下载、请人代写等情况,毕业论文一律不及格。同时取消学士学位申请资格。毕业论文不及格者,可申请重写一次,并按重修缴纳费用。本人承诺:本人已经了解北京语言大学的毕业论文写作的有关规定;本人的论文是在指导教师指导下独立完成的研究成果。整篇论文除了文中已注明出处或引用的内容外,绝没有侵犯他人知识产权。对本论文所涉及的研究工作做出贡献的个人和集体,均已在文中以明确方式注明。签名:_____________日期:________________目录目录..........................................................3摘要.............................................................2Abstract.........................................................3第一章绪论....................................................11.1前言...........................................11.2研究背景.......................................11.2.1信息抽取概述........................................................................................................11.2.2基于内容的文本信息提取....................................................................................21.3开发人机交互的标注工具的意义....................31.4任务描述.......................................31.5论文的组织和安排................................4第二章标注工具的设计原则和设计思想..............................42.1研究方法和指导思想..............................42.2标注工具的设计原则..............................42.2.2文本标注工具的设计原则...................................................................................52.3人机交互界面设计原则...........................5第三章标注工具的具体开发........................................53.1开发环境的选择..................................53.2标注工具的设计..................................53.2.1标注工具的界面算法............................................................................................53.2.2结构设计................................................................................................................53.3标注工具的详细设计.............................53.3.1人机交互界面详细设计........................................................................................53.3.2菜单和工具栏的设计............................................................................................53.4标注过程文本的处理..............................63.4.1实体标注详细设计................................................................................................63.4.2关系标注详细设计................................................................................................63.4.3事件标注详细设计................................................................................................63.5标注结果.......................................63.6技术难点讨论....................................6第四章标注工具的缺陷分析和功能展望............................6结束语...........................................................2致谢.............................................................3参考文献........................................................4人机交互文本标注工具开发作者:***指导教师:*****(指导教师职称)摘要:基于内容的文本信息提取是当前的一个研究热点,无论搜索引擎还是问答系统,其根本的基础是有效的获取文本中的信息。使用机器学习的方法从语料库中获取有效的知识,以支持文本信息的处理已经成为计算语言学的一个主流技术,而带标语料库则是这一技术的基础。带标语料库的建设的基础就是对大量的文本进行标注,并以一定的结构来存储。这样一来就需要开发一个具有友好的人机交互界面的文本标注工具来辅助文本标注,在一定程序上减轻标注工作者的负担。这次文本标注工具的设计,处理的目标是纯文本文件,以一篇文档为单位提供用户进行实体,事件,关系的标注,并在标注过程中给出标注的中间结果,最后在保存标注文件的时候进行处理,以xml语言格式进行输出存储。标注工具的功能包括对文本的实体,事件,关系三大类的标注,对标注过的文本进行标记,提醒用户标注进度,最后对标注中间结果的处理与保存。本文是对这次人机交互文本标注工具的设计与实现的详细的阐述。首先对背景及理论知识作了具体的介绍。然后,分别进行文本标注工具的系统分析、总体架构分析,并对每个模块的具体实现做详细地讲解。最后,本文还介绍本次文本标注工具设计的缺陷以及未来改进的方案,并对本次标注工具的开发作总结。关键词:人机交互,文本标注,MFC编程TheInteractiveTexttaggingToolDevelopmentAuthor:*****Tutor:*****Abstract:Thetextinformationextrationbasedoncontentisacurrentstudyhotspot.Regardlessofthesearchengineortheinterrogator-respondersystem,theirbasicfoundationisgaintextinformationineffective.UsethemethodofmachinelearningtogainstheeffectiveknowledgefromCorpus,supportingthetextinformationprocessingisalreadybecomecomputaionallinguisticsamainstreamtechnology.Thetaggedcorpusisthetechnicalfoundation.Thetargetofthistexttaggingtooldesignistheprocessedcorpora(text).Takingthesinglepieceoftextforuserstotagentities,relations,events,andshowintermediateresultsduringtaggingprocess.culminatinginthepreservationoftaggingdocumentsprocessedxmllanguagetotheoutputformatforstorage.Thetool'sfunctionalannotationincludingtaggingtheentities,theevents,therelationslabeledthetaggingofftext,remindusersthetaggingprogress,anddealingtheintermediateresultsprocessingandpreservation.Thepaperwilldescribeanddiscussoverthedesignandrealizationofthisinteractivetexttaggingtool.Firstly,detailedtheoreticalbackgroundswillbegiven;secondly,analysisofthistoolandgeneralstructureforitandthefulldescriptionsabouttherealizationofeachmodelwillbeintroduced;finally,thedefectsofthedesignofthetoolandimprovementtoitsfuturedevelopmentwillbegivenandasummaryofthestructureandtheperformanceofthesystemwillbedeliveredaswell.Keyword:HumancomputerInteractive,Texttagging,MFC人机交互文本工具开发第一章绪论1.1前言随着互联网的广泛普及,语言信息处理的社会需求越来越大,人们迫切需要用自动化的手段处理海量的语言信息。语言资源有计划有规模的开发对于语言信息处理领域的研究和开发具有重要意义。对文本进行标注就是语言资源建设的一个方面,人机交互式的标注工具是进行语料标注的有效手段,从一定程度上可以的减轻标注工作者的负担,同时还可以辅助检查标注结果。开发界面友好的标注工具可以进一步的提高标注工作者的效率,同时结构化的输出更方便标注数据的后续使用。1.2研究背景1.2.1信息抽取概述信息抽取是指从一段文本中抽取指定的事件,事实等信息,形成结构化的数据并填入一个数据库中供用户查询使用的过程。即它从文本中抽取用户感兴趣的事件,实体和关系,被抽取出来的信息以结构化的形式描述,然后存储在数据库中,为情报分析和监测、比价购物、自动文摘、文本分类等各种应用提供服务。例如,灾害预防部门可以从自然灾害的新闻报道中抽取出灾害的类型、时间、地点、人员伤亡、经济损失等情况;医生可以从病人的医疗记录中抽取出症状、诊断

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功