词典软件GoldenDict的研究与扩展开发小组成员:李文韬许瑞填赖永周陈欣黄鹏开源项目背景简介词典软件是计算机或手机上的具有词语解释等词典查询功能的软件。相比传统的纸质词典,词典软件具有使用方便、快捷等特点。当今比较著名和流行的商业类词典软件有:金山词霸、有道词典、灵格斯词霸等。相对于商业词典软件,开源词典软件通常具有免费、跨平台、可定制性强的特点。开源项目背景简介GoldenDict基于Qt开发的跨平台的辞典翻译软件,支持多种格式辞典、划词查询、即指即译等多种特色功能。研究与扩展开发计划方案基本思路:完善开源词典软件、利用词典软件功能扩展开发新应用。具体目标如下:研究GoldenDict、StarDict等开源词典项目的源码和开发文档、了解项目框架,完善开发文档。学习Qt开发,着重扩展和完善GoldenDict项目。研究与扩展开发计划方案具体目标(续):扩展的功能目标:增加背单词学习模块增加在线全文翻译模块增加在线资源模块尝试实现OCR屏幕取词技术改进划词查询模块、模糊查询模块…进度安排配置Qt与项目开发环境(10.10-10.17)学习研究GoldenDict源代码和程序框架,参考StarDict源码(10.18-10.31)各组员分工开发扩展功能模块,编写文档(11.1-12.18)模块整合、测试(12.19-12.31)项目总结(1.1-1.7)人员分工李文韬(组长):管理项目进度、参与背单词学习模块开发许瑞填:负责在线全文翻译模块和在线资源模块开发赖永周:负责屏幕OCR屏幕取词模块开发陈欣:负责背单词学习模块开发黄鹏:负责在线资源模块和全文划词搜索模块开发工作展示OCR屏幕取词模块在线全文翻译模块在线资源模块背单词学习模块…OCR屏幕取词模块OCR介绍OCR词典介绍OCR取词翻译实现原理OCR取词翻译功能介绍OCR取词翻译功能的计划与发展OCR介绍光学字符识别(OCR,OpticalCharacterRecognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。(via维基百科)OCR软件国内中文识别最好的两家:清华TH-OCR和汉王OCR。国外最好的两家:Nuance-OmniPage和ABBYY-FineReader。开源Tesseract-OCROCR词典介绍OCR屏幕取词有道词典2.0以上改进版的GoldenDict全文OCR翻译目前只有本软件实现OCR取词翻译实现原理OCRScreenCapture*.bmpTesseract.exe*.txtClipbordConfig.iniTranslate•Singleword•FullTextOCR取词翻译功能介绍OCR截取屏幕功能OCR单词翻译与全文翻译功能OCR功能设置OCR截取屏幕功能OCR单词翻译OCR全文翻译功能OCR功能设置OCR取词翻译功能的计划与发展摄像头捕捉实物文档进行翻译移植到手机上在线全文翻译模块功能简介通过调用互联网的在线全文翻译接口来完善词典的翻译功能在线自动翻译APIGoogle翻译APITranslateThisButton翻译APIjQuery翻译插件YahooBabelFish翻译APIMicrosoftLiveSearch翻译工具在线全文翻译模块使用Google翻译API使用get方法调用API工作流程用户切分段落待翻译文本发送每个段落的翻译请求语言类型信息段落文本Url接收翻译结果网络回应输出译文在线全文翻译模块在线资源模块功能简介整合管理互联网上的学习资源在线资源模块背单词学习模块需求充分利用GoldenDict的词典资源辅助语言课程的学习功能单词记忆辅助单词学习管理用户管理