中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences1用信息技术架起发展天路中国科学院软件研究所吴健中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences2内容234藏文信息技术发展现状加强藏文信息技术普及应用软件所在藏文处理方面的工作汉藏翻译技术研发1中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences3藏文信息技术发展现状1中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences4中科院西部行动一期基本情况研发支持藏汉英三种文字的操作系统和办公套件面向藏文用户日常办公、学习、网络应用与西藏大学、西藏自治区藏语委办密切配合主要项目支持院知识创新西部行动项目《基于Linux的跨平台藏文信息处理系统》“863计划”软件专项《民族语言版本Linux操作系统及办公套件研发》信息产业部电发基金藏文专项项目《跨平台藏文办公套件》信息产业部电发基金藏文专项项目《藏文Linux操作系统》主要成果跨平台藏文办公套件V2.0跨平台藏文办公套件V3.0已经完成研发和测试,西藏大学在进行用户界面的藏文翻译藏文版红旗Linux操作系统V5.0中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences5中科院西部行动一期基本情况成果已在西藏地区大规模推广应用2005年作为自治区成立40周年的礼物赠送西藏5000套2008年应西藏自治区藏语委办请求,再次赠送产品2000套(新版)科学院高技术局对此事十分重视,高技术局领导专门作了批示培养了大批的用户在高校、政府机关、新闻单位和中小学等藏文用户作为西藏大学藏文信息技术课程和计算机文化基础课的实验教学平台中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences6藏文信息化进入新的阶段藏文的输入输出、办公、上网等应用需求已基本满足藏、汉科研人员的三十多年的不懈努力2002年中央领导“进一步加快少数民族语言文字信息化”重要批示科技部、教育部、信息产业部以及中国科学院先后投入大量资金,启动了一批藏文信息处理技术与产品研发项目西藏藏文信息处理技术力量得到长足发展西藏大学藏文信息处理教育部工程中心2005年,软件所与西藏大学共建藏文信息处理技术联合实验室,共同进行藏文信息技术研发和藏文信息处理研究生培养完成了一批研发项目,取得大量成果一些内地具有实力的企业开展藏文信息处理软件研发方正公司、北京中科红旗、上海中标软、福建榕基等公司一批符合标准、技术含量高、实用性强的藏文处理产品及应用系统相继面世涵盖了操作系统、藏文输入法、高精度曲线字库、办公套件、电子词典、浏览器、藏文印刷体OCR识别软件、网站及出版系统和办公自动化系统等各个方面微软公司从Vista操作系统和Office2007办公套件起支持藏文处理中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences7加强具有藏族特色的藏文信息技术研究藏文分词、藏文手写识别、藏文OCR、藏文语音处理、……藏文处理技术在西藏地区经济、文化发展中发挥作用利用信息技术,加快以藏文为载体的信息制作、传播速度国家的政策法规、科学文化知识以及市场与致富信息宣传贯彻落实党的路线方针政策、反对分裂、普及法律知识传播科学文化知识和经济信息,提高民族素质,促进经济发展关系到藏族地区的文化经济发展和脱贫致富,关系到社会稳定加强信息技术,特别是现有藏文信息技术的推广普及与应用充分发挥信息技术,特别是藏文信息技术在发展西藏地区经济文化,提高少数民族群众的科学文化素质,建设社会主义新农村新牧区等方面的促进作用让更多的藏族群众,特别是广大农牧民群众逐步分享到藏文信息技术发展给他们生产经营与生活带来的便利与变化以信息化带动现代化,实现西藏经济文化的跨越式发展藏文信息化进入新的阶段中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences8汉藏翻译技术研发2中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences9汉藏翻译技术研发加快以藏文为载体的信息制作、传播速度大量汉文信息要翻译成藏文才能被藏族群众所接受为藏族同胞提供丰富的藏文信息不仅关系到藏族地区的文化经济发展和脱贫致富,而且关系到社会稳定开展的工作汉藏辅助翻译系统研发面向专业翻译机构人-机配合,完成高质量的翻译工作目的:达到印刷出版的要求汉藏在线翻译系统研发面向互联网、集网页内容动态翻译(汉译藏)、汉藏英电子辞典等功能于一体采用多策略融合的计算机自动翻译快速提供基本可读的藏文译文为藏文用户快速浏览互联网的海量汉文信息提供便利中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences10汉藏翻译模型与算法汉、藏单语模型与汉藏翻译模型研究汉藏短语翻译模型及算法研究汉藏双语翻译(转换)规则的研究,以及规则库的建设多策略翻译方法的融合研究藏文句子生成方法研究面向汉藏辅助翻译的翻译记忆算法和翻译记忆库检索算法面向统计机器翻译的并行算法研究汉藏翻译质量评价方法研究,等等主要研究内容(一)中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences11汉藏双语大规模知识库构建藏文词切分与词性标注算法与工具研发汉藏句子与词对齐算法与汉藏平行语料库加工、汉藏双语短语对齐算法与工具研发汉藏双语平行语料库标注工具与管理维护工具研发研究特定领域汉藏双语术语库的自动抽取技术,实现术语库及自动更新机制建设大规模汉藏翻译知识库百万级面向农村牧区信息化的汉藏双语平行语料库百万级非特定领域的汉藏双语平行语料库翻译模板与规则库,等等主要研究内容(二)中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences12汉藏辅助翻译系统人机交互模式研究汉藏翻译特点分析与汉藏翻译人员翻译工作习惯研究符合汉藏翻译特点和工作习惯的用户界面研发面向汉藏翻译的藏文输入法研发集成汉藏电子字典等工具,研究这些工具在辅助翻译软件中的操作行为构建汉藏辅助翻译协同工作环境结合西藏自治区编译局的翻译业务应用需求,构建网络化的汉藏翻译流程管理任务分配、原译文传输与跟踪、译文审校与签发、翻译质量监控,译文的排印,……系统研发(一)中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences13汉藏在线翻译系统集成在汉藏翻译算法和汉藏双语大规模知识库采用B-S结构,研发提供网页内容动态翻译的在线汉藏翻译引擎提供多种用户使用界面以插件方式与浏览器、办公套件等软件配合使用,为用户提供在线汉藏翻译服务集成汉藏在线电子词典等工具,并提供在线词典更新构建支持50万用户级大规模并发服务的基于互联网的汉藏在线翻译服务系统提供基于汉藏在线翻译系统客户端软件大规模并发下载服务与在线更新服务系统研发(二)中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences14汉藏辅助翻译系统研发2009年获得中国科学院西部行动高技术项目资助软件所、西藏大学、自治区编译局共同承担项目周期:2年进展情况完成藏文辅助翻译系统总体设计和各功能模块设计初步建立藏文语言模型,完成藏文分词算法设计与开发完成汉藏双语语料库加工工具集研发,建立20万句对规模的汉藏平行语料库、10万条以上的藏汉双语词及短语词典和5万藏词条的汉通用术语库,并完成翻译记忆库构建完成汉藏翻译特点分析与汉藏翻译人员翻译工作习惯研究,建立汉藏翻译用户模型库,初步完成符合汉藏翻译特点和工作习惯的用户界面研发初步建立汉藏互译规则和模板库初步完成汉藏辅助翻译软件和汉藏协同翻译流程管理子系统原型搭建研发进展(一)中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences15汉藏辅助翻译字典工具汉藏辅助翻译主菜单汉藏辅助翻译工具栏待翻译原文辅助翻译工具主界面中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences16翻译工作区:辅助翻译工具提供的汉藏翻译对比结果,如果不满意目前辅助翻译工具提供的译文,可以鼠标双击这里,得到分解后按短语翻译的结果译文区:编辑这些译文,完成最后的译文点击这个按钮,翻译的结果插入文档,并读取下一句辅助翻译工具工作框中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences17鼠标单击这里译文结果改变点击这个按钮,翻译的结果插入文档,并读取下一句中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences18下一句原文译文原文译文对比显示也可以直接在译文区修改中国科学院软件研究所InstituteofSoftware,ChineseAcademyofSciences19研发进展(二)汉藏在线翻译系统西藏大学、软件所共同完成了项目的立项申请西藏大学、软件所共同承担项目周期:2年开始进行前期技术研究进一步开展藏文分词与标注算法设计与开发完善汉藏双语语料库加工工具集汉藏互译语料库建设藏文概念词典(TCD)建设……