计算机辅助翻译ComputerAidedTranslation2工欲善其事,必先利其器。《论语·卫灵公》君子生非异也,善假于物也。荀子《劝学篇》参见短片:1电脑为你实时翻译:新技术,新生活——感受技术的魅力(二)为什么要学习翻译技术生产工具的重要意义生产工具是生产力的主要标志,生产工具在生产力的发展中起着决定性的作用,生产力的质的飞跃是以生产工具的重大变革为先导的。——社会发展简史3为什么要学习翻译技术身处信息时代,任何职业都离不开计算机技术,翻译行业当然也不例外。(参见短片:MIIS计算机辅助翻译课程介绍)掌握翻译技术,可能对求职是一个优势。全球化带来了前所未有的翻译需求(非文学文本占到了翻译总量的95%(李长栓,2004),如本地化的特点:量大、时间紧迫。传统的翻译手段难以满足需要。正确使用翻译技术能有效提高你的工作效率,为你带来效益。倍增生产力提高翻译速度提高翻译质量降低劳动强度4语言服务人才技能语言基础交流沟通行业知识项目经验职业道德IT技术现代语言服务人才素质需求5过硬的英中文表达、转换能力信息技术基础知识熟练利用多种网络检索技术来获取信息和知识熟练掌握各类辅助翻译/电子工具熟练基本的翻译规则和流程知识广博,并且精通某一行业领域的知识能够承受工作压力,按照客户要求及项目计划控制项目进度和质量团队协作精神贯穿整个翻译工作流程,翻译、编辑、校对、工程、测试等恪守职业道德,敬业态度、忠诚、责任心、细心、保密安全新一代语言服务人才素养要求1.信息技术支持2.协同翻译模式3.标准项目管理4.市场需求导向文本处理、机器翻译、翻译记忆、术语库、语料库、百科全书、在线词典、搜索引擎、专业资料等协同翻译、角色分工、资源共享角色分工、行业标准关注市场需求、实用文体、专业翻译我们的教学与现实的差距?HT–HumanTranslationCAT–Computer-aidedTranslationMT–MachineTranslation几个术语IT:自动化程度划分人机结合,各得其所Hutchins&Somers,1992参见短片:认识不同的翻译软件什么是CAT10参见冯志伟《机器翻译研究》2004.中国对外翻译出版公司制造一种机器,让使用不同语言的人无障碍地自由交流,一直是人类的一个梦想。MT早于计算机(1629,笛卡尔)机器翻译的研究始于上世纪四十年代。机器翻译(MachineTranslation):利用计算机及其软件把一种语言(自动)翻译成为另外一种语言的技术。MT:发展历程MT:发展历程1933-1954,初创阶段1949年,WarrenWeaver提倡MT研究■翻译的过程可用解密过程(decoding)来类比1954-1966,发展阶段Georgetown+IBM第一个俄英翻译实验1966-1976低潮(难以跨越的“语义障碍”(semanticbarrier),机器翻译很困难,这个结论来之不易)ALPAC(自动语言处理顾问委员会,AutomaticLanguageProcessingAdvisoryCommittee)报告1976-复苏机器翻译研究的发展历程70年代,机器翻译研究开始复苏■TAUM-METEO系统获得成功■欧共体启用SYSTRAN系统■人工智能、知识工程进展的影响。80年代,机器翻译研究呈繁荣局面,系统产品出现■日本实施五国合作的ODA计划■欧盟实施Eurotra计划■多个公司推出了MT产品■机器翻译方法的进展90年代,平台.难以提高,新方法出现1999.统计MT突破机器翻译方法的多样化机器翻译的理论基础或类型:Rule/StatisticsWheneverIfirealinguist,oursystemperformanceimproves1988SomeofmyBestFriendsareLinguists.2004FrederickJelinekJulianSinclairSmithProfessor,DepartmentofElectricalandComputerEngineeringJohnsHopkinsUniversityYorickWilksProfessorofArtificialIntelligeceDepartmentofComputerScienceUniversityofSheffieldStonesoupMT是语言学问题词序IhaveenjoyedhearingaboutyourexperienceinAfrica.多义词spririt介词Thefishwasboughtbythecook/river.连词and问题ItisnecessarytostudythehistoryandgrammarofChineselanguage.参见刘涌泉1997Isawagirlwithatelescopeinthebank.理性主义的规则-智能法直接转换transfer中间语言interlingua经验主义的语料统计法统计机器翻译statisticalMT基于实例的机器翻译Example-basedMT词典+规则语料+统计Givemeenoughparalleldata,andyoucanhavetranslationsystemforanytwolanguagesinamatterofhours.FranzJosephOchStonesoup“统计+规则”英汉机器翻译测试大纲(俞士汶)机器翻译的基本类型基于实例的机器翻译ExampleBasedMachineTranslation(EBMT)1984年由日本著名机器翻译专家长尾真提出背景■建立在转换基础上的机器翻译系统,在差异较大语言对间进行互译时,效果不好■人在翻译时不做深层次语言学分析■人在学外语的时候,首先要作大量的对照记忆,在遇到新的句子时,会和记忆中的句子类比建立基于类比思想的机器翻译基于实例的机器翻译基本思想■主要知识库是双语对照的实例库■当需要翻译一个新句子时,通过检索的办法在实例库中寻找和该句类似的翻译实例。■新句子的翻译可通过模拟最类似的实例的译文的方式获得。基于实例的机器翻译EBMT的优点■系统维护容易*系统中知识以翻译实例和义类词典等形式存在,可以很容易的利用增加实例和词汇的方式扩充系统。■容易产生高质量的译文*尤其是利用了较大的翻译实例或和实例精确匹配时更是如此。■可避免进行深层次的语言学分析基于实例的机器翻译EBMT的关键问题■大规模的双语语料库■双语对齐问题*语篇、句子、短语和词汇等各种级别■建立合理的相似度准则■高效的实例检索机制■译文生成翻译记忆技术和基于模板的翻译技术基于统计的机器翻译Statistic-BasedMachineTranslation(SBMT)50年代初曾有提及,遭到以Chomsky为代表的语言学家的反对90年代初,统计翻译技术复苏■统计技术在语音识别领域获得成功■目前计算机性能已能胜任密集型计算■目前也有大量联机双语电子文本不能完全指望机器翻译词典词库广泛性:收录够不够词条描写性:框架合适不合适词典适应性:加载不同属性词典规则规则广度与精度规则冲突的解决数据是否有足够多的语料是否有较好的算法Willyoumarryme新造词是否有对应译法?不折腾嫁给我/娶我mouse关于CAT全自动高质量翻译FAHQT不行,CAT呢计算机辅助翻译的主体是谁?计算机辅助翻译的主体是人。相对比较容易,很实用。人机结合,各得其所机器储存、记忆能力人工智能核心:翻译记忆(相似性的评判标准)适用于规范、重复性高的文本.Eg.Office2003Office2007Documents尽可能大而全的语料、尽可能好而快的算法.23狭义与广义翻译技术翻译技术体现为一组翻译工具,是若干软件工具的集合。计算机辅助翻译(CAT)关注的是“如何应用计算机软件,最大限度地实现翻译流程的自动化,提高人工翻译的效率,保证人工翻译的质量,并能够管理翻译流程”24CAT,范围较广,凡是有助于翻译的IT工具上传下载:Email/FTP/Portal虚拟系统:登陆客户方系统翻译杀毒防毒:kaspersky,360;网络收藏夹:资源分类和整理即时交流:MSN,Skype、QQ系统管理:分割、压缩(WinZip、WinRar)文档分类管理多媒体工具:OpenSubtitleTranslator辅助写作工具:Arbortext排版工具:处理不同格式资料备份与同步:输入法:手写阅读浏览PDF文本处理工具:Word、UltraEdit、EditPlus,文字处理常用的快捷键文字识别OCR文档处理工具(文档转换):SnagItSpellcheckerGrammarcheckerDictionary搜索工具Full-textsearch(google)电子词典Concordancer(语料库)Bitexts25