第十章第一节机器翻译概论1.机器翻译2.机器翻译的应用概念机器翻译(machinetranslation),又称机译(MT),是利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。国外机器翻译历史•国外机器翻译的发展历史:•20纪30年代初,法国科学家GB阿尔楚尼最早提出机器翻译的设想。•1946年,英国和美国的两位工程师在1949年出版了《翻译备忘录》一书。•1954年年,美国乔治敦大学和国际商用机器公司(IBM)首次联合试验使用电脑机译系统,并将由250个词组成的简单的俄文材料译成了基本上可以接受的英文。•这次试验的成功标志着机器翻译系统的真正诞生。中国机器翻译历史•1956年我国开始研究机器翻译。•1987年中国军事科学院成功研制出“科译4号”,这标志着我国机译系统从无到有。•1967-1976年的沉寂期•1997年底,东方快车以“智能汉化”为口号,在国内掀起翻译软件的高潮。•1988年是中国翻译软件最红火的一年,国内出现了通译、译星、朗道、即时通、汉神、Internet宝典等几十种翻译软件。机器翻译方法分类•(1)基于规则分析,就是对源语言语句的词法、语义、语法和句法进行分析并进行判断和取舍,然后重新进行排列组合,最后生成目标语言。这一系列过程均是模仿人脑进行翻译的过程。•2)基于语料库技术,工作原理是利用统计学和概率方法建立一个包含各种句型的双语对照语料库。•基于规则的机器翻译(Rule-Based):直接翻译法,即输入→形态分析→双语字典查询→词序调整→输出;转换系统;基于中间语的机器翻译逐词进行翻译,又称逐词翻译法:翻译效果差,属于早期过时认识,现已无人采用:Howareyou?怎么是你?Howoldareyou?怎么老是你?•基于语料库的方法(Corpus-Based):基于实例的机器翻译EBMT(example-basedmachinetranslation)统计机器翻译SBMT(statistics-basedmachinetranslation):如Google翻译引擎机器翻译的缺陷•以至于近来有人说“MT,不是machinetranslation的缩写,而是madtranslation(疯子的翻译)的缩写”。•虽然机器翻译历经了70多年的研究,机译的译文质量确实还是不能令人满意。从语言文化角度•每个国家都有其独特的文化,文化的差异形成于历史沉积,渗透于生活的方方面面。•机器翻译在进行翻译过程中遇到英汉之间文化差异和文化障碍,通过“金山快译”和“东方快车”这两种常用的翻译软件来举例说明:这是机器翻译的一个缺陷,也是其重要的薄弱点。•Sheisafox.•机器翻译:她是狐狸.•机器翻译对这个句子进行了直接字面翻译,似乎没有错。在中英文中,“狐狸”一词都可以与狡猾或诡计多端的人联系在一起。•但是“当狐狸”一词与女性联系在一起时,汉语与英语却分别具有了不同的色彩和暗示。•按照中国人的心理“狐狸”形容女性是贬义,指“狐狸精”,这无疑是错误的,因为在英语中“FOX”形容女性是指时髦迷人的女子。•如果直译为“:她是只狐狸”,便容易在中国读者心中唤起一种传统上遭到贬斥的形象。•参考译文:她是位时髦迷人的女郎。•狗嘴里吐不出象牙•机器翻译:Noivoryissuesfromthemouthofadog.•在汉语中有关狗的词语往往带有贬义色彩,然而在英语国家中,狗被普遍认为是人类最忠诚的朋友,对狗的忠诚大加赞赏,因此如果在这个句子中,把狗直译为dog,会产生文化色彩的变异。•在这里机器翻译忽略了“狗”(dog)在中英的特殊文化意义。对这个句子大家比较接受的翻译为:Afilthymouthcan’tutterdecentlanguage.•天有不测风云•机器翻译:Awindandcloudmayarisefromaclearsky.•汉语中的“风云“一词如果照字面直译为英语中的windandcloud,那么英语读者是很难体会出“风云”一词所包含的文化内涵的。•“风云”一词在汉语中可以用来比喻“不安定的,多变的局势”,比如“风云变幻”,“风云突变”等词组中的“风云”都包含有这一层的含义。为了便于英语读者的理解,应当根据其真正的文化意义来真实再现原文信息:•参考译文:Somethingunexpectedmayhappenanytime.从语言语法角度•Wedon‘treadbooksforamusement.•机器翻译:我们为了消遣而不读书。•原文中的not位于read前,形式上是否定谓语,而在实际意义上是否定后面的foramusement,原文的正常语序应是:Wereadbooksnotforamusement.•但英语中习惯把not提到前面去,这叫“否定前置”。又如我们常说的“:我们活着不是为了吃饭,而吃饭是为了活着”,译为英语就是:Wedonotlivetoeatbuteattolive.原译单纯在形式上与原文相对应,但意思却完全错误。•参考译文:我们读书不是为了消遣。•他有两米高。•机器翻译:Hehastwometershigh.•这就是我们经常所说的Chinglish(中式英语)现象,机器翻译也同样出现了这种问题,只懂得按字面意思翻译。•have(has)是“有”的意思,表示拥有某物,具有所属的关系。但是汉语中的“有”不能完全等同于“have(has)”。他“有”两米高表示他的特征,本身所具有的属性,不能按照字面进行直译。•参考译文:Heistwometershigh.从语言上下文联系角度•不胜惭愧。•机器翻译:Itisashamedvery。•这句话的上下文若是为自己有缺点,做错了事或未能尽到责任而感到不安,此句应译为“Ifeelquiteashamed.”•但其上下文若是受人赞扬而表示自谦,则此句话只具备语用意义,应译为“Ifeelgreatlyflattered.”数码相机机器翻译:数のカメラ*这里“数码相机”翻译成“数のカメラ”,日本人是不会懂的。参考译文:デジタルカメラ机器翻译的优点•机器翻译是科技翻译,尤其是各具体学科、专业翻译的最佳途径。因为这类翻译句式结构较为简单,专业词汇重复量大,而机器翻译速度快、效率高,完全可以在这方面大显身手。•1.Thesetestsdetermineifthesubsystemhasaproblem.•机器翻译:这些测试确定子系统是否有问题。•非文学出版物的机器翻译一直在进行,产品说明书、天气预报等一些基于专业语料库的材料的翻译效果还是不错的。例如,蒙特利尔大学研制的英法翻译系统进行天气预报的自动翻译,多年来每天自动翻译1,5002,000份天气预报材料,具有很强的实用性。•世界上有70%以上的网站都是用英文编写的,而只有12%13%的网站是由汉语编写而成的。•互联网以及与计算机相关材料的翻译很大一部分依赖机器翻译。机器翻译在这方面发挥着机器辅助翻译所不能比拟的作用。•目前有多种网络资源可以提供词汇、专有名词、例句、文化背景等资料检索功能,大大方便了翻译学习和研究,并为翻译教学提供新的思路。•常见的资料检索渠道有搜索引擎、在线词典(如金山在线)、在线百科全书(如维基百科等)、双语平行语料库(如中国译网、句酷等)。•人类对自然语言的认识是无尽的,对机器翻译的研究也是无尽的。不管怎么说,机器翻译的速度却是无可置疑的,因此我们必须相信机器翻译的质量将会越来越好,越来越成熟。•我们不能完全依赖于机器翻译,最多把机器翻译当做一种参考,一份“草稿”,再进行人工翻译的思考与修改。