第10章-统计机器翻译第一讲

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

LOGO第十章统计机器翻译第1讲统计自然语言处理CompanyLogo第十章统计机器翻译机器翻译的产生与发展1机器翻译基本方法2关于分析方法与统计方法的思考3统计翻译基本原理4关于译文评估7统计机器翻译的改进(待续)6IBM统计机器翻译模型5CompanyLogo10.1机器翻译的产生与发展CompanyLogo10.1机器翻译的产生与发展CompanyLogo10.1机器翻译的产生与发展CompanyLogo10.1机器翻译的产生与发展CompanyLogo10.1机器翻译的产生与发展CompanyLogo第十章统计机器翻译机器翻译的产生与发展1机器翻译基本方法2关于分析方法与统计方法的思考3统计翻译基本原理4关于译文评估7统计机器翻译的改进(待续)6IBM统计机器翻译模型5CompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法fCompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法CompanyLogo10.2机器翻译基本方法机器翻译研究现状:CompanyLogo第十章统计机器翻译机器翻译的产生与发展1机器翻译基本方法2关于分析方法与统计方法的思考3统计翻译基本原理4关于译文评估7统计机器翻译的改进(待续)6IBM统计机器翻译模型5CompanyLogo10.3关于分析方法与统计方法的思考CompanyLogo10.3关于分析方法与统计方法的思考CompanyLogo10.3关于分析方法与统计方法的思考CompanyLogo10.3关于分析方法与统计方法的思考CompanyLogo10.3关于分析方法与统计方法的思考CompanyLogo10.3关于分析方法与统计方法的思考CompanyLogo10.3关于分析方法与统计方法的思考3、观点与认识CompanyLogo10.3关于分析方法与统计方法的思考CompanyLogo第十章统计机器翻译机器翻译的产生与发展1机器翻译基本方法2关于分析方法与统计方法的思考3统计翻译基本原理4关于译文评估7统计机器翻译的改进(待续)6IBM统计机器翻译模型5CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理翻译概率语言模型概率CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理CompanyLogo10.4统计翻译基本原理式(10-4)是后面将要介绍的5个IBM翻译模型的基础。CompanyLogo第十章统计机器翻译机器翻译的产生与发展1机器翻译基本方法2关于分析方法与统计方法的思考3统计翻译基本原理4关于译文评估7统计机器翻译的改进(待续)6IBM统计机器翻译模型5CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型目标语言长度l=8源语言长度m=10CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-1翻译模型CompanyLogo10.5IBM-2翻译模型CompanyLogo10.5IBM-2翻译模型只是模型1中将对位概率a(i|j,m,l)固定为而已。因此,模型1的所有参数都可以被重新解释成为模型2的参数。实际上,利用一个模型计算对位概率,而用另一个模型计算计数的方法是一种常用的思路,这种方法总是可以把一个模型的参数转换给另一个模型。1)1(lCompanyLogo10.5IBM-2翻译模型CompanyLogo10.5IBM-3翻译模型CompanyLogo10.5IBM-3翻译模型CompanyLogo10.5IBM-3翻译模型CompanyLogo10.5IBM-3翻译模型CompanyLogo10.5IBM-3翻译模型CompanyLogo10.5IBM-3翻译模型CompanyLogo10.5IBM-3翻译模型模型3的缺陷:模型3没有考虑到“多对一”的情况而造成了模型的不完整。如果一种模型具有这种特性:不能够把所有的概率集中到所关注的事件,我们说这种模型是不充分的或者说是有缺陷的。CompanyLogo10.5IBM-4、5翻译模型在英语句子中,有些单词常常构成短语,这些短语一般作为一个整体被翻译成法语。很多情况下,一个短语被翻译成法语后在句子里的位置与原来在英语句子里的位置完全不同。模型3的位变概率却不能很好地解释短语作为一个整体移动这种趋势。当然,唱的短语与短的短语相比,被移动的机会更少。在模型4中,通过修改位置概率来部分地解决这种问题。在模型4中,可能出现一些根本不可能存在的对位却有着非零概率的情况,因此,模型5试图消除这种缺陷。CompanyLogo第十章统计机器翻译机器翻译的产生与发展1机器翻译基本方法2关于分析方法与统计方法的思考3统计翻译基本原理4关于译文评估7统计机器翻译的改进(待续)6IBM统计机器翻译模型5CompanyLogo10.6统计机器翻译的改进基于结构的翻译模型基于句法结构的翻译模型基于短语的翻译模型基于最大熵的统计翻译方法基于反向转换文法的翻译模型基于层次短语的翻译模型基于语块的翻译模型基于有限状态转换机的翻译模型……CompanyLogo第十章统计机器翻译机器翻译的产生与发展1机器翻译基本方法2关于分析方法与统计方法的思考3统计翻译基本原理4关于译文评估7统计机器翻译的改进(待续)6IBM统计机器翻译模型5CompanyLogo10.7关于译文评估常用的评测指标1)句子错误率:译文与参考答案不完全相同的句子为错误句子。错误句子占全部译文的比率。2)单词错误率:译文与参考答案之间的编辑距离的比率。3)与位置无关的单词错误率4)流畅度5)忠实度CompanyLogo10.7关于译文评估IBM的BLEU评价方法-BiLingualEvaluationUnderstudy基本思想:统计同时出现在系统译文和参考译文中的N元词的个数,最后把匹配到的N元词的数目除以系统译文的单词数目,得到评测结果。CompanyLogo10.7关于译文评估CompanyLogo10.7关于译文评估NIST评估方法-NationalInstituteofStandardsandTechnology,USA基本思想:在BLEU方法的基础上提出来的,如果一个N元词在参考译文中出现的次数越少,表明它所包含的信息量越大,那么,它对于该N元词就赋予更高的权重。CompanyLogo10.7关于译文评估统计翻译中的译文错误1)模型错误:概率最高的译文不是正确的。2)搜索错误:概率最高的译文是正确的,但搜索算法找不到。这类错误大约占5%。CompanyLogo第十章第1讲小结机器翻译的发展机器翻译基本方法统计机器翻译的基本原理IBM统计机器翻译模型统计机器翻译的改进(待续)关于译文评估LOGOThankyou!

1 / 72
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功