下载此文档

贝叶斯公式的简介.docx


文档分类:高等教育 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
贝叶斯公式在人工
智能中的应用
2013年4月7日
、公式
则对任一事件
贝叶斯定理若A,A,…,A构成完备事件组,且P(A)>0,(i=1,2,…,n),
12ni
B(P(B)>0)有
,k=1,2,…n
工P(A翻译界带来了极大的冲击。它不仅使机器翻译研究者重新思考以前的翻译方法,而且也激发了他们对统计方法用于机器翻译的浓厚兴趣。
IBM的工作一直延续到1995年,之后由于研究经费的原因而被迫中止。但是由于文献[3]中详细记载了IBM方法,(JHU)夏季研讨班上重新实现了IBM模型,并公开了源代码GIZA2。之后奥赫(Och)博士在此基础上发布了增强版GIZA++3。这些工作为后来统计机器翻译的发展奠定了坚实的基础。
IBM方法可以说是纯粹的单词到单词自动转录方法,除了计算复杂之外,另外一个很大的缺陷在于它只能学****到两种语言单词之间互为翻译的知识,而对单词的上下文语境却不敏感。这就导致了IBM方法在单词层面(word-level)上由于缺乏上下文语境而不能正确选择译文,尤其是不能正确翻译****惯表达、成语等多个单词结合紧密,却不能通过把逐个单词翻译然后拼凑在一起形成译文的源语言串。
2基于短语的方法
这种方法的基本思想是以短语作为翻译的基本单位。在翻译过程中,不是孤立地翻译每个词,而是将连续的多个词一起翻译。由于扩大了翻译的粒度,基于短语的方法很容易处理局部上下文依赖问题,能够很好地翻译****语和常用词搭配。一般而言,在基于短语的方法中,短语可以是任意连续的字符串,不作语法上的限制。这样可以方便地从词语对齐的双语语料库中自动获取双语短语翻译。给定一个源语言句子,基于短语的模型翻译过程如下:
1)对源语言句子进行短语划分;
2)根据翻译模型翻译每个短语;
3)对目标短语进行语序调整。(图3是基于短语的翻译过程示例)
源语言:访问ICEEJ
短语划分:
他将
1
于4中0日
访问美国
谓整顺序:
Hewill
onApril10
VisitAmerica
Hewill
VisitAmerica
onApril10
3训练
训练的时候,最初输入的是一个双语语料库,即一对一对互为翻译的句子。如样例1所示。经过一个词语对齐过程,得到如样例2所示形式的数据。从词语对齐的结果中可以知道句子中哪些词是互为翻译的。下面,训练过程的第二个步骤就是进行短语抽取了。所谓短语抽取,就是抽取出语料库中所有互为翻译的连续的词串,而不用管这个词串是否具有真正的含义。以上面第二个句子为例,可以抽取到的短语见样例3:
样例1
中国化工工业保持稳定增长。
ChinaTschemicalindustrymaintainssteadygrowth.
万里会见泰国客人
LiWanmeetswithguestsfromThailand
样例3
万里||LiWan
力里会见||LiWanmeetswith
万里会见泰国客人||LiWanmeetwithguestsfromThailand
会见||meetswith
会见泰国客人||meetwithguestsfromThailand
泰国||Thailand
泰国客人||gue

贝叶斯公式的简介 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息