下载此文档

多语种的拼音到汉字的转换和翻译-.ppt


文档分类:高等教育 | 页数:约44页 举报非法文档有奖
1/44
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/44 下载此文档
文档列表 文档介绍
多语种的拼音到汉字的转换和翻译-
目录
问题概述
拼音输入法
机器翻译:服务于汉字文化圈语言
结语
汉字文化圈
汉字亦称中文字、中国字,是世界上仍被广泛使用的高度发展的表意文字。仍在使用和曾经使用汉字的国家和地区包括로부터 삼년 이후에 忠道를 執持하고 과실이 없도록 맹세한다.
韩汉夹写(汉主韩从)
只今으로부터 三年以後에 忠道를 執持하고 過失이 없도록 盟誓한다.
韩国宪法(韩汉混合书写)
前文
悠久한 歷史와 傳統에 빛나는 우리 大韓國民은 3·1運動으로 建立된 大韓民國臨時政府의 法統과 不義에 抗拒한 4·19民主理念을 계승하고, 祖國의 民主改革과 平和的 統一의 使命에 입각하여 正義·人道와 同胞愛로써 民族의 團結을 공고히 하고, 모든 社會的 弊習과 不義를 타파하며, 自律과 調和를 바탕으로 自由民主的 基本秩序를 더욱 확고히 하여 政治·經濟·社會·文化의 모든 領域에 있어서 各人의 機會를 균등히 하고, 能力을 最高度로 발휘하게 하며, 自由와 權利에 따르는 責任과 義務를 완수하게 하여, 안으로는 國民生活의 균등한 향상을 기하고 밖으로는 항구적인 世界平和와 人類共榮에 이바지함으로써 우리들과 우리들의 子孫의 安全과 自由와 幸福을 영원히 확보할 것을 다짐하면서 1948年 7月 12日에 制定되고 8次에 걸쳐 改正된 憲法을 이제 國會의 議決을 거쳐 國民投票에 의하여 改正한다.
 
第1章 總綱
第1條 ①大韓民國은 民主共和國이다.
②大韓民國의 主權은 國民에게 있고, 모든 權力은 國民으로부터 나온다.
第2條 ①大韓民國의 國民이 되는 요건은 法律로 정한다.
②國家는 法律이 정하는 바에 의하여 在外國民을 보호할 義務를 진다.  
第3條 大韓民國의 領土는 韓半島와 그 附屬島嶼로 한다.
第4條 大韓民國은 統一을 指向하며, 自由民主的 基本秩序에 입각한 平和的 統一 政策을 수립하고 이를 추진한다.
第5條 ①大韓民國은 國際平和의 유지에 노력하고 侵略的 戰爭을 否認한다.
②國***은 國家의 安全保障과 國土防衛의 神聖한 義務를 수행함을 使命으로 하며, 그 政治的 中立性은 준수된다.
 … …
训读汉字串
借鉴这些周边语言和汉语的历史性联系,我们提出使用一种严格按照词汇语义等价条件下的汉字转写形式,分别用于相关语言到汉语的翻译处理。
这个以源语言的语法和语序书写的汉字串,其中的各个词汇在源语言和现代汉语之间语义等价,借用日语的术语,我们称之为“训读汉字串”。
语义翻译和语法翻译
以训读汉字串为中间语言,可以将机器翻译任务分解为两个阶段
语义翻译阶段
完全类似于汉语拼音输入法中汉语拼音串到汉字句子的逐一转换过程,基于双语词典提供的候选,源语言音节到汉字的转换是严格对应的(在越南语的情形,国语字到汉字的转换甚至是一个音节恰好可以严格映射到一个汉字),而无须考虑词序的重排和词汇的复杂改写。
语法翻译阶段
把遵照源语言语法的训读汉字串重排词序,必要时改写个别词汇,转为合乎汉语语法的句子。
注意这是一个单语言处理过程!
语言差异:韩语-汉语
语音:
和日语一样,韩语没有声调。
存在元音和谐现象。
语法:
韩语的语法结构是主宾谓(SOV)结构,不同于汉语的主谓宾(SVO)。
韩语是黏着语,这种类型的语言靠粘着在词干后面的大量、丰富的词尾的变化来表达语意。汉语是孤立语,靠词序来表达语意。
五组九类词,助词(关系语)反映黏着语功能和特性。可翻译的是体语(名词、代词等)。
语言差异:越南语-汉语
语音
越汉都有声调,前者有6个,后者有5个。
语法
越汉都是孤立语,动词没有型态变化,名词既没有性、数、格的形式和变化,形容词无需和名词保持性、数、格上的一致。通过词序来表达语法作用。都是主谓宾结构(SVO)。
跟多数东南亚语言(泰、高棉、马来语等)一样,越南语也是形容词后 置的语言。
「越南语」就不是「Việt(越)Nam(南)Tiếng(语)」,而是「Tiếng Việt Nam」;「京族的正式语言」就应该写成 「ngôn ngữ(言语)chính thức(正式)của[属于、的]dân tộc(民族)Kinh(京)」。
最简机器翻译方案
语义翻译
基于双语词典
语法翻译
基于语言模型联合得分最大化重排句子
为什么可以这么做
汉字的序顺其实不响影的你阅读和理解,是吧?
既然大部分汉语借词本来就是用汉字书写的,那我们就恢复它的本来面目!这就是最精确的翻译!
分离语义和语法翻译,让机器翻译过程更为明确,更有针对性
把双语的翻译转换为单语的重述任务

多语种的拼音到汉字的转换和翻译- 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数44
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小可爱
  • 文件大小1.88 MB
  • 时间2022-05-20