下载此文档

一种基于规则的现代汉语动词词义自动甄别方法.pdf


文档分类:办公文档 | 页数:约59页 举报非法文档有奖
1/ 59
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 59 下载此文档
文档列表 文档介绍
厦门大学
硕士学位论文
一种基于规则的现代汉语动词词义自动甄别方法
姓名:李安
申请学位级别:硕士
专业:语言学及应用语言学
指导教师:苏新春
20080501
中文摘要本挖掘、语音识别、文语转换等都有深刻影响,当前计算机自动词义甄别面对的算机词义自动甄规则。整个框架分三部分:第一部分应用语料库和统计方法,设占总数的.%,相信这一成果和基于统计的算法或者其它对更长上下文理解计算机自动词义甄别是自然语言处理中的一个重要的中间问题,也是词汇处理层面最难的问题,这一问题对机器翻译、文本分类、自动文摘、信息检索、文最大问题是难以获取足够有效的词义甄别知识。本文尝试利用《现代汉语语法信息词典》、《现代汉语词典》、《现代汉语动词大词典》等资源,建立一个统计方法和人工辅助相结合的分析框架为动词寻找计计了两套软件,一个可以对多义词的上下文词条、词性、义类进行多种统计,为人工制定规则提供帮助;另一个执行和检验规则对语料的处理情况并提供开放接口方便对规则进行修改。第二部分设计了语法分析框架,充分利用《现代汉语语法信息词典》以及其它可以形式化的句法结构进行词义甄别,统计了语法框架的处理效力。第三部分借鉴格语法、配价语法等理论建立词义甄别规则的语义分析框架,讨论了名词义类、名词词条、介词短语在处理不同类型动词上的作用。统计发现,几种语法标记在词义自动甄别上的作用是有限的,应该主要依赖动词和语义角色间的语义选择限制,而语义选择限制的作用会“因词而异本文为龆嘁宥实个义项编制了计算机词义自动甄别规则,并设计了与有限句法相结合的算法,统计结果证明有鲆逑畹恼仿试ヒ陨希的程序相结合后会取得更好的效果。关键字:计算机词义甄别;词义;规则
綽瑆保盡’’盌,,瑃”...”,.瑆.
衪甒.,.%瑃篶籱;.
声明人┟:李嗲厦门大学学位论文原创性声明~、辍拢兹呈交的学位论文,是本人在导师指导下独立完成的研究成果。本人在论文写作中参考的其它个人或集体的研究成果,均在文中以明确方式标明。本人依法享有和承担由此论文产生的权利和责任。
刷币答名:蕃作者签名:喀嗲厦门大学学位论文著作权使用声明日期:伽产√,月弓/日日期:┧暝鹿璪本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅,有权将学位论文的内容编入有关数据库进行检索,有权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。本学位论文属于⒈C年解密后适用本授权书。⒉槐C朐谝陨舷嘤ê拍诖颉
绪论第一节计算机自动甄别概述计算机自动词义甄别①即让计算机确定一个使用中多义词的确定意思,“确定早期词义消歧利用的是完全依赖人工编制规则的方法,这种方法主要利用上这种方法主要利用语言学家编制的各种词典里提供的消歧知识进行消歧,.钕仁褂谜庵址椒ǎù实渲卸源实氖鸵灞旧碜魑O绲囊谰荩知识,减轻了人工编制规则的劳动,但是这种方法不能对词的上下文进行很好地预测,而且没有哪部词典会涵盖所有对词义消歧有用的语言知识。一个歧义词的哪一种语义在一个特殊的使用环境中被调用。通过考虑词汇使用的上下文可以确定其具体的语义捌溆镆宥ㄒ逵写实洹⒗嘁宕堑浠蛘咂渌牟慰资源给出’’圆。一基于规则方法的研究下文词语间的选择限制,确定一个多义词的义项,这种方法有两个缺点:一是规则编制需要花费大量的时间、人力,难以大规模推广,二是单纯依赖规则不能处理修辞导致的“超常规”搭配,也很难处理一些缺少语言提示项的句子,在当时不能用于大规模的全文词义消歧。二利用词典的方法通过统计上下文词与词典释义词的同现数目来确定词义。后来随着义类辞典的研制发展,这种辞典也被应用到消歧当中,设计的算法在一些情况下取得了很好的正确率庵址椒ǖ挠诺闶强梢宰远袢『屠么实渲邢①词义甄别和词义消歧研究上是相同的,本文绪论部分不区分这两个术语。②【美甅德反悍ǎ钋熘校蹶溃钗埃艿路嫉纫耄谱匀挥镅源基础【浚本旱缱庸ひ党霭嫔纾:③繻甅德】基础【浚本旱缬韫ひ党霭嫔纾:
是通过一定的算法,对经过处理的训练语料进行统计,得出一个概率模型,另一部分是标注系统,根据学习到的概率模型对新的语料进行标注,在程序的训练阶特征,贝叶斯模型、决策表、决策树、神经网络逻辑学习系统以及临近方法等都适用于该模式。①几种算法从不同角度提出统计模型,虽然具体方法、对事实的逼近思路都不同,但是都是以概率来逼近语言现象的,卢志茂等对已有研究方法语言知识词典在当前词义消歧研究中发挥了重要作用,如董振东的“知网”、等。“知网ⅰ锻宕蚀柿帧方执河锎驶惆凑找欢ㄌ逑倒槿氩煌睦啵ü研究义项和语义类的搭配可以有效解决统计词义消歧中

一种基于规则的现代汉语动词词义自动甄别方法 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 59
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 durian
  • 文件大小 0 KB
  • 时间2014-05-13
最近更新