下载此文档

基于规则的现代汉语副词用法自动识别研究.pdf


文档分类:办公文档 | 页数:约61页 举报非法文档有奖
1/ 61
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 61 下载此文档
文档列表 文档介绍
郑州大学
硕士学位论文
基于规则的现代汉语副词用法自动识别研究
姓名:刘锐
申请学位级别:硕士
专业:计算机软件与理论
指导教师:昝红英
20090501
摘要汉语属于分析性语言,缺乏严格意义上的形态变化,汉语的副词承担着繁重重要性不言而喻。目前已有的副词研究成果大都是面向人用的,对副词个性的描述难以避免主观性和模糊性,很难直接应用于自然语言处理的研究。本论文主要探讨了面向机的语法任务,在汉语语法系统中具有重要地位。副词在自然语言理解与生成中的器的副词用法自动识别。本文的主要工作包括:愿贝手J犊狻⒏贝使嬖蚩夂陀锪辖屑蛞C枋觯曜⑾低辰ɡ酶词知识库和副词规则库对语料进行标注。莞贝视梅ù实洹⒏贝视梅ü嬖颍盟惴ㄊ迪侄杂锪系母贝视梅自动识别,副词的规则是一种问剑锪弦逊执省8莞贝使嬖蚱ヅ溆锪希将匹配成功的规则标注在副词后。诖砦笄墓嬖蜓埃砸丫曜⒑玫挠锪辖醒埃韵钟械规则进行修改使其更加完善,达到理想的效果。目褐皇钦攵缘ジ龉嬖虻母贝式行了错误驱动的规则学习。论文最后对本课题已有的研究工作进行了总结,并对今后的进一步研究进行了展望。关键词副词知识库;副词用法自动识别:副词规则库:错误驱动基于规则的现代汉语副词用法自动识别研究
...,甀.,甃,,
学位论文作者┟:和学位论文作者:劂刍乙伊瓿г掠∪删曷拊鲁迦学位论文使用授权声明郑重声明本人所呈交的学位论文是在导师指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表过或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均己在文中以明确的方式标明。本声明的法律责任由本人承担。本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。瑈、
第一章绪论虚词的概貌词是语言中能独立运用的最小的音义结合体。在汉语中的词类问题一直是汉语语法学界长期争论但未能较好解决的问题,很多学者主张汉语的词可以分类而虚词意见不尽相同,对汉语虚实划分的标准意见不一。从功能上看,实词能够充锋、张化瑞、段慧明、俞士汶的统计,在年《人民ā酚锪现校且需要分类,并且主张首先分为实词和虚词两大类。但对于哪些是实词,哪些是任主语、宾语或谓语,虚词不能充任这些成分。一般都把连词、介词、语气词、助词当作虚词,把名词、动词、形容词、数词、量词、代词当作实词,副词的归属则意见不一,归纳起来有三种意见:一是虚词;二是实词;三是半虚半实词。本文致力于面向机器的副词机器自动识别标注的研究,该研究工作是俞士汶“三位一体”广义虚词知识库建设口闹匾D谌葜唬氐阍谟诶靡丫⒑玫母词知识库对语料进行副词用法的计算机自动识别标注工作。副词是虚词中的一种,首先我们对虚词要有一个总的了解,要建立汉语虚词知识库首先得对汉语虚词有一个较为清醒的认识。虚词是针对实词而言的,虚词虽然数量不多,但意义和用法较为复杂,而且是表达语法意义的主要手段。从数量上看,与实词相比较,虚词属于封闭性词类,每一类虚词的数量是有限的。据一般统计,汉语的虚词数量大约在鲎笥遥S眯榇实氖恐辉颊ァ《汉语水平词汇等级大纲》中所收虚词大约有觯其中,“就”分别是副词、介词、连词,“和”分别是连词和介词,除去这种交叉的情况,那就不足觯绻俪ザ〖缎榇剩O碌木椭挥个左右了。可见,常用得虚词并不多,但我们说的每句话却离不开虚词,说明虚词得使用频率很高。根据朱学使用频率前个词中虚词就有个,其出现总数和分布均匀度如表卜4这个表可以看出,虚词的使用频率很高,如助词“的”高达次,而且分布均匀度也高。侯学超编《现代汉语虚词词典》总结了“的”的罄钟法,可谓全面系统,但是要提炼其中的规则还有一定的难度。正是因为使用的频率高,各种虚词在多年的使用中产生了多种不同的用法,使得虚词通过其它非屈基于规则的现代汉语副词用法自动识别研究
副词的作用如副词“就《现代汉语八百词》总结出了七个大项,二十一个小项,总结得细示程度的副词:很、非常、极、十分、最、顶、太、更、挺、极其、格外、分外、方式的副词:忽然、猛然、公然、特意、亲自、大肆、肆意、悄悄、连忙、赶紧、竟然、究竟、幸而、幸亏、偏偏、明明、恰恰、未免、只好、不妨、索性、简直、折形式来表现,有的虽然用屈折形式,但这种屈折形式并不是的用法特别复杂,致全面,可是不同的词典却有不同的分类和解释,带

基于规则的现代汉语副词用法自动识别研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 61
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 Horange
  • 文件大小 0 KB
  • 时间2014-05-15
最近更新