下载此文档

现代汉语语法信息词典的开发与应用.docx


文档分类:办公文档 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
现代汉语语法信息词典的开发与应用.docx现代汉语语法信息词典的开发与应用・朱学锋俞士汶王惠【摘要】现代汉语语法信息词典是为计算机实现汉语句子的自动分析与自动生成开发的一部机器词典,它以数据库文件形式收录了5万多条现代汉语的词语,不仅给出了每个词语所属的词类,而且详细描述了它们的各种语法属性。本文介绍这部语法词典的开发历程、内容概耍和设计思想,并且举例说明在口然语言处理系统中如何应用这部语法词典。关键词:现代汉语、语法信息词典、机器词典、putationalLinguistics,PekingUniversityBeijing100871,:2501892AbstractTheContemporaryChineseGrammaticalKnowledgeBaseisamachinedietionary,,000Chinesewordsandidiomsintheknowledgebaserepresentedbydatabasefiles・Theknowledgebasenotonlygivespartofspeechforeachwordoridiom,butalsodescribestheirvariousgrammaticalattributes・Thepaperintroducesthedesign,thedevelopmentandtheoutlineoftheknowledgebaseandshowsitsapplicationsinnaturallanguageprocessingsystemswithexamples・Keywods:contemporaryChinese,grammaticalknowledgebase,machinedictionary,naturallanguageprocessing现代汉语语法信息词典的开发历程十年前,中文输入技术的主流还是汉字编码,以词为单位进行输入也只是汉字输入的陪衬。北大计算语言学研究所在1986年提出了一个语法规则制导的以语句为单位的中文输入方案,并在一年多的时间内实现了。参考文献[1]深入浅出地介绍了这个方案的原理与实现技本项研究得到屮国八五攻关项U打国家H然科学肚金的支持术。这个方法中就包含了一部电子词典,除了词条及每个词的检索特征(拼音、起笔、末笔等)外,还包括词类及细分的子类。这部词典成为现代汉语语法信息词典的某础。作为中国七五攻关项H“自然语言理解与人机接口”中的一个子专题,俞士汶于1987年提出了开发“现代汉语词语语法信息库”的计划[2],把研究重点放在词语语法属性的描述上。恰逢此时冲国著名语言学家朱徳熙先生承担了全国社会科学规划领导小组卜-达的“现代汉语词类研究”的攻关项1=1。从此,北人计算语言学研究所与中文系的研究者们在朱徳熙先生的率领下开始了联介攻关,并结成了稳定的合作关系。1990年,“现代汉语词语语法信息库”取得了阶段性成果,通过技术鉴定。在讨论八五攻关项目时,以中国工程院院士、中国中文信息学会理事长陈力为教授为代衣的中国一批口然语言处理技术专家敏锐地觉察到,为了中文信息处理技术的发展,特别是语言信息处理技术的发展,有必

现代汉语语法信息词典的开发与应用 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人ttteee8
  • 文件大小48 KB
  • 时间2019-07-21