下载此文档

基于中文树库的依存句法分析的研究与实现.pdf


文档分类:IT计算机 | 页数:约63页 举报非法文档有奖
1/63
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/63 下载此文档
文档列表 文档介绍
沈阳工业大学硕士学位论文


论文题目: 基于中文树库的依存句法分析的研究与实现

作者:_______________肖睿 __________









指 导 教 师: 王宏生 副教授 单位: 沈阳工业大学
协助指导教师: 单位:
论文提交日期:2014 年 2 月 24 日
学位授予单位:沈 阳 工 业 大 学
A Master’s Thesis in Computer Software and Theory




RESEARCH AND IMPLEMENTATION ON
DEPENDENCY PARSING BASED ON CHINESE
TREEBANK




By Xiao Rui
Supervisor:Associate Professor Wang Hongsheng






School of Information Science and Engineering
Shenyang University of Technology
February 24, 2014
摘 要
基于树库和机器学****的方法是当前自然语言处理领域中的一个研究热点。在句法
分析研究领域,经过句法标注的树库可以充当句法分析器获得语言知识的资源,同时
也可以当作对句法分析结果进行评判的标准。近几年,对于依存句法分析性能的改进,
研究人员主要从机器学****方法、分类特征和算法上入手,从树库的语言学标注方面也
能对句法分析性能加以改善。
本文将哈尔滨工业大学依存树库作为语料资源,对树库的动词、名词及有关标点
进行修改,从而实现利用语言学手段来提高句法分析性能的目的。论文采用基于决策
式方法的 MaltParser 依存句法分析器进行依存分析实验,采用 Libsvm 对哈工大树库
进行学****训练,训练集所需格式为国际会议 CoNLL 格式。为此,论文首先使用 Java
及 DOM4J 对哈工大树库 XML 格式进行解析,实现了 XML 向 CoNLL 格式的转换。
其次,论文分别根据中科院词性标注体系和《信息处理用现代汉语词类标记规范》对
树库动词词类进行细分,使每类动词担当的句法功能尽可能简单。第三,论文将树库
中的人名、地名等八类名词全部合并为一

基于中文树库的依存句法分析的研究与实现 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数63
  • 收藏数0 收藏
  • 顶次数0
  • 上传人陈潇睡不醒
  • 文件大小1.58 MB
  • 时间2021-10-28