沈阳工业大学硕士学位论文
论文题目: 基于中文树库的依存句法分析的研究与实现
作者:_______________肖睿 __________
指 导 教 师: 王宏生 副教授 单位: 沈阳工业大学
协助指导教师: 单位:
论文提交日期:2014 年 2 月 24 日
学位授予单位:沈 阳 工 业 大 学
A Master’s Thesis in Computer Software and Theory
RESEARCH AND IMPLEMENTATION ON
DEPENDENCY PARSING BASED ON CHINESE
TREEBANK
By Xiao Rui
Supervisor:Associate Professor Wang Hongsheng
School of Information Science and Engineering
Shenyang University of Technology
February 24, 2014
摘 要
基于树库和机器学****的方法是当前自然语言处理领域中的一个研究热点。在句法
分析研究领域,经过句法标注的树库可以充当句法分析器获得语言知识的资源,同时
也可以当作对句法分析结果进行评判的标准。近几年,对于依存句法分析性能的改进,
研究人员主要从机器学****方法、分类特征和算法上入手,从树库的语言学标注方面也
能对句法分析性能加以改善。
本文将哈尔滨工业大学依存树库作为语料资源,对树库的动词、名词及有关标点
进行修改,从而实现利用语言学手段来提高句法分析性能的目的。论文采用基于决策
式方法的 MaltParser 依存句法分析器进行依存分析实验,采用 Libsvm 对哈工大树库
进行学****训练,训练集所需格式为国际会议 CoNLL 格式。为此,论文首先使用 Java
及 DOM4J 对哈工大树库 XML 格式进行解析,实现了 XML 向 CoNLL 格式的转换。
其次,论文分别根据中科院词性标注体系和《信息处理用现代汉语词类标记规范》对
树库动词词类进行细分,使每类动词担当的句法功能尽可能简单。第三,论文将树库
中的人名、地名等八类名词全部合并为一
基于中文树库的依存句法分析的研究与实现 来自淘豆网www.taodocs.com转载请标明出处.