汉语依存句法分析关键技术研究.pdf


文档分类:高等教育 | 页数:约137页 举报非法文档有奖
1/137
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/137
文档列表 文档介绍
博博博士士士学学学位位位论论论文文文
汉语依存句法分析关键技术研究
RESEARCH ON KEY TECHNOLOGIES
OF CHINESE DEPENDENCY PARSING
李李李正正正华华华
哈哈哈尔尔尔滨滨滨工工工业业业大大大学学学
2013年年年3月月月
国内图书分类号: 学校代码:10213
国际图书分类号: 密级:公开
工工工学学学博博博士士士学学学位位位论论论文文文
汉语依存句法分析关键技术研究
博 士 研 究 生:李 正 华
导 师:刘 挺 教 授
申 请 学 位:工学博士
学 科:计算机应用技术
所 在 单 位:计算机科学与技术学院
答 辩 日 期:2013年3月
授予学位单位:哈尔滨工业大学
Classified Index:
:
Dissertation for the Doctoral Degree in Engineering
RESEARCH ON KEY TECHNOLOGIES
OF CHINESE DEPENDENCY PARSING
Candidate: Zhenghua Li
Supervisor: Professor Ting Liu
Academic Degree Applied for: Doctor of Engineering
Specialty: Computer Application Technology
Affiliation: School of Computer Science and Technology
Date of Defence: March, 2013
Degree-Conferring-Institution: Harbin Institute of Technology
摘 要
摘 要
依存句法分析的目标是分析输入句子的句法结构,将词语序列转化为树状
的依存结构。一条依存弧两个词语构成搭配关系,依存弧上的标签表示搭配的
具体类型,如主语、宾语、状语等。在不同语法体系中,依存语法以其形式简
洁、易于标注、便于应用等优点,逐渐受到研究人员的重视。计算自然语言学注面向多语言的依存句法分析,大大推动了依存句法分析的发展。依存句法分
析也越来越广泛的应用于机器翻译、问答系统、文本挖掘、信息检索等。
依存句法分析的研究工作旨在提高依存分析的准确率和效率。高准确率的
分析结果可以为上层应用提供更可信的句法结构。随着互联网数据的迅速膨
胀,上层应用系统需要迅速处理海量的信息,因此效率对于依存句法分析的应
用也很关键。本文的研究内容涵盖这两个问题,包括以下四个方面。
1. 提出了基于柱搜索和标点切分的快速高阶依存句法分析方法。针对前人
提出的面向高阶依存句法分析模型的动态规划解码算法时间复杂度高的问题,
本文提出使用柱搜索的近似解码算法,一方面允许模型可以方便的融入丰富的
高阶句法子树特征,另一方面保证较低的时间复杂度,我们实现的基于柱搜索
的高阶依存句法分析系统在CoNLL 2009年多语依存句法分析和语义角色标注
联合评测任务上取得了优异的成绩。进而,我们针对汉语的特点,提出一种利
用标点符号进行长句切分的二阶段依存句法分析方法,进一步提高依存句法分
析模型处理长句时的效率。实验证明,这种方法可以大幅度提高依存句法分析
的速度,长句子的句法分析准确率也有提高。
2. 提出了汉语词性标注和依存句法分析联合模型。由于缺少词语的形态变
化信息

汉语依存句法分析关键技术研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数137
  • 收藏数0 收藏
  • 顶次数0
  • 上传人陈潇睡不醒
  • 文件大小5.47 MB
  • 时间2021-10-22