分类号密级
U D C 编号 10736
硕士学位论文
基于句法特征的汉语韵律边界预测
的研究
研究生姓名:朱玲
指导教师姓名、职称:杨鸿武教授
专业名称:电路与系统
研究方向:语音信号处理
二〇一三年六月
Research on Predicting Chinese prosodic
boundary based on syntactic features
Zhu Ling
西北师范大学研究生学位论文作者信息
论文题目基于句法分析的汉语韵律边界预测的研究
姓名朱玲学号 2010210876
专业名称电路与系统答辩日期
联系电话 ********** E_mail 251060158@
通信地址(邮编):
备注:
西北师范大学硕士学位论文
摘要
随着科学与技术的发展,高自然度的语音合成成了人工智能、语音信号处理以及
人机交互领域一个重要的研究课题。现阶段的语音合成技术研究重点是实现汉语文语
转换系统(CTTS),将输入的文本按语音处理规则自动地转换为声学信号输出。为了更
准确预测出输入文本的韵律边界信息,提高输出语音的自然度,本文建立了文本语料
库,统计分析了语法特征、句法特征和韵律结构的关系,对比分析了词性、词长和邻
接度等各个参数对韵律边界预测的影响,最终利用 TBL 算法来实现对汉语韵律边界的
预测。论文的研究结果对于揭示文本与语音之间的关系、提高合成语音的自然度具有
重要的理论意义和应用价值。论文的主要研究成果和创新如下:
。本文利用面向 web
基于 XML 的中文信息处理平台——语言技术平台 LTP,对句子进行句法结构拆分;
语料信息标注结果均通过了专家的抽样检查,达到了科研要求,可用于韵律边界的预
测。该语料库包含约 10000 句标准语法的汉语文本语料,平均句长为 52 字。
、句法特征和韵律结构的关系,提出了一个用于汉语韵律
边界预测的新特征——邻接度。对文本信息的统计分析表明:文本语料中语法词在该
句子中的句法层级和韵律结构有很大的相关性。本文提出用邻接度(Adjacent Degree,
AD)这一概念来描述文本语料中语法词在该句子中的句法层级,并将它作为新的韵律
结构的预测参数,反映句法结构和韵律结构的关系。因此,标注汉语语料时追加了邻
接度这一反映句法特征的信息。
、词长和邻接度等特征作为韵律预测的参数,并对比分析了词性、
词长和邻接度等特征对韵律边界预测的影响。本文对汉语语料库的文本信息进行了统
计分析,根据分析结果选用了词性、词长和邻接度等特征作为韵律边界预测的重要参
数。
——TBL 算法。TBL 算法是
一种基于转换的错误驱动学习算法,它能在人工规则模板不适用时自动地从实例中学
习新规则,并将新规则添加到已有的规则模板中。实验结果表明,该方法在测试集上
韵律词的预测精度达到了 %,韵律短语的预测精度达到了 %,均优于现有的
同类研究结果。
关键词:韵律边界;语法结构;句法结构;韵律词;韵律短语;邻接度;TBL 算
法;自然语言处理技术平台 LTP
I
基于句法特征的汉语韵律边界预测的研究
Abstract
With the rapid development of the science and technology, high level naturalness of
speech synthesis has e an important research topic in the artificial intelligence ,
speech signal processing, and puter interaction field. At present, the researchers
put the research of speech synthesis technology focuses on Chinese text-to-speech
conversion system (CTTS), and the input text by voice processing rules automatically
converted into
基于句法特征的汉语韵律边界预测的研究 来自淘豆网www.taodocs.com转载请标明出处.