下载此文档

基于支持向量机的短语音说话人识别.pdf


文档分类:IT计算机 | 页数:约69页 举报非法文档有奖
1/69
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/69 下载此文档
文档列表 文档介绍
基于支持向量机的短语音说话人识别
摘 要
说话人识别是一种根据语音信号对说话人进行辨认或确认的生物识别技术,
具有便捷性、经济性、安全性等方面的优势,广泛应用于司法、军事、安全等领
域。目前,在安静的实验室环境下和语音数据充足的条件下,说话人识别技术已
经达到令人满意的效果。但是在实际应用中,当说话人的语音数据较少时,系统
的性能显著下降。实际应用环境无法预测,导致测试语音与训练语音的不匹配,
更增加了说话人识别的难度。针对上述问题,本文对短语音说话人识别算法及其
噪声鲁棒性进行深入研究。
本文从识别模型出发,对短语音说话人识别算法进行了研究。在支持向量机
(Support Vector Machine, SVM)的基础上,结合高斯混合模型(Gaussian Mixture
Model, GMM),提出基于一类 SVM-GMM 的短语音说话人识别算法,提高了短
语音数据条件下系统的识别性能;引入多核映射,提出基于多核 SVM-GMM 的
短语音说话人识别算法。在噪声鲁棒性方面的研究,本文运用基于循环维纳滤波
器的扩展谱减法和基于非语音段概率(Speech Absence Probability,SAP)软门限
的语音端点检测算法,对输入语音信号进行语音增强和端点检测,提高输入语音
信号的质量,进一步提高噪声环境下的短语音说话人识别系统的性能。
本文的主要工作包括:
提出基于一类 SVM 的短语音说话人识别算法,并将 GMM 模型与一类 SVM
模型相结合提出一类 SVM-GMM 说话人识别算法,有效减少了说话人识别的训
练和识别时间,提高了系统的实用性。
引入多核映射,提出基于多核 SVM-GMM 的说话人识别算法,采用 KL 核
函数和常用核函数的线性组合实现多核映射,将说话人的特征映射到由多个特征
空间构成的组合特征空间中,使说话人的特征得到更好地表达,进一步提高短语
音说话人识别系统的性能。
考虑实际应用中,噪声对说话人识别系统性能的影响,在语音信号预处理过
程中,采用基于循环维纳滤波器的扩展谱减法进行语音增强,实现噪声抑制,提
I
高语音信号的信噪比;采用基于 SAP 软门限的语音端点检测算法对噪声环境下
的语音进行端点检测,结合多核 SVM-GMM 模型,进一步提高噪声环境下的短
语音说话人识别系统的性能。

关键词:短语音,说话人识别,支持向量机,多核映射,扩展谱相减
II
Speaker Recognition under Short Utterance Based on
Support Vector Machine
Abstract
Speaker recognition technology is a biometric method that uses speech signal to
recognize different speakers. Due to its special merits in terms of flexibility,
economy , accuracy and safety , speaker recognition technology owns abroad
application future in identity verification. At present, speaker recognition system
performs well under quiet laboratory environment and with sufficient voice. However,
the performance of system will rapidly decrease when there are fewer of the speaker's
voice data

基于支持向量机的短语音说话人识别 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数69
  • 收藏数0 收藏
  • 顶次数0
  • 上传人iris028
  • 文件大小977 KB
  • 时间2021-12-06