下载此文档

说话人功能性副语音自动检测算法.doc


文档分类:IT计算机 | 页数:约13页 举报非法文档有奖
1/13
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/13 下载此文档
文档列表 文档介绍
说话人功能性副语音自动检测算法
  摘 要:功能性副语音如笑声、哭声、叹息声等的研究在情感识别领域中越来越受到关注,开始被作为识别说话人情感重要的信息之一。然在应用与研究中功能性副语音能否被自动检出是前提。针对这一需求,根据音频分割算法提出了基于定长分段的功能性副语音自动检测算法以及基于距离与贝叶斯的功能性副语音自动检测算法。并提出了结合静音帧语音分割点确认算法对分割点进一步确认,并通过实验验证了该算法是有效的。通过实验对比两种检测算法的优劣,实验结果表明:基于定长分段自动检测算法较好,检测率达到70%,较基于距离与贝叶斯的检测算法高出5%。
  关键词:功能性副语音;定长分段;自动检测;检测率
  中图分类号:TP391 文献标识码: A 文章编号:2095-2163(2015)01-
  Abstract: The functional paralanguages ??such as laughter, cries, and sighs get more and more attention in the field of emotion recognition. It is to be one of the important information as to identify the speaker emotion. While, automatic detection of functional paralanguage is the premise in the application and research. In response to this demand, according to the segmentation algorithm for audio, automatic detection of functional paralanguages algorithm based on fixed-length segments and algorithm based on distance and Bayesian are proposed. And a segment point confirmation combining with silence frame is proposed, and experiments are conducted to verify t
he algorithm. Through the experimental comparison of the two detection algorithms, the experimental results show that: the automatic detection algorithm based on fixed-length segments is better, and the detection rate is 70%, which is higher than detection algorithm based on distance and Bayesian by 5%.
  Key words: Functional Paralanguage; Fixed-length Segment; Automatic Detection; Detection Rate
  0引 言
  功能性副语音如哭声、笑声、叹息声等的研究越来越受到各个领域学者的重视,并逐渐被引入到模式识别领域中。在文献[1]中提到副语音携带更重要的情感信息,并且其受说话者的变化影响较少,文献[2]中提出其比语音更具有可靠性。目前,功能性副语音的研究主要集中在特征提取、识别等方向上,而却鲜有文章对功能性副语音的自动检测做出系统的研究。事实上,在实际应用中,功能性副语音的自动检测尤为重要,其检测结果更是功能性副语音应用和研究的基础,针对这一实际需求,本文提出一种较为通用的检测算法。
  功能性副语音与语音之间存在明显的差异,可将其视为与语音截然不同的音频类别,故可引入音频分割算法实现功能性副语音的自动检测过程。在文献[3]中就将音频分割算法分为基于距离的算法、基于模型选择的算法和基于模型的算法三类。具体地,第一,基于距离的算法采用滑动窗得到一条距离曲线,曲线上大于某一阈值的局部最大点被确认为分割点。该算法实现简单,缺点是阈值很难确定,阈值过大则会漏检掉正确的分割点,阈值过小则会增加虚假分割点;第二,基于模型选择的算法,最常用的是Chen等[4]提出的基于贝叶斯信息准则(Bayesian information criterion, BIC)算法,由于具有良好的统计学理论基础,而取得了较好的效

说话人功能性副语音自动检测算法 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数13
  • 收藏数0 收藏
  • 顶次数0
  • 上传人学习好资料
  • 文件大小36 KB
  • 时间2021-07-30