下载此文档

时频结合的带噪语音端点检测方法.doc


文档分类:通信/电子 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
时频结合的带噪语音端点检测方法摘要:提出了一种时频结合的带噪语音端点检测方法。选取时域短时能量和频域熵构成一个新的特征,采用自适应门限进行端点检测。实验结果表明该方法在低信噪比环境下较传统方法提高了端点检测的准确率,鲁棒性较好。本文采集自网络,本站发布的论文均是优质论文,供学****和研究使用,文中立场与本网站无关,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息,如果需要分享,请保留本段说明。关键词:端点检测短时能量频域熵中图分类号:TN912文献标识码:A文章编号:1672-3791(2011)04(a)-0000-00 语音信号检测(VAD)的目的是区分语音和背景噪声,在自动语音识别系统中(ASR)尤为重要,正确的端点检测能提高语音识别的速度和正确率。端点检测方法有很多,大体可分为两类。一类是门限法[1],这种方法是对每一帧语音信号选取一种特征参数,采用一种判决准则来调整门限,从而检测语音帧和非语音帧,达到端点检测的目的。另一类是模式匹配法[2],估计出语音和噪声信号的模型参数,其检测过程类似于识别过程。与模式匹配法相比,门限法更为简单,快捷。门限法中,比较经典的有RabinerLR[3]提出的用短时能量和短时过零率作为参数,利用短时能量来检测浊音,短时过零率来检测清音,两者配合实现端点检测。但是,大量实验表明,在低信噪比时,这两个特征很容易受到干扰,且不稳定,鲁棒性较差。为了寻找鲁棒性更好的特征参数,ShenJL[4]首次提出基于熵的语音端点检测方法。Shen的实验表明,语音的熵与噪声的熵存在很大的区别。谱熵法在机械类非平稳噪声下(volvo)和低信噪比下其效果比能量检测更为有效。本文把时域短时能量和频域熵结合起来对带噪语音信号进行分析,提取短时能量和频域熵的乘积(能量熵)作为新的特征参数,并采用自适应门限进行带噪语音端点检测。实验结果表明,此方法在低信噪比下能准确检测到语音端点,鲁棒性较好。端点检测方法 ,使信号的频谱平坦化,保持在低频到高频的整个频带中能用同样的信噪比求频谱,以便于频谱分析和声道参数分析。带噪语音信号经一阶FIR数字滤波器,以滤除50Hz的电源工频干扰,然后进行分帧、加窗处理,得到语音信号序列。 :(1) 其中为第i帧短时能量,N为一帧的采样点数。 ,来源于统计热力学,是紊乱程度的测度,在信息论中表示信源的不确定性。先对每一帧信号进行快速傅立叶变换,得到,从而完成由时域到频域的转变。概率密度函数:i=1,2,…M(2) 其中,是频率的能量谱,M为FFT变换所取的点数,表示相应的概率。由于语音信号的大部分能量集中在250Hz-3400Hz之间,为增强语音和非语音在概率密度函数上的区别,对引入以下约束条件: 研究表明,谱熵反映了谱的集中程度,谱熵越小,谱越集中,谱熵越大,谱在整个频率成分上分布得越均匀,则信号越复杂,不确定程度也就越大。又因为语音信号叠加了噪声之后的能量总是大于噪声的能量,语音信号的能量轮廓包络线是表征采样信号中出现语音的最显著的特征。因此完全可以用谱熵和能量的乘积作为特征来判断语音起止点。最后,新的特征参数()定义为: (4) 其中,为前10帧噪声信号的能量均值,为前10帧加噪信号熵的均值。

时频结合的带噪语音端点检测方法 来自淘豆网www.taodocs.com转载请标明出处.