下载此文档

短时能量和过零率.doc


文档分类:金融/股票/期货 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
于短时能量和过零率分析的语音端点检测方法研究刘波,聂明新,向俊涛武汉理工大学信息工程学院,湖北武汉(430070)E-mail:摘要:短时能量分析和过零率分析作为语音信号时域分析中最基本的方法,应用相当广泛,特别是在语音信号端点检测方面。由于在语音信号端点检测方面这两种方法通常是独立使用的,在端点检测的时候很容易漏掉重要的信息。本文将这两种方法结合起来,利用MATLAB工具对其进行了分析。实验结果表明,检测的效果好于分别使用其中一种方法的情况。关键词:端点检测,短时能量过零率门限1引言近年来,在语音信号处理领域,关于语音信号中端点检测及判定的研究越来越重要。作为语音识别的前提工作,有效的端点检测方法不仅可以减少数据的存储量和处理时间,而且可以排除无声段的噪声干扰,使语音识别更为准确。目前的语音信号端点检测算法比较多,有短时能量,短时过零率分析,自相关法等等,其中以短时能量和短时过零率用的最多。大多文献和教材都是把它们分别进行介绍,由于它们各有其优缺点,分别使用作为语音端点检测的手段难免会漏掉很多有用的信息,因此,笔者将这两种方法结合起来进行分析,在判断清浊音及静音方面可以起到互补的作用,从语音信号的短时能量和过零率分析的特点出发,加以门限值来分析将两种方法相结合应用的效果,最后通过Matlab进行了仿真。2语音信号短时能量和过零率的特征语音一般分为无声段,清音段和浊音段。一般把浊音认为是一个以基音周期为周期的斜三角脉冲串,把清音模拟成随机白噪声。由于语音信号是一个非平稳态过程,不能用处理平稳信号的信号处理技术对其进行分析处理。但由于语音信号本身的特点,在10~30ms的短时间范围内,其特性可以看作是一个准稳态过程,即具有短时性。因此采用短时能量和过零率来对语音进行端点检测是可行的。信号的短时能量定义为:设语音波形时域信号为x(l)、加窗分帧处理后得到第n帧语音信号为xn(m),则xn(m)满足下式:xn(m)=w(m)x(n+m)0≤m≤N−1(2-1)⎧1,w(m)=⎨⎩0,m=0~(N−1)m=其他值其中,n=0,1T,2T,L,并且N为帧长,T为帧移长度。设第n帧语音信号xn(m)的短时能量谱用En表示,则其计算公式如下[4][5][6]:-1-En=∑xn(m)(2-2)m=0N−1如图1所示为英文单词“eat”的短时能量。图1英文单词“eat”的短时能量语音和噪声的区别可以体现在他们的能量上,语音段的能量比噪声段的能量大,如果环境噪声和系统输入的噪声比较小,只要计算输入信号的短时能量就能够把语音段和噪声背景区分开,除此之外,用基于能量的算法来检测浊音通常效果也是比较理想的,因为浊音的能量值比清音大得多,可以判断浊音和清音之间过渡的时刻[3],但对清音来说,效果不是很好,因此还需要借助短时过零率来表征。短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。它可以用来区分清音和浊音,这是因为语音信号中的高频段有高的过零率,低频段过零率较低。定义语音信号xn(m)的短时过零率Zn为[4][5][6]:1N−1Zn=∑|sgn[xn(m)]−sgn[xn(m−1)]|(2-3)2m=0式中,sgn[]是符号函数,即:⎧1,(x≥0)sgn[x]=⎨−1,(x<0)⎩如图2所示为英文单词“eat”的短时过零率。-2-2英文单词“eat”的短时

短时能量和过零率 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人q1188830
  • 文件大小431 KB
  • 时间2019-11-15