基于语音识别中DTW改进算法的研究
胡金平 陈若珠 李战明
(兰州理工大学,电气工程与信息工程学院,甘肃,兰州,)
摘要:动态时间规整(Dynamic Time Warping)是语音识别中的一种经典算法。本文提出了一种改进的端点检测算法,特征提取采用了Mel频率倒谱系数(MFCC),并采用计算量相对较小的改进的动态时间规整(DTW)算法实现语音参数模板匹配,能够实现孤立词、特定人、小词汇量的语音识别,并用MATLAB进行了算法仿真,试验结果表明,改进后的算法,能够有效的提高系统对语音的识别率。
关键词:语音识别;端点检测;Mel倒谱参数;动态时间规整
中国分类号: 文献标识码:A
Discussion of DTW Programming Improved Way On Speech Recognition
Hu Jingping Chen Ruozhu Li Zhanming
Abstract: Dynamic Time Warping is a kind of classical programming in speech adopts the improved endpoint detection algorithm and Mel frequence cepstrum coeffiients(MFCC) to catch speech characteristic parameters and introduces dynamic time wrapping(DTW)arithmetic to realize speech pattern matching.It is proved that this article designs a small vocabulary,isolated word speech recognition system,arithmetic of Speech recognize simulate with MATLAB software,the results show that the modified algorithm can provide a better performance in the speech recognition rate.
Key words: speech recognition system; endpoint detection; MFCC;DTW
0 引言
______________________
作者简介:陈若珠(1963-),女,1984年毕业于西安交通大学,现为兰州理工大学高级工程师,主要研究方向语音识别、嵌入式。
胡金平(1985-),男,江苏徐州人,兰州理工大学研究生,主要从事语音识别、嵌入式研究。
在孤立词语音识别中,最为简单有效的方法是采用动态时间规整(Dynamic Time Warping,DTW)算法,该算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,算法较为简洁,正确率也较高,在语音识别系统
基于语音识别中DTW改进算法的研究 来自淘豆网www.taodocs.com转载请标明出处.