下载此文档

特征提取.ppt


文档分类:IT计算机 | 页数:约33页 举报非法文档有奖
1/33
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/33 下载此文档
文档列表 文档介绍
语音识别应用
*
语音识别之MFCC特征提取
*
预处理模块:对输入的原始语音信号进行处理
滤除掉不重要的信息及背景噪声
语音分帧(近似认为语音信号在10-30ms内是短时平稳的)
预加重(提升高频部分)等处理
*
语音识别之MFCC特征提取
*
特征提取:
去除语音信号中对于语音识别无用的冗余信息
保留反映语音本质特征的信息
即提取出反映语音信号特征的关键特征参数形成特征矢量 序列,以便用于后续处理
*
语音识别之MFCC特征提取
*
声学模型训练:
根据训练语音库的特征参数训练出声学模型参数
在识别时可以将待识别的语音的特征参数同声学模型进行匹配,得到识别结果。
*
语音识别之MFCC特征提取
*
语言模型训练:
语言模型是用来计算一个句子出现概率的概率模型。
它主要用于决定哪个词序列的可能性更大,或者在出现了几个词的情况下预测下一个即将出现的词语的内容。
*
语音识别之MFCC特征提取
*
语音解码和搜索算法:
针对输入的语音信号,根据己经训练好的HMM声学模型、语言模型及字典建立一个识别网络
根据搜索算法在该网络中寻找最佳的一条路径,这个路径就是能够以最大概率输出该语音信号的词串
*
语音识别之MFCC特征提取
*
语音是怎么产生
人通过改变声道的shape发出的不同声音。声道的shape包括舌头,牙齿等。
我们可以分析不同声道产生的语音短时功率谱的包络识别语音
MFCCs(Mel Frequency Cepstral Coefficents)是一种能准确描述这个包络的特征,在语音识别人工特征方面,可谓是一枝独秀
*
语音识别之MFCC特征提取
*
主要的几个概念
声谱图(Spectrogram)
倒谱分析(Cepstrum Analysis)
Mel频率分析(Mel-Frequency Analysis)
梅尔倒频谱系数(Mel-Frequency Cepstral Coefficients)
*
语音识别之MFCC特征提取
*
一、声谱图(Spectrogram)
FFT FFT FFT
*
语音识别之MFCC特征提取
*
一、声谱图(Spectrogram)
*
语音识别之MFCC特征提取
*

特征提取 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数33
  • 收藏数0 收藏
  • 顶次数0
  • 上传人业精于勤
  • 文件大小8.51 MB
  • 时间2021-01-12