下载此文档

2021年度语音识别和语义识别讲义.ppt


文档分类:高等教育 | 页数:约34页 举报非法文档有奖
1/34
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/34 下载此文档
文档列表 文档介绍
CONTENTS
1
语音识别
2
语义识别
*
语音识别和语义识别
*
语音识别
PART 1
*
语音识别和语义识别
*
定义
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。
本质上是一种模式识别的过程,未知语音的模式与已知语音的参考模式逐一进行比较,最佳匹配的参考模式被作为识别结果。
*
语音识别和语义识别
*
基本原理
系统中包括预处理、特征提取、参考模型、模式匹配和后处理五大部分。
*
语音识别和语义识别
*

对输入的原始语音信号进行处理
(1)模/数转换
(2)滤除掉其中的不重要的信息以及背景噪声
(3)进行语音信号的端点检测(找出语音信号的始末,双门限比较法 就是根据语音信号的特征参数(能量和过零率)进行清音、噪音判
别,从而完成端点检测的)
(4)语音分帧(近似认为在10-30ms内是语音信号是短时平稳的,将语音信号分割为一段一段进行分析,加窗函数)
(5)预加重(提升高频部分使语音信号的频谱变得比较平坦,便于进行频谱分析或者声
道参数分析)
*
语音识别和语义识别
*

特征提取就是从语音信号中提取出语音的特征序列,提取的语音特征应该能完全、准确地表达语音信号,特征提取的目的是提取语音信号中能代表语音特征的信息,减少语音识别时所要处理的数据量。
基于声道模型和听觉机理的线性预测倒谱系数LPCC(Linear Predietive Cepstral CoefieientS)和美尔频率倒谱系数MFCC(Mel Frequeney Cepstral cocfioionts)参数
*
语音识别和语义识别
*

基于LPC的倒谱参数(LPCC)分析法的典型代表是,以基于Durbin或Levinson迭代算法求解“维纳——霍夫方程”获得的LPC预测系数为基础,进而得到的LPC的倒谱参数(LPCC)。
MFCC的计算首先用FFT将时域信号转化成频域,之后对其对数能量谱用依照Mel刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换DCT,取前N个系数。
*
语音识别和语义识别
*

基于现代处理技术的小波变换系数分析法是将语音信号与一个在时域和频域均具有良好局部化性质的小波函数族进行积分(小波变换),从而把信号分解成一组位于不同频率和时段内的分量,即选择小波函数为某类平滑函数的一阶导数,则经小波变换后的局部最大值反映信号的尖锐变化(即声门闭着点),而局部最小值则反映信号的缓慢变化,从而获得反映基音周期的小波语音特征参数。
*
语音识别和语义识别
*

语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。在进行语音识别的时候,将输入的待识别语音信号与模式进行匹配,便可得到识别结果。
*
语音识别和语义识别
*
模式识别
语音识别过程依据模式匹配原则,传统的语音识别系统是一个按一定测度算法实现被识别特征参数与模式库中的模板进行最优模式匹配的过程。
目前语音识别比较常用的识别方法主要有:
模板匹配法,以动态时间规整(DynamiC Time Warping,DTw)为代表;
随机模型法,以隐马尔可夫模型(Hidden Markov Model,HMM)为代表;
基于人工神经网络(ArtifiCial Neural NetworkS,ANN)的识别方法
*
语音识别和语义识别
*

2021年度语音识别和语义识别讲义 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数34
  • 收藏数0 收藏
  • 顶次数0
  • 上传人读书百遍
  • 文件大小938 KB
  • 时间2021-01-05