下载此文档

神经网络在语音识别上的应用.doc


文档分类:IT计算机 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
1HarbinHarbinInstituteInstituteofofTechnologTechnologyy神经网络与智能信号处理实验报告神经网络实验报告1、实验名称:神经网络在语音识别上的应用2、实验目的:进一步了解神经网络在语音识别上的应用,了解神经网络的基本原理,学****神经网络的算法,还可以进一步分析不同的隐节点数以及训练步数对误差性能的影响。3、实验要求:1、设计一个标准的BP学****算法网络来对语音信号26个字母进行识别。2、在训练时采用不同的隐含层神经元个数,分析其对网络性能、语音识别系统的识别率的影响。3、用所创建的BP神经网络进行26个字母的语音识别,观察并记录结果,并分析其误差。4、实验步骤:1、语音识别的基本原理2语音识别的总体流程如下:语音输入时要先经过预处理,包括预加重、分帧加窗等。然后进行特征提取,参数。语音特征参数的时间序列构成语音的模式,将其与获得的参考模式逐一比较,获得最佳匹配的参考模式便是识别结果。由于语音信号的复杂性,所以在一开始在语音信号输入语音识别系统时需要进行预处理,预处理包括预加重,分帧加窗,端点检测等。预加重的目的是为了加强语音的高频部分,以便在特征提取阶段进行频谱分析。分帧加窗的目的是为了使帧与帧之间平滑过渡,保持连续性以及保持语音信号的短时平稳性,降低由于不连续而产生的Gibbs效应。端点检测的目的就是从语音信号序列中截取实际有效的语音信号。特征提取阶段,是从语音数据中提取能反映语音信号特征和变化规律的参数,以唯一表征语音,这儿选用的语音信号特征参数为MEL频率倒谱系数,。MEL频率倒谱的实现过程如下图所示:(1)对语音信号进行预处理,加窗、分帧将其变为短时信号。(2)将短时时域信号转变为频域信号,并计算其短时能量,离散傅立叶变换。将时域信号后补若干0形成长为N的序列,再经过离散傅立叶变换得到线性频谱,变换公式:0n,kN-1(3)在频标内三角带通滤波器个加于坐标得到滤波器组,转化关系为3(4)求对数能量。为了使计算结果对噪声和谱估计噪声有更好的鲁棒性,一般将上述经过Mel频谱取对数能量。则由线性频谱得到对数频谱的总的传递函数为:(5)离散余弦变换(DCT)将上述的对数频谱经过离散余弦变换到倒谱域,系数2、BP神经网络的建立BP神经网络是一种多层前馈神经网络,采用的算法是误差反传法,误差反传法特点就是使输入输出层连接权值进行调整,而且隐含层连接权值可根据误差与上层输出进行修改,即有了学****能力。在BP神经网络中存在前向传播信息流和误差反传信息流。前向传播信息流就是输入信号从输入层进入到隐含层,再从输出层输出。它的输出是整个神经网络的计算结果。网络会计算最后输出与期望间的误差。如果误差超过一定的范围,就沿着神经网络反传,进行误差反传。误差反传就是误差从输出层经隐含层到输入层的过程。误差衡量的是输出信息与期望信息的距离。在误差反传的过程中,连接权值根据误差值等一些参数来进行调整,使得调整后的BP网络的实际输出更接近于理想输出。本实验中的BP神经网络设计为3层,即其隐含层只有一层。参数组成。这些特征参数构成一个矩阵,矩阵的每一列代表一个单独的语音,矩阵的行数为每个输入的维数,矩阵的列数为语音样本数。要识别所有的字母,BP神经网络的输出层采用5维的来识别26个英文字母。00000~11010分别对应字母A~Z。但实

神经网络在语音识别上的应用 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人ffy51856fy
  • 文件大小0 KB
  • 时间2016-02-27