下载此文档

连续隐马尔可夫模型和神经网络在说话人识别中的比较.pdf


文档分类:论文 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
万方数据
网络在说话人识别中的比较+.癳.引言ContiIluoddenModelsdArtiialRecogIIi6说话人识别是一种自动识别说话人的过程,在信息高速公路、多媒体技术、办公室自动化、现代通信及智能系统等新兴领域应用广泛。说话人识别辨认,根据二段语音确定说话人是否已经注册,并判断其身份;说话人确认,则根据说话人的语音确定该说话人是否与其所声称的身份一致。对说话人识别的研究始于世纪年代。早期的工作主要集中在人耳听辨试验和探讨听音识别的可能的研究重点转向语音中说话人个性特征的分离提取、个性特征的增强、对各种反映说话人特征的声学参数的线性或非线性处理以及新的说话人识别(HMM)(ANN)语音信号的统计特点,即整体的随机性和局部的稳够很好反映说话人个性特征的特征参数,对多个说话人进行与文本有关的语音录制,建立基于周茉刘蓉陈琦CompativeweUknorecognitionpDdes系统按最终完成的任务可以分为两个范畴:说话人性方面,随着研究手段和工具的改进,说话人识别1的声学建模方法,前者在物理上很好地描述了人类定性;后者通过自动调整网络结构参数,对于给定的输入产生期望的输出,使得语音码本和语音模型一体化,处理速度快和容错能力强。本文选取了能虯两种模型的说话人辨认系统,分别在理想和白噪声两种环境下比较两种方法的识别效率。34(2006)9计算机与数字工程(4300r79)(CHMM)(ANN)这两种模型的说话人识别系统,提取感知谐波倒谱系数作为与文本有关的说话人识别的特征参数,并分别在理想和噪声环境下仿真比较。实验结果表明蚦P驮诶硐牖肪诚缕骄侗鹇驶疽恢拢谠肷肪诚翧模型鲁棒性明显优于模型,识别率较高。关键词连续隐马尔可夫模型人工神经网络说话人识别感知谐波倒谱系数01414ElectronicdInfoationEnneeringCCNUmodel(CHMM)danificialnehrk(ANN)arecoition缂鹡ennesCHMMcleenvimnmentmo:隧·收到本文时间:年月日礶【Selectedlhedependentc10sed.featuresTwo琣砒reoyerthetmnillgCHMMANNSRPHCC01414
万方数据
黧罴鬯峨厩****封H伶考模垂【、说话人辨认系统的概述3镆裟J皆げ馄魈卣魇涑鱿£用来^()=(1s))说话人识别的特征参数提取r)z1)1j2^(t)建立和应用一个说话人识别系统可分为两个统的每一个使用者说出若干训练语料,系统根据这些训练语料,通过训练学****建立每个使用者的模板或模型参数参考集;在识别阶段中,把从待识别说话人说出的语音信号中提取的特征参数,与在训练过程中得到的参考参量集或模型模板加以比较,并J原始语言信不重要的信噪声等,然后提取出反的关键特征参数,以降低维数并便于后续处理。对说话人辨认来说,所提取的参数要与训练过程中的每一人的参考模型加以比较,并把与它最近的那个参考模型所对应的使用者辨认为是发出输入语音的说话人。说话人识别的模型有很多种,比如动态时间规整,它是把时间规整和距离测度计算结合起来的一种非线性规整技术,可以有效地对特征参数序列重新进行时间的对准;矢量量化技术,它是将若干个标量数据组成一个矢量在多维空间给予整体量化,但是这两种方法计算量太大。为了减少识别过程中消耗

连续隐马尔可夫模型和神经网络在说话人识别中的比较 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人yinjiong623147
  • 文件大小385 KB
  • 时间2021-02-23