下载此文档

和矢量量化的说话人识别算法应用研究.pdf


文档分类:IT计算机 | 页数:约60页 举报非法文档有奖
1/60
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/60 下载此文档
文档列表 文档介绍
湖南大学硕士学位论文和矢量量化的说话人识别算法研究姓名:尹许梅申请学位级别:硕士专业:信息与通信工程指导教师:何选森 20110507 和矢量量化的说话人识别算泫研究摘要说话人识别技术是根据语音波形中反映说话人生理特征差异和行为****惯差异的语音参数能够自动鉴别说话人是谁的一项技术,其广泛的应用前景正受到越来越多人的重视。本文主要是基于美尔频率倒谱系数(Mel Frequency Cepstral Coefficients,)和矢量量化的与文本无关说话人识别技术的研究,采用矢量量化和自适应蚁群算法混合的方法,参数利用改进窗函数的Bark子波的美尔频率倒谱系数。首先,特征提取的预处理阶段对窗函数进行改进,用改进的Lanczos 窗代替汉明窗,在确定主瓣的宽度基本一致的情况下,使旁瓣能更好的得到抑制, 并引入与人耳听觉系统更为适应的Bark子波变换,,分析尺度的伸缩则按照“临界带(Critical Band)"的中心频率来变化,特征提取过程中,能提高语音在噪声环境下的鲁棒性。然后,对矢量量化模式识别方法进行改进,针对LBG算法极易陷入局部最优解的可能性和依赖初始码本的选择问题,利用蚁群算法的分布式并行机制,将蚁群算法与LBG算法进行混合交替,在提高其全局搜索能力的同时,通过LBG算法加快收敛速度。为了防止蚁群算法也陷入局部最优解的可能,采取了确定性选择和随机性选择相结合的选择策略,在搜索过程中动态调整状态转移概率的方法, 从一定程度上防止了所得的结果是局部最优解。最后,一种基于标准差描述的加权欧式距离测度用于匹配判决。通过实验可以验证,改进后的特征提取算法以及混合蚁群算法的矢量量化识别方法,与传统的基准算法相比较,识别率和鲁棒性均得到提高,且随着训练语音长度的增加,识别效果更好。因此在实际应用中,需要根据具体的环境进行调整。关键词:;Bark子波变换;蚁群算法;矢量量化;说话人识别 Abstract Speaker recognition as one of thebiometrics techniques is torecognize speaker’s identity automatically from itsvoice waveforms which contains difkrences of physiological and behavioral characteristics specific to each recognition has caught many people’S attention foritswide application thesis focuses on the research oftext—independent speaker recognition technology based on MEL frequency cepstral coefficients()and vector quantization(VQ). bines VQ with adaptive ant colony algorithm and uses improved as itsparameters. First,we improve the window function by adding the new Lanczos window function extraction preprocessing instead of theHamming the width of lobe isalmost thesame,we adopt afunction thatmore sidelobe suppression. We also introduce Bark wavelet transform(BWT)for more suitable tohuman ear's auditory system,the base function of BWT obeys the optimal uncertainty but the scale function varies according tothe critical can improve thespeech’s robustness innoisy environment feature extraction process. Then,improve the pattern method of speaker recognition base on vector quantiz

和矢量量化的说话人识别算法应用研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数60
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2982835315
  • 文件大小0 KB
  • 时间2016-03-18