下载此文档

基于矢量量化的说话人识别系统研究及实现.doc


文档分类:研究报告 | 页数:约60页 举报非法文档有奖
1/60
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/60 下载此文档
文档列表 文档介绍
基于矢量量化的说话人识别系统研究及实现.doc:..�擞�����语言和编译器为工具,搭建了说话人识别软件系统。在系统前端,设置了登录和语音库管理模块,给用户提供了安全、简便的使用环境。在系统的主界面,设置了模式选择模块和说话人识别的各步骤模块,后者包含了之前理论部分的所有方法,体现出的特色是:可选择方案种类多、可自行设置参数值、单个人的识别和多人识别都可进行、操作简单、效果直观。在主界面中,还设置了反馈信息模块、语音的时域、变换域分析等其他功能模块,扩大了系统的使用范围,增加了其灵活性。���������������琤�����������甌�������.������,�������������������琇�,��,��,△�����������������������,��������������������,���矢量量化的原理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.���矢量量化的过程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..���本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.���本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.�基于矢量量化的说话人识别系统研究及实现生物认证技术,也可称为生物识别技术、生物测定学技术、生物特征识别,是一种利用测试者自己的生物特征对其身份进行认证的技术,它也是一种集有效性和经济性于一身的技术乜�K��玫纳�锾卣饕话憔哂幸韵率粜裕浩毡樾�也可称为通用性,即每个人都有的特征�⒐潭ㄐ�也可称为稳定性、恒定性,它不随时间、地点的改变而改变�⒍捞匦�也可称为唯一性,即每个人的该特征都不一样�⒖刹杉��也称为可收集性,即该特征可定量测量�⒁资迪中�要考虑经济成本、人们接受程度等因素�湍哑燮��也可称为难伪造性,即不容说话人识别的实际应用体现在很多领域,其中包括:利用说话人识别,可以对战场情况进行监听,并对指挥员身份进行鉴别。这��说话人识别研究的历史和现状对说话人识别的研究着手于上个世纪三十年代,这个时期主要处于用人耳来验室的克斯特,在仔细研究了语谱图���������之后,发现了声纹���,���⑹庇蛞羲ㄅ浜戏ǖ挠镆粝於������������,����炔问��兴祷叭耸侗餹�。��年,阿尔塔���通过对线性预测系数、自相关系数、声道的冲激响应和面积函数以及倒实际应用方面的产品主要有:��公司研制的应用于��诘闹腔劭��基于矢量量化的说话人识别系统研究及实现��说话人识别概述语音中的个性信息。换句话说,语音识别是要确定“说的什么”,说话人识别是域的综合性学科乜¨。从不同的角度研究说话人识别,可以对其进行不同的分类。一般主要有以下基于矢量量化的说话人识别系统研究及实现��系统测试和实验分析,验证系统的协调性和有效性。基于矢量量化的说话人识别系统研究及实现原始语音信号频谱预加重后的语音信号频谱基于矢量量化的说话人识别系统研究及实现::●常用的窗函数主要有两种,它们分别是矩形窗和海明窗,对应的表达式如下:喇�游℃�海临矩形窗时域波形矩形窗幅频特性信号�丛肷�危��ㄎ奚��相隔离,是说话人识别过程中极其重要的一步。成功的端点检测,排除了噪声的干扰,对计算量的减少、处理时间的缩短和系统识别正确率的提高有着积极的作用。端点检测的基本原理是语音信号与噪声信号的特性不同,将其与设定的阈值相比较就可以加以区分,进而达到提取有用声段的目的。本节将对双门限法、谱减法和谱熵法三种端点检测的方法进行介绍。双门限法利用的两种特性及其对应的公式如下:基于矢量量化的说话人识别系统研究及实现打∑乙���。因此,短时能量对清音段的鉴别效果;过零率��诲圩�咱獭鱨�样点数采用同一段语音并对其加噪,检测后的效果如图��所示。样点数谱减法利用的特性是噪声信号与语音信号的叠加性,它能够去除噪声信号对基于矢量量化的说话人识别系统研究及实现�����,��表示��、��、��的傅立叶变换,则存在:幅度谱为:再做傅立叶反变换,便可得到去除噪声的语音信号。因为对噪声功率谱的估计并不精确,所以此时得到的语音信号也是一个估计的值。利用谱减法,增强了纯净的语音信号,排除了在端点检测过程中噪声信号的干扰。而去除了噪声影响的语音信号幅度与无声段的信号幅度有很大的差别,对此设定一个阈值进行判断,或在此基础上利用改进的双门限法,就可以提取出有用声段。将谱熵定义为:基于矢量量化的说话人识别系统研究及实现数�5住J����也是平均信息量的计算公式,因此在数值上,谱熵等于平号,噪声段的功率谱分布地较稳定,所以其谱熵大,语音段的功率谱分布地较加噪的语音波形�����蓥三�!!!!!!!!!!!!!!���皇�壹匿至王三狫—————————,—————.���!#�#甶。————————�!!!!!!!!!!!!!

基于矢量量化的说话人识别系统研究及实现 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数60
  • 收藏数0 收藏
  • 顶次数0
  • 上传人cjl201702
  • 文件大小9.31 MB
  • 时间2019-05-06