本科生毕业论文(设计)
中文题目:基于GMM说话人识别系统软件设计
英文题目:Software design of speaker recognition system based on GMM
学生:虢明 班级: 7班 学号: 52070724
学 院:通信工程学院
专 业:信息工程
指导教师:王金芳 职称: 副教授
基于GMM说话人识别系统软件设计
学 生 姓 名:虢明
班 级:7班
学 号:52070724
学 院:通信工程学院
专 业:信息工程系
指 导 教 师:王金芳(副教授)
摘 要
语音是实现人们之间沟通的最直接与方便的手段,而实现人与计算机之间畅通无阻的交流一直是人们努力的目标。随着信息技术的发展,计算机的应用日新月异,随着时代的前进,说话人识别技术也要求用计算机来处理。说话人识别技术是一种从语音数据中提取出能反映说话人生理和心理特征参数,并用这组特征参数来鉴别说话人身份的技术。一段语音数据中包含了太多的信息,而说话人识别的一项目标就是从语音信号中提取出反映说话人特征的参数。本文详细写出了说话人识别技术中应用得比较多的参数——梅尔倒谱特征参数(MFCC)的提取过程。说话人识别分为训练和测试两部分,本文的说话人识别模型采用的是高斯混合模型(GMM)。文章中详细说明了高斯混合模型的训练方法和说话人识别时的模式匹配。本文利用VC++,软件功能有语音文件的读取、语音信号的预处理、提取语音信号中的梅尔倒谱特征参数、高斯混合模型的训练以及说话人测试等。
在现实中,不可避免的语音信号会受到噪声的影响,语音噪声主要有信道中的卷积失真和加性噪声,本文介绍了这两种噪声的处理方法。
梅尔倒谱特征参数利用了听觉原理和倒谱的解相关特性,梅尔倒谱也具有对卷积性信道失真进行补偿的能力,由于这些特征,梅尔倒谱特征被认为是在语音相关识别任务中应用最成功的特征描述之一。高斯混合模型以其灵活、有效和对噪声的鲁棒性得到了人们越来越多的应用。
关键词: 说话人识别 Mel倒谱特征参数 高斯混合模型 Mel滤波器组 软件设计
ABSTRACT
Voice communication between people is to achieve the most direct and convenient means, and between man and computer communication has been a smooth one goal. With the development of information technology, computer applications with each passing day, with the progress of the times, speaker recognition technology is also required to deal with the computer. Speaker recognition technology is a voice data extracted from the reflected physiological and psychological characteristics of the speaker parameters, and parameters used to identify this group speaker identification technology. A voice data contains too much information, and speaker recognition, a goal is to extract from the speech signal characteristics that reflect the parameters of the speaker. This paper written by the application of speaker recognition technology more than the parameters - Mel Cepstrum parameters (MFCC) of the extraction process. Speaker recognition is divided
基于GMM说话人识别系统软件设计 来自淘豆网www.taodocs.com转载请标明出处.