下载此文档

数学建模声音识别模型的建立与评价.doc


文档分类:论文 | 页数:约42页 举报非法文档有奖
1/42
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/42 下载此文档
文档列表 文档介绍
声音识别模型的建立与评价
【摘要】
声音识别是研发智能防盗门的重要环节,对正常和非正常开门(指盗窃开门等声音)的声音进行准确地识别变得尤为重要。本文对采集到的正常和非正常声音进行识别模型建立和评价。其主要方法是:利用80次声音数据,结合MATLAB工具及分析计算,建立正常、非正常声音与数据y的均值、方差、短时平均能量均值、短时平均幅度均值、短时平均过零率均值和短时自相关函数均值之间的关系的BP神经网络模型。然后分析模型,确定目标函数t,1表示正常,0表示非正常,即对声音进行识别;又进行误差分析,达到误差要求时将80个数据代入函数,即为对声音模型进行验证与评价。
针对问题一,首先从80次声音数据入手,利用MATLAB的load函数载入到计算机内存,内存中变量有Fs和y等变量,其中Fs为采用频率,y为采用数据。再用sound函数,播放出声音信号,从听觉角度比较正常、非正常声音在响度和音调两方的差异。最后利用plot函数绘制出具体的声音波形图,从视觉角度比较声音的频率与振幅的不同效果。
针对问题二,采用合适的时域分析处理声音信号,找出和提取了最重要的特征向量是短时能量和平均幅度、短时平均过零率、短时自相关函数,并比较了它们在表达声音时的不同优越性和特点,用途。
针对问题三,用MATLAB计算出80个正常、非正常声音数据,y的均值、方差、短时平均能量均值、短时平均幅度均值、短时平均过零率均值和短时自相关函数均值,利用这些均值作为BP神经网络的输入数据p且对p进行转置。确定目标函数t,1表示正常,0表示非正常。进行多次训练达到误差要求,求解和分析模型结果,并对80组样本数据进行检验。最后对BP神经网络模型进行评价、改进及推广。
针对问题四,利用主成分分析(PCA)特征变换对参数进行优化,先在正常和非正常中分别随机选取声音组号,再将以上问题得到的对应特征参数均值进行PCA变换,获得新的特征参数f正和f非能够更具区分性,并用参数优化技术包括语音包络检测、Delta特征的引入,获得更好的声音识别率。
针对问题五,对于原始信号中有叠加一定幅度的白噪声,前期处理时为了达到优良的消噪效果,采用新兴方法小波去噪原理,,运用MATLAB中的小波工具箱对含噪信号进行小波分解、阈值量化、小波重组,获得的去噪结果与原始信号效果比较,验证小波去噪的可靠性。
关键词:BP神经网络时域分析特征向量主成分分析小波去噪原理
1 问题重述
A题:声音识别模型的建立与评价
随着家居智能化逐渐普及,智能冰箱、智能清洁机器人、智能电视等已步入平常老百姓家庭,但智能化的防盗门还处于研发阶段,未进入市场。随着人们对家居安全意识的不断增强,对防盗、防抢和防砸的门禁系统的智能性提出更高的要求。基于此,对正常和非正常开门(指盗窃开门等声音)的声音进行识别是智能防盗门的关键问题和技术,其具有广泛的应用前景和实用价值。
为了进行声音识别模型的建立,我们采集到了正常和非正常开门的声音,附件中有正常开门声音(),非正常开门声音(),各40次开门,共80次开门声音数据。该数据可利用matlab的load函数载入到计算机内存,内存中变量有Fs和y等变量,其中Fs为采用频率,y为采用数据。利用这些数据要求完成以下工作:
利用matlab中的sound函数,播放出声音信号,试听并比较正常和非正常开门声音的差别,利用plot函数绘制出具体的声音波形图,总结差别在哪些方面?
利用合适的时域或(和)频域特征表达个声音信号,建立特征向量,写出提取特征向量的具体方法和程序代码。
建立声音识别模型(二分类模型),利用模型区分正常和非正常声音,评价模型的好坏。
试利用特征选择或变换,对特征向量进行优化,并利用参数优化技术优化模型的参数,使识别模型的准确率提高。
若原始声音信号中有环境噪声(如白噪声),设y中叠加了一定幅值的白噪声(利用y1=y+(-+*rand(size(y)))*max(y)叠加噪声),如何对声音进行前期处理?
2 模型假设
假设80组样本的采用数据真实、有效、可靠;
假设每个样本的采用数据之间相互独立;
假设样本音频的录音环境为同一环境且外界环境对数据无影响;
假设我们在网上查阅的资料以及结论真实可靠。
3 符号说明
表示输入层第j个节点的输入,j=1,…,M
表示隐含层第i个节点到输入层第j个节点之间的权值
表示隐含层第i个节点的阈值
表示隐含层的激励函数
表示输出层第k个节点到隐含层第i个节点之间的权值,i=1,…,q
表示输出层第k个节点的阈值,k=1,…,L
表示输出层的激励函数
表示输出层第k个节点的输出
En
短时平均

数学建模声音识别模型的建立与评价 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数42
  • 收藏数0 收藏
  • 顶次数0
  • 上传人977562398
  • 文件大小1.41 MB
  • 时间2018-01-20