下载此文档

利用深度学习进行可变长度语音片段的情感识别.pdf


文档分类:论文 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
◆教育理论◆ SANWENBAIJIA
利用深度学****进行可变长度语音片段的情感识别
魏金太 王 振
河南林业职业学院
摘  要:通过将深度神经网络应用于频谱图,提出一种用于可变长度语音段的情感识别方法。从频谱图中提取这些信息,
并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传统的将句子分割成更小的固定长
度段的方法相比,该方法可以解决语音分割过程中引入的准确性降低问题。
关键词:变长语音片段;深度学****频谱图;神经网络;情感识别
情感识别在许多应用中起着重要的作用,特别是在当 Bhargava 和 Rose 使用叠加的瓶颈深度神经网络(DNNs)对
今日益普遍的人机交互系统中。作为人类之间的主要传播媒 窗口化语音波形进行训练,并且在相同体系结构上获得的结
体之一,语音已经引起了研究者的广泛关注。言语包含丰富 果只比相应的 MFCC 略差。直接使用梅尔谱声谱图进行说话
的情绪信息,如何从语音信号中提取这些信息对于自动语音 人识别也被证明是成功的。此外,基于线性间隔频谱图描述
情感识别具有重要意义。作为语音情感识别的重要组成部 了最近公布的现有技术的鲁棒语音识别系统。
分,提取最相关的声学特征引起了很多研究兴趣。这些研究 在语音情感识别领域,已经进行了一些使用深度神经
大部分都致力于设计一些手势特征,这些特征对于情感识别 网络进行特征学****的研究。最近,乔治等人提出了一个卷积
来说是最有特色的。 循环神经网络,对原始信号进行操作,从语音数据中执行端
最近,机器学****社区的一个趋势是直接从原始未处理 到端的自发情绪预测任务。Satt 等人还将 CNN 和 LSTM 相结
数据中推导出输入信号的表示。这个想法背后的原因是网络 合,对线性间隔频谱图中的情绪进行分类,超过了通用基准
可以自动学****原始输入信号的中间表示,它更适合手头的任 数据集

利用深度学习进行可变长度语音片段的情感识别 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人学习的一点
  • 文件大小1.99 MB
  • 时间2021-12-03