下载此文档

心理声学模型及其在感知音频编码中的应用.pdf


文档分类:通信/电子 | 页数:约79页 举报非法文档有奖
1/79
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/79 下载此文档
文档列表 文档介绍
上海交通大学
硕士学位论文
心理声学模型及其在感知音频编码中的应用
姓名:岳玲
申请学位级别:硕士
专业:信号与信息处理
指导教师:陈健
20040101
上海交通大学硕士学位论文 摘要
心理声学模型及其在感知音频编码中的应用
摘 要
随着对网络多媒体需求的增长 如何在低码率情况下提高音频编
码的质量日益受到人们关注 许多常用的编码器都采用了感知音频编
码方法 它不同于传统的编码算法 除了消除信号的时间 空间和编
码冗余外 还利用人耳的听觉特性去除感知冗余 在降低码率的同时
保证重建音频的感知质量 本文以 AAC 编码器为基础 研究其心理
声学模型的算法及应用 并结合听觉特性的新发现对它作改进
分析目前常用的心理声学模型后不难看出 它们对人耳听觉特性
的应用还是非常保守的 而要提高低码率情况下音频编码的质量 势
必需要改进模型使它更接近人耳听觉本身的特性 本文从超额掩蔽
前后向时域掩蔽 FFT 加窗系数分析和窗切换判据等几个方面对 AAC
心理声学模型进行了探讨
研究表明 多个掩蔽音同时存在时的综合掩蔽能量并不是各单独
掩蔽能量的线性相加 而是存在一个超额掩蔽 虽然可用各掩蔽量非
线性相加来近似 但是它运算量大而不利于实时实现 实验中我们按
照弦度将各阈值分区分为纯音和噪音分量 对能量相似的相邻噪音或
纯音信号 提高对应的信掩比来模拟它们共同作用的超额掩蔽效应
除了频域掩蔽外 信号的时域掩蔽也不容忽视 尤其是后向掩蔽
由于它持续时间长 掩蔽量大而备受关注 AAC 心理声学模型中对
时域掩蔽的考虑却非常有限 为此 我们通过将上帧信号的频域掩蔽
I
上海交通大学硕士学位论文 摘要
量指数衰减后与当前帧频域掩蔽能量线性加权得到后向掩蔽量 并取
其较大值为最终的掩蔽量 实验表明 在保证编码质量的情况下大多
数音频信号都能有效提高模型输出的掩蔽能量
AAC 编码器利用 TNS 技术和自动窗切换方法抑制预回声 由于
短块编码方式频域分辨率低且编码附加比特较多 因而通常要避免不
必要的窗切换 研究表明 AAC 采用的 PE 值窗切换判据经常会发生
误判或漏判的现象 尤其是对于高纯音度信号 为此 我们对 AAC
的窗切换判据进行改进 将信号的时频域特性及瞬态编码特性结合
通过分析信号相邻帧高频能量的变化值 时域上幅度最大变化率及峰
值位置检测 最终决定窗切换与否 实验结果表明 它在保证编码音
频质量的情况下 能有效减少短块编码次数 降低编码误差
AAC 分析的频谱在心理声学模型中由加汉宁窗的 FFT 变换得到
而在分析滤波器组中则由加正弦窗或 KBD 窗的 MDCT 变换得到 我
们将 FFT 的

心理声学模型及其在感知音频编码中的应用 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数79
  • 收藏数0 收藏
  • 顶次数0
  • 上传人allap
  • 文件大小2.50 MB
  • 时间2021-08-02