下载此文档

话音编译码器原理 脉冲编码调制(pcm).ppt


文档分类:通信/电子 | 页数:约33页 举报非法文档有奖
1/33
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/33 下载此文档
文档列表 文档介绍
MTI
XIDIAN
话音编码(Speech Coding)
多媒体技术
第三讲
2
主要内容
话音的形成原理
话音编译码器原理
脉冲编码调制(PCM)
增量调制与自适应增量调制
自适应差分脉冲编码调制(ADPCM)
子带编码
其他编码
3
话音的形成原理
肺中的空气受到挤压形成气流,气流通过声门(声带)沿着声道(由咽、喉、口腔等组成)释放出去,就形成了话音。
气流、声门可以等效为一个激励源,声道可以等效为一个时变滤波器(共振峰)。
话音信号具有很强的相关性(长期相关、短期相关)。
4
话音的分类
浊音(voiced sounds):声道打开,声带在先打开后关闭,气流经过使声带要发生张驰振动,变为准周期振动气流。浊音的激励源被等效为准周期的脉冲信号。
清音(unvoiced sounds):声带不振动,而在某处保持收缩,气流在声道里收缩后高速通过产生湍流,再经过主声道(咽、口腔)的调整最终形成清音。清音的激励源被等效为一种白噪声信号。
爆破音(plosive sounds):声道关闭之后产生压缩空气然后突然打开声道所发出的声音。
5
话音产生的数字模型
周期脉冲序列发生器
伪随机噪声产生器
周期
时变数字滤波器
音量控制
声道参数
语音
输出
浊/清选择
6
话音技术的研究热点
话音压缩编码(Speech Coding)
话音识别(Speech Recognition)
文本话音转换(Text To Speech)
7
话音编译码器
A/D
话音
编码
信道
编码
信道
信道
译码
话音
译码
D/A
8
衡量话音编码器的参数
数据输出速率
延迟时间
话音质量
价格(实现代价)
9
语音质量等级划分
广播质量:带宽为7000Hz的高质量话音
长途电话质量:带宽为3400Hz,信噪比为30db,有失真
通信质量:完全可以听懂,但和长途电话质量相比有明显的失真。
合成质量:80%-90%的可懂度,听起来象机器讲话,失去了讲话者的特征
10
话音编译码器的分类
波形编译码器(waveform coder):不利用生成话音的信号的任何知识,将话音视为一种普通的声音,直接对波形信号进行采样和量化。例如PCM、DPCM、ADPCM等。
音源编译码器(Source coder):也叫参数编译码器、声码器(vocoder)。它从话音波形信号中提取话音生成模型的参数,使用这些参数通过话音生成模型重构出话音。
混合编译码器(Hybrid coder):综合使用上述两种技术。使用的激励信号波形尽可能接近于原始话音信号的波形。例如CELP。

话音编译码器原理 脉冲编码调制(pcm) 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数33
  • 收藏数0 收藏
  • 顶次数0
  • 上传人zxwziyou9
  • 文件大小621 KB
  • 时间2018-06-07