下载此文档

单片机原理及实用技术 第6章语音处理技术及应用[精].ppt


文档分类:IT计算机 | 页数:约168页 举报非法文档有奖
1/168
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/168 下载此文档
文档列表 文档介绍
第6章语音处理技术及应用
概述
凌阳音频技术简介
常用应用程序接口
语音压缩方法
键控放音程序
语音识别技术
概述
音频信号
我们所说的音频是指频率在20 Hz~20 kHz的声音信号,分为波形声音信号、语音信号和音乐信号三种。其中波形声音就是自然界中的声音,是声音数字化的基础。语音也可以表示为波形声音,但波形声音表示不出语言语音学的内涵,语音是对讲话声音的一种抽象,是语言的载体,是人类社会特有的一种信息交流系统,是社会交际工具的符号。音乐与语音相比更规范一些,是符号化了的声音。但音乐不能对所有的声音进行符号化,乐谱是符号化声音的符号组,表示比单个符号更复杂的声音信息。
音频信号的抽样和量化
要将音频模拟信号进行数字化处理,就必须将模拟信号转换为数字信号。模拟信号数字化有多种方法,目前采用最多的是信号波形的A/D变换法(波形编码)。它直接将时域信号波形变换为数字序列,接收恢复的信号质量高。此外,还有参量编码(后面介绍)等。常用的波形编码方法有脉冲编码调制(PCM调制)和增量调制(DM)。数字音频信号的质量取决于采样频率和量化位数这两个重要参数。此外,声道的数目、相应的音频设备质量也会影响音频质量。
音频格式
音频文件通常分为两类:声音文件和MIDI文件。声音文件指的是通过声音录入设备录制的原始声音信号,直接记录了真实声音的二进制数据,通常文件较大。MIDI文件是一种音乐演奏指令序列,相当于乐谱。可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件较小。
1. 声音文件格式
1) WAVE文件(*.wav)
WAVE文件使用三个参数来表示声音,分别是采样位数、采样频率和声道数。在计算机中采样位数一般为8位和16位两种,而采样频率有11 025 Hz(11 kHz)、22 050 Hz(22 kHz)和44 100 Hz(44 kHz)三种。一般WAVE文件的波特率可达到88~704 kb/s。
WAVE格式是Microsoft公司开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范。它用于保存Windows 平台的音频信息资源,Windows平台及其应用程序均支持WAVE格式。
WAVE格式支持多种压缩算法,支持多声道、多种音频位数和采样频率,是PC机上最流行的声音文件格式。但其文件较大,多用于存储简短的声音片段。
4) MPEG文件(.mp1/.mp2/.mp3)
MPEG 是运动图像专家组(Moving Picture Experts Group)的英文缩写,MPEG音频层(MPEG Audio Layer)代表MPEG标准中的音频部分。
MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer1/2/3),分别对应MP1、MP2和MP3这三种声音文件。
MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和6:1~8:1,MP3 的压缩率则高达10:1~12:1,就是说若一分钟CD音质的音乐未经压缩需要10 MB存储空间,而经过MP3压缩编码后只需1 MB左右的存储空间,其音质基本保持不失真。因此,目前使用最多的是MP3文件格式。
5) RealAudio文件(.ra/.rm/.ram)
RealAudio文件是RealNerworks公司开发的一种新型流式音频Streaming Audio文件格式。它包含在RealMedia中,主要用于在低速的广域网上实时传输音频信息。
网络传输速率不同,客户端所获得的声音质量也不尽相同, kb/s的速率可以达到广播级的声音质量,如果拥有ISDN或更快的线路连接,则可获得CD音质的声音。
2. MIDI文件(.mid/.rmi)
MIDI是乐器数字接口(Musical Instrument Digital Interface) 的英文缩写,是数字音乐、电子合成乐器的国际标准。它定义了计算机音乐程序合成器及其它电子设备交换音乐信号的方式,还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间的数据传输协议。用于为不同乐器创建数字声音信号,可以模拟大提琴、小提琴、钢琴等常见乐器。
在MIDI文件中,只包含产生某种声音的指令,这些指令包括使用什么MIDI设备的音色、声音的强弱、声音持续时间等,计算机将这些指令发送给声卡,声卡按照指令将声音合成,MIDI在重放时可以有不同的效果。
相对于保存真实采样数据的声音文件,MIDI文件显得更加紧凑,其文件大小比声音文件小得多。

单片机原理及实用技术 第6章语音处理技术及应用[精] 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数168
  • 收藏数0 收藏
  • 顶次数0
  • 上传人yzhlya
  • 文件大小1.32 MB
  • 时间2018-01-17