下载此文档

语音识别的研究现状和应用前景.docx


文档分类:研究报告 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
: .

语音识别的研究现状和应用前景
语音识别技术并不是一夜之间冒出来的神话,早在三四十年前,在美国的一些
大学和研究单位,就已经有人开始从事这一方向的研究,并有一些相关论文发表;七
十年代前后,研究的脉络日渐清晰,于是贝尔实验室和国际商用机器公司(ⅠBM)等都
先后建立了专门的研究机构。今天这两家公司在这一领域都已取得了显著的成果,
并且在商业上应用成功,但贝尔实验室主要是偏重于电信方面应用的语音识别系统,
如电话查询等;而IBM则偏重于商务应用,因而在连续语音识别上取得了不小的成
功。
不谈商业方面的应用, 事实上, 很多家公司都提供语音识别的引擎(Engine) ,
并且都表示能支持微软的SAPI。看一看SAPI SUITE就不难发现, 微软在这
方面的研究并不逊于任何一家公司,只是很奇怪它居然没有将成果商业化。微软同
时提供了一系列引擎, 如Speech Recognition(语音识别) 、Command&
Control(发布指令并控制) 、Phone Query(电话语音识别) 、Text to spee
ch(文本语音转换)等。
今天,许多用户已经能享受到语音技术的优势了,可以对计算机发送命令,或者
要求计算机记录下用户所说的话,以及将文本转换成声音朗读出来。尽管如此,距离
真正的人机自由交流的前景似乎还远。目前,计算机还需要对用户作大量训练才能
识别用户的语音。并且,识别率也并不总是尽如人意。换言之,语音识别技术还有一
段路需要走,要做到真正成功的商业化,它还必须在很多方面取得突破性进展,这实
际就是其技术的未来走向。
就算法模型方面而言,需要有进一步的突破。
目前能看出它的一些明显不足,尤其在中文语音识别方面,语言模型还有待完
善,因为语言模型和声学模型正是听写识别的基础,这方面没有突破,语音识别的进
展就只能是一句空话。目前使用的语言模型只是一种概率模型,还没有用到以语言
学为基础的文法模型,而要使计算机确实理解人类的语言,就必须在这一点上取得进

展,这是一个相当艰苦的工作。此外,随着硬件资源的不断发展,一些核心算法如特
征提取、搜索算法或者自适应算法将有可能进一步改进。可以相信,半导体和软件
技术的共同进步将为语音识别技术的基础性工作带来福音。
就自适应方面而言,语音识别技术也有待进一步改进。
目前, 象IBM的ViaVoice和Asia works的SPK都需要用户在使用
前进行几百句话的训练,以让计算机适应你的声音特征。这必然限制了语音识别技
术的进一步应用,大量的训练不仅让用户感到厌烦,而且加大了系统的负担。并且,
不能指望将来的消费电子应用产品也针对单个消费者进行训练。因此,必须在自适
应方面有进一步的提高,做到不受特定人、口音或者方言的影响,这实际上也意味着
对语言模型的进一步改进。现实世界的用户类型是多种多样的,就声音特征来讲有
男音、女音和童音的区别,此外,许多人的发音离标准发音差距甚远,这就涉及到对
口音或方言的处理。如果语音识别能做到自动适应大多数人的声线特征,那可能比

语音识别的研究现状和应用前景 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人48216984
  • 文件大小20 KB
  • 时间2021-07-09