下载此文档

系统语音识别的研究现状与应用前景.doc


文档分类:研究报告 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
语音识别的研究现状和应用前景
语音识别技术并不是一夜之间冒出来的神话,早在三四十年前,在美国的一些大学和研究单位,就已经有人开始从事这一方向的研究,并有一些相关论文发表;七十年代前后,研究的脉络日渐清晰,于是贝尔实验室和国际商用机器公司(IBM)等都先后建立了专门的研究机构。今天这两家公司在这一领域都已取得了显著的成果,并且在商业上应用成功,但贝尔实验室主要是偏重于电信方面应用的语音识别系统,如电话查询等;而IBM则偏重于商务应用,因而在连续语音识别上取得了不小的成功。
不谈商业方面的应用, 事实上, 很多家公司都提供语音识别的引擎, 并且都表示能支持微软的SAPI。看一看 SUITE 就不难发现, 微软在这方面的研究并不逊于任何一家公司, 只是很奇怪它居然没有将成果商业化。微软同时提供了一系列引擎, 如 Speech Recognition ( 语音识别)、Command & Control ( 发布指令并控制)、Phone Query ( 电话语音识别)、Text to speech( 文本语音转换) 等。
今天, 许多用户已经能享受到语音技术的优势了, 可以对计算机发送命令, 或者要求计算机记录下用户所说的话, 以及将文本转换成声音朗读出来。尽管如此, 距离真正的人机自由交流的前景似乎还远。目前, 计算机还需要对用户作大量训练才能识别用户的语音。并且, 识别率也并不总是尽如人意。换言之, 语音识别技术还有一段路需要走, 要做到真正成功的商业化, 它还必须在很多方面取得突破性进展, 这实际就是其技术的未来走向。
算法模型方面, 需要有进一步的突破。
目前能看出它的一些明显不足, 尤其在中文语音识别方面, 语言模型还有待完善, 因为语言模型和声学模型正是听写识别的基础, 这方面没有突破, 语音识别的进展就只能是一句空话。目前使用的语言模型只是一种概率模型, 还没有用到以语言学为基础的文法模型, 而要使计算机确实理解人类的语言, 就必须在这一点上取得进展, 这是一个相当艰苦的工作。此外, 随着硬件资源的不断发展, 一些核心算法如特征提取、搜索算法或者自适应算法将有可能进一步改进。可以相信, 半导体和软件技术的共同进步将为语音识别技术的基础性工作带来福音。
自适应方面, 语音识别技术也有待进一步改进。
目前, 像 IBM 的 ViaVoice 和 Asiaworks 的 SPK 都需要用户在使用前进行几百句话的训练, 以让计算机适应你的声音特征。这必然限制了语音识别技术的进一步应用, 大量的训练不仅让用户感到厌烦, 而且加大了系统的负担。并且, 不能指望将来的消费电子应用产品也针对单个消费者进行训练。因此, 必须在自适应方面有进一步的提高, 做到不受特定人、口音或者方言的影响, 这实际上也意味着对语言模型的进一步改进。现实世界的用户类型是多种多样的, 就声音特征来讲有男音、女音和童音的区别, 此外, 许多人的发音离标准发音差距甚远, 这就涉及到对口音或方言的处理。如果语音识别能做到自动适应大多数人的声线特征, 那可能比提高一二个百分点识别率更重要。事实上,ViaVoice 的应用前景也因为这一点打了折扣, 只有普通话说得很好的用户才可以在其中文版连续语音识别方面取得相对满意的成绩。
强健性方面, 语音识别技术需要

系统语音识别的研究现状与应用前景 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人beny00011
  • 文件大小0 KB
  • 时间2015-10-26