基于VXML技术的语音门户研究.doc基于VXML技术的语音门户研究摘要:语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法,可以提高噪音影响下的语音识别率。关键词:语音门户;VXML;自动语音识别;语音合成中图分类号:TP393文献标识码:A文章编号:1009-3044(2009)34-9779-03 VXML-basedVoicePortalTechnologyResearch JIALin,LIXin-ke (puterandInformation,HefeiUniversityofTechnology,Hefei230009,China) Abstract:workinformation,:VXMLtechnology,binedwithChinesecharacteristicswasstudiedsidedautocorrelationlinearpredictionmethod,thenoisecanimprovethespeechrecognitionrateundertheinfluenceof. Keywords:voiceportal;XML;ASR;TTS 随着信息技术的发展和普及,人们希望通过电话获得更多的信息;基于VXML技术的语音门户(VoicePortal)是由一组互相关联的应用组成,用于帮助电话用户通过语音访问因特网上大量的内容。使用先进的电话系统,语音识别和文本转语音技术,用户能够从任何一个普通电话机上获取基于互联网信息。使用语音门户,不但可以拨打电话,还可以在一次连续的通话过程中获取互联网上的有关内容。这项在语音技术发展基础上产生的新的交流方式,充分显示了语音合成和语音识别的强大功能,,获取信息和进行交易成为可能。 1语音门户关键技术 VXML(VoiceeXtensibleMarkupLanguage)是W3C(WorldWideWebConsortium万维网联盟)定义的可扩展标记语言(XML)的一种扩展,网络的协议标准,定义了一套在设计上与网页编写标准相类似的标记语言,以规范应用程序的语音问题,并根据播放的提示信息、口述命令、要记录和识别的语音或按键音输入,实现人和计算机之间的交互对话,使人们能够通过语音和电话访问网站上的信息和服务。建立在XML数据机制基础之上的VXML语音浏览是语音门户的核心。它可以与数据库、HTML以及其他文档处理系统无缝结合,实现互联网与电话网的融合。标准的VXML的结构模型[1]一般分为三个部分:用户终端、VXML服务器(解释器)、文档服务器,如图1所示。文档服务器(WEBServer):用于存放VXML脚本文件,和事先录制好的音频文件等一切有关的文档。VXMLServer通过HTTP请求从该文档服务器获取各种需要的文件。在处理一个来自终端应用的请求时,这一请求经过了VXML解释组件处理,作为响应,文档服
基于VXML技术的语音门户研究 来自淘豆网www.taodocs.com转载请标明出处.