以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 XML在语音技术中的应用 』   (http://bbs.xml.org.cn/list.asp?boardid=47)
----  [转贴]VoiceXML打造语音通途  (http://bbs.xml.org.cn/dispbbs.asp?boardid=47&rootid=&id=20984)


--  作者:Coral
--  发布时间:8/9/2005 8:56:00 AM

--  [转贴]VoiceXML打造语音通途

 2004-04-05 网络世界第11期

目前,有许多种交互式的语音应用可以让用户听到计算机的响应,并通过电话按键做出回应。然而,呼叫者通常都会被那些冗长、耗时的一连串语音菜单和按键提示搞得晕头转向。而且,呼叫者在按键转换时很可能漏掉重要信息。因此,用户真正需要的是IVR式的用户界面,使用户不仅能够听取计算机的响应,也能够利用语音做出回应。

VoiceXML 2.0是一种标记语言,用于建立话音界面,相当于带语音功能的HTML。其语音浏览器相当于Web浏览器,可以解释VoiceXML 2.0脚本并向用户呈现语音信息,同时还能接受用户的语音请求。  

按此在新窗口浏览图片
WWW协会已经将VoiceXML 2.0批准为完整的建议,也就是相当于一项Web标准。该标准添加了语音识别语法格式,即用户在响应系统提示时所说的单词和短语。而在前一版本的标准中,并不支持这一功能。

由于电话(包括许多移动电话在内)不具备成为语音浏览器主机的计算能力,因此语音浏览器驻留在网络中的一台语音服务器上。语音服务器既可以位于企业的数据中心内,也可以由远程的主机供应商来提供。

用户可以拨号至一台语音服务器,而语音服务器则从一台应用服务器下载VoiceXML 2.0脚本、语法格式和音频文件。语音浏览器可以解释VoiceXML 2.0脚本并向用户呈现一条语音信息。如系统提问:“欢迎致电,您需要联系销售部门、会计部门还是维修部门?”语音信息既可以是预先录制好的,也可以是通过文本-语音合成器生成的语音。语音浏览器还会调用一台自动语音识别器(ASR),后者使用语法格式来识别用户的回答。

自动语音识别器会尝试对用户的口头响应进行识别。在这个例子中,语法格式只包括三个词:“销售”、“会计”和“维修”。这种通过语法实现的ASR具有很高的识别率和性能,要比口授式的ASR精确得多,因为后者会试图识别英语或用户所说的其他语言中的每一个单词。有时,用户可能会使用双音调制频率来通话,这种方式在嘈杂环境中或用户希望秘密回应时效果非常好。

语音浏览器会继续处理VoiceXML 2.0脚本,也可能进行其他对话,调用针对应用的功能或访问数据库中的信息。利用VoiceXML 2.0,开发人员可以创建基于语音的应用,并且可以指定高级别的菜单和表格,而不仅仅是简单的流程编号。这种方法还可以减轻编程人员的工作负担。

开发人员使用VoiceXML 2.0可以为许多类型的应用和信息提供电话用户界面,这些应用和信息包括时间敏感数据、商业数据和个人信息。这些应用使用户无论身处何地都能够访问其所需的企业数据,而且访问的过程非常简单,只需电话拨号和身份认证就可以得到所需信息。客户还可以使用这些系统来访问一些诸如订单状态和目录、交货和财户信息等数据。



W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
23.438ms