在2004年,微软发行了 Microsoft Speech Server,还有一个免费的SDK允许你开发基于Web的运行于Speech Server上的语音程序。可以使用SDK来构建电话或只发声的应用程序-其中的计算机对用户的交互是使用电话来实现的。同时你还可以构建多模态应用程序,其中由用户选择使用语音还是传统型Web控件作为输入。
该多模态应用程序使用一提示控件来指定将被播放给用户的音频。该提示控件包含InlineContent属性——它可以包含一个或者是Content型或者是Value型的基本Speech控件。该Content控件指定一特定的包含存储的音频记录的提示文件。该Value控件指定一个HTML Web页面中的元素。该示例应用程序使用一Value控件——它参考一个名为txtText的输入元素(在图2中的"Type some text here:"域)。下面是描述了用于一个提示的标注的HTML: