SCXML : State Chart XML

Le Voice XML

Introduction

Le Voice XML est un langage basé sur le XML qui permet de spécifier les interactions vocales entre un humain et un ordinateur. Ce langage est certifié par le W3C et est actuellement en version 2.1.

Ce langage a été créé dans le but de standardiser les différentes communications possibles entre un serveur vocal et l'utilisateur. En effet, il existe depuis des décennies différents systèmes propriétaires de serveur vocal. Malheureusement, le fait que ces systèmes soient propriétaires ne permettaient pas de changer de solution facilement. Le W3C a donc décidé de mettre en place un langage facile à utliser, indépendant du système utilisé, et regroupant de nombreuses fonctionnalités.

Principe

Principe du Voice XML

Lors de l'utilisation d'un web-browser, on envoie une requête à un serveur web qui nous transmet une page au format HTML qui sera interprêtée par notre navigateur. Pour l'utilisation du Voice XML, c'est la même chose.

Comme on peut le voir sur le schéma ci-dessus, l'utilisateur contacte un serveur téléphonique. Ce serveur téléphonique est un serveur vocal qui délivre des informations à l'utilisateur soit à travers des fichiers audio, soit à l'aide d'un synthétiseur vocal. Lorsque l'utilisateur voudra communiquer avec le serveur vocal (à l'aide des touches du clavier téléphonique ou par la voix), le serveur vocal interprêtera la demande, transmettra la requête associée au serveur web qui lui renverra la réponse associée à cette requête. On peut donc constater que le Voice XML est un langage de navigation.

Inconvénients

Néanmoins, le Voice XML contient certaines limitations qui ne suffisent pas à gérer un standard téléphonique vocal. Parmi ces dernières, on peut noter :