Retour à la page précédente

Développer une interface multimodale de communication Homme-Machine afin d'augmenter la pertinence de l'information dans des environnements à risque et hostiles

L’accès à l’information se diversifie de plus en plus, tant par ses supports (ordinateurs, PDA, téléphone mobile, pocket PC…) que par ses formes de communication (périphériques hardware – clavier, souris, stylet – audio, vidéo). L’accès classique le plus répandu se fait par interface écran et périphériques hardware.

Dans certaines situations extrêmes cette configuration n’est pas utilisable. Ainsi dans les cas d’urgence la communication de l’information doit être extrêmement rapide et fiable. D'autre part, même avec la facilité d'utilisation des supports mobiles, il n’est pas toujours possible de libérer les mains pour transmettre et/ou recevoir l’information. Les technologies de reconnaissance et de synthèse vocales sont alors de précieux atouts. Des outils et des technologies existent et émergent (Ex. VoiceXML [Voice], SALT [Salt]).

Cependant un paramètre important peut venir entraver l’utilisation de ces techniques : l’environnement. Dans des milieux dits "hostiles" certains facteurs sonores sont perturbants : le vent, les bruits de circulations, etc. La reconnaissance vocale en temps réel proche de 100% dans les schémas classiques n'est pas encore possible et ne le sera peut-être jamais là où déjà la communication vocale humain-humain est en soi difficile.

Prenons pour exemples les environnements à risque suivants: intervention de la police sur autoroute/route, interventions pompiers, appels d'urgence couverts par les bruits de la ville, manifestations, skieurs en compétition, navigateurs (bruits de vent, vagues…).

Ici des approches moins conventionnelles d'interaction vocale doivent être envisagées, mais partant de l'hypothèse que les utilisateurs sont hautement motivés et sont d'accord d'apprendre et d'utiliser des techniques plus simples d'interaction avec l'IHM (ex. mot-clés, chiffres, etc.).

Le problème est donc de déterminer et d'intégrer des messages de communication voix/son acceptable pouvant être facilement reconnus dans un contexte donné. Le contexte est défini par la connaissance de l'utilisateur, de l'environnement et de commandes prédéfinies possibles.

Le but de ce projet est de développer une interface multimodale de communication Homme-Machine afin d'augmenter la pertinence de l'information dans des environnements à risque et hostiles.

L'application offrira :

  • Une reconnaissance personnalisée de la voix
  • Un système d'envoi de commande/information vocale
  • Une interface multimodale de communication

Les travaux et compétences Ra&D mis en œuvre dans ce projet sont :

  • L'étude des nouvelles technologies de reconnaissance / synthèse vocale (VoiceXML, SALT, architecture de serveur vocal) dans le cadre particulier d'un environnement bruyant et imprévisible
  • Le développement de prototypes fonctionnels selon ces technologies - La multi-modalité
  • L'ergonomie des interfaces dans un but de simplification et d'efficacité ainsi que de robustesse du système d'information.