Retour à la page précédente

Développement d’un module de reconnaissance vocale permettant de mettre en lien des plateformes ou applications de vidéoconférences avec un service de retranscription.

ktunes

ASR – Ktunes est un module de reconnaissance vocale (ASR – Automatic Speech Recognition) destinés à mettre en lien des plateformes ou applications de vidéoconférences avec un service de retranscription. Sa particularité de pouvoir distinguer les différents interlocuteurs au sein d’une video.

Plus particulièrement, ASR – Ktunes stocke des fichiers vidéos puis les transmet vers un système de retranscription automatique du son en texte. L’utilisateur pourra ensuite corriger le texte retranscrit afin d’améliorer le système de reconnaissance vocale. C’est spécifiquement sur cette partie que l’IIG intervient pour fournir une interface efficace pour la modification des transcriptions.

L’institut se charge de concevoir et développer l’application permettant aux utilisateurs de se connecter à une plateforme de visioconférence, de sélectionner les fichiers qu’ils souhaitent transmettre et de récupérer ensuite les transcriptions texte afin de les consulter et éventuellement de les corriger. Enfin, le système développé permet de transmettre les résultats sur des plateformes telles que youtube.