INTÉGRATION D’UN MODULE DE RECONNAISSANCE DE LA PAROLE AU NIVEAU D’UN SYSTÈME AUDIOVISUEL - APPLICATION TÉLÉVISEUR

Thesis Type:

Doctorat en sciences

Abstract:

Cette thèse propose de concevoir et réaliser un système de reconnaissance automatique de la parole destiné à commander à distance un système audiovisuel à savoir : un Téléviseur. Le système global "bout en bout" se scinde en deux blocs : le premier cherche à extraire les meilleures caractéristiques à partir du signal vocal d’entrée. A cet effet, plusieurs techniques d’extraction de caractéristiques vont être examinées et testées. Concernant le deuxième bloc, nous mettons en évidence une multitude de techniques relevant du domaine de l’apprentissage profond, dont l’impact est d’adapter et de d’affirmer les caractéristiques extraites pour donner en final la classe de l’énoncé. La validation des différentes méthodologies présentées dans cette thèse a été effectuée sur la base de deux jeux de données réelles, le premier est tenu compte pour une évaluation initiale, tandis que le second est conçu exclusivement pour le système ASR proposé dans cette thèse. Les résultats obtenus ont certifié l’efficience des approches proposées. Le défi pour les travaux futurs est d’évaluer ce type de système dans des conditions plus réalistes avec des signaux vocaux issus des milieux bruités.

Publisher's Version

See also: Equipe 2