Thèses Doctorats

De nos jours, la plupart des moteurs d’analyse de solutions anti-malware sont heuristiques. Ils classent les objets, les flux de données ainsi que les zones mémoires comme bénins ou malveillants en fonction de leur comportement. La plupart des fabricants d'antivirus reconnaissent que l'approche heuristique permet d'atteindre jusqu'à 90% d'efficacité en termes de taux de détection, mais consomme davantage de ressources systèmes : de tels moteurs anti-malware, disponibles en open-source, sont extrêmement inefficaces en termes d’utilisation de ressources système car ils font souvent appel à des algorithmes d'apprentissage automatique. Pour réduire cette charge système, il est fortement recommandé d'utiliser la détection par signature statique, qui permet de filtrer à elle seule la majorité des échantillons de programmes malveillants connus, en conjonction avec les technologies de détection heuristiques et celles basées sur le cloud. Dans ce travail, nous présentons un scanner de signatures rapide pour la détection de programmes malveillants, basé sur une version améliorée de l’algorithme Aho-Corasick pour la recherche de chaînes de caractères (ou motifs), conçue pour pouvoir bénéficier des techniques de vectorisation qui ajoutent une forme de parallélisme de données au code de l’algorithme. La solution proposée est implémentée en utilisant le jeu d’instructions d’Intel® Advanced Vector Extensions (AVX2).

Cette thèse propose de concevoir et réaliser un système de reconnaissance automatique de la parole destiné à commander à distance un système audiovisuel à savoir : un Téléviseur. Le système global "bout en bout" se scinde en deux blocs : le premier cherche à extraire les meilleures caractéristiques à partir du signal vocal d’entrée. A cet effet, plusieurs techniques d’extraction de caractéristiques vont être examinées et testées. Concernant le deuxième bloc, nous mettons en évidence une multitude de techniques relevant du domaine de l’apprentissage profond, dont l’impact est d’adapter et de d’affirmer les caractéristiques extraites pour donner en final la classe de l’énoncé. La validation des différentes méthodologies présentées dans cette thèse a été effectuée sur la base de deux jeux de données réelles, le premier est tenu compte pour une évaluation initiale, tandis que le second est conçu exclusivement pour le système ASR proposé dans cette thèse. Les résultats obtenus ont certifié l’efficience des approches proposées. Le défi pour les travaux futurs est d’évaluer ce type de système dans des conditions plus réalistes avec des signaux vocaux issus des milieux bruités.

  •  
  • 1 of 7
  • »