Reconnaissance Automatique De La Parole Avec Intelligence Artificielle
Résumé: Le Chapitre 1 est une introduction à la phonétique et présente les systèmes régissant le langage chez l’être humain et le fonctionnement des appareils concernés, introduisant ainsi le système physiologique et le système neurologique et leur anatomie. Le système physiologique se constitue de l’appareil phonatoire qui est le moteur de la production du son des différents phonèmes grâce à l’interaction des trois grands organes (les poumons, le larynx et les cavités bucco-pharyngale) et l’appareil auditif qui a comme organe principal l’oreille est le centre du traitement acoustique et cognitif. Le système neurologique est la partie nerveuse dite le cerveau qui est constitué de neurones assurant ainsi le traitement des différents sons des phonèmes et leur compréhension. Le chapitre 2 présente le traitement automatique de la parole. Ce dernier comportera les différentes caractéristiques du signal de parole, évoquant les étapes de la numérisation et détaillant les méthodes traditionnellement mises en oeuvre pour cette analyse. Ce chapitre sera l’occasion de présenter en profondeur les différentes méthodes du codage LPC et MFCC. Le chapitre 3 comportera une introduction globale sur l’intelligence artificielle, puis précisément sur les réseaux de neurones, leur évolution durant le siècle dernier citant les différents types des réseaux de neurones. On se focalisera sur un perceptron multicouche MLP afin d’utiliser un nouveau modèle pour l’extraction de caractéristiques le Codage Neuro-Prédictif (NPC, Neural Predictive Coding) qui est une extension au domaine non-linéaire du codage LPC. Le chapitre 4 sera consacré à une présentation de la langue Amazighe et précisément les lettres Tifinagh puis à l’étude de la mise en forme d’un signal de parole qui sera injecté dans un réseau de neurones MLP (Multi Layer Perceptron), puis la comparaison entre les résultats obtenus par l’utilisation des deux codages : MFCC (Mel Frequency Cepstral Coding) et NPC (Neuronal Predictive Coding).
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!