Reconnaissance Automatique De La Parole Avec Intelligence Artificielle
2017
Mémoire de Master
Génie Eléctrique Et Eléctronique

Université Akli Mohand Oulhadj - Bouira

L
Louifi, Massinissa
O
Ouabdesselam, Feriel

Résumé: Le Chapitre 1 est une introduction à la phonétique et présente les systèmes régissant le langage chez l’être humain et le fonctionnement des appareils concernés, introduisant ainsi le système physiologique et le système neurologique et leur anatomie. Le système physiologique se constitue de l’appareil phonatoire qui est le moteur de la production du son des différents phonèmes grâce à l’interaction des trois grands organes (les poumons, le larynx et les cavités bucco-pharyngale) et l’appareil auditif qui a comme organe principal l’oreille est le centre du traitement acoustique et cognitif. Le système neurologique est la partie nerveuse dite le cerveau qui est constitué de neurones assurant ainsi le traitement des différents sons des phonèmes et leur compréhension. Le chapitre 2 présente le traitement automatique de la parole. Ce dernier comportera les différentes caractéristiques du signal de parole, évoquant les étapes de la numérisation et détaillant les méthodes traditionnellement mises en oeuvre pour cette analyse. Ce chapitre sera l’occasion de présenter en profondeur les différentes méthodes du codage LPC et MFCC. Le chapitre 3 comportera une introduction globale sur l’intelligence artificielle, puis précisément sur les réseaux de neurones, leur évolution durant le siècle dernier citant les différents types des réseaux de neurones. On se focalisera sur un perceptron multicouche MLP afin d’utiliser un nouveau modèle pour l’extraction de caractéristiques le Codage Neuro-Prédictif (NPC, Neural Predictive Coding) qui est une extension au domaine non-linéaire du codage LPC. Le chapitre 4 sera consacré à une présentation de la langue Amazighe et précisément les lettres Tifinagh puis à l’étude de la mise en forme d’un signal de parole qui sera injecté dans un réseau de neurones MLP (Multi Layer Perceptron), puis la comparaison entre les résultats obtenus par l’utilisation des deux codages : MFCC (Mel Frequency Cepstral Coding) et NPC (Neuronal Predictive Coding).

Mots-clès:

lpc
mfcc
npc
mlp
traitement automatique de la parole
langue amazigh
intelligence artificielle
Nos services universitaires et académiques

Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).

Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!

Comment ça marche?
Nouveau
Si le fichier est volumineux, l'affichage peut échouer. Vous pouvez obtenir le fichier directement en cliquant sur le bouton "Télécharger".


footer.description

Le Moteur de recherche des thèses, mémoires et rapports soutenus en Algérie

Doctorat - Magister - Master - Ingéniorat - Licence - PFE - Articles - Rapports


©2025 Thèses-Algérie - Tous Droits Réservés
Powered by Abysoft