Reconnaissance Optique De Caractères Par Réseau De Neurones Artificiels : Application Aux Scripts De La Langue Arabe
Résumé: La reconnaissance optique de caractères (ROC), optical character recognition (OCR) en anglais, désigne les procédés informatiques pour la traduction d’images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l’exécution de cette tache un logiciel d’OCR. Celui-ci permet de récupérer le texte dans l’image d’un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique. La reconnaissance optique de caractères arabe est domaine moins développé et une tâche complexe à développer car cette famille des caractères est cursive, de nature à droite, et que les caractères changent de formes lorsqu’ils sont placés au début, au milieu ou à la fin d’un mot. L’objectif de ce projet est, de développer un système de ROC arabes capable d’effectuer les taches : l’image des alphabets en arabe est d’abord prise en entrée, puis des étapes de prétraitement telles que la conversion en image à échelle de gris puis en image binaire, une suppression du bruit est effectuée. Ensuite, chaque caractère de l’image d’entrée est segmenté. Ensuite, après la segmentation, la reconnaissance des caractères est effectuée à l’aide d’un réseau de neurones.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!