Analyse Et Reconnaissance Automatique Des Documents Numérisés
Résumé: L'analyse et la reconnaissance automatique des documents numérisés est un domaine très vaste. Se caractérisent par divers problèmes pertinents tels que la présence des bruits, la variation des documents, la langue, etc. Actuellement, on utilise les documents numérisés pour accomplir plusieurs tâches d'information, cependant des grands problèmes entourent les documents mal scannés et la mauvaise écriture car cela engendre une perte d'information et une mauvaise expérience de lecture. La question qui se pose c'est comment régler ces problèmes et comment extraire une bonne information ? A l'aide des outils tel que Prima et Tesseract, nous avons suggéré dans ce mémoire une solution aux problèmes déjà cités. Cette méthode se base sur le prétraitement et la préparation des documents numériques, puis sur l'analyse et la segmentation de la structure des documents numériques, et en n une reconnaissance des caractères. Nous avons fait une étude bibliographique sur les di érents phénomènes rencontrés dans le processus d'analyse et de reconnaissance de documents numé- risés. On a utilisé une méthode caractérise par la préservation maximale du texte, une analyse et une segmentation des documents et en n une reconnaissance des documents avec moins de faute. Le résultat nal obtenu par cette méthode est un document utile, lisible et capable d'extraire de bonnes informations. Les résultats obtenus sont très satisfaisantes.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!