Apprentissage Statistique Pour L’extraction Des Relations À Partir De Textes
2021
Autre
Thèses De Doctorat

Université Ferhat Abbas - Sétif 1

B
Belazzoug, Mouhoub

Résumé: Le modèle de sac de mots est couramment utilisé dans la catégorisation de textes. Le problème principal de ce dernier réside dans le grand nombre d’attributs extraits, cela influe négativement sur les performances des tâches de catégorisation. Pour résoudre ce problème, une méthode de sélection des fonctionnalités est nécessaire. La sélection des fonctionnalités est bénéfique pour réduire la dimensionnalité du problème, elle conduit à minimiser le temps de calcul et à améliorer les performances de la tâche de catégorisation. Dans cette thèse, nous proposons un nouvel algorithme amélioré de l’algorithme original de recherche Sinus Cosinus (SCA) pour la sélection des fonctionnalités, qui permet une meilleure exploration dans l'espace de recherche. Contrairement au SCA qui se concentre uniquement sur la meilleure solution pour générer une nouvelle solution, le nouvel algorithme (ISCA) de notre proposition prend en compte deux positions de la solution : (i) la position de la meilleure solution trouvée jusqu'à présent, et (ii) une position aléatoire appartenant à l'espace de recherche. Cette combinaison nous permet de proposer un algorithme simple capable d'éviter une convergence prématurée et d'obtenir des performances très satisfaisantes. Pour valider le nouvel algorithme ISCA, nous avons effectué une série d'expériences sur neuf collections de ,textes, où nous avons comparé les résultats expérimentaux avec plusieurs algorithmes de recherche, y compris l'algorithme SCA d'origine et certaines de ses versions améliorées, ainsi que l’algorithme d’optimisation Moth Flam (MFO). De plus, de l'état de l'art, les algorithmes génétiques (GA) ainsi que les colonies de fourmis (ACO) sont choisis dans notre étude comparative. Nos résultats d'évaluation démontrent la haute performance de notre algorithme ISCA proposé qui le rend très utile pour les problèmes de catégorisation de textes.

Mots-clès:

catégorisation des textes
Nos services universitaires et académiques

Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).

Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!

Comment ça marche?
Nouveau
Si le fichier est volumineux, l'affichage peut échouer. Vous pouvez obtenir le fichier directement en cliquant sur le bouton "Télécharger".
Logo Université


Documents et articles similaires:


footer.description

Le Moteur de recherche des thèses, mémoires et rapports soutenus en Algérie

Doctorat - Magister - Master - Ingéniorat - Licence - PFE - Articles - Rapports


©2025 Thèses-Algérie - Tous Droits Réservés
Powered by Abysoft