Évaluation De L'utilisation Des Relations Léxico-sémantiques Dans La Catégorisation De Textes.
Résumé: La catégorisation automatique de textes (CT) est une tâche clé en traitement automatique du langage naturel (TALN) qui consiste à assigner un document à une ou plusieurs catégories prédéfinies. Les relations lexico-sémantiques, qui représentent les liens de sens entre les mots, jouent un rôle crucial dans ce processus en permettant de mieux saisir la signification globale d’un texte. Notre travail se concentre sur l’évaluation de l’impact de l’intégration des relations lexicosémantiques dans la catégorisation de textes. Pour ce faire, nous avons développé des modèles de classification qui exploitent ces relations et les avons évalués à l’aide de métriques standard telles que la précision, le rappel et la F-mesure, afin de mesurer leur efficacité. L’implémentation de ces modèles a été réalisée en JAVA, en utilisant la base de données lexicale WordNet pour l’enrichissement sémantique, et la plate-forme Weka pour l’évaluation des performances. Les résultats obtenus montrent amélioration notable ce qui prouve l’utilité de notre travail.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!