Utilisation D’une Approche Non Supervisée Pour L’extraction Automatique De Mots-clés : Application Aux Textes Arabes
Résumé: A travers ce projet, nous présentons une approche hybride pour l’extraction automatique des mots clés dans les textes écrits en langue arabe. La méthode que nous proposons combine des critères statistiques tels que la fréquence avec d’autres linguistiques liés à la catégorie grammaticale. L’expérience menée sur un corpus formé d’une collection de documents économiques, scientifiques et technologiques à montrer l’intérêt de combiner plusieurs critères pour améliorer le processus d’extraction des mots clés dans les textes arabes et en particulier l’intérêt de la catégorie grammaticale dans tel processus. Mots clés Traitement automatique de la langue arabe, Analyse morphologique, Mots pertinents, Pondération de termes, Catégorie grammaticale. Through this project, we present a hybrid approach for the automatic extraction of keywords in texts written in Arabic. The proposed method combines statistical criteria such as frequency of words with linguistic criteria related to the grammatical category. The experiment conducted on a corpus formed of a collection of economic , technologic and scientific articles showed interest to combine several criteria to improve the process of extracting key words in Arabic texts and in particular the interest of the grammatical category in such process. Keywords Arabic language processing, Morpho-syntactic analysis, Relevant words, terms weighting, Grammatical category.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!