Les Machines À Vecteurs Supports Dans La Catégorisation De Textes Arabes
2010
Mémoire de Magister
Informatique

Université 8 Mai 1945 - Guelma

D
Djelailia, Karim

Résumé: Notre mémoire traite la problématique de la catégorisation de texte en langue arabe, une approche de classification supervisée. La base d’apprentissage étant un corpus en langue arabe de documents étiquetés. La représentation utilisée est la représentation vectorielle, avec la technique TF-IDF. Nous évoquons à travers ce mémoire, l’influence de la sélection d’attributs et la langue du corpus d’entraînement dans la qualité des résultats du classifieur. Les SVM (acronyme de Support vector machine) est la méthode de classification que nous utilisons dans notre expérimentation. Le choix de la langue Arabe est motivé par la rareté des travaux menée dans ce domaine pour cette langue. Vu ses particularités morphosyntaxiques (langue fortement dérivationnelle, à caractère flexionnel et agglutinante). Nous visons à confirmer ou infirmer que la qualité des résultats obtenus pour d’autres langues avec les SVM et basés sur les techniques de radicalisation des termes (stemming), pour réduire la dimension de l’espace de représentation (problème inhérent à la technique de représentation en sacs de mots –bag of words-), sont ou ne sont pas liés à la nature de la langue du corpus. Il est donc, question de distinguer entre les résultats obtenus avec un prétraitement rigoureux de ceux obtenus avec un prétraitement rudimentaire consistant à une simple tokenisation

Mots-clès:

catégorisation de textes
corpus
stemming
tf-idf
svm
Nos services universitaires et académiques

Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).

Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!

Comment ça marche?
Nouveau
Si le fichier est volumineux, l'affichage peut échouer. Vous pouvez obtenir le fichier directement en cliquant sur le bouton "Télécharger".
Logo Université


Documents et articles similaires:


footer.description

Le Moteur de recherche des thèses, mémoires et rapports soutenus en Algérie

Doctorat - Magister - Master - Ingéniorat - Licence - PFE - Articles - Rapports


©2025 Thèses-Algérie - Tous Droits Réservés
Powered by Abysoft