Classification Des Documents Textuels Par La Détection Des Entités Nommées
Résumé: Dans ce document, je présente les travaux de recherche que j’ai menés, particulièrement les données textuelles, le développement d’outils d’analyse et de traitement automatique des textes, notamment la classification automatique de textes, est devenu indispensable, pour assister les utilisateurs, de ces collections de documents, à explorer et à répertorier toutes ces immenses banques de données textuelles. Le traitement des entités nommées s’oriente désormais vers de nouvelles perspectives avec, entre autres, la désambiguïsation et une annotation enrichie de ces unités. La tâche de reconnaissance et de catégorisation des noms de personnes, de lieux, d’organisations, etc. apparait en effet comme fondamentale pour diverses applications participant de l’analyse de contenu et nombreux sont les travaux se consacrant à sa mise en œuvre, obtenant des résultats plus qu’honorables. Ces travaux, combinant approche reconnaissance d’entités nommées, rendent compte de la possibilité d’une double annotation de corpus (catégories sémantique et catégories syntaxique) et d’une désambiguïsation des entités nommées et d’améliorer les performances et l’efficacité du modèle de classification. Outre, dans ce travail nous avons adapté l’algorithme K-NN sur les entités nommées et les corpus complets pour améliorer la classification des documents textuels, évaluer ces performances et comparer entre les résultats obtenus afin de mieux choisir la meilleure classification.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!