Indexation Sémantique De Documents Textuels
Résumé: Nous avons décrit dans ce mémoire une nouvelle approche d’indexation sémantique (proposée par Amirouche [Amirouche, 11]). Cette approche porte sur les trois aspects de l’indexation sémantique : (1) la détection des termes d’index qui consiste à retrouver l’ensemble des collocations, l’ensemble des termes simples et l’ensemble des termes orphelins. (2) la désambiguïsation des termes qui consiste à sélectionner le sens correct de chaque mot simple dans le document et (3) la pondération des termes, où nous avons proposé un nouveau schéma de pondération basé sur la similarité sémantique (plus le terme est relié sémantiquement aux autres termes du document plus il est important). Par la suite, nous avons intégré cette nouvelle approche à la plateforme de Terrier 3.5, formant ainsi Sem-Terrier, et ce, en ajoutant un module pour l’identification des termes d’index et leur désambiguïsation, et le nouveau modèle de pondération pour le calcul des scores.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!