Implémentation Et Évaluation D’une Méthode De Sélection De Termes D'expansion Basée Sur La Position Des Termes Dans Les Documents Pertinents
2016
Autre
Informatique

Université Mouloud Mammeri - Tizi Ouzou

F
Ferrah Chahines

Résumé: L'apparition d'Internet a rendu accessible au public des services variés comme le courrier électronique, la messagerie instantanée et le World Wide Web, ces derniers ont profondément transformé les moyens de communication, notamment en facilitant les échanges de documents entre les pays. Dès lors, les collections de documents se sont enrichies par des documents écrits dans différentes langues. Les systèmes de recherche d'information (SRI) ont dû s'adapter à cette révolution technique pour devenir des systèmes capables de gérer des collections de documents. Ainsi, un SRI permet de sélectionner parmi un volume d'information, les informations pertinentes vis-à-vis d'un besoin en information. Ce dernier est exprimé sous forme de requête Pour retrouver les documents pertinents. Le SRI compare la représentation de cette requête à la représentation de chaque document. Cette comparaison est réalisée au moyen d'une fonction de correspondance (Retrieval StatusValue : RSV) et un score de pertinence est affecté à chaque document. Ces scores permettent de présenter à l'utilisateur les documents pertinents ordonnés. Les modèles de recherche et représentation d'information sont basés sur le processus de mise en correspondance entre la requête utilisateur et documents de la collection .Le mécanisme de recherche détermine alors sur la base de degré de pertinence supposé des documents, ceux qui répondent au besoin de l'utilisateur. De nombreux modèles et stratégies sont développés. Les modèles classiques, le modèle booléen, le modèle vectoriel et le modèle probabiliste sont fondés sur l'utilisation de théories mathématiques tant pour représentation des unités textuelles que pour le calcul de la pertinence des documents. Dans le processus d'indexation, l'ensemble des descripteurs ou mots clés représentent des documents, ce qu'on appelle une présentation par le sac des mots. Plusieurs méthodes en développements, parmi où on trouve celle prenant en compte la proximité entre les termes (des termes adjacents) et utilisation d'unité de présentation plus complexe (N-grammes). La difficulté pour l'utilisateur de formulée sa requête de recherche de manière efficace. Il a été montré que la faible pertinence des systèmes de recherche est due principalement à des requêtes mal formés. Les termes d'une requête formuler peuvent avoir plusieurs sens, termes nulle ou une requête très courte. Notre approche dans ce mémoire s'inscrit dans les travaux qui améliorent la performance de recherche d'information,nous étudionsl'expansion de la requête automatique qui permet de reformulé la requête de l'utilisateur pour remédie le problème desélection des documents pertinents, puis sur la base de ces derniers, sélection des termes d'expansion comme unité d'indexe dans le modèle de langue (probabiliste) ; puis en implémentant la position de terme dans le document en utilisant le modèle KL positionpour la nouvelle requête. Nous avons expérimenté et évalué notre approche proposée sur la plateforme terrier1.2 avec l'implémentation du modèle de langue (probabiliste) et le modèle BM25 pour la recherche simple et l'expansion, la collection de test TRC et les requêtes (Topic101-150). La première solution se base sur l'expansion de requête d'utilisateur, pose le problème des termes, nous choisissons la technique l'expansion de requêtes automatique .L'amélioration relative à cette démarche a permis d'une part, de se focaliser sur le sens dominant de ces requêtes, d'améliorer la qualité des requêtes traduites et donc d'améliorer la qualité des résultats recensés. Evaluation de solution donne des résultats très importante, dans chaque solution des améliorations remarquable. Les valeurs de la MAP s'améliorent d'une MAPà une autre MAP, de la recherche simple par rapport à la recherched'expansion(le Modèle pertinence).et de la recherche d'expansion par rapport à notre approche (après l'expansion). Le but d'un système de recherche d'information est donc de renvoyer l'information pertinente vis-à-vis du besoin en information de l'utilisateur. D'après notre approche, nous avons constaté que : L'utilisation de l'expansion de requête améliore les résultats de la recherche. L'utilisation le modèle KL position améliore également les résultats de la recherche de manière substantielle.

Mots-clès:

sri
normalisation
java
net beans
requet
Nos services universitaires et académiques

Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).

Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!

Comment ça marche?
Nouveau
Si le fichier est volumineux, l'affichage peut échouer. Vous pouvez obtenir le fichier directement en cliquant sur le bouton "Télécharger".


footer.description

Le Moteur de recherche des thèses, mémoires et rapports soutenus en Algérie

Doctorat - Magister - Master - Ingéniorat - Licence - PFE - Articles - Rapports


©2025 Thèses-Algérie - Tous Droits Réservés
Powered by Abysoft