Implémentation Et Évaluation D’une Approche De Ri Basée Sur La Position Du Terme .
Résumé: La plupart des modèles de RI se basent généralement sur la combinaison de trois facteurs dans leur fonction de pondération, qui sont : la fréquence du terme dans le document (TF), la fréquence du terme dans la collection (ou l'IDF) et la taille du document. Quelques approches ont proposé d'intégrer la position du terme dans le document dans l'objectif de surpondérer les termes qui apparaissent au début du document. Dans ce travail, nous nous situons dans cette perspective. Nous proposons l'extension des modèles de RI suivants : TF_IDF et BM25 par un facteur basé sur les positions du terme dans les documents de la collection où il apparait. Précisément, en surpondérant le poids des termes qui apparaissent au début des documents. Cette idée est basée sur l'intuition suivante : " les auteurs des documents placent les termes les plus importants dans leurs premières parties ". Les résultats expérimentaux obtenus sur la collection de test TREC AP88, montrent que nos modèles étendus améliorent les deux modèles de base :TF_IDF et BM25.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!