Indexation De Données À Large Echelle
Résumé: Le Pair à pair (p2p) a permis une décentralisation des systèmes, en permettant à tous les ordinateurs de jouer le rôle de client (il peut effectuer des requêtes) et de serveur (il répond aux requêtes). Un tel système n'est composé que des machines des utilisateurs du système et n'implique pas de coût lié à des serveurs. Nous proposons dans cette thèse deux méthodes de routage des requêtes dans les systèmes pair à pair. Nous nous intéressons tout particulièrement à l'architecture hybride. La première méthode fait usage de la théorie de la percolation, qui permet le calcul d'un seuil critique, que nous appelons seuil de satisfaction. Celui-ci permet aux ultrapairs une prise de décision intelligente dans le processus de routage au lieu de l'utilisation automatique du nombre de sauts (Time To Live: TTL) qu'effectue la requête. Ce seuil permet d'alléger la fonctionnalité des ultrapairs car il représente la satisfaction du noeud demandeur de la requête par les réponses de ses voisins. Il est calculé en prenant en compte le nombre de réponses retournées parchaque voisin touché, par rapport au nombre de mots de la requête émise. La deuxième méthode de routage proposée est une méthode sémantique pour la localisation de fichiers. Nous composons une matrice particulière dite mot-mot, qui capture les occurrences des mots. Cette matrice sert à déduire les pairs qui parlent le même langage et de router les requêtes vers eux. Nous appliquons sur cette matrice une méthode spectrale appelée décomposition à valeur singulière (Singular Value Décomposition : SVD). Cette méthode nous permet d'interroger les individus les plus susceptibles d'avoir les fichiers recherchés et de créer des clusters de mots et des clusters de pairs, et ainsi d'optimiser la recherche. La particularité de notre méthode est l'application de la SVD sur une matrice mot_mot symétrique à diagonale fortement dominante. Ces deux propriétés permettent une convergence plus rapide et donnent un gain de calcul considérable. Nous l'appliquons sur la matrice mot_mot afin de ranger et trier les fichiers retournés selon un ordre précis. Nos expérimentations nous ont été très encourageantes et ont répondu à nos attentes. Notre travail a fait l'objet de trois communications internationales et une soumission d'article pour une publication dans le journal "Peer to Peer Networks and Application" de Springer.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!