Développement D'un Environnement Pour L'alignement Des Ontologies : Une Approche À Base D'instances
Résumé: L'ontologie est définie comme un modèle qui permet de représenter le sens de façon explicite. Elle a été adoptée dans le web sémantique afin de surmonter le problème crucial de l'interopérabilité sémantique. Toutefois, les sources d'informations disponibles sur le web utilisant les ontologies comme support ne cessent d'augmenter et sont souvent hétérogènes et distribuées. Cette hétérogénéité peut se situer aux niveaux syntaxique, terminologique, conceptuel et/ou sémiotique. L'alignement d'ontologies est la solution proposée pour combler le fossé sémantique entre ces ontologies hétérogènes afin d'assurer l'interopérabilité sémantique. L'alignement d'ontologies est un processus qui reçoit en entrée deux ou plusieurs ontologies et génère en sortie un ensemble de correspondances sémantiques entre les différentes entités de ces ontologies. Cependant, le nombre de plus en plus croissant des ontologies disponibles sur le web, nécessite des outils automatiques d'alignement d'ontologies. Toutefois, l'identification automatique des correspondances sémantiques entre les ontologies est très difficile en raison notamment de leurs divergences conceptuelles. Plusieurs méthodes ont été élaborées pour aligner sémantiquement les ontologies. Ces méthodes sont basées généralement sur le calcul de la similitude des concepts, des relations ou/et des instances ou l'utilisation des algorithmes de raisonnement et souvent les derniers systèmes d'alignement d'ontologies combinent ces méthodes pour avoir un meilleur alignement. Nous proposons dans cette thèse deux nouvelles approches d'alignement d'ontologies. La première approche consiste à combiner les méthodes structurelles intra-taxonomiques et à base de raisonnement. La deuxième approche consiste à créer un corpus commun d'instances en utilisant l'inférence de la logique de description et un mécanisme de transfert et de propagation. * L'idée de la première approche consiste à créer une taxonomie partagée, par les deux ontologies à aligner, qui sert de support à l'application des métriques intra-taxonomiques. Cette création se fait en deux étapes. D'abord un alignement de référence initial est exploité pour fusionner les deux ontologies à aligner. Ensuite un raisonnement de la logique de description est opéré pour identifier la taxonomie inférée. L'intuition derrière cette inférence est de découvrir toutes les relations de subsomptions implicites et enrichir ainsi la taxonomie partagée. * Le but de la deuxième solution étant de créer un corpus commun d'instances, ensuite à appliquer les métriques de calcul de similarités à base d'instances. La création du corpus se fait en trois étapes. La première étape consiste à fusionner les deux ontologies à aligner en exploitant un alignement de référence initial identifié manuellement par un expert du domaine ou automatiquement par les méthodes de l'alignement existantes. La deuxième étape consiste à générer la taxonomie inférée à partir de l'ontologie qui résulte de l'étape précédente. La dernière étape consiste à exploiter les nouvelles relations de subsomption identifiées pour opérer un transfert mutuel des instances entre les concepts des deux ontologies. En dernier, les similarités entre les concepts sont calculées par des métriques à base d'instances afin d'identifier les correspondances sémantiques. Nos méthodes ont été combinées avec le système AOT avec lequel nous avons participé dans la campagne d'évaluation OAEI 2014 (Ontology Alignment Evaluation Initiative). Pour évaluer la performance de nos approches nous avons utilisé les tests de Biblio et Finance de la série Benchmark et la série Anatomie de la campagne OAEI 2012. Nous avons comparé successivement nos approches avec les systèmes LogMap et YAM++. Nous avons aussi analysé l'apport de la première approche par rapport aux méthodes structurelle et sémantique, ainsi que l'apport de la deuxième approche par rapport aux méthodes à base d'instances et à base de raisonnement. Les résultats obtenus montrent la bonne performance de nos approches. En effet, ces résultats sont meilleurs que ceux de LogMap en termes de précision, de rappel et de F-mesure. Nos approches se révèlent aussi plus pertinentes que YAM++ pour certains types d'ontologies et améliorent significativement les méthodes à base de structure, à base d'instances et à base de raisonnement.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!