Fouille De Motifs : Formalisation Et Unification
Résumé: Durant les deux dernières décennies, un travail considérable a été consacré aux aspects algorithmiques de la fouille de motifs fréquents, ce qui a donné naissance à un nombre phénoménal d’algorithmes et d’implémentations associées où chacun prétend la prééminence. Parallèlement, il est généralement admis par la communauté que le développement d’une théorie unificatrice est une des questions ouvertes et les plus intéressantes dans la sphère de recherche en fouille de données. Aussi, la première motivation de notre travail dans cette thèse est l’introduction d’un formalisme de haut niveau pour ce problème fondamental, qui induit une vision unifiée des approches algorithmiques développées jusque-là. Un des traits remarquables de notre modèle est qu’il prend en charge de manière intrinsèque les aspects à la fois qualitatifs et quantitatifs de ce problème basique, traités antérieurement toujours de manière séparée. En effet, nous formalisons ce problème à l’aide d’un modèle reposant sur les séries formelles. Après avoir encodé les motifs comme des mots sur un alphabet ordonné, nous exprimons ce problème par une série formelle sur le semi-anneau de comptage (N,+,×,0,1), dont l’étendu représente les motifs et les coefficients sont leurs supports. L’objectif est triple : primo, la définition d’un cadre théorique clair, unifié et extensible à travers lequel nous pouvons reproduire les principales approches de fouille de motifs fréquents de l’état de l’art; secundo, la preuve d’un lien approprié entre la determinisation de l’automate à multiplicité représentant une base de transactions et le calcul de la collection associée de motifs fréquents; finalement, la mise en œuvre et l’évaluation d’une première implémentation, via des automates à multiplicités, de notre formalisme que nous baptisons WAFI (pour Weighted Automata Frequent Itemset mining algorithm). Les résultats obtenus montrent le bien fondé et l’adéquation de notre modèle.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!