Clustering De Données Dans Un Contexte Big Data
Résumé: Durant ces dernières années, on assiste à une prolifération de données dans plusieurs domaines. Cela est dû à l'évolution des données à haut débit qui sont devenus un outil indispensable à la recherche en plusieurs domaines de l'informatique. Pour faire face à cette évolution de données complexes, l'informatique doit exploiter des expertises diverses de haut niveau. En effet, Le Big Data s'est imposé comme l'innovation de ce début de décennie. Au coeur de cette révolution, une architecture connue sous le nom de MapReduce qui consiste en un puissant environnement massivement parallèle a émergé. Dans ce contexte, nous proposons un système parallèle distribué pour regrouper un ensemble des points basé sur le clustering des données. Pour cela, nous allons utiliser la plateforme Hadoop qui constitue l'une des meilleures plateformes du Big Data et qui repose sur le paradigme MapReduce. Dans notre travail on s'intéresse à la proposition d'une approche pour le clustering de données massives en utilisant MapReduce, cette approche est basée sur l'algorithme k-means et l'algorithme Particule Swarm Optimisation (PSO).
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!