La Méthode Knn Pour Le Big Data
Résumé: Le classifieur KNN (K-Nearest Neighbor classifier) est une méthode largement connue et utilisée dans la fouille de données. Mais cette méthode présente un inconvénient majeur qui réside dans la grande quantité de calcul qu’elle génère et la quantité de mémoire qu’elle nécessite. Ce qui fait que cette méthode n’est pas du tout adaptée aux applications d’analyses de Big Data. Pour contourner les inconvénients des méthodes connues de fouille de données, plusieurs alternatives d’environnement distribuées ont été proposées. Parmi ces alternatives on peut citer l’écosystème distribué Hadoop MapReduce ainsi que spark qui attire de plus en plus une attention considérable. Nous aurons pour tache de recenser les travaux sur la méthode kNN pour le Big Data, s’initier à l’écosystème Hadoop ou l’écosystème d’Apache Spark. Le but étant d’implémenter une des méthodes recensées et de la tester sur un Benchmark.
Mots-clès:
Nos services universitaires et académiques
Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).
Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!