Data Provenance Et Data Lineage Dans Un Environnement Data Lake
2023
Mémoire de Master
Informatique

Université Saad Dahleb - Blida

A
Amrouche, Manel
B
Boukrou, Lina
B
Bala, M. ( promoteur)

Résumé: La vulgarisation des données à grande échelle, tout particulièrement les données non structurées et les environnements Big Data, a donné naissance à une nouvelle technologie de stockage appelée Lac de données (Data Lake en anglais). Les lacs de données permettent de stocker d'énormes quantités de données, qu'elles soient structurées, semi-structurées ou non structurées, en les publiant à des fins d'analyse de données, de statistiques, de fouille de données, etc. Pour s’assurer que cette technologie de stockage ne se transforme en marécages, la gouvernance du Data Lake basée sur un catalogue de métadonnées est considérée comme la clé de voûte d’un environnement Data Lake. Le catalogue des métadonnées permet de créer des passerelles sémantiques entres les différentes sources de données et de prendre en charge les différentes opérations de base à savoir l’ingestion des données, faciliter l’accès aux différentes sources quel que soit leur format, etc. La " Data Provenance " ou " Data Lineage " étant l'un des éléments importants du catalogue des métadonnées du système Data Lake, elle permet de définir le contenu des sources de données, de décrire les liens entre les sources ainsi que l'historique des changements effectués sur celles-ci. L'objectif de ce travail est la capture, le stockage, l'interrogation et la visualisation des métadonnées décrivant le cycle de vie des sources de données dans un environnement Data Lake. Mots-clés: Data Provenance, Data Lineage, Métadonnées, Data Lake, Big Data, NoSQL.

Mots-clès:

Nos services universitaires et académiques

Thèses-Algérie vous propose ses divers services d’édition: mise en page, révision, correction, traduction, analyse du plagiat, ainsi que la réalisation des supports graphiques et de présentation (Slideshows).

Obtenez dès à présent et en toute facilité votre devis gratuit et une estimation de la durée de réalisation et bénéficiez d'une qualité de travail irréprochable et d'un temps de livraison imbattable!

Comment ça marche?
Nouveau
Si le fichier est volumineux, l'affichage peut échouer. Vous pouvez obtenir le fichier directement en cliquant sur le bouton "Télécharger".


footer.description

Le Moteur de recherche des thèses, mémoires et rapports soutenus en Algérie

Doctorat - Magister - Master - Ingéniorat - Licence - PFE - Articles - Rapports


©2025 Thèses-Algérie - Tous Droits Réservés
Powered by Abysoft