Big Data

Matériel de Référence

Cours avancé explorant les infrastructures de traitement de données distribuées, les systèmes de stockage évolutifs et les plateformes d'analyse modernes pour la gestion de volumes massifs de données dans de multiples domaines.
SOURCES API IoT BD Logs Ingestion Kafka Flume NiFi Traitement Spark Hadoop Flink Storm STOCKAGE HDFS NoSQL Volume Vélocité Variété

Matériel de Cours

Questions d'Examen

Référence (Majeure Image)

Session

Première Session

Questions d'examen complètes couvrant les fondamentaux de l'informatique distribuée, les concepts MapReduce et les infrastructures de traitement de données.

Voir les Questions

Référence (Majeure Image)

Session 1

Première Session

Questions d'examen couvrant les fondamentaux de l'informatique distribuée, les concepts MapReduce et les infrastructures de traitement de données.

Voir les Questions
Session 2

Deuxième Session

Évaluation avancée axée sur l'implémentation pratique de systèmes big data, l'optimisation des performances et les décisions architecturales en conditions réelles.

Voir les Questions

Technologies Clés

Infrastructure

Écosystème Hadoop

HDFS, MapReduce, YARN, Hive et HBase pour le stockage distribué et le traitement par lots à grande échelle.

Traitement en Mémoire

Apache Spark

Moteur d'analyse unifié supportant le traitement par lots, le streaming, l'apprentissage automatique et les graphes.

Stockage

Bases de Données NoSQL

MongoDB, Cassandra et Redis pour une conception de schéma flexible et une évolutivité horizontale.

Temps Réel

Traitement de Flux

Kafka, Flink et Storm pour l'ingestion de données en temps réel, le traitement et les pipelines d'analyse.