Creative Commons License

Digitalisation des procédés: Data Mining

Année: 2025-2026

Plan du Cours

  1. Répresentation, manipulation et prétraitement de données
    • 1.1. Cycle de vie des données
    • 1.1.1.1. Acquisition de données
    • 1.1.1.2. ETL (Extraction Transformation, Loading)
    • 1.1.1.3. Analyses de données
    • 1.1.1.4. Visualisation de données
    • 1.2. Acquisition et stockage des données
    • 1.2.1. Formats de stockage de données: CSV
    • 1.2.2 Types de stockage des données
    • 1.2.3.1. Propriétés ACID1
    • 1.2.3.2 Types de bases de données
    • 1.2.3.3. NoSQL
    • 1.3. Extraction et intégration des données
    • 1.3.1. Techniques d'extraction des données
    • 1.3.2. Interfaces d'interrogation
    • 1.3.3. Crawlers pour les pages web
    • 1.3.4. Interface de programmation d'applications (API)
    • 1.4. Prétraitement des données
    • 1.4.1. Nettoyage de données
    • 1.4.1.1. Erreurs de syntaxe
    • 1.4.1.2. Erreurs sémantiques
    • 1.4.1.3. Erreurs de couverture
    • 1.4.2.1. Traitement des erreurs syntaxiques
    • 1.4.2.2. Traitement des erreurs sémantiques
    • 1.4.2.3. Traitement des erreurs de couverture
    • 1.4.2.4. Administrateurs et traitement des erreurs
    • 1.5. Transformation des données
    • 1.5.1 Langages de programmation
    • 1.6. ETL
    • 1.6.1. ETL (Extraction Transformation and Loading)
    • 1.6.2. ETL: d'une base de données à l'autre
    • 1.6.2.1. Analyse des données multidimensionnelles
    • 1.6.2.2. Modèle de données en étoile
    • 1.6.2.3. Cubes ou hypercube de données
    • 1.6.2.4. Modèle de données en flocon
    • 1.7. Analyse des données
    • 1.8. Visualisation des données
    • 1.8.1 Les variables visuelles
    • 1.8.2. Visualisation des données: Exemples
  2. Données ouvertes liées

Crédits d'images