Data Mining et Machine Learning

IRC

John Samuel
CPE Lyon

Année: 2025-2026
Courriel: john.samuel@cpe.fr

Creative Commons License

John SAMUEL

John Samuel
  • Enseignant-Chercheur, Conception Logicielle et Big Data, CPE Lyon
  • Intérêts et thèmes de recherche: Représentation de connaissances, le web sémantique, les services web, l'intégration de données, l'entrepôt de données, les systèmes distribués, système d'information géographique
  • Cours: Programmation en C, Algorithmes en C, Data Mining et Machine Learning, Intelligence Artificielle et Deep Learning, Systèmes d'exploitation et Programmation Concurrente, Langages Web
  • Thèse: Intégration des données issues de services web
  • HDR : Des regards sémantiques pour des villes intelligentes, durables et inclusives

Data Mining et Machine Learning

Objectifs

Data Mining et Machine Learning

Composition du module:

12h
Cours
16h
Travaux pratiques et projet

Data Mining et Machine Learning

Environnement de programmation:

Data Mining

Cours:
  • Interactifs
  • Les questions: chaque 20-30 mins
  • Devoir surveillé: 60%
Travaux pratiques et Projet
  • Projet: 40%
  • 3 travaux pratiques et projet
  • Programmation en binôme
  • Soumission en ligne

Data Mining

Devoir surveillé (DS): 60%

Vous recevrez un courrier détaillé avant l'examen

Data Mining

Travaux pratiques et projet

Data Mining

Cours Dates
Cours 1 (4h) 11 février
Cours 2 (4h) 13 février
Cours 3 (4h) 25 février

Data Mining

Travaux pratiques Dates
TP 1 12 février
TP 2 et Projet 24 février
TP 3 et Projet 26 février
TP 4 et Projet 27 février

Data Mining

Travaux pratiques

Jupyter
Open Data

Data Mining

Soumission: Travaux pratiques et Projet

TP Points
TP 1
TP 2
TP 3
Projet ✅ (20 points)

Data Mining

Travaux pratiques

Chaque TP comporte plusieurs exercices. Chaque exercice est accompagné d'une indication de niveau de difficulté:

Facile
★★
Difficulté moyenne
★★★
Difficile

Data Mining

Liste de contrôle

Avant de déposer votre projet, vérifiez si vous respectez la liste de contrôle suivante:

Les noms complets (prénom et noms) de la binôme sont correctement inclus dans le fichier CONTRIBUTORS.md.
Le fichier README.md est rempli de manière exhaustive et conforme aux instructions fournies.
Vous avez respecté les noms de fichiers tels que spécifiés dans chaque exercice des travaux pratiques.
Votre code est accompagné de commentaires appropriés pour expliquer la logique et la fonctionnalité.
Votre code peut être exécuté sans générer d'erreurs, et dans la mesure du possible, sans générer d'avertissements.
Le rapport en format PDF (5 pages maximum, Arial 11pt)
Pas de fichiers Python (*.py)

Data Mining

Modèle de code

Vous pouvez consulter https://github.com/johnsamuelwrites/DataMining en ligne
ou le cloner sur votre machine à l'aide du terminal en utilisant les commandes suivantes.

$ git clone https://github.com/johnsamuelwrites/MachineLearning
$ cd MachineLearning ; ls

Et pour les dernières modifications:

$ git pull

Data Mining

Travaux pratiques: Notebooks Jupyter

Jupyter Notebook

Data Mining: Notebooks Jupyter

Travaux pratiques: Notebooks Jupyter

Jupyter Program

Data Mining: Notebooks Jupyter

Travaux pratiques: notebook Jupyter

Jupyter Scikit

Data Mining: Notebooks Jupyter

Travaux pratiques: Visualisation et notebook Jupyter

Histogram
Pie Chart

Data Mining: Notebooks Jupyter

Travaux pratiques: Visualisation et notebook Jupyter

Subplots

Data Mining

Travaux pratiques: Wikidata (Open Data)

Wikidata Query

Références

Sites web

Couleurs

Images