Data Mining
John Samuel
CPE Lyon
Année: 2025-2026
Courriel: john.samuel@cpe.fr
Objectif : transformer des chiffres en décisions métier.
Format léger basé sur des paires clé-valeur, pratique pour capteurs connectés et supervision.
[
{
"timestamp": "2025-09-10T08:15:00",
"reacteur": "BR-02",
"ph": 6.8,
"pression_bar": 1.2,
"temperature_c": 37.0
},
{
"timestamp": "2025-09-10T08:20:00",
"reacteur": "BR-02",
"ph": 6.7,
"pression_bar": 1.3,
"temperature_c": 37.1
}
]
Format hiérarchique utilisé dans plusieurs logiciels industriels et échanges inter-systèmes.
<ordreFabrication id="OF-2025-347">
<lot>L-0925-A</lot>
<produit>Solution Fermentee</produit>
<consignes>
<temperature_c>37</temperature_c>
<ph_cible>6.8</ph_cible>
</consignes>
<mesures>
<pression_bar>1.2</pression_bar>
<debit_l_h>45</debit_l_h>
</mesures>
</ordreFabrication>
Format simple pour commencer les analyses dans un tableur.
timestamp,machine,ph,pression_bar,temperature_c,debit_l_h,energie_kwh
2025-09-10T08:15:00,BR-02,6.8,1.2,37.0,45,12.4
2025-09-10T08:20:00,BR-02,6.7,1.3,37.1,44,12.8
2025-09-10T08:25:00,BR-02,6.6,1.4,37.3,43,13.5
Règle pratique : plus la donnée est structurée, plus l'analyse est rapide et fiable.
| timestamp | machine | variable | valeur | unité |
|---|---|---|---|---|
| 08:15 | BR-02 | pH | 6.8 | - |
| 08:15 | BR-02 | Température | 37.0 | C |
| 08:15 | BR-02 | Pression | 1.2 | bar |
| Outil | Quand l’utiliser | Limite principale |
|---|---|---|
| Excel | Exploration rapide, calculs simples, petits jeux de données. | Peu robuste pour gros volumes et automatisation. |
| Power BI | Dashboards, suivi KPI, partage avec production/management. | Préparation complexe si données non nettoyées. |
| Python + Pandas | Nettoyage, transformation, analyses reproductibles et scripts. | Nécessite un minimum de rigueur code/version. |
| SQL | Interroger des bases structurées, jointures, historisation. | Moins adapté aux analyses avancées sans outil complémentaire. |
Conseil de cours : commencer simple (Excel/SQL), puis passer à Python/Pandas et BI selon le besoin métier.
Note : le travail pratique est traité dans une autre séance dédiée.
Règle : l’IA assiste la décision, mais la validation finale reste métier (opérateur + process + qualité).
Objectif : des données exploitables pour piloter, mais aussi défendables en contrôle ou audit.
| Terme | Définition simple |
|---|---|
| ERP | Logiciel qui relie achats, stocks, production, qualité et finance. |
| SCADA | Supervision des équipements et visualisation en temps réel. |
| LIMS | Système de gestion des analyses et résultats laboratoire. |
| OEE / TRS | Indicateur global de performance d’une ligne de production. |
| MTBF | Temps moyen entre deux pannes d’un équipement. |
| MTTR | Temps moyen de réparation après panne. |
| Terme | Définition simple |
|---|---|
| ATEX | Zone à risque d’atmosphère explosive, avec exigences de sécurité. |
| ETL | Extract-Transform-Load: pipeline de données pour analyse. |
| KPI | Indicateur clé utilisé pour piloter la performance. |
| CAPEX | Dépenses d’investissement (machines, infrastructures). |
| OPEX | Dépenses opérationnelles (exploitation quotidienne). |
| Open Data | Données publiées et réutilisables sous conditions de licence. |