Intelligence artificielle et Deep Learning

Sujets supplémentaires

John Samuel
CPE Lyon

Année: 2024-2025
Courriel: john.samuel@cpe.fr

Creative Commons License

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle 2.0 [Pan 2016, Jaakkola 2019]

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle 2.0 [Pan 2016]

A.2. Introduction à l'apprentissage machine

L'apprentissage machine, également connu sous le nom de machine learning (ML), est un domaine de l'intelligence artificielle (IA) qui se concentre sur le développement de techniques permettant aux ordinateurs d'apprendre à partir de données. L'objectif principal de l'apprentissage machine est de permettre aux systèmes informatiques de prendre des décisions ou de réaliser des tâches sans être explicitement programmés, en s'appuyant sur des modèles et des motifs appris à partir des données.

Principes fondamentaux de l'apprentissage machine

A.2. Introduction à l'apprentissage machine

Principes fondamentaux de l'apprentissage machine

A.2.1. Positionnement de l'apprentissage machine

L'apprentissage machine occupe une place centrale dans le paysage technologique actuel et a un impact significatif dans divers domaines.

A.2.2. Approches de l'apprentissage machine

Approches

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation

A.2.3. Formalisation des problèmes d'apprentissage

Exemples de caractéristiques

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation

  1. https://en.wikipedia.org/wiki/Feature_vector

A.2.3. Formalisation des problèmes d'apprentissage

Exemple

La construction de caractéristiques est une étape essentielle dans le pipeline de prétraitement des données en apprentissage machine, car elle peut aider à rendre les données plus informatives pour les algorithmes d'apprentissage.

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

Cette formalisation est au cœur de l'apprentissage supervisé, où l'objectif est d'apprendre à partir d'exemples étiquetés et de trouver une fonction qui puisse prédire de manière précise les étiquettes pour de nouvelles données non vues.

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage non supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage non supervisé

L'apprentissage non supervisé est utilisé pour explorer et découvrir des modèles, des structures ou des caractéristiques inhérentes aux données, sans l'utilisation d'étiquettes ou de labels préalables. Il est couramment utilisé dans des domaines tels que la clustering, l'analyse de composantes principales (PCA), l'analyse en composantes indépendantes (ICA), et bien d'autres.

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

A.3. Méthodes de classification

Classification: Définition formelle

A.3. Méthodes de classification

Classificateurs

A.3. Méthodes de classification

Classification binaire

Classification binaire

A.3. Méthodes de classification

Linear Classificateurs

A.3. Méthodes de classification

Évaluation

Dans le contexte de la classification en apprentissage machine, l'évaluation des performances d'un modèle implique la compréhension de différents types de prédictions qu'il peut faire par rapport à la réalité. Les vrais positifs (VP) et les vrais négatifs (VN) sont deux de ces éléments.

A.3. Méthodes de classification

Évaluation

Les vrais positifs et les vrais négatifs
Précision et rappel

A.3. Méthodes de classification

Évaluation

Soit

A.3. Méthodes de classification

Évaluation

La précision mesure la proportion de prédictions positives faites par le modèle qui étaient effectivement correctes, tandis que le rappel mesure la proportion d'exemples positifs réels qui ont été correctement identifiés par le modèle. Alors

A.3. Méthodes de classification

Évaluation

Le F1-score est la moyenne harmonique de la précision et du rappel. Il fournit une mesure globale de la performance d'un modèle de classification, tenant compte à la fois de la précision et du rappel. Il est particulièrement utile lorsque les classes sont déséquilibrées.

Le F1-score tient compte à la fois des erreurs de type I (faux positifs) et des erreurs de type II (faux négatifs), fournissant ainsi une mesure équilibrée de la performance du modèle.

A.3. Méthodes de classification

Évaluation

A.3. Méthodes de classification

Le \(F_2\)-score est souvent utilisé dans des domaines où le rappel est considéré comme plus critique que la précision.

A.3. Méthodes de classification

Évaluation: matrice de confusion

La matrice de confusion est un outil essentiel dans l'évaluation des performances d'un système de classification. Elle fournit une vue détaillée des prédictions faites par le modèle par rapport aux classes réelles.

A.3. Méthodes de classification

Évaluation: matrice de confusion

Matrice de confusion pour un classificateur SVM pour les chiffres manuscrits (MNIST)

A.3. Méthodes de classification

Évaluation: matrice de confusion

Matrice de confusion pour un perceptron pour les chiffres manuscrits (MNIST)

A.3. Méthodes de classification

Classification multiclasse

Classification multiclasse

A.3. Méthodes de classification

Classification multiclasse [Aly 2005]

A.3. Méthodes de classification

Classification multiclasse

Classification multiclasse

A.3. Méthodes de classification

Classification multiclasse

One-vs.-rest (One-vs.-all) strategy

La strategie un-contre le rest pour la classification multiclasse

A.3. Méthodes de classification

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

La strategie un-contre le rest pour la classification multiclasse

A.3. Méthodes de classification

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

A.3. Méthodes de classification

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

Prendre des décisions signifie appliquer tous les classificateurs à un échantillon invisible x et prédire l'étiquette k pour laquelle le classificateur correspondant rapporte le score de confiance le plus élevé : \[\hat{y} = \underset{k \in \{1 \ldots K\}}{\arg\!\max}\; f_k(x)\]

A.3. Méthodes de classification

Classification multiclasse

One-vs.-one strategy

La strategie un-contre-un pour la classification multiclasse

A.3. Méthodes de classification

Classification multiclasse

One-vs.-one strategy

  • nécessite l'entraînement des \(\frac{K (K - 1)}{2}\) classificateurs binaires
  • chaque classificateur reçoit les échantillons d'une paire de classes du jeu de formation original, et doit apprendre à distinguer ces deux classes.
  • Au moment de la prédiction, un système de vote est appliqué : tous les \(\frac{K (K - 1)}{2}\) classificateurs sont appliqués à un échantillon non vu et la classe qui a obtenu le plus grand nombre de prédictions est prédite par le classificateur combiné.
  • La strategie un-contre-un pour la classification multiclasse

    Références

    Articles de recherche

    Références:

    Web

    1. Google acquiert DNNresearch, spécialisé dans les réseaux de neurones profonds: https://www.lemondeinformatique.fr/actualites/lire-google-acquiert-dnnresearch-specialise-dans-les-reseaux-de-neurones-profonds-52829.html
    2. Pourquoi Microsoft rachète Linkedin: https://www.lemondeinformatique.fr/actualites/lire-pourquoi-microsoft-rachete-linkedin-65136.html
    3. Scikit-learn: http://scikit-learn.org/stable/
    4. Perceptron: https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html

    Références:

    Wikipédia

    Références:

    Wikipédia

    Références:

    Couleurs

    Images