Apprentissage machine

John Samuel
CPE Lyon

Year: 2023-2024
Email: john(dot)samuel(at)cpe(dot)fr

Creative Commons License

John SAMUEL

  • Enseignant-Chercheur, Conception Logicielle et Big Data, CPE Lyon,
  • Intérêts et thèmes de recherche : Représentation de connaissances, le web sémantique, les services web, l'intégration de données, l'entrepôt de données, les systèmes distribués, système d'information géographique
  • Cours : Programmation en C, Algorithmes en C, Data Mining et Machine Learning, Intelligence Artificielle et Deep Learning, Systèmes d'exploitation et Programmation Concurrente, Langages Web
  • Thèse : Intégration des données issues de services web

Intelligence Artificielle - Deep Learning

Objectifs

  1. Introduction à l'Intelligence Artificielle (IA)
  2. Apprentissage Machine
  3. Apprentissage Profond
  4. Applications de l'IA

Intelligence Artificielle - Deep Learning

Devoir surveillé (DS): 60%

Vous recevrez un courrier détaillé avant l'examen

Intelligence Artificielle - Deep Learning

Travaux pratiques et Projet: 40%

Intelligence Artificielle - Deep Learning

Cours Nombre d'heures
Cours 16
TP 16
Projet 16

Attention : À chaque séance, nous adopterons un format intégrant à la fois des cours et des travaux pratiques.

1.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

1.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

1.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle 2.0 [Pan 2016, Jaakkola 2019]

1.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle 2.0 [Pan 2016]

1.2. Les fondements de l'IA

Objectifs

Intelligence artificielle

1.2. Les fondements de l'IA

1.2. Les fondements de l'IA

1.2.1. Logique et raisonnement

Logique et raisonnement

1.2.1. Logique et raisonnement

Logique propositionnelle

Les propositions dans la logique propositionnelle sont des déclarations qui peuvent être vraies (V) ou fausses (F). Supposons que nous ayons deux propositions simples : P, Q. Nous pouvons utiliser des connecteurs logiques pour créer des propositions plus complexes à partir de ces propositions simples.

1.2.1. Logique et raisonnement

Logique propositionnelle

1.2.1. Logique et raisonnement

Logique propositionnelle

Supposons que nous ayons quatre propositions simples : P, Q, R et S.

1.2.1. Logique et raisonnement

Logique propositionnelle

Avec ces propositions, nous pouvons définir des règles pour déterminer si une image représente la mer :

nous pouvons utiliser des opérateurs logiques pour combiner ces propositions et déterminer si l'image est celle de la mer :

Image de la mer : (P ET Q) OU (P ET R) OU (P ET S)

1.2.1. Logique et raisonnement

Logique du premier ordre

Contrairement à la logique propositionnelle, qui traite uniquement de la vérité ou de la fausseté de propositions simples, la logique du premier ordre permet de représenter des informations structurées sur des objets et leurs relations. Voici quelques concepts clés de la logique du premier ordre :

Utilisez des parenthèses pour indiquer la priorité des opérations et la structure de la formule.

1.2.1. Logique et raisonnement

Logique du premier ordre

Utilisez des parenthèses pour indiquer la priorité des opérations et la structure de la formule.

1.2.1. Logique et raisonnement

Logique du premier ordre

Exemple :

1.2.1. Logique et raisonnement

Logique du premier ordre

Exemple :

Les fonctions sont utilisées pour attribuer des valeurs à des objets ou effectuer des opérations, tandis que les prédicats sont utilisés pour exprimer des relations ou des propriétés entre des objets et renvoient une valeur booléenne indiquant si la relation est vraie ou non.

1.2.1. Logique et raisonnement

Logique du premier ordre

Utilisons l'exemple des règles pour confirmer qu'une image représente effectivement une mer.

1.2.1. Logique et raisonnement

Logique du premier ordre

1. Pour déterminer si une image représente une scène de mer, nous pourrions utiliser une règle du type

∀x (ContientEau(x) ∧ ContientSable(x) => EstMer(x))

2. Nous pourrions également ajouter des règles spécifiques pour détecter des éléments spécifiques :

∀x (ContientBateaux(x) => EstPort(x))

∀x (ContientOiseauxMarins(x) => EstPlage(x))

1.2.1. Logique et raisonnement

Logique du premier ordre

3. Il existe au moins une image x telle que l'image contienne de l'eau et du sable.

∃x (ContientEau(x) ∧ ContientSable(x))

1.2.1. Logique et raisonnement

Logique modale

La logique modale est une extension de la logique classique qui permet de raisonner sur la notion de "modalités", c'est-à-dire des catégories de propositions qui expriment des modalités ou des qualités spécifiques, telles que la nécessité, la possibilité, l'obligation, la croyance, etc

Opérateurs modaux : Les opérateurs modaux sont utilisés pour exprimer des modalités. Les deux opérateurs modaux les plus courants sont :

1.2.1. Logique et raisonnement

Logique modale

En logique modale, les termes "nécessaire", "contingent", "possible" et "impossible" sont utilisés pour décrire les modalités ou les qualités d'une proposition.

1.2.1. Logique et raisonnement

Logique modale

1.2.1. Logique et raisonnement

Logique modale

Exemple

1.2.1. Logique et raisonnement

Raisonnement automatisé

Le raisonnement automatisé est un domaine de l'intelligence artificielle (IA) qui concerne la création de systèmes informatiques capables de tirer des conclusions logiques et de résoudre des problèmes de manière autonome, similaire à la manière dont les humains utilisent leur raisonnement pour résoudre des problèmes.

1.2.1. Logique et raisonnement

Raisonnement automatisé

Le raisonnement automatisé peut être expliqué en utilisant différentes logiques, notamment la logique propositionnelle, la logique du premier ordre et la logique modale.

1.2.2. Représentation des connaissances

Introduction

La représentation des connaissances joue un rôle central dans la manière dont les systèmes informatiques comprennent, raisonnent et interagissent avec le monde. La représentation des connaissances désigne le processus de capture, de structuration et de stockage des informations et des connaissances de manière à les rendre utilisables par des systèmes informatiques. Cela implique de transformer des données brutes ou des concepts en une forme que les ordinateurs peuvent comprendre et exploiter pour résoudre des problèmes, prendre des décisions ou interagir avec les utilisateurs.

1.2.2. Représentation des connaissances

Types de connaissances

Les types de connaissances peuvent être classés en plusieurs catégories, notamment les connaissances déclaratives, les connaissances procédurales, les connaissances explicites et les connaissances tacites.

1.2.2. Représentation des connaissances

Types de connaissances

1.2.2. Représentation des connaissances

Représentation des connaissances déclaratives

Dans la représentation des connaissances déclaratives, les faits, les informations et les connaissances sont exprimés sous forme de propositions logiques.

1.2.2. Représentation des connaissances

Représentation des connaissances déclaratives

Graphes de Connaissances (Ontologies): Les ontologies sont des structures de données hiérarchiques qui organisent et hiérarchisent les connaissances en utilisant des concepts, des classes, des propriétés et des relations.

1.2.3. Agents intelligents

Introduction

Les agents intelligents sont des entités logicielles ou matérielles capables de percevoir leur environnement, de prendre des décisions, et d'agir pour atteindre des objectifs spécifiques. Un agent intelligent est un système informatique ou une entité physique qui possède certaines caractéristiques clés :

1.2.3. Agents intelligents

Types d'agents intelligents

Les agents intelligents peuvent être classés en différents types en fonction de leurs caractéristiques et de leurs capacités.

1.2.3. Agents intelligents

Types d'agents intelligents

1.2.3. Agents intelligents

Types d'agents intelligents

1.2.3. Agents intelligents

Types d'agents intelligents

1.2.4. Apprentissage machine

3 approches

  1. Apprentissage supervisé:
    • Un modèle est formé à partir d'un ensemble de données de formation qui sont étiquetées, c'est-à-dire que chaque exemple de données est associé à une étiquette ou une catégorie connue.
    • L'objectif du modèle est d'apprendre à faire des prédictions en utilisant ces étiquettes de manière à pouvoir généraliser et faire des prédictions précises sur de nouvelles données non vues.
    • Par exemple, la classification d'images, la prédiction de prix, et la détection de spam dans les emails.
  2. Apprentissage non supervisé:
    • Il n'y a pas de données de formation labellisées.
    • Le modèle doit découvrir des structures, des modèles ou des regroupements dans les données par lui-même.
    • Par exemple, la segmentation de clients en groupes, la réduction de la dimensionnalité, ou la détection d'anomalies.

1.2.4. Apprentissage machine

3 approches

  1. Apprentissage semi-supervisé:
    • Il repose sur un petit ensemble de données de formation étiquetées et une grande quantité de données non étiquetées.
    • Le modèle utilise les données étiquetées pour apprendre à faire des prédictions, mais il peut également tirer parti des données non étiquetées pour améliorer sa performance.
    • Cela peut être particulièrement utile lorsque l'obtention de données étiquetées est coûteuse ou difficile.

1.2.5. Apprentissage profond

Apprentissage profond

Dans l'apprentissage profond, le terme profond fait référence à la présence de multiples couches dans le réseau neuronal. Contrairement aux modèles plus simples, tels que les perceptrons monocouche, les réseaux profonds ont la capacité d'apprendre des représentations hiérarchiques complexes à partir de données brutes.

2.1. Introduction à l'apprentissage machine

L'apprentissage machine, également connu sous le nom de machine learning (ML), est un domaine de l'intelligence artificielle (IA) qui se concentre sur le développement de techniques permettant aux ordinateurs d'apprendre à partir de données. L'objectif principal de l'apprentissage machine est de permettre aux systèmes informatiques de prendre des décisions ou de réaliser des tâches sans être explicitement programmés, en s'appuyant sur des modèles et des motifs appris à partir des données.

Principes fondamentaux de l'apprentissage machine

2.1. Introduction à l'apprentissage machine

Principes fondamentaux de l'apprentissage machine

2.1.1. Positionnement de l'apprentissage machine

L'apprentissage machine occupe une place centrale dans le paysage technologique actuel et a un impact significatif dans divers domaines.

2.1.2. Approches de l'apprentissage machine

Approches

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation

2.1.3. Formalisation des problèmes d'apprentissage

Exemples de caractéristiques

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation

  1. https://en.wikipedia.org/wiki/Feature_vector

2.1.3. Formalisation des problèmes d'apprentissage

Exemple

La construction de caractéristiques est une étape essentielle dans le pipeline de prétraitement des données en apprentissage machine, car elle peut aider à rendre les données plus informatives pour les algorithmes d'apprentissage.

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

Cette formalisation est au cœur de l'apprentissage supervisé, où l'objectif est d'apprendre à partir d'exemples étiquetés et de trouver une fonction qui puisse prédire de manière précise les étiquettes pour de nouvelles données non vues.

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage non supervisé

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage non supervisé

L'apprentissage non supervisé est utilisé pour explorer et découvrir des modèles, des structures ou des caractéristiques inhérentes aux données, sans l'utilisation d'étiquettes ou de labels préalables. Il est couramment utilisé dans des domaines tels que la clustering, l'analyse de composantes principales (PCA), l'analyse en composantes indépendantes (ICA), et bien d'autres.

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

2.1.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

2.2. Méthodes de classification

Classification: Définition formelle

2.2. Méthodes de classification

Classificateurs

2.2. Méthodes de classification

Classification binaire

Classification binaire

2.2. Méthodes de classification

Linear Classificateurs

2.2. Méthodes de classification

Évaluation

Dans le contexte de la classification en apprentissage machine, l'évaluation des performances d'un modèle implique la compréhension de différents types de prédictions qu'il peut faire par rapport à la réalité. Les vrais positifs (VP) et les vrais négatifs (VN) sont deux de ces éléments.

2.2. Méthodes de classification

Évaluation

Les vrais positifs et les vrais négatifs
Précision et rappel

2.2. Méthodes de classification

Évaluation

Soit

2.2. Méthodes de classification

Évaluation

La précision mesure la proportion de prédictions positives faites par le modèle qui étaient effectivement correctes, tandis que le rappel mesure la proportion d'exemples positifs réels qui ont été correctement identifiés par le modèle. Alors

2.2. Méthodes de classification

Évaluation

Le F1-score est la moyenne harmonique de la précision et du rappel. Il fournit une mesure globale de la performance d'un modèle de classification, tenant compte à la fois de la précision et du rappel. Il est particulièrement utile lorsque les classes sont déséquilibrées.

Le F1-score tient compte à la fois des erreurs de type I (faux positifs) et des erreurs de type II (faux négatifs), fournissant ainsi une mesure équilibrée de la performance du modèle.

2.2. Méthodes de classification

Évaluation

2.2. Méthodes de classification

Le \(F_2\)-score est souvent utilisé dans des domaines où le rappel est considéré comme plus critique que la précision.

2.2. Méthodes de classification

Évaluation: matrice de confusion

La matrice de confusion est un outil essentiel dans l'évaluation des performances d'un système de classification. Elle fournit une vue détaillée des prédictions faites par le modèle par rapport aux classes réelles.

2.2. Méthodes de classification

Évaluation: matrice de confusion

Matrice de confusion pour un classificateur SVM pour les chiffres manuscrits (MNIST)

2.2. Méthodes de classification

Évaluation: matrice de confusion

Matrice de confusion pour un perceptron pour les chiffres manuscrits (MNIST)

2.2. Méthodes de classification

Classification multiclasse

Classification multiclasse

2.2. Méthodes de classification

Classification multiclasse [Aly 2005]

2.2. Méthodes de classification

Classification multiclasse

Classification multiclasse

2.2. Méthodes de classification

Classification multiclasse

One-vs.-rest (One-vs.-all) strategy

La strategie un-contre le rest pour la classification multiclasse

2.2. Méthodes de classification

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

La strategie un-contre le rest pour la classification multiclasse

2.2. Méthodes de classification

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

2.2. Méthodes de classification

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

Prendre des décisions signifie appliquer tous les classificateurs à un échantillon invisible x et prédire l'étiquette k pour laquelle le classificateur correspondant rapporte le score de confiance le plus élevé : \[\hat{y} = \underset{k \in \{1 \ldots K\}}{\arg\!\max}\; f_k(x)\]

2.2. Méthodes de classification

Classification multiclasse

One-vs.-one strategy

La strategie un-contre-un pour la classification multiclasse

2.2. Méthodes de classification

Classification multiclasse

One-vs.-one strategy

  • nécessite l'entraînement des \(\frac{K (K - 1)}{2}\) classificateurs binaires
  • chaque classificateur reçoit les échantillons d'une paire de classes du jeu de formation original, et doit apprendre à distinguer ces deux classes.
  • Au moment de la prédiction, un système de vote est appliqué : tous les \(\frac{K (K - 1)}{2}\) classificateurs sont appliqués à un échantillon non vu et la classe qui a obtenu le plus grand nombre de prédictions est prédite par le classificateur combiné.
  • La strategie un-contre-un pour la classification multiclasse

    2.3. Réseaux de neurones artificiels

    Neurones biologiques

    Neurone biologique1
    1. https://en.wikipedia.org/wiki/File:Neuron3.png

    2.3. Réseaux de neurones artificiels

    Introduction

    Réseaux de neurones artificiels

    2.3. Réseaux de neurones artificiels

    Réseau de neurones

    Les réseaux de neurones sont couramment utilisés dans le domaine de l'apprentissage machine, en particulier dans des tâches telles que la classification, la régression, la reconnaissance d'images, le traitement du langage naturel, et bien d'autres. Un réseau de neurones artificiels est une collection d'unités interconnectées appelées neurones artificiels. Ces réseaux sont inspirés de la structure du cerveau biologique

    2.3. Réseaux de neurones artificiels

    Réseau de neurones

    2.3. Réseaux de neurones artificiels

    Les couches

    Les neurones sont organisés en couches. Il existe généralement trois types de couches dans un réseau de neurones :

    2.3. Réseaux de neurones artificiels

    Les couches

    2.3. Réseaux de neurones artificiels

    L'entraînement

    L'objectif global de l'entraînement est d'ajuster les poids du réseau de manière à ce qu'il puisse généraliser à de nouvelles données, produisant des résultats précis pour des exemples qu'il n'a pas vu pendant l'entraînement.

    2.3. Réseaux de neurones artificiels

    L'entraînement

    2.3. Réseaux de neurones artificiels

    Composants des réseaux de neurones artificiels

    2.3. Réseaux de neurones artificiels

    Composants des réseaux de neurones artificiels

    Neurones

    Chaque neurone artificiel a des entrées, qui peuvent être les valeurs caractéristiques d'un échantillon de données externe, et produit une seule sortie. Cette sortie peut être envoyée à plusieurs autres neurones, formant ainsi la structure interconnectée du réseau neuronal. La fonction d'activation joue un rôle crucial dans le calcul de la sortie d'un neurone. Le processus comprend les étapes suivantes :

    2.3. Réseaux de neurones artificiels

    Composants des réseaux de neurones artificiels

    Connexions et poids

    Le réseau de neurones est constitué de connexions, où chaque connexion transmet la sortie d'un neurone comme entrée à un autre neurone. Chaque connexion possède un poids qui représente son importance relative dans la transmission du signal.

    2.3. Réseaux de neurones artificiels

    Composants des réseaux de neurones artificiels

    Fonction de propagation

    Calcul de l'entrée d'un neurone : La fonction de propagation calcule l'entrée d'un neurone en prenant la somme pondérée des sorties de ses prédécesseurs, où chaque sortie est multipliée par le poids de la connexion correspondante. Cela peut être représenté mathématiquement comme suit :

    \[ \text{Entrée du Neurone} = \sum_{i=1}^{n} (\text{Sortie du Prédécesseur}_i \times \text{Poids}_i) \] où \(n\) est le nombre de connexions d'entrée.

    2.3. Réseaux de neurones artificiels

    Composants des réseaux de neurones artificiels

    Fonction de propagation

    Ajout d'un terme de biais : Un terme de biais peut être ajouté au résultat de la propagation. Le terme de biais est un paramètre supplémentaire, souvent représenté par \(b\) dans les équations, qui permet au modèle d'apprendre un décalage ou une translation. Cela donne la forme finale de l'entrée du neurone :

    \[ \text{Entrée du Neurone} = \sum_{i=1}^{n} (\text{Sortie du Prédécesseur}_i \times \text{Poids}_i) + \text{Biais} \]

    2.3. Réseaux de neurones artificiels

    Composants des réseaux de neurones artificiels

    Fonction de propagation

    Fonction d'Activation : Après avoir calculé l'entrée du neurone, celle-ci est passée à travers une fonction d'activation. Cette fonction introduit une non-linéarité dans le modèle, permettant au réseau de neurones de capturer des relations complexes et d'apprendre des modèles non linéaires. Certaines des fonctions d'activation couramment utilisées comprennent :

    2.3. Réseaux de neurones artificiels

    Perceptron

    Le perceptron est un algorithme d'apprentissage supervisé utilisé pour la classification binaire. Il est conçu pour résoudre des problèmes où l'objectif est de déterminer si une entrée donnée appartient ou non à une classe particulière.

    2.3. Réseaux de neurones artificiels

    Perceptron

    Perceptron en mettant à jour sa limite linéaire à mesure que d'autres exemples de formation sont ajoutés.1
    1. Source: https://en.wikipedia.org/wiki/File:Perceptron_example.svg

    2.3. Réseaux de neurones artificiels

    Perceptron

    Perceptron

    2.3. Réseaux de neurones artificiels

    Perceptron: Définition formelle

    2.3. Réseaux de neurones artificiels

    Perceptron: Définition formelle

    2.3. Réseaux de neurones artificiels

    Perceptron : Étapes

    1. Initialiser les poids et les seuils
    2. Pour chaque exemple, \((x_j, d_j)\) dans l'ensemble d'entraînement
      • Calculer la sortie actuelle : \[y_j(t)= f[w(t).x_j]\] \[= f[w_0(t)x_{j,0} + w_1(t)x_{j,1} + w_2(t)x_{j,2} + \dotsb + w_n(t)x_{j,n}]\]
      • Calculer le poids: \[w_i(t + 1) = w_i(t) + r. (d_j-y_j(t))x_{j,i}\]
      \(r\) est le taux d'apprentissage.

    2.3. Réseaux de neurones artificiels

    Perceptron : Étapes

    1. Répétez l'étape 2 jusqu'à l'erreur d'itération \[\frac{1}{s} (Σ |d_j - y_j(t)|)\] est inférieur au seuil spécifié par l'utilisateur \(\gamma\), ou un nombre prédéterminé d'itérations ont été effectuées, où \(s\) est à nouveau la taille de l'ensemble de l'échantillon.

    2.3. Réseaux de neurones artificiels

    Fonction d'Échelon (Step Function)

    Le perceptron utilise généralement une fonction d'activation simple, et la fonction d'échelon (step function) est fréquemment choisie pour cette tâche.

    Définition

    La fonction d'échelon attribue une sortie de 1 si la somme pondérée des entrées dépasse un certain seuil, et 0 sinon.

    \( f(x) = \begin{cases} 1 & \text{si } x \geq \text{seuil} \\ 0 & \text{sinon} \end{cases} \)

    2.3. Réseaux de neurones artificiels

    Fonction d'activation: fonction d'identité

    Équation

    \[f(x)=x\]

    Dérivée

    \[f'(x)=1\]

    Fonction d'identité

    2.3. Réseaux de neurones artificiels

    Fonction d'activation: pas binaire

    Équation

    \[f(x) = \begin{cases} 0 & \text{for } x < 0\\ 1 & \text{for } x \ge 0 \end{cases} \]

    Dérivée

    \[f'(x) = \begin{cases} 0 & \text{for } x \ne 0\\ ? & \text{for } x = 0\end{cases}\]

    Pas binaire

    2.3. Réseaux de neurones artificiels

    Fonction d'activation: fonction sigmoïde

    Équation

    \[f(x)=\sigma(x)=\frac{1}{1+e^{-x}}\]

    Dérivée

    \[f'(x)=f(x)(1-f(x))\]

    La fonction sigmoïde

    2.3. Réseaux de neurones artificiels

    Fonction d'activation: TanH

    Équation

    \[f(x)=\tanh(x)=\frac{(e^{x} - e^{-x})}{(e^{x} + e^{-x})}\]

    Dérivée

    \[f'(x)=1-f(x)^2\]

    TanH

    2.3. Réseaux de neurones artificiels

    Fonction d'activation: Rectified linear unit: ReLU

    Équation

    \[f(x) = \begin{cases} 0 & \text{for } x \le 0\\ x & \text{for } x > 0\end{cases} = \max\{0,x\}= x \textbf{1}_{x>0}\]

    Dérivée

    \[f'(x) = \begin{cases} 0 & \text{for } x \le 0\\ 1 & \text{for } x > 0\end{cases}\]

    Unité linéaire rectifiée (ReLU)

    2.3. Réseaux de neurones artificiels

    Fonction d'activation: Gaussien

    Équation

    \[f(x)=e^{-x^2}\]

    Dérivée

    \[f'(x)=-2xe^{-x^2}\]

    Gaussien

    2.3. Réseaux de neurones artificiels

    Perceptron multiclasse

    2.4. Réseaux de neurones profonds

    Un réseau de neurones profond, également connu sous le nom de réseau de neurones profondément hiérarchisé ou réseau neuronal profond (DNN pour Deep Neural Network en anglais), est un type de réseau de neurones artificiels qui comprend plusieurs couches de traitement, généralement plus de deux. Ces réseaux sont appelés "profonds" en raison de leur architecture empilée de couches, permettant la création de représentations hiérarchiques complexes des données.

    Architecture en couches : Les réseaux de neurones profonds sont composés de multiples couches, généralement divisées en trois types principaux :

    2.4. Réseaux de neurones profonds

    L'entraînement de réseaux de neurones profonds peut nécessiter des volumes importants de données et de puissance de calcul.

    2.4. Réseaux de neurones profonds

    Il existe plusieurs types de réseaux de neurones profonds.

    2.4. Réseaux de neurones profonds

    2.4. Réseaux de neurones profonds

    Références

    Articles de recherche

    Références:

    Web

    1. Google acquiert DNNresearch, spécialisé dans les réseaux de neurones profonds: https://www.lemondeinformatique.fr/actualites/lire-google-acquiert-dnnresearch-specialise-dans-les-reseaux-de-neurones-profonds-52829.html
    2. Pourquoi Microsoft rachète Linkedin: https://www.lemondeinformatique.fr/actualites/lire-pourquoi-microsoft-rachete-linkedin-65136.html
    3. Scikit-learn: http://scikit-learn.org/stable/
    4. Perceptron: https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html

    Références:

    Wikipédia

    Références:

    Wikipédia

    Références:

    Couleurs

    Images