Intelligence artificielle et Deep Learning

Sujets supplémentaires

John Samuel
CPE Lyon

Année: 2024-2025
Courriel: john.samuel@cpe.fr

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

La méthode d'apprentissage profond
Les fusions et acquisitions d'entreprises
- DNNresearch par Google en 2013 [1] : vision par ordinateur.
- LinkedIn par Microsoft en 2016 [2] : réseaux sociaux professionnels.
Les chatbots
- Xiaobing par Microsoft: « comprendre » et répondre aux questions des utilisateurs en langage naturel.
Les programmes de jeux
- AlphaGo par Google : victoire historique contre le champion du jeu de go Lee Sedol en 2016.
L'utilisation dans les hôpitaux
- Watson par IBM : une plateforme d'IA qui a été utilisée dans le domaine de la santé pour aider les professionnels de la santé à analyser et à interpréter des données médicales complexes.
La compréhension du langage naturel
- Baidu : moteur de recherche.

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

1956: la definition d'IA
- La capacité des machines à comprendre, à penser et à apprendre d'une manière similaire à celle des êtres humains
- Proposée par J. McCarthy, M. L. Minsky, H. Simon, A. Newell, C. E. Shannon, N. Rochester,...
1970-2000
- 1983: le rapport par James Lighthill : un rapport critiquant la recherche en IA au Royaume-Uni, ce qui a conduit à un ralentissement temporaire des financements publics pour l'IA, connu sous le nom de « l'effet Lighthill ».
- 1982-1992: l'échec du développement d'un ordinateur intelligent par le Japon
- 1984: la construction manuelle d'une encyclopédie de la connaissance (Cyc) par Douglas Lenat à l'Université Stanford. Cyc est un projet d'IA visant à créer une base de connaissances informatisée capable de raisonner et de répondre à des questions complexes.

Intelligence Artificielle 2.0 [Pan 2016, Jaakkola 2019]

1990s-présent
- Popularité de l'Internet
- l'utilisation des capteurs
- Big Data
- l'e-commerce
Des demandes sociales pour IA
- des villes intelligentes
- médecine
- transport
- les automobiles sans conducteur
- les smartphones

Intelligence Artificielle 2.0 [Pan 2016]

Les technologies à l'origine de l'IA
- L'IA basée sur des données massives (Big Data)
- L'intelligence de la foule sur Internet
- Le savoir médiatique croisé
- L'intelligence hybride homme-machine
- Systèmes autonomes et intelligents
L'avenir
- L'IA explicative et générique
- la cognition, l'apprentissage et l'inférence trans-médiatiques.
- l'intelligence communautaire à partir de l'intelligence des foules basée sur l'intelligence individuelle
- des systèmes autonomes et intelligents pour le développement de machines et de produits intelligents.

L'apprentissage machine, également connu sous le nom de machine learning (ML), est un domaine de l'intelligence artificielle (IA) qui se concentre sur le développement de techniques permettant aux ordinateurs d'apprendre à partir de données. L'objectif principal de l'apprentissage machine est de permettre aux systèmes informatiques de prendre des décisions ou de réaliser des tâches sans être explicitement programmés, en s'appuyant sur des modèles et des motifs appris à partir des données.

Principes fondamentaux de l'apprentissage machine

Données d'entraînement : L'apprentissage machine commence par des données. Ces données, appelées données d'entraînement, sont utilisées pour enseigner au modèle les modèles et les relations dans lesquels il doit identifier.
Modèles : Les modèles en apprentissage machine sont des représentations mathématiques qui capturent les relations entre les différentes caractéristiques des données. Ces modèles sont entraînés à partir des données d'entraînement et sont capables de généraliser pour faire des prédictions sur de nouvelles données non vues.

Principes fondamentaux de l'apprentissage machine

Entraînement et apprentissage : L'entraînement d'un modèle implique de l'exposer aux données d'entraînement, lui permettant d'ajuster ses paramètres pour minimiser les erreurs de prédiction. L'apprentissage se produit lorsque le modèle améliore sa capacité à faire des prédictions précises.
Validation et test : Après l'entraînement, le modèle est évalué sur des données de validation et de test pour s'assurer qu'il généralise bien aux données non vues. Cela aide à éviter le surajustement, où le modèle apprend trop spécifiquement les données d'entraînement et ne peut pas généraliser correctement.

L'apprentissage machine occupe une place centrale dans le paysage technologique actuel et a un impact significatif dans divers domaines.

Intelligence Artificielle (IA) : L'apprentissage machine est une composante essentielle de l'intelligence artificielle. Il permet aux systèmes informatiques de tirer des conclusions, d'apprendre à partir d'expériences passées et d'améliorer leur performance sans être explicitement programmés.
Informatique et Technologie : L'apprentissage machine est largement utilisé dans les applications technologiques, y compris la vision par ordinateur, la reconnaissance vocale, la traduction automatique, les chatbots, et diverses autres applications qui exploitent la capacité des modèles à apprendre des données.
Santé : Dans le domaine de la santé, l'apprentissage machine est utilisé pour la prédiction de maladies, l'analyse d'images médicales, la personnalisation des traitements, la découverte de médicaments, et la gestion des dossiers médicaux électroniques.
Finance : Les institutions financières utilisent l'apprentissage machine pour la détection de fraudes, la prévision de tendances du marché, l'analyse de crédit, et l'optimisation des portefeuilles d'investissement.
Industrie : Dans le secteur industriel, l'apprentissage machine est appliqué à la maintenance prédictive, à l'optimisation de la chaîne d'approvisionnement, à la qualité de production, et à la robotique.

Approches

Apprentissage supervisé : Le modèle est entraîné sur un ensemble de données étiquetées où les exemples d'entrée sont associés à des sorties désirées. Le modèle apprend à faire des prédictions sur de nouvelles données en se basant sur ces associations.
Apprentissage non supervisé : Le modèle est exposé à des données non étiquetées et cherche à découvrir des modèles, des structures ou des relations intrinsèques dans les données.
Apprentissage semi-supervisé : Une combinaison des deux précédents, utilisant à la fois des données étiquetées et non étiquetées pour l'entraînement.
Apprentissage par renforcement : Le modèle apprend à prendre des décisions en interagissant avec son environnement. Il reçoit des récompenses ou des pénalités en fonction de ses actions, ce qui guide son apprentissage.

Formalisation

Vecteur euclidien:
- Un vecteur euclidien est un objet géométrique caractérisé par sa magnitude (longueur) et sa direction.
- Les vecteurs euclidiens sont couramment utilisés pour représenter des données sous forme de points dans un espace multidimensionnel, où chaque dimension correspond à une caractéristique ou une variable.
Espace vectoriel:
- Un espace vectoriel est une collection de vecteurs qui peuvent être additionnés entre eux et multipliés par des nombres (scalaires).
Vecteur de caractéristiques (features):
- Un vecteur de caractéristiques est un vecteur n-dimensionnel qui représente les caractéristiques ou les attributs d'une entité.
Espace de caractéristiques:
- L'espace de caractéristiques est l'espace vectoriel associé aux vecteurs de caractéristiques.
- Chaque dimension de cet espace représente une caractéristique particulière, et les vecteurs sont utilisés pour positionner les données dans cet espace en fonction de leurs caractéristiques.

Exemples de caractéristiques

Images: Dans le contexte des images, les vecteurs de caractéristiques peuvent être construits à partir des valeurs des pixels. Chaque pixel peut être considéré comme une dimension, et un vecteur de caractéristiques contiendra les valeurs de tous les pixels, permettant ainsi de représenter une image sous forme de vecteur.
Textes: Pour les textes, les vecteurs de caractéristiques sont souvent construits à partir de la fréquence d'apparition des mots, des phrases, ou des tokens dans un document. Cela permet de représenter le contenu textuel en utilisant des valeurs numériques, ce qui est essentiel pour l'analyse de texte et la recherche d'informations.

Formalisation

Construction de caractéristiques¹:
- La construction de caractéristiques consiste à créer de nouvelles variables ou attributs à partir de celles déjà présentes dans les données.
- Cette étape peut être cruciale pour améliorer les performances des modèles d'apprentissage machine en introduisant des informations pertinentes et en éliminant du bruit.
Opérateurs de construction pour les caractéristiques
- Les opérateurs de construction sont des fonctions ou des opérations mathématiques qui permettent de créer de nouvelles caractéristiques à partir de celles existantes.
- Parmi les opérateurs couramment utilisés, on trouve les opérateurs d'égalité (comparaisons), les opérateurs arithmétiques (addition, soustraction, multiplication, division), les opérateurs de tableau (min, max, moyenne, médiane, etc.), les fonctions de transformation, etc.

https://en.wikipedia.org/wiki/Feature_vector

Exemple

Soit Année de naissance et Année de décès deux caractéristiques existantes.
Une nouvelle caractéristique appelée âge est créée. âge = Année de décès - Année de naissance

La construction de caractéristiques est une étape essentielle dans le pipeline de prétraitement des données en apprentissage machine, car elle peut aider à rendre les données plus informatives pour les algorithmes d'apprentissage.

Formalisation: Apprentissage supervisé

Le nombre d'exemples d'entraînement (N) : Cela représente la quantité d'exemples de données que vous avez pour entraîner un modèle supervisé. Chaque exemple d'entraînement se compose d'un vecteur de caractéristiques (x) et de son label (y).
L'espace de saisie des caractéristiques (X) : C'est l'ensemble de toutes les combinaisons possibles de vecteurs de caractéristiques qui peuvent être utilisées comme entrée pour le modèle. Cet espace est défini par les caractéristiques que vous avez extraites des données.
L'espace des caractéristiques de sortie (Y) : Il représente l'ensemble de toutes les valeurs possibles que peuvent prendre les étiquettes ou les labels.
Exemples d'entraînement (D) : C'est votre ensemble de données d'entraînement, composé de paires (x, y) où x est le vecteur de caractéristiques et y est le label correspondant.

Formalisation: Apprentissage supervisé

Objectif de l'algorithme d'apprentissage supervisé : Il s'agit de trouver une fonction (g) qui associe un vecteur de caractéristiques (x) à un label (y). L'ensemble des fonctions possibles est appelé espace des hypothèses (G). L'objectif est de choisir la fonction (g) qui minimise l'erreur de prédiction sur les exemples d'entraînement et généralise bien sur de nouvelles données.
Fonction d'évaluation (F) : Elle indique l'espace des fonctions d'évaluation utilisées pour évaluer la performance des fonctions hypothétiques. L'objectif est de trouver la fonction (g) qui renvoie la fonction d'évaluation (f) la plus élevée, c'est-à-dire celle qui donne les prédictions les plus précises.

Formalisation: Apprentissage supervisé

Cette formalisation est au cœur de l'apprentissage supervisé, où l'objectif est d'apprendre à partir d'exemples étiquetés et de trouver une fonction qui puisse prédire de manière précise les étiquettes pour de nouvelles données non vues.

Soit \(N\) le nombre d'exemples d'entraînement
Soit \(X\) l'espace de saisie des caractéristiques
Soit \(Y\) l'espace des caractéristiques de sortie (des étiquettes)
Soit \({(x_1, y_1),...,(x_N, y_N)}\) les \(N\) exemples d'entraînement, où
- \(x_i\) est le vecteur de caractéristiques de i^ème exemple d'entraînement.
- \(y_i\) est son label.

Formalisation: Apprentissage supervisé

L'objectif de l'algorithme d'apprentissage supervisé est de trouver \(g: X → Y\), où
- g est l'une des fonctions de l'ensemble des fonctions possibles G (espace des hypothèses)
Fonction d'évaluation F indiquent l'espace des fonctions d'évaluation, où
- \(f: X × Y → R\) telle que g renvoie la fonction d'évaluation la plus élevée.

Formalisation: Apprentissage non supervisé

L'espace de saisie des caractéristiques (X) : C'est l'ensemble de toutes les combinaisons possibles de vecteurs de caractéristiques qui peuvent être utilisées comme entrée pour le modèle en apprentissage non supervisé. Cet espace est défini par les caractéristiques que vous avez extraites des données.
L'espace des caractéristiques de sortie (Y) : Il représente l'ensemble des caractéristiques de sortie potentielles. Contrairement à l'apprentissage supervisé, en apprentissage non supervisé, Y ne consiste pas en des étiquettes ou des labels prédéfinis, mais plutôt en des transformations, des représentations, ou des caractéristiques extraites des données d'entrée.
Objectif de l'algorithme d'apprentissage non supervisé : L'objectif est de trouver une correspondance entre l'espace de saisie des caractéristiques (X) et l'espace des caractéristiques de sortie (Y). Cela peut impliquer diverses tâches, telles que la réduction de la dimensionnalité, la classification automatique de données non étiquetées, la détection d'anomalies, la segmentation, ou la représentation latente des données.
Mise en correspondance X → Y : Cette mise en correspondance peut être réalisée de différentes manières, selon la tâche d'apprentissage non supervisé spécifique. Par exemple, dans la réduction de la dimensionnalité, X peut être une représentation à haute dimension des données, tandis que Y représente la version réduite de ces données, souvent avec moins de dimensions.

Formalisation: Apprentissage non supervisé

Soit \(X\) l'espace de saisie des caractéristiques
Soit \(Y\) l'espace des caractéristiques de sortie (des étiquettes)
L'objectif de l'algorithme d'apprentissage non supervisé est
- trouver la mise en correspondance \(X → Y\)

L'apprentissage non supervisé est utilisé pour explorer et découvrir des modèles, des structures ou des caractéristiques inhérentes aux données, sans l'utilisation d'étiquettes ou de labels préalables. Il est couramment utilisé dans des domaines tels que la clustering, l'analyse de composantes principales (PCA), l'analyse en composantes indépendantes (ICA), et bien d'autres.

Formalisation: Apprentissage semi-supervisé

L'espace de saisie des caractéristiques (X) : Il s'agit de l'ensemble de toutes les combinaisons possibles de vecteurs de caractéristiques qui peuvent être utilisés comme entrée pour le modèle en apprentissage semi-supervisé.
L'espace des caractéristiques de sortie (Y) : Il représente l'ensemble des caractéristiques de sortie potentielles, mais contrairement à l'apprentissage supervisé, il n'est pas nécessairement constitué d'étiquettes ou de labels prédéfinis.
Ensemble d'exemples d'exercices étiquetés (l) : Cela correspond à un sous-ensemble d'exemples qui ont été annotés ou étiquetés avec des valeurs de sortie connues.
Ensembles des vecteurs de caractéristiques non étiquetées (u) : Il s'agit des exemples non étiquetés, où les valeurs de sortie ne sont pas connues.

Formalisation: Apprentissage semi-supervisé

Objectif de l'algorithme d'apprentissage semi-supervisé : L'objectif principal est de trouver des étiquettes correctes pour les exemples non étiquetés (apprentissage transductif), ainsi que de trouver la bonne mise en correspondance entre les caractéristiques d'entrée et les caractéristiques de sortie (apprentissage inductif).
- Apprentissage transductif : Il s'agit de trouver des étiquettes correctes pour les exemples non étiquetés. Cela revient à prédire les valeurs de sortie pour les exemples non étiquetés sans nécessairement chercher à généraliser à de nouvelles données.
- Apprentissage inductif : Cela concerne la recherche de la bonne mise en correspondance entre les vecteurs de caractéristiques d'entrée et les caractéristiques de sortie. Cela peut inclure la généralisation à de nouvelles données en utilisant le modèle appris.

Formalisation: Apprentissage semi-supervisé

Soit \(X\) l'espace de saisie des caractéristiques
Soit \(Y\) l'espace des caractéristiques de sortie (des étiquettes)
Soit \({(x_1, y_1),...,(x_l, y_l)}\) l'ensemble d'exemples d'exercices étiquetés
Soit \({x_{l+1},...,x_{l+u}}\) sont les \(u\) ensembles des vecteurs de caractéristiques non étiquetées de \(X\).
L'objectif de l'algorithme d'apprentissage semi-supervisé est de faire
- l'apprentissage transductif, c'est-à-dire trouver des étiquettes correctes pour \({x_{l+1},...,x_{l+u}}\).
- l'apprentissage inductif, c'est-à-dire trouver la bonne mise en correspondance \(X → Y\)

Classification: Définition formelle

Soit \(X\) l'espace de saisie des caractéristiques
Soit \(Y\) l'espace des caractéristiques de sortie (des étiquettes)
L'objectif de l'algorithme de classification (ou classificateur) est de trouver \({(x_1, y_1),...,(x_l, y_k)}\), c'est-à-dire l'attribution d'une étiquette connue à chaque vecteur de caractéristique d'entrée, où
- \(x_i ∈ X \)
- \(y_i ∈ Y \)
- \(|X| = l \)
- \(|Y| = k \)
- \(l >= k\)

Classificateurs

Algorithme de classification
Deux types de classificateurs:
- Classificateurs binaires attribue un objet à l'une des deux classes
- Classificateurs multiclasses attribue un objet à une ou plusieurs classes

Classification binaire

Linear Classificateurs

Fonction linéaire attribuant un score à chaque catégorie possible en combinant le vecteur de caractéristiques d'une instance avec un vecteur de poids, en utilisant un produit de points.
Formalisation :
- Soit X être l'espace de saisie des caractéristiques et x_i ∈ X
- Soit β_k un vecteur de poids pour la catégorie k
- score(x_i, k) = x_i.β_k, score pour l'attribution de la catégorie k à l'instance x_i. La catégorie qui donne le score le plus élevé est attribuée à la catégorie de l'instance.

Évaluation

Dans le contexte de la classification en apprentissage machine, l'évaluation des performances d'un modèle implique la compréhension de différents types de prédictions qu'il peut faire par rapport à la réalité. Les vrais positifs (VP) et les vrais négatifs (VN) sont deux de ces éléments.

Vrais Positifs (VP/TP) : Les vrais positifs représentent les cas où le modèle prédit correctement la classe positive. En d'autres termes, il a correctement identifié les exemples qui appartiennent réellement à la classe que le modèle essaie de prédire.
Vrais Négatifs (VN/FN) : Les vrais négatifs représentent les cas où le modèle prédit correctement la classe négative. Cela signifie qu'il a correctement identifié les exemples qui n'appartiennent pas à la classe que le modèle essaie de prédire.

Évaluation

Les vrais positifs et les vrais négatifs

Évaluation

Soit

tp: nombre de vrais postifs
fp: nombre de faux positifs
fn: nombre de faux négatifs

Évaluation

La précision mesure la proportion de prédictions positives faites par le modèle qui étaient effectivement correctes, tandis que le rappel mesure la proportion d'exemples positifs réels qui ont été correctement identifiés par le modèle. Alors

Précision \[p = \frac{tp}{(tp + fp)}\]
Rappel (Recall) \[r = \frac{tp}{(tp + fn)}\]

Évaluation

Le F1-score est la moyenne harmonique de la précision et du rappel. Il fournit une mesure globale de la performance d'un modèle de classification, tenant compte à la fois de la précision et du rappel. Il est particulièrement utile lorsque les classes sont déséquilibrées.

F1-score \[f1 = 2 * \frac{(p * r)}{(p + r)}\]
F1-score: meilleure valeur à 1 (précision et rappel parfaits) et pire à 0.

Le F1-score tient compte à la fois des erreurs de type I (faux positifs) et des erreurs de type II (faux négatifs), fournissant ainsi une mesure équilibrée de la performance du modèle.

Évaluation

\(F_\beta\)-score utilise un facteur réel positif β, où β est choisi de telle sorte que le rappel est considéré comme β fois plus important que la précision, est :
\(F_\beta\)-score \[F_\beta = (1 + \beta^2) \cdot \frac{\mathrm{p} \cdot \mathrm{r}}{(\beta^2 \cdot \mathrm{p}) + \mathrm{r}}\]
Exemple: \(F_2\) score: Cette métrique est souvent utilisée dans des situations où le rappel est jugé plus critique que la précision, par exemple, dans des tâches où la détection des exemples positifs est particulièrement importante, même si cela entraîne un nombre plus élevé de faux positifs.

Le \(F_2\)-score est souvent utilisé dans des domaines où le rappel est considéré comme plus critique que la précision.

Détection de Maladies : Dans le domaine médical, en particulier pour la détection de maladies graves, le F2-score peut être utilisé pour évaluer la performance des modèles. Il est crucial d'identifier correctement autant de cas positifs que possible, même si cela conduit à quelques faux positifs.
Sécurité et Détection d'Intrusion : Lors de la détection d'intrusions dans les systèmes informatiques, il est souvent plus important de minimiser les faux négatifs (intrusions manquées) au profit de quelques faux positifs, d'où l'utilisation du F2-score.
Recherche Biomédicale : Dans des domaines de recherche biomédicale où la découverte de certaines caractéristiques ou protéines spécifiques est critique, le F2-score peut être privilégié pour s'assurer que ces éléments sont correctement identifiés.
Prévision de Catastrophes Naturelles : Lors de la prévision de catastrophes naturelles comme les tremblements de terre ou les tsunamis, il est essentiel de minimiser les faux négatifs pour garantir que le maximum d'avertissements est donné, même au prix de quelques alertes erronées.
Recherche en Astronomie : Dans la recherche astronomique, la découverte de nouveaux objets célestes ou de phénomènes rares peut être cruciale. Le F2-score peut être utilisé pour évaluer les performances des algorithmes de détection.

Évaluation: matrice de confusion

La matrice de confusion est un outil essentiel dans l'évaluation des performances d'un système de classification. Elle fournit une vue détaillée des prédictions faites par le modèle par rapport aux classes réelles.

Chaque ligne de la matrice représente les instances d'une classe prédite.
Chaque colonne représente les instances d'une classe réelle.
Toutes les prédictions correctes sont situées dans la diagonale du tableau.
Les erreurs de prédiction sont représentées par des valeurs situées en dehors de la diagonale principale.

Évaluation: matrice de confusion

Matrice de confusion pour un classificateur SVM pour les chiffres manuscrits (MNIST)

Évaluation: matrice de confusion

Matrice de confusion pour un perceptron pour les chiffres manuscrits (MNIST)

Classification multiclasse

Classification multiclasse [Aly 2005]

Transformation en classification binaire
- L'approche un contre le reste (Un contre tous)
- L'approche un-contre-un
Extension de la classification binaire
- Réseaux de neurones
- k-voisins les plus proches
la classification hiérarchique.

Classification multiclasse

One-vs.-rest (One-vs.-all) strategy

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

Entraîner un seul classificateur par classe, avec les échantillons de cette classe comme échantillons positifs et tous les autres comme négatifs.
Chaque classificateur produit un score de confiance réel pour sa décision

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

Entrées :
- \(L\), un apprenant (algorithme d'entraînement pour les classificateurs binaires)
- échantillons \(X\)
- étiquettes \(y\), où \(y_i ∈ \{1,..,K \} \) est l'étiquette de l'échantillon \(X_i\)
Sortie :
- une liste de classificateurs \(f_k\), où \(k ∈ \{1,..,K \} \)

Classification multiclasse

One-vs.-rest or One-vs.-all (OvR, OvA) strategy

Prendre des décisions signifie appliquer tous les classificateurs à un échantillon invisible x et prédire l'étiquette k pour laquelle le classificateur correspondant rapporte le score de confiance le plus élevé : \[\hat{y} = \underset{k \in \{1 \ldots K\}}{\arg\!\max}\; f_k(x)\]

Classification multiclasse

One-vs.-one strategy

Classification multiclasse

One-vs.-one strategy

nécessite l'entraînement des \(\frac{K (K - 1)}{2}\) classificateurs binaires

chaque classificateur reçoit les échantillons d'une paire de classes du jeu de formation original, et doit apprendre à distinguer ces deux classes.

Au moment de la prédiction, un système de vote est appliqué : tous les \(\frac{K (K - 1)}{2}\) classificateurs sont appliqués à un échantillon non vu et la classe qui a obtenu le plus grand nombre de prédictions est prédite par le classificateur combiné.

Articles de recherche

[Aly 2005] Aly, Mohamed. Survey on Multiclass Classification Methods. 2005.
[Jaakkola 2019] Jaakkola, H., et al. “Artificial Intelligence Yesterday, Today and Tomorrow.” 2019 42nd International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO), 2019, pp. 860–67. IEEE Xplore
[Pan 2016] Pan, Yunhe, “Heading toward Artificial Intelligence 2.0.” Engineering, vol. 2, no. 4, Dec. 2016, pp. 409–13. www.sciencedirect.com,

Web

Google acquiert DNNresearch, spécialisé dans les réseaux de neurones profonds: https://www.lemondeinformatique.fr/actualites/lire-google-acquiert-dnnresearch-specialise-dans-les-reseaux-de-neurones-profonds-52829.html
Pourquoi Microsoft rachète Linkedin: https://www.lemondeinformatique.fr/actualites/lire-pourquoi-microsoft-rachete-linkedin-65136.html
Scikit-learn: http://scikit-learn.org/stable/
Perceptron: https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html

Wikipédia

Perceptron: https://en.wikipedia.org/wiki/Perceptron
Multiclass Classification: https://en.wikipedia.org/wiki/Multiclass_classification
Multilayer Perceptron: https://en.wikipedia.org/wiki/Multilayer_perceptron
Feedforward Neural Network: https://en.wikipedia.org/wiki/Feedforward_neural_network
Recurrent Neural Network: https://en.wikipedia.org/wiki/Recurrent_neural_network
Long Short-Term Memory: https://en.wikipedia.org/wiki/Long_short-term_memory
Activation Function: https://en.wikipedia.org/wiki/Activation_function
Logique et Raisonnement Mathématique: https://fr.wikipedia.org/wiki/Logique_et_raisonnement_math%C3%A9matique
Représentation des Connaissances: https://fr.wikipedia.org/wiki/Repr%C3%A9sentation_des_connaissances

Wikipédia

Agent Intelligent: https://fr.wikipedia.org/wiki/Agent_intelligent
Calcul des Propositions: https://fr.wikipedia.org/wiki/Calcul_des_propositions
Calcul des Prédicats: https://fr.wikipedia.org/wiki/Calcul_des_pr%C3%A9dicats
Logique Modale: https://fr.wikipedia.org/wiki/Logique_modale
Raisonnement Automatisé: https://fr.wikipedia.org/wiki/Raisonnement_automatis%C3%A9
Connaissance: https://fr.wikipedia.org/wiki/Connaissance
Gestion des connaissances: https://fr.wikipedia.org/wiki/Gestion_des_connaissances

Couleurs

Color Tool - Material Design

Images

Wikimedia Commons

Intelligence artificielle et Deep Learning

Sujets supplémentaires

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle [Pan 2016, Jaakkola 2019]

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle 2.0 [Pan 2016, Jaakkola 2019]

A.1. Histoire scientifique: Intelligence Artificielle

Intelligence Artificielle 2.0 [Pan 2016]

A.2. Introduction à l'apprentissage machine

Principes fondamentaux de l'apprentissage machine

A.2. Introduction à l'apprentissage machine

Principes fondamentaux de l'apprentissage machine

A.2.1. Positionnement de l'apprentissage machine

A.2.2. Approches de l'apprentissage machine

Approches

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation

A.2.3. Formalisation des problèmes d'apprentissage

Exemples de caractéristiques

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation

A.2.3. Formalisation des problèmes d'apprentissage

Exemple

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage non supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage non supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

A.2.3. Formalisation des problèmes d'apprentissage

Formalisation: Apprentissage semi-supervisé

A.3. Méthodes de classification

Classification: Définition formelle

A.3. Méthodes de classification

Classificateurs

A.3. Méthodes de classification

Classification binaire

A.3. Méthodes de classification

Linear Classificateurs

A.3. Méthodes de classification

Évaluation

A.3. Méthodes de classification

Évaluation

A.3. Méthodes de classification

Évaluation

A.3. Méthodes de classification

Évaluation

A.3. Méthodes de classification

Évaluation

A.3. Méthodes de classification

Évaluation

A.3. Méthodes de classification

A.3. Méthodes de classification

Évaluation: matrice de confusion

A.3. Méthodes de classification

Évaluation: matrice de confusion

A.3. Méthodes de classification

Évaluation: matrice de confusion

A.3. Méthodes de classification

Classification multiclasse

A.3. Méthodes de classification

Classification multiclasse [Aly 2005]

A.3. Méthodes de classification

Classification multiclasse

A.3. Méthodes de classification

Classification multiclasse

One-vs.-rest (One-vs.-all) strategy

A.3. Méthodes de classification