Traitement de données massives

John Samuel
CPE Lyon

Year: 2021-2022
Email: john(dot)samuel(at)cpe(dot)fr

Objectifs

Apprentissage machine
Apprentissage profond
Apprentissage par renforcement
Licences de données, éthique et vie privée

Réseaux de neurones artificiels

Perceptron

Algorithme pour l'apprentissage supervisé des classificateurs binaires
Le classificateur binaire est un classificateur qui décide si une entrée donnée appartient ou non à une classe particulière
Inventé en 1958 par Frank Rosenblatt

Perceptron

Source: https://en.wikipedia.org/wiki/File:Perceptron_example.svg

Perceptron

Perceptron: Définition formelle

Soit \(y = f(z)\) la sortie du perceptron pour un vecteur d'entrée z
Soit \(N\) le nombre d'exemples d'entraînement
Soit X l'espace de saisie des caractéristiques
Soit \({(x_{1}, d_{1}),...,(x_{N}, d_{N})}\) be the N training examples, where
- \(x_i\) est le vecteur caractéristique de i^ème exemple d'entraînement.
- \(d_i\) est la valeur de sortie souhaitée
- \(x_{j,i}\) est la i^ème caractéristique de j^ème exemple d'entraînement.
- \(x_{j,0} = 1\)

Perceptron: Définition formelle

Les poids sont représentés de la manière suivante:
- \(w_i\) est la i^ème value of weight vector.
- \(w_i(t)\) est la i^ème valeur du vecteur de poids à un moment donné t.

Perceptron : Étapes

Initialiser les poids et les seuils
Pour chaque exemple, \((x_j, d_j)\) dans l'ensemble d'entraînement
- Calculer la sortie actuelle : \[y_j(t)= f[w(t).x_j]\] \[= f[w_0(t)x_{j,0} + w_1(t)x_{j,1} + w_2(t)x_{j,2} + \dotsb + w_n(t)x_{j,n}]\]
- Calculer le poids: \[w_i(t + 1) = w_i(t) + r. (d_j-y_j(t))x_{j,i}\]
\(r\) est le taux d'apprentissage.

Perceptron : Étapes

Répétez l'étape 2 jusqu'à l'erreur d'itération \[\frac{1}{s} (Σ |d_j - y_j(t)|)\] est inférieur au seuil spécifié par l'utilisateur \(\gamma\), ou un nombre prédéterminé d'itérations ont été effectuées, où \(s\) est à nouveau la taille de l'ensemble de l'échantillon.

Fonction d'activation: fonction d'identité

Équation

\[f(x)=x\]

Dérivée

\[f'(x)=1\]

Fonction d'activation: pas binaire

Équation

\[f(x) = \begin{cases} 0 & \text{for } x < 0\\ 1 & \text{for } x \ge 0 \end{cases} \]

Dérivée

\[f'(x) = \begin{cases} 0 & \text{for } x \ne 0\\ ? & \text{for } x = 0\end{cases}\]

Neurones biologiques

https://en.wikipedia.org/wiki/File:Neuron3.png

Tensorflow Playground

Source: https://playground.tensorflow.org/

Réseau de neurones artificiels

collection d'unités ou de nœuds connectés, appelés neurones artificiels, qui modèlent vaguement les neurones d'un cerveau biologique.
Chaque connexion, comme les synapses dans un cerveau biologique, peut transmettre un signal aux autres neurones.
Un neurone artificiel qui reçoit un signal le traite ensuite et peut signaler les neurones qui lui sont connectés.
Le "signal" à une connexion est un nombre réel, et la sortie de chaque neurone est calculée par une fonction non linéaire de la somme de ses entrées.
Les neurones et les arêtes (connexions) ont généralement un poids qui s'ajuste au fur et à mesure de l'apprentissage.
Le poids augmente ou diminue la force du signal au niveau d'une connexion.
Les neurones peuvent avoir un seuil tel qu'un signal n'est envoyé que si le signal global franchit ce seuil.

Réseau de neurones artificiels: les couches

Les neurones sont agrégés en couches.
Différentes couches peuvent effectuer des transformations différentes sur leurs entrées.
Les signaux passent de la première couche (la couche d'entrée) à la dernière couche (la couche de sortie), éventuellement après avoir traversé les couches plusieurs fois.

Réseau de neurones artificiels: l'entraînement

Les réseaux neuronaux apprennent (ou sont entraînés) en traitant des exemples.
chaque exemple contient une "entrée" et un "résultat" connus.
Erreur: L'entraînement d'un réseau de neurones à partir d'un exemple donné est généralement effectué en déterminant la différence entre la sortie traitée du réseau (souvent une prédiction) et une sortie cible
Le réseau ajuste ensuite ses associations pondérées en fonction d'une règle d'apprentissage et en utilisant cette valeur d'erreur.
Des ajustements successifs amèneront le réseau de neurones à produire un résultat de plus en plus similaire au résultat cible.

Composants des réseaux de neurones artificiels

Neurones
Connexions et poids
Fonction de propagation

Composants des réseaux de neurones artificiels

Neurones

Chaque neurone artificiel a des entrées et produit une seule sortie qui peut être envoyée à plusieurs autres neurones.
Les entrées peuvent être les valeurs caractéristiques d'un échantillon de données externes
Les sorties des neurones de sortie finale du réseau neuronal accomplissent la tâche
Fonction d'activation
- Pour trouver la sortie du neurone, nous prenons d'abord la somme pondérée de tous les intrants
- Nous ajoutons un terme de biais à cette somme. Cette somme pondérée est parfois appelée l'activation.
- Cette somme est ensuite passée par une fonction d'activation (généralement non linéaire) pour produire le résultat.

Composants des réseaux de neurones artificiels

Connexions et poids

Le réseau est constitué de connexions, chaque connexion fournissant la sortie d'un neurone comme entrée à un autre neurone.
Chaque connexion se voit attribuer un poids qui représente son importance relative
Un neurone donné peut avoir plusieurs connexions d'entrée et de sortie.

Composants des réseaux de neurones artificiels

Fonction de propagation

La fonction de propagation calcule l'entrée d'un neurone à partir des sorties de ses prédécesseurs et de leurs connexions comme une somme pondérée.
Un terme de biais peut être ajouté au résultat de la propagation

Apprentissage profond

Le mot "profond" dans l'apprentissage profond vient de l'utilisation de multiples couches dans le réseau neuronal.
Un perceptron linéaire ne peut pas être un classificateur universel. Un perceptron "monocouche" ne peut pas mettre en œuvre le XOR
Les réseaux d'apprentissage en profondeur permettent un nombre illimité de couches de taille limitée
Il utilise plusieurs couches pour extraire progressivement des caractéristiques de l'entrée brute.

Source: https://en.wikipedia.org/wiki/File:Deep_Learning.jpg

Composants des réseaux de neurones artificiels

Organisation

Les neurones sont généralement organisés en plusieurs couches
Les neurones d'une couche se connectent uniquement aux neurones des couches immédiatement précédente et immédiatement suivante.
La couche qui reçoit les données externes est la couche d'entrée.
La couche qui produit le résultat final est la couche de sortie.
Entre les deux, il y a zéro ou plusieurs couches cachées.

Composants des réseaux de neurones artificiels

Organisation et connectivité

Les couches peuvent être entièrement connectées, chaque neurone d'une couche étant connecté à chaque neurone de la couche suivante.
Les couches peuvent être mis en commun (pooling), c'est-à-dire qu'un groupe de neurones dans une couche se connecte à un seul neurone dans la couche suivante, réduisant ainsi le nombre de neurones dans cette couche

Exemple: Tensorflow

            
           from tensorflow.keras.models import Sequential
           from tensorflow.keras.layers import Dense
           from tensorflow.keras.optimizers import SGD

           # Créer un modèle séquentiel
           model = Sequential()
           model.add(Dense(4, activation='relu', input_shape=(3,)))
           model.add(Dense(units=2, activation='softmax'))

           # Compilation du modèle
           sgd = SGD(lr=0.01)
           model.compile(loss='mean_squared_error',
                optimizer=sgd,metrics=['accuracy'])

Applications

Vision par ordinateur (reconnaissance de formes)
Reconnaissance automatique de la parole
Conception de médicament
Traitement automatique du langage naturel
Traduction automatique

Réseaux de neurones convolutionnels

Convolutional deep neural networks en Anglais
Inspirés par le cortex visuel des animaux

Réseaux de neurones convolutionnels

Réseaux de neurones convolutionnels

Analyse des images
Utilise la convolution, une opération mathématique linéaire
Une couche d'entrée et une couche de sortie
Plusieurs couches cachées, constituées de couches convolutives

Réseaux de neurones convolutionnels

Ils considèrent le modèle hiérarchique des données et assemblent des modèles plus complexes en utilisant des modèles plus petits et plus simples.
Un réseau neuronal convolutif est constitué d'une couche d'entrée et d'une couche de sortie, ainsi que de plusieurs couches cachées.
Les couches cachées d'un CNN consistent généralement en une série de couches convolutionnelles qui se convoluent avec une multiplication
La fonction d'activation est généralement une couche RELU, et est ensuite suivie par des convolutions supplémentaires telles que des couches de regroupement, des couches entièrement connectées et des couches de normalisation

Noyau (traitement d'image)

Identité

\( \begin{matrix} \ \ 0 &\ \ 0 &\ \ 0 \\ \ \ 0 &\ \ 1 &\ \ 0 \\ \ \ 0 &\ \ 0 &\ \ 0 \end{matrix} \)

La détection de contours

\( \begin{matrix} \ \ 1 & 0 & -1 \\ \ \ 0 & 0 & \ \ 0 \\ -1 & 0 & \ \ 1 \end{matrix} \)

Noyau (traitement d'image)

Box blur

\( \frac{1}{9} \begin{matrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \end{matrix} \)

Flou de Gauss 3 × 3

\( \frac{1}{16} \begin{matrix} 1 & 2 & 1 \\ 2 & 4 & 2 \\ 1 & 2 & 1 \end{matrix} \)

Convolution matricielle

\[ \begin{bmatrix} x_{11} & x_{12} & \cdots & x_{1n} \\ x_{21} & x_{22} & \cdots & x_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ x_{m1} & x_{m2} & \cdots & x_{mn} \\ \end{bmatrix} * \begin{bmatrix} y_{11} & y_{12} & \cdots & y_{1n} \\ y_{21} & y_{22} & \cdots & y_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ y_{m1} & y_{m2} & \cdots & y_{mn} \\ \end{bmatrix} = \sum^{m-1}_{i=0} \sum^{n-1}_{j=0} x_{(m-i)(n-j)} y_{(1+i)(1+j)} \]

Max pooling

Exemple: Tensorflow (réseaux de neurones convolutionnels)

            
import tensorflow as tf

from tensorflow.keras import datasets, layers, models

(train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()
train_images, test_images = train_images / 255.0, test_images / 255.0

# Créer un modèle séquentiel (réseaux de neurones convolutionnels)
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

Exemple: Tensorflow (réseaux de neurones convolutionnels)

            
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10)

#Compilation du modèle
model.compile(optimizer='adam',
   loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
   metrics=['accuracy'])

history = model.fit(train_images, train_labels, epochs=10,
   validation_data=(test_images, test_labels))

Exemple: Tensorflow (réseaux de neurones convolutionnels)

Modèle: https://www.tensorflow.org/tutorials/images/cnn

Apprentissage par renforcement

Reinforcement learning (en Anglais)
Inspirée de théories de psychologie animale
Un agent autonome plongé au sein d'un environnement,
L'agent doit prendre des décisions en fonction de son état courant.
L'environnement procure à l'agent une récompense, qui peut être positive ou négative.
L'objectif est de maximiser la somme des récompenses au cours du temps.

Licences, Ethiques et la vie privé

Droits d'utilisation des données
Confidentiality and Privacy
Ethiques

Vie privée [Rizvi 2002][Xu 2014]

Licences, Ethiques et la vie privé [van Wel 2004]

Droits d'utilisation des données
Confidentialité et la vie privée
Ethiques

Ethiques [Zwitter 2014]

la responsabilité morale individuelle
Les défis éthiques des Big Data
- Vie privée
- Vie privée du groupe
- Propension (la "police prédictive")
- L'éthique de la recherche

Ethiques [Richards 2014]

La "vie privée" comme règles d'information
Les informations privées partagées peuvent rester "confidentielles".
Reconnaître que les grandes données exigent de la transparence
Reconnaître que les grandes données peuvent compromettre l'identité

Données ouvertes liées (Linked Open data: LOD)

Traitement de données massives

1. Apprentissage machine

Objectifs

1. Apprentissage machine

Réseaux de neurones artificiels

1. Apprentissage machine

Perceptron

1. Apprentissage machine

Perceptron

1. Apprentissage machine

Perceptron

1. Apprentissage machine

Perceptron: Définition formelle

1. Apprentissage machine

Perceptron: Définition formelle

1. Apprentissage machine

Perceptron : Étapes

1. Apprentissage machine

Perceptron : Étapes

1. Apprentissage machine

Fonction d'activation: fonction d'identité

Équation

Dérivée

1. Apprentissage machine

Fonction d'activation: pas binaire

Équation

Dérivée

1. Apprentissage machine

Neurones biologiques

1. Apprentissage machine

Tensorflow Playground

1. Apprentissage machine

Réseau de neurones artificiels

1. Apprentissage machine

Réseau de neurones artificiels: les couches

1. Apprentissage machine

Réseau de neurones artificiels: l'entraînement

1. Apprentissage machine

Composants des réseaux de neurones artificiels

1. Apprentissage machine

Composants des réseaux de neurones artificiels

Neurones

1. Apprentissage machine

Composants des réseaux de neurones artificiels

Connexions et poids

1. Apprentissage machine

Composants des réseaux de neurones artificiels

Fonction de propagation

2. Apprentissage profond

Apprentissage profond

2. Apprentissage profond

2. Apprentissage profond

Composants des réseaux de neurones artificiels

Organisation

2. Apprentissage profond

Composants des réseaux de neurones artificiels

Organisation et connectivité

2. Apprentissage profond

Exemple: Tensorflow

2. Apprentissage profond

Applications

2. Apprentissage profond

Réseaux de neurones convolutionnels

2. Apprentissage profond

Réseaux de neurones convolutionnels

2. Apprentissage profond

Réseaux de neurones convolutionnels

2. Apprentissage profond

Réseaux de neurones convolutionnels

2. Apprentissage profond

Noyau (traitement d'image)

Identité

La détection de contours

2. Apprentissage profond

Noyau (traitement d'image)

Box blur

Flou de Gauss 3 × 3

2. Apprentissage profond

Convolution matricielle

1. Apprentissage profond