Creative Commons License

Questions: première session

Question 1.a

Quelles sont les différentes façons d’obtenir des données afin d’en faire l’analyse? (1 point)

Question 1.b

Les enquêtes en ligne sont actuellement utilisées pour récupérer les avis sur des projets et des produits. Néanmoins, nous trouvons encore des gens dans les supermarchés posant des questions ainsi que des enquêtes porte à porte. Pourquoi, à votre avis, ces enquêtes face à face sont toujours utilisées? (1 point)

Question 2.a

Quelles sont les contraintes ACID? Quelles contraintes sont assouplies par les bases de données NoSQL et pourquoi? (1 point)

Question 2.b

Quels sont les différents types de base de données NoSQL? Décrivez-les brièvement. (1 point)

Question 3

Qu’est-ce que la visualisation de données? Pourquoi les diverses méthodes de visualisation sont importantes ? Expliquez en donnant des exemples. (1 point)

Question 4

Quels sont les différents objectifs du Data Mining (Exploration de données). (1 point)

Question 5.a

Qu’est-ce-que un classificateur? Quels sont les différents types de classificateurs? (1 point)

Question 5.b

Comment pouvons-nous comparer et évaluer l’efficacité des classificateurs? (1 point)

Question 5.c

Quelles sont les différentes méthodes de partitionnement de données que vous avez vues pendant vos travaux pratiques ? Quelles sont leurs avantages et limites? (1 point)

Question 6

Considérons un fichier CSV contenant les colonnes suivantes : photoId, ville, année et nombredevues. Ce fichier contient les informations détaillées sur les photos d’un site web de photographie : photoId : l’identifiant unique de photo, ville : nom de la ville où l’image a été pris, année : l’année à laquelle l’image a été prise et nombredevues : le nombre de vues sur le site web. Votre objectif est de coder en Python (utilisation de la bibliothèque pandas préférable) un programme qui peut lire ce fichier CSV et calcule les valeurs suivantes :

  1. La photo la plus vue et la moins vue
  2. La ville dans laquelle le plus grand nombre et le plus petit nombre de photos ont été prises
  3. L’année pendant laquelle le plus grand nombre de photos a été pris
  4. Pour chaque ville, le nombre de vues moyenne sur l’année 2018.

(2.5 points)

Question 7.a

Qu’est-ce qu’un réseau de neurones artificiel? (1 point)

Question 7.b

Pourquoi, à votre avis, l’apprentissage par renforcement est pertinent pour la navigation intérieure ou extérieure des robots? (1 point)

Question 8

Un site web d’annotation a demandé à 10 utilisateurs de décrire une image en utilisant 5 hashtag (mot-diès). Vous trouverez ci-dessous une table détaillant les choix de hashtags des 10 utilisateurs. La table contient 5 colonnes et 10 lignes. Chaque ligne correspond à un utilisateur. Chaque colonne correspond à un hashtag; les valeurs dans la colonne contiennent soit 0 soit 1. Si la valeur est égale à 0, l’utilisateur n’a pas choisi ce hashtag, sinon la valeur est 1. Votre objectif est de trouver toutes les règles d’association dans cette table. Que pensez-vous de cette image. (1.5 points)

Utilisateur #Architecture #Nature #Paris #StreetArt #Fractals
U110010
U211111
U310010
U411111
U501001
U601110
U700000
U800000
U901111
U1010010