Données ouvertes liées (Linked Open Data)

PSM

John Samuel
CPE Lyon

Année: 2025-2026
Courriel: john.samuel@cpe.fr

Creative Commons License

Wikidata

Linked Open Data

Le Linked Open Data (LOD) est une approche visant à connecter des ensembles de données hétérogènes de manière ouverte, interopérable et interconnectée. Cette approche facilite la découverte, le partage et la réutilisation de l’information à l’échelle du Web.

Principes Clés

  • Identifiants Uniques (URIs) : Chaque ressource est identifiée de manière unique grâce à une URI permettant de la référencer sur le Web.
  • Modèle RDF (Resource Description Framework) : Les données sont structurées sous forme de triplets (sujet–prédicat–objet) pour représenter les relations entre entités.
  • Protocole SPARQL : Un langage de requête standardisé permettant d’interroger et de combiner des ensembles de données RDF provenant de différentes sources.

Wikidata

Linked Open Data

Objectifs

  • Interconnexion des Données : Faciliter la liaison entre différentes sources de données pour créer une vision globale et cohérente des informations disponibles.
  • Accessibilité et Ouverture : Promouvoir la diffusion publique des données sous licences ouvertes, favorisant la transparence et la réutilisation libre.

Wikidata

Linked Open Data

Carte du Linked Open Data en 2009, illustrant les ensembles de données interconnectées. Carte du Linked Open Data en 2014, montrant l'expansion du réseau de données ouvertes liées.
  1. LOD datasets 2009 (Wikimedia Commons)
  2. LOD datasets 2010 (Wikimedia Commons)

Wikidata

Wikidata

Wikidata, lancé en 2012, est un projet collaboratif de la Wikimedia Foundation visant à créer une base de connaissances libre, liée et multilingue. Il sert de source centrale de données pour Wikipédia et d’autres projets Wikimédia.

Logo officiel du projet Wikidata.

Wikidata

Wikidata

Évolution des sites Wikipédia : passage de plusieurs Wikipédias multilingues séparées à une base de connaissances centralisée (Wikidata) permettant une cohérence et une mise à jour unifiée des données entre langues.

Logo Wikidata symbolisant la centralisation multilingue des connaissances.

Wikidata

Wikipédia : Articles multilingues

L’Infobox est une composante essentielle des articles Wikipédia. Elle résume, sous une forme structurée, les informations principales sur un sujet donné.

Wikidata

Wikipédia : Articles multilingues

Wikidata

Wikipédia : Articles multilingues

Problèmes potentiels

Comparaison d’Infoboxes entre différentes versions linguistiques de Wikipédia.
Différences entre les Infoboxes selon les versions linguistiques.

Wikidata

Wikipédia : Articles multilingues

Problèmes potentiels

Exemple d’Infoboxes divergentes entre versions linguistiques de Wikipédia.
Wikipédia : Articles multilingues

Wikidata

Élément de Wikidata : libellés, descriptions et alias

Chaque élément de Wikidata comprend un libellé (nom principal), une description (brève explication) et des alias (variantes ou synonymes). Ces champs facilitent la recherche et la compréhension des entités dans plusieurs langues.

Capture d’écran montrant les libellés, descriptions et alias pour l’élément Wikidata 'Bogotá' (Q2841).
Exemple : Bogotá (Q2841)

Wikidata

Élément (item) de Wikidata : Étiquettes et propriétés

Les propriétés décrivent les caractéristiques, relations ou attributs d’un élément (par ex. date de naissance, lieu, profession). Elles permettent une représentation structurée et interconnectée de la connaissance.

Page Wikidata montrant les propriétés liées à la ville d’Avignon (Q6397).
Exemple : Avignon (Q6397)

Wikidata

Propriétés de Wikidata

Visualisation des propriétés de Wikidata
Propriétés de Wikidata

Wikidata

Propriétés: Étiquettes et descriptions

Exemple de propriété Wikidata avec étiquette et description
Exemple: pays (P17)

Wikidata

Propriétés

Exemple de la propriété P31 en anglais sur Wikidata
Étiquettes, descriptions et alias de Property:P31 en anglais

Wikidata

Propriétés de l'Infobox de Wikipedia

Propriétés existantes de l’infoboîte Wikipédia pour une ville colombienne
Propriétés existantes de l'Infobox de Wikipedia en anglais pour une ville colombienne

Wikidata

Identifiant, étiquettes, descriptions et alias

Traductions Wikidata pour Bogotá
Traductions actuelles: Bogotá (Q2841)

Wikidata

Wikidata: Informations, propriétés, qualifications et références

Wikidata

Wikidata: Informations, propriétés, qualifications et références

Wikidata

Wikidata: Informations, propriétés, qualifications et références

Déclarations Wikidata pour Bogotá
Informations actuelles: Bogotá (Q2841)

Wikidata

Wikidata: External identifiers

Identifiants externes de l’élément Bogotá sur Wikidata
Identifiants externes actuels: Bogotá (Q2841)

Wikidata

Requêtes SPARQL

Interface web de Wikidata Query Service
Interface web

4. Wikidata

Requêtes SPARQL

Les identifiants des grandes villes.

SELECT ?grandeville WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
}

SELECT ?grandeville WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
}
LIMIT 100

4. Wikidata

Requêtes SPARQL

Les noms des grandes villes.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
  SERVICE wikibase:label {
  bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
LIMIT 100

4. Wikidata

Requêtes SPARQL

Les noms des grandes villes dans différentes langues.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
  ?grandeville rdfs:label ?grandevilleLabel.
}
LIMIT 100

4. Wikidata

Requêtes SPARQL

Les noms français des grandes villes.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591;
    rdfs:label ?grandevilleLabel.
  FILTER(lang(?grandevilleLabel) = "fr")
}
LIMIT 100

Rémarque: Le sujet n'est pas répété sur la deuxième ligne grâce au point-virgule.

4. Wikidata

Requêtes SPARQL

Les noms des grandes villes de France.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591;
    wdt:P17 wd:Q142;
    rdfs:label ?grandevilleLabel.
  FILTER(lang(?grandevilleLabel) = "fr")
}
LIMIT 100

4. Wikidata

Requêtes SPARQL

Les noms et images des grandes villes de France.

SELECT ?grandeville ?grandevilleLabel ?image {
  ?grandeville wdt:P31 wd:Q1549591;
               wdt:P17 wd:Q142;
               wdt:P18 ?image;
               rdfs:label ?grandevilleLabel.
  FILTER(lang(?grandevilleLabel) = "fr")
}

4. Wikidata

Requêtes SPARQL

Les noms et images des grandes villes.

SELECT DISTINCT ?grandeville ?grandevilleLabel ?pays ?paysLabel ?image {
  ?grandeville wdt:P31 wd:Q1549591;
               wdt:P17 ?pays;
               wdt:P18 ?image.
 SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
LIMIT 100

4. Wikidata

Requêtes SPARQL

Les noms de 100 langages de programmation.

SELECT ?languageLabel (YEAR(?inception) AS ?year) WHERE {
  ?language wdt:P31 wd:Q9143;
    wdt:P571 ?inception;
    rdfs:label ?languageLabel.
  FILTER((LANG(?languageLabel)) = "en")
}
ORDER BY (?year)
LIMIT 100

4. Wikidata

Requêtes SPARQL

Les noms de 100 langages de programmation et leurs paradigmes.

SELECT ?languageLabel ?paradigmLabel (YEAR(?inception) AS ?year) WHERE {
  ?language wdt:P31 wd:Q9143;
    wdt:P571 ?inception;
    wdt:P3966 ?paradigm;
    rdfs:label ?languageLabel.
  ?paradigm rdfs:label ?paradigmLabel.
  FILTER(((LANG(?languageLabel)) = "en") && ((LANG(?paradigmLabel)) = "en"))
}
ORDER BY (?year) (?paradigmLabel)
LIMIT 100

4. Wikidata

Requêtes SPARQL

Les informations disponibles sur la population des différents pays à différentes périodes.

SELECT DISTINCT ?countryLabel (YEAR(?date) AS ?year) ?population WHERE {
  ?country wdt:P31 wd:Q6256;
    p:P1082 ?populationStatement;
    rdfs:label ?countryLabel.
  ?populationStatement ps:P1082 ?population;
    pq:P585 ?date.
  FILTER((LANG(?countryLabel)) = "en")
}
ORDER BY (?countryLabel) (?year)
LIMIT 1000

Références

Ressources en ligne

Références

Couleurs

Images