De Wikidata à Wikibase

Pour une meilleure compréhension de vos données

John Samuel
CPE Lyon

Le Campus du Libre 2024
23 novembre 2024
Courriel: john.samuel@cpe.fr

Creative Commons License

John SAMUEL

  • Enseignant-Chercheur, Conception Logicielle et Big Data, CPE Lyon
  • Contributeur actif sur Wikidata et Wikimedia Commons.
  • Intérêts et thèmes de recherche : Représentation de connaissances, le web sémantique, les services web, l'intégration de données, l'entrepôt de données, les systèmes distribués, système d'information géographique
  • Cours : Programmation en C, Algorithmes en C, Data Mining et Machine Learning, Intelligence Artificielle et Deep Learning, Systèmes d'exploitation et Programmation Concurrente, Langages Web
  • Thèse : Intégration des données issues de services web

Wikidata

Wikidata

Wikidata a été lancé en 2012 en tant que projet collaboratif visant à créer une base de connaissances structurée et liée. Wikidata est une base de connaissances libre, ouverte, liée, structurée, collaborative et multilingue.

Wikidata

Wikidata

Évolution des sites Wikipédia : de sites Wikipédia multilingues avec plusieurs sous-domaines à un site Wikidata multilingue avec un seul domaine.

Wikidata

Wikipédia et Wikidata

Wikipédia Wikidata
https://fr.wikipedia.org/wiki/Chat
https://en.wikipedia.org/wiki/Cat
https://es.wikipedia.org/wiki/Gato
https://pt.wikipedia.org/wiki/Gato
https://www.wikidata.org/wiki/Q146
https://fr.wikipedia.org/wiki/Exemple
https://en.wikipedia.org/wiki/Example
https://es.wikipedia.org/wiki/Ejemplo
https://pt.wikipedia.org/wiki/Exemplo
https://www.wikidata.org/wiki/Q14944328
https://fr.wikipedia.org/wiki/Lyon
https://en.wikipedia.org/wiki/Lyon
https://es.wikipedia.org/wiki/Lyon
https://pt.wikipedia.org/wiki/Lyon
https://www.wikidata.org/wiki/Q456

Wikidata

Wikidata

Wikidata

Wikidata

Wikipédia: Articles multilingues

L'Infobox est une composante clé des articles Wikipédia. Elle fournit un résumé structuré et concis des informations essentielles sur un sujet.

Wikidata

Wikidata

Wikidata

Wikidata

Wikipédia: Articles multilingues

Wikidata: problèmes potentiels

Wikidata

Wikipédia: Articles multilingues

Problèmes potentiels

Wikipédia: Articles multilingues

Wikidata

Élément de Wikidata: libellés, descriptions et alias

Les éléments de Wikidata comprennent des libellés (labels), des descriptions et des alias. Les libellés sont les noms principaux, multilingues, attribués à chaque entité. Les descriptions fournissent des informations brèves sur la nature ou la signification de l'élément, tandis que les alias sont des synonymes ou variantes utilisés pour faciliter la recherche.

Exemple: Bogotá (Q2841)

Wikidata

Élément (item) de Wikidata: Étiquettes et propriétés

Les propriétés définissent les caractéristiques ou relations des éléments. Exemples : Date de naissance, lieu de naissance, genre, etc. Elles permettent une structuration précise des informations liées aux éléments.

Exemple: Avignon (Q6397)

Wikidata

Lyon - Propriétés de Wikidata

Propriété Valeur
Nature de l’élément Commune française
Commune française à statut particulier
Grande ville
Ville universitaire
Partie de Métropole de Lyon
Continent Europe
Pays France

Wikidata

Lyon - Propriétés de Wikidata

Propriété Valeur
Nature de l’élément (P31) Commune française
Commune française à statut particulier
Grande ville
Ville universitaire
Partie de (P361) Métropole de Lyon
Continent (P30) Europe
Pays (P17) France

Wikidata

Lyon (Q456) - Propriétés de Wikidata

Propriété Valeur
Nature de l’élément (P31) Commune française (Q484170)
Commune française à statut particulier (Q22927616)
Grande ville (Q1549591)
Ville universitaire (Q1187811)
Partie de (P361) Métropole de Lyon (Q16665897)
Continent (P30) Europe (Q46)
Pays (P17) France (Q142)

Wikidata

Propriétés

Propriétés de Wikidata

Wikidata

Propriétés: Étiquettes et descriptions

Exemple: pays (P17)

Wikidata

Propriétés

Étiquettes, descriptions et alias de Property:P31 en anglais

Wikidata

Propriétés de l'Infobox de Wikipedia

Propriétés existantes de l'Infobox de Wikipedia en anglais pour une ville colombienne

Wikidata

Identifiant, étiquettes, descriptions et alias

Traductions actuelles: Bogotá (Q2841)

Wikidata

Wikidata: Informations, propriétés, qualifications et références

Wikidata

Wikidata: Informations, propriétés, qualifications et références

Wikidata

Informations, propriétés, qualifications et références

Informations actuelles: Bogotá (Q2841)

Wikidata

Wikidata: External identifiers

Identifiants externes actuels: Bogotá (Q2841)

Wikidata

Wikidata: Identifiants externes

Identifiants externes actuels: Lyon (Q456)

Wikidata

Linked Open Data

Le Linked Open Data (LOD) est une approche permettant de connecter des ensembles de données hétérogènes de manière ouverte et interconnectée, facilitant la découverte et l'utilisation des informations.

Principes Clés

  • Identifiants Uniques (URIs) : Chaque ressource est identifiée de manière unique à l'aide d'URIs.
  • Modèle RDF (Resource Description Framework) : Structuration des données sous forme de triplets (sujet-prédicat-objet) pour représenter les relations.
  • Protocole SPARQL : Langage de requête permettant d'interroger les données RDF de manière standardisée.

Wikidata

Linked Open Data

Objectifs

  • Interconnexion des Données : Faciliter la liaison entre différentes sources de données, permettant une vue globale et cohérente.
  • Accessibilité et Ouverture : Encourager la disponibilité publique des données avec des licences ouvertes favorisant leur utilisation.

Wikidata

Linked Open Data

Linked Open Data: Représentation des relations (2009)
Données ouvertes liées (Linked Open data: LOD), 2010
  1. https://commons.wikimedia.org/wiki/File:Lod-datasets_2009-07-14.svg
  2. https://commons.wikimedia.org/wiki/File:Lod-datasets_2010-09-22_colored.png

Wikidata

Linked Open Data

Linked Open Data: Représentation des relations (Octobre 2024)

Wikidata

Requêtes SPARQL

Interface web

Wikidata

Requêtes SPARQL

Les identifiants des grandes villes.

SELECT ?grandeville WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
}

SELECT ?grandeville WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
}
LIMIT 100

Wikidata

Requêtes SPARQL

Les noms des grandes villes.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
  SERVICE wikibase:label {
  bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
LIMIT 100

Wikidata

Requêtes SPARQL

Les noms des grandes villes dans différentes langues.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591.
  ?grandeville rdfs:label ?grandevilleLabel.
}
LIMIT 100

Wikidata

Requêtes SPARQL

Les noms français des grandes villes.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591;
    rdfs:label ?grandevilleLabel.
  FILTER(lang(?grandevilleLabel) = "fr")
}
LIMIT 100

Rémarque: Le sujet n'est pas répété sur la deuxième ligne grâce au point-virgule.

Wikidata

Requêtes SPARQL

Les noms des grandes villes de France.

SELECT ?grandeville ?grandevilleLabel WHERE {
  ?grandeville wdt:P31 wd:Q1549591;
    wdt:P17 wd:Q142;
    rdfs:label ?grandevilleLabel.
  FILTER(lang(?grandevilleLabel) = "fr")
}
LIMIT 100

Wikidata

Requêtes SPARQL

Les noms et images des grandes villes de France.

SELECT ?grandeville ?grandevilleLabel ?image {
  ?grandeville wdt:P31 wd:Q1549591;
               wdt:P17 wd:Q142;
               wdt:P18 ?image;
               rdfs:label ?grandevilleLabel.
  FILTER(lang(?grandevilleLabel) = "fr")
}

Wikibase

Requêtes SPARQL

Les noms et images des grandes villes.

SELECT DISTINCT ?grandeville ?grandevilleLabel ?pays ?paysLabel ?image {
  ?grandeville wdt:P31 wd:Q1549591;
               wdt:P17 ?pays;
               wdt:P18 ?image.
 SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
LIMIT 100

Wikidata

Requêtes SPARQL

Les informations disponibles sur la population des différents pays à différentes périodes.

SELECT DISTINCT ?countryLabel (YEAR(?date) AS ?year) ?population WHERE {
  ?country wdt:P31 wd:Q6256;
    p:P1082 ?populationStatement;
    rdfs:label ?countryLabel.
  ?populationStatement ps:P1082 ?population;
    pq:P585 ?date.
  FILTER((LANG(?countryLabel)) = "en")
}
ORDER BY (?countryLabel) (?year)
LIMIT 1000

Wikidata

Liste des œuvres d'art générées à l'aide de Wikidata

Interface web

Wikidata

Liste des œuvres d'art générées à l'aide de Wikidata

Interface web

Wikibase

Wikibase

Que se passe-t-il si nous pouvons choisir une sélection de fonctionnalités de Wikidata ? Et la réponse est Wikibase.

Wikibase

Exemples: Creative Commons (CC)

Wikibase

Exemples: Creative Commons (CC)

Wikibase

Lyon - propriétés pertinentes

Propriété Valeur
Nature de l’élément Commune française
Commune française à statut particulier
Grande ville
Ville universitaire
Partie de Métropole de Lyon
Continent Europe
Pays France
vidéo Votre site interne

Wikibase

Propriété

Interface web

Wikibase

Propriété

Interface web

Wikibase

Propriété

Interface web

Wikibase

Requêtes SPARQL

Liste complète des propriétés.

PREFIX wikibase: <http://wikiba.se/ontology#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>

SELECT ?property ?label WHERE {
  ?property rdf:type wikibase:Property;
    rdfs:label ?label.
  FILTER((LANG(?label)) = "en")
}

Wikibase

Requêtes SPARQL

Liste des cours triée par année académique

PREFIX wd: <https://jsamwrites.wikibase.cloud/entity/>
PREFIX wdt: <https://jsamwrites.wikibase.cloud/prop/direct/>
SELECT DISTINCT ?item ?title ?url ?year WHERE {
  ?item wdt:P3 ?url;
    wdt:P27 ?title;
    wdt:P10 ?time;
    wdt:P29 wd:Q1043.
  BIND(YEAR(?time) AS ?year)
}
ORDER BY DESC (?year)

Wikibase

Requête fédérée vers Wikidata

Interface web

Wikibase

Wikibase Cloud

Wikidata

Wikibase Cloud - Discovery

Références

Ressources en ligne

Références

Couleurs

Images