Traitement de données massives
Données ouvertes liées (Linked Open Data)
John Samuel
CPE Lyon
Année: 2024-2025
Courriel: john.samuel@cpe.fr
Le Linked Open Data (LOD) est une approche permettant de connecter des ensembles de données hétérogènes de manière ouverte et interconnectée, facilitant la découverte et l'utilisation des informations.
Wikidata a été lancé en 2012 en tant que projet collaboratif visant à créer une base de connaissances structurée et liée. Wikidata est une base de connaissances libre, ouverte, liée, structurée, collaborative et multilingue.
Évolution des sites Wikipédia : de sites Wikipédia multilingues avec plusieurs sous-domaines à un site Wikidata multilingue avec un seul domaine.
L'Infobox est une composante clé des articles Wikipédia. Elle fournit un résumé structuré et concis des informations essentielles sur un sujet.
Les éléments de Wikidata comprennent des libellés (labels), des descriptions et des alias. Les libellés sont les noms principaux, multilingues, attribués à chaque entité. Les descriptions fournissent des informations brèves sur la nature ou la signification de l'élément, tandis que les alias sont des synonymes ou variantes utilisés pour faciliter la recherche.
Les propriétés définissent les caractéristiques ou relations des éléments. Exemples : Date de naissance, lieu de naissance, genre, etc. Elles permettent une structuration précise des informations liées aux éléments.
SELECT ?grandeville WHERE {
?grandeville wdt:P31 wd:Q1549591.
}
SELECT ?grandeville WHERE {
?grandeville wdt:P31 wd:Q1549591.
}
LIMIT 100
SELECT ?grandeville ?grandevilleLabel WHERE {
?grandeville wdt:P31 wd:Q1549591.
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
LIMIT 100
SELECT ?grandeville ?grandevilleLabel WHERE {
?grandeville wdt:P31 wd:Q1549591.
?grandeville rdfs:label ?grandevilleLabel.
}
LIMIT 100
SELECT ?grandeville ?grandevilleLabel WHERE {
?grandeville wdt:P31 wd:Q1549591;
rdfs:label ?grandevilleLabel.
FILTER(lang(?grandevilleLabel) = "fr")
}
LIMIT 100
Rémarque: Le sujet n'est pas répété sur la deuxième ligne grâce au point-virgule.
SELECT ?grandeville ?grandevilleLabel WHERE {
?grandeville wdt:P31 wd:Q1549591;
wdt:P17 wd:Q142;
rdfs:label ?grandevilleLabel.
FILTER(lang(?grandevilleLabel) = "fr")
}
LIMIT 100
SELECT ?grandeville ?grandevilleLabel ?image {
?grandeville wdt:P31 wd:Q1549591;
wdt:P17 wd:Q142;
wdt:P18 ?image;
rdfs:label ?grandevilleLabel.
FILTER(lang(?grandevilleLabel) = "fr")
}
SELECT DISTINCT ?grandeville ?grandevilleLabel ?pays ?paysLabel ?image {
?grandeville wdt:P31 wd:Q1549591;
wdt:P17 ?pays;
wdt:P18 ?image.
SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}
LIMIT 100
SELECT ?languageLabel (YEAR(?inception) AS ?year) WHERE {
?language wdt:P31 wd:Q9143;
wdt:P571 ?inception;
rdfs:label ?languageLabel.
FILTER((LANG(?languageLabel)) = "en")
}
ORDER BY (?year)
LIMIT 100
SELECT ?languageLabel ?paradigmLabel (YEAR(?inception) AS ?year) WHERE {
?language wdt:P31 wd:Q9143;
wdt:P571 ?inception;
wdt:P3966 ?paradigm;
rdfs:label ?languageLabel.
?paradigm rdfs:label ?paradigmLabel.
FILTER(((LANG(?languageLabel)) = "en") && ((LANG(?paradigmLabel)) = "en"))
}
ORDER BY (?year) (?paradigmLabel)
LIMIT 100
SELECT DISTINCT ?countryLabel (YEAR(?date) AS ?year) ?population WHERE {
?country wdt:P31 wd:Q6256;
p:P1082 ?populationStatement;
rdfs:label ?countryLabel.
?populationStatement ps:P1082 ?population;
pq:P585 ?date.
FILTER((LANG(?countryLabel)) = "en")
}
ORDER BY (?countryLabel) (?year)
LIMIT 1000