Skip to content

Publier des stats en RDF (2) : le problème du noeud « Donnée »

24/10/2012

Suite de l’épisode 1.

Croiser une université, un nombre d’étudiants… et une année ?

Le noeud de mon problème est : comment lier l’Université de Nice (que je peux citer par son identifiant PAPESR — non déréférençable — ou par son URI DBpedia, par exemple) à son nombre d’étudiants ?
(je prends le champ « Nombre d’étudiants », ça reste encore presque simple : quand on passera à « étudiants en L1 », etc., ce sera bien pire)

Je vous remets le schéma initial ici, qui semble répondre à la question :

Si je consulte la page DBpedia consacrée à l’Université de Nice, la résolution semble simple : j’y trouve en effet la ligne

Donc il me suffirait de générer le triplet

Sujet Verbe Complément
http://dbpedia.org/page/University_of_Nice_Sophia_Antipolis dbpedia-owl:numberOfStudents 25793

Mais où je mets l’année dans tout ça ? Car le concept numberOfStudents utilisé par DBpedia ne désigne que le nombre d’étudiants actuels (cf. la définition de cette propriété)

Donc je ne peux pas me contenter d’estimer que j’ai trouvé la bonne structure, et essayer maintenant de trouver la catégorie qui pourrait correspondre à « Nombre d’étudiants en L1 ». C’est la structure même de mon graphe. Je dois passer par un noeud intermédiaire.

Reprendre par le bon bout ?

En fait, pendant que je manipule ces données et que je rédige par à-coups cette série de billets, je continue la lecture du RDF Data Cube Vocabulary.

Ils ont eu la bonne idée de partir d’un exemple assez similaire au mien : convertir ce tableau

Espérance de vie dans 4 villes du Pays de Galle

2004-2006 2005-2007 2006-2008
Male Female Male Female Male Female
Newport 76.7 80.7 77.1 80.9 77.0 81.5
Cardiff 78.7 83.3 78.6 83.7 78.7 83.4
Monmouthshire 76.6 81.3 76.5 81.5 76.6 81.7
Merthyr Tydfil 75.5 79.1 75.5 79.4 74.9 79.6

Et ils ne commencent pas par convertir le tableau, mais par définir la structure des données.

Donc je vais sagement faire pareil !

%d blogueurs aiment cette page :