Skip to content

Une notice Unimarc/RDF ?

16/01/2013

Petit exemple par l’absurde pour donner à voir que le RDF ne vient pas remplacer l’Unimarc

La notice initiale

C’est celle-ci : une édition de La vie devant soi par Romain Gary/Emile Ajar

Notice Sudoc La Vie devant soi

En « grille de catalogage », ça donne ça

notice MARC - grille de catalogage

Mais ce même Unimarc ci-dessus peut aussi être exprimé

  • en iso2709
    notice iso2709
  • en MarcXML
    Notice MarcXML

Mais elle peut l’être aussi en triplets RDF reprenant les champs Unimarc

La notice  en RDF (ici triples)

notice Unimarc RDF - copie d'écran

[si vous voulez récupérer le code complet pour toute la notice pour le tester ailleurs, c’est par là]

Si on ne s’intéresse qu’au champ 200 (pour simplifier), le graphe ressemble à ceci :

graphe champ 200

C’est vraiment de l’Unimarc (à peu près)

Vous constatez donc que les différentes valeurs respectent la structure d’une notice Unimarc, le code des champs et sous-champs, etc. (j’espère que vous me pardonnerez, j’ai évacué les indicateurs pour ce petit exercice de style).

L’intégration des sous-champs à l’intérieur de champ est exprimée en noeuds blancs (commençant par _: ). Ca permet de faire en sorte de regrouper les sous-champs sous un noeud commun.

C’est vraiment du RDF (à peu près)

Elle est valide du strict point de vue du RDF. La preuve : vous pouvez la passer dans le RDF Validator and Converter (en sélectionnant le format en entrée : Notation 3 (or N-Triples/Turtle).

Vous pourrez ainsi voir ce que cette notice en turtle donnera exprimée en RDF/XML.

Après l’avoir converti dans le RDF Validator and Converter, vous pourrez récupérer ce RDF/XML et le coller dans un autre « validator » (qui n’accepte que le RDF/XML). Il vous produira un joli graphe.

graphe de notice La Vie devant soi

Limites sur la validité du RDF

Cette notice est « fausse » (du point de vue du RDF) puisque si on clique sur les URL des prédicats (les sous-champs 200$a, 200$f, etc.) on tombe sur rien du tout : il n’existe pas d’ontologie RDF décrivant les champs Unimarc.

Typiquement, quand une machine suit l’URL d’un prédicat, il s’attend à trouver une propriété rdfs:label avec une précision de langue. Là, vous n’obtiendrez qu’un message d’erreur.

(Pour mémoire : si vous cliquez sur une URL et que vous n’obtenez rien, c’est donc que cette URL n’est pas déréférençable, ce qui va à l’encontre des consignes du W3C)

Pour bien/mieux faire, il faudrait qu’en cliquant sur ces liens, je tombe (par exemple) sur une page du guide méthodologique de catalogage de l’Abes (avec système de redirection des URL au niveau du serveur), et que du RDFa soit intégré dans ces pages pour que les machines y trouvent aussi leur compte (et pas seulement les internautes).

Objectifs de l’exercice

L’idée avec la notice ci-dessus n’est pas de prouver qu’on peut faire du RDF à moindres frais, en restant sur des formats Marc RDFisés. D’ailleurs, de plus compétents que moi auraient sans doute beaucoup à redire sur le résultat auquel j’arrive.

Ce que je voulais, c’est juste montrer que le RDF ne vient pas remplacer Unimarc : les 2 ne se situent pas sur le même plan. Le RDF, c’est l’exigence que les données soient exprimées en triplets (sujet-prédicat-objet), où le sujet et le prédicat (au moins) sont des URI.

Pourquoi ne pas mettre les notices sous ce format Unimarc RDFisé ?

Il y a plusieurs niveaux de réponses.

A votre avis ?

10 commentaires
  1. 16/01/2013 16:03

    Donc tu génères avec print-03 tes premiers exemples, OK.
    Mais pour ta « notice en RDF (ici triples) », tu la génère comment ? Tu as fais un fix ? [en l’écrivant je réalise que ce n’est sans doute pas très compliqué à écrire] ? Autre script ?

  2. 16/01/2013 16:12

    Là, pour obtenir cette notice, j’ai
    1. exporté d’Aleph une notice en MarcXML (avec print-03, oui)
    2. utilisé une feuille XSL (celle-là)
    3. fait quelques petites corrections manuelles (remplacer les &lt; par < et &gt; par >)
    C’était pour en faire une, par pour pouvoir les produire à la chaîne ! (c’est pour ça que dans la feuille XSL le PPN est inscrit en dur, au lieu d’être extrait du fichier MarcXML)

  3. 16/01/2013 16:26

    Ok je vois bien ! C’est très intéressant tout ça !! Merci pour la xsl

Trackbacks

  1. Une notice Unimarc/RDF ? | Ebooksinfo | Scoop.it
  2. Une notice Unimarc/RDF ? | Bibliothèques et documentation | Scoop.it
  3. Une notice Unimarc/RDF ? | Doc Num - Informatique Doc | Scoop.it
  4. SIGB et catalogues | Pearltrees
  5. Une notice Unimarc/RDF ? | Bibliothèques [reloaded] | Pour un web qui a du sens | Scoop.it
  6. Catalogues | Pearltrees
  7. Décalog | Pearltrees

Les commentaires sont fermés.

%d blogueurs aiment cette page :