Aller au contenu principal

Cataloguer par entités et relations : ce que ça change

22/09/2023

Troisième fois que j’essaie d’apporter une proposition de réponse, même partielle, à ce billet. A chaque fois je m’embarque dans des précisions complémentaires, qui me semblent indispensables. Puis je m’interromps afin de reprendre plus tard — et je perds le fil. Donc changement de méthode : je rédige un billet plus court, d’une traite, et je complèterai peut-être ultérieurement par d’autres billets.

En gros, 3 axes essentiels :

  1. Les notices actuelles sont des documents
  2. Une fois la définition d’une entité rédigée, on ne peut plus choisir arbitrairement les métadonnées qu’on veut lui attribuer
  3. Les relations disposent aussi de métadonnées

Les notices bibliographiques et d’autorité sont des documents

Une notice bibliographique comportera ainsi tout un tas d’informations utiles sur le prix, l’auteur, le résumé. Une notice d’auteur contiendra des dates de naissance et de mort, la liste des pseudonymes successifs de l’auteur, ses éventuels ORCID et ISNI, etc. Une notice de lieu pourra contenir la date de fondation du lieu, ses différents noms successifs (et leurs dates d’utilisation) — ou au contraire ne contenir qu’un seul nom si l’on considère qu’on a besoin d’une notice distincte par nom (Istanbul / Constantinople / Byzance, ou Istanbul-Byzance-Constantinople).

S’il est jugé pertinent d’y rajouter d’autres infos, rien ne l’interdit : il suffit d’ajouter de nouvelles zones. Par exemple les notices IdRef sont enrichies (à l’affichage et non en production) d’éléments extérieurs : cela signifie qu’il a été considéré utile, voire nécessaire, d’ajouter pour les utilisateurs des informations non utiles pour le catalogueur (ou déjà saisies ailleurs, mais utiles pour les deux).

La description d’une entité est plus contraignante

Une fois que vous avez défini ce qu’est une personne, vous ne pouvez pas y ajouter les métadonnées qui vous arrangent.

Par exemple, tout n’est pas associé à la personne (en tant qu’être humain) dans les informations suivantes :

  • 1918 : Date de naissance de Romain Gary
  • 27/07/2023 : date de dernière modification de la notice
  • 1956 : date du prix Goncourt remporté (pour Les Racines du Ciel)
  • 1974 : date de première utilisation du pseudonyme Emile Ajar (avec Gros-Câlin)

Dans une notice d’autorité, les 4 informations se trouveront dans 4 zones distinctes (zone codée ou zone de note biographique, par exemple). Mais dès lors qu’on prétend décrire la Personne Romain Gary, on est obligé de modéliser (faire des schémas) pour comprendre à quoi se rattachent chaque information. Car si l’on veut ensuite exprimer toutes ces informations en RDF, il est exclu de déclarer les triplets suivants :

  • <ID_RomainGary> <est> "une personne"
  • <ID_RomainGary><s'appelle> "Romain Gary"
  • <ID_RomainGary> <a comme date de naissance> "1918"
  • <ID_RomainGary> <a comme date de dernière modification> « 20230727 »
  • <ID_RomainGary> <a comme date de prix Goncourt> « 1956 »
  • <ID_RomainGary> <a comme date de première utilisation du pseudonyme Emile Ajar> « 1974 »

Seuls les 3 premiers sont corrects.

Il faut donc se demander quel sera le sujet et le verbe dont la valeur sera « 230727 », « 1956 » et « 1974 », et comment je rattache ces informations à la personne qu’était Romain Gary.

Par exemple (et je ne traiterai que cette info là), on va avoir besoin d’exprimer une relation entre Romain Gary et son pseudonyme.

  • <ID_Romain_Gary> <utilise comme pseudonyme> <ID_pseudoEmileAjar>
  • <ID_pseudoEmileAjar><a comme valeur> "Emile Ajar"
  • <ID_pseudoEmileAjar><a comme date de première utilisation> "1974"

Je m’empresse de préciser qu’en format de catalogage MARC, ce ne serait pas forcément plus long à saisir. Mais l’administrateur du format, et la personne chargée de convertir ces informations de notice en données exposées vers l’extérieur (car c’est bien le but de la Transition bibliographique : exposer nos données vers l’extérieur, et non plus seulement des notices), vont devoir clarifier le positionnement de chaque zone au sein d’une architecture explicite de l’information (un schéma global).

Les relations ont elles aussi besoin de métadonnées

Les entités sont ce qui nous préoccupe le plus au premier abord : il faut les décrire, les qualifier, elles nous permettent de décrire nos ressources.

Mais on se rend compte assez rapidement que dans de nombreux cas, certaines métadonnées présentes aujourd’hui dans nos notices se rattachent en réalité non pas aux entités (ou aux ressources qu’on pense décrire), mais aux relations entre deux entités.

Par exemple on trouve dans la notice du journal L’Humanité du catalogue de la BnF la ligne suivante :

Jaurès, Jean (1859-1914). Directeur de publication, 1904-1914 

Pour les règles de catalogage actuelles, on a juste à donner les consignes suivantes : mention de responsabilité en zone 700, code fonction en $4, précisions en $7 (pardon, c’est de l’Intermarc BnF, et ça veut dire ici : « précisions complémentaires »). Et l’internaute comprend (j’espère) qu’il s’agit des dates extrêmes où Jean Jaurès fut directeur de publication de ce journal.

Dans un environnement où on décrit des entités et des relations, à quoi se rapporte cette période 1904-1914 ? A la relation

<ID_Humanite> <a comme directeur de publication> <ID_JeanJaurès>

De même, le code fonction « Auteur incertain » qui constitue une relation entre une œuvre et une personne, par exemple, est une métadonnées « information incertaine » qui affecte cette relation, et non une information ni sur l’œuvre ni sur la personne.

Conclusion

Un gros travail dans la rédaction du code RDA-FR, de l’ontologie qui l’accompagne désormais, et de la manière dont on construit un format (y compris un format MARC, comme Intermarc NG ou Unimarc ER) de catalogage pour décrire ces entités et leurs relations et leurs règles de conversion, est donc consacré à s’assurer que les attributs sont posés aux bons endroits, sur les bonnes entités, qu’elles qualifient réellement ce qu’on prétend leur faire qualifier.

Je n’irai donc pas plus loin pour le moment, de peur qu’en étant plus ambitieux je ne termine jamais ce billet. J’espère vous laisser frustré plutôt qu’indifférent (mais je vais éviter de poser la question frontalement). C’est donc évidemment très incomplet (il y a ce que j’omets pour l’instant, il y a aussi ce que j’ignore et n’ai pas identifié).

One Comment
  1. 22/09/2023 10:36

    Merci; tu as bien fait de limiter tes ambitions, j’ai osé débuté la lecture et suis arrivé à la fin; clair. Frustré un peu mais j’ai appris, donc content.

Commentaires fermés