Aller au contenu principal

L’interopérabilité à l’heure d’IFLA LRM / RDA

04/09/2023

Je n’ai pas oublié les questions posées dans mon dernier billet de blog (mais une réponse est belle et bien prévue, sinon planifiée). B

Mais mes lectures d’été m’ont donné l’occasion de me replonger dans le rapport du groupe Normalisation de la Transition bibliographique publié en 2021 sur l’analyse de RDA : en effet une première version de RDA est parue en 2010, avant que ne soit conçu le modèle IFLA LRM (2018), synthèse des 3 modèles FR*. En 2018 a été lancé le projet « 3R » de refonte de RDA. Suite à cela, le groupe Normalisation de la Transition bibliographique a présenté en 2021 au CSB (ministères ESR et Culture + agences bibliographiques) un rapport analysant le code RDA refondu, et requestionnant la trajectoire de RDA-FR (code indépendant ou profil d’application de RDA ?).

Les conclusions du rapport ont conforté la stratégie française (je vous laisse éventuellement vous référer aux conclusions et arguments de ce rapport), mais pour ma part je voulais donner à lire ici quelques lignes qui sont dans la première partie et relèvent d’un rappel du contexte :

Avec le web de données, c’est une nouvelle conception de l’interopérabilité qui s’impose, avec une transition depuis un monde où l’on normalise des notices pour se les échanger vers celui où l’on structure les données pour se les partager, avec l’émergence du rôle clé de la modélisation et de l’organisation par entités. Le pivot du partage des données n’est donc plus la manière dont une instance d’entité est décrite (par un point d’accès privilégié censé être commun pour tous au niveau international, par exemple) ; mais il repose sur un identifiant désignant de manière explicite, pérenne et univoque, une instance dont les modalités de description sont renvoyées à la responsabilité des communautés nationales ou transnationales. […] C’est une interopérabilité qui n’intervient plus au niveau du catalogage courant mais au niveau des machines et des moteurs de recherche. Les identifiants internationaux (par exemple : ISSN, ISBN, ISNI, ISAN…) permettant des alignements entre graphes sont donc les leviers principaux de cette interopérabilité d’un genre nouveau pour qui l’importance du catalogage partagé est moindre que la nécessité d’une gestion partagée et normalisée d’identifiants.

On attend aujourd’hui d’un code de catalogage qu’il nous fournisse des règles permettant de garantir que tout le monde saisit les informations « de la même manière ». Mais en passant d’ISBD à RDA/RDA-FR, l’accent n’est plus mis sur la même chose. Dans l’univers ISBD, on se préoccupe des règles de description pour que 2 catalogueurs transcrivent bien la zone de titre, ou la description matérielle, de la même manière : ainsi les notices se ressemblent d’un catalogue à l’autre, on peut donc partager la production de notices en sachant, à l’import, qu’on ne verra pas arriver des notices extérieures complètement différentes.

RDA et RDA-FR se préoccupent d’autre chose : proposer un cadre de description commun, une architecture commune, permettant d’avoir de part et d’autres des entités de même contour. La transcription de chaque élément d’information importe moins1. Le pré-requis essentiel est qu’on puisse aligner des entités entre bases, et pour cela partager des contours communs : qu’un « livre » dans une BDD corresponde à une « manifestation » dans une autre (peu importe l’appellation de l’entité), mais qu’il partage bien la même liste d’attributs autorisés pour sa description. Ainsi, Wikidata ne partage pas le même modèle (ce n’est pas la même liste d’entités) que IFLA LRM, ce qui d’emblée pose des questions d’articulation (par exemple dans Wikidata, Le mystère de la chambre jaune existe comme literary work, qui est une sous-classe de Work au sens Wikidata ; et il existe à côté de ça Le mystère de la chambre jaune (1932, Laffitte) qui est de type version, édition ou traduction : je vous laisse réfléchir aux alignements entre ces 2 entités Wikidata et les entités LRM qui pourraient exister, en face, dans un catalogue de bibliothèque).

Aujourd’hui, les SIGB sont conçus pour dériver des notices (Z39.50, here we are), mais les mécanismes d’injection d’éléments d’information ne sont pas aussi « natifs » : des fonctionnalités sont éventuellement prévues pour venir faire des enrichissements par lots, mais potentiellement en une succession d’étapes à concevoir à chaque cas.

Un environnement avec IFLA LRM et RDA (ou RDA-FR) n’a de sens que si les fonctionnalités de manipulation des informations qui s’y trouvent facilitent les enrichissements, ajouts, corrections, curation, au niveau de chaque donnée — chacune étant associée à un identifiant (généralement local, mais aligné à un identifiant international) permettant de désigner l’entité décrite (OEMI, Agent, Concept, etc.).

On peut commencer à se demander comment se passera la dérivation des notices (çàd un ensemble d’informations relatives à une entité). Mais il ne faudrait pas passer à côté du changement de paradigme induit par le passage à un système utilisant LRM : un des intérêts doit être de faciliter la récupération de bouts d’informations.

Par exemple vous avez une source primaire de données, mais vous pouvez aller récupérer plus facilement des prix littéraires associés aux oeuvres ou aux auteurs, des affiches de films, etc. dans des sources d’informations exogènes au monde des bibliothèques, qui ne parlent pas le même format que nous — mais parce que nos données sont désormais pensées granulairement, et qu’enrichir 10.000 notices pré-existantes d’une ou deux informations doit avoir le même niveau de complexité qu’importer un panier d’Electre, de Moccam ou de la BnF.

1 Je ne sais pas si c’est le motif d’origine, mais j’y vois personnellement un principe de réalité, sur le fait que les données des bibliothèques doivent pouvoir coexister avec des données de tout un tas d’autres acteurs. Cela signifie notamment qu’on peut être amenés à importer dans un catalogue des notices de collectivités ou de personnes émanant de l’univers des majors, ou des maisons de production cinématographiques : et qu’on ne maîtrisera pas la manière dont ils choisissent de transcrire certaines informations. En revanche on peut s’assurer qu’on parle bien de la même chose : qu’un « film » d’un côté est une oeuvre (ou une expression ou une manifestation) chez nous, pas exemple.

Commentaires fermés