Recontextualisation
Je me suis retrouvé à creuser le modèle FRBR (pour une formation Médial où j’ai croisé Manue au milieu de son tour de France), et j’ai découvert que ça a quand même un peu bougé depuis la toute première présentation qui m’en a été faite à l’Enssib en 2004.
Le modèle de base lui-même n’a pas changé (on a toujour des oeuvres/expressions/manifestations/items, reliées à des autorités/sujets) mais d’autres termes ont fait leur apparition, que j’ai eu du mal à situer l’un par rapport à l’autre : FRBRER et FRBROO.
Précision utile : je ne participe pas aux instances décisionnelles et autres groupes techniques qui développent les différents modèles de données évoqués ici. Ma compréhension s’en trouve forcément limitée. Si vous avez des éclairages complémentaires, voire des critiques face à mes erreurs d’interprétations et mes ignorances, n’hésitez pas !
FRBR (tout court)
Le modèle FRBR est né d’un groupe de travail de l’IFLA dans les années 1990.
L’objectif était de définir une nouvelle manière de concevoir l’information bibliographique en fonction des usages qui pouvaient être fait d’une notice bib. 4 usages ont été identifiés par le groupe (trouver/identifier/sélectionner/obtenir).
Par ailleurs le groupe a constaté que dans les pavés ISBD se trouvaient des informations qui relevaient de plusieurs niveaux, et notamment un mélange Contenu / contenant qui, surtout dans un contexte de catalogues informatisés (parce qu’à l’époque, il fallait préciser pour un catalogue qu’il était informatisé), n’avait aucune justification.
Exemple d’info sur le contenu dans le pavé ISBD : titre, auteur.
Exemple d’info sur le contenant : nombre de pages.
A partir de ces diverses constatations (et de quelques autres), le groupe a défini le modèle qu’on est censé connaître à peu près aujourd’hui, d’arbre FRBR.
Le vocabulaire FRBR
Pour exprimer et décrire cette structure, le rapport final du groupe de travail IFLA sur le FRBR (version française – PDF) utilise un vocabulaire cohérent :
- les blocs sont des entités(n’apparaissent ici que les entités du groupe 1)
- les entités ont entre elles des relations
(y compris des relations d’oeuvres entre elles, d’expressions entre elles, d’items entre eux) - chaque entité a également des attributs pour la décrire
(le code-barres est un attribut de l’entité Item, permettant de décrire l’exemplaire détenu par une bibliothèque spécifique)
Ces termes, entités, relations et attributs, sont récupérés du mode de représentation Entité-Relation (ou "Entité-Association", puisque Wikipedia dit que c’est ainsi qu’il faudrait dire — mais tant pis).
Ce mode de représentation (ou modèle de données) permet de représenter l’information sous forme de diagrammes en attribuant à chaque objet du diagramme un terme avec un sens précis : entité (plutôt que "bloc", "ressource", ou "chose"), relation (plutôt que "trait", "lien"), attribut (plutôt que "champ" — mais on peut aussi parler de propriété).
Et le web des données dans tout ça ?
L’idée de structurer l’information en triplets, née dans le cerveau magistral de Tim Berners-Lee, arrive à la fin des années 1990. Elle sera prolongée et construite dans le cadre du W3C.
Le vocabulaire utilisé sera : Sujet – Prédicat – Objet
L’élaboration du modèle FRBR se fait donc de manière complètement indépendante. On le constate d’ailleurs quand on compare attributs et relations : par exemple dans ce diagramme qui s’intéresse à l’oeuvre Education européenne (premier roman de Romain Gary) et à son auteur.
Les "relations" (entre entités FRBR) sont en rouge, les attributs (de chaque entité) sont en bleu
Si on prend la peine d’y reconnaître un graphe avec quelques triplets, on constate que
- dans le modèle FRBR, "Auteur" est une relation et "Titre" est un attribut
- dans le modèle RDF, "Auteur est "Titre" sont tous deux des prédicats
- l’objet du prédicat "Auteur" est un URI
- l’objet du prédicat "Titre" est une chaîne de caractères
- par ailleurs, si je peux exprimer l’oeuvre et l’auteur par des URI, je n’ai pas d’URI à disposition pour désigner les prédicats "Auteur" et "Titre" tels que définis dans le modèle FRBR.
Bref, il faut ajuster le modèle FRBR pour le caler parfaitement sur la représentation en graphe RDF.
Les musées réfléchissent aussi (si !)
Dans les années 1990 également (c’est fou tout ce qui s’est passé à cette période, alors que je n’avais même pas mon bac ! On est peu de choses, finalement…), au sein de l’ICOM (le Conseil international des musées, l’IFLA des musées donc), la section chargée de la documentation, le CIDOC,définit un modèle de description de ressource (ressource muséale, donc) : le CRM.
Et puis tous ces gens se sont dit : et si on travaillaient ensemble ?
FRBRER et FRBROO
A la suite de ça est né le projet FRBROO : la fusion du CRM et du FRBR, adapté au contexte nouveau du web des données.
OO, c’est pour Orienté objet, terminologie plus informatique que Entité-Relation, qui n’envisage les choses que sous un angle purement conceptuel (et hors cadre technique).
Cela induit une manière différente d’exprimer les concepts manipulés. Ainsi, dans le modèle CRM, il n’y a pas d’attribut : il n’y a que des propriétés.
Par contre-coup, pour désigner le modèle FRBR initial, dans sa terminologie "Entité-relation", celui-ci se trouve rebaptisé FRBRER.
- C’est au sein de l’IFLA qu’a été conçu le modèle FRBR
- C’est au sein du W3C qu’a été développé le modèle RDF
- Pour le FRBROO, le groupe de travail FRBR de l’IFLA et le groupe CRM du CIDOC (ICOM) fusionnent en 2003
La première version de FRBROO date de 2008.
Une ontologie FRBR
Adapter le modèle FRBR au web des données, c’est donc
- définir l’ensemble des classes (ex-entités) et des propriétés (ex-relations + ex-attributs), leurs spécificités, etc. (ce qu’on peut relier ensemble ou non, etc.)
- Attribuer des URI à une classe ou un attribut
Pour pouvoir dire que
http://data.bnf.fr/13505466/romain_gary_education_europeenne/
est du type FRBR oeuvre, il faut pouvoir disposer d’un URI pour le type oeuvre dans le modèle FRBR (qu’on pourrait abréger en frbr:work, par exemple) - Il faut aussi tenir évidemment compte de l’apport des musées, puisque le modèle FRBR initial est conçu pour des descriptions bibliographiques.
L’idée est d’anticiper aussi une éventuelle intégration d’autres modèles de descriptions (au hasard : archivistique – pourquoi pas ?)
Plusieurs documents ont été produits, permettant de définir ce modèle
- d’abord un "rapport" décrivant textuellement ce qu’on obtient.
Vous trouverez sur cette page la dernière version de mai 2013 [pdf]. - ensuite
un ensemble de schémas donnant des exemples de graphes types pour rendre compte de la structure obtenue - Enfin l’ontologie elle-même, exprimée en schémas RDF, dont plusieurs versions sont accessibles sur cette page [dernière version].
On y voit notamment que les deux premières classes définies sont celles de "Work" et de "Expression".
PRESSOO
Pendant la journée Sudoc-PS à l’Abes (où la question a été abordée) l’élaboration du modèle PRESSOO, présenté succinctement ici, élaboré par l’ISSN et la BnF : le "oo" final permet de précise que c’est bien un prolongement de FRBROO et non du modèle FRBR initial (désigné FRBRER).
PRESSOO vient répondre à la question "Et Dieu les périodiques dans tout ça ?"
Donc il devrait devenir possible de faire rentrer les périodiques dans ce modèle. Évidemment, il faut se demander l’intérêt qu’on en tire, au regard des usages définis par le modèle FRBR pour les utilisateurs :
- trouver
- identifier
- choisir
- obtenir
Exemple : au sein d’un titre précis, le lien entre la revue papier et les différents accès à la revue en ligne (selon les plate-formes aggrégatives) sera sans doute plus perceptible.
Par ailleurs, la visualisation des titres qui fusionnent, qui "deviennent", qui meurent et renaissent de leurs cendres, etc. — bref, l’apparition de liens entre revues (au niveau de l’oeuvre) vont sans doute devenir plus intéressantes.
On peut supposer que cette modélisation qui est actuellement développée devrait à terme faire l’objet d’une validation par l’instance qui développe FRBROO , pour réintégrer in fine le modèle général.
Bref, voilà où il semble qu’on en soit :
Mise à jour du schéma
Suite aux remarques de P. Le Boeuf en commentaire, voici un schéma plus exact
Au fait
Voici ma présentation FRBR lors de cette formation.
Rien de bien original, et souvent abscons sans le discours prévu pour l’accompagner. J’ai tout de même pu profiter, sur les exemples d’applications FRBR, de la présentation d’OpenCat lors des Journées Abes 2013, et d’un billet paru le matin même de la formation sur le blog Punktokomo concernant theses.fr.
J’ai découvert tout récemment une fonction Excel (et LibreOffice) qui répond enfin à l’un besoin ancien (et même plusieurs). Je vous en donne donc le principe, puis deux exemples d’utilisations. Si vous avez d’autres exemples d’usages, je suis d’avance intéressé.
Principe
Vous avez deux tableaux, qui contiennent tous deux une colonne où se retrouvent des identifiants communs (n°, ISBN, code-barres, titre, etc). Le tableau 1 est celui que vous voulez enrichir, avec des infos tirées du tableau 2.
Cela ne permet pas exactement de jointer deux tableaux, mais de reproduire dans le tableau 1 tout ou partie des infos du tableau 2, sur la base d’un identifiant commun (présent n fois dans le tableau 1, mais 1 fois dans le tableau 2)
La fonction RECHERCHEV() contient les paramètres suivants :
- Paramètre 1 : dans le tableau 1, quelle valeur va devoir être retrouvée dans le tableau 2 (l’identifiant commun)
- Paramètre 2 : où est le tableau 2 (dont la 1ère colonne contient l’identifiant qu’on va chercher comme premier paramètre)
- Paramètre 3 : si on trouve dans la colonne 1 du tableau 2 l’identifiant défini comme paramètre 1, quelle valeur récupère-t-on (donc : n° de colonne du tableau 2)
- Paramètre 4 : FAUX
(FAUX pour dire : la correspondance des deux identifiants doit être exacte)
Ca a l’air un peu abstrait ? C’est pourtant très pratique, donc on va voir ce que ça donne en vrai
Exemple 1 : enrichir une liste d’informations extraites d’une liste plus longue
Imaginons un prof qui vous envoie une bibliographie de 100 ouvrages : Titre, Auteur, ISBN (sympa !). Vous voulez enrichir cette liste de leur cote (quand vous en avez un exemplaire dans votre bibliothèque).
Une solution un peu brutale, mais rapide, consiste à extraire la liste de vos dizaines de milliers d’exemplaires (même si Excel 2007 accepte désormais 1 million de lignes, mieux vaut quand même l’éviter) avec : ISBN, localisation, cote.
- Le tableau 1 sera donc celui de l’enseignant (100 lignes)
- Le tableau 2 sera votre liste d’exemplaires (disons : 7811 lignes – c’est comme ça)
Dans chaque tableau, la première colonne est l’identifiant commun, à savoir l’ISBN (nettoyé, c’est-à-dire sans tiret — c’est mieux pour être sûr de matcher plus aisément les 2 listes).
Dans le tableau 1, je rajoute en dernière colonne à droite la formule qui va
- [Paramètre 1] prendre l’ISBN de la première colonne du tableau 1
- [Paramètre 2] chercher cette valeur dans le tableau 2
- [Paramètre 3] s’il trouve l’ISBN, prendre la 2e colonne (la localisation)
- [Paramètre 4] faire une correspondance exacte sur l’ISN (‘FAUX’)
Ce qui me donne pour la première ligne (cellule D4) la formule : RECHERCHEV(A2;$F$2:$I$7812;2;FAUX)
Exemple 2 : attribuer une typologie plus large sur la base d’une typologie fine
Imaginons que vous ayez 2 listes :
- La liste des étudiants emprunteurs de votre Université, avec mention du code Diplôme dedans (extraction du SIGB)
- La liste des codes Diplômes, avec libellé complet et mention du cycle et de l’UFR
Si vous voulez faire des stats sur votre population d’étudiants et leurs pratiques de prêt, il est vraisemblable que les sous-groupes par code diplôme seront trop réduits : il sera donc plus utile d’exploiter l’info Cycle et/ou UFR.
Vous avez donc besoin d’attribuer à chaque étudiant son cycle et son UFR, à partir de la seconde liste.
Puis
Bon, il faut me croire sur parole si je dis que chacune des valeurs présentes (de manière répétée) dans la colonne C [tableau 1] l’est également (mais une seule fois) dans la colonne G [tableau 2].
Je suis convaincu que pour la gestion de la documentation électronique, par exemple, cette fonction peut se révéler très utile (par exemple si on a un tableau avec des ISSN et des stats, et un tableau avec des ISSN et des prix ou des noms de collections Elsevier).
Voici comme promis quelques extraits complètement arbitraires de l’étude d’impact diffusée par l’Abes concernant le projet de mise en place d’un SGB mutualisé.
Ces extraits ne vous dispensent évidemment pas de la lecture du reste : Le fil conducteur de mes extraits, en gros, c’est que ça concerne tous les établissements du réseau, et tout de suite.
Par exemple la mise en place d’un SGB commun dans les nuages pose la question : que deviennent les ressources humaines actuellement affectées à l’administration et à la gestion courante des serveurs et du SIGB (et tous autres outils gravitant autour : résolveur de liens, AtoZ) ? Quelle est la nature du travail qui leur resterait (s’il leur en reste)
Le scénario 1 évoque en étape 3 :
Remplacer le SIGB installé localement par les services en ligne du SGB : passage d’un investissement + fourniture de logiciel + fourniture de services (de support notamment) à un abonnement annuel + des fournitures de services
Pour vous, ça veut dire quoi ? Et si vous n’êtes pas d’accord, ça veut dire quoi ?
Ainsi sous mon précédent billet, Anne-Sophie a laissé en commentaire : "on ne comprend pas bien d’où sort le scénario 3." D’une certaine manière, il me semble que c’est aux établissements d’y répondre, soit en l’évacuant d’emblée (parce que aberrant), soit en l’imposant comme évident — par exemple sous la forme : Il est exclu que nous migrions sur une plate-forme dans les nuages sur laquelle nous n’aurions plus la main, alors que nous avons développé en interne des compétences techniques exceptionnelles, et qu’en plus votre solution n’est même pas open source.
Ou tout autre argumentaire (bien construit ou non) qui amène à penser qu’une instance commune pour une quasi-totalité du réseau, même sur le long terme, est purement illusoire.
Donc les autres citations ci-dessous ne reprennent pas du tout la diversité des problématiques évoquées dans le document, et ne vous permettent pas de ne pas lire son introduction, ses enjeux, et les impacts évoqués.
Préambule (par M. Bérard)
Nos destins sont étroitement liés mais là où vous attendez les fonctions d’un système local en mieux, l’ABES attend un système qui remplacerait CBS, le logiciel coeur du Sudoc.
[A propos de la bonne volonté espérée de la part des fournisseurs]
En cas de développement d’un outil de catalogage national extérieur au SGB faute de solution crédible de ce dernier, le fournisseur sera-t-il d’accord pour que son SGB soit interconnecté avec l’outil de catalogage qui serait développé par l’ABES ? Assurera-t-il la synchronisation entre le SGB et la base miroir ? Et entre son SGB et celui d’un concurrent ?
[Et si la mutualisation ne prenait pas ? - p. 6]
Les établissements sont autonomes. L’ABES n’a ni le pouvoir ni la volonté d’imposer un seul système qui s’imposerait à tous, bien que cela semble la solution la plus simple et rationnelle.
[De l'impossibilité de ne rien faire en attendant que l'horizon s'éclaircisse]
Il n’est pas possible de reporter toute décision dans l’attente de dissiper toutes ces incertitudes : ce serait figer toute évolution d’un dispositif qui doit s’adapter à la nouvelle donne du signalement du numérique. L’initiative d’une base de connaissance publique menée en collaboration avec nos partenaires européens pourrait constituer une première étape du dispositif.
Ne rien faire pourrait entraîner le délitement du réseau Sudoc : une bibliothèque du réseau a déjà signé un contrat pour une solution hébergée. Elle prévoit de ne plus produire dans le Sudoc et demande à alimenter le catalogue collectif depuis la base internationale. Ce mouvement peut faire des émules.
Les enjeux
Petit rappel sur l’évolution interne du projet initial et définition de la notion de SGB (p. 10) :
À l’origine, il s’agissait simplement de faire une économie d’échelle par l’utilisation d’un SIGB commun à plusieurs établissements. Il s’agissait aussi de réduire le nombre de systèmes pour en simplifier l’interopérabilité. L’ABES aurait alors essentiellement joué le rôle de porteur d’une commande groupée.
La réflexion a pris une autre dimension avec l’arrivée des premiers systèmes de gestion de bibliothèque de nouvelle génération caractérisés par :
- Le remplacement de l’acquisition d’un système local par un abonnement à un service dans les nuages (« Software as a Service ») ;
- L’usage, par toutes les bibliothèques abonnées au service, d’un seul système commun [...];
- [...] une plate-forme de création et de partage de nouveaux services;
- L’intégration et la rationalisation des circuits de traitement des collections physiques et des ressources en ligne [...]
- L’intégration et la rationalisation des multiples systèmes locaux : SIGB, prêt entre bibliothèques, liste AtoZ, ERMS, [etc]
- La fourniture d’un vaste ensemble de métadonnées internationales
Sur les limites du Sudoc actuel concernant les ressources électroniques et quelques échecs antérieurs (p. 10-11) :
Le catalogue SUDOC ne parvient pas à organiser efficacement le signalement des ressources électroniques malgré les demandes de plus en plus pressantes des établissements[...]
Trois projets dans ce sens ont échoué.
En 2004 le projet APE (Accès aux périodiques électroniques) [...].
Au même moment le projet de Portail SUDOC visait à donner accès à l’ensemble des ressources documentaires des établissements [...].
En 2010-2011 le projet d’ERMS, porté au départ par Couperin [...]
Pour résumer (p. 13)
Un SUDOC dans les nuages incluant les fonctions des systèmes locaux apporterait :
- Une solution à la gestion et au signalement des collections électroniques,
- Une amélioration du signalement des collections imprimées (voir 2.1.4)
- Une économie d’échelle.
Impacts pour les établissements > Technique et organisation
Voir d’abord le plan des différents aspects abordés :
Concernant les besoins en formation et la "répartition des compétences techniques" (partie 2.1.2, p. 12)
Le service d’informatique documentaire devra paramétrer le niveau local du SGB. Il pourra en adapter le fonctionnement local via des API, voire reconfigurer les workflows de certains services ou créer de nouveaux services sur la plate-forme de services partagés. Les établissements souhaiteraient que l’ABES organise des formations nationales à ces outils et prenne en charge des adaptations communes.
Sur les données locales, qui cesseront d’être locales (partie 2.1.4, p. 13)
La distinction actuelle entre catalogage local et catalogage partagé sera profondément remaniée. Le SGB distinguera différents niveaux de données, des données globales partagées librement au niveau international, des données propres à un groupe de bibliothèques, des données propres à une bibliothèque. Mais toutes ces données seront liées entre elles dans un système unique et il n’y aura plus de copies de données entre système local et système central.
Sur le catalogage local, qui lui aussi cessera de l’être (partie 2.1.7) — les établissements seront-ils d’accord (à voir : quelles sont les raisons du maintien d’un catalogage local ?)
Sur l’intégration entre le SGBM et le système d’information de l’établissement (partie 2.1.8, p. 15 du PDF) : j’invite tout particulièrement tous ceux qui ont à gérer ces interconnexions avec Apogée, Sifac, le CAS de leur établissement à évaluer la fluidité et l’optimisme de la description avec les difficultés qu’ils peuvent actuellement rencontrer.
Impact pour les établissements > Questions économiques
Le passage d’un SIGB local au SGB sur le Web constitue un changement de modèle économique. L’établissement n’acquiert plus ni logiciel ni matériel mais seulement un service auquel il s’abonne annuellement.
Dans ce contexte nouveau, le modèle économique des fournisseurs est tout à fait différent
Dans ce contexte la notion de support aux établissements, qui représente aujourd’hui le plus gros coût, change de sens. Il n’y a plus à proprement parler que le système commun qui soit susceptible de pannes ou de dysfonctionnements. Un dysfonctionnement spécifique à un établissement ne peut guère être qu’une inadaptation du système commun à un fonctionnement local particulier ou une erreur de paramétrage du niveau local du système commun ou un problème dû au réseau local.
Attention, il y a dans le document une partie "Impacts économiques sur les établissements", et une autre plus loin "Impacts économiques sur l’Abes, répercutés sur les établissements". Ne la ratez pas !
Cette partie contient notamment en point 3.2.2 (ou dans le PDF : p. 27) une évocation des (sur)coûts durant la phase de test, où il faut maintenir le système actuel, et déployer en même temps un nouveau système : donc ressources humaines et compétences, maintenance, etc.
L’étude d’impact SGBM m’a permis de découvrir la procédure du dialogue compétitif : une vraie mise en production du logiciel sur plusieurs établissements pour tester l’outil et ses limites en grandeur nature. La rédaction du cahier des charges est faite en cours de route.
Si la formule du dialogue compétitif est retenue, qui implique de tester les solutions de plusieurs fournisseurs sur une longue durée (12 à 18 mois), les frais afférents seront partagés entre toutes les bibliothèques SUDOC : il ne serait en effet pas équitable de faire supporter la charge financière de la phase de test aux seuls bibliothèques pilotes dans la mesure où le système retenu le sera à terme pour l’ensemble de la communauté, qui doit ainsi participer à la charge financière des tests.
Donc même si votre établissement n’est pas pilote, vous êtes immédiatement concernés.
Je ne souligne pas ce genre d’extrait pour vous inciter à la révolte, mais pour vous permettre de réaliser que l’impact est immédiat pour l’ensemble du réseau. Le raisonnement tenu ci-dessus me semble par ailleurs tout à fait…. raisonnable.
Et puisqu’on parle de coûts, j’ai trouvé une phrase d’une construction un peu complexe, dont j’irai prochainement m’assurer que je l’ai bien comprise (p. 27)
Comme aujourd’hui avec le catalogue SUDOC, Il ne s’agira pas de faire payer aux établissements l’ensemble des services rendus par l’ABES qui ne leur facture actuellement que les coûts directs du SUDOC hors dépenses de personnels fonctionnaires.
Impact sur les établissements > Questions juridiques
Bien évidemment, est posée la question des données personnelles :
En matière de données personnelles, outre l’application des recommandations générales, il faut attirer l’attention sur deux points, la localisation et le contenu des données. Deux pays, le Canada et l’Australie, ont déjà imposé aux fournisseurs de SGB que les données personnelles soient hébergées par des data centers nationaux. Le comité de pilotage a recommandé que le projet de l’ABES étudie la possibilité d’un hébergement en France (projet de Cloud Ile-de-France) ou du moins en Europe. Il est possible de réduire au minimum le contenu des données personnelles transférées. Un SGB peut a priori fonctionner avec seulement le nom de l’usager et son identifiant numérique, codes-barres ou numéro de puce sans contact. Toutefois les besoins fonctionnels d’une bibliothèque nécessiteront souvent plus d’informations : adresses de mail et de courrier, téléphones pour les rappels de documents en retard et la communication ; niveau et domaine d’étude ou de recherche pour déterminer les droits d’accès et établir des statistiques d’usage.
Impacts pour l’Abes > Impacts techniques
Les transferts réguliers ne sont qu’une partie des nombreux traitements d’export régulier (Worldcat,
INIST, VIAF, RNBFD, Google Scholar) et d’import régulier (BnF, ISSN, Fmesh, Springer) ou ponctuel
(licences nationales).
On veut bien le croire :
(je note au passage le projet de Reverse Proxy, dont je suppose qu’il doit aller avec l’outil de signalement national des ressources en ligne ?)
SGB open source ou commercial ?
Le principe d’avoir un logiciel open source, pourquoi pas — mais sans utilité immédiate derrière
Il serait souhaitable que l’appel d’offres de l’ABES suscite une offre basée sur un produit open source susceptible d’être comparée aux offres commerciales. Mais il faut aussi souligner qu’un SGB en open source n’aurait pas exactement les mêmes avantages que les logiciels open source utilisés aujourd’hui en bibliothèque. Un SGB est un système unique pour toutes les bibliothèques. Chacune pourra consulter le code source et peut être mieux comprendre comment adapter tel service, lorsque ce sera prévu et possible, ou comment ajouter un nouveau service, mais elle ne pourra en aucun cas adapter le code commun à ses propres besoins. C’est la raison pour laquelle les fournisseurs commerciaux estiment offrir une solution équivalente avec une bonne documentation sur les fonctions de base du système couplée à une plate-forme de services ouverte.
Je suis certains que de nombreux collègues pro-actifs sur l’open source auraient à commenter cette réflexion — ne vous gênez pas !
SGBM et Discovery Tool national
L’autre étude (menée par le cabinet Pleiade) est évoquée dans son articulation avec le futur SGBM, notamment en 5.1.5 (p. 32) au sein de la partie 5.1 "Eléments de choix pour un scénario") :
Cette base doit permettre le signalement des périodiques en ligne, mais aussi une recherche au niveau de l’article
Elle sera alimentée parallèlement par les bases de connaissance open source GOKb et Knowledge Base+. L’ensemble des établissements du réseau SUDOC pourra localiser ses ressources électroniques dans la base nationale.
[...]
Seules les données d’articles acquises dans le cadre national (licences nationales, plate-forme ISTEX) seront intégrées au catalogue national.
SGBM et RDA
Dans tous les scénarios évoqués (en particulier en première ligne de la procédure de mise en place du scénario 1) est mentionnée la création d’un profil RDA.
Même si je soupçonne vaguement de quoi il s’agit (déclaration d’un profil de l’institution, pour disposer d’une URI dans un environnement de catalogage RDA où toute autorité, y compris l’autorité catalogueuse, doit disposer d’une notice d’autorité — donc d’une URI), j’avoue ne pas savoir où ce genre de choses se passe, et quelle forme ça peut prendre.
C’était ma parenthèse "technique"…
Conclusion
Ces extraits ne sont donc décidément pas représentatifs de tous les points abordés par le document. Ce n’était pas mon ambition, donc je ne suis pas sûr de devoir m’excuser du résultat.
Comme ce centon a été (re/dé)composé en plusieurs fois, j’espère qu’il reste globalement compréhensible.
Je dépose ici un projet de texte que je compte diffuser en interne, à la direction et aux personnes que ça peut intéresser. J’aurais pu leur en laisser la primeur, mais il me semble aussi intéressant de le soumettre à la relecture de ceux qui ont lu le rapport complet (collègues Abes compris) pour m’assurer qu’ils ont compris la même chose (notamment mon schéma sur les 3 scénarios).Je le mets également à votre disposition, pour le cas où vous en trouveriez l’usage (et vous éviter ainsi de le re-rédiger vous-même), l’idée étant de fournir au conseil de direction l’enjeu global du document, afin qu’une délégation auprès d’un "groupe technique interne" puisse se faire, une fois les enjeux assimilés – en leur évitant ainsi de devoir déléguer en aveugle, et de leur permettre de savoir ce qui se passe.
Si vous avez des suggestions d’amélioration, n’hésitez pas.
Je conserve comme objectif final de commenter le site de l’Abes qui est consacré à cette étude, mais j’avance avec méthode pour y engager, autant que possible, mon établissement.
Je compte une dernière étape avant cet objectif : la sélection de certains extraits de l’étude, qui ont particulièrement retenu mon attention. L’idée n’est pas de les commenter sur ce blog, mais de les signaler, et éventuellement de les expliciter. La discussion doit ensuite avoir lieu là-bas. Evidemment.
———————–
Synthèse de l’étude d’impact SGBM
L’Abes vient de produire le résultat de 2 études, avec appel à réactions et commentaires de la part du réseau.
Voici une présentation concise de l’un de ces 2 documents : l’étude d’impact de la mise en place d’un SGBM (système de gestion de bibliothèque mutualisé).
Ce document rappelle d’abord l’historique du projet, avant d’en décrire les principaux enjeux.
Le SGBM est défini comme un outil de gestion des collections de tous types (monographies et périodiques, papier et en ligne, acquises ou numérisées), dans toute la chaîne de traitement de ces ressources (acquisitions, signalement, prêt-retour, désherbage).
Cet outil serait mutualisé dans toutes ses fonctionnalités, pour l’ensemble du réseau ou presque.
Le document commence donc par définir les contours de cet outil (en insistant particulièrement sur l’émergence des outils de découverte « de nouvelle génération », et leur caractéristique propre d’être systématiquement dans les nuages).
Avant d’évoquer et décrire les 3 scénarios envisagés, l’étude décline les impacts qu’aura la mise en place d’un SGBM pour les établissements, pour l’Abes et pour le réseau Sudoc, dans ses aspects :
- organisationnels et techniques
- juridiques
- financiers
Puis il donne un calendrier de déploiement envisagé (compter 5 ans au moins pour le gros des migrations).
Les scénarios vont pour l’essentiel décliner plusieurs manières de concevoir cette « mutualisation » :
- Instance unique, centralisée (sur des serveurs) à laquelle se connecteraient les établissements pour travailler
- Instances multiples interconnectées
- Hybride
Pour en donner un des aspects techniques les plus immédiats et significatifs : l’adoption d’un SGB permettrait pour chaque bibliothèque de n’alimenter et gérer qu’une seule base, et de se passer des chargements quotidiens des notices Sudoc à jour. Les collections de la bibliothèque seraient dans une seule base, accessible immédiatement
- à la fois depuis l’outil de gestion utilisée par la bibliothèque
- et par l’interface de recherche nationale des collections des BU (actuellement
http://www.sudoc.abes.fr/
).
Cf. ci-dessous un schéma qui récapitule les 3 scénarios envisagés
Pour chaque scénario, l’étude d’impact propose aussi des schémas assez complexes sur les articulations entre les outils, parce que :
- Ils présentent en une image la diversité des situations et la coexistence d’outils multiples
(or aucun établissement n’a tous ces outils et n’est dans toutes ces situations à la fois) - La distinction entre les rectangles "données" et les rectangles "interfaces d’accès à ces données" (en lecture/écriture) n’est pas immédiatement visible.
De même la distinction entre les installations locales et les interfaces "personnalisées" à une base globale n’est pas évidente
Pour comprendre les problématiques évoquées et les scénarios retenus, il faut revenir sur 2 aspects qui se sont rajoutés en cours du projet à la demande initiale (plusieurs établissements voulant réinformatiser au même moment) :
- l’apparition des outils de nouvelle génération dans les nuages, comme Alma et WMS (d’OCLC)
Conséquence : L’Abes a renoncé à faire un simple groupement de commande pour des SIGB classiques, et décidé de passer à une autre dimension du projet. - la nécessité du remplacement de CBS (outil de gestion de la base Sudoc derrière WinIBW), qu’OCLC cessera de maintenir bientôt
Conséquence : L’Abes doit coupler la migration dans un futur SGB à la question du remplacement de CBS, en partant du principe qu’il n’est pas garanti qu’un de ces SGB soit capable d’assurer cette mission de catalogage national.
La présente synthèse ne restitue évidemment de tous les aspects qu’évoque le document. A titre d’exemple, l’étude d’impact prend aussi en compte le cas des établissements qui ne migreraient pas (ou pas avant trèèèès longtemps) et pour lesquels les chargements Sudoc demeureraient une nécessité.
Je sais qu’il est prévu un site dédié pour réagir au contenu des documents dont il va être question ci-dessous, mais ce n’est pas du contenu des documents dont je veux parler.
Le 29 mars ont été publiées sur le fil de l’Abes 2 études :
- Etude d’impact de l’implantation d’un SGBM au sein du réseau Sudoc – impact pour les établissements, pour l’Abes et pour le réseau
- Rapport de la société Pléiade sur des scénarios de mise en place d’un discovery tool pour réaliser un signalement national des ressources électroniques
Dans la foulée paraissaient les sites ouverts à commentaires, sur ces mêmes études (étude d’impact SGBM, discovery tool). Et l’Abes lançait un appel à réactions et commentaires de la part du réseau, "de préférence avant le 15 mai".
C’est la deuxième fois (à ma connaissance) que l’Abes s’efforce de solliciter de manière ouverte son réseau, incontestablement solide et actif, sur un projet précis.
Souvenez-vous le projet d’établissement (Arabesques 65, février-mars 2012) :
Nous avions aussi placé des espoirs dans la mise en commentaire sur le web des idées charpentant notre projet. Force est de reconnaître que nos attentes – sans doute naïves – furent largement déçues à moins que la période – l’été – n’ait été mal choisie : les commentaires se sont comptés sur les doigts des deux mains.
Je ne suis pas community manager, je n’ai pas de trucs, astuces et conseils à donner à l’Abes (ou à qui que ce soit, d’ailleurs), pour expliquer comment il faudrait faire.
Ce que je peux essayer d’expliquer, en revanche, c’est pourquoi dans le cas présent la méthodologie utilisée risque de (me/nous) poser quelques difficultés.
Le principal problème : le comité technique, qui existe depuis déjà pas mal de mois et travaille au projet, engage des établissements. L’étude évalue l’impact d’un SGB sur les établissements. Ce sont donc aux établissements de réagir à cette étude pour voir s’ils s’y retrouvent.
En gros : j’envisage difficilement de lire l’étude SGB puis d’aller la commenter à titre personnel sur le site dédié.
Si je suis intéressé par le projet (ce que je suis !), il faut donc que je puisse parler au nom de mon établissement. Même mieux : que mon établissement se soit engagé dans une lecture, et un retour construit et constructif sur cette étude.
Cela signifie
- soit une délégation forte de la direction, où je partirai en électron libre : j’émettrai des remarques sans aucun doute pertinentes, mais sans avoir consulté mes collègues (donc pour "l’intelligence collective", on repassera)
- soit une lecture et discussion au niveau du conseil de direction
- soit la constitution d’un groupe de travail
Dans tous les cas
- c’est donc à moi de convaincre ma direction
- c’est à moi de dégager du temps pour m’y plonger, et (dans les scénarios 2 et 3) de faire en sorte que les collègues en trouvent
- c’est à moi d’organiser le tout en urgence, pour avoir produit d’ici le 15 mai quelque chose d’intéressant
(je rappelle que d’ici le 15 mai, il y a les vacances d’avril et déjà quelques ponts)
N’aurait-il pas été plus simple :
- que ma direction soit informée de cette demande de l’Abes directement par l’agence (soit par un courrier/courriel de M. Bérard aux directeurs, soit par un appel sur le forum de l’ADBU)
pour éviter que ça ne vienne "d’en bas" - de la prévenir 3-4 semaines à l’avance, afin d’anticiper ce chantier et de l’intégrer au mieux dans le calendrier des autres activités (par exemple : les enquêtes Couperin…)
Pour le reste, je vais faire au mieux, en diffusant l’information en interne, en insistant particulièrement sur les pages les plus vibrantes du rapport SGBM : ainsi cette sous-partie intitulée "3.2 Des coûts répercutés aux établissements" (p. 27).
Ca donne envie de se demander ce qu’ils nous réservent, non ?
(précision ultime : quand j’écris "je" ci-dessus, ce n’est pas pour laisser croire que je, Etienne Cavalié, sois le seul de mon établissement à suivre ces questions : c’était un "je philosophique", comme disait ma prof de terminale)
Traduction du début de cet article :
http://en.wikipedia.org/wiki/Wikipedia:Wikipedia_Signpost/2013-03-18/Interview
(le titre de mon billet est un mauvais jeu de mot partant de l’expression Meeting in the Middle qui, à ma connaissance, n’a rien à voir avec l’univers de Tolkien. Que les anglicistes chevronnés et les spécialistes d’Heroic Fantasy daignent me pardonner)
Demandez à des bibliothécaires ce qu’ils pensent de Wikipedia, et vous obtiendrez sans doute quelques réponses intéressantes. Certains se lamenteront sur la paresse de cette génération Google et de leur hyper-dépendance à l’égard de Wikipedia.
Certains décriront avec fatalisme l’excellence de leurs collections ignorées au profit des ressources en ligne.
Certains le verront comme une "compétition". Et certains vous diront que c’est la plus grande invention depuis le fil à couper le beurre.
Wikipedia et les bibliothèques travaillent dans le même domaine : les 2 veulent accroître la quantité des connaissances disponibles pour le plus grand nombre possible, gratuitement.
Mais en dépit de ces objectifs communs, les 2 entités sont encore restées très distantes l’une de l’autre.
Certes, il existe des bibliothécaires wikipediens, et il existe des bibliothèques qui travaillent avec les projets GLAM de Wikipedia.
Il y a Wikipedia Loves Libraries.
Les wikipédiens ont développé des outils et des liens pour aider à intégrer les ressources des bibliothèques, mais tout cela reste sous-utilisé.
Les bibliothèques contiennent de vastes réserves de connaissances, et beaucoup veulent venir à la rencontre de Wikipedia, d’une manière ou d’une autre. Comment Wikipedia peut participer à la construction du pont pour accéder à cette connaissance ?
Interfaces actuelles Wikipedia-Bibliothèques
Un des freins à l’intégration est le système de catégorisation de Wikipedia.
Dans ses premiers jours, Wikipedia a évité d’adopter les schéma standard organisationnels utilisés dans les bibliothèques, comme l’indexation matière de la Bibliothèque du Congrès.
Les bibliothèques attribuent plusieurs mots-clés à leurs items : Wikipedia se contente d’un titre unique, et parfois un mode de désambiguïsation entre parenthèses. Les catégories Wikipedia sont venus plus tard, et sont ajoutées (ou pas) au bon vouloir des contributeurs.
Certains efforts ont été faits pour intégrer les pages de Wikipedia dans des contextes plus larges de métadonnées "library-friendly".
Le projet VIAF est une tentative d’unifier les différents systèmes de gestion des autorités utilisés par les bibliothèques nationales. Un modèle fournissant des liens VIAF a été ajouté à de nombreux articles biographiques (cf. les commentaires sur le modèle VIAF pour Wikipedia). Les bibliothèques bénéficient également de la page Special:BookSources, qui exploite le modèle de citation sur la base d’une requête sur ISBN. Cette page permet aux lecteurs d’utiliser des catalogues collectifs comme WorldCat d’OCLC, et de trouver l’item cherché dans une bibliothèque proche de chez lui. OCLC fournit égalemetn un lien vers les livres à travers l’infobox Livre. Quoi qu’il en soit, ces liens et services ne fournissent pas d’état de collection de la bibliothèque "locale" sur un sujet, ils ne font que pointer vers une ressource spécifique si demandée.
Les bibliothécaires ont continué d’explorer différentes manières d’associer leurs collections avec les articles Wikipedia correspondants. Les efforts de l’Université de Washington et de l’Université de Houston ont visé à ajouter des liens externes vers des pages de collections pertinentes. Certains ont esséy d’utiliser les partenariats GLAM avec des wikipediens expérimentés pour améliorer l’intégration de leurs ressources dans WIkipedia.
Un nouvel outil

John Mark Ockerbloom, architecte d’une bibliothèque numérique et planificateur à l’Université de Pennsylvanie, a conçu un outil différent, appelé : "Vers les bibliothèques" (Forward to libraries).
Ce service utilise le titre de l’article Wikipedia comme sujet ou mot clé de recherche dans la bibliothèque choisie par l’utilisateur, en utilisant l’opac de cette bibliothèque. On peut choisir sa bibliothèque dans une "sous-page", ou d’installer un cookie. Ockerblomm a échangé sur ses idées dans un blog la semaine passée.
Cory Doctorow, contributeur de Boing Boing, auteur de fiction et wikipedien a été impressionné et a qualifié le template de "formidable proposition pour créer des synergies de recherche entre les bibliothèques et Wikipedia".
Le nouveau modèle d’Ockerbloom se trouve à l’adresse :
http://en.wikipedia.org/wiki/Template:Library_resources_box
.
Pour en voir un exemple d’utilisation, voyez dans la section "Further reading" de la page Louisa May Alcott.
[La suite de l'article est une interview de John Mark Ockerbloom]
[Puis reprise de l'article]
Modèles et questions visuelles
Les modèles qui créent des boîtes dans les pages Wikipedia ne sont pas universellement acceptées chez les contributeurs. Beaucoup les trouvent peu esthétiques, et contestent leur utilités. Ces modèles peuvent aussi accroître le temps de chargement des pages, d’une manière disproportionnée pour les connexions à faible débit.
S’il y en a un trop grand nombre dans un article, le lecteur doit supporter un "template ghetto" en bas de page. Et en mode écriture, le modèle de boîte "Library Resources" n’a pas été soumis au vote d’une large communauté, même s’il a déjà attiré l’intérêt sur la page de commentaires. Il reste à voir comment l’idée va évoluer, et s’il gagne en soutien de la part des wikipediens.
Il n’y a pas qu’une seule manière pour une bibliothèque d’interconnecter ses ressources avec Wikipedia. La communauté n’a pas pour l’instant priorisé ce genre de relations. Néanmoins une chose est certaine : les bibliothèques veulent travailler avec Wikipedia. Vont-elles trouver un terrain de rencontre ?
Export Zotero en UnimarcXML : Mise à jour
Puisque jsicot s’est très obligeamment chargé de mettre à jour le translator Zotero qui permet d’exporter en Unimarc XML des notices de ses collections, je remets à disposition ce translator en remerciant Julien vivement : cette question traînait vraiment (la dernière mise à jour datant d’au moins 3 ans, et le langage des fichiers d’export ont beaucoup évolué avec le logiciel lui-même. Le translator UnimarcXML n’était plus opérationnel.
Télécharger le nouveau translator UnimarcXML
(Ouvrir le lien, enregistrer le fichier sur son poste — de préférence en l’appelant "UnimarcXML.js". Pour la suite de la procédure d’installation, celle-ci est toujours valable si vous voulez savoir où déposer ce fichier.)
Il faut aussi que j’apprenne à me professionnaliser, sur tous ces types d’outils, en utilisant les canaux adaptés.
Pour un petit bout de code comme ça, Julien a déposé sa mise à jour sur Github (en fait, là c’est Gist — faut encore que j’apprenne la différence entre les deux). J’en ai fait un fork ("fourche") pour y ajouter un paramètre qui manquait (l’URL en 856).
C’est plus sérieux que mon utilisation initiale de Google Docs pour vous proposer ce fichier.
Il me resterait encore à y ajouter quelques nouveaux paramètres pour prendre en compte les spécificités des thèses. Mais comme ce translator a surtout été conçu à destination de bibliothécaires, pour gérer leurs paniers d’acquisitions dans Zotero et les exporter ensuite vers leur SIGB pour passer des commandes… la "commande" de thèses n’est pas ce qui se fait de plus fréquent.
Donc je préfère indiquer dès à présent le translator mis à jour (d’autant que certains insistent !), et voir plus tard pour les améliorations.
N’hésitez pas à



















