A quoi sert l’OpenURL

Même si on en parle de plus en plus, même si de plus en plus de bibliothèques en sont dotées, je ne suis pas sûr que tout le monde voie clairement comment fonctionne et à quoi sert l’OpenURL. Il est possible que ce billet arrive trop tard et ne soit plus nécessaire. Dans ce cas-là je m’en réjouirai (tout le monde serait au fait de l’OpenURL).

Le principe de base est clair : en tant que chercheur, étudiant, lecteur, je rencontre sur Internet ou ailleurs des notices bibliographiques (articles, livres, vidéos, etc.). A chaque fois que j’en rencontre une, je veux qu’un lien apparaisse qui aille interroger directement le catalogue de MA bibliothèque, pour savoir si celle-ci peut me proposer le document.

Voyons à présent comment ça se concrétise.

Il vous faut deux extensions Firefox (la première fonctionne aussi avec Internet Explorer) pour le visualiser :

  1. OpenURL Referrer
  2. Zotero

OpenURL Referrer

OpenURL Referrer est une extension qui, dès qu’une référence bibliographique (identifiable comme telle par la machine, et pas par l’internaute) est présente sur la page, propose un lien vers le catalogue de la bibliothèque qui interroge ce catalogue pour savoir s’il contient la ressource (le livre s’il s’agit d’un livre, la revue s’il s’agit d’un article).

Donc vous installez OpenURL Referrer, et vous le configurez.

openurl-referrer-11

Je vais le configurer en supposant que je fais mes études au MIT. L’URL du résolveur OpenURL du MIT est : http://owens.mit.edu:8888/sfx_local/. Donc je la mets dans “Link Server OpenURL”. Et dans le champ Display link as Text, je mets : “Trouver le document”.
Si ce n’est pas mis par défaut, il faut cocher comme “version” (sous l’URL) : 0.1

openurl referrer preferences

J’ai trouvé ces paramètres en cherchant sur Google : “MIT OpenURL

Désormais, chaque fois que le navigateur va rencontrer une référence bibliographique, il va me proposer un lien cliquable “Trouver le document” vers le catalogue du MIT, m’indiquant si la bibliothèque possède la ressource en question.

Cela se voit immédiatement :

Si à présent je ne suis plus au MIT, mais à la l’université d’Angers (il y a des parcours singuliers, parfois), à la place de l’URL précédente propre au MIT, je mettrai : http://sfx6.exlibrisgroup.com:3210/sfxangers.

Et si je suis à Paris 6, je mettrai : http://jubil.upmc.fr/openurl.

A chaque fois, sur les mêmes sites, l’URL pointera sur mon catalogue.

Comment ça se passe ? Le site lui-même ne génère que la fin de l’URL, toujours la même, qui contient les métadonnées de la ressource (titre, auteur, ISSN, etc.). C’est le navigateur qui rajoute la racine déclarée dans les Préférences d’OpenURL Referrer. Tous les résolveurs acceptent une même syntaxe d’interrogation dans l’URL :

[Rq : c'est un livre en français, et le MIT ne l'a pas. L'existence du lien ne promet pas l'existence du livre]

Faire une requête en construisant une URL

Il n’a échappé à personne que pour interroger un moteur de recherche sur Internet (Google, Yahoo, Amazon, catalogue de bibliothèque), on peut

Le champ correspondant aux mots recherchés sera, s’appellera, selon la base : q, p ou “field-keywords”.

Mais pour une référence bibliographique, on peut avoir plusieurs champs qui caractérisent la ressource : auteur, titre de l’article, titre de la revue, ISSN, numéros des pages, etc.

L’idée simple de l’OpenURL, c’est que toute ressource référençant des documents utiliserait le même vocabulaire. La norme OpenURL, c’est donc un standard qui définit que le champ “Nom de famille de l’auteur” ne s’appellera pas “auteur”, “author”, “creator” ou autre, mais “aulast” (pour last name). Tout catalogue qui accepte l’OpenURL doit donc accepter que son champ Auteur s’appelle “aulast”.

De même, le titre de l’article sera, dans l’URL : “atitle” ; le titre de la revue : “title” ; l’ISSN : “issn”, etc.

Comme généralement le catalogue lui-même n’est pas nativement OpenURL, il faut installer un résolveur OpenURL (ou résolveur de liens, ou link resolver, ou link server) qui comprendra la requête OpenURL, la transmettra au catalogue (en Z39.50, par exemple) et récupèrera le résultat pour afficher la notice détaillée. De même que le catalogue a une URL d’accès, le résolveur a une URL spécifique. C’est l’URL racine à indiquer à OpenURL Referrer.

Zotero

Zotero est un logiciel de gestion bibliographique intégrée à Firefox. On remplit sa bibliographie en naviguant sur Internet. On peut y stocker des notices d’articles, de chapitres, d’ouvrages, de conférences, etc., rencontrées un peu partout. Si je fais une recherche dans le Sudoc, une liste de résultats peut être rapidement stockée dans ma bibliographie (liste des sites où Zotero est capable de reconnaître des références biblio et de les importer en deux clics).

Quand j’affiche une notice, j’ai un bouton “Localiser”. Il permet de bricoler la fin de l’URL en vocabulaire OpenrURL, en mettant bout à bout les infos contenues dans la notice (titre, auteur, etc.), et de rajouter en racine l’URL du résolveur indiqué dans les préférences.

localiser1

Preferences Zotero

Autres applications — Que devons-nous faire ?

[Rq préalable : Ex Libris, fournissant le résolveur SFX, de loin le plus répandu, se charge d'un certain nombre de démarches décrites ci-dessous. Tout ce qui nous reste à faire dans ce cas, c'est la comm'.]

OpenURL Referrer permet de générer un lien dès que des métadonnées sont présentes dans la page. Pour cela, il faut que la machine sache qu’il s’agit de métadonnées. Donc les informations doivent être à la fois écrites “en clair” pour l’utilisateur, avec des caractères droits et italiques, et sous forme de balise autofermante  <span> contenant les informations bibliographiques en mode OpenURL : ce sont les fameuses balises COInS dont parlait déjà Figoblog il y a fort longtemps. La balise <span> étant autofermante, un navigateur ne la comprenant pas ne l’affichera pas. Mais si le navigateur sait ce que sont ces balises, il va générer le lien conformément au profil demandé par l’utilisateur, càd rajouter l’URL racine propre à la bibliothèque, et produire le texte (“Trouver le document”) choisi par l’utilisateur.

Une telle balise <span> ressemble (à peu près) à ceci (cf. aussi cette page) :

<span class="Z3988" title="genre=book&amp;aulast=North&amp;aufirst=Simon&amp;title=XML"/>

Ou trouve-t-on des références bibliographiques ?

Les bases de données bibliographiques comme le Web of Science, Pascal, Google Scholar, savent produire ce genre de balises. Si la base est sur abonnement, il faut déclarer son résolveur (et sa version, car il y a deux versions du langage OpenURL…) auprès de son fournisseur. Ainsi, par reconnaissance de l’IP, le fournisseur mettra la bonne URL racine (on parle de “base URL” dans la norme OpenURL).

Les bibliographies d’articles dans les revues en ligne payantes. Sur IOP, IEEE et plein d’autres, l’éditeur du site est capable, à côté de la référence de l’article, de générer un lien OpenURL si on le lui demande gentiment. A noter que nous avons déclaré notre “URL racine” à ScienceDirect — il s’est mis à générer un lien OpenURL uniquement avec les métadonnées de l’article en cours de lecture : on cliquait sur le lien, on basculait sur le site de la bibliothèque qui renvoyait à l’article en question. L’intérêt de la chose m’a laissé pantois. Nous avons retiré le lien.

Exemple de lien OpenURL ("Disponibilité") depuis la bibliographie d'un article

Exemple de lien OpenURL (

Certains services de gestion de bibliographie gratuits et collaboratifs comme Connotea (CiteULike ne le fait pas encore) génèrent déjà des liens OpenURL avec l’extension OpenURL Referrer.

Les pages des sites des bibliothèques, devant prêcher la bonne parole, devraient comporter ces balises <span> à chaque référence bibliographique mentionnée. Les outils pour le faire facilement se multiplient. Et pourquoi pas dans nos catalogues : avec les moteurs de recherche web qui indexent de plus en plus le web invisible, Dieu sait le nombre de manières qu’un utilisateur a de tomber sur une de nos notices, dans notre catalogue, sans être passé par l’interface d’accueil. Donc s’il arrive directement sur une notice de livre, il peut apprécier un lien qui le renvoie directement à sa bibliothèque

A une époque, WorldCat générait ces liens. Du moins je les voyais sur les notices détaillées grâce à OpenURL Referrer. Je ne les vois plus pour l’instant (c’est curieux puisque WorldCat et l’extension OpenURL Referrer sont des produits OCLC). Plus généralement, tous les catalogues collectifs, qui dans une certaine mesure servent aussi de base bibliographique, devraient permettre cette fonctionnalité.

Le signalement des revues en ligne pourrait se faire de cette manière dans le Sudoc, et sur son propre Opac : régulièrement on se demande s’il faut cataloguer les revues en ligne dans le Sudoc. Déjà, si on pouvait demander au Sudoc un lien OpenURL, l’utilisateur pourrait, ayant trouvé une revue (papier ou en ligne), tomber sur le résolveur de sa bibliothèque qui lui dirait si celle-ci a la revue papier et/ou en ligne. De même, un lien dans l’Opac (notamment depuis les notices de revues, mais aussi depuis les monographies avec l’achat croissant de e-books) devrait permettre de rebondir rapidement des collections papier vers les collections en ligne.

Les postes publics des bibliothèques et les ordinateurs portables prêtés devraient donc proposer Firefox avec l’extension OpenURL Referrer préparamétrée (l’extension existe aussi pour IE7, mais je n’ai jamais compris comment les extensions IE fonctionnaient…).

Et pour les développeurs : Zotero ne passe pas d’accord avec les éditeurs de sites. Il s’appuie sur une communauté croissante de développeurs qui s’amusent à décortiquer le codage HTML des listes de résultats dans les catalogues, bases de données et autres, pour faire comprendre au logiciel que, sur telle URL, quand c’est violet c’est le titre, quand c’est vert c’est l’auteur, etc. (on trouve parfois des associations de couleurs un peu indigestes). Autrement dit, Zotero avale une information “mise en forme” et la restructure sémantiquement. Il en faudrait peu pour que Zotero prenne la place d’OpenURL Referrer, et génère à chaque référence rencontrée un lien OpenURL : sur HAL, OAISter, ArXiv, Pubmed, etc., toutes ces ressources gratuites qui ne dépendent donc pas d’éditeurs auprès desquels le fournisseur de notre résolveur OpenURL, non plus que le responsable de la doc électronique, pourrait déclarer les IP de ses utilisateurs.

NB : remarque sur SFX.

SFX est un logiciel remarquable. Mais je n’y ai rien compris la première fois que je l’ai rencontré : plusieurs liens sont proposés d’emblée, et on ne voit pas de raison a priori de cliquer sur l’un plutôt que sur l’autre. L’efficacité est là, mais en terme d’ergonomie il faudrait repenser la page de résultats. Parce qu’il est hors de question de prendre le temps d’expliquer à l’internaute ce qu’est l’OpenURL et poufrquoi il voit ce qu’il voit, alors que l’objectif de l’OpenURL est précisément de rendre la recherche plus intuitive (j’ai une référence — Hop ! je clique — et la bibliothèque m’indique si je peux avoir la notice en ligne ou en salle).

Biblio-webographie

Sylvain Machefert, L’OpenURL dans les institutions françaises, une chance pour la valorisation des ressources électroniques ?, Institut national des techniques de la documentation du CNAM – Mastère professionnel, 06/11/2007, [En ligne], http://memsic.ccsd.cnrs.fr/mem_00000613/fr/

“OpenURL”, Wikipedia, dernière mise à jour : 30/10/2008, [En ligne], http://en.wikipedia.org/wiki/OpenURL

“OpenURL”, Bibliopedia, dernière mise à jour : 18/04/2008, [En ligne], http://www.bibliopedia.fr/index.php/OpenURL

Que dire aux chercheurs qui n’utilisent qu’ArXiv ou CiteSeer ?

Cette question était posée à la fin du second article sur Google Scholar : lorsqu’on les interroge sur leur utilisation d’Inspec, certains chercheurs en informatique disent se contenter de CiteSeer (base d’archives ouvertes en open access, avec liens éventuels vers les articles publiés), de même que certains physiciens n’utiliseraient “que” ArXiv.

La remarque de professionnel qui me vient à l’esprit est : utiliser une collection d’articles au lieu d’une base de données, c’est confondre un catalogue et une bibliographie. Le catalogue référence les collections possédées, la bibliographie signale toute la documentation existante selon l’exhaustivité qu’elle a pris le soin de définir (tant de revues dépouillées, dans tel domaine, etc.). La bibliographie doit être prête à rendre des comptes sur le non-respect de sa charte de dépouillement, le catalogue s’enrichit selon un accroissement que partiellement maîtrisé des collections.

Mais c’est là oublier que la plupart des chercheurs, lorsqu’ils utilisent CiteSeer, ne cherchent pas à établir une bibliographie sur un sujet : cette biblio, ils l’ont déjà. Ce qu’ils veulent, c’est accéder à un article dont ils connaissent déjà l’existence. CiteSeer interviendrait, en quelque sorte, après Inspec.

On le voit bien dans la page d’accueil d’ArXiv : ce n’est pas adapté à une recherche par sujet.

Donc il est inutile de proposer aux chercheurs de remplacer CiteSeer par Inspec, puisque leur fonction n’est pas équivalente (la plupart du temps, s’entend).

Mais alors, par quel outil les chercheurs remplacent-ils Inspec (que nous payons si cher).

Dites-moi si je me trompe (si, si ! dites !), mais mon impression est : par aucun “outil”.

Leur manière de découvrir de nouveaux articles sur un sujet, c’est :

  1. en lisant d’autres articles et rebondissant sur leurs références bibliographiques.
  2. en discutant avec d’autres collègues, qui leur signalent telle ou telle parution parce qu’ils lisent les mêmes revues spécialisées.

A qui sert Inspec (même question que pour Google Scholar) ?

  1. A nous, pauvres bibliothécaires, qui ne sommes pas dans le circuit et ne bénéficions pas des tuyaux. Pourtant quand quelqu’un vient nous voir en banque de prêt pour nous dire : “Bonjour, je cherche ce qui a pu être écrit avant 1990 sur la rupture spontanée de symétrie des particules“, il faut bien être capable de lui répondre quelque chose.
  2. Aux quelques étudiants qui ne sont pas encore dans le circuit, à qui il faut bien apprendre autre chose que “Va voir ton prof et demande-lui de t’aider à faire ta biblio : lui, il sait déjà tout”.
  3. Aux chercheurs qui navigueraient temporairement en eaux troubles, à la frontière de leur champ de compétence stricte (et ne connaîtraient pas les revues adéquates, par exemple).

Mais surtout à nous.

Bref, ne cherchons pas à concurrencer les chercheurs. Attendons qu’ils viennent et tenons nous prêts pour la seconde et la troisième situation.

<màj>La plupart des affirmations ci-dessous sont consciemment caricaturales. Il est évident que nos statistiques de consultation d’Inspec ne sont pas à 0. C’est simplement que les chercheurs ne se servent généralement pas suffisamment des bases de données à notre goût.</màj>