Aller au contenu principal

Les opac – Ergonomie : 1, Bidouillabilité : 0

05/02/2010

Projet initial

Yahoo PipesJ’avais dans l’idée de construire un pype permettant de connaître le taux d’emprunts de documents dans une dizaine de bibliothèques, pour un sujet donné.

Exemples : Mano Solo meurt. Le jour même, je lance « mano solo » dans le formulaire de recherche de mon pype, et je constate que dans les 10 bibliothèques observées, la moitié des documents (en l’occurrence, des CD pour l’essentiel) sont empruntés. Je fais la même requête une semaine plus tard, et j’observe l’évolution. Je peux au bout de deux mois constater sur un panel intéressant si les collections des bibliothèques servent de relais à l’actualité brûlante.

Le jeu pourrait aussi se jouer avec des événements prévisibles : la mort de Johnny Hallyday une conférence mondiale sur l’écologie est annoncée plusieurs mois à l’avance. Avec un certain nombre de mots adéquats, j’observe l’évolution de certains thèmes au regard du calendrier de la conférence.

Le pype envisagé devait fonctionner ainsi :

  1. l’utilisateur indique une requête dans le formulaire de recherche du pype
  2. Yahoo Pipes transmet la requête à plusieurs opac, qui affichent ainsi chacun une liste de résultats
  3. Pour chaque résultat, le pype suit le lien vers chaque notice détaillée, consulte la disponibilité du document.
  4. En sortie, le pype me produit 1 item par opac, et pour chaque opac, le nombre de documents empruntés et le nombre de documents disponibles

(oh ! cela ne nous aurait rien appris de révolutionnaire sans doute : c’était un petit outil sans prétention, comme tous ceux que j’élabore)

Je cherchais des opac

  • de bibliothèques de lecture publique
  • qui permettent d’avoir des URL spécifiques à une liste de résultats
  • et dont les liens dans ces listes conduisent toujours à la notice détaillée.

Cela aurait dû me laisser un large choix de sites. Mais nous savions déjà que nos opac n’étaient pas très ergonomiques pour nos usagers.

Les sites normaux

Si vous prenez Amazon, Google Books, WorldCat, ça marche sans problème. Par exemple sur LibraryThing, l’URL http://www.librarything.fr/search_works.php?q=bibliotheques pointe toujours vers une page listant les résultats pour une recherche « bibliotheques » sur LT.

Au moment où j’interroge LibraryThing, le lien vers le premier résultat est : http://www.librarything.fr/work/6258913. Et ce lien fonctionnera toujours, et pointera toujours vers le même document.

Les opac

J’ai rencontré sur plusieurs opac de multiples problèmes, dont les plus fréquents sont :

  1. chaque requête est spécifique à une session. Donc si vous lancer une requête dans un opac, l’URL de la liste des résultats ne peut pas être transmise à quelqu’un d’autre (si vous voulez lui faire voir cette liste, par exemple).
  2. les liens vers les notices détaillées ne sont pas pérennes. Voyez le Sudoc : Quelle que soit la recherche, le lien vers la première notice est : http://www.sudoc.abes.fr/DB=2.1/SET=1/TTL=1/SHW?FRST=1. Ce lien n’a de valeur que pour la recherche en cours. C’est inexploitable (et ça a rendu très complexe de bricoler un fil RSS pour le Sudoc, d’ailleurs)
  3. Le site n’est pas indexable : le fichier robots.txt interdit l’accès aux répertoires, et Yahoo Pipes ne peut donc traiter ces données.

Sur le dernier point, il n’y a sans doute nulle mauvaise intention de la part de l’opac-master (…) : simplement, ce fichier robots.txt était configuré ainsi par défaut par l’éditeur de l’opac, nul membre de la bibliothèque n’a jamais su qu’il en existait un.

Toujours est-il que pour 1 opac qui correspondait à mes critères, j’ai dû en éliminer 19 autres.

La morale de cette histoire ?

Vous vous en fichez sans doute, de mes pypes. Mais pour moi ce n’est pas là le problème.

La bidouillabilité (traduction proposée par Tristan Nitot et d’autres pour hackability), c’est la capacité d’un logiciel à être détourné. Un « bon » logiciel est un produit que ses utilisateurs peuvent appliquer à d’autres usages que ceux prévus par son concepteur.

Cela peut vous paraître curieux si vous le découvrez ici. Mais songez à un roman où les lecteurs ne trouveraient que ce que l’auteur y a consciemment et volontairement mis. Oui, ces auteurs existent (je ne donnerai pas de nom), mais ce ne sont pas eux qui édifient la littérature.

En moins prétentieux : songez au carton d’emballage d’un jouet qui serait conçu pour ne pas pourvoir servir aussi de chapeau, de chaussure, de lit à poupée ou de table à repasser !

Bref, la bidouillabilité pour un opac, ce serait la possibilité de l’utiliser autrement que prévu par son concepteur. Par exemple :

  • l’utiliser comme base d’ouvrages et non comme outil de signalement de collections. Cela signifie que l’opac doit faciliter les rebonds vers d’autres plate-formes, la citation, la récupération de métadonnées, etc.
  • l’exploiter pour en extraire des statistiques diverses sur les collections.
  • l’interroger autrement que par le formulaire de recherche (parce que je le veux, pour les raisons que je veux et que je n’ai pas à fournir).

Lorsque nous élaborons un cahier des charges, la bidouillabilité n’entre pas dans les critères, pour tout un tas d’excellentes raisons, dont la première est que le concept est le plus souvent ignoré.

Je ne vais pas vous démontrer l’intérêt d’intégrer le concept dans vos cahiers des charges.

Je ne vais pas vous démontrer même l’intérêt de la bidouillabilité. Elle est faite pour les bidouilleurs, et vous avez parfaitement le droit de n’en avoir point l’âme.

Ce qui me frappe dans les constatations ci-dessus, c’est que les concepteurs de SIGB/Opac n’élaborent pas leurs bases de données comme le fait le reste du monde (les problèmes rencontrés sur les opac pour du bidouillage sont inexistants sur WorldCat, Amazon, etc.).

On peut bien dire que les bibliothécaires sont à la traîne.

Mais vous voyez que sur des caractéristiques auxquelles les bibliothèques n’ont pas accès, les éditeurs de SIGB sont scandaleusement hors des logiques d’Internet.

Tout n’est donc pas notre faute — ouf ! Mais il y a tout de même un problème !.

Conclusion

Certains SIGB, du fait de leur fonctionnement, sont irrécupérables pour l’utilisation que je voulais en faire. Pour certains, je pense que ça pourrait être possible, mais en compliquant considérablement ma tâche au regard de ce que j’aurais eu à faire avec LibraryThing, WorldCat ou Amazon.

Deux seulement m’ont semblé possiblement utilisables (mais nécessitant tout de même quelques raffinements pour se débarrasser de l’identifiant de session, de certains Javascript, etc). Il m’apparaît inutile de les citer car de toute façon ce genre de considération ne permettra jamais de faire des choix en cas d’appel d’offre : ce test ne nous apprend nullement

  • si ce sont de « bons opac » (en termes d’ergonomie et de fonctionnalités).
  • si leurs concepteurs ont volontairement rendu leurs opac plus bidouillables que ceux des autres.

Et en fin de compte le seul opac rencontré qui soit simple dans ses URL et ses rebonds, c’était Koha.

Voyez la médiathèque intercommunale Ouest-France : l’URL de requête est du type http://koha.mediathequeouestprovence.fr/cgi-bin/koha/opac-search.pl?q=couleurs, et le lien vers un résultat est ainsi : http://koha.mediathequeouestprovence.fr/cgi-bin/koha/opac-detail.pl?biblionumber=519.

Malheureusement Koha n’est pas implanté dans un nombre significatif de de villes de tailles significatives. D’où mon renoncement. Temporaire, j’espère.

15 commentaires
  1. 05/02/2010 09:41

    Bonjour, et merci pour cet article très stimulant, comme d’habitude. Je me joins à votre voeu (pieux ?) d’OPAC plus bidouillable, nos bibliothèques étant hélas loin derrière les sites marchands.
    Pour info tout de même, il y a aussi cette possibilité depuis la mise en place de notre plugin SPIP/PMB, par exemple :
    pour la notice http://www.risom.fr/spip.php?page=notice_display&id=36583
    pour la requête http://www.risom.fr/spip.php?page=recherche&look_PMB=1&look_ALL=1&recherche=choeur+femmes
    C’est encore imparfait (et le sera toujours tant mieux) en terme d’ergonomie et de bidouillabilité, notre réseau est très modeste et nos solutions aussi, mais cela prouve que ça existe même sur de petites bibs.
    Bien cordialement
    Renaud AIOUTZ

  2. 05/02/2010 10:02

    @Renaud : Merci pour cet exemple positif 🙂
    Continuez à indiquer des exemples qui marchent !
    Ainsi :
    1. ça prouvera que c’est possible d’avoir un opac sans identifiant de session et autres paramètres multiples dans l’URL.
    2. ça me donnera peut-être matière à bricoler tout de même mon pype, dont l’idée me plaisait bien.

  3. Austremoine permalink
    05/02/2010 12:47

    Vous pourriez détailler un jour cette histoire d’identifiant de session ? C’est un problème que j’ai souvent rencontré en testant, sur divers OPACs, la possibilité de citer l’URL d’une notice, mais j’ai un peu de mal à saisir sa raison d’être, ignare que je suis.
    La question corollaire étant : peut-on tout aujourd’hui exiger d’un fournisseur de SIGB qu’il se passe de ce genre de procédé ? C’est une question assez intéressée : on change prochainement de version pour le SIGB, et cela éveille chez nous l’espoir (qui sera fatalement déçu, je sais, mais si on ne demande pas…) de lever enfin TOUS les obstacles techniques qui nous empoisonnent la vie. Dont celui de l’URL des notices.
    Donc si vous avez des lumières là-dessus, je suis preneur. Je sais, j’abuse (mais si on ne demande pas…).

  4. 05/02/2010 14:26

    @Austremoine : finalement j’ai répondu dans un billet

  5. 09/02/2010 12:18

    Merci pour ce renvoi au catalogue de la MIOP et à Koha en particulier qui dispose en effet une URL unique par notice et par liste bibliographique, sans oublier un fil RSS à la requête, la navigation à facette, le nuage de tags utilisateurs (+ nuage sujets) et autre étagères virtuelles.
    Je précise que la percée de Koha est actuellement spectaculaire et qu’il sera très bientôt (Nîmes, Albi, Limoges… + plusieurs SCD) « implanté dans un nombre significatif de villes de tailles significatives » ;). Voir à ce sujet le billet de Bambou sur « Koha : la carte du monde » (http://docmiop.wordpress.com/2010/01/17/koha-la-carte-du-monde/)
    Bien kohament
    J.Pouchol

  6. 09/02/2010 14:33

    Bidouillabilité 0 / SRU 1

    La bidouillibilité me semble une solution mais probablement pas la meilleure.
    Certains systèmes construisent leur OPAC en passant la requête en URL c’est bien. Mais chacun adopte une syntaxe propriétaire. Or un standard existe et il s’appelle SRU (Search Retreive by URL) voir http://www.loc.gov/standards/sru/specs/search-retrieve.html. Si tous les SIGB autorisaient des requêtes selon ce protocole, le problème posé serait résolu de fait sans avoir à étudier le fonctionnement de chacun des SIGB. Ensuite, pour leur OPAC, libre à eux de faire ce qu’ils veulent comme ils veulent.
    Avant d’être open source,un logiciel doit d’abord être open tout court, c’est à dire adopter chaque fois que possible normes et standard plutôt que des protocoles propriétaires.
    Le problème de la session est différent. Elle est nécessaire chaque fois qu’il y a nécessité de travailler dans la continuité et de conserver des résultats intermédiaires, par exemple pour des recherches croisées. C’est le jeton (Token) pour OAI (qui fonctionne par URL) et le Resultset pour SRU
    Bien sûr, il n’est d’aucune utilité pour accéder à une notice unique.

  7. 09/02/2010 15:28

    @Jacques Kergomard : merci pour toutes ces remarques auxquelles je souscris : l’adoption de ce standard devrait être systématique.
    Mais il me semble que l’un (accès aux données par SRU) n’empêche pas l’autre (URL avec identifiant de notice). Parce que tout le monde n’est pas informaticien, ni même seulement bibliothécaire : un lecteur « normal » peut aussi avoir besoin de bookmarker une notice, sans avoir à passer par un format XML d’affichage.
    Avez-vous d’autres exemples que les recherches croisées pour l’intérêt des identifiants de session ? Parce que je doute que ce mode d’interrogation serve à la plupart des lecteurs (même si j’admets que pour un professionnel de l’information, il puisse présenter des avantages) ? La gestion de paniers temporaires dans Amazon se fait sans identifiant de session, non ?

  8. 09/02/2010 16:48

    Je ne suis pas un spécialiste de SRU mais on peut bien sûr construire une URL permettant retourner une seule notice (également vrai pour OAI). L’inconvénient est que le flux retourné doit correspondre à un schéma XML que seul un spécialiste de XSL comme vous va pouvoir afficher proprement dans un navigateur. Pour ce que j’en sais, plusieurs logiciels permettent de retourner une page HTML avec une notice à partir d’une URL simple, c’est en tout cas vrai pour Aloès qui fourni ce service même si pour l’OPAC, il fonctionne différemment. Je suis d’accord qu’un petit bouton du style « marquer cette notice » permettant de récupérer cet URL ne ferait de mail à personne. A demander dans un cahier des charges.

    Pour revenir à la notion d’identifiant de session, c’est indispensable dès qu’une requête retourne un très grand nombre de résultat. Au delà d’une certaine taille, le flux XML ne peut pas être renvoyé en une seule fois. On demande alors à récupérer x notices à partir de la yème dans le resultset qui a été créé lors de la requête initiale.
    En fait, ce n’est pas vraiment un identifiant de session mais plutôt un identifiant de resultset, qui a une durée de vie fixée par le serveur SRU ou OAI et peut-être parfois négocié entre le serveur et le client.
    Pour Amazon, si on regarde le résultat d’une recherche avec plusieurs pages, on s’aperçoit qu’il y a la aussi un identifiant de session ou de résultat qui est renvoyé lorsqu’on demande une page suivante.
    Par exemple : http://www.amazon.fr/histoire/s/qid=1265729075/ref=sr_pg_3/278-7332020-2772716?ie=UTF8&rs=&keywords=histoire&rh=i%3Aaps%2Ck%3Ahistoire&page=3
    Quand au panier Amazon, vous ne pouvez pas en faire si vous n’acceptez pas les cookies. Mais je crains que le combat anti-cookie ne soit malheureusemen perdu. Dur de surfer quand on n’accepte pas les cookies.

Trackbacks

  1. URL avec identifiant de session : quelques explications « Bibliothèques [reloaded]
  2. Vous faites quoi pour l’environnement aujourd’hui ? « Bibliothèques [reloaded]
  3. Le catalogue en débat (01/03/10) « pintiniblog
  4. Is this an iPad World ? « Bibliothèques [reloaded]
  5. Quai Branly, Primo et Zotero « Bibliothèques [reloaded]
  6. Ta BU dans Chrome (le kit Just Do It) « Bibliothèques [reloaded]
  7. Journées Abes : groupe SIGB mutualisé « Bibliothèques [reloaded]

Commentaires fermés