15 jours sans dormir (ou : deux semaines de veille) : Electre, Vigilibris, Amazon

Avertissement : ce billet a traîné un certain temps, et a suscité en moi des constatations pleines de perplexité. Je ne savais plus que faire de mes observations. Pardon pour la confusion du propos et la maigreur de la conclusion…

Après avoir comparé Electre, Vigilibris et Amazon comme source de veille pour un acquéreur en droit, je vous indique d’abord les conclusions de mon observation.

Ceux que ça intéresse iront lire ensuite la méthode utilisée.

S’il ne faut en choisir qu’un, Electre me semble l’outil le plus complet pour faire de la veille :

  • Liste la plus fournie (le plus grand nombre de titres), avec des titres pertinents
  • Certains ouvrages ne sont mentionnés que par Electre. L’inverse (ouvrages présents chez Amazon ou Vigilibris et pas chez Electre) est plus rare.

logo Electre

Pour ceux qui n’auraient pas Electre ou ne veulent pas/plus l’utiliser, Vigilibris est un bon outil, mais beaucoup moins complet, semble-t-il (il propose deux fois moins de titres qu’Electre).

Amazon est très lacunaire pour permettre une veille documentaire. En revanche sa base est (on le sait) bien fournie et peut permettre une bonne récupération de notices via Moccam-en-ligne : Amazon propose (sur 15 jours) 5 fois moins de titres qu’Electre comme nouveautés, pourtant 84% des nouveautés Electre sont bien dans la base Amazon…

D’un autre côté, les quelques titres donnés par Amazon sont à 70% absents des listes de nouveautés Electre et Vigilibris (peut-être parce que ces deux-là les avaient déjà mentionnés avant, je n’en sais rien).

Donc si on se contente des 3 outils comparés ici :

  • on peut faire de la veille (uniquement francophone) avec Electre.
  • si on épuise son quota d’export de notices d’Electre, on peut récupérer sur Moccam les notices d’ouvrages trouvés grâce à sa veille Electre, au moins pour 85% des cas.

Mais en réalité le protocole de test est mauvais (en plus des limites signalées ci-dessous) : il part du principe, d’une certaine manière, qu’on peut n’avoir qu’une seule source, et qu’il est impossible de les associer, de les fusionner.

Ce que j’aurais aussi pu faire avec tout ça — et ce dont, à mon avis, tous les acquéreurs ont besoin

Il faudrait

  1. une page Bibliopedia listant des fil RSS pour acquéreurs, par domaine d’acquisition
  2. un #pype qui, pour chacune de ces disciplines, fusionne les fils RSS listés, puis
    1. les dédoublonne (critère : ISBN)
    2. enrichisse les notices avec des liens vers Amazon, LibraryThing et autres sites de commentaires et de critiques (des idées ? Peut-être aussi une simple recherche Google sur le critère Titre), ou même affiche directement les commentaires et résumés Amazon et LT dans la notice détaillée
    3. propose aussi un lien vers le Sudoc, pour que l’acquéreur puisse voir qui aurait déjà acheté l’ouvrage
  3. que le #pype permette à l’acquéreur de ne pas tenir compte de tel ou tel fil RSS présent dans la liste Bibliopedia
  4. que l’acquéreur puisse rajouter un flux dans ce #pype, sans vouloir nécessairement le mettre sur Bibliopedia (besoin très local, inutile à la communauté)

(les points 3 et 4 visant à éviter que tous les SCD de France se mettent à acheter les mêmes choses ! il faut aussi une certaine souplesse, même facultative)

Et dans une telle configuration, Electre ne pourrait venir enrichir le flux principal (Electre n’est pass exportable en RSS). Une fois qu’une telle source serait définie, Electre serait alors à comparer à ce flux, comme outil alternatif ou complémentaire.

Ce que je décris là intéresserait-il réellement des acquéreurs ?

Quels seraient les ajustements à y apporter ?


Voici le protocole de test

Suite à des questions internes, j’ai comparé une veille thématique sur Electre, Vigilibris et Amazon sur le thème Droit.

Ceci pendant deux semaines : plus exactement du lundi 5 octobre au vendredi 16 octobre 2009.

Ainsi vous êtes déjà prévenus sur les LIMITES ENORMES quant aux conclusions qu’une telle comparaison autorise :

  1. délai très court.
  2. domaine non représentatif (très français ?).
  3. peu de concurrence (et toutes les autres sources, alors).

Je fais d’avance ces critiques pour vous économiser du temps. En l’état, la comparaison (qui l’a déjà faite ?) peut être utile. Surtout, ce qui peut être utile, c’est que chaque acquéreur la reproduise sur une période d’un mois pour chacun de ses domaines d’acquisitions.

Bref.

Fonctionnement de chaque base

L’abonnement à chaque base a commencé le 19 octobre et s’est terminé le 30.

Electre

Electre propose d’envoyer un mail quotidien, hebdomadaire ou mensuel, sur une requête effectuée dans la base. J’ai choisi un mail hebdomadaire sur la requête : “Dewey = 34 (Droit) ou Thème = Droit”.

Le mail envoyé contient un lien vers la liste des résultats correspondant à la requête pour les ouvrages nouveaux depuis le mail précédent.

J’ai reçu un 1er mail le 19 octobre (avec 66 références), et un second le 26 octobre (avec 61 références). Donc un total de 127 références.

A noter : l’URL fournie par le mail reçu renvoie à une requête qu’on ne peut afficher qu’une seule fois (ou pendant une durée déterminée). En tout cas je n’ai pas la possibilité d’y revenir et de partager le lien.

Vigilibris

Vigilibris propose de sélectionner un thème (et des sous-thèmes), pour un envoi par mail.

Le mail contient des notices simples (Titre, Auteur, Prix, page de couverture), avec un lien vers la notice détaillée. A noter : le lien contient l’EAN du document (ex. : http://www.decitre.fr/partenaires.aspx?action=vigilibris&ean=9782297013062).

J’ai reçu un 1er mail le surlendemain de l’abonnement me donnant la liste des nouveautés parues durant le mois passé. J’ai trouvé cela très obligeant ;-) .

Puis un second mail le 23/10, intitulé “Liste des nouveautés du 14/10/2009 au 20/10/2009″) avec les 36 nouveautés de la semaine.

Enfin un 3e mail le 30/10, intitulé : “Liste des nouveautés du 21/10/2009 au 27/10/2009″ (42 références).

Amazon

Amazon propose des fils RSS pour les Nouveautés, en passant par la rubrique “Actualités et nouveautés”, puis en choisissant une discipline, et (en bas de page), en cliquant sur le lien “Encore plus de nouveautés”. J’ai donc choisi la rubrique “Droit” (fil RSS correspondant).

J’ai pu constater un problème avec les fils RSS : si vous n’ouvrez pas votre agrégateur régulièrement, vous perdez de l’information.

Pour rappel : un “fil RSS”, c’est simplement un fichier XML. Chaque fois que vous ouvrez votre agrégateur, il va chercher dans le fichier les nouveaux items depuis la fois précédente. Or un fil RSS est souvent tronqué : il ne garde que les 10 ou 20 derniers items. Si le samedi paraissent 15 items, et le dimanche 15 autres items, et que le fil RSS est paramétré pour n’en contenir que 20, le lundi matin je verrai les 15 items du dimanche, plus les 5 plus récents du samedi.

Au final, Amazon a enrichi son fil RSS de 30 références. Donc 4 documents en double, et un en triple — soit, en réalité, 24 références.

Vous pouvez consulter ici la liste de toutes ces références (tableur Google Docs à 4 feuilles)

Comparaison 1 : nombre de titres

Nombre de titres sur 15 jours
Electre 127
Vigilibris 78
Amazon 24

Comparaison 2 : langue de publication

Tous les titres sont en français. Electre m’a fourni (hors cette période de test) quelques titres en anglais : ce sont les publications officielles du Conseil de l’Europe.

Comparaison 3 : pertinence

Difficile à juger sans politique documentaire définie et sans profil institutionnel (BU, BM, etc.).

Je regarde donc juste la justesse d’indexation (est-ce que tous les titres ont leur place dans une veille en droit ?). Vous pouvez analyser les listes directement.

Tous les titres des trois listes m’ont paru à leur place dans une recherche sur le domaine “Droit”. Après un rapide survol je n’ai trouvé aucune d’aberration.

Comparaison 4 : taux de recoupement des titres

C’est le plus intéressant, mais le plus complexe à faire aussi. J’ai dû un peu utiliser Yahoo Pipes pour traiter ces données (je vous passe les détails). Il m’ a été impossible d’analyser le contenu de la base Decitre, à cause de l’encodage manifestement très spécial de leur formulaire : je n’ai pas réussi à construire une URL de requête sur critère ISBN.

<update>J’ai finalement réussi à bidouiller avec le plugin de recherche rapide Decitre trouvé sur Mycroft</update>

Nb titres Nb titres présents
dans les listes de nouveautés
des deux autres sources(pas seulement une des deux)
Nb titres absents
des nouveautés
des deux autres sources
Nb titres présents dans la base (interrogation
catalogue) d’une autre source
Electre 127 49 (39%) 78 (61%) Titres Electre présents chez Decitre : 94 (75%)Titres Electre présents chez Amazon : 107 (84%)
Vigilibris 78 47 (60%) 31 (40%) Titres Vigilibris présents chez Electre : 70 (90%)Titres Vigilibris présents chez Amazon : 73 (94%)
Amazon 24 7 (29%) 17 (71%) Titres Amazon présents chez Electre : 24 (100%)Titres Amazon présents chez Decitre : 16 (66%)

Sudoc-RSS 2 : il revient (et il est encore plus fort)

Souvenez-vous : j’avais créé avec Yahoo Pipes un générateur de flux RSS sur des requêtes dans le Sudoc. Je l’avais ensuite amélioré à destination des acquéreurs.

Pour l’utiliser, il fallait passer par un widget Netvibes ou installer un plugin de recherche spécifique (Sudoc-RSS) dans sa barre de recherche rapide.

Puis tout était tombé : Yahoo Pipes respectait désormais le contenu des fichiers robots.txt des sites web, lesquels fichiers autorisent ou interdisent l’indexation de leurs pages. Celui du Sudoc interdisait que les pages commençant par http://www.sudoc.abes.fr/ soient indexées.

IL revient !

Grâce à assistance.abes.fr, j’ai demandé le déblocage du fichier robots (qu’on enlève un “/” à la 2e ligne). Le 17 septembre 2009.

Voilà, le problème est résolu. J’ai cru comprendre que la modification du fichier Robots.txt posait de gros problèmes techniques qui a nécessité un appel à l’aide auprès d’OCLC. Mais comme je n’ai eu aucune explication détaillée, je serais bien en peine de vous expliquer ce délai.

Si bien que le plugin Netvibes (ainsi que le plugin de recherche rapide) sont de nouveau opérationnels. (Rq : pour installer la recherche rapide, vous installez d’abord l’extension Firefox Add to Search Bar, qui vous permet d’ajouter presque n’importe quel moteur de recherche à votre navigateur. Puis vous utilisez l’extension sur le widget Netvibes).

Mais il y a mieux

Si vous n’avez pas encore installé l’extension GreaseMonkey, c’est le moment.

Cette extension vous permet ensuite d’ajouter des scripts qui vont enrichir certains sites (vous choisissez vous-mêmes quels scripts installer).

Par exemple, après avoir installé GreaseMonkey, allez sur cette page et cliquez sur le gros bouton Install. Désormais, lorsque vous ferez une recherche dans le Sudoc, vous verrez cela :

Un lien au fil RSS de la recherche en cours

Pendant que vous y êtes, allez aussi sur cette page et installez le script. Cela vous donnera sur chaque notice détaillée du Sudoc un permalien “Lien vers cette notice”.

Ces deux scripts sont l’oeuvre de Symac, et je lui redis ici toute ma gratitude mon admiration mon adoration.


Sur les scripts GreaseMonkey utiles pour les bibliothécaires : dans Userscripts, cherchez donc des scripts sur des mots comme Worldcat, Wikipedia, Google Book Search, ISBN.

Une dernière remarque pour la route

Le #pype qui produit le fil RSS est assez lourd : l’affichage du flux prend donc un certain temps. Soyez indulgents : j’essaierai de voir si je peux l’alléger…

Electre ou le tonneau des Danaïdes : la gestion des paniers (percés)

J’ai commencé la série sur Electre avec des allusions plus ou moins étymologiques et plus ou moins paraphrastiques.

Je m’efforce de persister dans la veine, mais je pressens que je rencontrerai de plus en plus de difficultés, et de moins en moins de pertinence. Pour être plus exact, je pressens que bientôt ces allusions seront dadaïstes.

Continuons.

Situation initiale

Ce qu’on constate généralement sur Electre, c’est une liste insupportable de paniers aux noms ésotériques, redondants, cabalistiques ou inutiles :

FC, Informatique, Sciences de la vie 01052004, FC2, FC3, Bib Sciences, etc. où vous pressentez d’ailleurs que le FC en question est un certain collègue parti depuis un an et demi.

Je ne suggère pas de nettoyer pour le plaisir de ranger (vous verriez mon appart !) mais pour faciliter une certaine organisation du travail.

Condition initiale : qu’il y ait au sein de la bibliothèque une personne désignée et reconnue comme ayant le droit

  • d’administrer Electre
  • de poser des règles d’utilisation
  • de faire du nettoyage régulièrement

Proposition de rangement

  • Un dossier par bibliothèque (quand un SCD ou une BM a plusieurs BU ou antennes).
  • Dans chaque dossier de bibliothèque, un dossier par acquéreur (sauf si certains acquéreurs partagent les mêmes domaines d’acquisitions, ça, c’est à voir).
  • Le dossier d’un acquéreur est à son nom complet (par les initiales, pas seulement le prénom), sous la forme : Nom Prénom, afin d’exploiter le classement alphabétique automatique d’Electre.
  • Dans son dossier perso, chaque acquéreur a autant de dossiers que de domaines d’acquisitions.
  • Dans chaque dossier “Domaine d’acquisitions”, deux paniers :
    1. Domaine d’acq – Commandes en cours
    2. Domaine d’acq – Commandes passées

(voici une arborescence bidouillée sous Windows, pour rendre compte d’un tel rangement)

Deux paniers par domaine d’acquisition ?

Oui : le panier “Commandes en cours” contient les titres qui n’ont pas encore été chargés dans le SIGB. Peut-être certains vont-ils finalement être supprimés de vos choix. Lorsque vous avez chargé le contenu du panier “Commandes en cours”, vous le transférez dans le panier “Commandes passées”, pour en garder une trace (si vous souhaitez en garder une trace).

Vidéo : Transférer des notices d’un panier à l’autre (1‘57, où la première minute est en trop…)

A chaque clôture budgétaire, vous avez le choix entre archiver le dossier “Commandes passées” (en le renommant pour y ajouter le nom de l’année concernée), ou simplement le vider.

Quand on “archive” un panier, il est impossible d’y mettre de nouvelles notices (il n’apparaît plus dans la liste des paniers quand on veut remplir un panier suite à une recherche dans Electre). En revanche, on peut le “désarchiver” pour le remplir de nouveau si nécessaire.

Si vous voulez conserver un panier sans avoir plus l’intention de l’alimenter, mieux vaut l’archiver.

A suivre : les modèles de paniers (rajouter des champs)…

Mais le prochain billet sur Electre portera sur la veille documentaire.

Lien Electre -> Sudoc limité à votre bibliothèque

En complément au billet précédent (et en étant persuadé que vous vous y perdrez entre tous ces billets) :

  1. vous pouvez générer sur Electre un lien vers votre Opac
  2. vous pouvez générer sur Electre un lien vers le Sudoc
  3. vous pouvez générer sur Electre un lien vers le Sudoc, avec une restriction sur votre établissement.

Il faut reprendre l’URL donnée au billet précédent en rajoutant le paramètre (ILN=qqchose) propre à votre établissement.

Sous la forme :

http://www.sudoc.abes.fr/DB=2.1/SET=21/TTL=1/CMD?ACT=SRCHM&ACT0=SRCH&MATCFILTER=Y&MATCSET=Y&NOSCAN=Y&PARSE_MNEMONICS=N&PARSE_OPWORDS=N&PARSE_OLDSETS=N&IMPLAND=Y&IKT0=7&TRM0={Isbn}&ILN_DEP_BIB=ILN&ADI_ILN=[numéro_de_votre_établissement]&screen_mode=Recherche&

Attention :

  • si l’ISBN n’est pas présent dans vos collections, le Sudoc indiquera 0 résultat (sans rappel de la recherche), si bien que vous ne pourrez vérifier s’il a correctement formulé la requête. Faites donc un test dans Electre sur un document que vous savez être dans vos collections pour vous assurer d’avoir bien saisi l’URL modèle.
  • Si l’ISBN est dans vos collections, vous arriverez directement sur la liste des localisations.

Voici la liste des valeurs pour tous les établissements :

157 AIX-EN-PROVENCE-LEST
2 AIX-MARSEILLE1-SCD
3 AIX-MARSEILLE2-SCD
4 AIX-MARSEILLE3-SCD
5 AMIENS-SCD
6 ANGERS-SCD
167 ANGERS-UCO
8 ANTILLES-GUYANE-SCD
165 ATHENES-ECOLE FRANCAISE
10 ARTOIS-SCD
11 AVIGNON-SCD
101 BELFORT-UTBM
12 BESANCON-SCD
110 BEZIERS-CIRDOC
171 BORDEAUX-IUFM-AQUITAINE
15 BORDEAUX-DDOC
24 BOURGOGNE-SCD
16 BREST-SCD
133 BREST-NANTES-IFREMER
17 BRETAGNE SUD-SCD
18 CAEN-SCD
105 CERGY PONTOISE-ESSEC
19 CERGY PONTOISE-SCD
21 CLERMONT-FERRAND-BCIU
22 COMPIEGNE-SCD
23 CORSE-SCD
155 ENSAM-ESTP
25 EVRY-VAL D’ESSONNE-SCD
177 FONTAINEBLEAU-INSEAD
26 GRENOBLE1 ET INPG-SICD
27 GRENOBLE2 ET 3-SICD
151 GRENOBLE-IUFM
149 INRIA
161 INSTITUT TELECOM
29 LA REUNION-SCD
30 LA ROCHELLE-SCD
31 LE HAVRE-SCD
32 LE MANS-SCD
33 LILLE1-SCD
34 LILLE2-SCD
35 LILLE3-SCD
175 LILLE-UNIVERSITE CATHOLIQUE
148 LIMOGES-IUFM Limousin
36 LIMOGES-SCD
37 LITTORAL-SCD
38 LYON1-SCD
39 LYON2-SCD
40 LYON3-SCD
41 LYON-BIU ENS-LSH
107 LYON-DOC’INSA
134 LYON-Ecole centrale
128 LYON-ENS SCIENCES
106 LYON-FACULTES CATHOLIQUES
141 LYON-INRP
176 LYON-ISH
154 LYON-IUFM
146 MADRID-Casa de Velazquez
119 MARNE LA VALLEE-CTLES
42 MARNE LA VALLEE-SCD
44 METZ-SCD
45 MONTPELLIER-BIU
46 MULHOUSE-SCD
147 NANCY-INIST
47 NANCY1-SCD
48 NANCY2-SCD
94 NANTERRE-BDIC
158 NANTERRE-BDIC Fonds cyrillique
49 NANTES-SCD
50 NICE SOPHIA ANTIPOLIS-SCD
51 ORLEANS-SCD
52 POLYNESIE-SCD
53 NOUVELLE-CALEDONIE-SCD
54 PAU-SCD
55 PERPIGNAN-SCD
56 POITIERS-SCD
57 REIMS-SCD
138 RENNES-AGROCAMPUS OUEST
166 RENNES-IEP
139 RENNES-INSA
163 RENNES-IUFM-BRETAGNE
58 RENNES1-SCD
59 RENNES2-SCD
173 ROME-ECOLE FRANCAISE
140 ROUEN-INSA
60 ROUEN-SCD
61 SAINT ETIENNE-SCD
20 SAVOIE-SCD
62 STRASBOURG-BNU
150 STRASBOURG-IUFM Alsace
63 STRASBOURG1-SCD
64 STRASBOURG2-SCD
65 STRASBOURG3-SCD
66 TOULON-SCD
153 TOULOUSE-IUFM
67 TOULOUSE-SICD
68 TOURS-SCD
69 TROYES-SCD
70 VALENCIENNES-SCD
102 VANDOEUVRE LES NANCY-INPL
71 VERSAILLES-SCD
108 VILLEURBANNE-ENSSIB
72 PARIS1-SCD
73 PARIS2-SCD
74 PARIS3-SCD
75 PARIS4-SCD
76 PARIS5 DESCARTES-SCD
77 PARIS6-SCD
79 PARIS7-SCD
80 PARIS8-SCD
81 PARIS9 DAUPHINE-SCD
82 PARIS10-SCD
83 PARIS11 ORSAY-SCD
84 PARIS12-SCD
85 PARIS13-SCD
95 PARIS-ACAD. NAT. MEDECINE
144 PARIS-Acad. Sciences Outremer
156 PARIS-Bib. Litt. J. Doucet
129 PARIS-Bib. Sainte Barbe
88 PARIS-Bib. Sainte Geneviève
91 PARIS-BIUM
92 PARIS-BIUP
172 PARIS-BSI LA VILETTE
130 PARIS-BULAC
104 PARIS-CIUP
178 PARIS-Cité architecture et patrimoine
145 PARIS-CEDOC
135 PARIS-CNAM
99 PARIS-COLLEGE DE FRANCE
87 PARIS-CUJAS-BIU
136 PARIS-Ecole centrale
124 PARIS-Ecole Nat. des chartes
142 PARIS-CACHAN-ENS
159 PARIS-ENS ULM
120 PARIS-Fondation Sciences Politiques
160 PARIS-JOUY-EN-JOSAS-HEC
96 PARIS-INSTITUT DE FRANCE
143 PARIS-INED
90 PARIS-INHA
137 PARIS-Institut Pasteur
162 PARIS-IUFM
169 PARIS-ORSAY-Jacques Hadamard
93 PARIS-JUSSIEU-BIUS
97 PARIS-Mazarine
164 PARIS-MSH
98 PARIS-MNHN / MUSEE HOMME
126 PARIS-Musée du Quai Branly
100 PARIS-MEUDON-OBSERVATOIRE
168 PARIS-Service Santé des armées
86 PARIS-SORBONNE-BIU
121 PARIS-SORBONNE-GEOGRAPHIE
174 PARIS-Institut Catholique
200 ALSACE-Centre régional Sudoc-PS
201 AQUITAINE-Centre régional Sudoc-PS
202 AUVERGNE-Centre régional Sudoc-PS
203 BOURGOGNE-Centre régional Sudoc-PS
204 BRETAGNE-Centre régional Sudoc-PS
205 CENTRE-Centre régional Sudoc-PS
206 CHAMPAGNE ARDENNE-Centre régional Sudoc-PS
207 FRANCHE-COMTE-Centre régional Sudoc-PS
208 ILE-DE-FRANCE-BIOLOGIE-Centre régional Sudoc-PS
209 ILE-DE-FRANCE- SCI.HUMAINES-Centre régional Sudoc-PS
210 ILE-DE-FRANCE-DROIT SCI.ECON.-Centre régional Sudoc-PS
211 ILE-DE-FRANCE-LANGUES ORIENT.-Centre régional Sudoc-PS
212 ILE-DE-FRANCE-MEDECINE-Centre régional Sudoc-PS
213 ILE-DE-FRANCE-PHARMACIE-Centre régional Sudoc-PS
214 ILE-DE-FRANCE-SCIENCES JUSSIEU-Centre régional Sudoc-PS
215 ILE-DE-FRANCE-ART ARCHEOL.-Centre régional Sudoc-PS
217 ILE-DE-FRANCE-ECON.GESTION-Centre régional Sudoc-PS
218 ILE-DE-FRANCE-SCIENCES ORSAY-Centre régional Sudoc-PS
219 LANGUEDOC ROUSSILLON-Centre régional Sudoc-PS
220 LIMOUSIN-Centre régional Sudoc-PS
221 LORRAINE-Centre régional Sudoc-PS
222 MIDI PYRENEES-Centre régional Sudoc-PS
223 NORD PAS DE CALAIS-Centre régional Sudoc-PS
224 BASSE-NORMANDIE-Centre régional Sudoc-PS
225 HAUTE NORMANDIE-Centre régional Sudoc-PS
226 PAYS-DE-LOIRE-Centre régional Sudoc-PS
227 PICARDIE-Centre régional Sudoc-PS
228 POITOU-CHARENTE-Centre régional Sudoc-PS
229 P.A.C.A. MARSEILLE-Centre régional Sudoc-PS
230 P.A.C.A. NICE-Centre régional Sudoc-PS
231 RHONE-ALPES GRENOBLE-Centre régional Sudoc-PS
232 RHONE-ALPES LYON-Centre régional Sudoc-PS
233 ILE-DE-FRANCE-BNF-Centre régional Sudoc-PS

Lien vers l’Opac dans Electre — pourquoi pas un lien vers le Sudoc

Le lien depuis une notice Electre vers l’Opac permet de savoir si vous avez déjà l’ouvrage en stock.

Mais certains Opac ne permettent pas ce genre de rebonds… ou bien la structure de cette URL serait trop complexe à trouver.

Bref, pour ceux qui participent au Sudoc, vous pouvez tout aussi bien pointer vers la notice Sudoc, sur la page Localisation du document. Cela vous permettra en 1 clic de savoir si vous avez déjà l’ouvrage aussi bien que si vous pointiez vers votre Opac.

En terme de politique documentaire, ça peut du même coup vous donner une idée du nombre d’exemplaires disponibles en France ou dans votre ville avant de l’acheter.

Bref, pour les raisons que vous voudrez, ça peut être un lien intéressant. Donc pour cela il faut mettre dans le champ “Lien Opac” d’Electre :

http://www.sudoc.abes.fr/DB=2.1/SET=2/TTL=1/PRS=HOL/CMD?ACT=SRCHA&IKT=7&SRT=RLV&TRM={Isbn}

Lien vers l’Opac — And the winner is… Electre !

C’est Electre qui remporte la première manche sur le Sudoc, en fournissant un lien que j’ai mis un temps fou à repérer.

Electre permet sur chaque notice détaillée de générer un lien lançant une requête dans votre Opac, sur le critère ISBN.

En cliquant dans la colonne de gauche sur la clé à molette, puis sur Abonnement, vous avez au bas de la rubrique une zone texte à remplir intitulée : Lien Opac.

Il faut renseigner ce lien en indiquant la manière dont il faut interroger votre Opac sur le critère ISBN.

Voyez ce que j’ai écrit tout récemment sur de tels liens dans le Sudoc : le système est exactement celui-là.

  1. Vous faites une recherche dans votre opac avec un ISBN
  2. Vous copiez l’URL obtenu dans le bloc-notes
  3. Vous remplacez l’ISBN recherché par {Ibsn} (ou {Ean13} si c’est plus pertinent — faites des tests !)
  4. Vous collez le résultat dans la zone de texte sur Electre.

Et voici ce que ça donne (je l’ai paramétré il y a deux semaines, mais ne l’ai remarqué que ce matin. J’ignore si Electre a réparé un bug ou si je ne l’avais pas vu) :

Si vous avez mis dans l’URL {Isbn}, le lien sera en face de l’ISBN. Si vous avez mis {Ean13}, il sera en face de EAN.

Certains Opac posent de grosses difficultés, notamment Flora (c’est difficile à Aix-Marseille 3, et impossible avec le CCFr) et Bookline (pour Incipio, je ne sais pas) pour lesquels il faut parfois beaucoup d’inventivité pour obtenir une URL de requête sur le critère ISBN.

Aucun problème avec Koha, Aleph, HIP (SirsiDynix) et plein d’autres.

Si vous avez des difficultés pour obtenir une URL “efficace”, n’hésitez pas à me poser la question en commentaire. A noter que Damiano est aussi devenu un pro des requêtes par ISBN (merci à lui !)

Electre ou le mythe d’un Narcisse ouroboros

Ouroboros - serpent se mordant la queue Le billet précédent m’a donné une petite envie de faire une courte série sur Electre. Cela me permettra de me stimuler un peu parce que le redémarrage du blog s’est fait un peu attendre.

Je ne vais pas vous proposer des “tutoriels Electre”, mais vous signaler (dans d’autres billets) certaines fonctionnalités ou procédures qui peuvent s’intégrer dans un flux de travail au sein d’une bibliothèque.

Ceci étant posé, je commence en déplorant les limites pénibles dans la conception de la base : Electre est complètement fermée sur elle-même, dans un modèle économique et technique complètement archaïque.

Cela a déjà été dit par d’autres, Electre aurait pu devenir la base bibliographique commerciale de référence pour le grand public, si elle avait ouvert ses données gratuitement. Bon, comme vous savez, finalement c’est Amazon qui a pris cette place. Electre ne sera donc pas pour le grand public

Mais même pour les professionnels, même une fois qu’on a payé l’accès, l’utilisation en est fermée, comme si Electre n’avait pas besoin des autres sites, comme si ses utilisateurs pouvaient naviguer en vase clos dans Electre comme dans un aquarium.

Un formulaire de recherche intransportable

Après avoir essayé à plusieurs reprises, j’ai dû renoncer : le formulaire de recherche Electre, avec la technologie utilisée (qui se retrouve, sauf erreur, dans Flora d’Ever), ne peut être transformé en plugin de recherche rapide pour Firefox ou IE (non plus que comme “mot-clé de recherche” sous Firefox).

Si bien que, trouvant une référence (un ISBN, par exemple) sur Internet, je ne peux pas basculer en un clic sur Electre

(rappel : si un plugin de recherche est “en cours” dans votre boîte de recherche, et que vous sélectionnez un mot, un clic droit de la souris vous permet de chercher cette sélection dans le plugin de recherche en cours — cf. cette vidéo de 50 secondes si mon explication n’est pas claire)

Pas de rebonds vers d’autres ressources

Je me souviens qu’OvidSP, par exemple, permet à son client de paramétrer un rebond (même non-OpenURL) vers son propre catalogue.

Quand on navigue dans Electre, un tel rebond me paraît un besoin évident. Pour deux motifs :

  1. vérifier que l’ouvrage n’est pas déjà dans la bibliothèque. Objectivement, ce besoin n’est pas le plus important dans la mesure où nous achetons le plus souvent du neuf. Donc pour le nombre de fois où on rachète un titre ancien, ce n’est pas si grave…
  2. Rebondir depuis l’indexation sujet (Rameau, Dewey ou autre) d’Electre vers son propre catalogue, pour apprécier l’ampleur du rayon sur le sujet, et sa mise à jour (ex. : Tiens, un ouvrage sur les Mac. Qu’est-ce que nous avons sur les Mac dans notre bibliothèque ? Oh, ça va : on a 15 bouquins… Tiens, le dernier date de 2004 ! Finalement je vais peut-être acheter celui-là).

Pas de web services ni de serveur z39.50

Idéalement, j’aurais rêvé de pouvoir exploiter Electre sans aller sur le site, selon le scénario suivant :

  1. Dans mon SIGB, j’ouvre le module Acquisition, et je crée une nouvelle ligne de commande
  2. Je passe la douchette sur le code-barre de LivreHebdo. Le SIGB interroge Electre et récupère toutes les informations utiles.
  3. J’enregistre.

Mais Electre ne peut être interrogé que sur Electre. Donc pour récupérer les données, c’est nécessairement par transfert de fichiers (export des notices depuis Electre, importées ensuite dans le SIGB). Un peu plus lourd tout de même.

Une monétisation de l’export de notices

Voilà un écran que je trouve à la fois angoissant et culpabilisant pour l’acquéreur :

C’est un aspect qui me semble ahurissant d’un point de vue “modèle économique”.

Logiquement, si nous payons un accès à Electre, c’est pour un besoin professionnel. Donc pas seulement pour pouvoir découvrir des ouvrages, mais aussi récupérer les notices et non faire du copier-coller champ à champ.

Faire payer l’export de notices en plus de l’abonnement (ou, pour mieux dire, avec des tranches de tarification), c’est estimer que l’on peut faire un usage intelligent et profitable d’Electre sans utiliser l’export de notices. C’est encourager une utilisation pauvre d’Electre. Ou s’enrichir sur le dos des utilisateurs intelligents…

Conclusion

Electre n’est pas un “mauvais site” (he’s not the bad guy). Mais les fonctionnalités présentes, tout autant que les fonctionnalités absentes, induisent de la part de ses utilisateurs un certain comportement pour l’exploiter au mieux. Il ne se prête absolument pas à des détournements intelligents (tels que décrits ici, notamment)

Autrement dit, c’est un bon outil, mais il n’entre pas dans la logique web à laquelle nous nous habituons un peu plus chaque jour.

Je parlerai une prochaine fois des trucs intéressants (paramétrages, personnalisation surtout) dans Electre.

Gérer une base de signets (3/4)

Je reprends doucement la série de billets consacrés à la gestion d’une base de signets. Celui-ci, court, est consacré aux outils de gestion.

Je ne parle pas ici du logiciel utilisé, mais, dans un contexte de gestion décentralisé (“correspondants Signets” dans les sections), ce dont les responsables de signets souhaitaient disposer en termes de :

  • fonctionnalités pour gérer la base, ou “leur” base (càd la sous-partie du tout qui était gérée par eux)
  • renseignements sur la base à un temps T.

Cette liste n’est que le résultat de plusieurs mois de pratique, avec des ajustements successifs. Nous avions une base XML dont je pouvais extraire les données pour les traiter de la manière que je voulais.

Donc voici ce dont nous avons constaté avoir besoin :

  • une extraction de l’intégralité des URL stockées dans la base
  • une vérification automatique des liens
  • un filtre par gestionnaire (pour que dans l’interface de gestion la personne puisse n’afficher que les signets qu’il gérait)
  • un champ de date de vérification des notices + un champ de date de modification des notices

Des rapports fournissant les informations suivantes :

  • liste des tous les signets, par gestionnaire, avec Titre, Auteur, URL
  • liste de tous les signets (toujours triés par gestionnaire, comme les rapports suivants) avec Titre, Auteur, Description, Sujet
    Oui, j’éditais deux rapports différents, pour éviter des tableaux à 10 colonnes, vite illisibles. Dans cette seconde liste, les gestionnaires visaient avant tout l’homogénéisation des pratiques. La première liste est surtout là “pour info”.
  • nombre de signets par section

ces trois premiers rapports servaient à chacun à comparer sa propre base (en quantité et en contenu) avec les autres.

  • liste des signets triés par section puis (pour chaque section) par date de dernière modification (les plus anciennement modifiés en tête = ceux à revoir d’abord).
  • liste des URL stockées plus d’une fois dans la base (doublons, triplons, etc.)
  • liste des URL trop longues
    Ce dernier point est intéressant : la base de signets est interrogeable par moteur de recherche, et affiche une liste de résultats. Nous avons choisi de rendre visible l’URL de chacun des signets (plutôt que de rendre le titre cliquable, pointant vers le site décrit). Donc nous donnons à voir l’URL. Celle-ci doit donc être (autant que possible) simple. Cela a permis de réfléchir à la structure des URL, notamment quand elles contiennent un identifiant de session. Exemple : http://www.scirus.com/srsapp/ et http://www.scirus.com/ pointent vers la même page. Donner à voir à l’utilisateur la “version courte” est toujours un service à lui rendre.
    Donc je générais un rapport qui listait les signets dont l’URL dépassait 50 caractères (évidemment, c’était parfois nécessaire).

Je donne cette liste telle quelle, sans échelle d’importance : si vous avez à en gérer une, vous saurez tout seul attribuer ces degrés.

Selon l’outil utilisé, notamment si c’est une base locale ou un gestionnaire en ligne de favoris (du type Delicious), la réponse à ces besoins sera plus ou moins complète, et surtout elle se fera par des moyens différents.

Mais il est évident que la possibilité ou non d’obtenir ce genre de manipulations et d’informations n’est pas l’argument ultime pour choisir un outil, puisque l’ergonomie, la simplicité d’utilisation et de maintenance, comme la possibilité d’intégration dans l’ensemble des outils de la bibliothèque, sont primordiaux.

Mais je voulais tout de même donner cette liste pour information. Puisque, comme je le rappelle (encore !), ceci n’est qu’un retour d’expérience et non une réflexion approfondie sur cette question.

La liste intégrale des URLs

J’y tiens beaucoup, d’une manière ou d’une autre, il vous faut :

  1. pouvoir extraire l’intégralité de vos URL
  2. pouvoir extraire régulièrement les nouvelles URL et elles seules.

Pourquoi ? Pour ça : pour générer à partir de vos signets un moteur de recherche en texte intégral sur une partie du web sélectionnée par vous.

Il me semble qu’avoir une base de signets est en soi légitime et précieux (si jamais celle des autres ne vous satisfait pas). Toutefois pour l’usager la notion de base de signets, de notices de sites web, peut paraître très étrange, sinon incompréhensible.

Si bien que si vous pouvez lui proposer, à un endroit ou à un autre, une recherche en texte intégral dans les sites que vous avez sélectionnez pour lui, c’est un type de contenu (et un mode d’interrogation) dont il comprendra peut-être mieux l’utilité.

Sur Jubil, est proposée

  • une interrogation de la base de signets en recherche simple (unifiée) sur la page d’accueil,
  • en recherche multi-ressources, 4 moteurs thématiques intitulés “Le web de la Physique-chimie”, “Le web des sciences de la Terre”, “Le web de la médecine” et “Le web des Math-Info”.

Je ne prétends pas que la terminologie soit pleinement satisfaisante, non plus que l’emplacement de ces moteurs (un peu discrets), mais au moins le service existe, il est disponible.

Ces 4 connecteurs correspondent à 4 moteurs Google CSE, dans lesquels nous avons chargé des extractions partielles (filtres par sujets).

Il faut ensuite actualiser ces moteurs avec les sites nouvellement entrés.

Il y a le problème des signets que l’on supprime (chaque gestionnaire supprime des sites de la base de signets, alors qu’une seule personne gère le moteur Google : problème de communication à prévoir), et qui me laisse penser que le fonctionnement le plus simple serait de vider chaque moteur pour le recharger complètement.

Malheureusement Google CSE ne permet de supprimer les sites que 20 par 20 : l’élimination complète risque d’être fastidieuse.

Bref, sans avoir de solution complètement satisfaisante pour une gestion parfaite de ce service, il me semble que c’est un vrai service à rendre à nos lecteurs.

PS : si vous utilisez des services comme Delicious, et que vous ne savez pas comment en extraire la liste des URLs brute pour l’injecter dans un moteur Google nouvellement créé, je vous ferai une petite vidéo.

PS 2 : à vous ensuite de mener une réflexion sur l’intégration d’un tel service. Ce genre de moteur peut être aussi utile simplement en interne, quand vous êtes dérangé sollicité en service public sur une question de chimie à laquelle vous ne comprenez rien.  Une rapide recherche dans un moteur thématique peut rendre de grands services ! Mais si vous demandez à votre webmaster d’intégrer le formulaire de recherche quelque part dans votre site web (de préférence au bon endroit), c’est peut-être encore mieux.

PS3 : à Jussieu, nous nous étions posé la question de supprimer carrément l’interrogation de la base de signets, pour ne proposer que la recherche en texte intégral. Finalement nous y avions renoncé, je ne sais plus pourquoi.

Un pipe pour une veille autour des revues en sciences humaines

Base Mirabe Est sortie il y a peu (en version “prototype”) une base de mutualisation pour la mise à jour des informations autour des revues en SHS.

Marlène en avait parlé, le BBF aussi.

Ce n’est pas forcément mon centre d’intérêt premier : je suis plutôt réservé face à ce risque d”épuisement des énergies pour la mise à jour de nos bases de revues en ligne. Mais comme c’est un travail mutualisé, c’est un moindre mal ; surtout, l’utilisation de Yahoo Pipes me semblait un exercice intéressant.

Cette base propose des informations bibliographiques sur toutes les ressources qu’elle référence, informations que nos collègues s’efforcent de mettre à jour autant que possible.

Pour chaque revue donnée, il y a un fil RSS correspondant, pour suivre les actualisations de la notice. Voilà un outil fort utile. L’URL de chaque flux RSS est structurée ainsi :

http://www.reseau-mirabel.info/rss.php?object=revue&id=identifiant_interne_de_la_base

Sauf que le responsable de la documentation électronique d’un établissement, qui ne peut pas connaître les identifiants Mir@bel pour ses revues, est obligé de chercher revue par revue pour s’abonner à chaque fil RSS. L’idéal pour lui serait qu’il puisse entrer une liste d’ISSN, et avoir un fil RSS unique pour toutes ses revues.

J’ai donc élaboré un pipe qui fait les manipulations suivantes :

  1. on lui donne une liste d’ISSN, séparés par des points-virgules
  2. il construit une requête sur chaque ISSN : il concatène
    http://www.reseau-mirabel.info/index.php?termes=“, ISSN, “&action=recherche&methode=simple
  3. Il ouvre chaque page de résultats correspondant à ces URL : ces pages contiennent, toujours au même endroit, le lien vers la revue auquel correspond l’ISSN. Ce lien est structuré ainsi :
    http://www.reseau-mirabel.info/index.php?action=show&object=revue&id=identifiant_interne_de_la_base.
  4. Il récupère cet identifiant interne
  5. Il construit l’URL du fil RSS correspondant à chaque revue.
  6. Il ouvre chacun des flux RSS.

En fait, ce flux ressemble assez, par certains côtés, à celui du tutoriel 8 : au lieu de rentrer un flux RSS dans le pipe, on récupère une information qui permet de construire l’URL de ce flux, pour le produire en sortie.

Cette manipulation s’effectue à l’avant-dernière étape : pour chaque URL de flux construite, au lieu de “sortir” l’URL elle-même, on “émet” le contenu du fichier ayant cette URL (la case cochée par défaut est toujours “Assign results”, il faut donc penser à choisir l’autre option).
Copie d'écran de la case Emit results au lieu de Assign results

Cela peut vous donner une idée de ce à quoi sert un web service : une telle base peut proposer ce genre de fonction nativement, à savoir qu’il suffit de lui donner une information sous une forme standard (par exemple : un ISSN intégré dans une URL construite d’une certaine manière) pour que la base renvoie un fichier XML avec d’autres infos associées à cette information initiale (par ex. l’identifiant, ou le flux RSS correspondant à cet ISSN).

En reprenant le pipe décrit ci-dessus, on pourrait sans trop de difficulté l’améliorer pour que, à une liste d’ISSN en entrée, il produise en sortie une liste d’états de collections, ou tout autre information présente dans les notices (langue, URL, URL du flux RSS de la revue, etc.). Un tel usage ne serait pas tellement pour suivre les mises à jour, mais pour extraire une série d’informations à un instant donné au sujet de vos abonnements.

Si vous avez des besoins particuliers associés à cette base, n’hésitez pas à me demander un pipe adapté.

> Voir (et utiliser) le pipe

Remarque 1 : j’ignore quel est l’état actuel de la base et sa richesse. Il se peut donc que lorsque vous rentrerez votre première liste d’ISSN, le fil RSS produit soit vide (si aucune de ces notices n’a été mise à jour).

Remarque 2 : le fil RSS produit contiendra tous les ISSN que vous aurez indiqué au pipe. Donc le navigateur peut avoir du mal à avaler une URL trop longue (c’est variable selon les navigateurs, il me semble). Voici les différences selon les navigateurs. J’ignore par ailleurs si un agrégateur peut avoir des difficultés avec une URL de plusieurs centaines ou milliers de caractères. Vous me raconterez ;-) !

Remarque 3 : je ne vous ai pas du tout présenté l’interface. Vous êtes grands ! :-) Notez tout de même la possibilité pour tout un chacun de modifier une notice (les modifications en mode anonyme devant être validées par un modérateur).

Remarque 4 : on peut retrouver le fil RSS de toutes les modifications (toutes revues confondues) en reprenant le fil d’une revue (par exemple : http://www.reseau-mirabel.info/rss.php?object=revue&id=533) et en supprimant la référence à l’identifiant. Ce qui donne : http://www.reseau-mirabel.info/rss.php?object=revue.

————————————

Précisions données par les porteurs du projet :

  • Le développement de web services pour les partenaires fait  partie du plan de développement de Mirabel (qui sera présenté lundi 8 juin, lors du lancement officiel). A terme donc, ce pipe n’aurait plus grande utilité. L’équipe ne refuse pas “l’idée de construire les  url avec l’issn comme alternative à l’id interne, et nous avons aussi en projet la possibilité d’alimenter un sigb (koha) par webservice”.
  • En devenant partenaire de Mir@bel, “vous aurez alors accès aux fonctions avancées d’export des données et
    si vous ajoutez vos identifiants locaux pour les revues que vous possédez, alors, vous aurez beaucoup plus qu’un fil RSS par titre ! “
  • “Enfin, pour éviter l’épuisement, nous avons mis en place un outil de collecte automatique pour les ressources lorsque c’est possible (pour Cairn, Persee et Revues.org, pour commencer) et que nous souhaitons élargir le réseau de partenaire pour que chacun ait le moins de travail à accomplir. “

A titre de curiosité

Je viens de faire une rapide manipulation pour savoir si nos ouvrages en cours d’acquisition étaient présents dans Amazon. J’en ai profité pour voir la proportion de couvertures présentes.

Nous acquérons à partir de LivreHebdo + Electre.

Pour une université pluridisciplinaire, donc, voici les stats — si jamais quelqu’un s’était posé la question sans avoir encore pris le temps d’y répondre :

  • Taux de recoupement des notices : 100%
  • Taux de présence de couvertures : 89,13%

Pour la méthode

J’ai demandé à mon administrateur SIGB une extraction de 50 ISBN d’ouvrages commandés mais non encore arrivés. Il se trouve qu’aucun n’était en langue étrangère.

J’avais donc une liste d’ISBN, que j’ai copié dans Word, où j’ai remplacé

  • tout saut de ligne (caractère ^p dans la boîte de Chercher-Remplacer)

par

  • “>Lien Amazon</a><br/>^p<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=

Cela m’a généré une liste de liens HTML : l’URL http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=numero_d_isbn correspond à une recherche de livre dans Amazon.

<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=9782701146591″>Lien Amazon</a><br/>
<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=8423324370″>Lien Amazon</a><br/>
<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=9782748344998″>Lien Amazon</a><br/>
<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=9782130571124″>Lien Amazon</a><br/>
<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=9782916589114″>Lien Amazon</a><br/>
<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=9780729302968″>Lien Amazon</a><br/>
<a href=”http://www.amazon.fr/s/ref=nb_ss_b?__mk_fr_FR=%C5M%C5Z%D5%D1&url=search-alias%3Dstripbooks&field-keywords=9782804159450″>Lien Amazon</a><br/>

J’ai ensuite inséré ce code dans une page HTML vide : c’est à dire que j’ai ouvert Notepad, j’ai rajouté en tête de liste

<html><head/><body>

et en fin de liste

</body></html>

Et j’ai mis dans le nom de fichier une extension .html

Bon, ensuite j’ai dû ouvrir manuellement les 50 liens : LinkChecker ne m’aurait rien appris.

« Articles plus anciens