15 jours sans dormir (ou : deux semaines de veille) : Electre, Vigilibris, Amazon

Avertissement : ce billet a traîné un certain temps, et a suscité en moi des constatations pleines de perplexité. Je ne savais plus que faire de mes observations. Pardon pour la confusion du propos et la maigreur de la conclusion…

Après avoir comparé Electre, Vigilibris et Amazon comme source de veille pour un acquéreur en droit, je vous indique d’abord les conclusions de mon observation.

Ceux que ça intéresse iront lire ensuite la méthode utilisée.

S’il ne faut en choisir qu’un, Electre me semble l’outil le plus complet pour faire de la veille :

  • Liste la plus fournie (le plus grand nombre de titres), avec des titres pertinents
  • Certains ouvrages ne sont mentionnés que par Electre. L’inverse (ouvrages présents chez Amazon ou Vigilibris et pas chez Electre) est plus rare.

logo Electre

Pour ceux qui n’auraient pas Electre ou ne veulent pas/plus l’utiliser, Vigilibris est un bon outil, mais beaucoup moins complet, semble-t-il (il propose deux fois moins de titres qu’Electre).

Amazon est très lacunaire pour permettre une veille documentaire. En revanche sa base est (on le sait) bien fournie et peut permettre une bonne récupération de notices via Moccam-en-ligne : Amazon propose (sur 15 jours) 5 fois moins de titres qu’Electre comme nouveautés, pourtant 84% des nouveautés Electre sont bien dans la base Amazon…

D’un autre côté, les quelques titres donnés par Amazon sont à 70% absents des listes de nouveautés Electre et Vigilibris (peut-être parce que ces deux-là les avaient déjà mentionnés avant, je n’en sais rien).

Donc si on se contente des 3 outils comparés ici :

  • on peut faire de la veille (uniquement francophone) avec Electre.
  • si on épuise son quota d’export de notices d’Electre, on peut récupérer sur Moccam les notices d’ouvrages trouvés grâce à sa veille Electre, au moins pour 85% des cas.

Mais en réalité le protocole de test est mauvais (en plus des limites signalées ci-dessous) : il part du principe, d’une certaine manière, qu’on peut n’avoir qu’une seule source, et qu’il est impossible de les associer, de les fusionner.

Ce que j’aurais aussi pu faire avec tout ça — et ce dont, à mon avis, tous les acquéreurs ont besoin

Il faudrait

  1. une page Bibliopedia listant des fil RSS pour acquéreurs, par domaine d’acquisition
  2. un #pype qui, pour chacune de ces disciplines, fusionne les fils RSS listés, puis
    1. les dédoublonne (critère : ISBN)
    2. enrichisse les notices avec des liens vers Amazon, LibraryThing et autres sites de commentaires et de critiques (des idées ? Peut-être aussi une simple recherche Google sur le critère Titre), ou même affiche directement les commentaires et résumés Amazon et LT dans la notice détaillée
    3. propose aussi un lien vers le Sudoc, pour que l’acquéreur puisse voir qui aurait déjà acheté l’ouvrage
  3. que le #pype permette à l’acquéreur de ne pas tenir compte de tel ou tel fil RSS présent dans la liste Bibliopedia
  4. que l’acquéreur puisse rajouter un flux dans ce #pype, sans vouloir nécessairement le mettre sur Bibliopedia (besoin très local, inutile à la communauté)

(les points 3 et 4 visant à éviter que tous les SCD de France se mettent à acheter les mêmes choses ! il faut aussi une certaine souplesse, même facultative)

Et dans une telle configuration, Electre ne pourrait venir enrichir le flux principal (Electre n’est pass exportable en RSS). Une fois qu’une telle source serait définie, Electre serait alors à comparer à ce flux, comme outil alternatif ou complémentaire.

Ce que je décris là intéresserait-il réellement des acquéreurs ?

Quels seraient les ajustements à y apporter ?


Voici le protocole de test

Suite à des questions internes, j’ai comparé une veille thématique sur Electre, Vigilibris et Amazon sur le thème Droit.

Ceci pendant deux semaines : plus exactement du lundi 5 octobre au vendredi 16 octobre 2009.

Ainsi vous êtes déjà prévenus sur les LIMITES ENORMES quant aux conclusions qu’une telle comparaison autorise :

  1. délai très court.
  2. domaine non représentatif (très français ?).
  3. peu de concurrence (et toutes les autres sources, alors).

Je fais d’avance ces critiques pour vous économiser du temps. En l’état, la comparaison (qui l’a déjà faite ?) peut être utile. Surtout, ce qui peut être utile, c’est que chaque acquéreur la reproduise sur une période d’un mois pour chacun de ses domaines d’acquisitions.

Bref.

Fonctionnement de chaque base

L’abonnement à chaque base a commencé le 19 octobre et s’est terminé le 30.

Electre

Electre propose d’envoyer un mail quotidien, hebdomadaire ou mensuel, sur une requête effectuée dans la base. J’ai choisi un mail hebdomadaire sur la requête : “Dewey = 34 (Droit) ou Thème = Droit”.

Le mail envoyé contient un lien vers la liste des résultats correspondant à la requête pour les ouvrages nouveaux depuis le mail précédent.

J’ai reçu un 1er mail le 19 octobre (avec 66 références), et un second le 26 octobre (avec 61 références). Donc un total de 127 références.

A noter : l’URL fournie par le mail reçu renvoie à une requête qu’on ne peut afficher qu’une seule fois (ou pendant une durée déterminée). En tout cas je n’ai pas la possibilité d’y revenir et de partager le lien.

Vigilibris

Vigilibris propose de sélectionner un thème (et des sous-thèmes), pour un envoi par mail.

Le mail contient des notices simples (Titre, Auteur, Prix, page de couverture), avec un lien vers la notice détaillée. A noter : le lien contient l’EAN du document (ex. : http://www.decitre.fr/partenaires.aspx?action=vigilibris&ean=9782297013062).

J’ai reçu un 1er mail le surlendemain de l’abonnement me donnant la liste des nouveautés parues durant le mois passé. J’ai trouvé cela très obligeant ;-) .

Puis un second mail le 23/10, intitulé “Liste des nouveautés du 14/10/2009 au 20/10/2009″) avec les 36 nouveautés de la semaine.

Enfin un 3e mail le 30/10, intitulé : “Liste des nouveautés du 21/10/2009 au 27/10/2009″ (42 références).

Amazon

Amazon propose des fils RSS pour les Nouveautés, en passant par la rubrique “Actualités et nouveautés”, puis en choisissant une discipline, et (en bas de page), en cliquant sur le lien “Encore plus de nouveautés”. J’ai donc choisi la rubrique “Droit” (fil RSS correspondant).

J’ai pu constater un problème avec les fils RSS : si vous n’ouvrez pas votre agrégateur régulièrement, vous perdez de l’information.

Pour rappel : un “fil RSS”, c’est simplement un fichier XML. Chaque fois que vous ouvrez votre agrégateur, il va chercher dans le fichier les nouveaux items depuis la fois précédente. Or un fil RSS est souvent tronqué : il ne garde que les 10 ou 20 derniers items. Si le samedi paraissent 15 items, et le dimanche 15 autres items, et que le fil RSS est paramétré pour n’en contenir que 20, le lundi matin je verrai les 15 items du dimanche, plus les 5 plus récents du samedi.

Au final, Amazon a enrichi son fil RSS de 30 références. Donc 4 documents en double, et un en triple — soit, en réalité, 24 références.

Vous pouvez consulter ici la liste de toutes ces références (tableur Google Docs à 4 feuilles)

Comparaison 1 : nombre de titres

Nombre de titres sur 15 jours
Electre 127
Vigilibris 78
Amazon 24

Comparaison 2 : langue de publication

Tous les titres sont en français. Electre m’a fourni (hors cette période de test) quelques titres en anglais : ce sont les publications officielles du Conseil de l’Europe.

Comparaison 3 : pertinence

Difficile à juger sans politique documentaire définie et sans profil institutionnel (BU, BM, etc.).

Je regarde donc juste la justesse d’indexation (est-ce que tous les titres ont leur place dans une veille en droit ?). Vous pouvez analyser les listes directement.

Tous les titres des trois listes m’ont paru à leur place dans une recherche sur le domaine “Droit”. Après un rapide survol je n’ai trouvé aucune d’aberration.

Comparaison 4 : taux de recoupement des titres

C’est le plus intéressant, mais le plus complexe à faire aussi. J’ai dû un peu utiliser Yahoo Pipes pour traiter ces données (je vous passe les détails). Il m’ a été impossible d’analyser le contenu de la base Decitre, à cause de l’encodage manifestement très spécial de leur formulaire : je n’ai pas réussi à construire une URL de requête sur critère ISBN.

<update>J’ai finalement réussi à bidouiller avec le plugin de recherche rapide Decitre trouvé sur Mycroft</update>

Nb titres Nb titres présents
dans les listes de nouveautés
des deux autres sources(pas seulement une des deux)
Nb titres absents
des nouveautés
des deux autres sources
Nb titres présents dans la base (interrogation
catalogue) d’une autre source
Electre 127 49 (39%) 78 (61%) Titres Electre présents chez Decitre : 94 (75%)Titres Electre présents chez Amazon : 107 (84%)
Vigilibris 78 47 (60%) 31 (40%) Titres Vigilibris présents chez Electre : 70 (90%)Titres Vigilibris présents chez Amazon : 73 (94%)
Amazon 24 7 (29%) 17 (71%) Titres Amazon présents chez Electre : 24 (100%)Titres Amazon présents chez Decitre : 16 (66%)

La veille avec Electre : vierges sages et vierges folles

Le titre est terrible, je sais : je bascule dans l’iconographie chrétienne après la mythologie grecque. Mes souvenirs en mythologie grecque ne me permettent pas de retrouver aucune allusion relative à une quelconque veille.

En revanche, on a dans les Evangiles  des vierges folles et des vierges sages, qui attendent le retour de l’Epoux (elles veillent, certaines intelligemment, d’autre non).

La veille avec Electre, c’est possible, mais c’est pénible aussi.

C’est comme pour le reste : plus satisfaisant que LivreHebdo, mais pas vraiment professionnel non plus.

Le principe est simple :

  1. Vous allez en recherche avancée.
  2. Vous cochez le champ “Dewey”, et vous sélectionnez la cote correspondant à votre ou vos domaines d’acquisition (ci-dessous : Religion + Linguistique)
  3. Dans la ligne suivante (avec le booléen “ou”), vous choisissez le “Thème” (classification interne Electre, je crois), et vous reprenez les mêmes rubriques que pour la Dewey (ci-dessous : Religion + Linguistique).

L’objectif étant de balayer de manière la plus large possible vos domaines d’acquisition.

Cela vous donne quelques milliers de résultats, les derniers étant les plus récents.

Ensuite

  1. Vous allez dans Mes recherches
  2. Vous enregistrez la recherche que vous venez de faire, comme recherche sauvegardée
  3. Vous demandez un envoi par mail hebdomadaire des dernières mises à jour.

Désormais, vous recevrez d’Electre un mail contenant un lien. En cliquant sur ce lien (et après authentification dans Electre), vous obtiendrez la liste des ouvrages parus dans les domaines sélectionnés, pour la semaine écoulée.

Bref, vous aurez ainsi une extraction d’Electre pour vos domaines d’acquisitions. Soit exactement ce que vous aviez avec LivreHebdo.

Vidéo (2′16) : Paramétrer une veille sur Electre

Vous noterez au passage que l’envoi par mail n’est possible que pour 3 recherches enregistrées.

Donc si toute la bibliothèque utilise le même compte Electre, seuls 3 acquéreurs sont bénis.

Mais rassurez-vous, votre responsable Doc Elec dispose d’un mot de passe administrateur sur Electre pour créer un compte spécifique à chaque acquéreur.

Ce qui amène à utiliser Electre désormais avec des logins différents pour chaque acquéreur, et une gestion des habilitations pour la Doc élec.

Pourquoi la veille avec Electre est-elle du côté des vierges folles ?

D’abord parce que le concept de veille devrait être associé au réflexe “Fils RSS”. Il est d’ailleurs possible techniquement de proposer des fils RSS sur authentification, ou sur contrôle d’adresse IP (un fil RSS, ce n’est jamais qu’un fichier XML très simple).

Ensuite parce que même en envoyant un mail, Electre réussit à ne fournir aucune information dans ce mail : pour les notices, il faut retourner sur l’interface web.

Bref : du grand art.

Dès que possible, nous irons faire un tour du côté de Vigilibris. Ce n’est pas encore du RSS, mais c’est du mail de veille plus intelligent.

Electre ou le tonneau des Danaïdes : la gestion des paniers (percés)

J’ai commencé la série sur Electre avec des allusions plus ou moins étymologiques et plus ou moins paraphrastiques.

Je m’efforce de persister dans la veine, mais je pressens que je rencontrerai de plus en plus de difficultés, et de moins en moins de pertinence. Pour être plus exact, je pressens que bientôt ces allusions seront dadaïstes.

Continuons.

Situation initiale

Ce qu’on constate généralement sur Electre, c’est une liste insupportable de paniers aux noms ésotériques, redondants, cabalistiques ou inutiles :

FC, Informatique, Sciences de la vie 01052004, FC2, FC3, Bib Sciences, etc. où vous pressentez d’ailleurs que le FC en question est un certain collègue parti depuis un an et demi.

Je ne suggère pas de nettoyer pour le plaisir de ranger (vous verriez mon appart !) mais pour faciliter une certaine organisation du travail.

Condition initiale : qu’il y ait au sein de la bibliothèque une personne désignée et reconnue comme ayant le droit

  • d’administrer Electre
  • de poser des règles d’utilisation
  • de faire du nettoyage régulièrement

Proposition de rangement

  • Un dossier par bibliothèque (quand un SCD ou une BM a plusieurs BU ou antennes).
  • Dans chaque dossier de bibliothèque, un dossier par acquéreur (sauf si certains acquéreurs partagent les mêmes domaines d’acquisitions, ça, c’est à voir).
  • Le dossier d’un acquéreur est à son nom complet (par les initiales, pas seulement le prénom), sous la forme : Nom Prénom, afin d’exploiter le classement alphabétique automatique d’Electre.
  • Dans son dossier perso, chaque acquéreur a autant de dossiers que de domaines d’acquisitions.
  • Dans chaque dossier “Domaine d’acquisitions”, deux paniers :
    1. Domaine d’acq – Commandes en cours
    2. Domaine d’acq – Commandes passées

(voici une arborescence bidouillée sous Windows, pour rendre compte d’un tel rangement)

Deux paniers par domaine d’acquisition ?

Oui : le panier “Commandes en cours” contient les titres qui n’ont pas encore été chargés dans le SIGB. Peut-être certains vont-ils finalement être supprimés de vos choix. Lorsque vous avez chargé le contenu du panier “Commandes en cours”, vous le transférez dans le panier “Commandes passées”, pour en garder une trace (si vous souhaitez en garder une trace).

Vidéo : Transférer des notices d’un panier à l’autre (1‘57, où la première minute est en trop…)

A chaque clôture budgétaire, vous avez le choix entre archiver le dossier “Commandes passées” (en le renommant pour y ajouter le nom de l’année concernée), ou simplement le vider.

Quand on “archive” un panier, il est impossible d’y mettre de nouvelles notices (il n’apparaît plus dans la liste des paniers quand on veut remplir un panier suite à une recherche dans Electre). En revanche, on peut le “désarchiver” pour le remplir de nouveau si nécessaire.

Si vous voulez conserver un panier sans avoir plus l’intention de l’alimenter, mieux vaut l’archiver.

A suivre : les modèles de paniers (rajouter des champs)…

Mais le prochain billet sur Electre portera sur la veille documentaire.

Gérer une base de signets (2/4) : une politique documentaire

J’ai involontairement suscité un effet d’annonce avec le premier billet, et je crains que la suite ne soit pas à la hauteur des attentes. Donc acceptez d’avance mes excuses. Cette série de 4 billets est avant tout un retour d’expérience sur ce qui avait été mis en place et préconisé pour la base de signets de Jubil, le portail documentaire de l’UPMC.

Ce portail contient une base de 1200 signets environ (dont ceux du Cadist en sciences de la Terre). Cette base est interrogeable dès la page d’accueil, en même temps que les autres ressources des bibliothèques (collections imprimées, revues en ligne, e-books et pages du site). Sa gestion est éclatée entre des “correspondants Signets” en sections, les sections étant à la fois disciplinaires (mathématiques, informatique, etc.) et par niveau (L1-L2, L3-M1, M2-D).

Outre la recherche simple par mots-clés, il est aussi possible de naviguer dans toutes les collections en ligne (signets, e-books, revues en ligne et bases de données) par arborescence thématique : 13 disciplines scientifiques définies (dont 4 uniquement pour la médecine), chacune contenant entre 10 et 20 spécialités.

Ces disciplines et spécialités servent aussi à classer les nouvelles acquisitions papier et en ligne. Donc leur nombre et leur dénomination doit correspondre à l’ensemble des documents recensés.

Pour les signets spécifiquement, nous avons aussi désigné 10 types de sites web, dont la liste est certainement insatisfaisante et contestable.

Tout ceci pour vous permettre de mieux comprendre ce qui suit, dans la définition qui en a découlé d’une “politique documentaire” autour de la base de signets.

Par “politique documentaire”, j’entends la prise en compte de la base comme d’un fonds spécifique, où les “documents” ont une raison pour y être, et soumis à certaines règles de cohérence :

  • vérification de la couverture des collections
  • complémentarité entre sections
  • dédoublonnage
  • désherbage

1. Définition d’une politique documentaire

C’est une nécessité : il s’agit d’assigner un rôle et un contenu plus ou moins flou à cette base :

  1. vient-elle uniquement en renfort du site web, qui lui-même mentionne de nombreux sites (dans ses tutoriels, ses supports de formation, etc.)
  2. intègre-t-on les questions d’actualités, ou bien veut-on un contenu plus pérenne ?
  3. s’adresse-t-on aux étudiants ? aux enseignants ?
  4. intègre-t-on les cours d’autres universités (problème politique !)
  5. comment ma base de signets se positionne-t-elle par rapport aux bases nationales ?

Ce dernier point est intéressant : cela a-t-il encore un sens de créer une base de signets locale, alors qu’il y a déjà ceux de la BnF, ceux du Cerimes/Abes, ceux de tel ou tel Cadist ?

  • Est-ce que je vais profiter du contenu de ces bases existantes pour enrichir la mienne (en reprenant leurs notices, ou presque) ?
  • Est-ce que mes signets seront exclusivement du complément à ces bases ?
  • Est-ce que je vais créer une rubrique de signets intitulée “Signets” et référençant ces bases ?
  • Est-ce que je vais proposer un formulaire de recherche sur mon site vers l’une de ces bases ?
  • Est-ce que je ne vais pas renoncer simplement à monter une base de signets ?
  • Est-ce que je vais d’emblée choisir un outil de gestion de base de signets, qui me permettra de moissonner l’une ou l’autre de ces bases, pour proposer une recherche unique dans une vaste collection de signets où je n’aurai enrichi qu’une partie minime ? [cette question de l'outil sera l'objet du 4e billet]

2. La découverte de nouveaux sites

J’ai toujours eu le sentiment que trouver de nouveaux sites à signaler n’était jamais vraiment un problème : les collègues furetaient sur Internet, dans les revues de vulgarisation scientifique, etc. mais n’étaient jamais à court d’idée pour créer de nouvelles notices.

Eventuellement, ils étaient à court de temps parce que l’alimentation de la base n’était jamais définie comme une priorité.

En revanche il est plus difficile, quand on gère un certain nombre de signets, d’en conserver une vision cohérente pour lui donner un sens. C’est donc là-dessus que je me suis davantage penché.

J’avais tout de même donné trois critères complémentaires, pour éviter que l’alimentation de la base soit tout à fait le fruit du hasard des rencontres :

  1. On peut enrichir la base en fonction des collections de la bibliothèque (utilisation du plan de classement)
  2. On peut l’enrichir en fonction des programmes d’études (en allant chercher sur le site de l’université les sujets d’études ou les pôles sur lesquels elles veut mettre l’accent)
  3. On peut l’enrichir en fonction de l’actualité (que propose ma bibliothèque en terme de signets sur l’épidémiologie en général, et la grippe porcine/mexicaine en particulier ?)

3. La couverture des collections

Revenons au cas de Jubil.

Quoique l’accès par sélection d’une discipline et/ou d’un type de site soit certainement très minoritaire pour l’utilisateur, elle permet de vérifier régulièrement que toutes les cases sont remplies :

Si nous avons défini une spécialité Biologie > Biologie moléculaire, celle-ci contient-elle des signets ?

1. Si non

  • Dois-je remplir la “case” avec des signets, ou bien ce n’est pas pertinent (la rubrique restant pertinente pour les autres types de ressources ?
  • Dois-je faire supprimer la spécialité (qui avait été définie a priori et se révèle non pertinente à l’usage) ? ou la regrouper avec une autre, sous une nouvelle appellation ?

2. Si oui

> Combien ? S’ils sont peu nombreux, faut-il

  • trouver de nouveaux sites sur le sujet ?
  • mieux indexer les signets existants (par exemple des sites plus vastes, portant sur plusieurs aspects de la biologie) ?
  • décréter qu’il y a effectivement peu de sites sur ce sujet ?

> S’ils sont nombreux, faut-il

  • en désindexer ?
  • en supprimer ?
  • estimer que tous les sites sont légitimement dans la base

Mais qu’est-ce que cette légitimité ?

Il ne suffit pas que le site soit intéressant, structuré, riche, mis à jour régulièrement. Il faut encore que le “correspondant Signets” le décrive en imaginant à quel profil d’internaute il s’adresse : étudiant, prof, chercheur ? débutant dans un domaine ? cherchant de l’actualité dans sa discipline ? etc.

Voyez cette recherche : je m’intéresse au tableau périodique des éléments (de Mendeleïev) pour avoir un site riche en contenus qui ne se satisfasse pas de m’en reproduire l’image brute.

Tableau périodique des éléments. Image Wikimedia

Tableau périodique des éléments. Image Wikimedia

Jubil recense 6 signets : six sites référencés dans la base comme fournissant de la documentation autour de ce tableau.

En tant qu’utilisateur, je vois ces 6 sites, et je n’ai aucun moyen de savoir a priori

  • pourquoi autant de sites, s’ils sont redondants, ont été référencés dans cette base ?
  • lequel va le plus m’intéresser ?

Donc si on définit des doublons, non comme deux notices d’un même ouvrage, mais comme deux sites traitant de la même chose, il faut dédoublonner,

  • soit en supprimer une des deux notices
  • soit en explicitant la différence entre les deux sites, et pourquoi les deux méritent, à des titres différents, d’être dans cette base.

Ainsi, sur cette requête (recherche “Pubmed”), j’obtiens à la fois un lien vers Pubmed, ainsi que différents tutoriels dont la description me permet à peu près d’en saisir d’emblée les différences, et d’en déduire celui qui m’intéressera le plus.

4. Le désherbage

Il faut revoir périodiquement chacun des signets, et se reposer à chaque fois la question de la légimité de sa notice en l’état. La conclusion d’un tel examen peut être :

  • sa confirmation telle quelle (le site n’a pas changé, donc sa description ne change pas) –> se demander d’ailleurs si un site qui ne bouge pas a sa place dans la base (ce peut être le cas : le CCFr, par exemple).
  • sa mise à jour, en tenant compte à la fois du contenu du site lui-même (qui a changé depuis la dernière fois) et du contenu de la base de signets, qui a également changé. Car le signet apparaît toujours dans une liste de résultats, en contexte — et il est difficile mais indispensable de prévoir ce contexte : quelles recherches vont amener l’apparition de ce signet ? et si j’effectue cette recherche, quels seront les autres signets ?
  • sa suppression –> éventuellement son remplacement par un nouveau site, plus légitime.

J’insiste beaucoup sur une question très prosaïque, très comptable, mais qui me semble indispensable : combien de signets suis-je capable de gérer ?

5. Définir un nombre de signets “idéal” pour ma base

Cela paraîtra peut-être ridicule à certains a priori, mais j’y tiens beaucoup :

  • comme tout signet doit faire l’objet d’une révision régulière (ou toute la crédibilité de la base en pâtit)
  • comme je dispose d’un temps limité chaque semaine pour gérer cette base

alors il est inconcevable que je définisse mon travail comme un simple enrichissement de la base. Et pour me donner à la fois les moyens de revenir sur les anciens signets + en créer de nouveaux, je ne doit pas dépasser une certaine masse critique.

Je vous propose la démarche suivante pour définir cette taille critique. Elle dépend de trois variables :

  1. Quelle est la périodicité raisonnable pour revenir sur un signet ?
  2. Combien de temps puis-je consacrer à la gestion de ma base chaque semaine ?
  3. Combien de minutes je passe à revoir un signet existant (le site lui-même + la notice existante)

Dans mon exemple, on va dire que je considère qu’il faut revenir sur un signet tout les 4 mois [ce nombre dépendra de la nature des sites que vous indexez, et de votre base en général : voulez-vous faire des liens sur l'actualité, ou référencer seulement des organisations internationales ?]

Et imaginons que je puisse consacrer 1 heure / semaine à la gestion de ces signets.

Cette heure sera consacrée pour moitié à la reprise d’anciens signets, et pour moitié à la recherche et création de nouveaux signets1. Donc je passe 30 minutes par semaine à revoir les signets existants.

Si j’ai besoin de 6 minutes par signet, je “révise” 5 signets par semaine.

Donc en quatre mois (4 mois = 16 semaines), j’aurai revu 5*16 = 80 signets

Comme il me faut revoir l’intégralité de ma base sur 4 mois, celle-ci ne doit pas excéder 80 signets.

Ce mode de calcul donne toujours des chiffres assez faibles : en effet nombreux sont ceux qui, dans leurs favoris (sur leur navigateur, sur Delicious ou ailleurs) ont plus de 80 signets. Mais il s’agit là d’une base qui a une autre visibilité que vos favoris.

L’expérience m’a montré que :

  1. on n’arrive jamais à consacrer 1h/semaine à la gestion de la base
  2. il faut plus de 6 minutes pour revoir un signet de manière satisfaisante

Donc en réalité il en faudrait moins que cela.

Conclusion

C’est tout ! Le prochain (billet 3/4) doit porter sur les outils nécessaires aux gestionnaires de la base pour pouvoir faire confortablement tout ce que je viens de décrire…

———————————

1. Notez au passage que cela implique d’avoir des notices comportant un champ “Modifié le …”, ou de tenir à jour sous Excel la liste des signets mis à jour.

Gérer une base de signets (1/4)

Ce premier article d’une série de quatre ne vise pas à proposer une solution technique (pour une fois !) à la gestion d’une base de signets, mais plutôt à donner un ensemble de principes qui relèvent plus de la politique documentaire.

La politique documentaire, je l’avoue,  n’est pas vraiment mon rayon, mais comme j’ai eu la responsabilité d’un groupe de “Gestionnaires de signets” à l’UPMC, j’ai eu l’obligation d’apporter des réponses à un certain nombre de questions.

Principes de base :

  • Une base de signets est différente d’une liste de sites sur une page web (ou plusieurs pages web)
  • Elle ne servira pas souvent si on ne la met pas dans un moteur de recherche commun
  • Elle doit faire l’objet d’une politique documentaire, en définissant par exemple si doivent/peuvent être signalés :
    • des sites “de référence”
    • de petits sites
    • des sites événementiels
  • Comment définir sa base de signets dans le paysage national, voire international : comment exploiter ceux du Cerimes-Abes, ceux de la BnF, etc.

Principe 1 : Une base de signets est différente d’une liste de sites sur une page web (ou plusieurs pages web)

Une base de signets est n’existe pour l’usager que comme une liste de résultats obtenue suite à une requête. Cela signifie par exemple qu’il ignorera a priori la logique de la base (complétude, domaines couverts, etc.).

Il est déjà passé par Google avant : il faut donc que votre site ait une raison d’être là en complément de Google, par exemple pour l’une ou plusieurs des raisons ci-dessous :

  • il est incontournable, et ne pas le mettre dans votre base serait ridicule
    Attention toutefois à cette logique : sur une page web listant des moteurs de recherche web, ne pas mettre Google serait compris comme étant de l’anti-googlisme primaire. En revanche créer une notice pour Google dans une base de signets serait inutile. Même chose pour des sites auxquel l’usager penserait sans vous : Pôle Emploi, SNCF, etc.
  • vous le “validez” comme ayant un contenu scientifique adapté aux besoins de vos usagers
  • il propose des outils particulièrement intéressants, difficiles à repérer en passant par Google ou même une fois sur le site (donc il faut décrire ces outils)
    Par exemple Google Maps peut avoir sa place dans une base de signets, même si vous supposez que votre lecteur connaît déjà son existence. Mais vous pouvez lui en “révéler” des usages intéressants auxquels il n’aurait pas pensé, par exemple en terme de collaboration autour d’informations géolocalisées.
    Idem, vous pouvez indiquer le site du CNRS en précisant pourquoi vous le mettez (donc il vous faut une raison)

J’ai tendance à préférer le langage naturel pour décrire les sites web (pour être plus clair : à éviter le Rameau), mais je ne vais pas me lancer dans un débat là-dessus. Cela dit, une double indexation est intéressante : indexation sujet (fine, redondante) et une classification, permettant un autre mode d’accès ressemblant plus à une promenade dans les rayons.

La description du signet doit utiliser les termes qu’utiliserait l’internaute s’il cherchait ce genre de sites, pour la raison que vous avez imaginé. Par exemple s’il cherche des sites d’actualités scientifiques, ou des blogs de philosophes, il faudrait que “philosophe” apparaisse dans la notice aussi bien que “philosophie”, et le mot “blog” devrait y être. Si possible, trouvez un moyen systématique pour faire savoir que tel site a un fil RSS (cela dit, de moins en moins de sites n’en proposent pas, donc je me demande si cette consigne est toujours pertinente).

La classification envisagée, si elle permet une navigation spécifique dans la base, doit être pragmatique : elle peut s’appuyer sur une classification existante, mais en évitant les rubriques vides (parce que sur un sujet donné, il existe des bouquins donc le thème est présent dans la Dewey, mais aucun site web) et les rubriques surpeuplées. Cela dit, une telle situation (des vides et des pleins) peut entraîner une réflexion sur la politique documentaire autour de la collection (cf. 2e billet, à venir).

Principe 2 : un moteur de recherche commun

Je précise d’abord deux choses :

  1. qu’une bibliothèque dispose de signets me semble une évidence : nous revenons toujours aux mêmes sites, nous avons besoin d’en recommander en appui à nos affirmations, et pour éviter d’avoir à tout réécrire. Par exemple pour un tutoriel à telle ou telle base de données, soit je trouve ce tutoriel en ligne et je l’indique dans mes signets, soit je suis obligé de le rédiger moi-même.
  2. Une base de signets est beaucoup plus facile à entretenir, mettre à jour, etc. — bref à rester pertinente — qu’un ensemble de pages où se perdra l’internaute.

Donc dans ce contexte la base de signets est entourée de ressources plus visibles qu’elle, essentiellement :

  1. le catalogue des collections imprimées (pardon : physiques, car il y a les CD-ROM, les DVD, etc.)
  2. la liste A-Z des revues en ligne
  3. le site web

Il me semble évident qu’il faut viser à avoir un moteur de recherche commun pour toutes ces ressources :

  • pour l’internaute, il est incompréhensible d’avoir d’un côté le Web of Science, moteur payant (donc liste A-Z), et de l ‘autre OAIster, Scitopia ou Google Scholar.
  • les signets référençant des tutoriels viennent en appui des tutoriels présents sur le site, donc une recherche commune site-signets est utile.
  • si l’internaute cherche Pascal (la base de données), lui proposer à la fois une notice de la base avec URL, et un renvoi vers un tutoriel en ligne, c’est un service intéressant.
  • l’internaute ne pensera pas que la bibliothèque peut lui recommander des sites, et ne viendra jamais exploiter la belle base de signets qu’on a faite pour lui. Donc tout ce travail perdu…

Sur ce dernier point, on peut aussi considérer que la base de signets est une commodité avant tout interne (notamment trouver une info rapidement en salle de lecture quand un étudiant chimiste vient vous chercher des noises, et que vous ignorez ce qu’on peut trouver sur le web dans son domaine), et que toute consultation par l’internaute est du “bonus”. Il faut alors y consacrer un temps de travail moindre, évidemment.

Une collection comme une autre

On voit déjà se dessiner un principe : la base de signets est une collection comme une autre, qui doit faire l’objet d’une réflexion autour de son contenu, d’une perception cohérente — et notamment d’une personne qui en aura une vision synthétique d’ensemble, au-dessus des responsables de son enrichissement.

Voici les 3 autres billets prévus :

  1. Gérer une base de signets (2/4) : grosso modo, ce devrait être la notion de politique documentaire
  2. Gérer une base de signets (3/4) : quels outils le webmaster doit-il espérer pouvoir fournir aux personnes qui gèrent les signets (car la gestion en est généralement décentralisée) ? càd quelles extractions de données, stats, etc.
  3. Gérer une base de signets (4/4) : quels outils (logiciels) pour tout ça ?

Pas de calendrier pour le moment…

Faut-il acheter Claude Allègre en BU ?

Concernant les ouvrages sur le créationnisme, on peut trouver des solutions satisfaisantes : soit on décide de ne pas acheter, soit on décide d’acheter et on range ça au rayon “Religion”. Evidemment, ça dépend de la vocation de la bibliothèque concernée, mais il me semble dommage de nier l’existence de ce courant, apparemment très fort aux Etats-Unis. C’est un aspect culturel très important qui doit être pris en compte dans les collections des bibliothèques.

Concernant Claude Allègre et ses ouvrages sur le climat, la question se pose très différemment : une BU a-t-elle la possibilité de choisir ?

Si on le considère comme scientifique et que l’on parcourt les comptes-rendus de lecture par ses pairs, il est exclu de mettre à disposition des étudiants des textes aussi entachés d’erreurs (ce n’est pas moi qui le dis).

D’un autre côté, étant donné sa notoriété (et accessoirement son poids politique y compris dans le monde universitaire), il est difficile de faire abstraction de sa production éditoriale. Et il est complètement impossible de ranger ses ouvrages au rayon “Pseudo Science“. Alors?