Skip to content

Gérer une base de signets (3/4)

18/06/2009

Je reprends doucement la série de billets consacrés à la gestion d’une base de signets. Celui-ci, court, est consacré aux outils de gestion.

Je ne parle pas ici du logiciel utilisé, mais, dans un contexte de gestion décentralisé (« correspondants Signets » dans les sections), ce dont les responsables de signets souhaitaient disposer en termes de :

  • fonctionnalités pour gérer la base, ou « leur » base (càd la sous-partie du tout qui était gérée par eux)
  • renseignements sur la base à un temps T.

Cette liste n’est que le résultat de plusieurs mois de pratique, avec des ajustements successifs. Nous avions une base XML dont je pouvais extraire les données pour les traiter de la manière que je voulais.

Donc voici ce dont nous avons constaté avoir besoin :

  • une extraction de l’intégralité des URL stockées dans la base
  • une vérification automatique des liens
  • un filtre par gestionnaire (pour que dans l’interface de gestion la personne puisse n’afficher que les signets qu’il gérait)
  • un champ de date de vérification des notices + un champ de date de modification des notices

Des rapports fournissant les informations suivantes :

  • liste des tous les signets, par gestionnaire, avec Titre, Auteur, URL
  • liste de tous les signets (toujours triés par gestionnaire, comme les rapports suivants) avec Titre, Auteur, Description, Sujet
    Oui, j’éditais deux rapports différents, pour éviter des tableaux à 10 colonnes, vite illisibles. Dans cette seconde liste, les gestionnaires visaient avant tout l’homogénéisation des pratiques. La première liste est surtout là « pour info ».
  • nombre de signets par section

ces trois premiers rapports servaient à chacun à comparer sa propre base (en quantité et en contenu) avec les autres.

  • liste des signets triés par section puis (pour chaque section) par date de dernière modification (les plus anciennement modifiés en tête = ceux à revoir d’abord).
  • liste des URL stockées plus d’une fois dans la base (doublons, triplons, etc.)
  • liste des URL trop longues
    Ce dernier point est intéressant : la base de signets est interrogeable par moteur de recherche, et affiche une liste de résultats. Nous avons choisi de rendre visible l’URL de chacun des signets (plutôt que de rendre le titre cliquable, pointant vers le site décrit). Donc nous donnons à voir l’URL. Celle-ci doit donc être (autant que possible) simple. Cela a permis de réfléchir à la structure des URL, notamment quand elles contiennent un identifiant de session. Exemple : http://www.scirus.com/srsapp/ et http://www.scirus.com/ pointent vers la même page. Donner à voir à l’utilisateur la « version courte » est toujours un service à lui rendre.
    Donc je générais un rapport qui listait les signets dont l’URL dépassait 50 caractères (évidemment, c’était parfois nécessaire).

Je donne cette liste telle quelle, sans échelle d’importance : si vous avez à en gérer une, vous saurez tout seul attribuer ces degrés.

Selon l’outil utilisé, notamment si c’est une base locale ou un gestionnaire en ligne de favoris (du type Delicious), la réponse à ces besoins sera plus ou moins complète, et surtout elle se fera par des moyens différents.

Mais il est évident que la possibilité ou non d’obtenir ce genre de manipulations et d’informations n’est pas l’argument ultime pour choisir un outil, puisque l’ergonomie, la simplicité d’utilisation et de maintenance, comme la possibilité d’intégration dans l’ensemble des outils de la bibliothèque, sont primordiaux.

Mais je voulais tout de même donner cette liste pour information. Puisque, comme je le rappelle (encore !), ceci n’est qu’un retour d’expérience et non une réflexion approfondie sur cette question.

La liste intégrale des URLs

J’y tiens beaucoup, d’une manière ou d’une autre, il vous faut :

  1. pouvoir extraire l’intégralité de vos URL
  2. pouvoir extraire régulièrement les nouvelles URL et elles seules.

Pourquoi ? Pour ça : pour générer à partir de vos signets un moteur de recherche en texte intégral sur une partie du web sélectionnée par vous.

Il me semble qu’avoir une base de signets est en soi légitime et précieux (si jamais celle des autres ne vous satisfait pas). Toutefois pour l’usager la notion de base de signets, de notices de sites web, peut paraître très étrange, sinon incompréhensible.

Si bien que si vous pouvez lui proposer, à un endroit ou à un autre, une recherche en texte intégral dans les sites que vous avez sélectionnez pour lui, c’est un type de contenu (et un mode d’interrogation) dont il comprendra peut-être mieux l’utilité.

Sur Jubil, est proposée

  • une interrogation de la base de signets en recherche simple (unifiée) sur la page d’accueil,
  • en recherche multi-ressources, 4 moteurs thématiques intitulés « Le web de la Physique-chimie », « Le web des sciences de la Terre », « Le web de la médecine » et « Le web des Math-Info ».

Je ne prétends pas que la terminologie soit pleinement satisfaisante, non plus que l’emplacement de ces moteurs (un peu discrets), mais au moins le service existe, il est disponible.

Ces 4 connecteurs correspondent à 4 moteurs Google CSE, dans lesquels nous avons chargé des extractions partielles (filtres par sujets).

Il faut ensuite actualiser ces moteurs avec les sites nouvellement entrés.

Il y a le problème des signets que l’on supprime (chaque gestionnaire supprime des sites de la base de signets, alors qu’une seule personne gère le moteur Google : problème de communication à prévoir), et qui me laisse penser que le fonctionnement le plus simple serait de vider chaque moteur pour le recharger complètement.

Malheureusement Google CSE ne permet de supprimer les sites que 20 par 20 : l’élimination complète risque d’être fastidieuse.

Bref, sans avoir de solution complètement satisfaisante pour une gestion parfaite de ce service, il me semble que c’est un vrai service à rendre à nos lecteurs.

PS : si vous utilisez des services comme Delicious, et que vous ne savez pas comment en extraire la liste des URLs brute pour l’injecter dans un moteur Google nouvellement créé, je vous ferai une petite vidéo.

PS 2 : à vous ensuite de mener une réflexion sur l’intégration d’un tel service. Ce genre de moteur peut être aussi utile simplement en interne, quand vous êtes dérangé sollicité en service public sur une question de chimie à laquelle vous ne comprenez rien.  Une rapide recherche dans un moteur thématique peut rendre de grands services ! Mais si vous demandez à votre webmaster d’intégrer le formulaire de recherche quelque part dans votre site web (de préférence au bon endroit), c’est peut-être encore mieux.

PS3 : à Jussieu, nous nous étions posé la question de supprimer carrément l’interrogation de la base de signets, pour ne proposer que la recherche en texte intégral. Finalement nous y avions renoncé, je ne sais plus pourquoi.

Advertisements
3 commentaires
  1. 18/06/2009 22:15

    PS 4 : pas si court que ça, finalement, ce billet…

  2. Auteur ABES permalink
    19/06/2009 18:30

    Bonjour,

    Le site « signets des universités » http://www.signets-universites.fr/ , récemment ouvert et fruit d’une collaboration Abes-Cerimes, permet aux établissements de récupérer par moissonnage OAI des données structurées en LOMFr. L’idéal pour les mises à jour est d’automatiser les procédures de moissonnage selon une périodicité définie : un vérificateur de liens indique les liens rompus et met les notices en statut « à corriger ». Des abonnements RSS par discipline, sont également proposés.
    Un rappel : cet « outil pour tous enrichi par chacun » ne pourra exister que grâce aux contributeurs. Mutualisation des efforts et partage des contenus : telle est la philosophie qui a présidé à ce projet, récompensé hier par le prix i-expo de la « meilleure initiative de l’année ». Pour tous renseignements complémentaires, n’hésitez pas à prendre contact à l’adresse suivante : signets@abes.fr
    Merci !!!

Trackbacks

  1. bookmark from diigo 06/19/2009 : Relation, transformation, partage

Les commentaires sont fermés.

%d blogueurs aiment cette page :