Sidewiki : garder la fonction sans la barre d’outils Google

Bon, le script GreaseMonkey indiqué dans le précédent billet a un fonctionnement aléatoire :-( (il faudra que je creuse mais je ne vois pas par où commencer : comprendre un script qu’on n’a pas rédigé soi-même, surtout quand le JavaScript vous est très moyennement connu, c’est un exercice périlleux et chronophage).

Heureusement la barre d’outil Google permet, une fois installée, d’utiliser Sidewiki sans afficher la barre elle-même.

Paramètres à régler

Dans l’onglet Disposition, il faut cocher : Conserver les fonctionnalités actives lorsque la barre d’outils est invisible

Profitez-en pour paramétrer tout le reste, notamment dans l’onglet Recherche, décochez :

  1. Envoyer les données à Google sur l’utilisation
  2. Afficher la page “Nouvel onglet” de Google

Et dans l’onglet Outils, en bas de liste (Sidewiki), cliquez sur “Modifier” et décochez : “Afficher uniquement les entrées de Sidewiki rédigées dans la langue de mon navigateur”

Ecrire

Quand vous avez coché cette case, vous verrez en permanence, en bas à gauche des pages web, l’icône suivante permettant d’écrire un nouveau commentaire :

Lire

Et s’il existe déjà des commentaires, vous verrez une barre à gauche (sur toute la hauteur) :

Gérer une base de signets (3/4)

Je reprends doucement la série de billets consacrés à la gestion d’une base de signets. Celui-ci, court, est consacré aux outils de gestion.

Je ne parle pas ici du logiciel utilisé, mais, dans un contexte de gestion décentralisé (“correspondants Signets” dans les sections), ce dont les responsables de signets souhaitaient disposer en termes de :

  • fonctionnalités pour gérer la base, ou “leur” base (càd la sous-partie du tout qui était gérée par eux)
  • renseignements sur la base à un temps T.

Cette liste n’est que le résultat de plusieurs mois de pratique, avec des ajustements successifs. Nous avions une base XML dont je pouvais extraire les données pour les traiter de la manière que je voulais.

Donc voici ce dont nous avons constaté avoir besoin :

  • une extraction de l’intégralité des URL stockées dans la base
  • une vérification automatique des liens
  • un filtre par gestionnaire (pour que dans l’interface de gestion la personne puisse n’afficher que les signets qu’il gérait)
  • un champ de date de vérification des notices + un champ de date de modification des notices

Des rapports fournissant les informations suivantes :

  • liste des tous les signets, par gestionnaire, avec Titre, Auteur, URL
  • liste de tous les signets (toujours triés par gestionnaire, comme les rapports suivants) avec Titre, Auteur, Description, Sujet
    Oui, j’éditais deux rapports différents, pour éviter des tableaux à 10 colonnes, vite illisibles. Dans cette seconde liste, les gestionnaires visaient avant tout l’homogénéisation des pratiques. La première liste est surtout là “pour info”.
  • nombre de signets par section

ces trois premiers rapports servaient à chacun à comparer sa propre base (en quantité et en contenu) avec les autres.

  • liste des signets triés par section puis (pour chaque section) par date de dernière modification (les plus anciennement modifiés en tête = ceux à revoir d’abord).
  • liste des URL stockées plus d’une fois dans la base (doublons, triplons, etc.)
  • liste des URL trop longues
    Ce dernier point est intéressant : la base de signets est interrogeable par moteur de recherche, et affiche une liste de résultats. Nous avons choisi de rendre visible l’URL de chacun des signets (plutôt que de rendre le titre cliquable, pointant vers le site décrit). Donc nous donnons à voir l’URL. Celle-ci doit donc être (autant que possible) simple. Cela a permis de réfléchir à la structure des URL, notamment quand elles contiennent un identifiant de session. Exemple : http://www.scirus.com/srsapp/ et http://www.scirus.com/ pointent vers la même page. Donner à voir à l’utilisateur la “version courte” est toujours un service à lui rendre.
    Donc je générais un rapport qui listait les signets dont l’URL dépassait 50 caractères (évidemment, c’était parfois nécessaire).

Je donne cette liste telle quelle, sans échelle d’importance : si vous avez à en gérer une, vous saurez tout seul attribuer ces degrés.

Selon l’outil utilisé, notamment si c’est une base locale ou un gestionnaire en ligne de favoris (du type Delicious), la réponse à ces besoins sera plus ou moins complète, et surtout elle se fera par des moyens différents.

Mais il est évident que la possibilité ou non d’obtenir ce genre de manipulations et d’informations n’est pas l’argument ultime pour choisir un outil, puisque l’ergonomie, la simplicité d’utilisation et de maintenance, comme la possibilité d’intégration dans l’ensemble des outils de la bibliothèque, sont primordiaux.

Mais je voulais tout de même donner cette liste pour information. Puisque, comme je le rappelle (encore !), ceci n’est qu’un retour d’expérience et non une réflexion approfondie sur cette question.

La liste intégrale des URLs

J’y tiens beaucoup, d’une manière ou d’une autre, il vous faut :

  1. pouvoir extraire l’intégralité de vos URL
  2. pouvoir extraire régulièrement les nouvelles URL et elles seules.

Pourquoi ? Pour ça : pour générer à partir de vos signets un moteur de recherche en texte intégral sur une partie du web sélectionnée par vous.

Il me semble qu’avoir une base de signets est en soi légitime et précieux (si jamais celle des autres ne vous satisfait pas). Toutefois pour l’usager la notion de base de signets, de notices de sites web, peut paraître très étrange, sinon incompréhensible.

Si bien que si vous pouvez lui proposer, à un endroit ou à un autre, une recherche en texte intégral dans les sites que vous avez sélectionnez pour lui, c’est un type de contenu (et un mode d’interrogation) dont il comprendra peut-être mieux l’utilité.

Sur Jubil, est proposée

  • une interrogation de la base de signets en recherche simple (unifiée) sur la page d’accueil,
  • en recherche multi-ressources, 4 moteurs thématiques intitulés “Le web de la Physique-chimie”, “Le web des sciences de la Terre”, “Le web de la médecine” et “Le web des Math-Info”.

Je ne prétends pas que la terminologie soit pleinement satisfaisante, non plus que l’emplacement de ces moteurs (un peu discrets), mais au moins le service existe, il est disponible.

Ces 4 connecteurs correspondent à 4 moteurs Google CSE, dans lesquels nous avons chargé des extractions partielles (filtres par sujets).

Il faut ensuite actualiser ces moteurs avec les sites nouvellement entrés.

Il y a le problème des signets que l’on supprime (chaque gestionnaire supprime des sites de la base de signets, alors qu’une seule personne gère le moteur Google : problème de communication à prévoir), et qui me laisse penser que le fonctionnement le plus simple serait de vider chaque moteur pour le recharger complètement.

Malheureusement Google CSE ne permet de supprimer les sites que 20 par 20 : l’élimination complète risque d’être fastidieuse.

Bref, sans avoir de solution complètement satisfaisante pour une gestion parfaite de ce service, il me semble que c’est un vrai service à rendre à nos lecteurs.

PS : si vous utilisez des services comme Delicious, et que vous ne savez pas comment en extraire la liste des URLs brute pour l’injecter dans un moteur Google nouvellement créé, je vous ferai une petite vidéo.

PS 2 : à vous ensuite de mener une réflexion sur l’intégration d’un tel service. Ce genre de moteur peut être aussi utile simplement en interne, quand vous êtes dérangé sollicité en service public sur une question de chimie à laquelle vous ne comprenez rien.  Une rapide recherche dans un moteur thématique peut rendre de grands services ! Mais si vous demandez à votre webmaster d’intégrer le formulaire de recherche quelque part dans votre site web (de préférence au bon endroit), c’est peut-être encore mieux.

PS3 : à Jussieu, nous nous étions posé la question de supprimer carrément l’interrogation de la base de signets, pour ne proposer que la recherche en texte intégral. Finalement nous y avions renoncé, je ne sais plus pourquoi.

Créez un moteur de biblioblogs en moins de 3 minutes

Suite au précédent billet, ceux qui pensent qu’il est complexe de créer un moteur de recherche limité à 300 sites web, et qui pensent que j’ai fait preuve d’un dévouement sans borne en y consacrant mes 10 dernières nuits, je dédicace cette vidéo de 2′26” :

  1. je récupère sur Bibliopedia la liste des URL
  2. je la colle sous Word
  3. je supprime tout ce qui est en noir (donc tout ce qui n’est pas une URL) : chercher ce qui est noir et le remplacer par un saut de ligne (ensuite je supprime les doubles sauts de ligne en les remplaçant par un seul saut)
  4. je colle la liste obtenue dans un moteur Google CSE (Custom Search Engine).

Bref, j’ai passé moins de temps à créer le moteur en question qu’à rédiger le billet qui le présentait…

Voir la vidéo

Pour créer un moteur, tout commence ici.

A présent, vous pouvez reprendre la même liste de blogs si vous voulez par exemple pouvoir interroger simultanément ceux-ci et Biblio-fr.

Bref, vous faites ce que vous voulez.

Impatience

Jeudi 20 novembre doit enfin être officiellement lancée Europeana (cf. actus sur le sujet).

J’avais suivi avec beaucoup d’intérêt le lancement de la première version, pour voir ensuite que :

  1. cette première version n’avait pour réel avenir que de permettre à Gallica d’évoluer
  2. Europeana, projet initialement purement “bibliothèque”, devenait un portail culturel visant à associer tous les acteurs du patrimoine (essentiellement : bibliothèques, musées, archives).

C’est l’occasion peut-être de revenir sur la notion de concurrence entre Google Book Search et Europeana.

1. comme ne cesse de le proclamer depuis des années Affordance (sauf si je n’ai rien compris), non seulement il faut des alternatives à Google, mais c’est même naturel d’avoir des outils qui co-existent les uns à côté des autres. Il n’est même pas besoin de justifier cette coexistence, et il n’est même pas nécessaire de parler de concurrence : la constitution d’un portail culturel européen doit apparaître comme une nécessité, que le projet Google Book Search existe ou non.

2. Europeana n’est plus une collection de livres. Il doit intégrer de nombreux autres types de documents (y compris multimédia). Et on n’entre pas dans la catégorie du moteur “total”, ou plutôt du moteur “fourre-tout”, que prétend devenir Google en mélangeant sur ses pages des pages web, des résultats Google Maps, des actualités, des vidéos, des images, et des livres numérisés (etc.).

Europeana a une logique de contenu, qu’elle explique(ra). Lorsqu’on l’interroge(ra), on sait(saura) d’avance le genre de résultats susceptibles de sortir.

3. Même si Europeana avait été une bibliothèque numérique, ce n’est pas le cas de Google Book Search. Je l’ai déjà dit ailleurs, je le répète : GBS n’est pas une bibliothèque.

Qu’est-ce que j’en attends ?

Je passe sur la taille du fonds accessible, sur les fonctionnalités de recherche attendues, etc. Je les commenterai une fois qu’elles seront en ligne.

En revanche j’en attends (peut-être de façon illusoire) une philosophie différente de ce à quoi tendent en ce moment la plupart des bibliothèques numériques qui se créent depuis quelques mois/années.

Ces bibliothèques numériques ont bien intégré les exigences du web 2 : compte lecteur avec possibilité de se créer une sélection de documents, de les annoter, de les tagguer, de les partager, etc. Persée, Gallica2, en sont de très bons exemples (et de remarquables outils).

Mais je n’ai pas encore vu de bibliothèque numérique facilitant la vie des internautes qui disposeraient d’un compte Connotea, ou CiteULike, ou qui, membres d’un groupe Google (ou Yahoo) de chercheurs, en proposant une intégration des données numérisées vers ces espaces, et une interopérabilité avec ces fournisseurs de services en ligne. C’est-à-dire que ces interfaces ne prennent pas en compte que leurs utilisateurs ont déjà une existence numérique (sur les services précités, mais aussi sur Netvibes, sur Facebook, sur LibraryThing, qu’ils ont un OpenID), qu’ils ont déjà constitué des communautés d’intérêts sur ces espaces.

Cela peut prendre par exemple un aspect comparable à ce qu’on trouve au bas des articles de certains journaux en ligne (une série d’icônes correspondant à autant d’actions vers Facebook, Digg, etc.).

Bas d'un article du Monde

Pourquoi réinventer tous ces services sur un nouvel espace, alors qu’ils existent déjà ailleurs, déjà satisfaisants et déjà familiers ?

PS : évidemment, j’en attends aussi des COinS pour mon résolveur OpenURL

Comportement de Google Book Search selon la langue

Le saviez-vous ? Je viens de le découvrir : Google Book Search affiche des résultats différents selon la langue d’affichage choisie par l’utilisateur.
Je pensais au départ que la variation ne portait que sur l’ordre des résultats, favorisant les documents dans la même langue que l’interface, ce qui est logique : si j’interroge GBS en français, je suis francophone donc les résultats que je trouverais les plus intéressants (en fait, les plus accessibles) seront en français. Sauf évidemment si les mots cherchés sont en anglais…
Mais pour la recherche suivante : “chromatographie synthèse vanilline”

  • GBS en français me donne 9 résultats (dont un en allemand et un en anglais)
  • GBS en anglais m’en donne… 111.

J’avoue ne pas comprendre le choix de Google.