Skip to content

Sudoc-RSS 2 : il revient (et il est encore plus fort)

02/11/2009

Souvenez-vous : j’avais créé avec Yahoo Pipes un générateur de flux RSS sur des requêtes dans le Sudoc. Je l’avais ensuite amélioré à destination des acquéreurs.

Pour l’utiliser, il fallait passer par un widget Netvibes ou installer un plugin de recherche spécifique (Sudoc-RSS) dans sa barre de recherche rapide.

Puis tout était tombé : Yahoo Pipes respectait désormais le contenu des fichiers robots.txt des sites web, lesquels fichiers autorisent ou interdisent l’indexation de leurs pages. Celui du Sudoc interdisait que les pages commençant par http://www.sudoc.abes.fr/ soient indexées.

IL revient !

Grâce à assistance.abes.fr, j’ai demandé le déblocage du fichier robots (qu’on enlève un « / » à la 2e ligne). Le 17 septembre 2009.

Voilà, le problème est résolu. J’ai cru comprendre que la modification du fichier Robots.txt posait de gros problèmes techniques qui a nécessité un appel à l’aide auprès d’OCLC. Mais comme je n’ai eu aucune explication détaillée, je serais bien en peine de vous expliquer ce délai.

Si bien que le plugin Netvibes (ainsi que le plugin de recherche rapide) sont de nouveau opérationnels. (Rq : pour installer la recherche rapide, vous installez d’abord l’extension Firefox Add to Search Bar, qui vous permet d’ajouter presque n’importe quel moteur de recherche à votre navigateur. Puis vous utilisez l’extension sur le widget Netvibes).

Mais il y a mieux

Si vous n’avez pas encore installé l’extension GreaseMonkey, c’est le moment.

Cette extension vous permet ensuite d’ajouter des scripts qui vont enrichir certains sites (vous choisissez vous-mêmes quels scripts installer).

Par exemple, après avoir installé GreaseMonkey, allez sur cette page et cliquez sur le gros bouton Install. Désormais, lorsque vous ferez une recherche dans le Sudoc, vous verrez cela :

Un lien au fil RSS de la recherche en cours

Pendant que vous y êtes, allez aussi sur cette page et installez le script. Cela vous donnera sur chaque notice détaillée du Sudoc un permalien « Lien vers cette notice ».

Ces deux scripts sont l’oeuvre de Symac, et je lui redis ici toute ma gratitude mon admiration mon adoration.


Sur les scripts GreaseMonkey utiles pour les bibliothécaires : dans Userscripts, cherchez donc des scripts sur des mots comme Worldcat, Wikipedia, Google Book Search, ISBN.

Une dernière remarque pour la route

Le #pype qui produit le fil RSS est assez lourd : l’affichage du flux prend donc un certain temps. Soyez indulgents : j’essaierai de voir si je peux l’alléger…

Publicités
3 commentaires
  1. Mathieu Saby permalink
    18/11/2009 18:49

    Bonjour
    j’ai testé avec enthousiasme le widget et le script Greasemonkey.
    Malheureusement le problème lié au tri des résultats dans l’interface publique du sudoc, que vous signaliez en février me semble rédhibitoire et difficilement corrigible (mais je ne suis pas informaticien…).
    Par exemple, la requête « psychologie » (mon domaine d’acquisition…) donne déjà 6 livres parus en 2010 (sic…). Les nouveaux livres parus en 2009 resteront donc toujours après.
    Et si je suis la 1re BU à acheter un livre américain paru en 2007 (ce qui est très possible), cela n’apparaîtra jamais dans le fil RSS.
    J’ai également essayé de faire une requête portant non sur un sujet mais sur un RCR. J’espérais créer une sorte de fil de nouveautés (fonction que ne propose pas notre opac. Grrr.). Mais malheureusement le même problème se pose : si jamais je catalogue un livre de 2008, il n’apparaîtra jamais dans le fil…
    Cela dit, c’est vraiment un sacré boulot que vous avez fait…

  2. 18/11/2009 19:33

    @Mathieu Saby : vos remarques sont très intéressantes, et les dysfonctionnements signalés sont liés au fait qu’à l’origine, le fil RSS ne pouvait être produit que par un plugin de recherche rapide pour Firefox. Donc forcément une recherche dans tous les champs, sans option.
    Je n’y ai pas retravaillé, je l’avoue, mais le fait que ce fil RSS puisse être proposé dans un nouveau contexte, avec toutes les options de recherche du Sudoc, nécessitent d’intégrer au fil les options en question.
    Ce n’est pas forcément impossible (ça dépend quoi), et je vous promets d’étudier la question.

Trackbacks

  1. Sudoc RSS – pour de vrai, et même en mieux « Bibliothèques [reloaded]

Les commentaires sont fermés.

%d blogueurs aiment cette page :