Le Sudoc en RSS
Cf. mise à jour.

Ayant appris que des collègues interrogeaient régulièrement le Sudoc pour avoir des idées de nouvelles acquisitions, j’ai bricolé un « pipe » en utilisant le service Yahoo Pipes, service dont j’ai déjà parlé ailleurs.
Voilà le plugin Firefox de recherche rapide. La boîte de recherche est récupérable à cette adresse (WidgetBox intégrée dans un univers Netvibes) pour être exportable vers Netvibes, iGoogle, etc.
Vous pouvez afficher le formulaire de recherche sur Yahoo Pipes, et si vous voulez voir comment est fabriqué ce pipe, c’est ici.
Vous pouvez même envisager de l’améliorer, car j’avoue avoir renoncé à y intégrer des COinS (mode d’emploi pour la structuration des COinS : ici. En revanche la manière de procéder dans Yahoo Pipes m’a semblé trop lourde, au moins pour le moment. Je reviendrai peut-être à la charge)
La recherche se fait sur le champ « Tous les mots » du Sudoc, c’est-à-dire grosso modo : Titre, Auteur, Sujet, Editeur, Collection. Pas d’ISSN ni d’ISBN. Mais si c’est pour une recherche thématique afin de faire de la veille documentaire, la recherche par ISBN ou ISSN n’est pas très utile.
Si vous avez des améliorations à proposer (notamment avec l’usage que vous aimeriez bien en faire), je veux bien essayer.
Très utile. Je fais suivre aux acquéreurs de mon SCD. Merci!
J’ai un bug : avec Sage (extension firefox) quand je clique ensuite sur le titre qui m’intéresse j’ai le message « Oublié – cette recherche n’est plus conservée »… c’est normal?
(J’ai essayé de te le dire sur twitter mais je crois que tu ne me suis pas)
Bonne idée ! Quand je fais une requête avec un terme dans le plugin de recherche firefox, je tombe directement sur le fil rss des résultats et pas la page de résultat elle-même…. c’est normal ?
@Phelly : pour Twitter, voilà qui est fait.
Pour le lien pointant vers la notice, c’est ma faute (et celle du Sudoc) : j’avais oublié que dans les listes de résultats, les liens vers la notice détaillée contenaient comme seule information : « 1er résultat », « 2e résultat », etc.
Ici : http://www.sudoc.abes.fr/DB=2.1/SET=4/TTL=1/SHW?FRST=3
pointe vers le 3e résultat (FRST=3) de la recherche en cours. Mais en l’occurrence il n’y a pas de recherche « en cours ».
Donc il faut que je rebricole mon pipe pour que le lien fourni soit une nouvelle interrogation, par exemple sur le titre. J’aurais voulu pouvoir combiner ce critère avec l’année… mais celle-ci n’est pas interrogeable dans le Sudoc.
Cette complexité supplémentaire prouve bien que dans les listes de résultats, il faut des liens pérennes vers les notices !
J’ai donc amélioré la génération du lien, mais j’attends toute suggestion, où le signalement de cas spécifiques que je n’avais pas prévus pour lesquels ce lien ne fonctionne pas.
@Bibliobsession : ben évidemment ! A quoi t’attendais-tu ? Au lieu d’une liste de résultats dans le Sudoc (tu trouveras un plugin de recherche pour ça ici, comme me l’a signalé Marlène).
L’idée est d’obtenir un fil RSS à la place d’une liste de résultats.
En voici le principe : dans le Sudoc, on peut faire une recherche thématique et trier les résultats par date de publication.
Sur la recherche « Microbiologie », ça donne ce lien :
http://www.sudoc.abes.fr/DB=2.1/SET=2/TTL=1/CMD?ACT=SRCHA&IKT=1016&SRT=YOP&TRM=microbiologie
Si je veux savoir les nouveautés pour ce thème, je dois retourner de temps en temps sur le Sudoc et relancer cette requête.
Le plugin Firefox que je propose fournit un fil RSS à la place d’une liste de résultats sous forme de page web : ainsi, à chaque connexion à Google Reader (ou autre), c’est l’agrégateur qui fait le travail de se connecter à Yahoo Pipes, qui lui-même interroge le Sudoc et retourne le fil RSS correspondant à la page obtenue dans le Sudoc.
En fait, c’est un fil RSS moyennement satisfaisant, car il est tributaire de l’interface publique du Sudoc. Si je m’abonne à Microbiologie, en triant les résultats par date, j’aurai en tête (càd dans la première page de résultats, càd dans mon fil RSS) tout ce qui est paru en 2009.
La semaine suivante, de nouveaux documents parus en 2009 auront été catalogués dans le Sudoc. Ils auront la même valeur « 2009″ que les précédents. Donc je ne suis pas sûr qu’ils passent en tête.
En effet, entre deux notices de documents parus la même année, comment le Sudoc les trie-t-il ? J’aimerais que ce soit par date de création de notice, mais j’ai quelques doutes : à mon avis, c’est complètement aléatoire.
Donc pour rendre ce générateur de fils RSS un peu plus satisfaisants, il faut que je voie s’il n’y a pas un moyen de récupérer, non pas les 10 premiers résultats, mais au moins les 40 premiers.
Bref, c’est encore à suivre. Mais l’avantage de la chose, c’est que toute personne ayant récupéré le plugin Firefox aura les mises à jour automatiquement. Et tout fil RSS déjà généré sera également amélioré automatiquement.
Je veux bien des suggestions d’améliorations, ou des indications de bugs, d’ailleurs.
Merci, ça marche!
Il reste encore des petits détails à régler :
- gestion des accents : si je mets « littérature », je n’ai aucun résultat ; si je mets « litterature », ça marche.
- quel que soit le nom que je donne au fil RSS, dans Sage dès que j’active le fil le nom du fil redevient « Sudoc-RSS » : ça peut être gênant pour une veille sur des mots-clefs multiples…
Merci en tout cas d’avoir développé ce petit plugin. C’est le genre de chose qui facilite la vie!
J’avais remarqué le pb des accents. C’est une difficulté de codage : par défaut le Sudoc est en ISO-8859-1, et je ne peux pas demander que ce soit par défaut de l’UTF-8. Et Yahoo! ne fait que de l’UTF-8.
Je vais encore creuser la question, car je suis d’accord : c’est pénible.
Et je ne suis pas sûr que le fil RSS obtenu puisse avoir un nom tenant compte des variables. Là encore, je vais creuser. Cela dit, Sage ne permet pas de rebaptiser un fil RSS ?
Merci, c’est très intéressant (comme les autres billets de ce blog d’ailleurs).
Pour info, je l’ai ajouté dans mon univers netvibes public (recherche sur le terme sociologie) : http://www.netvibes.com/lucie75#Actu_publications_socio_en_fran%C3%A7ais
@Lucie : comme le fait remarquer Phelly, le titre des RSS est toujours « Sudoc – RSS » (ne tient pas compte des mos recherchés). Vous devriez modifier manuellement le titre du fil de votre univers, sinon ce n’est pas très visible.
Merci pour le compliment sur le blog.
@Lully : Sage permet en effet de rebaptiser le fil RSS, mais j’ai beau le faire, quand le fil « s’active », son intitulé redevient « Sudoc – RSS ».
@Phelly : En fait, dans Sage, après s’être abonné à ce nouveau fil RSS, on peut cliquer sur ce « marque-page » (clic droit) > Propriétés > Modifier le nom. Et là, logiquement, ça ne bouge plus.
Sinon, j’ai résolé (a priori) le problème pour les accents : on peut désormais faire des recherches avec accents.
En fait l’astuce est : avant de transmettre la requête au Sudoc, Yahoo Pipes remplace les « é » par des « e », des « à » par des « a », etc.