Skip to content

Sudoc, Netvibes, Google Reader et RSS

12/01/2011

Bref historique

Depuis deux ans, existe la possibilité de récupérer le flux RSS d’une requête Sudoc. Au début, c’était assez rudimentaire : il fallait passer par un plugin OpenSearch spécifique ou un widget de recherche Netvibes #bof

Ensuite, grand bond en avant il y a quelques mois grâce à Symac, un script GreaseMonkey permet d’afficher directement le lien vers le flux RSS d’une requête. Bon, il faut toujours installer GreaseMonkey et le script.

Enfin, depuis quelques semaines, grâce à l’opiniâtreté des collègues de l’Abes, le lien vers le flux RSS est inscrit en dur dans les pages Sudoc (menu latéral gauche).
[Précisons que l’utilisation du script de Symac garde tout son intérêt pour plein d’autres raisons !]

Sudoc - flux RSS - copie d'écran

Ce qui n’a pas changé depuis le début, c’est que le flux est produit, non pas par un outil interne Sudoc, mais par le service Yahoo Pipes.

C’est bien, mais ce serait mieux si le Sudoc produisait lui-même ce flux.

Les pages Sudoc : fonctionnement

Les pages de résultats du Sudoc ne sont pas des pages HTML, comme vous seriez tentés de le croire. En fait, le Sudoc vous envoie un fichier XML, contenant les résultats, et dans ce fichier XML se trouve un lien vers une feuille de style : vous pouvez le constater si vous affichez le code source d’une page.

Les navigateurs internet sont capable d’exécuter une feuille XSL pour produire un fichier HTML « à la volée ». C’est tout à leur honneur.

La feuille XSL a pour « simple » rôle de modifier les noms des balises, l’ordre des infos, etc., afin que les balises XML soient remplacées par des balises HTML.

Projection

Et si une autre feuille de style, alternative, remplaçait les balises XML initiales par des balises RSS ? Techniquement, c’est beaucoup plus simple (ou moins complexe…) de produire du RSS que du HTML.

On pourrait imaginer que la feuille de résultats (celle qui s’affiche en HTML et est liée à une feuille XSL) contienne un lien vers la même feuille de résultats, mais cette fois liée à une feuille XSL pratiquant la conversion en RSS.

L’URL de cette 2e feuille de résultats pourrait être « fournie » à un agrégateur.

Oui mais…

Comme dit plus haut, lors de votre navigation dans le Sudoc, c’est le navigateur internet qui fait la transformation XML->HTML. Donc pour l’utilisation du flux RSS, c’est forcément à l’agrégateur de faire cette transformation XML->RSS.

Les agrégateurs savent-ils le faire ?

C’est là où je voulais en venir (en fait, enfin) : j’ai récupéré à un moment donné le flux RSS du présent blog, où j’ai simplement modifié la balise racine <rss> pour la rebaptiser <flux>. J’ai donc obtenu un fichier XML qui n’était plus RSS.

Puis j’ai écrit une feuille XSL qui transforme simplement la balise <flux> en <rss>. J’obtiens donc un fichier XML (non-RSS) lié à une feuille XSL, produisant ainsi un fichier RSS.

Si je donne l’URL du fichier XML à Google Reader, il n’en veut pas (et il me propose gentiment de découvrir d’autres flux).

Mais si je donne cette URL à Netvibes, il m’affiche un flux correct.

Dernière subtilité : Firefox est capable de transformer un fichier XML en HTML à la volée (cf. les pages de résultats Sudoc). Mais le fichier XML mentionné ci-dessous, rendu non conforme au RSS pour les besoins de l’exercice, il n’est pas capable de me l’afficher comme un flux RSS normal. Il est perdu quoi.

En conclusion

Je reconnais que cela ne nous mène nulle part. Mais je trouvais intéressant de noter que Netvibes était en l’occurrence plus performant que Google Reader.

Bref, pour l’instant, pas de solution pour se passer de Yahoo Pipes…

%d blogueurs aiment cette page :