Skip to content

Un pipe pour une veille autour des revues en sciences humaines

05/06/2009

Base Mirabe Est sortie il y a peu (en version "prototype") une base de mutualisation pour la mise à jour des informations autour des revues en SHS.

Marlène en avait parlé, le BBF aussi.

Ce n’est pas forcément mon centre d’intérêt premier : je suis plutôt réservé face à ce risque d"épuisement des énergies pour la mise à jour de nos bases de revues en ligne. Mais comme c’est un travail mutualisé, c’est un moindre mal ; surtout, l’utilisation de Yahoo Pipes me semblait un exercice intéressant.

Cette base propose des informations bibliographiques sur toutes les ressources qu’elle référence, informations que nos collègues s’efforcent de mettre à jour autant que possible.

Pour chaque revue donnée, il y a un fil RSS correspondant, pour suivre les actualisations de la notice. Voilà un outil fort utile. L’URL de chaque flux RSS est structurée ainsi :

http://www.reseau-mirabel.info/rss.php?object=revue&id=identifiant_interne_de_la_base

Sauf que le responsable de la documentation électronique d’un établissement, qui ne peut pas connaître les identifiants Mir@bel pour ses revues, est obligé de chercher revue par revue pour s’abonner à chaque fil RSS. L’idéal pour lui serait qu’il puisse entrer une liste d’ISSN, et avoir un fil RSS unique pour toutes ses revues.

J’ai donc élaboré un pipe qui fait les manipulations suivantes :

  1. on lui donne une liste d’ISSN, séparés par des points-virgules
  2. il construit une requête sur chaque ISSN : il concatène
    "http://www.reseau-mirabel.info/index.php?termes=", ISSN, "&action=recherche&methode=simple"
  3. Il ouvre chaque page de résultats correspondant à ces URL : ces pages contiennent, toujours au même endroit, le lien vers la revue auquel correspond l’ISSN. Ce lien est structuré ainsi :
    http://www.reseau-mirabel.info/index.php?action=show&object=revue&id=identifiant_interne_de_la_base.
  4. Il récupère cet identifiant interne
  5. Il construit l’URL du fil RSS correspondant à chaque revue.
  6. Il ouvre chacun des flux RSS.

En fait, ce flux ressemble assez, par certains côtés, à celui du tutoriel 8 : au lieu de rentrer un flux RSS dans le pipe, on récupère une information qui permet de construire l’URL de ce flux, pour le produire en sortie.

Cette manipulation s’effectue à l’avant-dernière étape : pour chaque URL de flux construite, au lieu de "sortir" l’URL elle-même, on "émet" le contenu du fichier ayant cette URL (la case cochée par défaut est toujours "Assign results", il faut donc penser à choisir l’autre option).
Copie d'écran de la case Emit results au lieu de Assign results

Cela peut vous donner une idée de ce à quoi sert un web service : une telle base peut proposer ce genre de fonction nativement, à savoir qu’il suffit de lui donner une information sous une forme standard (par exemple : un ISSN intégré dans une URL construite d’une certaine manière) pour que la base renvoie un fichier XML avec d’autres infos associées à cette information initiale (par ex. l’identifiant, ou le flux RSS correspondant à cet ISSN).

En reprenant le pipe décrit ci-dessus, on pourrait sans trop de difficulté l’améliorer pour que, à une liste d’ISSN en entrée, il produise en sortie une liste d’états de collections, ou tout autre information présente dans les notices (langue, URL, URL du flux RSS de la revue, etc.). Un tel usage ne serait pas tellement pour suivre les mises à jour, mais pour extraire une série d’informations à un instant donné au sujet de vos abonnements.

Si vous avez des besoins particuliers associés à cette base, n’hésitez pas à me demander un pipe adapté.

> Voir (et utiliser) le pipe

Remarque 1 : j’ignore quel est l’état actuel de la base et sa richesse. Il se peut donc que lorsque vous rentrerez votre première liste d’ISSN, le fil RSS produit soit vide (si aucune de ces notices n’a été mise à jour).

Remarque 2 : le fil RSS produit contiendra tous les ISSN que vous aurez indiqué au pipe. Donc le navigateur peut avoir du mal à avaler une URL trop longue (c’est variable selon les navigateurs, il me semble). Voici les différences selon les navigateurs. J’ignore par ailleurs si un agrégateur peut avoir des difficultés avec une URL de plusieurs centaines ou milliers de caractères. Vous me raconterez ;-) !

Remarque 3 : je ne vous ai pas du tout présenté l’interface. Vous êtes grands ! :-) Notez tout de même la possibilité pour tout un chacun de modifier une notice (les modifications en mode anonyme devant être validées par un modérateur).

Remarque 4 : on peut retrouver le fil RSS de toutes les modifications (toutes revues confondues) en reprenant le fil d’une revue (par exemple : http://www.reseau-mirabel.info/rss.php?object=revue&id=533) et en supprimant la référence à l’identifiant. Ce qui donne : http://www.reseau-mirabel.info/rss.php?object=revue.

————————————

Précisions données par les porteurs du projet :

  • Le développement de web services pour les partenaires fait  partie du plan de développement de Mirabel (qui sera présenté lundi 8 juin, lors du lancement officiel). A terme donc, ce pipe n’aurait plus grande utilité. L’équipe ne refuse pas "l’idée de construire les  url avec l’issn comme alternative à l’id interne, et nous avons aussi en projet la possibilité d’alimenter un sigb (koha) par webservice".
  • En devenant partenaire de Mir@bel, "vous aurez alors accès aux fonctions avancées d’export des données et
    si vous ajoutez vos identifiants locaux pour les revues que vous possédez, alors, vous aurez beaucoup plus qu’un fil RSS par titre ! "
  • "Enfin, pour éviter l’épuisement, nous avons mis en place un outil de collecte automatique pour les ressources lorsque c’est possible (pour Cairn, Persee et Revues.org, pour commencer) et que nous souhaitons élargir le réseau de partenaire pour que chacun ait le moins de travail à accomplir. "
About these ads
One Comment

Trackbacks

  1. MIRABEL « pintiniblog

Les commentaires sont fermés.

Suivre

Recevez les nouvelles publications par mail.

Rejoignez 110 autres abonnés

%d bloggers like this: