Articles reli´s: «:RSS»

h1

Ecrire pour Netvibes

14 décembre 2009

Si j’en crois Google Reader, il y a 205 abonnés au flux du présent blog sur cet agrégateur.

Si j’en crois les statistiques du Bouillon et du Nectar, la population bibliothéconomique se répartit en (approximativement)

  • 8% Google Reader
  • 8% iGoogle
  • 20% Netvibes

Ce qui signifie que s’il y a 205 personnes qui lisent (potentiellement) ce blog sur Google Reader, il y en a environ 500 qui y sont abonnés sur Netvibes.

Or l’affichage d’un post dans Google Reader peut être comparé à celui qu’on trouve sur le blog : la colonne de texte prend une portion de l’écran (environ 50-60% de la largeur), et la lisibilité y est comparable.

En revanche sur Netvibes je note au moins deux spécificités d’affichage :

  1. dans la liste des items (avant d’accéder à son contenu), la première image est affichée sous forme d’icône à gauche du titre
  2. quand on veut lire un billet, l’encart Netvibes prend alors toute la largeur de l’écran.

Je ne sais si je vais modifier ma manière de rédiger en tenant compte de la seconde spécificité.

En tout cas je pense désormais que, pour toutes les séries à venir, je vais faire en sorte que la première image de chaque billet soit toujours la même.

J’ai d’ailleurs commencé, avec la série XSL : icône

Est-ce pertinent ? Je n’en sais rien encore. Mais du moins le principe d’adapter la présentation à son réel environnement d’affichage me semble a priori intelligent.

(Il va sans dire qu’un “ajustement” de cette nature, quel qu’il soit, ne doit en rien léser les autres visualisations, fusse à destination des réfractaires au RSS qui viendraient directement sur le blog :-) )

h1

Sudoc-RSS 2 : il revient (et il est encore plus fort)

2 novembre 2009

Souvenez-vous : j’avais créé avec Yahoo Pipes un générateur de flux RSS sur des requêtes dans le Sudoc. Je l’avais ensuite amélioré à destination des acquéreurs.

Pour l’utiliser, il fallait passer par un widget Netvibes ou installer un plugin de recherche spécifique (Sudoc-RSS) dans sa barre de recherche rapide.

Puis tout était tombé : Yahoo Pipes respectait désormais le contenu des fichiers robots.txt des sites web, lesquels fichiers autorisent ou interdisent l’indexation de leurs pages. Celui du Sudoc interdisait que les pages commençant par http://www.sudoc.abes.fr/ soient indexées.

IL revient !

Grâce à assistance.abes.fr, j’ai demandé le déblocage du fichier robots (qu’on enlève un “/” à la 2e ligne). Le 17 septembre 2009.

Voilà, le problème est résolu. J’ai cru comprendre que la modification du fichier Robots.txt posait de gros problèmes techniques qui a nécessité un appel à l’aide auprès d’OCLC. Mais comme je n’ai eu aucune explication détaillée, je serais bien en peine de vous expliquer ce délai.

Si bien que le plugin Netvibes (ainsi que le plugin de recherche rapide) sont de nouveau opérationnels. (Rq : pour installer la recherche rapide, vous installez d’abord l’extension Firefox Add to Search Bar, qui vous permet d’ajouter presque n’importe quel moteur de recherche à votre navigateur. Puis vous utilisez l’extension sur le widget Netvibes).

Mais il y a mieux

Si vous n’avez pas encore installé l’extension GreaseMonkey, c’est le moment.

Cette extension vous permet ensuite d’ajouter des scripts qui vont enrichir certains sites (vous choisissez vous-mêmes quels scripts installer).

Par exemple, après avoir installé GreaseMonkey, allez sur cette page et cliquez sur le gros bouton Install. Désormais, lorsque vous ferez une recherche dans le Sudoc, vous verrez cela :

Un lien au fil RSS de la recherche en cours

Pendant que vous y êtes, allez aussi sur cette page et installez le script. Cela vous donnera sur chaque notice détaillée du Sudoc un permalien “Lien vers cette notice”.

Ces deux scripts sont l’oeuvre de Symac, et je lui redis ici toute ma gratitude mon admiration mon adoration.


Sur les scripts GreaseMonkey utiles pour les bibliothécaires : dans Userscripts, cherchez donc des scripts sur des mots comme Worldcat, Wikipedia, Google Book Search, ISBN.

Une dernière remarque pour la route

Le #pype qui produit le fil RSS est assez lourd : l’affichage du flux prend donc un certain temps. Soyez indulgents : j’essaierai de voir si je peux l’alléger…

h1

De la difficulté technique des blogs et RSS par rapport aux listes de diffusion

16 juin 2009

Je constate qu’il devient urgent que j’écrive un petit quelque chose sur cette question, suite à ce qui a notamment été dit dans ce commentaire mais aussi ailleurs.

Je précise que ceci n’est que mon avis (qui par essence ne vaut pas  mieux que le vôtre), et qu’il m’est déjà arrivé d’en changer. Donc je dis ce que je pense en ce moment, et vous êtes en droit d’espérer de me faire changer d’avis ! Je préfère le préciser car il m’est déjà arrivé de lire, à propos d’autres débats et concernant d’autres débatteurs (on ne parlait pas de moi !) : il se prend pour le censeur suprême, ayant droit de donner une opinion définitive sur tout.

Sur les blogs, l’opinion est rarement définitive, et la pensée y est presque consubstantiellement évolutive. C’est un peu ce que je disais dans ce commentaire chez Bertrand Calenge.

Je conteste que l’on juge élitiste l’usage des fils RSS : il me semble au contraire élitiste de prétendre que seule une “élite” saura s’en servir, et que les petits, les sans-grade, n’y arriveront jamais. Cela dénote une forme de mépris condescendant pour les catégories B et C, un pessimisme quant à leurs capacités que je ne partage pas.

Mais reprenons du début : pourquoi est-ce que le mail a été bien adopté par tous les collègues des bibliothèques ?

Le mail : facile ou obligatoire ?

“Parce qu’il ne nécessite aucune compétence technique, aucune maîtrise de l’informatique” ? (sous-entendu : à la différence des fils RSS). Je prétends que non.

Je suis convaincu que si le mail a été si largement adopté par tous les collègues de toutes les catégories, c’est parce que son utilisation et sa maîtrise (minimale) est devenue obligatoire pour assurer ses missions : certaines informations ne sont accessibles qu’en ouvrant sa boîte mail, certains contacts ne sont envisageables que par mail. Donc l’agent est contraint d’utiliser sa messagerie. Et il apprend à s’en servir.

Ca, c’était mon premier point.

Les fils RSS : entre technicité et motivation

Mon second point : pour avoir assuré des formations aux fils RSS à Jussieu (très mal : je suis un exécrable formateur et je vais toujours trop vite : j’en demande encore pardon aux victimes) auprès des collègues de toutes catégories, je l’affirme haut et fort, à aucun moment je n’en ai regardé un, pendant une formation, en songeant “Celui-là est trop nul ! il est perdu pour les fils RSS.”

Non, il n’est pas difficile de maîtriser les fils RSS : pas plus que d’être abonné à des podcasts sur iTunes (le concept est exactement le même). Et si j’admets qu’il faille une formation pour beaucoup de monde, les outils sur Internet, à commencer par le navigateur web lui-même, sont conçus autour des fils RSS beaucoup plus qu’autour des mails et en facilitent l’utilisation.

Il est loin le temps (vous n’avez qu’à abandonner Internet Explorer 6, enfin ! on en est à la version 8 !) où l’affichage du flux RSS montrait un fichier XML brut.

Sur Le Monde, en 2 clics vous êtes abonnés à la rubrique que vous voulez. Combien de temps pour recevoir du même site les mêmes informations par mail ?

La seule difficulté, comme pour tous les autres domaines, c’est la motivation des personnes à changer de pratiques.

Une médiation numérique

Enfin (troisième point), ainsi que je le suggérais dans mon billet précédent, dans chaque établissement (avec ou sans intranet) peut émerger un médiateur capable de transformer un (ou plusieurs) fils RSS en abonnements par mail, via une fonction simple de Feedburner.

Donc techniquement la veille d’informations peut rester préservée : Biblio-fr n’était qu’un relai de la plupart des informations du monde des bibliothèques (“Je vous signale que j’ai découvert…”) et non la source elle-même. Ou c’était un outil de diffusion d’informations dont l’ampleur était réduite (“exposition de peintures à la médiathèque”).

Un dernier message à Hervé (et à beaucoup d’autres)

J’aime la technique, c’est vrai. Je l’avoue. Il y a un plaisir à la maîtriser, à l’employer, la manipuler.

Tous les informaticiens que je connais jouent avec leur machine (ils veulent dire par là qu’ils travaillent).

Je n’attends pas de tous mes collègues qu’ils aient ce plaisir et cette maîtrise.

Mais mon plus grand plaisir n’est pas d’étaler mes compétences : c’est d’arriver à leur masquer la technicité pour qu’ils en viennent à utiliser des outils d’un usage simple. Sur l’OpenURL, j’essaie de réfléchir pour que cette technologie soit le plus transparente possible pour l’usager. Sur ce blog, je m’adresse à des collègues étant plutôt technophiles aussi (je ne m’adresse pas au lectorat de Biblio-fr !) pour leur suggérer des pistes afin de rendre familière, voire transparente, cette technique aux collègues ou aux usagers.

En définitive, voici à quoi se résoud la “maîtrise” des fils RSS :

  1. j’ai un compte Google ou Netvibes (comme j’ai un compte de messagerie).
  2. je vais sur un site
  3. je clique dans la barre d’adresse
  4. c’est fini : je peux suivre l’actualité du site

C’est plus rapide que d’écrire une adresse mail. Et ce n’est pas plus technique.

Je le réaffirme pour ceux qui auraient lu trop vite ce billet : l’adoption du mail supérieure à l’adoption du fil RSS n’a rien à voir avec la difficulté d’utilisation, mais avec le degré d’obligation.

C’est en tout cas mon avis (ça aussi, je l’ai déjà précisé au début, mais je préfère le redire : l’espace de commentaires est là pour vous).

La preuve : ma mère n’arrive pas à se servir de sa messagerie. Pourquoi ? Parce qu’elle n’en a pas besoin dans son travail. Si vous êtes dans une “communauté” (une classe de collège, par exemple) qui chatte tous les soirs, vous serez “obligés” de vous mettre au chat.

La différence entre RSS et messagerie : les récalcitrants technologiques ne pouvaient se permettre de l’être face au mail. Ils auront cette option face aux fils RSS.

Dernière info : Thunderbird et Outlook 2007 intègrent les fils RSS (et ce n’est pas ma faute si Outlook 2000 et 2003 ont plusieurs années de retard).

h1

Construire l’après-biblio-fr : petite proposition pour la veille

12 juin 2009

Je n’ai aucune proposition construite et élaborée pour “remplacer” Biblio-fr. Il ne sert à rien d’ailleurs à mon avis de vouloir recréer un site ex nihilo en espérant reconstituer la “communauté” des 17.000 inscrits.

Ne fantasmons plus sur ce chiffre, qui ne signifie pas grand chose en soi et essayons plutôt de définir quels étaient les services que rendait Biblio-fr, et comment y répondre désormais.

J’irai plus loin (je suis fou !) : voyons comment y répondre mieux.

<add>Jean-Michel Salaün suggère ici que finalement, Biblio-fr n’est peut-être pas si mort que ça.
Je ne suis ni pour ni contre cette fermeture, je ne me réjouissais pas de sa disparition et si d’une manière ou d’une autre “on” arrive à le faire revivre, je ne m’en plaindrais pas. Disons que dans la vie en général, j’ai une tendance fataliste et résignée : j’admets qu’une information telle que “Biblio-fr ferme” ou “Pascal Sevran est mort” est par nature définitive.
Parfois je me trompe et c’est très bien ainsi, mais je n’y mets aucun parti pris ni aucune intention maligne.
Disons que, faute de connaître l’avenir, je pars d’une hypothèse d’école qui serait : “Tiens, mais que ferait-on si Biblio-fr n’existait pas ?”</add>

Dans la liste des propositions (je ne suis pas seul sur les rangs : plusieurs messages — pas les plus nombreux ! — publiés sur Biblio-fr avancent également des pistes) qui seront lancées d’ici à septembre, la plupart s’effondreront d’elles-mêmes, inadaptées pour plusieurs raisons possibles et combinables :

  • inadaptées aux besoins initiaux
  • inadaptées aux compétences techniques de leurs utilisateurs présumés (je pense à cette phrase : “Croire que tout le monde manie les fils RSS ou les agrégateurs est une illusion élitiste.” J’aurai très envie d’y revenir à l’occasion, car elle est vraie, sans doute, mais je n’arrive pas à considérer cette véracité comme une fin).
  • inadaptées car correspondant aux besoins qui avaient fait créé Biblio-fr, mais n’ont plus lieu d’être aujourd’hui

Donc la proposition que je fais ici en fera peut-être partie. En même temps, je persiste à la faire car :

  1. pour qu’à la fin, puissent émerger les “bonnes” solutions, il faut bien qu’une masse critique existe
  2. vous pouvez y suggérer des améliorations
  3. cela peut vous donner d’autres idées

Bref, je pars du besoin suivant : comment désormais se tenir au courant de l’actualité des bibliothèques, quand on ne connaissait rien d’autre que Biblio-fr ?

Donc, dans le cas présent, je ne me soucie pas des producteurs de messages, mais des lecteurs. Savoir où les dispenseurs d’infos pourront désormais publier n’est pas le plus important, finalement : sur Biblio-fr comme ailleurs, les contributeurs étaient moins importants que les lecteurs, et c’est aux lecteurs que je m’intéresse pour le moment.

La proposition est simple : si vous avez un intranet, vous pouvez y prévoir une page “Actualités du monde des bibliothèques” qui afficherait un flux RSS intégrant lui-même plusieurs flux.

La difficulté technique ne doit arrêter personne : les outils existent, pour fusionner des flux comme pour les afficher sur une page web. Et cette difficulté ne concernerait qu’une seule personne. Or (j’espère qu’) il se trouve bien une personne par SCD capable de manipuler un peu les fils RSS.

Je vous propose un pipe (qui s’étonne ? qui sourit d’un air narquois ? — au fait, ça se prononce “paÿpe”), qui fédère plusieurs sources. Au titre initial de chaque source il ajoute le nom de celle-ci :

Un module Loop intègre un module String Builder, qui concatène “[Bibliobsession]” + “Titre de l’item”

On fusionne tout ça, on trie par date de publication, et on tronque à 20 items.

J’ai préparé ce pipe avec 12 sources, ce qui n’est déjà pas si mal. Vous pouvez le cloner et l’adapter selon vos préférences.

Précision sur les sources mises par défaut :

  • j’ai sous-représenté les sources diffusant une information “technologique”, parce que ce n’est pas une préoccupation globale d’une bibliothèque, et ceux que ça intéresse ont déjà généralement leurs sources d’information sur ce sujet dans leur agrégateur.
  • Et j’ai intégré des sources institutionnelles et associatives, parce qu’elles produisent aussi une information sous cette forme.

Donc avec cet outil, vous obtenez un fil RSS intégrable dans un intranet, diffusant une information sur divers sujets. Vous n’aurez pas tous les sujets intéressant vos collègues — mais c’était déjà le cas avec Biblio-fr ! Ainsi, j’ai mis S.I.Lex, dont la richesse pédagogique sur les questions juridiques ne s’y retrouvait pas vraiment. En outre, vous pouvez aussi y intégrer le fil RSS de votre université ou de votre municipalité : ainsi vos collègues sauront enfin ce qui se passe dans un environnement un peu élargi :-) !

Yahoo Pipes propose un lien “Get as a Badge”, qui vous donne le code à insérer dans une page web “normale” pour y faire apparaître votre fil RSS.

Fournissez aussi l’adresse du fil RSS : si jamais des collègues savent ce que c’est…

“Oui, mais les mails, c’est quand même plus simple (et plus répandu) !”

Je ne le nie pas ! J’ai moi-même un très bon ami mail.

Donc à présent vous allez proposer à vos collègues un abonnement par mail à ce fil RSS. Vous allez voir, ça ressemblera beaucoup à Biblio-fr !

Créez un compte sur Feedburner (sauf si vous disposez déjà d’un compte Google : Feedburner appartient à Google et le compte du second peut resservir pour le premier).

Faites avaler le fil RSS par Feedburner, et allez dans l’onglet “Publicize”, pour activer la fonction “Email Subscription”

Voir le tutoriel vidéo

Feedburner vous donne un code à insérer dans la page web de votre intranet, pour qu’y apparaisse le formulaire d’inscription par mail au fil RSS.

Et pour finir je vous donne le code HTML d’une page très moche (sans couleurs) intégrant l’abonnement par mail et le contenu du fil RSS :

<html>
<head>
<title>Intranet – actualités</title>
</head>
<body>
<h1>Intranet – Actualités des bibliothèques</h1>

<!–Ici le formulaire d’inscription par mail–>

<form action=”http://feedburner.google.com/fb/a/mailverify” method=”post” target=”popupwindow” onsubmit=”window.open(‘http://feedburner.google.com/fb/a/mailverify?uri=ActualitsBibliothconomiques’, ‘popupwindow’, ’scrollbars=yes,width=550,height=520′);return true”>S’abonner aux actualités par mail : indiquez votre mail ci-dessous<br/>
<input type=”text” style=”width:140px” name=”email”/>
<input type=”hidden” value=”ActualitsBibliothconomiques” name=”uri”/>
<input type=”hidden” name=”loc” value=”fr_FR”/>
<input type=”submit” value=”S’abonner”/>
</form>

<!–Fin du formulaire d’inscription–>

<!–Ici le code pour insérer le fil RSS (code fourni par Yahoo)–>

<script src=”http://pipes.yahoo.com/js/listbadge.js”>
{“pipe_id”:”442cd973e9e5bae789b49ebef232e344″,”_btype”:”list”, “height”:”100%”, “width”:”40%”}
</script>

<!–Fin du code Yahoo–>

</body>
</html>

Et ce que ça donne à l’écran

Bon, c’est un peu plus joli quand le logiciel de gestion du site lui-même prévoit l’intégration de fils RSS (avec la charte graphique réutilisée). C’est le cas de Drupal, par exemple, comme dans Spip.

Voici ce que ça donne sur Confluence (logiciel de wiki) – sans le formulaire d’abonnement :
Copie d'écran - intégration d'un fil RSS sur Confluence

Voilà !

  • par ce biais vous diffusez une information sur le monde des bibliothèques (le choix des sources fera certainement l’objet de longues polémiques !)
  • vos collègues n’ont pas besoin de savoir ce qu’est un agrégateur (et vous n’avez pas besoin de les perturber en leur apprenant que les fils RSS existent, même s”ils savent — eux ou leurs enfants — utiliser des podcasts)

Si le résultat vous semble pertinent, si vous avez un peu suivi les tutoriels Yahoo Pipes, et si vous avez quelques connaissances en HTML (je m’adresse là à des personnes participant à l’enrichissement d’un intranet : logiquement ça devrait être le cas), vous ne devriez pas avoir de problème pour mettre ça en place.

Et la question technique ne doit pas vous arrêter : si vous avez un souci à une étape ou à une autre, mes coordonnées sont là.

Mais par ailleurs vous pouvez tout à fait juger que la solution proposée :

  1. est inadaptée : vous n’avez pas d’intranet !
  2. est inadaptée : ça ne permet pas du tout de retrouver la communauté Biblio-fr. Rappelez-vous que ce n’était pas mon objectif : ce que je visais, c’était permettre de disposer facilement d’une certaine actualité des bibliothèques. Constituer un des élément d’une communauté professionnelle, c’était un des autres rôles de Biblio-fr (mais ce n’en était pas une mission, ni à proprement parler un service).
  3. est inadaptée : pour retrouver la richesse du contenu de Biblio-fr (cf. ) il faut bien plus de 12 sources !
  4. est absurde : j’ai une vision exclusivement “technophile“, je suis un obsédé, et je ne vois pas que ce que je propose ne répond absolument pas au besoin de se tenir au courant de l’actualité des bibliothèques. Je ne saurai trop vous inviter à développer cette idée en commentaires (avec toute la courtoisie que l’exercice nécessite). Vous pouvez aussi en débattre sur Biblio-fr : je continue à suivre les messages par mon agrégateur.

PS : ce billet doit paraître pendant que je n’aurai pas accès à Internet. Ne m’en veuillez donc pas de ne pas répondre avant mardi :-)

PS 2 : il y a une prolongation possible de cette première proposition, pour ajouter un peu de souplesse dans un monde de brutes (pardon : dans ces sources “figées”). J’y reviendrai en début de semaine prochaine (sauf si entre temps vous m’avez montré le caractère illusoire de ce premier billet).

h1

Yahoo Pipes : tutoriel 8 (manipulation complexe de fils RSS)

26 mai 2009

Liste des tutoriels Yahoo Pipes

Cette fois-ci, plutôt que de créer un fil RSS — ce qui est très bien, très pédagogique, mais ne permet pas de faire des choses complexes — je vous propose d’en regarder un existant, qui soit complexe, pour le décortiquer.

En l’espèce, celui de @jsicot sera très bien. Ce pipe permet de faire une veille simultanée sur 7 services de gestion de favoris en ligne.

Pour faire une veille thématique (par exemple sur les archives ouvertes), il peut être très intéressant de se tenir au courant de ce qui intéresse les autres, donc de suivre l’enrichissement de bases comme Delicious ou Connotea. Mais deux constatations s’imposent :

  1. il existe un certain nombre de services en ligne
  2. il existe plusieurs termes susceptibles de servir de tags pour désigner des domaines de veille comme celui-ci : archivesouvertes, archives_ouvertes, ao, oai, open_archives, openarchives, etc.

Cela représente donc beaucoup de fils RSS

Le fonctionnement du pipe de @jsicot est :

  1. de mettre dans un champ unique tous les termes susceptibles de servir de tags, avec un séparateur spécifique (la virgule, ou le point-virgule).
  2. pour chaque terme saisi (le nombre est variable), de l’envoyer à chacun des services de gestion de favoris en ligne (il en a paramétré 7)
  3. de récupérer les fils RSS correspondants, de les fusionner
  4. de les dédoublonner (sur le critère de l’URL)

La principale difficulté est dans la 2e et la 3 étape : il faut faire des boucles (module “loop”) pour que, pour chaque terme (1ère boucle) et pour chaque service (2e boucle) il y ait un fil RSS généré. La fusion de fils RSS ne devrait en elle-même pas être un problème : c’était l’objet du premier tutoriel.

Voyons à présent ce que ça donne.

Voir la vidéo

Le pipe présenté est ici.

PS : toujours la même remarque qu’avant. Vous êtes invité à réagir si ce n’est pas clair. Vous pouvez me demander aussi de refaire la même chose avec un autre pipe (plus simple ou plus complexe, ou un que vous auriez trouvé et que vous aimeriez comprendre, etc.).

PS 2 : notez que ce pipe ne contient pas d’expressions régulières. Mine de rien, j’essaie de séparer les difficultés ;-)

h1

Yahoo Pipes : tutoriel 7 (créer un fil RSS)

15 mai 2009

Liste des tutoriels Yahoo Pipes

On entre enfin dans les vraies possibilités de Yahoo Pipes.

Les tutoriels qui précèdent montrent des fonctions utiles, et qui justifient l’utilisation de l’outil : utiliser Yahoo Pipes pour filtrer un seul fil RSS sur un mot-clé est légitime, c’est rapide, et ce n’est pas sortir la grosse artillerie pour tirer le perdreau. Mais Yahoo Pipes est un outil remarquable pour générer des fils RSS sur des pages qui n’en proposent pas : page d’actualités, liste de résultats dans un moteur de recherche.

Là, une remarque annexe : lorsque je génère ce genre de fils, je le rends très rarement public, car il pose tout de même la question de la propriété des données. En effet un site qui propose un fil RSS s’attend à ce que son contenu soit lu ailleurs que su le site lui-même. L’auteur d’un site qui n’en propose pas peut s’être fait la réflexion inverse, et vouloir précisément que les internautes viennent sur son site au lieu de lire ces informations ailleurs (pour des questions de publicité, ou d’autres). Je n’ai pas d’attitude type à proposer, mais je voulais tout de même signaler le problème : l’auteur d’un site ne sera pas forcément ravi si vous diffuser son contenu à tous les agrégateurs.

De quoi est composé un fil RSS

Un fil RSS, c’est un fichier XML composé de balises <item>.

Dans ces items, il ya 3 éléments clé :

  1. le titre
  2. le lien (vers le site d’origine)
  3. la description (qui peut être un résumé du billet, ou son contenu intégral).

Sur une page d’actus comme celle des archives départementales du Bas-Rhin, il faudra donc que dans le code HTML je détermine

  1. ce qui caractérise un item (donc : qu’est-ce qui sépare un item — une actu — d’un autre)
  2. ce qui, dans cet item, constitue
    • le titre
    • le lien (si l’item renvoie vers une page plus complète)
    • la description (le corps de l’item)

Donc je vais créer un pipe

  1. en indiquant ce qui permet de distinguer un item de l’autre (chaîne de caractères systématique)
  2. en indiquant, pour chaque item, ce que sont le titre, le lien et la description.

La notion “pour chaque item” s’exprime en informatique sous le terme de boucle (en anglais : loop). Donc dans mon pipe je vais faire 3 boucles disant successivement que pour chaque item :

  • le titre est situé entre telle et telle balise HTML
  • le lien entre telle et telle balise
  • la description entre telle et telle balise.

Deux nouvelles expressions Perl

A ce stade, le caractère . ne suffit plus. En effet il désigne tout caractère sauf le saut de ligne.

Or il faut

  1. pouvoir chercher “tout caractère, y compris un saut de ligne”
  2. tout caractère, sauf un caractère précis (par exemple, tout caractère sauf un guillemet.

Il n’existe pas de raccourci Perl pour le premier cas. En revanche il existe

  • \d : tout chiffre
  • \D : tout ce qui n’est pas un chiffre

Et si je demande à Perl de chercher [\d\D]*, il trouvera n’importe quel chiffre ou non chiffre, en nombre nul ou illimité : donc n’importe quoi.

Pour chercher tout caractère à l’exclusion d’un seul, par exemple tout caractère (en nombre indéfini) sauf #, il faut le faire précéder de l’accent circonflexe ^ :

  • [^#]*

A noter :

  • les crochets servent à désigner un ensemble de caractères (ou des raccourcis Perl). Ainsi [a-z] permettra de chercher toute lettre de l’alphabet en minuscules, et [a-zA-Z] toute lettre de l’alphabet, en minuscules ou majuscules (si vous voulez que ce soit en nombre indéfini, il faut mettre une * après). C’est pourquoi si on cherche spécifiquement les caractères [ et ] (comme c’était le cas dans le tuto 6), il faut les faire précéder de l’antislash.
  • Je vous rappelle l’existence de cette page pour connaître davantage d’expressions régulières Perl.

Place aux vidéos qui bougent

Je redonne le lien vers le site des AD du Bas-Rhin que j’exploite honteusement ici.

J’ai été obligé de découper en 2 vidéos (Jing me limite à des screencasts courts, mais ce n’est sans doute pas plus mal…)

Vidéo 7-1 : Préparation des modules

Vidéo 7-2 : Expressions régulières avec du code HTML

Et voilà le pipe produit

Pré-requis : il faut connaître un peu le HTML, sa structuration, quelques balises (pour les liens, les tableaux, les paragraphes, etc.)

N’hésitez pas à regarder de nouveaux les vidéos, mettre la lecture en pause, etc. J’ai fait rentré beaucoup de choses dans ces 2*4 minutes.

Et après ?

Si vous êtes encore là, vous avez passé le plus dur.

On pourra voir par la suite

  • la géolocalisation
  • l’enrichissement des descriptions (par exemple, un fil RSS de notices bibliographiques enrichi de rebonds vers différentes plates-formes)
  • et peut-être d’autres choses si j’ai des idées d’ici là.

Bon, la prochaine fois, pour se reposer, j’analyserai un fil RSS existant, combinant tout un tas de choses déjà vues. Ce sera une petite révision ;-) .

h1

Yahoo Pipes : tutoriel 5 (remplacement de texte)

29 avril 2009

Liste des tutoriels Yahoo Pipes

Logiquement, la notion de Chercher – Remplacer vous est familière, parce qu’existant dans tous les outils bureautique.

Chercher-remplacer classique

Appliquée à un fil RSS, la logique est la même : dans le fil RSS auquel vous vous êtes abonné, il y a des contenus qui vous gênent. Dans l’exemple de la vidéo ci-dessous, ce sont les caractères spéciaux : il y a un problème d’encodage (confusion entre iso8859-1 et UTF-8), et ça m’énerve. Donc je vais faire passer le fil RSS par Yahoo Pipes pour remplacer

  • tous les &ecirc; en ê
  • tous les &eacute; en é
  • tous les &agrave; en à
  • etc.

En outre, il s’agit de liens qui me renvoient à des notices sur LibraryThing, dans sa version anglaise (URL en librarything.com), et je veux que les liens pointent vers les mêmes notices, mais avec l’interface en français (même URL, mais en librarything.fr).

Voir la vidéo

Pardonnez ma voix fatiguée : je suis fatigué. Si quelqu’un veut la refaire ;-)

Voici le pipe produit. Notez au passage que par défaut Yahoo Pipes propose un affichage “image” que je ne connaissais pas, et qui ici ne sert pas à grand chose. Donc cliquez sur “List”.

Début d’initiation aux expressions régulières

Les expressions régulières (regular expressions, ou regex), c’est un outil qui vous permet de chercher des mots avec des variables.

Par exemple, si vous avez un fichier avec des ISSN “compacts” (sans tiret) où vous voulez introduire un tiret central, il vous faut

  • chercher toute série de 8 chiffres consécutifs
  • le remplacer par 4 chiffres – tiret – 4 chiffres

Le fil RSS ici présent est lui-même une fusion de plusieurs sources, et mentionne leur origine : dans le titre des items, on trouve ainsi, rajouté au titre d’origine : “(via LibraryThing)”, “(via Google Reader)”, etc.

Dans le cas présent, j’ai besoin de remplacer tout ce qui commence par “(via ” et qui se termine par “)“. Entre les deux, il peut y avoir n’importe quel caractère (sauf un saut de ligne).

Yahoo Pipes utilise le langage de programmation Perl pour ses fonctions d’expressions régulières, parce qu’il est particulièrement riche pour cela.

En Perl, il existe un caractère générique qui permet de désigner n’importe quel caractère sauf un saut de ligne : c’est “.” (le point).

Donc il va falloir chercher

  • “(via “
  • suivi de n’importe quel caractère (répétable)
  • “)”

Pour exprimer qu’un caractère peut être répété, c’est * (l’astérisque).
Donc au final, je vais chercher

(via .*)

et le remplacer par rien.

[Bon, en réalité je serai obligé de chercher

\(via .*\)

parce que les parenthèses ont un rôle particulier, et que pour signifier à Yahoo Pipes que ce sont vraiment les caractères "(" et ")" que je cherche, je dois mettre un anti-slash "\" devant.L'utilisation de ces parenthèses sera essentiel pour la suite, c'est pourquoi je suis obligé d'insister maintenant.]

Voir la vidéo

Voici le pipe (c’est le même que le précédent, cloné, avec un encart de plus).

Expressions régulières : pour aller plus loin

Si déjà vous piaffez d’impatience sur les expressions régulières, et que vous voulez savoir comment exprimer “Tout chiffre (mais pas de lettre)”, tout signe de ponctuation, toute lettre, etc. ;

Si vous voulez déjà savoir comment récupérer une partie du texte cherché pour le mettre dans le texte remplacé ;

Bref, si vous voulez déjà apprendre sans attendre les tutoriels suivants, voici une page qui liste comment désigner 4 chiffres (\d\d\d\d), etc. (lire la page à partir de l’expression surlignée en jaune)

[Remarque : les puristes traduisent regular expressions par expressions rationnelles. Ils ont raison.]

h1

Yahoo Pipes : tutoriel 2 (Interface d’ensemble)

24 avril 2009

Liste des tutoriels Yahoo Pipes

Je vais m’efforcer d’avancer lentement dans Yahoo Pipes, parce que j’ai plutôt l’habitude d’entendre que je vais trop vite. Si bien que si vous n’en apprenez pas assez, il faudra prendre votre mal en patience, ou découvrir par vous-même l’outil (ce qui n’est pas chose impossible : je l’ai fait).

Dans le tutoriel 1, j’ai généré un fil RSS fusionnant plusieurs sources. Cela vous permettait d’emblée de voir ce que permettait l’outil (ou du moins d’en avoir un minuscule aperçu).

Aujourd’hui, je reviens sur les outils d’ensemble de l’interface : le debugger, la colonne d’outils à gauche, etc.

C’est très simple, mais au moins c’est fait et il n’y aura pas à y revenir.

J’ai voulu changer d’outils pour passer de Jing à CamStudio : Jing ne fournit que du flash (SWF), format que Dailymotion n’accepte pas. Mais le taux de compression de Dailymotion rend la visualisation du screencast épuisante.

Donc je continue avec Jing, et voici la vidéo.

Le pipe dont il est question dans la vidéo est toujours accessible ici. Notez bien que lorsque vous trouvez un pipe qui vous intéresse, la fonction Clone et View source vous ouvrent l’accès à son moteur et à la possibilité de l’adapter.

La prochaine fois, nous passerons à des choses plus amusantes [sic] en manipulant cette merveilleuse source de données qu’est Calendoc, le calendrier des formations pour bibliothécaires et documentalistes. Nous allons le trier, le filtrer, le projeter (violemment) sur une carte, etc. En plusieurs étapes, évidemment.

h1

Yahoo Pipes : tutoriel 1 (fusionner des fils RSS)

22 avril 2009

Liste des tutoriels Yahoo Pipes

Je ne me rends pas compte de la propagation de l’outil au sein de la communauté. Mais comme je n’en entends jamais parler autrement que par ma propre bouche, j’ai l’impression que peu de personnes utilisent Yahoo Pipes.
Et comme je trouve que c’est dommage, je commence une série de petits tutoriels vidéos.

Petites explications initiales :
Yahoo Pipes est très simplement un outil de traitement de données. C’est essentiellement un outil permettant de traiter des fils RSS, par exemple pour les fusionner, les tronquer, les dédoublonner, etc.
Mais il permet aussi de générer des flux RSS à partir de pages web structurées en listes (des pages de résultats, par exemple).
Si on le lui demande gentiment, il peut aussi afficher sous forme de carte dynamique des listes contenant des informations de lieux (La Tribune des Archives en a fait une carte dynamique des expositions en services d’archives, à partir d’une liste contenant le nom de l’expo et le lieu : c’est dans le menu latéral du blog).
Il peut aussi produire un format ICS : par exemple si vous trouvez sur Internet une liste de conférences prévues, avec des dates et des lieux, vous pouvez la rentrer dans Yahoo Pipes pour en sortir à la fois une projection géographique et un calendrier.

Mais bon, nous allons commencer petitement.

La première chose à faire, c’est de disposer d’un compte Yahoo.
Cette première vidéo explique comment fusionner plusieurs fils RSS portant sur une veille  “Bibliothèque numérique mondiale”.
C’est du format Flash, ça dure 3′58 et il y a du son.
Et comme WordPress m’interdit le JavaScript, je suis obligé de vous renvoyer au site où est stockée la vidéo.

Et vous pouvez aller revoir le pipe créé dans la vidéo ici.

Bon, dans quelque temps, je vous préviens déjà, je vous parlerai d’expressions régulières. Habituez-vous déjà à cette idée !

h1

Sudoc RSS : petite mise à jour

7 avril 2009

J’ai rajouté un lien vers une recherche dans Moccam-en-ligne sur les listes de résultats par RSS dans le Sudoc.
Ca relance en réalité une recherche dans Amazon sur le titre, mais directement depuis Moccam, ce qui permet d’enrichir ainsi plus facilement son panier.
Cela dit, je n’ai pas encore vraiment fait de tests pour m’assurer de l’efficacité de la chose : la requête sur Moccam ne prend pas en compte les guillemets, ce qui peut rendre le nombre de résultats pléthorique, et je ne peux pas combiner ni avec l’auteur (impossible à récupérer dans les résultats du Sudoc) ni avec la date (champ non interrogable sur Moccam).

Un rebond vers Electre me semble en outre impossible, étant donné la technologie (ASP) utilisée par Electre. Cela m’exaspère profondément mais je ne peux pas y faire grand chose.

Par ailleurs (et c’est plus intéressant), je travaille à un script GreaseMonkey afin qu’en faisant une recherche directement dans le Sudoc, un lien vers le fil RSS correspondant apparaisse dans la page (bien meilleure solution que d’avoir un plugin de recherche spécifique).
C’est du JavaScript et j’ai encore quasiment tout à apprendre pour ce langage, mais le bout du tunnel est certainement proche !