Aller au contenu principal

Créez un moteur de biblioblogs en moins de 3 minutes

26/05/2009

Suite au précédent billet, ceux qui pensent qu’il est complexe de créer un moteur de recherche limité à 300 sites web, et qui pensent que j’ai fait preuve d’un dévouement sans borne en y consacrant mes 10 dernières nuits, je dédicace cette vidéo de 2’26 » :

  1. je récupère sur Bibliopedia la liste des URL
  2. je la colle sous Word
  3. je supprime tout ce qui est en noir (donc tout ce qui n’est pas une URL) : chercher ce qui est noir et le remplacer par un saut de ligne (ensuite je supprime les doubles sauts de ligne en les remplaçant par un seul saut)
  4. je colle la liste obtenue dans un moteur Google CSE (Custom Search Engine).

Bref, j’ai passé moins de temps à créer le moteur en question qu’à rédiger le billet qui le présentait…

Voir la vidéo

Pour créer un moteur, tout commence ici.

A présent, vous pouvez reprendre la même liste de blogs si vous voulez par exemple pouvoir interroger simultanément ceux-ci et Biblio-fr.

Bref, vous faites ce que vous voulez.

15 commentaires
  1. rmasur permalink
    26/05/2009 17:57

    Intéressant!
    Mais en fait, est-ce qu’on n’obtient pas le même résultat en ayant cette liste de biblioblogs dans son Google Reader (qui contient lui aussi un moteur de recherche interne)?

  2. 26/05/2009 18:06

    @rmasur : mon but était de ne pas avoir à m’abonner à 300 biblioblogs, car tous leurs billets ne m’intéresseront pas nécessairement. Pour la plupart, je n’aurai pas besoin d’être informé de leur existence au moment de leur parution — à la différence des infos que je traque par mon agrégateur.
    En revanche, avec cet outil, je pourrai découvrir une information ponctuelle sur un blog à la thématique générale m’intéressant moins.
    En outre, il est techniquement beaucoup plus rapide de créer un moteur avec 300 URL que de s’abonner à 300 fils RSS (sans parler de vider son agrégateur quotidiennement…) : la source de mon moteur, c’est une liste d’URL (la page de Bibliopedia). Si ç’avait été un fichier OPML complet, je me serais peut-être posé la question différemment !

  3. rmasur permalink
    26/05/2009 18:31

    Merci pour cette réflexion très pertinente (je noterai quand même que je lis quotidiennement surtout les 7-10 blogs qui m’intéressent le plus et je vide systématiquement le reste pour éviter que ce soit une activité trop chronophage) ; ce qui me frustre justement avec Bibliopedia c’est justement cette absence d’OPML….

    Continuez donc à produire des articles de cette qualité 🙂 .

  4. 26/05/2009 20:18

    @rmasur : il « suffirait » qu’à côté de la liste des biblioblogs (plutôt dans une autre page), on alimente une liste des fils RSS correspondants.
    Ensuite on utilise cet outil : on lui fait avaler la liste des URLs, et il génère le fichier OPML correspondant.
    Mais je ne suis pas convaincu par le nombre d’utilisateurs potentiels d’une telle liste : qui souhaitera effectivement s’abonner à 300 biblioblogs, au point d’alimenter une liste de fils RSS.

    Autre solution (je vais creuser) : utiliser un outil (peut-être Yahoo Pipes ?) qui à partir de l’URL trouve l’URL du fil RSS (sans doute possible : le lien vers le fil RSS est dans les métadonnées de la page web), pour que de la même liste Bibliopedia on sorte les fils RSS correspondants.
    Et ensuite on utilise ce même outil pour produire un fichier OPML à donner à Google Reader ou Netvibes (pbs de doublons en perspective avec les abonnements déjà présents…)

    Bref, tout ça serait un peu lourd, en fin de compte, non ?

  5. 04/06/2009 00:18

    J’ai également construit un moteur de recherche bibliothéconomique avec près d’un millier de sources : http://inqua.tk

    L’agrégateur et les fils rss sont parfaits pour l’actualité mais pas pour la recherche globale.

  6. 15/06/2009 11:18

    Les conseils et instructions que vous dispensez sur ce blog sont vraiment très utiles. Merci pour pour ce tutoriel qui m’a permis de construire un moteur de recherche de chroniques musicales. Moteur qui sera complété et mis à jour par mes collègues bibliothécaires musicaux. Il s’agit encore pour le moment d’un work-in-progress : http://tinyurl.com/ndc6gc.

  7. 15/06/2009 11:20

    L’adresse mentionnée ci-dessus sans le point :
    http://tinyurl.com/ndc6gc

  8. 16/06/2009 10:32

    @Mediamus : Mais voyons, tout « work » est « in-progress » !-)

Trackbacks

  1. Biblio-fr : encore d’autres réflexions « Encore un biblioblog…
  2. Gérer une base de signets (3/4) « Encore un biblioblog…
  3. Un an d’expérience, deux ans de vacances « Encore un biblioblog…
  4. Un an d’expérience, deux mois de vacances « Encore un biblioblog…
  5. Biblioblogs : proposer des retours d’expérience « Encore un biblioblog…
  6. Moteur de biblioblogs – rapides statistiques « Bibliothèques [reloaded]
  7. Présentation du moteur de recherche de chroniques discographiques | ACIM

Commentaires fermés