Créez un moteur de biblioblogs en moins de 3 minutes

26/05/2009

tags: Google, Google CSE, screencast, tutoriel

Suite au précédent billet, ceux qui pensent qu’il est complexe de créer un moteur de recherche limité à 300 sites web, et qui pensent que j’ai fait preuve d’un dévouement sans borne en y consacrant mes 10 dernières nuits, je dédicace cette vidéo de 2’26 » :

je récupère sur Bibliopedia la liste des URL
je la colle sous Word
je supprime tout ce qui est en noir (donc tout ce qui n’est pas une URL) : chercher ce qui est noir et le remplacer par un saut de ligne (ensuite je supprime les doubles sauts de ligne en les remplaçant par un seul saut)
je colle la liste obtenue dans un moteur Google CSE (Custom Search Engine).

Bref, j’ai passé moins de temps à créer le moteur en question qu’à rédiger le billet qui le présentait…

Voir la vidéo

Pour créer un moteur, tout commence ici.

A présent, vous pouvez reprendre la même liste de blogs si vous voulez par exemple pouvoir interroger simultanément ceux-ci et Biblio-fr.

Bref, vous faites ce que vous voulez.

15 commentaires

rmasur permalink

26/05/2009 17:57

Intéressant!
Mais en fait, est-ce qu’on n’obtient pas le même résultat en ayant cette liste de biblioblogs dans son Google Reader (qui contient lui aussi un moteur de recherche interne)?
Lully permalink*

26/05/2009 18:06

@rmasur : mon but était de ne pas avoir à m’abonner à 300 biblioblogs, car tous leurs billets ne m’intéresseront pas nécessairement. Pour la plupart, je n’aurai pas besoin d’être informé de leur existence au moment de leur parution — à la différence des infos que je traque par mon agrégateur.
En revanche, avec cet outil, je pourrai découvrir une information ponctuelle sur un blog à la thématique générale m’intéressant moins.
En outre, il est techniquement beaucoup plus rapide de créer un moteur avec 300 URL que de s’abonner à 300 fils RSS (sans parler de vider son agrégateur quotidiennement…) : la source de mon moteur, c’est une liste d’URL (la page de Bibliopedia). Si ç’avait été un fichier OPML complet, je me serais peut-être posé la question différemment !
rmasur permalink

26/05/2009 18:31

Merci pour cette réflexion très pertinente (je noterai quand même que je lis quotidiennement surtout les 7-10 blogs qui m’intéressent le plus et je vide systématiquement le reste pour éviter que ce soit une activité trop chronophage) ; ce qui me frustre justement avec Bibliopedia c’est justement cette absence d’OPML….

Continuez donc à produire des articles de cette qualité 🙂 .
Lully permalink*

26/05/2009 20:18

@rmasur : il « suffirait » qu’à côté de la liste des biblioblogs (plutôt dans une autre page), on alimente une liste des fils RSS correspondants.
Ensuite on utilise cet outil : on lui fait avaler la liste des URLs, et il génère le fichier OPML correspondant.
Mais je ne suis pas convaincu par le nombre d’utilisateurs potentiels d’une telle liste : qui souhaitera effectivement s’abonner à 300 biblioblogs, au point d’alimenter une liste de fils RSS.

Autre solution (je vais creuser) : utiliser un outil (peut-être Yahoo Pipes ?) qui à partir de l’URL trouve l’URL du fil RSS (sans doute possible : le lien vers le fil RSS est dans les métadonnées de la page web), pour que de la même liste Bibliopedia on sorte les fils RSS correspondants.
Et ensuite on utilise ce même outil pour produire un fichier OPML à donner à Google Reader ou Netvibes (pbs de doublons en perspective avec les abonnements déjà présents…)

Bref, tout ça serait un peu lourd, en fin de compte, non ?
InQua permalink

04/06/2009 00:18

J’ai également construit un moteur de recherche bibliothéconomique avec près d’un millier de sources : http://inqua.tk

L’agrégateur et les fils rss sont parfaits pour l’actualité mais pas pour la recherche globale.
mediamus permalink

15/06/2009 11:18

Les conseils et instructions que vous dispensez sur ce blog sont vraiment très utiles. Merci pour pour ce tutoriel qui m’a permis de construire un moteur de recherche de chroniques musicales. Moteur qui sera complété et mis à jour par mes collègues bibliothécaires musicaux. Il s’agit encore pour le moment d’un work-in-progress : http://tinyurl.com/ndc6gc.
mediamus permalink

15/06/2009 11:20

L’adresse mentionnée ci-dessus sans le point :
http://tinyurl.com/ndc6gc
Lully permalink*

16/06/2009 10:32

@Mediamus : Mais voyons, tout « work » est « in-progress » !-)

Trackbacks

Commentaires fermés

	amarois dans Cataloguer par entités et rela…
	Cataloguer par entit… dans Cataloguer par entités et rela…
	L’interopérabi… dans Cataloguer par entités et rela…
	Cataloguer par entit… dans Cataloguer par entités et rela…
	Donner à voir… dans Donner à voir nos données : la…

Créez un moteur de biblioblogs en moins de 3 minutes

Trackbacks

Articles récents

Commentaires récents

Archives

Créez un moteur de biblioblogs en moins de 3 minutes

Partager :

Articles similaires

Trackbacks

Articles récents

Commentaires récents

Archives