Skip to content

Gephi : le temps du débutant

20/06/2014

gephi-logoJ’ai installé Gephi sur mon poste il y a une semaine (comment je me suis raccroché à cet outil ? sans doute fut-il mentionné dans un billet de blog non-quelconque).

Je pensais vous faire part prochainement, et progressivement, de ma manière de découvrir cet outil, des difficultés rencontrées, des incompréhensions, des ridiculitudes, etc.

Mais un tweet m’a interpellé, et du coup au lieu de commencer bille en tête par vous présenter l’outil, je me fends d’un petit préambule : Gephi, pourquoi faire ?

Gephi ?

Tout d’abord, le principe : Gephi est un logiciel de visualisation de données en réseau. C’est particulièrement pour donner à voir les liens entre amis à partir d’un compte Facebook, par exemple.

Plus généralement, ça permet ce genre de choses :

Résultats sur Google Image

Résultats sur Google Image

En entrée : un fichier contenant des « choses » avec des liens entre elles. Et en sortie un des trucs ci-dessus (ou d’autres).

Et pour moi ?

A vrai dire, je ne sais pas pourquoi je l’ai installé. Je veux dire que je sais ce qui m’a motivé au départ — mais je ne sais pas pour quoi.

Je ne sais pas ce que j’en ferai. Il n’est d’ailleurs pas impossible que je n’en fasse finalement rien (parce que trop compliqué, ou pas adapté, parce que je n’ai pas le temps).

Mais il y a deux manières d’apprendre à manipuler les outils :

  1. être confronté à une difficulté, et devoir trouver comment la surmonter, la dépasser, voire la sublimer.
    Bref, construire sa compétence sur un outil strictement en fonction de son besoin immédiat.
    C’est sur ce mode-là que j’ai découvert JavaScript dans le cadre de la bookmarklet Colodus (le seul code JavaScript que j’avais déjà vu était celui de diverses pages web, et des translators Zotero)
  2. Avoir envie de découvrir un truc, anticipant un besoin possible, supposé ou fantasmé.
    C’est ainsi que j’ai appris un peu de Perl et les expressions régulières, à manipuler les API ou SPARQL.

Dans la première catégorie, je rangerai les situations où on connaît déjà l’existence d’un outil, qu’on sait déjà un peu utiliser, et dont on sait que face à un besoin nouveau, l’outil saura répondre — à condition de monter en compétences.

La deuxième exploration est différente. Elle s’appuie uniquement sur la curiosité.

Les compétences acquises permettent ensuite d’envisager des solutions à des problèmes qu’on n’avait parfois pas envisagé jusque là comme des problèmes (mais simplement comme des états des lieux), sur le mode : it’s not a bug, it’s a feature.

Ce modèle d’acquisition de connaissance nouvelles me semble avoir deux caractéristiques essentielles :

  • il peut ne pas mener très loin (découragement, autres priorités plus immédiates)
  • il peut mener sur des chemins nouveaux

Trouver des chemins de traverse (ou les tracer ?) – Photo FlickR par Lotte Grønkjær – CC-BY-NC-SA-2.0

La visualisation des données : un chemin nouveau (pour moi en tout cas)

Gephi est un outil de visualisation de données « en réseau ». Aujourd’hui, tout ou presque peut être décrit comme réseau (j’ai d’ailleurs commencé mes exercices pratiques en essayant de décrire notre système d’information — je vous en reparlerai).

Mais très sincèrement, la notion de visualisation des données est un champ assez vierge pour moi. Je ne mets pas dans cette case les graphiques Excel (pas même les nuages de points).

J’ai tendance à penser les données en tableau. Mais ce n’est pas forcément leur structure : souvent, ce peut être simplement leur représensation. Le tableau est un outil d’alimentation et de manipulation des données, qui entraîne une certaine manière de les concevoir, de les penser.

Par exemple, les relations entre données n’y apparaissent pas.

Donc il me semble intéressant de me confronter à d’autres types de visualisation.

Je ne sais pas si les possibilités de Gephi sont pertinentes et performantes par rapport à cela. J’irai prochainement voir du côté d’Exhibit une autre fois.

Visualiser mes données — ou pas

Dans l’immédiat, je ne suis pas sûr d’avoir un jour des données qui mériteront d’être exploitées au travers d’un tel logiciel.

Par « exploitées », je veux dire qu’un outil de visualisation des données ne doit pas servir (seulement) à produire des images jolies : il doit permettre soit de rendre plus visible une réalité déjà présente dans les données, mais peu manifeste ; et il doit permettre de découvrir cette réalité.

Et donc dans mes activités, je ne vois pas de jeu de données immédiat. Cela dit je ne doute pas que l’apprentissage des possibilités de Gephi ne me fasse penser à certains usages. Heureusement que je n’ai pas attendu d’avoir besoin des API pour m’y former : dans le cas contraire, je serais encore à ce jour à me demander ce que je pourrais bien faire avec.

Mais surtout, j’espère qu’un jour j’aurai à m’occuper d’autres données que des miennes.

Toute la littérature professionnelle des 4 derniers mois (je ne trouve pas que ça remonte tellement à plus, cette obsession) pousse à positionner les BU sur le traitement des données, au service des chercheurs. Il me semble que la visualisation des données fait partie de cette problématique.

Donc si je veux être crédible sur ces questions, les outils des dataviz (Gephi et d’autres), il faut bien que je m’y frotte un peu avant de devoir en répondre.

Donc, comme je le disais : tester Gephi, je sais pourquoi, je ne sais pas encore pour quoi.

Publicités
13 commentaires
  1. 20/06/2014 08:38

    « Dans l’immédiat, je ne suis pas sûr d’avoir un jour des données qui mériteront d’être exploitées au travers d’un tel logiciel. »
    => Mais si 🙂 tu as un nouveau web service Sudoc, qui sert en format gephi le graphe formé par l’histoire d’un périodique (successions, scissions…) : http://www.sudoc.fr/services/metaperiodical/039255204.gexf
    Hélas, à ce jour, on subit de lourdes avaries techniques et ce service (comme d ‘autres) n’est pas encore revenu 😦
    Plus d’infos chez @thmchx

  2. 20/06/2014 08:42

    Mince, je ne le connaissais pas, celui-là ! J’aurais du venir au Jabes, c’est ça ?
    Merci pour l’info
    Et oui, pour le pb d’accès aux webservices, je m’en étais déjà rendu compte (mais t’as vu, j’ai pas râlé, j’ai juste compati intérieurement)

  3. 20/06/2014 11:06

    Pas encore eu le temps de le tester de notre côté, mais peut-être Gephi pourrait aussi être intéressant sur des résultats de traitements ezPAARSE (outil d’analyse de logs collectés localement sur un reverse proxy d’établissement) ? Notamment sur cet aspect données tabulaires –> données « en réseau »

  4. Thomas Michaux permalink
    20/06/2014 14:24

    Pour tester en ligne les fichiers .gexf avec le travail de Andrei Kashcha : http://anvaka.github.io/ngraph/examples/storage/gephi/fromGephi/

  5. Thomas Michaux permalink
    20/06/2014 14:47

    …au passage encore un peu de publicité pour le webservice Sudoc…et pour ceux « qui ont tendance à penser les données en tableau » c’est possible (contexte SNCF oblige 🙂 aussi d’obtenir les données en tabulé, il suffit juste d’enlever le .gexf : http://www.sudoc.fr/services/metaperiodical/039255204 mais dans cette forme tabulée on ne dispose pas des liens qui ont été suivis pour arriver aux ppn qui constituent l’historique d’un périodique

  6. Dominique Rouger permalink
    20/06/2014 17:11

    Contrairement à Gephi qui demande d’installer un logiciel, la bibliothèque D3.js permet de faire aussi bcp de visualisation https://github.com/mbostock/d3/wiki/Gallery
    … et d’ailleurs j’espère bien arriver a l’utiliser pour rendre visible via un navigateur les données du web service metaperiodical … mais mon apprentissage est laborieux : -\

  7. Thomas Michaux permalink
    20/06/2014 17:27

    http://sigmajs.org/

  8. 23/06/2014 10:55

    @Dominique Rouger et Thomas Michaux : même si d3.js et sigma.js sont certainement très bien aussi, je pense que j’ai besoin (psychologiquement parlant) de commencer par manipuler des fichiers et un logiciel dédié.
    C’est un peu comme ça que j’avais démarré sur Sparql avec Twinkle : c’est juste ma manière d’entrer dans une nouvelle matière.
    Après, il y a sans doute des perspectives supplémentaires à intégrer la datavisualisation directement dans le navigateur. Mais je vais me le garder pour plus tard.

  9. B. Majour permalink
    25/06/2014 16:46

    il peut mener sur des chemins nouveaux

    C’est vrai.
    Et même si ça ne te sert à rien, ça peut servir à d’autres, et en mener d’autres sur des chemins nouveaux.

    Rien que pour ça, tu as raison d’en parler.

    Et puis n’oublie pas les rebonds.

    Gephi m’a renvoyé à :

    – Tropes (www.tropes.fr/UtiliserGephiavecTropesVF84.pdf)
    – nodexl (nodexl.codeplex.com)
    – automap.software.informer.com/3.0/
    – text mining tool
    – Navicrawler, Plugin Firefox

    Vu, pour une part, dans : Cours-aux-Anciens-Gephi-Sébastien-Montaufier-16052013.pdf

    Gephi affiche, les autres creusent.

    Navicrawler
    Il s’adresse en premier lieu à la recherche en Sciences Humaines et Sociales, mais il peut être utilisé à d’autres fins. Il permet notamment de mieux comprendre sa propre activité de navigation, de la contextualiser en indexant tous les liens hypertextes (même ceux qu’on n’a pas cliqués) et de constituer des prises pour interpréter le web. Le Navicrawler produit ainsi des graphes dans lesquels les sites sont les noeuds et les liens sont les arcs ; ces dessins à plat ou en trois dimensions manifestent le parcours web de la session de navigation, à condition de les visualiser dans un logiciel adapté (par exemple Guess ou Graphiltre). Les graphes produits par le Navicrawler sont enrichis de nombreuses données issues de la navigation, qui permettent une interprétation poussée du terrain-web qu’on a exploré.

    […]

    Contrairement aux crawlers classiques qui produisent des graphes à interpréter dans un second temps hors du web, le Navicrawler fournit le graphe de l’exploration pendant laquelle l’utilisateur a essayé de comprendre quelque chose du web. Le Navicrawler accompagne l’utilisateur et capitalise sa navigation : toutes ses fonctionnalités sont pensées pour l’aider à s’orienter et à voir ce qui est caché.
    nous dit : http://blog.christophelebot.fr/2007/04/06/navicrawler/

    Comme quoi, on pourrait avoir des ressources insoupçonnées à portée de main.

    Imagine un peu. Chaque document de la bibliothèque comme une page Web.
    Et l’usager consulte ce Web intérieur avec Navicrawler, avant de sortir un graphe de son parcours.

    Et quand le bibliothécaire va récupérer tous ces graphes, il a le cheminement des lecteurs dans sa bibliothèque. Les zones fréquentées, les zones non fréquentées, et en sus il sait pourquoi.

    Enfin, peut-être :-), il faudra que je teste Navicrawler pour savoir ce qu’il a vraiment dans le ventre, et ce qu’il est capable de sortir.

    Merci pour la découverte.
    B. Majour

Trackbacks

  1. Gephi : le temps du débutant | Concours ...
  2. Gephi : le temps du débutant | Dr. Goulu...
  3. Mais que fait Gephi ? | Bibliothèques [reloaded]
  4. Gephi : le temps du débutant | Blogging ...

Les commentaires sont fermés.

%d blogueurs aiment cette page :