Skip to content

Gephi : première utilisation – spatialisation

23/07/2014

Le fichier en entrée

Pour ma part, j’utilise un fichier listant les composants de notre système d’information documentaire. Vous devriez avoir un fichier à vous, à la structure comparable, suite aux consignes de ce billet.

Extrait : liste des applications du SCD, et à chaque application j’ai indiqué les applications associées et le service qui l’administre

source-exemple

Dans la fenêtre de chargement, j’ai choisi de dire que mon graphe était non dirigé. Dans le cas contraire, la spatialisation m’aurait affiché des flèches, dont je ne veux pas ici.

L’interface

Voilà à quoi ça ressemble quand on a simplement ouvert Gephi, et chargé un fichier de données.

interface-gephi

 

4 étapes simples

1. Répartition des noeuds dans l’espace en fonction d’un algorithme

Pour la plupart des cas qui nous occupent, c’est Force Atlas ou Force Atlas 2 qui sont recommandés. Force Atlas 2 n’est que la v2 de Force Atlas, une version améliorée dans la manière de traiter les calculs.

Le principe de base, très simple, est expliqué par exemple sur cette page.

Donc vous choisissez un algorithme dans la liste déroulante, et vous réglez les paramètres

algorithme

Pour comprendre chacun des paramètres, voyez  ce diaporama p. 31 (tutoriel Gephi, en français – les diapos qui précèdent sont très intéressantes aussi).

Le paramètre le plus important est l’échelle (pour Force Atlas 2) et la force de répulsion (pour Force Atlas) : si après avoir cliqué sur bouton Exécutervous trouvez que votre nuage de noeuds est trop ramassé, il faut augmenter l’une de ces valeurs (sans avoir peur de rajouter 1, 2 ou 3 zéros à la valeur par défaut).

Pensez toujours à arrêter l’algorithme en cours : sinon, il continue de faire ses calculs pour affiner perpétuellement (même si vous ne voyez plus la différence) la spatialisation de vos données.

Désormais le nuage initial ressemble à :

après spatialisation

Etape 2. Calcul du poids de chacun des noeuds et des liens

Afin de déterminer des sacs groupes de noeuds et les dimensions de chaque noeud, on utilise la colonne de droite pour qu’à chaque noeud soit associée une valeur, calculée notamment en fonction du nombre de noeuds entrants.
Au fait, en vrai, il faudrait dire sommets, qui est la bonne traduction de node pour désigner les intersections des arêtes dans une forme géométrique. Mais je crois que je vais y renoncer et rester sur « noeuds ». Je sais, c’est mal)

Ainsi, la modularité va permettre de définir des groupes (donc sera utile lors de la partition) : la modularité calcule « le nombre de liens dans chaque groupe moins nombre de liens dans les mêmes groupes, dans un graphe où les liens auraient été redistribués de façon aléatoire. » (source)

Donc en face de « modularité » vous cliquez sur « Exécuter ». Vous validez les valeurs par défaut dans la fenêtre qui s’ouvre, ça ira très bien.

(dans certains cas, la Centralité Eigenvector – explications – peut être plus intéressante : elle ne valorise pas le nombre de liens, mais leur diversité, càd le nombre de destinataires distincts pour un noeud donné)

Etape 3. Constituer des groupes

La modularité permet de dégager des groupes (fonction Partition). Et à chaque groupe, on va attribuer une couleur spécifique.

Donc en haut à droite, onglet Partitions, cliquer sur actualiser pour actualiser la liste des critères qui permettent de partitionner les données.

Dans la liste déroulante, je choisis « Modularity Class ».

partition - liste

Et j’obtiens un certain nombre de groupes, chacun ayant une couleur spécifique.

En bas de la liste, je clique sur Appliquer

appliquer partition

Mes noeuds ont désormais des couleurs.

Mais comme ces noeuds sont tout petits, on ne les voit pas bien. Il faut donc maintenant agrandir la taille des noeuds, en tenant compte de leur importance dans le « réseau ».

Etape 4. Attribuer une taille proportionnelle à chaque noeud

C’est l’onglet Classement juste à côté.

Et dans cet onglet, il ne faut pas rater la petite icône Diamant sur la droite. Je le signale parce que j’ai mis du temps à la repérer.

classement-poids

Puis vous choisissez le paramètre de classement Degré, une taille min et une taille max : les différents noeuds vont prendre des dimensions qui iront de ce minimum à ce maximum.

Puis le bouton « Appliquer ».

classement-appliquer

Et voici le résultat :

classement-resultat

Dernière phase : afficher les noms des noeuds

Faut reconnaître que c’est quand même pratique de savoir qui est qui.

En dessous de l’image, il y a un certain nombre d’icônes permettant d’afficher ou de masquer certaines infos, et de jouer sur leur taille.

Ne pas rater la toute dernière icône complètement à droite, qui affiche plus d’options.

barre-outils

Tadaaaam !

SI documentaire

Bon, c’est pas le schéma le plus joli du monde, mais :

  • il m’a demandé peu d’efforts (quelques minutes)
  • il est quand même parlant et signifiant, et les sous-ensembles sont bien identifiés :
    • les outils de l’Abes
    • ceux de la DSI
    • ceux du Cléo
    • ceux du CCSD (même si la couleur serait à revoir)
    • et pour le Sidoc, distinction assez bonne des outils internes et des interfaces publiques

Les commentaires sont fermés.

%d blogueurs aiment cette page :