Skip to content

Comparer deux listes de valeurs

17/01/2011

Un service du MIT met à disposition un petit service tout simple, extrêmement pratique.

C’est un formulaire à deux champs

  • Première colonne : une liste de valeurs
  • Deuxième colonne : une autre liste de valeurs

Le service compare les deux listes, et fournit :

  1. la liste des valeurs présentes seulement dans la liste 1
  2. la liste des valeurs présentes seulement dans la liste 2
  3. la liste fusionnée et dédoublonnée des deux listes
  4. la liste des valeurs présentes dans les deux listes à la fois

Intérêt majeur

En cas de manipulation de très longues listes (10.000, 20.000 lignes), on évacue

  • le plantage récurrent d’Excel (qui permet aussi de comparer des listes)
  • le PC immobilisé pendant 8 minutes,
  • l’utilisation de fonctions Excel
  • l’interprétation des résultats (si on compare avec la méthode Excel proposée dans le billet ci-dessus cité)

Exemples

  • Vous avez dans la base Apogée de l’Université 23.035 étudiants.
    Dans votre SIGB, après chargement du fichier, vous n’en avez plus de 19.657.
    Quels sont ceux qui manquent ? (et pourquoi ?)
  • Vous faites des transferts de fonds avec des traitements automatisés : 7.625 exemplaires à migrer — et, mystérieusement, 7.624 seulement dans le fonds destinataire.
    Où a-t-il bien pu passer ?
  • Vous voulez comparer, pour un fonds ou une bibliothèque donnée, des listes de PPN (extraction SIGB local comparée à extraction Sudoc sur requête précise)

A ce propos, pour ceux qui voudraient lancer ce genre de chantier, et qui utiliseraient Aleph, je tiens à disposition de qui veut une procédure (et un paramétrage) pour

  1. lancer une recherche dans Aleph
  2. lancer un service qui produise la liste brute des PPN (champ 001) des notices Aleph résultant de la recherche
4 commentaires
  1. 17/01/2011 13:43

    Sur le site de la BIMPE, Dominique Rouger propose un outil de ce genre, qui permet de comparer deux fichier csv. On peut ainsi comparer deux listes comportant plusieurs champs :
    http://bimpe.free.fr/bimpe_comparaison.php

  2. 07/02/2011 09:48

    Super outil, mais il bloque avec une liste vraiment longue. Sous Linux, on peut aussi utiliser comm, qui fait tout ça très bien, sur plusieurs dizaines ou centaines de milliers de lignes, sans effort.

  3. 07/02/2011 09:50

    @Hatt : je n’ai pas les mêmes fichiers que toi🙂
    Excel bloquait ou ramait sur 30.000 lignes, et c’est le genre de fichiers que j’ai à manipuler.
    Sur deux listes de 30.000 valeurs, ce service fonctionne en quelques secondes.
    Surtout, il est utilisable par n’importe quel autre collègue, à qui je n’ai donc pas besoin d’apprendre ni une formule Excel, ni une commande Linux ! #dissemination_des_competences

Trackbacks

  1. Tweets that mention Comparer deux listes de valeurs « Bibliothèques [reloaded] -- Topsy.com

Les commentaires sont fermés.

%d blogueurs aiment cette page :