Aller au contenu principal

Bibliostratus 1.35 : une mise à jour éditoriale

30/01/2023

Après 6 mois à bloquer sur des problèmes techniques pour livrer une nouvelle version de Bibliostratus, j’ai enfin pu y arriver, et vous livrer une version 1.35.

Voici les mises à jour concernées : ils concernent tous le module blanc Alignements bibliographiques.

Télécharger Bibliostratus 1.35

Amélioration de la recherche par titre-auteur-date

Suite à une erreur dans le code, le nom de l’auteur était jusque là dans une forme non nettoyée (normalisation sur les espaces, les accents, etc.), ce qui peut empêcher certains alignements.

Les alignements sur les recherches par mot y seront donc plus nombreux.

Contrôle de date sur un alignement par ISBN

En plus du contrôle sur le titre, l’alignement est aussi contrôlé sur la date de publication (à 1 an près).
En effet il est arrivé que certains (rares) éditeurs réutilisent le même ISBN pour des rééditions du même documents plusieurs années ou dizaines d’années plus tard.

Contrôle sur le nom de l’éditeur

Depuis plusieurs années, le format en entrée de Bibliostratus imposait une colonne « Editeur » pour les monographies imprimées, sans que j’ose vraiment l’utiliser : en effet la manière de saisir l’éditeur peut être très variable d’une base à l’autre, avec des règles de saisie, des abréviations, des non-mentions, etc. très différentes.

Il semblait donc risqué de mettre en place un contrôle sur les données trouvées, par rapport aux données entrantes : on risquait de générer de nombreux faux négatif (aucun alignement trouvé, parce que « C.-Lévy » ne correspond pas à « Calmann-Lévy », ni « GF » à « Garnier Flammarion »).

Est proposé désormais un paramétrage laissé à la main de l’utilisateur, dans les préférences, permettant de mettre un contrôle de 0 (pas de contrôle) à 3 (contrôle strict)

Zone contrôle éditeur dans Bibliostratus > Préférence (valeur par défaut : 0)

Le contrôle sur l’éditeur ne se fait qu’à partir du moment où il y a une proposition d’alignement (faite sur une recherche par ISBN, EAN, Titre-Auteur-Date)

  • 0 : pas de contrôle, les données en entrée dans la colonne Editeur ne sont pas comparées avec celles trouvée dans la notice alignée
  • 1 : la valeur de l’éditeur en entrée est présente dans la notice trouvée — ou l’inverse
    • Si le fichier en entrée contient « Flammarion » et la notice Sudoc/BnF contient : « Garnier Flammarion », le contrôle validera l’alignement
    • Si le fichier contient « G.Flammarion », la chaîne de caractère (nettoyée) « g flammarion » n’est pas présente dans « garnier flammarion », donc l’alignement sera rejeté
    • Si le fichier en entrée a une colonne vide, et que la notice Sudoc/BnF contient « Garnier Flammarion », l’alignement se fait
      l’absence de valeur dans une des deux notices comparées entraîne l’absence de contrôle
  • 2 : même contrôle qu’en 1. La seule différence est que s’il y a une valeur vide, ça n’annule pas la comparaison : il faut dans ce cas que pour les 2 notices aucun éditeur ne soit mentionné
  • 3 : l’alignement n’est validé que s’il y a une valeur strictement équivalente de part et d’autre
    • En cas de proposition d’alignement, si le fichier en entrée contient « Flammarion », l’alignement ne sera valide que si la notice trouvée contient aussi « Flammarion », mais ni « Garnier-Flammarion » ni « GF »
    • si la colonne est vide d’un côté, il faut que la valeur le soit aussi dans la notice trouvée

J’ai rédigé un notebook qui donne plusieurs exemples (avec valeurs d’éditeur trouvées) où un alignement se fait avec la valeur 0, mais pas avec la valeur 1 — ou avec la valeur 1, mais pas avec la valeur 2, etc. Avec plein d’exemples sur :

  • Editions du Seuil <->Seuil
  • British Library <-> The British Library
  • Librarie Académique Perrin et Cie <-> Perrin
  • Ernest Flammarion <-> E. Flammarion

Sachant qu’il y a plein d’autres cas aussi où, naturellement, le contrôle sur l’éditeur permet de lever des erreurs.

En tout cas vous aurez désormais pour faire vous-même votre choix, y compris en comparant les résultats avec les différents niveaux, selon votre corpus, vos règles de catalogage, la période des documents à aligner, etc.

Commentaires fermés

%d blogueurs aiment cette page :