Skip to content

Intégrer les nouvelles consignes FRBR du Sudoc dans le quotidien du catalogage

05/03/2013

Contexte

Le 20 février 2013 est sortie une série de nouvelles consignes de catalogage pour décrire les documents dans le Sudoc, en lien avec la future FRBRisation des données.

Comme mon travail n’est ni de cataloguer, ni même d’animer le réseau des catalogueurs de mon SCD, je ne vous entretiendrai pas directement de ces nouvelles consignes, de leur intérêt, de leur enjeu, de leur complexité ou tous autres aspects de ce genre.

Je vais simplement vous expliquer comment nous essayons de les prendre en compte pour les faire entrer — façon méthode douce — dans les pratiques de catalogage des courageux collègues qui s’y attèlent chaque jour, et doivent ajouter de nouvelles règles aux anciennes déjà existantes.

Dans ce projet de FRBRisation du Sudoc, les consignes de catalogage sont  à deux niveaux :

  1. une insistance nouvelle sur des règles déjà existantes — parce qu’elles ont une importance nouvelle
  2. de nouvelles règles

Contrôle bibliographique de données FRBR – Photo FlickR de rarewren – CC-BY-NC-SA-2.0

Réponse technique

Dans notre SIGB (Aleph), le chargement quotidien des données du Sudoc (mises à jour « propres », avec redescente uniquement quand nous modifions les notices) donne lieu à un rapport, produit automatiquement, qui liste les n° de notices ajoutées, modifiées et rejetées, par RCR. Ce rapport est produit dans Aleph au format HTML.

Nous avions déjà fait il y a quelques mois un travail de retraitement de ce fichier (en local — sans modifier le programme qui génère ce fichier pour conserver intacte la maintenance associée à l’outil auprès du prestataire) pour en faire du XHTML.

Le XHTML, c’est du XML + HTML :

  • on peut l’ouvrir dans un navigateur
  • on peut lui appliquer une feuille de style XSL pour retransformer le fichier, notamment
    • modifier le format d’affichage (jouer sur l’ordre de tri, etc.)
    • appeler des API, c’est-à-dire des informations extérieures, sur la base des informations présentes dans le fichier.

Dans ce rapport, il y a donc les n° des notices chargées.

Or il existe une API Aleph qui permet de récupérer la notice en MarcXML en construisant une URL contenant le n° de notice. Donc on récupère cette notice en MarcXML, on l’ouvre et on en contrôle le contenu.

Bien évidemment, le code XSL qui va contrôler ce contenu n’a pas le livre en main ! Il n’est donc pas question de vérifier la qualité du catalogueur ! Simplement, une succession de tests vont vérifier la cohérence interne de la notice.

Voici quelques exemples (nous n’avons pas encore exploré l’ensemble des consignes FRBR pour voir comment les traduire en contrôles automatisés) :

  • Tous les 7XX ont-ils un $4 (code de fonction)
  • S’il se trouve un traducteur dans les 7XX ($4 = 730), y a-t-il un titre original en 454 ? — et réciproquement
  • Si un code 205 existe (ce qui signifie que ce n’est pas la première édition, mais forcément une réédition), vérifier qu’il y a une mention « cop. » dans 210 $$d (mention de la date de copyright)

J’insiste : je ne suis pas catalogueur, et dans ma manière de formuler ces exemples je peux me fourvoyer. Cela n’a aucune importance puisque mon seul rôle sera de transformer en XSL les contrôles qu’on me demandera d’appliquer : d’autres se chargent de décortiquer les consignes de l’Abes, donc je m’en décharge allègrement. Merci de votre indulgence sur cet aspect !

Par exemple, dans la feuille XSL se trouve le code suivant qui contrôle le 700$4 :

<!--Vérifs sur le code fonction de l'auteur (zones 7XX)-->
  <xsl:template name="code_fonction_auteur">
    <!--Récup de 2 variables : le n° de notice Aleph et le contenu de la notice Unimarc dans Aleph (API Aleph)-->
    <xsl:param name="no_aleph"/>
    <xsl:variable name="not_url" select="concat($url_opac_aleph, ':8080/X?op=find-doc&amp;doc_num=', $no_aleph, '&amp;base=', $base_bib)"/>
    <!--$not_file : contenu de la notice Aleph en MarcXML (API Aleph)-->
    <xsl:variable name="not_file">
          <xsl:copy-of select="document($not_url)//metadata"/>
    </xsl:variable>

    <p>Vérifs code fonction Auteur (7XX)</p>
    <ul>
      <xsl:for-each select="$not_file//varfield[starts-with(@id, '7')]">
        <li>
            <xsl:value-of select="position()"/><xsl:text> : </xsl:text>
              <xsl:choose>
                <xsl:when test="subfield[@label = '4'] != ''"><xsl:text>OK</xsl:text></xsl:when>
                <xsl:otherwise><xsl:text>Pb</xsl:text></xsl:otherwise></xsl:choose>
        </li>
      </xsl:for-each>
    </ul>
    <xsl:if test="not($not_file//varfield[starts-with(@id, '7')])">Pas de zone 7XX</xsl:if>
  </xsl:template>
Rapport actuel

Rapport actuel

Rapport avec contrôles sur 7XX$4

Rapport avec contrôles sur 7XX$4

La « visualisation » du rapport est centralisée, et le signalement des erreurs envoyé à chaque correspondant Catalogue en section qui redistribuera les corrections à faire.

Entre la chaise et le clavier

Ce n’est pas le tout de mettre en place plein de contrôles, il faut encore ménager les collègues.

Chaque agent recevra par mail ses notices corrigées automatiquement au stylo rouge – Photo FlickR de Wootang01 – CC-BY-ND-2.0

En effet avec ce système, les notices vont être contrôlées au lendemain de leur localisation dans le Sudoc, y compris avec les erreurs faites par d’autres BU. Donc si un catalogueur s’est contenté de créer un exemplaire sous une notice existante, il peut se retrouver avec un ensemble de corrections à faire, alors qu’il n’avait rien demandé !

Donc, bien évidemment, pour que ce soit efficace et afin de ne pas dégoûter les collègues, l’ensemble de ces contrôles va être mis en place progressivement, afin d’évaluer, à chaque nouvel ajout, le nombre de notices concernées et le temps nécessaire pour que ce nombre s’approche de 0 : ce qui signifiera que les notices sont propres quand elles arrivent dans notre SIGB, donc qu’on peut ajouter un contrôle supplémentaire qui fera remonter dans les rapports quotidiens le nombre de notices « sales », jusqu’à l’intégration de ces contrôles dans le regard, le cerveau et les mains de nos estimés catalogueurs.

Pour conclure

Le processus démarre tout juste. Il n’est pas exclu que nous butions sur des difficultés techniques ou humaines — par exemple un si grand nombre de problèmes par notices qu’il deviendrait inenvisageable de déployer in fine l’ensemble des contrôles techniquement possibles.

Bref, je signale là une intention, pas un retour d’expérience🙂

6 commentaires
  1. 11/03/2013 11:01

    La technique au service de l’amélioration du catalogue, ça semble une bonne piste que cette amélioration progressive, bien vu les collègues.

  2. 13/03/2013 23:55

    J’ai le même genre de projet chez nous ! Mais on a pas de XServer… Alors récupération des notices ds oracle, et vérif du fichier Aleph Sequentiel. Même genre de contrôle, et on va (peut-être) faire quelques contrôle avec les ws abes.

Trackbacks

  1. Intégrer les nouvelles consignes FRBR du Sudoc dans le quotidien du catalogage | L'évolution des BibliothèqueS | Scoop.it
  2. Intégrer les nouvelles consignes FRBR du Sudoc dans le quotidien du catalogage | Bibliothèque hybride | Scoop.it
  3. Intégrer les nouvelles consignes FRBR du Sudoc dans le quotidien du catalogage | Digital bibliothèques | Scoop.it
  4. Intégrer les nouvelles consignes FRBR du Sudoc dans le quotidien du catalogage | docnews

Les commentaires sont fermés.

%d blogueurs aiment cette page :