Skip to content

Journée Afnor/BnF sur l’open data du 24 juin 2016 (1/5) : Eléments préliminaires + le ROI de l’ouverture des données

27/06/2016

J’ai assisté ce vendredi 24 juin à une journée co-organisée par la BnF et l’AFNOR sur l’open data (oui, parce qu’en quittant Nice pour Paris, je n’ai plus le soleil mais j’ai davantage de journées professionnelles. Ça tombe assez bien parce que j’ai moins de jours de congé, donc plus de jours de travail).

Il y a eu pas mal d’interventions très intéressantes, et surtout très stimulantes. Je ne suis pas chargé d’en faire un compte-rendu, donc je vais me contenter de rebondir sur ce qui m’a le plus inspiré (en gros, les plus grosses résonances avec ce à quoi je m’intéresse, notamment sur ce blog).

Ça fera l’objet de 5 billets :

J’insiste : même pour ces interventions (il y en a eu d’autres), ce n’est pas un compte-rendu. Les présentations ont été filmées, et seront mises en ligne dans les semaines à venir ; les supports de présentation seront diffusés également.

Donc je ne vais revenir que sur les points qui me plaisent. J’essaierai juste d’être vigilant dans la distinction de ce que j’ai entendu et de ce que ça m’a inspiré.

Le coût de l’ouverture des données et le retour sur investissement

Le matin, un des représentants du GFII a expliqué que les données que les administrations mettent gratuitement en ligne sont récupérées et exploitées par les GAFA, sans bénéfice pour la société civile (les GAFA sont connues pour optimiser leur fiscalité).

Deux remarques là-dessus (la seconde a d’ailleurs été exprimée partiellement par l’intervenant dans un second temps) :

  • d’abord, il faudrait évaluer largement ce qu’on entend par « bénéfice » et par « société civile ». Au sens strict, ce serait les impôts perçus par le Trésor Public.
    Mais on peut aussi concevoir que ces GAFA transforment les données en services, et que ces services sont généralement accessibles gratuitement pour les internautes.
    Ceux-ci ont donc gratuitement accès à un service qui, auparavant, était soit payant soit inexistant.
    Cela pose le problème de ce qu’Olivier Ertzscheid et d’autres appellent l’uberisation de la santé ou de l’éducation (des intermédiaires applicatifs se substituent aux acteurs traditionnels). Entre autres conséquences, au bout d’un moment l’État estime que puisque ces sociétés prennent en charge certains services qu’il assurait auparavant, il peut diminuer progressivement les budgets de ces services moribonds et se reposer sur les sociétés privées.
    Mais le fait est que les utilisateurs de Google Maps économisent l’achat d’une carte ou d’un GPS. Il y a donc bien un « bénéfice » quelque part.
    En outre, il faut sans doute ne pas se focaliser systématiquement sur les GAFA pour généraliser aux « entreprises ». Certaines start-up qui démarrent sur une idée de service, mais n’ont au départ aucun capital de données, bénéficient de ces données publiques (et paient la taxe professionnelle, et embauchent).
  • Le second point est très différent : il me semble indispensable pour l’établissement qui décide de diffuser ses données, de faire en sorte qu’il soit le premier gagnant de cette opération.
    Pas « gagnant » au sens simpl(ist)e où un modèle économique formidable lui permettrait de gagner au moins l’équivalent du budget dépensé pour ouvrir ses données. Mais gagnant au moins sur les points suivants :
    1. il voit lui-même mieux ses données. Il peut ainsi les analyser, percevoir des défauts et améliorer la qualité de ses données (corrections), de son modèle de données (normalisation) ou même de son service (organisation)
    2. d’autres personnes s’emparent de ces données : soit pour les exploiter (les réutiliser dans leur propre contexte), soit pour les explorer (pour mieux connaître l’établissement, ou simplement par exercice).
      Ils peuvent alors faire ce travail d’analyse et de critique mentionné au point précédent.
      Si l’établissement n’a pas les moyens, le temps ou les compétences de faire cette analyse, il peut au moins se doter d’un processus de feedback pour faciliter les réactions (point de contact centralisé, veille sur le sujet, etc.).
    3. l’établissement peut même en venir à être réutilisateur des données qu’il met en open access. Ce peut être d’ailleurs un critère pour identifier les données à diffuser en premier.
      Dans tout établissement d’une certaine taille (mettons, une université), l’histoire fait que pour leurs besoins propres plusieurs sous-structures sont amenés à gérer des listes d’informations : liste des laboratoires, liste des projets en cours, liste des personnels, etc.
      Je ne sais plus quelle université américaine a mis en linked data la liste de ses fournisseurs d’accès aux ressources électroniques, de manière à pouvoir exploiter ces informations depuis plusieurs applications. Elle en a profité pour mettre cette liste sur le web, pour le cas où ça profiterait à d’autres établissements (mais ce n’était qu’un effet de bord).
      Pour donner un autre exemple : les données du catalogue sont le fruit d’une longue histoire, où les notices sont produites dans un certain contexte, et en vue d’une certaine utilisation (gérer et donner accès à un stock).
      L’extraction des données du catalogue de la BnF hors de sa base de données natives, pour les mettre en RDF, permet potentiellement à plusieurs services, au sein même de la BnF, d’accéder à ces données sous des angles nouveaux pour en extraire des informations, par exemple sur les erreurs de saisie : on peut grâce à DataBnF récupérer la liste des ouvrages édités avant la date de naissance de leur auteur (et donc corriger ces notices).
      C’est une requête relativement simple avec SPARQL. C’est plus complexe dans un logiciel conçu pour le catalogage et la gestion des colections.
12 commentaires
  1. B. Majour permalink
    29/06/2016 11:41

     » Ceux-ci ont donc gratuitement accès à un service qui, auparavant, était soit payant soit inexistant. »

    Ça pose aussi le problème d’être exploité par ces GAFA lorsque l’Etat ne le ferait pas dans le même sens.
    Vous utilisez nos services, nous pouvons récupérer et utiliser toute votre production, lire tout ce que vous échangez sont dans les CGU des GAFA.

    Comme je l’ai lu, dans un élevage de cochons, le cochon est nourri, logé, blanchi… gratuitement.
    Il n’est pas le client final.

    « Mais le fait est que les utilisateurs de Google Maps économisent l’achat d’une carte ou d’un GPS. Il y a donc bien un « bénéfice » quelque part. »

    Au détriment d’une autre société, comme l’IGN dans le cas des cartes. IGN qu’il faut continuer à financer sur les deniers de l’état. Ou alors peut-être en économisant des fonctionnaires ?

    Rapporté aux bibliothèques : Google offre aussi une « bibliothèque », mais peut-on économiser sur les bibliothèques pour autant ? Le fonctionnaire offre une orientation, une neutralité qu’une société privée n’a pas à respecter.

    Oui, attention à l’orientation des soi-disant services « gratuits ». Qui ne sont pas si gratuits que ça au bout du compte.
    Google c’est gentil, mais c’est basé sur la pub, et la pub tout le monde la paye. C’est un impôt en piqûre de moustique, indolore quand on dort, mais un impôt quand même. (jusqu’à 50 % du coût d’un produit, médicament compris)

    Et gratuit, pour combien de temps ?
    Par contre, ils sont bien financés par notre argent. Google récupère le beurre et l’argent du beurre.

    Les GAFA ne sont pas de gentils altruistes. Ce sont des sociétés commerciales avant tout.
    Et le cochon finit en jambons, gros jean comme devant.

    Il serait bon qu’il y ait une Creative Commons de réciprocité : vous utilisez nos données, nous pouvons utiliser les vôtres !… dans les mêmes conditions d’usage.

    Merci pour ce retour, très intéressant.
    B. Majour

  2. 05/07/2016 18:26

    @B. Majour : en fait, j’ai tendance à réagir assez négativement, par principe, aux démarches dont l’objectif initial est de contrer les GAFA. Ça donne généralement des effets désastreux.
    Par ailleurs, l’administration a des missions « régaliennes » dont elle ne doit pas se défausser sous prétexte que des acteurs privés veulent les assurer aussi.

    Plus globalement : merci pour tes commentaires🙂

Trackbacks

  1. Journée Afnor/BnF sur l’open data ...
  2. Journée Afnor/BnF sur l’open data ...
  3. Journée Afnor/BnF sur l’open data ...
  4. Journée Afnor/BnF sur l’open data du 24 juin 2016 (2/5) : Open data et records management | Bibliothèques [reloaded]
  5. Journée Afnor/BnF sur l’open data ...
  6. Journée Afnor/BnF sur l’open data ...
  7. Journée Afnor/BnF sur l’open data du 24 juin 2016 (3/5) : DataBnF et ArchivesFrance.fr | Bibliothèques [reloaded]
  8. OpenData France » La quinzaine des Données Ouvertes #124 #opendata
  9. Journée Afnor/BnF sur l’open data du 24 juin 2016 (4/5) : la table ronde, les archives et la politique d’open data | Bibliothèques [reloaded]
  10. Journée Afnor/BnF sur l’open data du 24 juin 2016 (5/5) : partager son EAD | Bibliothèques [reloaded]

Les commentaires sont fermés.

%d blogueurs aiment cette page :