Aller au contenu principal

INIST : Et maintenant, on fait quoi ?

15/10/2012

[Précision sur le titre : « on fait quoi » désigne l’Inist, et non les auteurs envisagent des procédures pénales à son encontre. L’objet de ce billet — comme à mon habitude — est technique, et essaie de poser des questions sur ce que techniquement l’Inist peut faire de sa plate-forme.
<update>En revanche, pour les auteurs qui se demanderaient « Et maintenant, on fait quoi ? », il y a ça !</update>]

Voilà plusieurs jours que le buzz tourne, suite à un premier billet d’Olivier Ertzscheid daté du 1er octobre 2012.

Depuis, les échos ont été nombreux, s’indignant de ce que par Refdoc, on était invités à payer la reproduction papier d’un document qu’on pouvait trouver par ailleurs gratuitement dans une archive ouverte. (je ne vous refais pas toute l’histoire : je considère que si vous suivez ce blog, c’est que certainement vous en suivez suffisamment d’autres pour ne pas la découvrir)

Je voudrais prendre le temps d’expliquer que, non, il ne « suffit » pas de simplement générer un lien depuis Refdoc vers HAL, quand l’équivalent OA (open archive) existe.  Pour des raisons simplement techniques.

L’Inist n’a juste pas le droit de faire ce qu’il fait

Prenons deux secondes pour évoquer la question juridique.

En 2011, l’Inist et le CFC ont été condamnés parce que le droit de reproduction versé au CFC n’autorise que la copie privée. Or Refdoc fait un commerce de ses reproductions. Dans ce cas-là, il faut donc obtenir une autorisation spécifique de l’auteur lui-même.

On a le résumé de l’affaire sur le site de l’Enssib, et l’arrêt complet ici.

Donc l’Inist n’a plus le droit de continuer à fonctionner comme il fonctionne, à moins de solliciter, à chaque commande d’un internaute, l’autorisation des ayant-droit. Et la plate-forme, telle qu’elle existe, ne peut pas continuer en l’état. C’est un fait (légal).

Bref, maintenant, il faut changer Refdoc en… autre chose.

Qu’est-ce qu’autre chose ?

Cela ne signifie pas que le scénario proposé par Olivier Ertzscheid tienne aisément la route. Je le cite :

Et tu sais ce qui me fait le plus mal dans mon petit coeur de chercheur qui cherche et qui défend l’accès ouvert aux connaissances ? Hein ? Dis tu le sais, cher responsable du service Refdoc et cher directeur de l’Inist ? C’est qu’à aucun moment, à AUCUN moment tu ne cherches à te vêtir de la plus élémentaire décence (à ce stade je renonce à parler même d’honnêteté), à aucun moment tu ne cherches à te vêtir de la plus élémentaire décence en signalant que ces 3 articles sont AUSSI disponibles gratuitement, dans la version que l’on veut (pdf, htm, doc, rtf …), conformément, cette fois, à ce petit grain de sable dans ta chaussure de responsable du service Refdoc et dans ton soulier de directeur de l’inist, ce petit grain de sable que l’on appelle la volonté de l’auteur et le respect du droit.

Sympa sur le principe. Mais comment faire le lien ?

Est-ce le même article ?

Plutôt que de partir de HAL, comme le fait Olivier Ertzscheid, pour s’assurer qu’un de ses articles déposés sur HAL se retrouve (payant) dans Refdoc, partons de l’autre bout et voyons comment Refdoc est alimenté.

Reprenons le 2e article de cette copie d’écran : De l’ingénierie des compétences à l’ingénierie des connaissances, par Olivier Ertzscheid, Jo Link-Pezet, Elisabeth Lacombe, paru chez L’Harmattan en 2003 et déposé en 2002 sur HAL.

Comment Refdoc en a eu connaissance ? La source est mentionnée en bas de la notice : par la bibliographie présente dans La librairie des humanités paru en 2005.

Donc :

  1. lors du référencement des ouvrages, Refdoc n’avait pas moyen de savoir que l’auteur avait fait un dépôt parallèle du même article dans HAL.
  2. il n’y a aucun identifiant commun permettant de faire la jointure (un DOI, par exemple). On pourrait rêver que La librairie des humanités, postérieur au dépôt de HAL, fournisse l’identifiant HAL. Sauf que La librairie des humanités ne référence pas l’archive, il référence l’article publié.

C’est pareil ? Comment le savez-vous ? D’abord, les métadonnées diffèrent :

  • Sur @rchiveSIC, le titre est : « FoRSIC : De l’ingénierie des compétences à l’ingénierie des connaissances »
  • Sur Refdoc : « De l’ingénierie des compétences à l’ingénierie des connaissances : Construction d’une ontologie pour la recherche d’information »

Ensuite, des versions distinctes peuvent coexister. J’ai bien peu de publications à mon actif. Mais je peux quand même citer celle-ci : « Qu’est-ce que le web des données ? » paru sur Bibliothèque(s) dans la rubrique « Le billet des hybrides » en 2010, dont j’avais donné une version longue sur ce blog. L’article publié est mentionné sur Refdoc, mais si j’avais pensé à le déposer dans HAL (il est vrai qu’il est encore temps), ç’aurait été la version (trop) longue, qui ne pouvait pas s’étendre autant dans Bibliothèque(s).

J’ai par ailleurs eu l’occasion de croiser dans la bibliographie de ma thèse des auteurs qui reprennent un même texte d’une revue à l’autre, en changent à peine le titre et parfois le contenu, pour s’adapter aux spécificités de chaque public ou de chaque comité de lecture.

Le lien entre les métadonnées sur HAL (un titre d’article et ses auteur) et celles d’une publication (titre d’article, auteurs, titre de revue, date de publication). Imaginons que seul le 1er soit mis sur HAL — comment Refdoc pourrait-il y renvoyer aussi hasardeusement ?

Je suppose que le circuit est un peu plus fluide quand il s’agit d’article de revues en ligne. J’en ai pris un article au hasard chez Elsevier : « The Adipocyte as an Active Participant in Energy Balance and Metabolism », de Michael K. Badman,Jeffrey S. Flier, paru dans Gastroenterology en mai 2007.

Il est bien référencé sur Refdoc, et la source est la revue elle-même (avec l’utilisation de formats d’échange et de partenariats dont je ne sais pas grand chose, sauf que ça semble heureusement automatisé).

Mais supposons que les auteurs en ont fait un dépôt dans une archive ouverte par ailleurs. Est-ce que l’on peut espérer de l’éditeur qu’il fournisse cette information avec les métadonnées de l’article publié ?

Est-ce le même auteur ?

Une des pistes proposées (dans le billet d’Affordance et/ou les commentaires) a été de « tenir » compte de la démarche proactive de l’auteur d’être signalé comme déposant sur des archives ouvertes, ou encore comme opposé à la reproduction abusive de sa production.

Pourquoi pas ?

Sauf que : Refdoc ne fonctionne pas comme une base bibliographique, mais comme un service de fourniture de document. Il est conçu pour que, si et seulement si vous connaissez déjà la référence exacte de la ressource, ça vaut le coup de s’adresser à Refdoc pour y avoir accès. Cela a beaucoup de conséquences.

L’une d’entre elle est que, sauf erreur de ma part — il n’y a pas de base d’autorités, ni matière ni auteur. Donc je ne peux pas simplement dire : « Je m’appelle Etienne Cavalié, merci de me faire disparaître de votre base. » Je pourrais avoir des homonymes (ou pas), en tout cas il est impossible d’identifier de manière certaine l’ensemble des productions qui seraient le fruit de mon imaginationmes entrailles mes travaux.

A la différence d’IdRef et du Sudoc.

Impasse ?

En l’état actuel des données disponibles sur Refdoc, il est impossible de générer dynamiquement quelque lien que ce soit vers des dépôts d’archives.

La seule chose envisageable pourrait ressembler à un petit texte disant : « Avez-vous pensé que ce document est peut-être gratuitement accessible pour vous sur HAL/Pubmed Central/ArXiv/Gallica/Persée/Revues.org/Google Books Search/Internet ».

Bof.

Est-ce le même travail ?

Ou alors, sans changer l’outil, on pourrait changer la manière de travailler : à la réception d’une demande, vérifier si l’article demandé n’est pas dans HAL. Et si c’est le cas, rediriger l’internaute vers ladite plate-forme.

Après tout, en BU, quand on reçoit une demande de PEB, le premier réflexe est de vérifier que le livre n’est réellement pas dans le catalogue…

Pour évaluer le taux de recoupement, Olivier Ertzscheid a constaté que tous les articles ou presque dont il constatait la présence gratuite sur HAL étaient (à vendre) sur Refdoc.

Sauf que pour l’équipe de l’Inist, ça fonctionne (là encore) dans l’autre sens : donc il faudrait plutôt, pour les X dernières demandes faites sur Refdoc, constater quelle proportion est présente dans HAL.

HAL, c’est 200.000 articles en plein texte. Refdoc, 53 millions de références.

HAL et Refdoc – obtenu en bidouillant à partir des Google Charts Tools

Donc sauf à constater que les auteurs les plus demandés sont ceux précisément qui sont accessibles dans des archives ouvertes (ce qui serait une information formidable pour la promotion de ce modèle au sein des chercheurs !) on peut supposer que, la plupart du temps, l’article demandé n’est pas dans HAL.

Peut-être est-il alors dans une des autres sources citées plus haut (Pubmed Central, Revues.org, Persée, voire la page perso d’un prof d’université) ?

Au final, ça revient à identifier un ensemble de ressources et mettre en place un métamoteur. Et contrôler (comment ?) que la version publiée, dont la reproduction est demandée par l’internaute, est bien la même que la version en archive ouverte

Autre souci : je n’ai pas testé la plate-forme, mais je suppose qu’on paie au moment de la demande de reproduction. Donc si l’Inist constate ensuite que l’article est disponible gratuitement, et y renvoie l’internaute, que faire de l’argent déjà payé ? Je suppose que ce genre de problème se résout par le passage à une étape intermédiaire (argent bloqué sur le compte d’un tiers, et reversement si prestation annulée), mais nécessite une réorganisation tout de même.

Est-ce le même service ?

D’ailleurs, si c’était le choix retenu, il me semble que le service changerait de forme, et deviendrait une sorte de service de recherche bibliographique d’un autre genre. Si l’Inist travaille à trouver la version gratuite d’un article dont il a recensé les métadonnées, n’est-ce pas là un service rendu (une sorte de questions-réponses) qu’il pourrait souhaiter facturer ?

Que peut faire l’Inist (s’il décide de faire quelque chose) ? Il semble pour commencer qu’ils aient des compétences en interne suffisantes pour évoluer.

Il y a vraiment un énorme problème de positionnement de cette base, selon qu’on la considère comme une sorte de vache à lait (comme elle est décrite ici sur le blog Bibnum), comme une base bibliographique proposant en plus la fourniture payante du document, ou comme un système de demande de reproduction d’articles à distance (sur le modèle du PEB, en quelque sorte).

Le billet d’Olivier Ertzscheid, qui mentionne le lien vers le blog Bibnum, semble suggérer plutôt d’évoluer vers la seconde orientation (base bibliographique), avec la mention de l’alternative Version gratuite / Version payante. Sauf que, comme je l’ai évoqué, Refdoc n’est actuellement pas du tout conçue comme une base bibliographique, dans la structure de ses données et dans les fonctionnalités qui les exploitent.

J’envisage ci-dessous plusieurs pistes. J’avoue d’emblée qu’elles sont toutes incomplètes, que je n’ai pas pris le temps (dont je ne disposais pas) de dépouiller toute la doc que j’aurais pu, notamment le mode d’alimentation actuel de Refdoc sur la base de chargements de métadonnées dans un format propre, au sein d’un circuit complexe.

Extrait de « L’édition électronique scientifique, son impact dans le traitement de l’information d’un centre de documentation », p. 3 – http://archivesic.ccsd.cnrs.fr/sic_00359634

Je n’ai pas non plus exploité le travail effectué par BSN 8 sur le projet de fusion de Refdoc et Supeb (dossier évoqué dans le tout dernier Arabesques), sur lequel des propositions de web services (donc d’interconnexions entre bases) ont été formulées. Le fait est que ces web services n’existent pas encore (ou en tout cas ne sont pas « en service »)

Voici en tout cas les pistes qui me semblent possibles :

  • Grosso modo, je lis depuis quelques jours des auteurs accuser l’Inist de « piller HAL et le revendre » (accusation formulée en des termes variés), alors que justement le gros problème vient de ce que l’Inist ne moissonne pas HAL.
    Pourquoi ne pas faire de Refdoc un moissonneur OAI, avec fonction de dédoublonnage (système classique de décompte de points pour évaluer si 2 ressources ont des chances d’être la même).
    Si le dédoublonnage fonctionne, l’internaute se retrouve avec une notice et 2 liens : Payant / gratuit.
    S’il ne fonctionne pas (métadonnées trop différentes), il peut tout de même retomber (selon sa requête) sur l’affichage de 2 résultats, et choisir entre les deux.
  • Se contenter de proposer des liens dynamiques vers HAL (en utilisant les API de HAL), en précisant que c’est « sans garantie » sur l’équivalence entre le texte référencé sur Refdoc et celui déposé sur HAL (contenu du document), et « sans garantie » sur la réelle correspondance entre les 2 (qualité des métadonnées).
    Ca ressemblerait à ça :
  • Ramener la tarification des documents au prix que coûte réellement leur reproduction.
    Je ne suis pas sûr que l’on revienne ainsi  à une pleine légalité, mais je suppose qu’en cessant d’en faire « commerce », ça évacue certains problèmes. Ou alors les BU vont être embarrassées de même, puisqu’elles s’échangent des reproductions d’articles dans le cadre du PEB, sans préalablement en demander l’autorisation aux auteurs.
  • Se contenter d’être une base bibliographique, sans donner accès aux ressources.
    Et on appellerait ça Francis&Pascal ?
  • Définir un ensemble de bases de contenus (du type archives ouvertes), et exploiter leurs API pour interroger en temps réel ces bases, sur les métadonnées disponibles, afin de s’assurer qu’une version gratuite n’existe pas par ailleurs
    Techniquement, on l’a vu, ça ne marchera pas ou de manière trop incertaine.
  • S’appuyer sur un moteur du type OAIster (chez OCLC désormais, je ne sais plus vraiment ce que c’est devenu) pour faire la même chose que précédemment, mais en exploitant ainsi les API d’une seule base, cette base se chargeant de centraliser les informations sur l’accès aux ressources (URL des documents)

Toutes ces pistes (très insatisfaisantes) situent les améliorations et les articulations au niveau de l’article. Si elles sont susceptibles, du moins pour certaines, d’apaiser l’ardeur des protestations actuelles, elles ne résolvent pas le problème juridique : comment gérer l’exigence qu’aurait l’Inist de devoir contacter les ayant-droit à chaque demande de reproduction ?

En supposant qu’on soit sur un modèle d’opt-in (l’auteur doit confirmer qu’il accepte la reproduction), et non d’opt-out (l’auteur doit venir tout seul se déclarer auprès de l’Inist pour refuser les reproductions).

Donc il faut sans doute aussi chercher des solutions au niveau des auteurs (et non de leurs articles). Quelques exemples :

  • Une meilleure articulation avec le CFC, s’appuyant sur une base auteurs commune : cela permettrait que, pour un article trouvé sur Refdoc, l’interface Refdoc interroge la base des auteurs qui ont passé contrat avec le CFC, et puisse déterminer si elle peut proposer une reproduction.
    Evidemment, le plus simple serait peut-être d’utiliser une base plus large, du type IdRef (ajoutée à d’autres sources complémentaires). C’est tout l’intérêt du web des données de pouvoir partager des identifiants facilement.
  • Une articulation de HAL avec IdRef, avec la possibilité dans HAL de cocher une case sur le profil d’un auteur, correspondant à une « déclaration de principe » au sujet de la reproduction de ses oeuvres.
  • Comme IdRef ne contiendra jamais tous les auteurs des articles et qu’il est difficile de l’alimenter, il y a peut-être une piste à suivre sur la constitution d’une base Auteurs, avec attributs sur le positionnement de chaque auteur sur les questions des archives ouvertes, ou de l’accord ou non d’être référencé dans un outil comme Refdoc — base que les auteurs eux-mêmes pourraient venir alimenter (sur la base d’une authentification Shibboleth exploitant différents annuaires, par exemple)
    Cette base, qui utiliserait évidemment les technologies des linked data (et pourquoi pas des API aussi ?) pourrait être exploitée aussi bien par Refdoc, HAL ou tout autre base.
  • Exploiter les correspondances apparemment existantes entre Refdoc et Francis, puisqu’il semble y en avoir dans cet exemple de notice structurée dans un format propre à l’Inist : on y trouve la ligne
    <identifier inist="17025242" francis="520-06-10519" monographicid="35400013242590" analyticid="354000132425900050" issn="0765-5762">
    Francis est, elle, une base bibliographique.

Et pour récupérer la base existante, pourquoi ne pas s’inspirer de la manière dont l’Abes a travaillé [dernière diapo] pour le lancement de theses.fr, autour de la question des notices d’autorités, avec Google Refine ?

Conclusion ?

Juste une petite conclusion pour la route : ça va pas être simple.

21 commentaires
  1. 15/10/2012 09:31

    Passionnant, merci! ^_^
    Petite question sur « Comme IdRef ne contiendra jamais tous les auteurs des articles et qu’il est difficile de l’alimenter » : et pourquoi donc?

  2. 15/10/2012 09:37

    MarieIdille : pourquoi IdRef ne contiendra jamais tous les auteurs des articles ?
    ou bien : Pourquoi il est difficile de l’alimenter ?

  3. 15/10/2012 10:19

    Les deux!

  4. 15/10/2012 10:46

    @MarieIdille : j’aurais dû m’en douter.
    Alors :
    1. l’auteur d’un ou plusieurs articles ne va pas forcément sortir un livre. Il peut n’avoir aucun diplôme universitaire français ou s’être arrêté au M2. Bref, il peut être référencé dans une base d’articles et pas dans un catalogue de bibliothèque.
    2. si la base d’articles (par exemple : Refdoc) décide de créer une autorité auteur qui n’existe pas dans IdRef, cela veut-il dire que l’Abes doit lui ouvrir les droits d’écriture sur IdRef ? J’ai des doutes.

  5. citoyenYann_nonAgentYann permalink
    15/10/2012 11:07

    Autre solution peut-être : que Refdoc ne soit *pas* une base de documents avec interface de recherche mais un guichet de commande de reproduction papier ou numérique. On ne chercherait pas dans Refdoc : on chercherait ici et là (bases biblio, HAL, Sudoc, Google Scholar, etc.), on trouverait une référence, on aurait les moyens de conclure qu’un des seuls recours qu’il nous reste pour accéder au doc serait d’en commander une repro à ce service de l’Etat* qu’est Refdoc, plutôt par exemple qu’à l’éditeur lui-même.

    * On présumerait, par exemple : l’Etat a fait de l’achat en gros, donc j’en profite, plutôt que de d’acheter en détail chez l’éditeur.

  6. 15/10/2012 11:24

    Je peux me tromper, mais pour moi l’objectif d’IdRef est justement de s’ouvrir à plus large que les catalogues de bibliothèque et de servir de référentiel pour l’ESR.
    Si tu revois la présentation d’IdRef par l’Abes, vers laquelle tu as mis un lien en fin d’article (http://bit.ly/TdlHGe diapo 4), IdRef vise aussi les archives ouvertes, par exemple.
    Pour moi rien n’empêcherait donc en théorie d’associer RefDoc et Hal à IdRef (voir le travail de SudocAd sur Persée http://punktokomo.abes.fr/2012/02/02/sudocad-resume-du-projet/)
    Je conviens néanmoins que l’association avec Persée n’allait apparemment pas jusqu’à créer de nouvelles autorités pour compléter IdRef.
    J’ai cependant retenu que l’alimentation d’IdRef par d’autres sources que SU / Star / Calames était envisagée (il faudrait reposer la question à Y. Nicolas, peut-être).

  7. 15/10/2012 11:54

    @marieidille Bien sûr, Emilie, tu as tout à fait raison. La vocation d’IdRef est bien se s’ouvrir à d’autres applications documentaires, pour qu’elles exploitent *et enrichissent* ce référentiel partagé d’auteurs, d’organismes, de concepts…
    Je crois aussi qu’Étienne le sait également, mais je crois comprendre qu’il souligne que si/quand HAL était/sera connecté, directement ou non à IdRef, cela ne voudrait pas dire pour autant que c’est l’auteur-déposant lui-même qui créerait son autorité dans IdRef. Je suis d’accord avec lui : ce n’est pas réaliste ; ça tombe bien ce n’est pas souhaité.
    Par contre, c’est tout à fait le genre d’opération à valeur ajoutée et à fort impact (IdRef=>VIAF=>ORCID, ISNI etc.) qui devrait revenir aux documentalistes de la Recherche, en coordination ou pas avec les SCD (dans le cas des UMR)(irénisme du lundi matin, espoir) . IdRef est pour eux !
    Les Pays-Bas ont un tel système (DAI). Avec IdRef, on n’a aucune raison de ne pas le faire dans le périmètre ES et R français. Il y a des obstacles techniques et organisationnels à lever. OK. Mais le veut-on ? Si oui allons-y ! Si non, mettons sur la table les arguments de fond. cf. Bureau du Service National.

  8. Gaétan permalink
    15/10/2012 12:00

    On trouve PubMed dans Refdoc et ses identifiants (PMID). Ceux-ci sont liés à PubMed Central (cf. http://www.ncbi.nlm.nih.gov/pmc/pmctopmid/) donc pour les 2 millions et + d’articles de ce dépôt, il y aurait bien une solution pour créer les liens.

  9. Emmanuel permalink
    15/10/2012 12:27

    Un point m’étonne dans cet argumentaire. Je comprends tout à fait qu’on puisse réagir au fait que la commercialisation des articles puisse se faire sans l’accord des auteurs ou dans des conditions non contractualisées mais la cristallisation de la discussion autour du fait qu’on « vend des articles accessibles gratuitement par ailleurs » me paraît une erreur.
    Elle conduit à des proposition assez ridicules comme le fait de promouvoir le gratuit sur la plateforme payante…

    Il me semble qu’il faut aller jusqu’au bout de la discussion des droits et des conditions d’exploitation des articles mais ne pas se disperser dans une discussion du « juste prix » un peu surréaliste. Certes le montage décrit dans cette affaire est un peu tordu (beaucoup même) mais depuis quand le régime de gratuité devrait être la norme.

  10. 15/10/2012 15:04

    @Gaëtan : j’avais bien noté ce point (que vous aviez mentionné chez Affordance), et j’avais testé la chose. J’aurais pu prendre le temps de détailler (mais le billet est déjà long, non ?).
    Prenons l’exemple d’un article, qu’on trouve

    Refdoc a récupéré l’identifiant PMID : 20175398, qui correspond au numéro de l’article dans Pubmed, et non dans PMC. L’identifiant PMC est : PMC2817902. Et sur la notice PMC on ne trouve pas l’identifiant Pubmed.
    Bref, pour accéder depuis Refdoc à PMC, il faut passer par Pubmed qui devrait faire une table de correspondance. Soit en ajoutant un lien « Pubmed » sur Refdoc, soit en utilisant une API Pubmed qui ferait la redirection.
    Mais la présence d’un identifiant Pubmed (et non PMC) ne signifie pas que l’article référencé par Refdoc soit sur PMC. Je n’ai pas l’impression que Refdoc est le moyen de faire la distinction entre un article PMC et un article non PMC signalé sur Pubmed.

  11. 15/10/2012 15:08

    @Emmanuel : le problème n’est pas tout à fait là. De nombreuses entreprises vendent du libre.
    Il me semble qu’on peut très bien facturer un CD d’installation Linux, en rajoutant un surcoût qu’on justifierait par le travail de gravure, le temps passé, l’obsolescence du matériel, etc.
    Mais là, il s’agit de cessions de droits d’auteur à des fins de reproduction en vue d’une utilisation commerciale.
    Le droit d’auteur est un concept qui doit être traité à part.

    Je note au passage (avec jubilation) une certaine contradiction chez certains qui souhaitent nier le concept de droit d’auteur chez les chercheurs, mais y font appel — non pas « quand ça les arrangent » — mais pour défendre ce qui me semble être une bonne cause : favoriser la diffusion de l’information scientifique.
    Où l’on constate donc que l’invocation du droit d’auteur, ou sa réfutation, n’est qu’un outil pour ce but-là : aider à la propagation de la connaissance et des résultats de la recherche.

    Précision utile : le modèle, les aspects juridiques du problème, ce n’est pas mon rayon. Si vous souhaitez prolonger la réflexion, rendez-vous sur le tout récent article de Calimaq (Lionel Maurel). Vous y trouverez des personnes bien plus compétentes.

  12. Gaétan permalink
    15/10/2012 16:01

    Je veux juste souligner que Refdoc choisit de ne pas récupérer le PMCID lorsqu’il récupère les données de PubMed (Les deux identifiants sont dans la même balise : http://www.ncbi.nlm.nih.gov/pubmed/20175398?&report=xml).

  13. 15/10/2012 16:29

    @Gaëtan : la source de la notice Refdoc, c’est, semble-t-il, la revue et non Pubmed. Reste à savoir par quelle chaîne de traitement exactement la notice est arrivée là, et si Refdoc a connaissance directe du fait que, cet article avec un identifiant PMID, est accessible sur PMC. Est-ce que la source utilisée mentionne que, outre le PMID, la revue elle-même est en open access ?
    Certes, ils pourraient travailler sur la base d’ISSN associés à des états de collections — mais ça implique de toute façon une conception autre que le service conçu actuellement pour Refdoc. De toute façon, il est évident que même si un tel lien dynamique était possible, ce n’est pas dans la politique de l’Inist.

  14. Gaétan permalink
    15/10/2012 17:15

    Je parierai bien une boisson non alcoolisée que la source de la notice c’est PubMed directement. (Est-ce que les revues elles-mêmes transmettraient systématiquement le PMID ?).

  15. 15/10/2012 18:16

    @Emmanuel : je reviens un peu sur ce que j’ai dit et sur le modèle économique.
    Il me semble que certains auteurs se sont un peu emballés sur cette histoire, avec 2 incompréhensions en arrière-plan :
    1. l’idée (fausse) que l’Inist vendait leurs articles déposés sur HAL. L’Inist vend des reproductions d’articles publiés dans des revues, pour lesquels les auteurs ont par ailleurs déposé une archive HAL
    (je laisse de côté les thèses, qui me semblent devoir suivre une tout autre logique)
    2. l’idée (vraie ? fausse ?) que si l’Inist et le CFC ont perdu face à un auteur, alors tous les auteurs pouvaient gagner.
    Je suppose que pour certaines revues, l’auteur a signé une autorisation de publication, et que dans cette autorisation pouvait être mentionnée en petits caractères « et à toute organisation à laquelle la revue donnerait autorisation de reproduction » (ou qqchose dans ce goût-là). Et que ces revues ont pu passer accord avec l’Inist. Auquel cas l’Inist est dans son droit.
    Le fait que les revues en question n’y gagnent rien financièrement est un problème moral, pas juridique.

    Donc pas sûr que l’Inist ait menti dans sa réponse à Rémi Mathis, postérieure à la condamnation de l’Inist. Il se peut qu’ils aient été dans l’illégalité dans un cas, et dans leur droit dans un autre.

    Ce qui m’atterre dans tout ça, c’est l’absence complète de réponse de l’Inist, afin qu’ils puissent s’expliquer sur leur circuit (et donc sur les difficultés techniques à modifier leur système actuel, par exemple) et sur leur assise légale.

  16. 16/10/2012 21:06

    Bonsoir Etienne,
    Je me pose quand même la question du succès de Refdoc : est-ce que leurs affaires sont si florissantes, et est-ce que l’Inist se fait vraiment de l’argent uniquement en vendant du gratuit… auquel cas, il faut leur piquer leur stratégie de référencement sur google et leur politique de communication! Mais en fait non, parce qu’en cherchant comme tout un chacun via google, je prends un exemple au hasard, « L’homme, un document comme les autres » d’O. Ertzscheid, via google, je tombe sur l’article en pdf dès le 2d résultat (sur une plate-forme de l’Inist, par ailleurs…). Donc, ce n’est peut-être pas parce que l’on vend du gratuit que les gens achètent, parce qu’on va tout de même commencer une recherche via google, et pas via refdoc, non mais. D’où l’idée de connaître, au delà de la proportion d’articles accessibles gratuitement sur le Net, la part de leur vente dans le CA de l’Inist. J’espère quand même que ce n’est pas une statistique qui est suivie… Mais l’Inist pourrait tenir des comptes grâce aux auteurs qui indiquent en ce moment-même ne plus vouloir figurer au catalogue Refdoc : la liste des titres concernés qui ont pu un jour être vendus donnerait une première idée du pognon qu’il y a à se faire, pardon, je voulais dire de l’ampleur du dommage. Je me demande si on tient ça autrement qu’à la louche, chez nous, au service du PEB les stat de documents qu’on a finalement chez nous ou sur Internet, et qu’on file gratos à l’usager finalement. Bref, tout ça pour dire que du gogo pressé plein aux as au bibliothécaire plein de bonne foi, il y aura toujours moyen de passer à côté du gratuit s’il n’est pas bien référencé et, pour ces documents-là, finalement Refdoc rend un service en rendant ces documents visibles. Donc oui, il faudrait quand même avoir une idée du gratuit vendu pour que les éditeurs/plates-formes en question se bougent pour être un peu plus visibles via google, ou tout autre moteur de recherche :On peut aussi se bouger pour que les auteurs mettent encore plus leurs articles en ligne, parce que, comme tu le dis, ce n’est quand même pas la majorité…et là, il y aussi du boulot.

Trackbacks

  1. INIST : Et maintenant, on fait quoi ? | Bibliolab, l'atelier des hybrides | Scoop.it
  2. INIST : Et maintenant, on fait quoi ? | Digital bibliothèques | Scoop.it
  3. #INISTGATE, analyse du buzz | Guillaume-Nicolas Meyer
  4. INIST : Et maintenant, on fait quoi ? | Bibliothèques et documentation | Scoop.it
  5. INIST : Et maintenant, on fait quoi ? | Données numériques de la recherche en SHS | Scoop.it

Commentaires fermés