Skip to content

Les chiffres Elsevier : et donc ?

04/06/2014

IHier, je suis allé faire un tour sur le blog de Tim Gowers pour voir s’il avait publié le second billet annoncé comme la suite de celui traduit ici. A défaut de l’y trouver, j’ai vu que Gowers avait actualisé son tableau des chiffres (dernière mise à jour : 31 mai) pour avoir un ensemble de données de départ déjà intéressant. Je le reproduis ici :

University Cost Enrolment Academic Staff
Birmingham £764,553 31,070 2355 + 440
Bristol £808,840 19,220 2090 + 525
Cambridge £1,161,571 19,945 4205 + 710
Cardiff £720,533 30,000 2130 + 825
*Durham £461,020 16,570 1250 + 305
**Edinburgh £845,000 31,323 2945 + 540
*Exeter £234,126 18,720 1270 + 290
Glasgow £686,104 26,395 2000 + 650
Imperial College London £1,340,213 16,000 3295 + 535
King’s College London £655,054 26,460 2920 + 1190
Leeds £847,429 32,510 2470 + 655
Liverpool £659,796 21,875 1835 + 530
§London School of Economics £146,117 9,805 755 + 825
Manchester £1,257,407 40,860 3810 + 745
Newcastle £974,930 21,055 2010 + 495
Nottingham £903,076 35,630 2805 + 585
Oxford £990,775 25,595 5190 + 775
***Queen Mary U of London £454,422 14,860 1495 + 565
Queen’s U Belfast £584,020 22,990 1375 + 170
Sheffield £562,277 25,965 2300 + 460
Southampton £766,616 24,135 2065 + 655
University College London £1,381,380 25,525 4315 + 1185
Warwick £631,851 27,440 1535 + 305
*York £400,445 17,405 1205 + 285

Question : que peut-on faire de ça ?

Cela m’intéresserait beaucoup que quelqu’un s’en empare, pour y déceler des constatations palpitantes et lumineuses qui me feraient enfin comprendre comment fonctionne la documentation électronique. Parce que pour l’instant, et en dépit de tout ce que je peux lire sur ce sujet, je garde cette désagréable sensation de nager dans la vase.

Outre cette ignorance avérée, je ne suis ni mathématicien, ni statisticien.

Mais bon, pour lancer un peu le mouvement, j’ai voulu tester un truc : j’ai voulu voir s’il était vrai que, plus l’Université est grosse, plus Elsevier lui demande des sous.

J’ai donc ajouté une colonne : « Coût / Nb d’étudiants »

Université Coût Nb d’étudiants Personnels 100%  Personnels temps partiel Coût/nb d’étudiants
Birmingham £764 553 31070 2355 440 £24,61
Bristol £808 840 19220 2090 525 £42,08
Cambridge £1 161 571 19945 4205 710 £58,24
Cardiff £720 533 30000 2130 825 £24,02
*Durham £461 020 16570 1250 305 £27,82
**Edinburgh £845 000 31323 2945 540 £26,98
*Exeter £234 126 18720 1270 290 £12,51
Glasgow £686 104 26395 2000 650 £25,99
Imperial College London £1 340 213 16000 3295 535 £83,76
King’s College London £655 054 26460 2920 1190 £24,76
Leeds £847 429 32510 2470 655 £26,07
Liverpool £659 796 21875 1835 530 £30,16
§London School of Economics £146 117 9805 755 825 £14,90
Manchester £1 257 407 40860 3810 745 £30,77
Newcastle £974 930 21055 2010 495 £46,30
Nottingham £903 076 35630 2805 585 £25,35
Oxford £990 775 25595 5190 775 £38,71
***Queen Mary U of London £454 422 14860 1495 565 £30,58
Queen’s U Belfast £584 020 22990 1375 170 £25,40
Sheffield £562 277 25965 2300 460 £21,66
Southampton £766 616 24135 2065 655 £31,76
University College London £1 381 380 25525 4315 1185 £54,12
Warwick £631 851 27440 1535 305 £23,03
*York £400 445 17405 1205 285 £23,01

Et j’ai voulu voir s’il y avait une corrélation linéaire entre le coût et le coût par étudiant (hypothèse : plus il y a d’étudiants, plus le coût par étudiant est élevé)

Et j’ai donc publié ce tweet

Type de graphique : nuage de points. En ordonnées, la colonne « Coût », en abscisse la colonne « Coût / étudiant ».

Et j’ai demandé à Excel de rajouter une courbe de tendance linéaire.

Faisons parler ce graphique

Une conclusion simple semble s’imposer : plus l’université est grande, plus elle paie plus [sic].

Du coup, la capacité de négociation d’un établissement consiste à se retrouver au-dessus ou en-dessous de cette courbe de tendance.

négociateurs universités

Ça me fait deux déductions simples, qui déjà pose question sur la notion de mise en concurrence des établissements.

Pourtant…

Pourtant je suis convaincu qu’il est très prétentieux de faire parler ce graphique.

D’abord, Excel est capable d’attribuer une courbe de tendance quelle que soit la distribution des points. Donc ce n’est pas parce que j’obtiens une droite qu’elle signifie quelque chose. Et je manque de comparaisons pour savoir si la distribution est réellement parlante,  à peu près homogène, ou en réalité plutôt éclatée (il suffit de changer l’échelle pour que les points apparaissent plus ou moins loin de la courbe).

En outre, est-ce une bonne idée de prendre les étudiants ? Vaut-il mieux avoir la population globale ? Ou seulement les chercheurs ? Ou essayer d’obtenir des informations par niveau d’études (voire par discipline) avant de prétendre interpréter les coûts des abonnements Elsevier ?

Et d’ailleurs, que cherche-t-on à faire ?

  • comprendre ce que ces abonnements coûte à une université (comparativement à ce que ça représentera pour d’autres universités) ?
  • comprendre comment fonctionne le modèle économique d’Elsevier (c’est-à-dire plus précisément, ici, le modèle de répartition des coûts) ?

Conclusion

Ce billet est un peu confus. Mes impressions aussi.

Mais j’en reviens du coup à l’objectif du tweet d’hier : il ne visait pas vraiment à commencer à proposer une exploitation de ces données, mais bien plutôt à vous/nous interpeller, à vous/nous inciter à envisager une utilisation de ces données. En les croisant avec d’autres données, en réfléchissant aux informations réellement utiles pour leur faire dire quelque chose.

Donc : oubliez ce graphique. Mais faites-en d’autres, des mieux.

4 commentaires
  1. Laurent permalink
    04/06/2014 16:44

    Merci pour ce post (et celui d’avant, très bien aussi) ! j’en parle ici : http://ist.blogs.inra.fr/technologies/2014/06/04/elsevier-le-juste-prix-ou-qui-veut-gagner-des-millions/

    A bientôt !

    Laurent

  2. Cyril permalink
    05/06/2014 15:07

    Bonjour,

    Je viens de passer sur votre blog suite à l’article de Laurent.
    Votre graphe m’interroge. Utiliser le montant de l’abonnement en ordonnées ne me permet pas de tirer la moindre conclusion, un truc me bloque.

    Les données seraient peut-être plus parlantes en prenant le nombre d’étudiant (y) / coût par étudiant (x)
    Cela permettra de voir si réellement le coût par étudiant augmente avec la taille de l’université (aka le nombre d’étudiants), ou bien si ce dernier est stable, et dans ce cas on a une droite de régression bien plate.

Trackbacks

  1. Elsevier : le juste prix ou qui veut gagner des millions ? | Observatoire des technologies de l'IST
  2. Gephi : le temps du débutant | Bibliothèques [reloaded]

Les commentaires sont fermés.

%d blogueurs aiment cette page :