Skip to content

Statistiques DLL 2005-2008 : enfin la comparaison devient possible

25/11/2009

J’avoue que cela m’a donné du fil à retordre, et j’ai eu besoin de l’aide de Risu (que je remercie ici derechef et vigoureusement).

Nous avions jusque là 4 tableaux coexistants, mais il était impossible de faire des analyses d’évolution en masse.

Exemple de question simple : les bibliothèques qui augmentent leur nombre d’ouvrages augmentent-elles aussi leur nombre de prêts ? Pour ça, il fallait pouvoir retrouver, d’une année sur l’autre, quelles bibliothèques avaient augmenté leur nombre de livres et comparer avec les colonnes d’évolution des prêts.

Bref, il fallait faire une jointure sur le nom de la ville pour relier les tableaux entre eux.

J’ai dû passer par un fichier XML de transition pour obtenir un tableau unique, listant pour chaque commune toutes les valeurs de 2005 à 2008.

Le tableau (fichier CSV) obtenu faisant plus de 1 Mo (il pèse 2,2 Mo), je ne peux pas le charger sur Google Docs. Avant que je trouve où le poser, si quelqu’un en veut je veux bien le zipper et le lui transmettre par mail.

<update>Je l’ai chargé dans ManyEyes, tout en ignorant pour le moment tout de cette base…  Vous pouvez récupérer toutes les données en format tabulé en cliquant sur ce lien. Ou bien trifouiller vous-même directement sur cette plate-forme</update>

Idem pour le fichier XML, si ça inspire quelqu’un (…) Je signale à tout hasard à quoi ressemble ce dernier :

Pour chaque ville, on a ceci :

<ville>
<nom year="2005">Ambérieu-en-Bugey</nom>
<departement year="2005">1</departement>
<population year="2005">11927</population>
<depenses_de_personnel_en_euros year="2005">177095</depenses_de_personnel_en_euros>
<nb_d_emplois year="2005">5</nb_d_emplois>
<part_des_emplois_specifiques_en_pourcentage year="2005">94</part_des_emplois_specifiques_en_pourcentage>
<nb_de_livres year="2005">31372</nb_de_livres>
<nb_de_phonogrammes year="2005">2414</nb_de_phonogrammes>
<nb_de_videogrammes year="2005">2128</nb_de_videogrammes>
<nb_de_cederoms year="2005">347</nb_de_cederoms>
<nb_de_postes_internet_public year="2005">1</nb_de_postes_internet_public>
<depenses_d_acquisition_en_euros year="2005"/>
<nb_de_livres_acquis year="2005">804</nb_de_livres_acquis>
<nb_d_abonnements year="2005">24</nb_d_abonnements>
<nb_de_phonos_acquis year="2005">152</nb_de_phonos_acquis>
<nb_de_videos_acquises year="2005">129</nb_de_videos_acquises>
<nb_de_cederoms_acquis year="2005">42</nb_de_cederoms_acquis>
<nb_d_inscrits_emprunteurs year="2005">1467</nb_d_inscrits_emprunteurs>
<nb_de_livres_pretes year="2005"/>
<nb_de_periodiques_pretes year="2005"/>
<nb_de_phonos_pretes year="2005"/>
<nb_de_videos_pretees year="2005"/>
<ouverture_hebdomadaire year="2005">10:00:00</ouverture_hebdomadaire>
<surface_totale year="2005">525</surface_totale>
<nb_d_annexes year="2005">0</nb_d_annexes>
<population year="2006">11927</population>
<depenses_de_personnel_en_euros year="2006">188180</depenses_de_personnel_en_euros>
<nb_d_emplois year="2006">5</nb_d_emplois>
<part_des_emplois_specifiques_en_pourcentage year="2006">94</part_des_emplois_specifiques_en_pourcentage>
<nb_de_livres year="2006">32121</nb_de_livres>
<nb_de_phonogrammes year="2006">2604</nb_de_phonogrammes>
<nb_de_videogrammes year="2006">2286</nb_de_videogrammes>
<nb_de_cederoms year="2006">379</nb_de_cederoms>
<nb_de_postes_internet_public year="2006">1</nb_de_postes_internet_public>
<depenses_d_acquisition_en_euros year="2006">20179</depenses_d_acquisition_en_euros>
<nb_de_livres_acquis year="2006"/>
<nb_d_abonnements year="2006">24</nb_d_abonnements>
<nb_de_phonos_acquis year="2006">191</nb_de_phonos_acquis>
<nb_de_videos_acquises year="2006">158</nb_de_videos_acquises>
<nb_de_cederoms_acquis year="2006">31</nb_de_cederoms_acquis>
<nb_d_inscrits_emprunteurs year="2006">1841</nb_d_inscrits_emprunteurs>
<nb_de_livres_pretes year="2006"/>
<nb_de_periodiques_pretes year="2006"/>
<nb_de_phonos_pretes year="2006"/>
<nb_de_videos_pretees year="2006"/>
<ouverture_hebdomadaire year="2006">10:00:00</ouverture_hebdomadaire>
<surface_totale year="2006">525</surface_totale>
<nb_d_annexes year="2006">0</nb_d_annexes>
<population year="2007">11927</population>
<depenses_de_personnel_en_euros year="2007">202620</depenses_de_personnel_en_euros>
<nb_d_emplois year="2007">5</nb_d_emplois>
<part_des_emplois_specifiques_en_pourcentage year="2007">96</part_des_emplois_specifiques_en_pourcentage>
<nb_de_livres year="2007">32866</nb_de_livres>
<nb_de_phonogrammes year="2007">2878</nb_de_phonogrammes>
<nb_de_videogrammes year="2007">2432</nb_de_videogrammes>
<nb_de_cederoms year="2007">398</nb_de_cederoms>
<nb_de_postes_internet_public year="2007">2</nb_de_postes_internet_public>
<depenses_d_acquisition_en_euros year="2007">17320</depenses_d_acquisition_en_euros>
<nb_de_livres_acquis year="2007"/>
<nb_d_abonnements year="2007">24</nb_d_abonnements>
<nb_de_phonos_acquis year="2007"/>
<nb_de_videos_acquises year="2007">141</nb_de_videos_acquises>
<nb_de_cederoms_acquis year="2007">1</nb_de_cederoms_acquis>
<nb_d_inscrits_emprunteurs year="2007"/>
<nb_de_livres_pretes year="2007"/>
<nb_de_periodiques_pretes year="2007"/>
<nb_de_phonos_pretes year="2007"/>
<nb_de_videos_pretees year="2007"/>
<ouverture_hebdomadaire year="2007">10:00:00</ouverture_hebdomadaire>
<surface_totale year="2007">525</surface_totale>
<nb_d_annexes year="2007">0</nb_d_annexes>
</ville>

Exemple d’exploitation : l’accroissement de l’amplitude d’ouverture

Ces statistiques permettent d’avoir un tableau (représentatif ?) de la lecture publique en France. Elles peuvent aussi servir d’aide à la décision. Par exemple : si j’augmente mes horaires d’ouverture, vais-je augmenter mon nombre d’inscrits ? mon nombre de prêts ?

Il y a 1814 communes pour lesquelles nous avons des chiffres sur le nombre de prêts, le nombre d’inscrits et sur l’amplitude horaire pour 2005 ET 2008.

Voici un tableau fournissant pour toutes ces communes : le nom, le département, la population, les prêts, le nombre d’inscrits et le nombre d’heures d’ouverture pour ces deux années

(Remarque : Google Docs affiche n’importe quoi pour la colonne des horaires, mais on peut récupérer le fichier sous Excel et choisir comme format de cellule > personnalisé > [h]:mm)

Sur ces 1814 bibliothèques :

  • 257 ont diminué leur nombre d’heures d’ouverture,
  • 1116 ont gardé la même amplitude horaire (arrondi à l’heure prêt).
  • 560 bibliothèques qui, entre 2005 et 2008, ont augmenté leurs horaires de plus d’une heure.

Si les choses étaient bien faites, on devrait avoir une augmentation des prêts proportionnelle (ou au moins corellée) à l’augmentation des horaires d’ouverture.

On devrait donc avoir un truc comme ça, où les points se répartiraient grosso modo le long d’une droite. Cela permettrait de conclure que lorsque l’amplitude horaire augmente, les prêts augmentent…

Correlation attendue entre l'augmentation de l'amplitude horaire et l'augmentation du nombre de prêts

En réalité on obtient plutôt quelque chose comme ça :

Bref, la corrélation n’apparaît pas clairement…

L’augmentation des horaires permettrait d’atténuer la diminution générale

Voici les valeurs médianes pour le pourcentage d’évolution des prêts

((Prêts_de_2008 - Prêts_de_2005) / Prêts_de_2008) * 100

Ce calcul est effectué pour chaque commune et me donne un % d’évolution des prêts de 2005 à 2008.

Je fais la même chose pour le taux d’inscription (nombre d’inscrits rapporté à la population de la commune) pour 2005 et 2008

Idem pour le nombre d’heures d’ouverture.

J’ai donc 3 séries de pourcentages : l’évolution des prêts, l’évolution des inscrits, l’évolution des horaires d’ouverture

Evolution des horaires, des prêts et du taux d’inscription sur l’ensemble de la population d’une commune Médiane Evolution des prêts Médiane Evolution des taux d’inscription Médiane évolution heures d’ouverture
Toutes bibliothèques (1814 bib) -2% -1% 0%
Bibliothèques ayant augmenté leur amplitude horaire entre 2005 et 2008 (560 bib) 2% -1% 12%
Bibliothèque n’ayant pas changé leur amplitude horaire (1116 bib) -3% -2% 0%
Bibliothèques ayant diminué leur amplitude horaire (257 bib) -1% -1% -14%

On constate que, dans la série « générale » (toutes bib confondues), le nombre de prêts et le nombre d’inscrits diminue.

Alors qu’il augmente pour le groupe des bibliothèques ayant accru leurs horaires d’ouverture : il augmente de 2% alors que les horaires augmentent de 12%.

En revanche cela n’aide pas vraiment le taux d’inscriptions.

Finalement, et assez mystérieusement, ce sont les bibliothèques qui n’ont pas changé leur amplitude horaire (1116 bib) qui voient leur nombre de prêts diminuer.

Un petit tour dans les extrêmes

Les chiffres fournis par la DLL sont peut-être erronés, toujours est-il que c’est avec ceux-là qu’on doit bosser.

Voici les augmentations et les diminutions extrême (horaires qui augmentent ou diminuent, évolution des prêts, taux des inscrits).

Rien qui permette de conclure quoi que ce soit…

Ville Accroissement prêts
(%)
Accroissement taux
d’inscrits
Accroissement heures
d’ouverture (%)
Ville ayant diminué
le plus ses horaires d’ouverture
Moyeuvre-Grande -6,96% -3,09% -77,78%
Ville ayant augmenté
le plus ses horaires d’ouverture
Caussade 955% 11% 584%
Ville ayant vu la
plus grande diminution du nombre de prêts
Sancerre -90% -9% 31%
Ville ayant eu la
plus grande augmentation du nombre de prêts
Saint-André-les-Vergers 1800,44% 6,88% -19,30%
Ville ayant eu la
plus grande diminution du nombre d’inscrits
Névez -18,28% -280,42% -11,11%
Ville ayant eu la
plus grande augmentation du nombre d’inscrits
Saint-Romain-de-Surieu 1,72% 99,05% 0,00%

Remarques d’ensemble

A ce stade, on tâtonne encore pour faire des conclusions probantes. En tout cas il apparaît clairement qu’une équation simple (comme : j’augmente mes horaires d’ouverture, donc j’aurai plus de lecteurs) n’est pas envisageable.

Il faudra associer à ces chiffres le nombre d’ouvrages par lecteur, le nombre d’acquisitions dans l’année, etc.

Ce qui me semble le plus criant, c’est que nous avons dans ces tableaux très peu de critères pour évaluer l’amélioration des services rendus par une bibliothèque :

  • Nombre d’inscrits
  • Nombre de prêts

Par exemple, on ne peut pas considérer le nombre de postes internet comme une amélioration en soi, puisqu’ils peuvent rester inutilisés…

et c’est à peu près tout… Alors qu’il faudrait d’autres indicateurs qui permettraient de constater le résultat d’une politique volontaire de la part d’une bibliothèque (et de sa tutelle), à commencer par la fréquentation du site web et du catalogue. Mais aussi le déploiement de services supplémentaires (assistance à la recherche d’emploi, heure du conte, etc.).

Eh bien ! C’est pas gagné !

Et si quelqu’un sait où je pourrais déposer le fichier CSV et le fichier XML, je suis preneur 🙂

Advertisements
8 commentaires
  1. 25/11/2009 16:31

    1 001 bravos !! J’avais commencé à mouliner les fichiers excel … mais tu est plus rapide …. !! Ces fichiers seront considérés comme en CC j’espère ? Si besoin, je prête tout l’espace nécessaire sur le serveur de Bibliofrance ! qui je le rappelle est coopératif… log FTP par mail privé si besoin en envoi en fichier zippé … au choix …

  2. 25/11/2009 16:34

    @Bibliofrance : « Fichiers considérés en CC » ? Quel besoin ? Les données sont déjà publiques, non ?
    Pour le stockage des données, j’ai finalement chargé le fichier CSV sur ManyEyes, où il est aisément récupérable en TXT tabulé.
    Mais effectivement il reste le fichier XML. Celui-ci est-il susceptible d’intéresser quelqu’un (auquel cas je veux bien le mettre sur un serveur Bibliofrance), ou bien je suis le seul à aimer exploiter ce genre de format ?

  3. 25/11/2009 17:15

    @Bibliofrance : au fait, ça veut dire qu’un tel travail de jointure entre plusieurs tableaux, sur un critère simple (comme un nom de ville), est possible sous Excel ?
    Comment ?

  4. 25/11/2009 18:05

    @lully Oui les données sont publiques… Cependant (si je ne m’abuse…) ton travail (pipes, compilation, moulinage, correction, poudre de perlimpinpin, etc…) forme un nouveau document qui n’est publique que si tu le décide ?

    @lully Pour ta question sur la jointure de plusieurs tableaux (sur un critère simple comme un nom de ville, ou autres d’ailleurs ) je ne suis pas un killer d’Excel mais il me semble que la fonction « classeur » et une année par «  »feuille » avec une troisième (ou X) feuille(S) pour les comparaisons/Cumulatif/etc ne doit pas être impossible à réaliser ? a voir C’était ça ta question ? …si oui je veux bien fouiller et tester … @+

  5. 25/11/2009 18:13

    @Bibliofrance : Bon, pour l’instant, sauf si les spécialistes précisent qu’il faut mettre une licence CC, je considère que le simple travail de conversion des données ne relève pas du droit d’auteur et ne nécessite aucune licence.
    D’ailleurs je n’ai pas vraiment expliqué ici comment je suis passé de 4 tableurs à un seul. Seul le résultat final (tableau unique) est communiqué.

    Pour la question sur la jointure, je ne suis pas sûr de comprendre ta précision. Ce que je veux dire :
    j’ai un tableau listant trois personnes, Pierre, Jacques et Lully, et pour chacun une colonne « couleurs de cheveux », avec les valeurs respectives : brun, blond, gris (les poils de rats, de même les perruques du XVIIe siècle, sont souvent gris). Ce qui donne :
    Pierre;brun;
    Jacques;blond;
    Lully;gris;

    A côté, j’ai un autre tableau avec 3 autres personnes : Pierre, André, Lully, et les tailles :
    Pierre;1,75m;
    André;1,88m;
    Lully;0,22m;

    Je voudrais obtenir le tableau suivant :
    Pierre;brun;1,75m;
    Jacques;blond;;
    André;;1,88m;
    Lully;gris;0,22m;

    Càd une jointure sur le critère Nom. Est-ce possible avec Excel ?

  6. 02/12/2009 18:54

    Mmon intuition, c’est que la fréquentation dépend aussi de la publicité (du buzz, de la visibilité, appelez ça comme vous voudrez…) Moi, par exemple, qui habite un petit village de 800 000 habitants appelé Marseille, ben, j’ai pas souvenir d’avoir vu des affiches pour les bibs. Ni beaucoup d’évolutions (par exemple : on peut maintenant réserver 1 livre, mais uniquement s’il est en prêt, et uniquement en allant le chercher soi-même sur le site ou il se trouve. Or, on a une bib dans l’une des + importantes stations de métro. Évidemment, elle est petite. Donc avec un fonds ridicule au regard du fonds du réseau. Je suis sûr que ca ferait un tabac si on avait une grande affiche : « demandez nous un livre, dans 48H, il est là, 700 000 docs à votre disposition, y compris 50 000 CDs et 7000 DVD [1]). Mais non, faut toujours aller à l’autre bout de la ville.

    Ah, 2eme reproche: les ouvertures ne sont pas harmonisées d’un jour à l’autre et d’une bib à l’autre. Ici, c’est lundi matin mais pas après-midi, là bas, c’est lundi après-midi, la 3eme c’est lundi matin et après-midi, et la 4eme lundi journée continue. C’est comme ça toute la semaine (bonne note à la BMVR sur ce point : 10H-19H tous les jours, en continu)

    [1] nombres au pif

Trackbacks

  1. “Mesurer le nébuleux” « Lirographe
  2. Benchmarker avec PAPESR (ou : Comment libérer des données) « Bibliothèques [reloaded]

Les commentaires sont fermés.

%d blogueurs aiment cette page :