Académique Documents
Professionnel Documents
Culture Documents
ETUDE PRLIMINAIRE
JEAN-PHILIPPE MICHEL
Il s'agit dans cette courte tude d'explorer la bibliothque forme par les livres des lecteurs
autour de soi et de la comparer aux bibliothques municipales. Plus prcisment, les quatres
questions suivantes sont abordes:
(1) Quelle est la distance moyenne de la plus proche bibliothque et quel est le fond de
livres qui y est disponible?
(2) Volume: Combien de livres puis-je trouver chez mes voisins en fonction de la distance?
(3) Diversit: Combien de titres dirents puis-je trouver chez mes voisins en fonction
de la distance?
(4) Pertinence: A quelle distance se trouve le livre que je cherche?
Pour rpondre ces quatres questions, j'utilise des donnes en libre accs, un certain
nombre d'hypothses simplicatrices et des modles mathmatiques. Dans toute la suite je
me focalise sur la petite couronne parisienne (dpartements: 75+92+93+94):
9000 habitants/km2 ,
763 km2 ,
281 bibliothques municipales [3].
Par ailleurs je supposerai que les donnes suivantes, collectes l'chelle de la France, s'appliquent:
> 90 livres possds par foyers en moyenne, [5]
2.3 personnes par foyer en moyenne.
1.
D'aprs les chires ci-dessus une distance r de chez soi, avec r reprsent en km, il y a
2
foyers soit au moins 90 9000r
1100000r2 livres. Avec r reprsent en mtres,
2.3
2
cela donne 1.1r livres une distance r, soit le graphique suivant
9000r2
2.3
Volume de livres
nombres de livres
150 000
100 000
50 000
150
200
250
300
350
400
distance en mtres
Ceci est dj suprieur une bibiolthque moyenne. Pour comparaison, une bibliothque
couvrant une population de 70000 habitants comporte en moyenne un fond de 140000 ouvrages
[1], ce que l'on retrouve moins de 400 mtres de chez soi.
3.
Pour valuer la diversit, il s'agit de quantier les redondances dans les achats de livres.
Elles sont trs leves d'un voisin l'autre pour des best-sellers, mais quasiment nulle
l'intrieur d'un mme foyer. La pertinence est clairement une question encore plus dlicate.
Je prsente successivement la modlisation choisie, son implmentation numrique, mes
rsultats et les limitations du modle.
3.1. Le modle. Je dispose des donnes suivantes pour 2014 (cf. [2]): le nombre des ventes
de chacun des 30 titres les plus vendus (pour un total de 3.4% des ventes) et
les 1000 titres les plus vendus reprsentent 19.1% du chires d'aaires,
les 10000 titres les plus vendus reprsentent 44.2% du chires d'aaires,
690000 titres dirents ont t vendus.
Ceci nous permet, par interpolation, d'estimer les ventes de chacun des titres. L'achat de N
livres est alors modlis comme suit:
chaque achat de livres est eectu de manire indpendante et suivant la loi de probabilit donne par les ventes (probabilit d'achat de 0.001 pour un livre qui reprsente
0.1% des ventes de l'anne).
3.2. Implmentation numrique. J'utilise ici le logiciel de calcul scientique Mathematica.
A partir des donnes dans [2], j'obtiens une approximation de la densit de probabilits d'achat
de chaque livre. La queue de la distribution tant trs lourde, je l'obtiens en ralisant un t
0.0020
0.0015
0.0010
0.0005
10
20
30
40
50
rang du livre
150 000
Diversit(x)
100 000
Volum(x)
50 000
250
300
350
400
distance en mtres
150
200
Il serait intressant de comparer le ratio obtenu diversit/volume avec celui d'une bibliothque.
Je suppose que le dsir de trouver un livre concorde avec celui d'acheter un livre, i.e., si
un livre reprsente 0.1% des ventes il y a 0.1% de chances que ce soit le livre que je cherche.
Pour chacune des 16 sous-listes je calcule maintenant la probabilit pour un livre achet
d'appartenir cette liste. Sous l'hypothse prcdente, cette probabilit est la probabilit de
trouver le livre que l'on cherche et elle varie comme suit avec la distance:
Pertinence
probabilit de prsence
0.6
0.5
0.4
0.3
0.2
0.1
150
200
250
300
350
400
distance en mtres
Le livre recherch est moins de 300 mtres de chez soi avec 50% de
chance.
A 150 mres de chez soi, il y a dj 1 chance sur 3 de trouver le livre que l'on cherche.
3.4. Limitations du modle choisi. Le modle ci-dessus ne rend pas compte de la dynamique du march du livre, en eet:
L'ensemble des livres la vente volue: de 2013 2014 il y a eu 68000 nouvelles
publications et 38000 publications ont disparu, sur un total de 700000 publications.
les ventes de chaque livre varient vite: les premires ventes restent en haut du classe-
Le site www.edistat.com compile chaque semaine les ventes de tous les livres mais cette
donne n'est pas en libre accs. Elle permettrait une modlisation plus ne o l'achat de
livres de N habitants serait un processus stochastique temps discret (unit de temps = 1
semaine) dni comme suit:
Le nombre de livres achet chaque semaine est donne par:
chaque achat de livres est eectu de manire indpendante et suivant la loi de probabilit donne par les ventes de la semaine (probabilit d'achat de 0.001 pour un livre
qui reprsente 0.1% des ventes de la semaine).
Un tel modle conduirait une diversit plus grande et une pertinence a priori plus faible que
le modle choisi.
Mme si il est plus ran, le modle ci-dessus ne prend pas en compte plusieurs choses:
le nombre d'achats de livres par an est trs dirents suivant les personnes: 43% n'en
achtent aucun et 16% en achtent plus de 12, [4]
chaque lecteur a des prfrences: policiers, fantasy, etc... et ne suit donc pas la loi de
probabilit moyenne,
les lecteurs d'un mme foyer n'achtent a priori jamais deux fois le mme livre,
les achats de livres des habitants d'un mme quartier ne sont pas indpendants: plus
d'achats concernant la voile et la mer en Bretagne qu' Strasbourg, etc...
Pour prendre en compte les trois premires remarques il faudrait un modle bas sur l'achat de
chaque foyer, la rfrence [4] donne quelques lments pour une telle modlisation. Avec un tel
modle, plus prcis, nous obtiendrions une plus forte diversit de livres. La dernire remarque
semble plus dlicate intgrer au modle. Sa prise en compte diminuerait la diversit et
augmenterait la pertinence.
Au nal, notre modle sous-estime la diversit des livres, la courbe bleue du graphique
"Volume et diversit" doit tre interprt comme un nombre minimal de livres dirents. Il
n'est pas clair si notre modle sous-estime ou sur-estime la pertinence.
References
BM
[1]
ChiffresCles
[2]
ffresClesIdF
[3]
LivresAch
[4]
LivresPos
[5]
observatoire_de_la_lecture_publique_web/FR/syntheses_annuelles.awp
documents/chiffres\_cles\_livre\_sll\_2013\_2014.pdf
tableau/chap6/VI-2-3-Q62.pdf
tableau/chap6/VI-2-1-Q58.pdf
http://fr.calameo.com/read/