Académique Documents
Professionnel Documents
Culture Documents
Fabrice MAZEROLLE
Rsum du cours
Sommaire
Chapitre 1
Vocabulaire de la statistique descriptive
1 - Utilit de la statistique descriptive en conomie
A - Dfinition
B - Exemples d'utilisation
2 - Terminologie
A Population et units statistiques
B Echantillons et sous-ensembles dune population
C - Critres de classification
1) Critres quantitatifs
2) Critres qualitatifs
3 - Modes de regroupement des donnes
A - Srie simple
B - Distribution par valeurs ou par modalits
1) Distribution par valeurs
2) Distribution par modalits
C - Regroupement par catgories
1) Catgories de valeurs
2) Catgories de modalits
1 - Utilit de la statistique descriptive en conomie
A Dfinition
On divise gnralement l'tude de la statistique gnrale en deux parties :
La statistique descriptive, qui est un ensemble de mthodes permettant de dcrire
les units statistiques (voir la section 2 pour une dfinition plus prcise du terme
"units statistiques") qui composent une population (voir la section 2 pour une
dfinition plus prcise du terme "population").
La statistique mathmatique dont l'objet est de formuler des lois partir de
l'observation d'chantillons, c'est--dire de sous-ensemble d'une population
statistique (voir la section 2 pour une dfinition plus prcise du terme "population").
La statistique mathmatique intervient dans les enqutes et les sondages. Elle
s'appuie sur la statistique descriptive, mais aussi sur le calcul des probabilits.
On devra calculer ce chiffre pour tous les pays du tableau, ou seulement pour ceux
de lUE 27 et faire une la moyenne des rsultats obtenus. Ce qui permettra alors
de savoir quel est lcart de chaque pays par rapport cette moyenne, etc.
Plutt que de reprsenter le rsultat sous forme dun tableau on peut choisir une
reprsentation visuelle, par exemple une reprsentation en secteurs, dite aussi
parfois en camembert :
2 - Terminologie
A Population et units statistiques
En statistique, la population dsigne un ensemble d'units statistiques. Les units
statistiques sont les entits abstraites qui reprsentent des personnes, des
populations d'animaux ou des objets. Les premires populations ayant fait l'objet
dun recensement ayant t des populations humaines (d'o le lien troit entre
statistique et dmographie) on emploie frquemment le terme "individus" comme
synonyme de "units statistiques".
Source : http://www.insee.fr/fr/recensement/nouv_recens/resultats/grandes-villes.htm#L
Exemple 2 : Le tableau 1
statistiques.
10
Pour plus de dtails, voir le document de lINSEE, Le plan de sondage dans les communes de 10
000 habitants ou plus, INSEE Mthodes, Pour comprendre le recensement de la population, numro
hors srie.
11
12
C - Critres de classification
Nous avons vu dans lexemple prcdent que les units statistiques dune population
pouvaient tre regroupes suivant des critres ou dimensions. Ces critres sont
choisis en fonction de ce qui nous intresse. On parle de critre, mais aussi parfois
de dimension.
1) Critres quantitatifs
Les critres quantitatifs sont les critres qui sont reprsents par des chiffres.
Cest la raison pour laquelle on les appelle aussi parfois des variables. Les
variables prennent des valeurs.
Par exemple, dans le tableau 1 , on peut voir que la superficie est un critre de
classification quantitatif. Cest une variable qui dont les diffrentes occurrences
sont appeles valeurs. Chacune des 35 units statistiques de notre population est
ainsi caractrise par une valeur. La superficie est donc ici une variable qui prend
35 valeurs diffrentes. Cest un cas particulier dans lequel le nombre de valeurs de
la variable est gal au nombre des units statistiques de la population. Nous verrons
que dans des cas de ce type, ou bien lorsque le nombre de valeurs possibles, bien
quinfrieur au nombre dunits statistiques, est grand, un regroupement par classes
de valeurs peut tre utile.
Les critres quantitatifs ou variables permettent de faire des calculs. On peut
par exemple additionner les superficies, calculer des moyennes, etc.
13
Dans le tableau 1, la plupart des critres sont quantitatifs. On peut donc effectuer
des calculs sur les valeurs. Il ny a gure que la monnaie et le nom des pays qui ne
sont pas des critres quantitatifs. Ce sont des critres qualitatifs.
2) Critres qualitatifs
Les critres qualitatifs sont tous les critres qui ne sont pas reprsents de faon
numrique. On les appelle des caractres . Les caractres prennent
des
modalits.
Par exemple, dans le tableau 1, on peut voir que la monnaie utilise dans chaque
pays est un critre qualitatif qui possde 21 modalits. Ces modalits sont les
diffrentes monnaies. Il y a en effet 15 pays qui ont la modalit euro et les 20
autres qui ont chacun pour modalit une monnaie diffrente. On voit donc dans cette
exemple que le nombre de modalits (21) est infrieur celui de la population (35).
14
15
un
1) Catgories de valeurs
Prenons lexemple de la variable superficie dans le tableau 1. Un regroupement
des 35 units statistiques pour chacune des valeurs possibles de la variable
donnerait un tableau avec 35 valeurs, ce qui naurait aucun intrt. En revanche, on
peut crer des classes de valeurs pour les superficies et rpartir les 35 pays
lintrieur de ces classes. Comment procder sachant que le plus petit (Malte) na
quune superficie de 316 km2 et le plus grand pays (La Russie) a une superficie de
17 075 200 km2 ? Si lon regarde les superficies des diffrents pays, on voit quun
trs grand nombre de pays ont des superficies infrieures 600 000 km2. Pour le
faire apparatre, classons les pays par ordre croissant de superficies (voir le tableau
ci-aprs)
16
2) Catgories de modalits
Prenons lexemple du caractre pays dans le tableau 1. Un regroupement des
35 units statistiques pour chacune des modalits possibles du caractre donnerait
un tableau avec 35 modalits, ce qui naurait aucun intrt. En revanche, on peut
crer des classes de modalits pour les pays. On peut par exemple rpartir les 35
pays selon catgories propose par lOrganisation Mondiale du Commerce (voir
carte prcdente). Si lon regroupe nos 35 pays selon ces 6 catgories on obtient le
tableau suivant :
Regroupement des pays selon des catgories gographiques
A noter quil sagit bien dun regroupement par catgories de modalits car chaque
pays est en lui-mme une modalit.
Chapitre 2
Les tableaux statistiques
20
21
En outre :
22
23
Note : Certaines moyennes ne sont pas reportes (superficie, population) car la dispersion est trop
grande pour que la moyenne ait un sens.
4 -Tableaux croiss
A Dfinition et exemple
1) Dfinition
Les tableaux croiss sont appels ainsi car ils croisent deux distributions au sein
dun mme tableau. Les possibilits de croisement sont multiples. En fait, comme
lillustre le tableau synoptique ci-aprs, il y a 16 possibilits.
Diffrentes possibilits de croisement de 2 distributions
2) Exemple
a) Effectifs
Le tableau crois ci-aprs illustre le cas numro 6. Les variables Age mdian et
Indice de fcondit du tableau 1 ont en effet t regroupes par catgories de
valeurs puis croises dans le tableau. On a choisi de mettre les catgories dges
mdians en lignes et les catgories dindices de fcondit en colonne, mais linverse
aurait galement t possible sans que cela ne change la signification du tableau.
24
25
Notons bien que ce tableau crois contient leffectif des 35 pays. Autrement dit, si on
fait la somme des 9 chiffres contenus dans le tableau, on trouve leffectif total de la
population, soit 35.
b) Pourcentages
Ce tableau peut tre mis sous forme de pourcentages en divisant chacun des 9
chiffres par 35 et en multipliant par 100. On obtient alors une distribution croise des
35 pays en fonction de lge mdian et de lindice de fcondit, mais contrairement
au cas prcdent, cette distribution croise est exprime en en pourcentages
Tableau crois indice de fcondit/ge mdian - Pourcentages
B Distributions marginales
1) Dfinition
Lorsquon ajoute au tableau crois une colonne pour la somme des valeurs en ligne
et une ligne pour la somme des valeurs en colonnes, on appelle cette colonne et
cette ligne les distributions marginales.
26
2) Exemple
a) Effectifs
Reprenons le tableau crois indice de fcondit/ge mdian , mais ajoutons une
ligne et une colonne.
27
b) Pourcentages
La dernire ligne et la dernire colonne du tableau prcdent peuvent sexprimer en
pourcentage de la faon suivante :
C Distributions conditionnelles
1) Colonnes
a) Effectifs
Reprenons le tableau crois indice de fcondit/ge mdian , mais concentronsnous sur les diffrentes colonnes. Considrons par exemple la colonne des ges
mdians compris dans lintervalle [30-40[ :
Exemple de distribution conditionnelle en colonne (effectifs)
28
La distribution par catgories dge de fcondit des 20 pays dont lge mdian est
dans lintervalle [30-40 ans [est appele distribution conditionnelle en colonne.
Lexpression conditionnelle provient du fait que les 20 pays concerns sont une
sous-population de la population totale et que cette sous-population correspond
tous les pays qui rpondent la condition tre dans lintervalle [30-40[des ges
mdians .
On voit quil y a 3 distributions conditionnelles possibles puisquil y a 3 catgories
dges mdians.
b) Pourcentages
Leffectif de la distribution conditionnelle prcdente est de 20. Il est distribu selon
les 3 catgories dindices de fcondit. Si lon fait abstraction du reste du tableau, on
peut diviser chacun des chiffres de cette colonne par 20 et le multiplier par 100 de
faon exprimer la distribution conditionnelle en pourcentages. On aura alors :
b) Pourcentages
Suivant le mme principe que pour les distributions conditionnelles en colonne, on
peut transformer les distributions deffectifs en distribution de pourcentages en
divisant les chiffres de chaque ligne par le total de la ligne. On obtient alors le
tableau suivant des distributions conditionnelles en colonnes en pourcentages.
Les 3 distributions conditionnelles en ligne (pourcentages)
30
31
Une dernire remarque : bien quil soit possible deffectuer des calculs de
statistiques rsumes sur les donnes groupes en catgories, cest dconseill de
3
Il existe aussi des statistiques qui rsument la forme dune distribution, mais celles-ci ne sont
plus gure utilises aujourdhui dans la mesure o il est plus facile dobserver directement le
graphique dune distribution pour en apprcier la forme.
32
33
Nous voyons alors plus facilement quels sont les deux modes de la srie.
B - La moyenne arithmtique
Le mot moyenne a pour origine le latin "mdius, mot signifiant "qui est au milieu".
"Mdius" est aussi l'origine du mot "mdiane". Pourtant, en statistique, les deux mots
conduisent des dfinitions diffrentes. Ceci nous laisse supposer que la notion de
milieu n'est pas toujours facile dfinir.
1) La moyenne arithmtique simple
La moyenne arithmtique d'une srie ou moyenne arithmtique simple se
calcule par une formule qui est donne par l'expression :
(1)
34
Les diffrences entre la formule de la moyenne donne en (1) et celle donne en (2)
sont importantes noter, quoique les deux formules donnent ncessairement le
mme rsultat.
La premire diffrence tient au fait que dans la formule (1) la somme se fait
sur les n units statistiques, alors que dans la formule (2) la somme se fait sur
les k valeurs.
La seconde diffrence tient au fait que dans la formule (1), chaque lment
additionn compte pour un, c'est--dire que la pondration est de 1. Dans la
formule 2, les pondrations sont diffrentes. La formule (1) est en fait un cas
particulier de la formule (2). En effet si n = k et que ni = 1 pour i = 1 k alors
les deux formules sont identiques.
35
Effectifs
4
6
On peut calculer les frquences associes chaque modalit. On voit alors que la
modalit la plus frquente est "F" (0,6 contre 0,4 pour la modalit "H"). Mais la notion
de moyenne arithmtique n'a pas de sens pour un caractre.
3) Calcul de la moyenne sur des donnes catgorielles
Ainsi que prcis dans lintroduction cette section consacre la moyenne, il faut
tout prix viter de procder ce type de calcul. Nous ne le donnons ici qu titre
dinformation. Lorsque l'on a une distribution par classes de valeurs, la moyenne se
calcule en prenant la formule de la moyenne pondre et en remplaant dans cette
formule "xi" par "ci", o ci reprsente le centre de la classe i, cest--dire la
moyenne arithmtique des extrmits de classe. A dfaut d'avoir une valeur xi on
prend "ci". Ceci explique que le calcul de la moyenne donne un rsultat imprcis. On
va le voir dans les deux exemples suivants :
Soit la srie dj utilise prcdemment : {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1,
3, 3, 4, 5}. Nous savons que la moyenne arithmtique simple applique cette srie
est :
ni
4
10
6
36
Pour calculer la moyenne, nous devons dterminer les centres de classe, puis faire
la somme des "ni x ci" et diviser par n. Autrement dit, nous devons appliquer la
formule :
Classes
ni
[0-2[
[2- 4[
[4- 6]
4
10
6
ci (moyenne des
extrmits de
classe)
1
3
5
ni x ci
4
30
30
64
Et finalement :
Nous avons donc une marge d'erreur non ngligeable par rapport la vraie
moyenne, savoir 2,7. La marge d'erreur en pourcentage est donne par :
ni
14
6
ci
2
5
ni x ci
28
30
58
37
On voit donc que chaque fois que l'on change les classes ou que l'on modifie leur
amplitude, on exerce un effet sur la moyenne par le jeu de la modification des
centres de classe. Il est donc facile de manipuler la moyenne en choisissant les
amplitudes de classe. C'est pourquoi il est recommand de ne calculer la
moyenne partir des centres de classe que lorsqu'on ne peut pas faire
autrement, c'est--dire lorsque l'on ne dispose pas des donnes brutes.
C - La mdiane
1) Origine du mot, sens gomtrique
Le mot mdiane a pour origine le latin mdius, mot signifiant qui est au
milieu . Mdius est aussi l'origine du mot "moyenne". Pourtant, en statistique,
les deux mots conduisent des dfinitions diffrentes. Ceci nous laisse supposer
que la notion de milieu n'est pas toujours facile dfinir.
Avant d'avoir une dfinition statistique, la mdiane a d'abord une dfinition
gomtrique. On dfinit ainsi, par exemple, les mdianes d'un triangle. Une mdiane
d'un triangle est une droite qui joint un sommet au milieu du ct oppos. Il y a donc
3 mdianes par triangle.
38
3) Mthode de calcul
a) n est pair
Dans ce cas la mdiane est gale la moyenne arithmtique de a(k) et de
a(k+1) o k est tel que n = 2k et o a(k) et a(k+1) sont les valeurs associes k
et k+1
Exemple : si l'on prend la srie S = {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4,
5}.
On a donc le tableau suivant (o les valeurs sont classes par ordre croissant):
Puisque n=20, n est pair. Donc n= 2k implique 20 = 2k soit k = 10 et k+1 = 11. Les
valeurs associes sont a(k) = 3 et a(k+1) = 3. Par consquent :
Me = [a(k)+a(k+1)]/2=(3+3)/2=3
39
On peut aussi appliquer la formule propose par le tableur EXCEL ( cf. la notice
technique sur le site de Microsoft : http://support.microsoft.com/kb/103493/fr 4.
Dans ce cas, on doit calculer Me de la faon suivante :
Me = a(k) + [ f x [ a(k+1) - a(k)] ]
g = [(1/2)(20-1)]+1=10,5
Me = 3 + [0,5(3-3)] = 3
40
b) n est impair
Dans ce cas la mdiane est gale a(k+1) o k est dfini par 2k+1 = n et o
a(k+1) est la valeur associe k+1
Exemple : si l'on prend la srie prcdente mais que l'on enlve le 20me lment, on
alors la srie { 4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4 } ou n = 19 et le
tableau suivant (o les valeurs sont classes par ordre croissant) :
41
Ces deux valeurs donnent immdiatement une certaine ide de la dispersion. On voit
par exemple que les carts entre les superficies des pays, de mme que lcart entre
les populations sont trs importants.
2) Intervalle de variation (ou tendue )
Lintervalle de variation (IV) ou ltendue de la srie est simplement une faon de
rsumer le minimum et le maximum de la srie en un seul chiffre. On lobtient ainsi :
Intervalle de variation de la srie = valeur maximale Valeur minimale
Dans le tableau ci-aprs, lintervalle de variation a t ajout sur la dernire ligne
pour les 8 sries :
Tableau de statistiques rsumes pour certaines des variables du tableau 1
42
3) Rapport de variation
Le rapport de variation est simplement le rapport de la valeur maximale la valeur
minimale. Ainsi, si lon divise le PIB par habitant maximum par le PIB par habitant
minimum en 2006, on obtient :
43
44
45
3) Intervalle interquartile
L'intervalle interquartile (IIQ) est la diffrence entre le troisime quartile et le
premier quartile. Il s'crit :
IIQ = Q3 - Q1
L'intervalle interquartile sert apprcier la dispersion de la srie, de faon absolue,
ou bien par comparaison avec une autre srie ( condition que les valeurs de lautre
srie soient exprimes dans la mme unit). En effet, les valeurs Q1 et Q3 dlimitent
une plage au sein de laquelle environ6 50% des valeurs de la srie sont
concentres. Plus cet intervalle est large, plus la srie est disperse. Dans
lexemple que nous avons utilis, lIIQ est gal 4-2 = 2.
46
47
O :
Nous donnons ici la formule de la variance des valeurs associes aux units statistiques dune
population et non la variance dun chantillon de cette population, dont la dfinition est lgrement
diffrente. En effet, pour calculer la variance dun chantillon, on divise par n-1 au lieu de diviser par
n, mais dans ce cas le n de lchantillon est videmment beaucoup plus petit que le n de la
population et lon diffrencie alors les deux en dsignant par N le nombre dunits statistiques de la
population et par n le nombre dunits statistiques de lchantillon. De plus, si lon veut extraire
plusieurs chantillons de la population, on est amen rajouter un indice aux n pour les distinguer (on
prendra alors lindice j puisque lindice i est dj utilis pour dsigner les units statistiques ellesmmes).
48
b) Exemple
Soit la srie S = {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4, 5} ou n=20. Pour
calculer la variance de cette srie, on procde ainsi :
Toujours se ramener une srie :par exemple, si au lieu davoir une srie
on avait la distribution suivante :
On obtient ainsi une srie qui comprend des valeurs ngatives (car certaines
valeurs de la variable sont infrieures la moyenne et donc si on retranche la
moyenne elles deviennent ngatives) et des valeurs positives (car certaines
valeurs de la variable sont suprieures la moyenne et donc si on retranche
la moyenne elles restent positives).
Diviser ensuite ce total par n, pour avoir en fait une sorte de moyenne. Cest
pour cela que lon dit que la variance nest finalement que la moyenne du
carr des carts la moyenne . Et lon obtient la variance de notre srie de
chiffres, soit ici :
49
c) Utilit de la variance
La variance nest pas dune grande utilit en soi. On peut seulement dire que plus
elle est leve, plus la dispersion autour de la moyenne est leve. Mais comme les
carts la moyenne ont t levs au carr, le chiffre obtenu, quoiquexprim dans
lunit de la variable, est gnralement assez lev et encombrant . Cest
pourquoi, on utilise surtout la variance comme calcul intermdiaire pour obtenir
lcart-type et le coefficient de variation.
50
2) Lcart-type
a) Dfinition
La dfinition de lcart-type dune srie de chiffres est donne par la formule :
c) Utilit de lcart-type
De faon gnrale :
si lcart-type est faible, cela signifie que les valeurs sont assez concentres
autour de la moyenne.
si lcart-type est lev, cela veut dire au contraire que les valeurs sont plus
disperses autour de la moyenne.
Exemple : Dans une usine, le fait davoir un cart-type aussi bas que possible peut
constituer un objectif de contrle de qualit. Soit une entreprise qui fabrique un
certain composant et quun des lments du contrle de la qualit consiste
mesurer le diamtre du composant. Chaque composant aura donc son diamtre
mesur. On calculera ensuite le diamtre moyen, puis lcart-type. Si lcart-type est
faible, cela signifie que les pices ont dans lensemble un diamtre proche de la
moyenne, donc que leur diamtre se ressemble. la limite, un cart-type nul signifie
que toutes les pices ont le mme diamtre. Inversement, plus lcart-type est lev,
plus il y a de pices dont le diamtre scarte de la moyenne et qui risque de ne pas
cadrer avec le systme auxquelles elles sont destines.
51
Une autre utilit de lcart-type est de servir de bornes. On regardera par exemple
combien de valeurs de la srie sont comprises dans lintervalle dfini par :
52
3) Le coefficient de variation
Lcart-type est un outil intressant pour mesurer la dispersion dune srie, ainsi que
nous venons de le voir. Mais il possde une limite : Il est est exprim dans lunit
de la variable dont il mesure la dispersion des valeurs.
Ainsi, par exemple, si on veut comparer les dispersions de deux sries qui sont
exprimes dans des units diffrentes, on ne peut pas.
Le tableau de statistiques rsumes ci-aprs donne lcart-type de certaines des
variables du tableau 1. On peut regarder chaque cart-type et constater quil est
lev ou pas, mais on ne pourrait comparer chaque cart-type qu un autre carttype exprim dans la mme unit.
Par exemple, si lon avait aussi la srie des ges mdians de lanne 1997 pour les
mmes 35 pays, on pourrait regarder si la dispersion a augment ou diminu en 10
ans, car les deux cart-types seraient exprims dans la mme unit (lanne).
Par contre, on ne peut pas dire, en regardant lcart-type des densits par habitant
en 2006 (qui est de 138) que la distribution de valeurs est plus groupe autour de la
moyenne que dans le cas des PIB par habitant de 2006, dont lcart-type est
pourtant beaucoup plus lev (17 239). Car comme les deux sries sont exprimes
dans des units diffrentes, elles ne sont pas comparables.
Tableau de statistiques rsumes pour certaines des variables du tableau 1
53
54
55
Fichier EXCEL
Par consquent, on a :
Q1 = moyenne entre la pe et la (p+1)e valeur =(2+2)/2=2
Q2 = Me = moyenne entre la (2p)e valeur et la (2p+1)e valeur = (3+3)/2=3
Q3 = moyenne entre la (3p)e valeur et la (3p+1)e valeur = (4+4)/2=4
Les 4 groupes de valeurs sont : {{0, 1, 1, 1, 2}, {2, 2, 2, 2, 3}, {3, 3, 3, 3, 4}, {4, 4, 4, 5,
5}}
b) Cas o n = 4p + 1
Dans ce cas, le reste de la division par 4 est 1 et l'on a :
Q1 = moyenne entre la pe et la (p+1)e valeur.
Q2 = (2p+1)e valeur.
Q3 = moyenne entre la (3p+1)e valeur et la (3p+2)e valeur.
Exemple : si l'on prend la srie
n =17 et n = 4p + 1, avec p = 4.
{4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3} on a
56
Fichier EXCEL
Par consquent, on a :
Q1 = moyenne entre la pe et la (p+1)e valeur = (1+2)/2=1,5
Q2 = (2p+1)e valeur = 2
Q3 = moyenne entre la (3p+1)e valeur et la (3p+2)e valeur=(3+4)/2=3,5
Les 4 groupes de valeurs sont : {{0, 1, 1, 1}, {2, 2, 2, 2}, 2, {3, 3, 3, 3}, {4, 4, 4, 5}}
On a exclu Q2=Me pour obtenir 4 groupes gaux.
c) Cas o n = 4p + 2
Dans ce cas, le reste de la division par 4 est 2 et l'on a :
Q1 =(p+1)e valeur.
Q2 = moyenne entre la (2p+1)e valeur et la (2p+2)e valeur.
Q3 = (3p+2)e valeur
Exemple : si l'on prend la srie {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3}, on a
n=18 et n = 4p+2, avec p= 4.
57
Fichier EXCEL
Par consquent, on a :
Q1 =(p+1)e valeur = 2
Q2 = moyenne entre la (2p+1)e valeur et la (2p+2)e valeur = (2+3)/2=2,5
Q3 = (3p+2)e valeur =3
Les 4 groupes de valeurs sont : {{0, 1, 1, 1}, 2, {2, 2, 2, 2}, {3, 3, 3, 3}, 3, {4, 4, 4, 5}}
On a exclu Q1 et Q3 pour obtenir 4 groupes gaux.
d) Cas o n = 4p + 3
Dans ce cas, le reste de la division par 4 est 3 et l'on a :
Q1 =(p+1)e valeur.
Q2 = (2p+2)e valeur.
Q3 = (3p+3)e valeur.
Exemple : si l'on prend la srie {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4} on
a n=19 et n = 4p+3, avec p= 4.
58
Fichier EXCEL
Par consquent, on a :
Q1 =(p+1)e valeur = 2
Q2 = (2p+2)e valeur = 3
Q3 = (3p+3)e valeur = 4
Les 4 groupes de valeurs sont : {{0, 1, 1, 1}, 2, {2, 2, 2, 2}, 3, {3, 3, 3, 3}, 4, {4, 4, 4,
5}}
On a exclu Q1, Q2 et Q3 pour obtenir 4 groupes gaux.
59
Tableau rcapitulatif
Fichier EXCEL
60
Chapitre 4
Indices et progressions
1 Indices
A Dfinitions
1) Nombre indice
2) Srie indice
B Indice temporel et indice de situation
1) Indice temporel
2) Indice de situation
C Indice lmentaire et indice synthtique
1) Indice lmentaire
2) Indice synthtique
D Indice dvolution de la valeur dun panier de biens
1) Dfinition de la valeur dun panier de biens
2) Indice de LASPEYRES
a) Indice dvolution des prix
b) Indice dvolution des quantits
2 Progressions
A Variation absolue
B Taux de croissance sur une priode
C Taux de croissance sur plusieurs priodes
1) Formule directe (en passant par laccroissement global)
2) Formule indirecte (en passant par les accroissements successifs)
3) Exemple numrique
4) Lien avec la moyenne gomtrique
D Taux de croissance du produit de 2 valeurs
E Taux de croissance du rapport de 2 valeurs
F Complments
1) Augmentations et/ou diminutions successives
2) Augmentation en % suivie dune diminution identique en pourcentage
3) Temps de doublement dune grandeur
4) Exemple dutilisation en conomie
Nous avons vu au chapitre 2 que les chiffres dune srie pouvaient tre prsents
sous forme deffectifs, de pourcentages et de pourcentages cumuls. Mais ce nest
pas tout : les chiffres dune srie peuvent aussi tre mis sous forme dindices. De
plus, il est frquent que lon souhaite tudier une srie dont les valeurs changent au
cours du temps ou bien, plus simplement, que les valeurs dune seule srie
correspondent diffrentes valeurs dans le temps (il sagit alors dune srie
chronologique). Dans ces deux cas, le calcul dun indicateur de progression (taux
de variation, taux de croissance) va permettre de rsumer lvolution avec un seul
chiffre. Les indices et les progressions sont aussi utiliss pour comparer des
situations (gnralement deux sries dont les valeurs changent selon le lieu).
61
1 - Indices
A - Dfinition
1) Nombre indice
Un nombre indice est une mesure de la variation dune grandeur compare une
valeur de rfrence gale 100 et appele base .
Exemple : En dcembre 2007, l'Indice des prix la consommation de l'INSEE (IPC),
base 100 en 1998, s'tablissait ainsi :
Source : http://www.insee.fr/fr/indicateur/indic_conj/indconj_frame.asp?ind_id=29 .
La valeur de rfrence est ici la valeur 100 en 1998. A partir de ce tableau, on peut
voir que :
les prix ont augment de 17,70% entre 1998 et 2007 (en 10 ans)
les prix ont augment de 117,26-114,73=2,53% entre dcembre 2006 et
novembre 2007 (en 1 an)
Les prix ont augment de 117,7-117,26=0,44% entre novembre 2007 et
dcembre 2007 (en un mois)
Certains indices ne sont pas exprims par rapport une base 100, mais par rapport
une base 1. C'est le cas de l' indice S.I.E.R
Exemple : Lindice de trafic routier en le de France, dit indice S.I.E.R . (Service
Interdpartemental d'Exploitation Routire) est gal 1 quand le trafic est fluide,
cest--dire quand il faut en moyenne 1 minute pour faire un km. Si lindice est gal
2, cela signifie que les temps de parcours sur le rseau sont deux fois plus longs que
si le trafic est fluide. Sil est gal 3, ils sont 3 fois plus longs et ainsi de suite.
(Source : www.sytadin.equipement.gouv.fr ).
2) Srie indice
Une srie indice est une srie divise par une de ses valeurs et ventuellement
multiplie par 100.
Exemple : Soit la srie S1 = {1, 3, 7, 4, 8, 6, 11, 9}
Pour transformer cette srie en sri indice, nous allons diviser chaque lment de la
srie par l'un des lments, par exemple 7 (troisime lment) et ensuite multiplier
chaque lment par 100. On obtient alors :
I1 = {14,3 ; 42,9 ; 100 ; 57,1 ; 114,3 ; 85,7 ; 157,1 ; 128,6}
62
I1 est une srie indice. Sa base "100" est le troisime lment de la srie. On voit
ainsi que le choix de la "base" est arbitraire. On aurait pu aussi diviser par le premier
lment de la srie. Mais plutt que de partir de la srie initiale S1, on peut aussi
partir de I1 et diviser chaque lment par 14,3 et multiplier par 100. On a alors
effectu un changement de base, la nouvelle base tant le premier lment de la
srie.
I2 = [I1/I1(1)]*100 = {100, 300, 700, 400, 800, 600, 1100, 900}
Les deux graphiques ci-dessous, du type "nuages de points relis" reprsentent
respectivement les sries indices I1 et I2. On remarque que le changement de base
na pas dincidence sur la forme de la courbe, mais seulement sur les valeurs
indiques par lchelle de lordonne (la position relative de ces valeurs les unes par
rapport aux autres sur l'chelle demeurant inchange).
63
2) Indice synthtique
Un indice synthtique est un indice qui rsume lvolution de plusieurs grandeurs :
plusieurs prix, plusieurs quantits, plusieurs valeurs (prix x quantits), etc.
Exemple : Le prix dun bien x est gal 1,7 euros la date 0. la date t, il est gal
2,5 euros. Le prix dun bien y est gal 3 euros la date 0 et 2 euros la date t.
Les donnes sont rsumes dans le tableau ci-aprs :
Dates
Biens
1,7
2,5
Nous pouvons calculer les indices lmentaires dvolution des prix du bien x et du
bien y. Mais nous pouvons aussi calculer lindice synthtique dvolution du prix des
deux biens. Pour calculer cet indice synthtique, nous allons faire une moyenne
arithmtique de chacun des indices lmentaires.
64
Biens
x
y
Indice lmentaire
1,7
3
2,5
2
147,06
66,67
coefficients
de
Indice * Coefficient
pondration
0,5
73,53
0,5
33,33
Indice synthtique 106,86
La colonne "indices lmentaires" est obtenue en divisant les prix en t par les prix en
0 et en multipliant ce rapport par 100 :
Ixt/0 = Indice lmentaire du prix de x = (2,5/1,7)*100=147,06
Iyt/0 = Indice lmentaire du prix de y = (2/3)*100= 66,67
Pour obtenir l'indice synthtique de l'volution du prix des deux biens, on fait la
moyenne des deux indices :
It/0 = Indice synthtique = (147,06 * 0,5) + (66,67*0,5)= 73,53+33,3=106,86
Lorsque l'on fait une moyenne simple, on suppose que la contribution de chaque
bien l'volution totale est la mme. En ralit cela revient attribuer un coefficient
1/2 chaque bien. Si l'on dsigne par x le coefficient de pondration de x et par y
le coefficient de pondration de y on aura x = 0,5 et y =0,5 et donc x + y = 1.
L'indice synthtique d'volution du prix des deux biens pourra alors s'crire :
Cependant, nous pouvons choisir de pondrer chaque bien par des coefficients x et
y diffrents de mais toujours tels que x + y = 1. Si l'on prend par exemple x =
1/4 et y = 3/4, on obtient :
65
S'il y a n produits dans le panier (i= 1 n), la valeur totale du panier la date t
scrira :
Exemple : soit le tableau suivant qui donne le prix unitaire en euros et les quantits
de 3 biens la date t :
Produit 1
Produit 2
Produit 3
pti
15
7
3
qti
3
9
11
66
On voit ainsi que si les prix ne changent pas entre 0 et t (cest--dire si pti = p0i ),
lindice synthtique de LASPEYRES des prix demeure gal 100. Pour comprendre
la signification de cet indice et voir comment on le calcule, prenons un exemple
concret.
67
Exemple : Soit le tableau ci-aprs, qui donne les prix et les quantits de deux
produits 1 et 2, aux dates 0 et t. On peut supposer que le produit 1 est un pantalon et
le produit 2 un tee shirt (voir le fichier EXCEL).
Date 0
1
Date t
1
Produit 1
p0 =15
q0 =3
pt =22
qt1=10
Produit 2
p02=7
q02=9
pt2=5
qt2=8
Dans cet exemple, le prix du bien 1 (pantalon) augmente (de 15 22 euros) tandis
que celui du bien 2 (tee shirts) baisse (de 7 5 euros).
Mais les quantits aussi ont chang. Pour diverses raisons, les gens ont achet plus
de pantalons et moins de tee-shirts. Il n'est pas ncessaire que ces quantits
voluent en sens inverse des prix car il ne s'agit pas dune relation instantane, mais
d'une volution dans le temps. Pour mesurer l'volution des prix, LASPEYRES
suppose donc que les quantits ne changent pas. Il pose la question : quelle serait
l'volution de la valeur de ce panier si les quantits n'avaient pas chang ?
Pour rpondre cette question et savoir si l'indice synthtique des prix ainsi dfini
augmente ou baisse, appliquons la formule de LASPEYRES d'volution des prix :
On enregistre donc une volution des prix du panier de bien de 2,8 % selon la
formule de LASPEYRES.
b) Indice d'volution des quantits
Lindice de LASPEYRES des quantits mesure lvolution, entre deux dates 0 et t,
des quantits des biens qui composent un panier, en prenant comme rfrence la
valeur du panier la date initiale (t=0) et en supposant que les prix des biens dans le
panier nont pas vari entre 0 et t.
Sa dfinition est la suivante :
On voit ainsi que si les quantits ne changent pas entre 0 et t (cest--dire si qti =
q0i), lindice synthtique de LASPEYRES des quantits demeure gal 100. Pour
comprendre la signification de cet indice et voir comment on le calcule, prenons un
exemple concret.
68
Exemple : reprenons le tableau prcdent, qui donne les prix et les quantits de
deux produits 1 et 2, aux dates 0 et t voir le fichier EXCEL).
Date 0
Date t
Produit 1 p01=15
q01=3
pt1=22
qt1=10
Produit 2 p02=7
q02=9
pt2=5
qt2=8
Dans cet exemple, la quantit du bien 1 augmente (de 3 10 units) tandis que
celle du bien 2 baisse (de 9 8 units). Pour savoir si l'indice synthtique des
volumes augmente ou baisse, appliquons la formule de LASPEYRES d'volution des
quantits :
On enregistre donc une volution des volumes du panier de bien de 90,74 % selon la
formule de LASPEYRES.
3) Indice des prix de l'INSEE
Lun des indices synthtiques les plus connus et les plus utiliss est lindice des prix
la consommation (IPC) publi chaque mois par lINSEE. L'IPC permet de mesurer
l'inflation, cest--dire la variation du niveau gnral des prix des biens et des
services consomms par les mnages sur le territoire franais entre deux priodes
donnes. C'est une mesure synthtique des volutions de prix qualit constante.
Pour le calculer, lINSEE applique la formule de lindice de LASPEYRES des prix
un chantillon de quelques 21000 indices lmentaires. Ces 21000 indices
lmentaires sont calculs partir de prix recueillis dans 106 agglomrations de plus
de 2000 habitants rparties sur tout le territoire. Lindice couvre plus de 1000 varits
de produits, regroupes en 161 groupes. Pour viter toute tentative de manipulation
des prix, la liste prcise de ces 1000 varits de produits reste confidentielle.
Actuellement, la priode de rfrence, ou base de lIPC, est 1998. Ci-aprs, le
camembert qui donne la structure des pondrations par grandes catgories de
consommation.
69
70
71
72
2 - Progressions
Soit la valeur numrique V au temps t qui s'crit respectivement V0 quand t=0, V1
quand t=1 et Vt quand t est une date quelconque.
A - Variation absolue
La variation absolue de la valeur V entre le temps 0 et le temps t s'crit :
Exemple : Soit V0 = 2 104 967 fin novembre 2006 le nombre de chmeurs (de
catgorie 1, c'est--dire ceux qui recherchent un emploi temps plein, en contrat
dure indtermine et qui n'ont pas travaill plus de 78 heures au cours du mois- les
demandeurs d'emploi peuvent en effet avoir une activit rduite tout en restant
inscrits pour viter un loignement du march du travail) en France et V1 = 1 907
100 ce nombre fin novembre 2007 (ce sont les chiffres donns par le Ministre du
travail, des relations sociales et de la solidarit : http://www.travailsolidarite.gouv.fr/etudes-recherche-statistiques-dares/statistiques/chomage/lesindicateurs-conjoncturels/les-dernieres-statistiques-mensuelles-novembre-20077187.html ).
Le taux de variation entre fin novembre 2006 et fin novembre 2007 est alors gal :
V1 -V0= 1 907 100 - 2 104 967 = - 197 867
B - Taux de croissance sur une priode
Le taux de croissance sur une priode de la valeur V entre t = 0 (date du dbut de la
priode) et t =1 (date de fin de la priode) s'crit :
73
Et ainsi de suite pour les autres priodes jusqu' la priode t pour laquelle on aura :
74
Or :
Donc, en remplaant :
75
3) Exemple numrique
Soit une entreprise dont le chiffre d'affaires en euros de 2001 2007 est donn par
le tableau ci-dessous : (Fichier EXCEL)
Annes
2003
V0
Chiffre
d'affaires
210000
2004
V1
280000
2005
V2
330000
2006
V3
450000
2007
V4
500000
a) Calcul du taux de croissance moyen par la formule directe (en passant par
l'accroissement global) :
Ici, on pose par exemple V0 = 210000, V1 = 280000, V2= 330000, V3= 450000 et V4 =
500000.
(Fichier EXCEL)
Soit un taux de croissance moyen gal 24,2%.
b) Calcul du taux de croissance moyen par la formule indirecte (en passant par
les accroissements successifs) :
Calculons le taux de croissance annuel du CA entre 2003 et 2004, puis entre 2004 et
2005, 2005-06 et enfin 2006-07. Nous allons ainsi avoir 4 taux de croissance g1, g2,
g3 et g4. Le tableau ci-dessous rsume les calculs :
gi
1+gi
2003- 04
g1
0,33333333 1,33333333
2004- 05
g2
0,17857143 1,17857143
2005- 06
g3
0,36363636 1,36363636
2006- 07
g4
0,11111111 1,11111111
(Fichier EXCEL)
76
Cette formule est un cas particulier pour n=4 de la formule plus gnrale de la
moyenne gomtrique simple d'une srie dfinie par les termes {(1+g1), (1+g2),
(1+g3), ......., (1+gn)} :
77
p est le prix d'un produit quelconque et q sa quantit. Dans ce cas, si le prix varie et
que la quantit varie aussi, on peut souhaiter calculer le taux de croissance du
produit des deux, c'est--dire le taux de croissance de la recette totale.
Soient le prix pt et la quantit qt. L'volution du prix pt et de la quantit qt par rapport
la priode prcdente peut s'exprimer ainsi :
pt =(1+gp)pt-1
qt =(1+gq)qt-1
o gp et gq sont les taux de croissance respectivement du prix et de la quantit entre
t -1 et t.
Partant de ces deux expressions, la recette totale en t s'crit alors :
RTt= pt qt =(1 + gp)(1 + gq)pt-1 qt-1 = (1 + gp)(1 + gq)RTt-1
On en dduit son taux de croissance entre t-1 et t :
gRT=(RTt/RTt-1) -1=(1 + gp)(1 + gq)-1
Exemple : Un commerant augmente le prix d'un produit de 1% (gp = 0,01). la
suite de cette augmentation, la quantit vendue baisse de 4% (gq=-0,04). Pour
connatre l'volution de la recette totale, on va calculer son taux de croissance
partir de la formule prcdente:
gRT = (RTt / RTt-1) -1=(1 + gp)(1 + gq) -1
gRT = (1 + 0,01)(1 - 0,04) - 1 =(1,01 x 0,96) - 1 = 0,9696 - 1 = -0,0304
La recette totale a diminu de 3,04% la suite de la hausse du prix de 1% et de la
baisse de la quantit de 4%.
78
79
F - Complments
1) Augmentations (diminutions) successives
Lorsque qu'une grandeur crot successivement des taux diffrents chaque
priode et que l'on veut connatre la valeur de la grandeur au terme des
augmentations ou diminutions successives on applique la formule suivante :
Donc :
80
Exemple : si l'on part de V0=10 et que l'on applique une diminution de 10%, on
obtient V1= 9. Si l'on applique une augmentation de 10% V1, on obtient
V2=9(1+0,1)=9 x 1,1 = 9,9.
3) Temps de doublement d'une grandeur
Le temps de doublement d'une grandeur qui crot un taux moyen constant se
calcule en appliquant la formule :
Il faut donc 14 ans plus 0,2 x 12 mois = 2,4 mois pour qu'un capital plac 5% l'an
double. C'est--dire 14 ans, 2 mois et 0,4 x 30 jours = 12 jours. Soit 14 ans, 2 mois et
12 jours.
4) Exemple d'utilisation en conomie
Les taux de croissance, et en particulier les taux de croissance annuels moyens,
sont trs utiliss en conomie. On les reprsente parfois sous la forme de
graphiques, comme dans l'exemple ci-dessous, tir du site Internet de l'organisation
mondiale du commerce, qui donne les taux de croissance du commerce mondial et
de la production, par priodes. Le graphique illustre un point qui est frquemment
soulign : le commerce mondial est plus dynamique que la production. Il a un taux
de croissance annuel moyen plus rapide.
81
Chapitre 5
Diagrammes et graphiques
1 Utilit des graphiques
A Qualits dun bon graphique
B Quartet dANSCOMBE
2 Les chelles graphiques
A Echelles numriques
B Echelle catgorielles
1) catgories numriques
2) catgories nominales
C Echelles ordinales
D Echelles verticales doubles
E Echelles logarithmiques
1) Dfinition
2) Calcul pratique du log dcimal dun nombre
3) Rappels sur le log dcimal
4) Exemples
a) Lchelle log pour mieux voir les diffrences de progression
b) Lchelle log linarise les volutions taux constant
3 Diagrammes
A - Pictogramme
B - Cartogramme
C Diagramme de GANTT
4 Graphiques usuels
A - Graphique en barres
1) Barres verticales
a) Simples
b) Multiples
c) Trononnes
2) Barres horizontales
a) Simples
b) Multiples
c) Trononnes
B Courbes et aires
1) Courbe simple
2) Courbes multiples
3) Aires dlimites par des courbes
C - Graphique de dispersion ou nuage de points
D - Secteurs
1) Secteurs 360 degrs
2) Secteurs 180 degrs
3) Mthode de construction
a) 360 degrs
b) 180 degrs
4) Anneaux
a) Simples
b) concentriques
82
5 Autres graphiques
A Graphiques en radar et toiles daraigne
1) Radar
2) Toile daraigne
B Graphique bulles
C Graphiques boursiers
D Graphique de TUKEY
E Graphiques panachs
1) Secteur complt par une barre trononne
2) Graphique de PARETO
a) De la loi de Pareto au graphique de Pareto
b) Dfinition, construction, exemple et interprtation
c) Interprtation
F Histogramme
1) amplitudes de classes identiques
a) Histogramme deffectifs
b) Histogramme de frquences
2) Amplitudes de classes diffrentes
a) Histogramme deffectifs
b) Histogramme de frquences
G Pyramide des ges
H Graphique en cascade
I Graphique en trois dimensions
1) Graphique en 2D avec ajout de profondeur
2) Graphique en barres avec 3 dimensions relles
83
B Quartet dANSCOMBE
Les graphiques rvlent des informations sur la forme des sries que les
tableaux et les statistiques rsumes ne peuvent pas toujours montrer. La meilleure
illustration en est le quartet dANSCOMBE.
Dans le tableau ci-aprs les quatre 4 paires de sries diffrentes de 11 chiffres ont
toutes les mmes statistiques rsumes. La moyenne des X est gale 9 et leur
cart-type est 1,94 pour les 4 sries de X. La moyenne des Y est gale 7,5 et leur
cart-type 1,94 pour les 4 sries de Y. Sans les quatre graphiques ci-aprs, on
pourrait dduire de faon errone que comme les 4 paires de sries ont la mme
moyenne et la mme dispersion (en outre, elles ont le mme coefficient de
corrlation et la mme droite de rgression Y = 3 + 0,5 X [sur le calcul de la droite de
rgression voir le chapitre 6]), elles sont trs semblables. Or, comme le montrent les
4 graphiques dits nuages de points qui leurs sont associes, elles ont des formes
trs diffrentes. Et ceci confirme ladage qui dit que un beau graphique vaut mieux
quun long discours !
TUFTE, Edward (2001), The Visual Display of Quantitative Information , Graphics Press. Voir le site
internet de Edward TUFTE, page 13.
84
Quartet dANSCOMBE
Source des chiffres : F.J. ANSCOMBE, Graphs in Statistical Analysis, American Statistician, 27 fvrier 1973, pages 17-21.
Ce qui nous intresse dans un premier temps ce sont les diffrentes sortes
dchelles propres ce type de reprsentations graphiques.
A Echelles numriques
Une chelle numrique est une chelle qui mesure des valeurs qui peuvent varier
de moins linfini plus linfini. Ci-aprs, un graphique avec une chelle numrique sur
laxe horizontal et une chelle numrique sur laxe vertical.
Sur laxe horizontal, lunit de mesure numrique est lanne. Les valeurs
schelonnent entre 1995 et 2007. Si lon doit dessiner ce graphique la main
sur une feuille de papier, on prendra soin de dfinir la distance que lon
souhaite consacrer une anne (par exemple : 1 an = 1 cm). Si cest un
logiciel qui ralise le graphique, cette opration devient inutile car les
dimensions du graphique seront choisies par dfaut (il est possible cependant
de les modifier son gr en redimensionnant le graphique).
Sur laxe vertical, lunit de mesure numrique est le dficit commercial dun
pays, mesur en millions de dollars. Il varie de -150 millions + 400 millions.
Remarque : il est important de toujours bien stipuler lunit dans laquelle lchelle est
mesure (ici lunit est lanne pour laxe horizontal et les millions de dollars pour
laxe horizontal)
B Echelle catgorielles
Une chelle catgorielle est une chelle sur laquelle sont portes des catgories. Il
peut sagir :
1) Catgories numriques
Ci-aprs un graphique o lon a regroup les chmeurs dune ville par classes
dges :
87
Sur laxe horizontal figurent les catgories dges. Cest une chelle de
catgories ou catgorielle. Lunit est lge. On remarque aussi que les
classes dge ont la mme amplitude cest--dire que toutes les catgories
dges ont le mme nombre dannes. Il existe aussi des chelles de
catgories damplitude diffrentes.
Sur laxe vertical figurent leffectif des chmeurs qui entrent dans
chaque catgorie. Cest une chelle numrique simple. Lunit est le nombre
des chmeurs.
2) Catgories nominales
Ci-aprs un graphique o lon a regroup les 35 pays du tableau 1 selon la monnaie
utilise. On a cr trois catgories :
La catgorie des pays qui font partie de la zone Euro en 2008
La catgorie des pays de lUE 27 qui nen font pas partie et utilisent de ce fait
dautres monnaies
La catgorie des pays hors UE qui sont reprsents dans le tableau 1.
Lchelle de laxe vertical est donc une chelle nominale. On a plac lchelle
nominale sur laxe vertical car ainsi il est plus commode dcrire ce que signifie
chaque barre. Lchelle de laxe horizontal, quant--elle, est numrique, elle
mesure le nombre de pays appartenant chaque catgorie.
88
C Echelles ordinales
Une chelle ordinale est une chelle sur laquelle un ordonnancement des modalits
est concevable. Il peut sagir :
10
89
90
120-3 = 117, on ne peut pas en conclure que les Etats-Unis sont 117 fois plus
attractifs que lInde du point de vue des investissements internationaux. Il ne sagit
pas dune chelle rellement numrique, mais dune chelle spciale, dite
ordinale .
Lchelle verticale du graphique ci-dessus est galement ordinale : les pays y sont
classs par ordre dcroissant, du moins attractif au plus attractif.
D Echelles verticales doubles
Lorsque que lon veut reprsenter les donnes relatives deux variables ou deux
caractres, on a parfois recours une chelle double pour faciliter la lecture.
Lexemple suivant va permettre dillustrer ce point. Le tableau ci-dessous montre
deux sries mensuelles. La premire indique le temps pass par une personne sur
Internet chaque mois (en heures) et la seconde srie indique le total de la somme
dpense sur diffrents sites marchands11.
Temps pass sur Internet (heures/mois)
et sommes dpenses sur diffrents sites marchands (euros)
11
Exemple inspir de Creating a Combination Chart in EXCEL 2007 , par Matthew McDONALD,
video Youtube : http://fr.youtube.com/watch?v=WW2IDE4rPCc
92
Imaginons que lon souhaite savoir sil existe une covariation entre ces deux sries.
Une bonne faon de procder est de les mettre sous forme dun graphique.
Cependant, comme les deux chelles sont diffrentes, il faut rserver par exemple
lchelle verticale de gauche pour le temps pass sur internet (qui est exprim en
heures) et lchelle verticale de droite pour les sommes dpenses (qui sont
exprimes en euros). En effet, si lon utilise seulement lchelle verticale de gauche
pour tracer les deux sries, la plus petite (celle des heures passes sur internet) sera
crase par la plus grande (celle des euros dpenss) et le graphique ne rvlera
rien du tout. Inversement, si lon rserve une chelle pour chaque srie, on obtient
alors un graphique beaucoup plus lisible qui semble bel et bien rvler que plus cet
individu a pass de temps sur Internet et plus il a dpens dargent (ceci nest quun
constat de covariation et non une relation de causalit, bien sr).
E Echelles logarithmiques
1) Dfinition
Lchelle logarithmique est une chelle qui mesure le logarithme dcimal des
valeurs de la variable. C'est un excellent moyen de mettre en vidence une ide ou
un rsultat grce aux proprits des logarithmes dcimaux.
Avant de prsenter le mode de construction d'un graphique chelle semilogarithmique, il convient cependant de faire un rappel sur les logarithmes dcimaux.
ce sujet, sur un plan pratique, il est plus important de savoir obtenir un logarithme
dcimal avec une machine calculer, que de comprendre le pourquoi et le comment
des logarithmes dcimaux, ce qui est certainement passionnant mais relve d'un
cours de mathmatiques.
Nous allons donc commencer par voir comment on calcule un logarithme dcimal
avec une machine calculer standard (ci-aprs la "SC-05 Plus") avant de faire un
bref rappel sur les logarithmes dcimaux.
2 ) Calcul pratique du log dcimal d'un nombre
Il suffit d'appuyer sur la touche "log" d'une machine calculer pour obtenir le log d'un
nombre. Par exemple, l'image ci-dessous illustre le calcul du log dcimal de 1000.
L'cran indique que le log dcimal de 1000 est gal 3. Pour obtenir ce rsultat, on
procde ainsi :
1 - Allumer la machine
2 - appuyer sur la touche "log" entoure en rouge (attention de ne pas appuyer sur
la touche "ln" qui est entoure en bleu juste ct et qui sert calculer les
logarithmes naturels)
3 - Entrer le chiffre 1000
4 - Appuyer sur la touche "="
5 - Le rsultat (ici le log de 1000 c'est 3) apparat sur l'cran de la calculatrice.
95
4 ) Exemples
a ) Lchelle logarithmique permet de mieux voir les diffrences de
progression
On dcide de comparer le nombre de contrats conclus par deux vendeurs en 2004 et
2005 :
Vendeur 1
Vendeur 2
2004
300
100
2005
600
400
Progression
multipli par 2
multipli par 4
Sur le graphique de droite, l'chelle de l'ordonne est logarithmique, mais les chiffres
indiqus (les nombres de contrats) sont les mmes que sur le graphique de droite.
Cependant, au lieu d'utiliser les valeurs elles-mmes, le trac utilise le logarithme
dcimal des valeurs, comme indiqu dans le tableau ci-dessous :
Vendeur 1
Vendeur 2
2004
log(300)=2,48
log(100)=2
2005
log(600)=2,78
log(400)=2,6
96
CA (en euros)
100
1000
10000
100000
1000000
Comme on peut le voir sur le graphique ci-aprs les valeurs pour 2001, 2002 et 2003
sont crases par rapport celles de 2004 et 2005 :
Graphique avec chelle des ordonnes ordinaires (sans transformation
logarithmique)
Fichier EXCEL
97
CA (en euros)
100
1000
10000
100000
1000000
log(100)=2
log(1000)=3
log(10000)=4
log(100000)=5
log(1000000)=6
Fichier EXCEL
5 Echelle doublement logarithmique
il existe aussi des graphiques avec chelle logarithmique sur les deux axes.
Autrement dit, non seulement l'chelle des ordonnes est logarithmique, mais
galement l'chelle des abscisses. C'est assez peu frquent en conomie. L'exemple
donn ci-aprs est celui de la relation entre le temps de gnration (priode allant de
la naissance l'ge moyen de reproduction) et la longueur de divers tres vivants.
On voit nettement sur ce graphique que le temps de gnration crot avec la
longueur. Mais on a ici un cas trs intressant o l'chelle de temps varie entre
moins d'une heure et 100 ans et o l'chelle de longueur varie de l'infiniment petit
98
Source : John Tyler BONNER, Size and Cycle : An Essay on the Structure of Biology (Princeton,
1965), p.17. Reproduit dans
Edward R. TUFTE, The Visual Display of Quantitative Information
(Graphics Press LLC, 2004), p. 94
99
3 Diagrammes
Un diagramme est une reprsentation visuelle simplifie et structure de concepts,
dides, de constructions, des relations, de l'anatomie et aussi (et cest en cela quil
nous intresse ici) de donnes statistiques. Il est employ dans tous les aspects
des activits humaines pour visualiser et clarifier. Un diagramme permet aussi de
dcrire des phnomnes, de mettre en vidence des corrlations en certains
facteurs ou de reprsenter des parties dun ensemble..
Un graphique est aussi une reprsentation visuelle simplifie, mais il reprsente
principalement, voire exclusivement des chiffres.
Il existe donc une relation entre diagramme et graphique, que nous pouvons
dailleurs illustrer par le diagramme de VENN ci-aprs (lequel est un diagramme non
statistique !).
100
A Pictogramme
Le pictogramme est un dessin gnralement en couleur, conu par un graphiste,
qui essaie de traduire non seulement des donnes quantitatives, mais galement
des informations dordre commercial ou esthtique. Dans lexemple suivant, 4
figurines qui reprsentent des bouteilles deau et la corpulence de chaque
bouteille correspond aux ventes de la marque fictive eau de qualit . En ralit, il
sagit au dpart dun graphique en colonne qui a t redessin pour remplacer les
colonnes par des bouteilles. Ce qui compte ici, cest la hauteur de la bouteille. La
plus haute et la plus grosse montre que les ventes ont t particulirement
importantes au troisime semestre.
Remarquons quil sagit dun pictogramme qui traduit principalement une information
statistique. Certains pictogrammes ne traduisent que des informations diverses, non
statistiques.
Un pictogramme qui reprsente des donnes chiffres
101
B - Cartogramme
Les cartogrammes sont dsormais trs frquemment utiliss pour reprsenter
toutes sortes dinformations, de la mtorologie, aux rsultats lectoraux, en
passant naturellement par des informations conomiques.
Un cartogramme statistique : De la CEE 6 lUE 27
Source : http://upload.wikimedia.org/wikipedia/commons/c/c4/European_union_past_enlargements_map_fr.png
102
C - Diagramme de GANTT
Le diagramme de GANTT, du nom de lingnieur amricain Henry Laurence GANTT
(1861-1919) qui la popularis, est un outil remarquable de gestion de projets. Il sert
visualiser dans le temps les diffrentes tapes qui composent un projet. Il existe
des logiciels spcifiques qui permettent de produire ce diagramme, mais il est aussi
possible dutiliser EXCEL 2007 pour le tracer12.
Nous allons partir dun exemple simple sous forme dun tableau dcrivant la dure
des diffrentes tapes de la ralisation dun mmoire et nous transformerons ce
tableau en diagramme de Gantt. Ci-aprs, le tableau qui va servir faire le
diagramme :
Tableau chronologique des tches effectuer pour raliser un mmoire
12
103
4 Graphiques usuels
lre du numrique et des tlcommunications, les graphiques sont partout. Ces
reprsentations visuelles colores, aux formes trs diverses sont plus agrables
regarder que les tableaux et permettent souvent de mieux faire passer un message
au premier coup dil.
Il est galement trs facile, grce aux logiciels tels que EXCEL 2007 de Microsoft de
donner une profondeur aux diffrents graphiques, afin quils apparaissent comme
104
ayant trois dimensions (Il est aussi possible dans EXCEL 2007, de reprsenter
rellement 3 dimensions pour certains graphiques en barres ou pour les graphiques
dits de surface ).
Il ne faut cependant pas abuser de la possibilit qui nous est donne aujourdhui de
raliser des graphiques complexes. Car cette complexit peut finir par rendre le
graphique difficilement comprhensible. Mieux vaut sen tenir aux principales
reprsentations graphiques connues et apprcies de tous : diagrammes en
colonne, diagramme en barres, lignes, camemberts , etc.
Il existe une grande quantit de graphiques, tous plus imaginatifs les uns que les
autres. Ainsi, titre dexemple, la figure ci-aprs montre les 73 possibilits de
graphiques simples, regroupes en 11 catgories, qui peuvent tre raliss avec le
logiciel EXCEL 2007. Mais en ralit, il est possible den faire beaucoup plus, soit en
combinant ces formes de base, soit en utilisant certaines astuces.
Les 73 reprsentations graphiques de base dans EXCEL 2007, regroupes
dans 11 catgories communes
De plus, grce des logiciels tels que FLASH dAdobe, il est possible de raliser des
graphiques anims, ou des graphiques interactifs (pouvant par exemple tre modifis
par lutilisateur).
105
A Graphiques en barres
On distingue les graphiques en barres verticales et les graphiques en barres
horizontales. Mais pour chacune de ces deux catgories, il existe 3 varits : simple,
multiples et trononne. Sagissant des barres trononnes , elles se subdivisent
en barres deffectifs ou en barres de pourcentages empils 100%. Le Tableau ciaprs donne une reprsentation schmatique de ces 8 varits.
Pour crer les 8 graphiques les donnes ci-dessous ont t utilises :
.
Il sagit du chiffre daffaires hypothtique quune entreprise a ralis en 2007
249 327 045 euros) rpartis par ses 4 vendeurs et dans les trois villes o se trouvent
ses clients. Les 8 graphiques ci-aprs sont juste les 8 principales faons de
reprsenter ces donnes (ou une partie dentre elles). Chaque graphique en barres
fait ressortir ces chiffres dune manire diffrente et pourra donc tre prfr selon
les circonstances dans lesquelles le graphique est utilis.
1) Barres verticales
La premire ligne du tableau ci-aprs intitul les 8 principales varits de
graphiques en barres reprsente les 4 principales faons de disposer les donnes
du tableau sous forme de barres verticales (ou colonnes). Comme laxe horizontal
reprsente des catgories nominales, la largeur des colonnes na pas dimportance,
pourvu quelle soit identique pour toutes les colonnes. Cette largeur peut varier dun
minimum qui serait un simple trait vertical jusqu un maximum qui serait reprsent
par le fait que toutes les colonnes seraient colles .
a) Simple
Le type barres verticales simples est reprsent par le graphique numrot 1. Il
permet de mettre en vidence le chiffre daffaire ralis par chaque vendeur. On voit
du premier coup dil combien chaque vendeur ralis et quel est celui qui a
ralis le plus gros chiffre daffaires. Les chiffres du graphique correspondent la
dernire ligne du tableau.
106
b) Multiples
Le type barres verticales multiples est reprsent par le graphique numrot 3. Il
permet de mettre en vidence le chiffre daffaire ralis par chaque vendeur dans
chaque ville. Pour chacune des villes (Marseille, Paris, Lyon) on peut voir combien
chaque vendeur ralis. Ce graphique permet de voir quel est le vendeur le plus
performant dans chaque ville.
c) trononnes
Le type barres verticales trononne est reprsent par les graphiques
numrots 5 et 7.
2) Barres horizontales
La deuxime ligne du tableau ci-avant intitul les 8 principales varits de
graphiques en barres reprsentent les 4 principales faons de disposer les
donnes du tableau sous forme de barres horizontales. Comme laxe horizontal
reprsente des catgories nominales, la largeur des barres na pas dimportance,
pourvu quelle soit identique pour toutes les barres. Cette largeur peut varier dun
minimum qui serait un simple trait vertical jusqu un maximum qui serait reprsent
par le fait que toutes les colonnes seraient colles .
a) Simple
Le type barres horizontales simples est reprsent par le graphique numrot 2.
Il est lquivalent en barres horizontales du graphique numrot 1
b) Multiples
Le type barres horizontales multiples est reprsent par le graphique numrot 4.
Il est lquivalent en barres horizontales du graphique numrot 3.
c) trononnes
Le type barres horizontales trononnes est reprsent par les graphiques
numrots 6 et 8. Il est lquivalent en barres horizontales des graphiques numrots
5 et 7.
B Courbes et aires
La courbe est gnralement le graphique le plus appropri pour montrer des
volutions dans le temps. Lorsque lon veut montrer lvolution de plusieurs sries
dans le temps on utilisera galement ce type de prsentation. Parfois, on veut aussi
montrer lvolution de diffrentes composantes dun ensemble dans le temps. Dans
ce cas, on peut utiliser des aires dlimites par des courbes. Pour illustrer les
diffrents usages possibles des courbes et des aires, soit le tableau suivant qui
reprsente la rpartition du chiffre daffaires dune entreprise sur les 3 villes o se
situent ses clients.
Rpartition du chiffre daffaires de lentreprise XXX par villes
(Millions deuros)
109
2) Coubes multiples
Le graphique numrot 2 reprsente lvolution des ventes totales (ou chiffre
daffaires total) en millions deuros que cette entreprise ralise pour chacune des 3
villes o se trouvent ses clients. Il est intressant, mais en fait, on peut lui prfrer un
graphique qui allierait la fois les avantages de la courbe simple (graphique
numrot 1) et la dcomposition par ville (graphique numrot 2). Cest ce que
propose le graphique numrot 3.
3) Aires dlimites par des courbes
On peut concevoir deux faons de prsenter un graphique daires dlimites par des
courbes :
112
113
D - Secteurs
Les graphiques en secteurs sont utiles lorsque lon veut reprsenter la relation entre
une partie et un tout. On distingue les secteurs 380 et ceux 180. Voyons un
exemple de chacun deux avant de voir la mthode de construction qui repose sur la
conversion des pourcentages en degrs.
Reprenons les donnes du chiffre daffaires hypothtique quune entreprise a ralis
en 2007 249 327 045 euros) rpartis par ses 4 vendeurs et dans les trois villes o se
trouvent ses clients.
114
3) Mthode de construction
a) Secteur 360 degrs
Pour obtenir la part du chiffre daffaire ralis dans chaque ville, on divise le chiffre
daffaires ralis dans la ville par le chiffre daffaires total et on multiplie par 360.
Par exemple, pour Marseille on a :
Le tableau ci-dessous donne les rsultats en degrs pour les trois villes :
Une fois que lon a calcul les degrs associs au chiffre daffaire dans chaque ville,
il faut tracer le secteur au moyen dun compas, puis, avec un rapporteur, le diviser
en 3 sous-secteurs ayant pour angle 97 (Marseille), 185,3 (Paris) et 77,7(Lyon).
115
Le tableau ci-dessous donne les rsultats en degrs pour les trois villes :
Un fois que lon a calcul les degrs associs au chiffre daffaires dans chaque ville,
il faut tracer le secteur au moyen dun compas, puis, avec un rapporteur, le diviser
en 3 sous-secteurs ayant pour angle 48,5 (Marseille), 92,7 (Paris) et 38,8 degr
(Lyon). Pour le faire avec EXCEL, voir lien internet ici.
4) Anneaux
a) Simples
Les anneaux sont simplement des secteurs trous au milieu. Ainsi, par exemple,
les deux secteurs prcdents peuvent tre reprsents sous forme danneaux
comme ci-aprs. La seule diffrence tant le cercle vide du milieu dont la taille peu
tre choisie de faon arbitraire en fonction de considration telles que lesthtique ou
lconomie dencre (si le graphique est destin tre imprim) par exemple.
116
b) Concentriques
Un exemple typique danneaux concentriques est celui de la reprsentation des
rsultats du second tour de llection prsidentielle 2007 pour 3 villes hypothtiques.
Dans le cercle intrieur, on a la rpartition des voix entre les deux candidats (dans
cet exemple hypothtique, ils ont obtenu chacun 150 voix) et dans le cercle extrieur,
on a la rpartition des voix de chaque candidat dans chacune des villes.
117
2 Toile daraigne
Le graphique en toile daraigne est une variante du graphique en radar, mais avec
un nombre daxes plus grand. On lutilise par exemple pour reprsenter des donnes
chronologiques. Soit par exemple une entreprise qui souhaite comparer le nombre
de visiteurs mensuels sur son site internet en 2006 et en 2007.
Nombre de visiteurs mensuels sur le site internet de lentreprise XXX (milliers)
118
Une bonne faon de prsenter une comparaison visuelle est de faire un graphique
en toile daraigne suivant :
Exemple de graphique en toile daraigne
Les visites en 2007 ont chaque mois t suprieures aux visites en 2006
Il y a un caractre cyclique dans les visites, car les mois creux et les mois
pleins sont les mmes en 2006 et en 2007.
119
B Graphiques bulles
Semblable au graphique de dispersion ou nuages de points, le graphique
(ou diagramme) en bulles permet d'ajouter une troisime dimension
l'analyse. Les deux premires dimensions dterminent la position des bulles
sur le diagramme tandis que la troisime fixe la surface de chacune des
bulles.
Exemple 1 ( faire avec un logiciel)
titre dexemple, soit les chiffres ci-dessous, extrait du tableau 1, qui
donnent lge mdian, lindice de fcondit et le PIB par habitant des pays de
lUE 27.
120
Exemple de graphique bulles : Age mdian (axe horizontal) , indice de fcondit (axe vertical)
et PIB par habitant (surface de la bulle) des pays de lUE 27. Annes 2007 (ge mdian et indice de fcondit) et 2006 (PIB/habitant en $)
Dans cet exemple relativement simple, il suffit de faire en sorte que laire du disque
qui reprsente le taux de croissance du pays A soit le double de laire qui reprsente
le taux de croissance du pays B.
Pour assurer la proportionnalit des aires, il faut passer par la formule de laire du
disque :
On peut choisir pour rfrence la plus grosse valeur reprsenter sous forme de
disque.
Ensuite on lui attribue une aire arbitraire, par exemple 2 cm2 et on en dduit le
rayon :
123
124
D - Graphique de TUKEY
Le graphique Boite moustaches ou diagramme en bote (box plot) a t
invent en 1977 par le statisticien amricain John TUKEY (1915-2000).
1) Les lments constitutifs du graphique
Sur le graphique ci-aprs, les lments suivants apparaissent13 :
Lintervalle interquartile : il est dfini par Q3 - Q1 et donne les "dimensions" de la
bote.
Les moustaches : Ce sont les extrmits gauche et droite du graphique (parfois
appeles "pattes").
La moustache gauche est dfinie par la valeur de la srie immdiatement
suprieure Q1 - 1,5 (Q3 - Q1). Sil y a des valeurs infrieures Q1 - 1,5 (Q3 Q1) dans la srie, elles sont atypiques et reprsentes par des marqueurs.
La moustache droite est dfinie par la valeur de la srie immdiatement
infrieure Q3 + 1,5 (Q3 - Q1). Sil y a des valeurs suprieures Q3 + 1,5 (Q3
- Q1), elles sont reprsentes par des marqueurs.
La mdiane : la valeur de la variable qui partage la population en deux populations
gales. On la dsigne par l'abrviation Me.
2) Exemple14
Soit la srie des 20 lments : {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4, 5}
La mdiane est gale 3. De plus, Q1 = 2 et Q3 = 4. Enfin, la valeur minimale est 0 et
la valeur maximale 5. Pour tre complet, on peut ajouter la moyenne de la srie qui
est gale 2,7.
13
Voir : http://www.sfds.asso.fr/groupes/statvotre/Boite-a-moustaches.pdf
Pour tracer une boite moustache avec EXCEL 2007, voir : http://blog.immeria.net/2007/01/boxplot-and-whisker-plots-in-excel.html . Voir aussi : http://www.bloggpro.com/box-plot-for-excel-2007/
(mais remplacer les valeurs Min et Max par les valeurs adquates si la distribution contient des
valeurs atypiques). Enfin, voir aussi http://www.coventry.ac.uk/ec/~nhunt/boxplot.htm qui explique la
construction dune boite moustaches avec EXCEL 97, 2003 et 2007.
14
125
Valeurs atypiques : Pour savoir s'il y a des valeurs atypiques il faut calculer Q1 - 1,5
(Q3 - Q1) = 2 - 1,5 x (4 - 2) = 2 - 1,5 x 2 = 2 - 3 = -1 < 0 et Q3 + 1,5 (Q3 - Q1) = 4 +
1,5 x (4 - 2) = 4 + 3 = 7 > 5. Conclusion : puisque -1 >0 et que 7>5, n'y a pas de
valeurs atypiques15. Par consquent, puisque la valeur immdiatement suprieure
Q1 - 1,5 (Q3 - Q1) est 0 et que la valeur immdiatement infrieure Q3 + 1,5 (Q3 - Q1)
est 5, les deux moustaches ont respectivement pour extrmit gauche le minimum
de la srie (soit 0) et pour extrmit droite le maximum de la srie (soit 5).
15
Selon Monique LE GUENN, La valeur 1.5 est selon TUKEY une valeur pragmatique (rule of
thumb), qui a une raison probabiliste. Si une variable suit une distribution normale, alors la zone
dlimite par la bote et les moustaches devrait contenir 99,3 % des observations. On ne devrait donc
trouver que 0.7% d'observations atypiques (outliers). Si le coefficient vaut 1, la probabilit serait de
0.957, et elle vaudrait 0.999 si le coefficient est gal 2. Pour TUKEY la valeur 1.5 est donc un
compromis pour retenir comme atypiques assez dobservations mais pas trop dobservations .
http://www.sfds.asso.fr/groupes/statvotre/Boite-a-moustaches.pdf
126
E Graphiques panachs
Il existe une infinit de faons de panacher les diffrents graphiques. Voyons
quelques exemples.
1) Secteur complt par une barre trononne
Soient les donnes dj utilises du chiffre daffaires par ville et par vendeur dune
entreprise XXX en 2007.
On souhaite :
127
128
tait possde par 20% des individus. Par la suite, on s'aperut qu'un grand
nombre de phnomnes taient gouverns par la loi du 80/20 :
20 % des clients reprsentent 80 % du chiffre d'affaires
20% des pices stockes dans une entreprise reprsentent 80% de la valeur du
stock
20% des fournisseurs reprsentent 80% du volume d'achat total
20% du personnel effectue 80% du travail
20% des salaris dune entreprise empoche 80% de la masse salariale
20% des automobilistes causent 80% des accidents
20% des vtements d'une garde-robe sont ports 80% du temps
20% des produits reprsentent 80% du chiffre d'affaires
20% des ventes reprsentent environ 80% de la marge bnficiaire
20% du personnel total est concern par 80% des accidents du travail
20% des causes peuvent tre l'origine de 80% des dfauts
20% des clients sont l'origine de 80% des rclamations
20% de la population paie 80% des impts
20% des dlinquants gnrent 80% des dlits
20% des joueurs de foot marquent 80% des buts
20% des problmes reprsentent 80% des proccupations
20% des pays mettent 80% des gaz effet de serre, etc.
20% des acteurs jouent dans 80% des films.
Source : http://www.ed-productions.com/leszed/index.php?80-20-pareto
Ces exemples illustrent la loi de PARETO. Quelques causes majeures, une fois
isoles, permettent de rsoudre la plus grande partie d'un problme de qualit. Une
fois ces causes majeures identifies, on peut concentrer les efforts et les ressources
les liminer. Le graphique de PARETO est une faon de visualiser la loi des
80/20. Mais, comme on va le voir dans l'exemple tudi plus loin, cette loi n'est pas
systmatique, il arrive trs souvent aussi que 20% des causes expliquent beaucoup
moins que 80% des rsultats.
b) Dfinition, construction, exemple et interprtation
Un diagramme de PARETO est un graphique qui combine un graphique en barre
et une courbe cumulative. Il sert principalement l'tude des donnes qualitatives,
mais rien n'empche de l'utiliser pour des donnes quantitatives.
Procdure pour construire le graphique :
i) Si les donnes sont sous forme d'une srie, les regrouper par modalits
(donnes) ou par valeurs (donnes quantitatives), de faon obtenir une
distribution par modalits ou par valeurs (ventuellement, une distribution par
classes de modalits ou par classes de valeurs).
ii) Classer les valeurs ou les modalits par ordre dcroissant des effectifs
iii) Ajouter une colonne pour la distribution en pourcentages
129
130
Construction du graphique :
i) Si les donnes sont sous forme d'une srie, les regrouper par modalits (donnes
qualitatives) ou par valeurs (donnes quantitatives), de faon obtenir une
distribution :
Modalits
Le contenu ne correspond pas mes attentes (A)
Le contenu n'est pas bon (B)
Le contenu n'est pas renouvel assez souvent (C)
Difficults techniques pour accder au contenu (D)
Autres (E)
Total
Nombre de rponses
2
5
1
3
4
15
ii) Classer les valeurs ou les modalits par ordre dcroissant des effectifs :
Modalits
Le contenu n'est pas bon
Autres
Difficults techniques pour accder au contenu
Le contenu ne correspond pas mes attentes
Le contenu n'est pas renouvel assez souvent
Total
Nombre de rponses
5
4
3
2
1
15
Nombre de rponses
5
4
3
2
1
15
Pourcentages
33,3
26,7
20,0
13,3
6,7
100,0
Nombre de
rponses
5
4
Pourcentages
33,3
26,7
Pourcentages
cumuls
33,3
60,0
20,0
80,0
13,3
93,3
1
15
6,7
100,0
100,0
131
Fichier EXCEL
c) Interprtation
Dans notre exemple, on voit que la loi de PARETO n'est pas vrifie. En effet, la loi
de PARETO veut que 20% des causes expliquent 80 % des rsultats. Or ici, il y a 5
causes. Donc une cause reprsente elle seule 20% des rsultats. Pour que la loi
de PARETO soit vrifie, il faudrait qu'une seule cause (20% des causes) explique
80% des rsultats (80% des rsiliations). Or, ici, la premire cause n'explique que
35% des rsiliations et il faut 3 causes, soit 60% des causes, pour parvenir
expliquer 80% des rsultats.
On peut se reporter aux sites internet suivants qui donnent des exemples
intressants :
http://membres.lycos.fr/jflipes/pareto.htm (scurit routire)
http://www.azaquar.com/outils/pareto.html (amlioration de la qualit dans une usine
qui fabrique des conserves)
132
F Histogramme
Lhistogramme peut parfois tre assimil un graphique en barre verticales. Cest le
cas lorsque le graphique en barres verticales a pour chelle horizontale des
catgories numriques damplitudes gales. Mais lhistogramme se distingue du
graphique en barres verticales lorsque les catgories numriques de laxe horizontal
sont damplitudes ingales. Le diagramme de VENN ci-aprs permet dillustrer ce
point et les exemples qui suivent de le prciser.
Barres verticales et histogrammes : pas toujours la mme chose !
133
La dernire classe va en fait de 80 plus de 110 ans, mais pour simplifier, nos la supposons gale
5 ans, en nous basant sur le fait que le nombre des 85 ans et plus reste encore minime compar
lensemble de la population mondiale, mme sil est appel augmenter.
134
effectifs) ou une frquence (colonne des frquences). La somme des effectifs donne
la population mondiale en 2007, tandis que la somme des frquences est gale 1.
Nous allons dabord voir comment se prsente lhistogramme des effectifs, puis
ensuite lhistogramme des frquences.
135
Exemple dhistogramme deffectifs quand les catgories numriques sont damplitudes gales
Correspond lhistogramme numrot 1 dans le tableau Les 4 types dhistogrammes
Exemple dhistogramme de frquences quand les catgories numriques sont damplitudes gales
Correspond lhistogramme numrot 2 dans le tableau Les 4 types dhistogrammes
137
Les deux histogrammes (celui des effectifs et celui des frquences) ont la mme
forme, mais diffrent par lchelle de laxe vertical.
1350,
1500,
2100,
2810,
3000,
3100,
3500,
4380,
1400,
1550,
2200,
2820,
3000,
3200,
3550,
4500,
1400,
1600,
2220,
2840,
3000,
3210,
3560,
4560,
Supposons que lon souhaite rpartir ces mnages dans les catgories de revenu
suivantes : [0 1500[ ; [1500 3000[ ;[3000 5000[ ; [5000 10000[. On va alors
obtenir le tableau deffectifs suivant :
Rpartition des 110 mnages par classe de revenu
Lamplitude de chaque classe nest pas la mme. Les 2 premires classes ont une
amplitude de 1500 euros, la troisime a une amplitude de 2000 euros et la dernire
classe a une amplitude de 5000 euros. Par consquent, si lon veut reprsenter ces
donnes sous forme dun histogramme deffectifs, nous ne pouvons pas procder de
la mme faon que lorsque les amplitudes de classes sont identiques. En effet, sur
laxe vertical, les barres nauront plus la mme longueur. Lchelle de laxe
horizontal est le suivant :
On voit que dans ces conditions, la hauteur des barres verticales ne peut plus tre
proportionnelle aux effectifs, car cela aboutirait donner une image fausse de
limportance des effectifs inclus dans chaque classe.
a) Histogramme deffectifs
Pour tracer lhistogramme des effectifs, il faut donc modifier lchelle de laxe vertical
en divisant les effectifs de chaque classe par lamplitude de classe correspondante.
On ajoute pour cela deux colonnes au tableau prcdent :
Calcul des effectifs corrigs (effectifs sur amplitudes)
La colonne amplitude de classe donne lcart en euros entre les deux extrmits
de chaque classe. La colonne effectifs corrigs se calcule en divisant chaque
effectif par lamplitude de classe qui lui correspond ; Ainsi, leffectif corrig de la
classe de revenu [0 1500[ sobtient par lopration suivante :
facilement que la barre qui correspond 40 a une surface double de celle qui
correspond 20. Et, bien que cela ne soit pas vident visuellement, la barre qui
correspond 45 a une surface qui est 45/40=1,125 plus grande que celle qui
correspond 40 et une surface 45/5 = 9 fois plus grande que celle qui correspond
5.
Histogramme deffectifs
avec catgories numriques damplitudes diffrentes
Correspond lhistogramme numrot 3
dans le tableau Les 4 types dhistogrammes
b) Histogramme de frquences
Pour tracer lhistogramme des frquences, il faut donc modifier lchelle de laxe
vertical en divisant les frquences de chaque classe par lamplitude de classe
correspondante.
140
141
La pyramide des ges est un outil de l'analyse dmographique plus clbre encore
que le diagramme de LEXIS (et surtout plus populaire !). Ce graphique a t invent
en 1870 par le Gnral WALKER, alors directeur du Bureau of Census, organisme
amricain charg du recensement de la population et des tudes dmographiques.
C'est en fait un double histogramme qui indique la composition dune population
par classes dges et par sexe, un moment donn.
Faire une pyramide, c'est faire graphique du nombre d'hommes et de femmes de
diffrents ges. Pour cela on place dos dos, deux histogrammes dcrivant la
structure par classe dge dune population masculine pour le premier et dune
population fminine pour le second. Le tableau ci-dessous rpertorie la population
mondiale par groupe dges quinquennaux et par ge en 2007. Nous allons lutiliser
titre dexemple pour construire la pyramide des ges17.
17
Cet exemple est disponible sous forme vido sur You Tube :
http://fr.youtube.com/watch?v=ubAKKG2Bxsg
143
144
Il sagit en fait dun graphique qui reprsente TROIS dimension : lge, le sexe
et les effectifs associs ces deux catgories.
H Graphique en cascade
Le graphique en cascade (waterfall graphic) est une variante du graphique en barres.
Il sert faire apparatre :
- les contributions positives et ngatives une grandeur
- les variations successives d'une grandeur.
Exemple : Le tableau ci-dessous indique l'volution du chiffre d'affaire d'une
entreprise de 2001 2006. La troisime colonne du tableau met en vidence les
augmentations et la quatrime les diminutions. On voit ainsi que le CA a augment
en 2002, 2003 et 2005, et qu'il a baiss en 2004 et 2006.
Annes
2001
2002
2003
2004
2005
2006
CA (euros)
210000
280000
330000
300000
360000
320000
Plus
Moins
70000
50000
-30000
60000
-40000
145
Voir le fichier Excel 2003 (il faut d'abord installer la macro : tlchargeable ici)
On voit ainsi immdiatement la contribution de chaque anne et on peut visualiser :
l'importance de la contribution
Si la contribution est positive ou ngative.
comment on est pass de 210 320 par variations successives.
146
147
Cette fois, nous allons utiliser un seul graphique en barres verticales pour montrer
la fois la rpartition du CA par villes et par vendeur en 2007.
Chapitre 6
Tendances et corrlations
1 Introduction
2 La dtermination de la tendance dune srie chronologique
A Dtermination graphique
B Dtermination par la mthode des points extrmes
C Dtermination par la mthode des moindres carrs (MCO)
3 Ltude de la corrlation entre deux variables
A Lexemple dune fonction de demande
B Lquation de rgression linaire
C Le coefficient de dtermination
4 Le test du Khi-carr
A Introduction
B Exemple dutilisation
1 Introduction
Ce chapitre est consacr lutilisation dun mme outil statistique, lajustement
linaire, deux cas de figure diffrents. Lajustement linaire, aussi appel
mthode des Moindres Carrs Ordinaires (MCO).
Il est appliqu successivement :
150
151
Source : FMI
152
Cette mthode nest cependant pas trs satisfaisante car elle ne tient compte que de
des deux points extrmes. Une meilleure mthode est celle dite des moindres
carrs ordinaires ou MCO en abrg.
153
18
Ces formules sont donnes ici sans dmonstration, le lecteur intress par une dmonstration
rigoureuse pourra consulter avec profit le livre de PY, Bernard (2007), Statistique descriptive :
nouvelle mthode pour comprendre et bien russir 5me dition, Economica.
154
155
La mthode MCO est plus rigoureuse que la mthode car elle calcule la droite de
tendance en tenant compte de toutes les observations.
3 Ltude de la liaison statistique entre deux variables
Nous allons maintenant nous intresser la mise en vidence due relation
statistique entre deux variables partir de la mthode MCO. Nous prendrons comme
exemple, ltude de la relation entre prix et quantit dun produit.
A Lexemple dune fonction de demande
Il est important pour une entreprise d'avoir une bonne ide de la demande qui
s'adresse son produit. Comment faire pour connatre la fonction de demande pour
un produit ?
La premire ide qui vient l'esprit consiste tracer un repre quantit/prix, avec la
quantit en abscisse et le prix en ordonne, comme ci-dessous. Supposons que l'on
dispose pour cela des informations suivantes :
2005
2006
2007
156
La courbe obtenue en joignant les 3 points est bien dcroissante et suggre que plus
le prix augmente, plus la quantit demande diminue. S'agit-il pour autant d'une
fonction de demande ? En fait, pas forcment. Le prix et la quantit d'un bien sont
normalement dtermins la fois par l'offre et la demande, du moins lorsque le
march est concurrentiel (si le march n'est pas concurrentiel, les choses n'en sont
que plus compliques). Mais, quoiquil en soit, le prix et la quantit du produit
s'tablissent l'intersection de l'offre et de la demande.
Ainsi, en fait, les 3 points du graphique prcdent sont gnralement interprts par
les conomistes comme trois points d'quilibre, ainsi qu'illustr ci-dessous :
Sur ce graphique, nous voyons en fait que les 3 points prcdents sont trois points
d'quilibre qui rsultent de l'intersection de courbes d'offre et de demande. Par
exemple, en 2007, il s'est vendu 30 millions d'units au prix unitaire de 15 euros, ce
qui correspond au point d'quilibre E, qui est l'intersection des courbes d'offre et de
demande de l'anne 2007.
En reliant les 3 observations temporelles pour en faire une courbe de demande, on
commet sans doute une erreur. On est conduit ainsi sous-estimer l'lasticit de la
demande par rapport au prix. Ainsi, par exemple, on pourrait penser qu'une baisse
du prix de 15 14,5 euros a pour effet d'augmenter la demande de 30 33 millions
d'units. Or en fait, ainsi qu'on peut le voir sur le graphique, une baisse du prix de 15
14,5 entrane une augmentation bien plus importante de la demande (de 30 40
millions). Bien sr, pour que la quantit vendue soit effectivement gale 40 millions,
il ne faut pas seulement qu'il y ait un dplacement le long de D2007, il faut aussi que la
courbe d'offre O2007 se dplace de faon ce que le nouveau point d'intersection soit
en E' (ce que nous supposons ici).
157
Cependant, comme illustr sur le graphique ci-dessous, on ne peut pas exclure que
les 3 observations temporelles correspondent 3 points sur la fonction de demande.
Mais cela signifie en fait que la courbe de demande n'a pas chang, alors que la
courbe d'offre s'est dplace vers la gauche (en supposant que maintenant on
commence en 2005, puis on continue avec 2006 et ensuite 2007).
Trois courbes d'offre successives, face une courbe de demande inchange
constituent ainsi une justification simple de l'estimation d'une courbe de demande par
un nuage de points constitus de couples prix/quantit observs diffrents points
du temps (de prfrence en un mme lieu). Il existe des analyses bien plus subtiles
et le lecteur intress peut se rapporter pour plus de dtails un ouvrage
dconomtrie.
158
difficile d'obtenir une relation aussi vidente avec des chiffres rels. Cependant, ce
qui nous intresse principalement ici, c'est d'illustrer la mthode.
Dates
Janvier
Fvrier
Mars
Avril
Mai
Juin
Juillet
Aot
Septembre
Octobre
Novembre
Dcembre
Quantit qi
(milliers d'units)
5
15
9
14
3
9
10
17
11
16
7
3
Prix pi (euros)
14
6
10
9
11
13
9
6
5
3
11
15
159
Nous nous attendons ici ce que le coefficient a soit ngatif. Les principaux calculs
ncessaires sont donns ci-aprs :
160
On a :
q = - 1,55618* p+24,4413
On peut ensuite se servir de la fonction de demande ainsi obtenue pour valuer les
consquences d'une baisse du prix sur la quantit demande et donc sur la recette
totale.
161
C - Le coefficient de dtermination
Lorsque l'on a estim la droite de rgression, on doit se demander ci cette estimation
est de bonne qualit. On dispose d'un premier outil pour rpondre cette question :
c'est le coefficient de dtermination dont la formule est donne par :
162
163
Lexpression khi carr est aussi le nom dune distribution thorique assez
complexe, dont les valeurs servent valider le test du chi-carr. Ces rsultats
sont prsents sous forme dune table. De ce fait, en pratique, il suffit de se
reporter la table.
On cherche savoir si lge a une influence sur le type de produit achet. Or ici, il y
a deux dimensions dont lune est quantitative (lge) et lautre est qualitative (le
produit achet). On ne peut donc pas utiliser la mthode des moindres carrs. On
peut en revanche utiliser un test du khi-carr.
164
Pour cela, les donnes sur lge ont t regroupes en 2 catgories : jeunes et
moins jeunes , pour savoir si le produit est galement achet par les plus de 20
ans par exemple. On va donc regrouper la population en deux catgories : les moins
de 25 ans et ceux de 25 ans et plus (ici, cela se rsume la catgorie 20-45 ans).
En ce qui concerne les catgories de produits, nous allons en revanche conserver
les 4 catgories A, B, C et D. Les 100 personnes sont donc regroupes dans le
tableau deux dimensions ci-dessous :
165
On voit ds prsent que les effectifs rels ne sont pas gaux aux effectifs
attendus ou thoriques . Il se peut donc que lge ait une influence sur le
choix du produit. Mais dans quelle mesure ?
Il faut maintenant calculer les diffrences entre les effectifs rels et les effectifs
attendus ou thoriques, puis porter cette diffrence au carr et la diviser par leffectif
thorique, et enfin additionner les huit chiffres ainsi obtenus.
En dautres termes, il faut appliquer la formule suivante :
166
Une fois que lon connat le khi carr calcul, on doit le comparer avec la valeur du
khi-deux issue de la distribution du khi carr (voir le tableau ci-aprs).
Pour trouver cette valeur dans le tableau, nous devons prendre en compte deux
informations supplmentaires :
Nous avons donc 6 degrs de libert et une probabilit de fiabilit du test de P=0,05.
Par consquent, nous voyons dans la table que :
Il nous reste maintenant comparer le chi-carr calcul et le khi carr thorique, issu
de la table :
167
Degrs de
libert
P=0,05
P=0,01
P=0,001
Degrs de
libert
P=0,05
P=0,01
P=0,001
168
Etant donn que le chi-carr thorique est infrieur au khi carr calcul, nous
pouvons conclure que la rpartition des prfrences est suffisamment diffrente
dune rpartition homogne pour quon puisse raisonnablement se fier lide que
l'ge a une influence sur le choix du produit. Notre observation initiale sur la base
de lchantillon est donc probablement vraie lextrieur de lchantillon (avec 5% de
chances de nous tromper). Si lon crot ce type de test, on pourrait donc cibler des
publicits pour les jeunes pour mieux vendre les produits C et D et cibler des
publicits pour les moins jeunes pour mieux vendre les produits A et B. Il devrait
alors en rsulter une augmentation des ventes la fois pour les produits destins
aux jeunes (C et D) et pour les produits destins aux moins jeunes (A et B). Bien
sr, le test nest pas fiable 100%. Il y a toujours 5% de chances de se tromper.
Mais lon peut juger que cette marge derreur est suffisamment faible pour dcider
dune politique de marketing en fonction des rsultats. On peut aussi, choisir de
refaire le test en choisissant P =0,001. Dans ce cas, il ny a plus quune chance sur
1000 de se tromper et la valeur du khi-carr thorique passe 22,46, valeur qui
reste infrieure au chi-carr calcul et qui aboutit donc la mme conclusion, avec
une fiabilit renforce.
Si en revanche le chi-carr thorique avait t suprieur au khi carr calcul, alors
nous naurions pas pu conclure avec suffisamment de certitude que,
indpendamment de notre chantillon, l'ge a une influence sur le choix du
produit
169
Chapitre 7
Courbe de LORENZ et coefficient de GINI
1 Introduction
2 La courbe de LORENZ
A Lexemple de la rpartition des PIB au sein de lUE 27
B Lutilit de la courbe de LORENZ pour les comparaisons
C Cas Gnral
3 Le coefficient de GINI
A Dfinition
B Formules de calcul
C - Exemple
1 Introduction
Max Otto LORENZ (1880 -1962) est lconomiste amricain qui inventa le concept
de courbe de LORENZ en 1905. Il sagissait pour lui de dcrire et de mesurer les
ingalits de revenu. Par la suite, cette courbe quil fut le premier utiliser servit plus
gnralement mesurer la faon dont se rpartit une masse (salariale, de revenus,
de richesses, etc.) au sein dun population pour se faire une ide du caractre plus
ou moins galitaire de la rpartition de ces masses au sein de la population et
comparer ainsi diffrentes populations entre elles ou comparer la distribution dune
masse au sein dune population en deux ou plusieurs points du temps afin de savoir
si lingalit augmente ou diminue19.
Corrado GINI (1884 -1965) est le statisticien, dmographe, ethnologue, sociologue
et idologue italien qui on doit le coefficient de GINI une mesure de l'ingalit
associ la la courbe de LORENZ.
En pratique, lorsquon sintresse la rpartition dune masse de revenus ou de
richesse au sein dune population, on trace dabord une courbe de LORENZ afin
davoir une ide visuelle de lgalit ou de lingalit de cette rpartition. Ensuite, si
lon dsire rsumer cette ingalit par un chiffre, on calcule le coefficient de GINI.
2 La courbe de LORENZ
A Lexemple de la rpartition des PIB au sein de lUE 27
Pour introduire la courbe de LORENZ, prenons lexemple de la rpartition des PIB
au sein de lUE 27. Ci-aprs, un extrait du tableau 1, o les 27 pays de lUE ont
t classs par ordre de PIB dcroissant (colonne 2).
La colonne 3 est simplement un cumul des pays de 0 27. La colonne 4 est un
cumul des PIB des pays.
19
170
La colonne 5 reprend les chiffres de la colonne 3 diviss par 27 (nombre total des
pays) et multipli par 100.
La colonne 6 reprend les chiffres de la colonne 4 diviss par 13847 (PIB total de lUE
27) et multipli par 100.
Les chiffres des colonnes 5 et 6 nous permettent dvaluer lampleur de lingalit de
la production de richesse au sein des pays de lUE 27
Tableau pour la construction dune courbe de LORENZ
de la rpartition des PIB au sein de lUE 27
171
172
Comparaisons de la distribution des salaires dans les filiales A et B dune entreprise XXX
et calculs ncessaires pour le trac de la courbe de LORENZ
20
Une dmonstration vido de construction dune courbe de LORENZ avec EXCEL 2007
disponible sur You Tube : http://fr.youtube.com/watch?v=UeHUhDyHGjQ
est
175
3 cas typiques, dont les deux cas limites, sont reprsents par les graphiques ci-dessous
3 Le coefficient de GINI
A Dfinition
Le coefficient de Corrado GINI (1884 -1965) est une mesure de l'ingalit associ
la courbe de LORENZ. Il est donn par la formule :
De plus, comme :
B Formules de calcul
Il existe plusieurs formules de calcul du coefficient de GINI. Nous adopterons lune
des plus utilises qui est donne dans la notice explicative de la Banque mondiale
pour le calcul de lingalit des rpartitions21, parfois dite formule de BROWN .
Cette formule scrit :
Les 2 tableaux ci-aprs montrent comment les calculs doivent tre disposs pour
parvenir rapidement au rsultat.
21
178
180
On constate que le coefficient de GINI de la filiale A est beaucoup plus lev que
celui de la filiale B, indiquant que la distribution de la masse salariale y est plus
ingalitaire. En effet, on a :
Coefficient de GINI de la filiale A = 0,45107
Coefficient de GINI de la filiale B = 0,27635
Voyons maintenant comment disposer les calculs en appliquant la deuxime formule
(qui est plus simple et plus rapide tout en donnant les mmes rsultats)
Calcul du coefficient de GINI de la filiale A selon la formule :
182
Bibliographie
A
ABELL Martha L., James P. BRASELTON & John A. RAFTER (1998), Statistics with
mathematica , Academic Press.
ALBARELLO, Luc, Jean-Luc GUYOT et Etienne BOURGEOIS (2002), Statistique
descriptive , De Boeck
AVENEL, Jean-David (1999), Statistique descriptive : Cours et exercices corrigs ,
Dunod.
B
BADIA, Jacques, Ren BASTIDA et Jean-Robert HAIT (1997), Statistique sans
mathmatique , Ellipses
BAILLY, Pierre (1999), Statistique descriptive , Presses Universitaires de Grenoble
BEAUFILS, Batrice (1996) , Statistiques appliques la psychologie. Statistiques
descriptives, tome 1 , ditions Bral.
BLUMAN, Allan (2005), Elementary Statistics: A Step by Step Approach , Mc Graw
Hill Publishing Company
BOUNDFORD, Trevor et Alaister CAMPBELL (2000), Digital Diagrams , WatsonGuptill Publications.
BOURSIN, Jean-Louis (2000), La statistique pour l'conomie et la gestion: QCM ,
EJA/Gualino.
C
CALOT, Grard (1969), Cours de statistique descriptive , Dunod.
CHAUVAT, Grard et Jean-Philippe REAU (1995), Statistique descriptive , Hachette
Suprieur.
D
DAGNELIE, Pierre (1998), Statistique thorique et applique. Statistique descriptive
et bases de l'infrence statistique, tome 1 , De Boeck
DELMAS, Bernard (2005), Statistique descriptive , Armand Colin, Fac conomie
de BERNONVILLE, Dug (1939), Initiation l'analyse statistique , Librairie de Droit
et de Jurisprudence.
DUTHIL, Grard (1998), Initiation la statistique descriptive , Ellipse Marketing
183
G
GEORGIN, Jean-Pierre et Michel GOUET, Statistiques avec Excel : Descriptives,
tests paramtriques et non paramtriques partir de la version Excel 2000
(1Cdrom) , Presses Universitaires de Rennes.
GONICK larry et Woollcott SMITH (1993), The Cartoon Guide to Statistics ,
HarperCollins Publishers
GOULET, DRETZKE (2004), Statistiques avec Microsoft Excel , Reynald et Goulet
diteur.
GRAIS, Bernard (2003), Statistique descriptive : Techniques statistiques , Dunod.
GUEGUEN, Nicolas (2005), Statistiques pour psychologues : Cours et exercices ,
Dunod.
H
HAND, D.J. (1993), A Handbook of Small Data Sets , Chapman & Hall.
HUFF, Darrell et Irving GEIS (1993), How to Lie With Statistics , W. W. Norton &
Company
HOWELL, David (1998), Mthodes statistiques en sciences humaines , De Boeck.
I
INSEE (2005), Tableaux de l'conomie franaise , INSEE Editeur, Collection
"Rfrences".
J
JAISINGH, Lloyd R. (2005), Statistics for the Utterly Confused , McGraw-Hill.
JANVIER, Michel (1999), Statistique descriptive : Avec ou sans tableur, cours et
exercices corrigs , Dunod.
JONES, Gerald, E. (1995), How to Lie With Charts , Sybex
K
KAZMIER, Leonard (2003), Business Statistics: Based on Schaum's Outline of
Theory and Problems of Business Statistics, Third Edition , Schaum/McGraw Hill
Publishing Company.
184
L
LETHIELLEUX, Maurice (2003), Statistique descriptive , ditions Dunod, Collection
"Express".
M
MASSONI, Andr (2002),Initiation aux statistiques descriptives avec Excel. 2me
dition , Vuibert.
.
MILNE, P. H. (1992), Presentation Graphics For Engineering, Science And Business ,
Spon (Chapman & Hall)
MONINO, Jean-Louis, Jean-Michel KOSIANSKI et Franois LE CORNU (2004),
Statistique descriptive : Travaux dirigs , Dunod.
MOORE, David, S. et George P. McCABE (2002), Introduction to the Practice of
Statistics , 4me dition, W.H. Freeman & Company.
P
PIATIER, Andr (1966), Statistique, statistique descriptive et initiation l'analyse ,
Puf, Presses Universitaires de France, Collection Thmis, Manuels Juridiques,
Economiques et Politiques .
PILLER, Alain (2004), Statistique descriptive : Manuel d'exercices corrigs avec
rappels de cours , ditions Premium.
PY, Bernard (2007), La statistique sans formule mathmatique , 1re dition, Pearson
Education.
PY, Bernard (2007), Statistique descriptive : nouvelle mthode pour comprendre et
bien russir 5me dition, Economica.
PY, Bernard (2007), Exercices corrigs de statistique descriptive : Problmes,
exercices et QCM , 3me dition revue et augmente, Economica.
R
REUCHLIN, Maurice (1998), Prcis de statistique : Prsentation notionnelle, 7e
dition , PUF.
RODRIGUEZ, Marc et Michel TERRAZA (1998), Statistique descriptive: 30 exercices
corrigs , EJA/gualino.
RUMSEY, Deborah (2003), Statistics for Dummies , Wiley Publishing inc. Site
internet de la collection "... for dummies" : Etats-Unis. Voir aussi la page Web du
livre.
185
S
SCHARLIG, Alain (1997), Faire parler les chiffres: La statistique descriptive au
service de la gestion , Presses Polytechniques et Universitaires Romandes (PPUR)
SLAVIN, Steve (1998), Chances Are: The Only Statistics Book You'll Ever Need ,
Madison Books
SPIEGEL, Murray et Larry STEPHENS, Statistique: Cours et problmes , 3me
dition, Srie Schaum/McGraw Hill
T
TUFTE, Edward (2001), The Visual Display of Quantitative Information , Graphics
Press. Voir le site internet de Edward TUFTE.
V
VOELKLER, David, Peter ORTON et Scott ADAMS (2001), Cliffsquickreview
Statistics , Hungry Minds
W
WAINER, Howard (2005), Graphic Discovery: A Trout in the Milk and Other Visual
Adventures , Princeton University Press.
WILKINSON Leyland, S. (1999), The Grammar of Graphics , Springer.
Z
ZELAZNY, Gene (2001), Say it with Charts : The Executive's Guide to Visual
Communication , McGraw-Hill
186
187
188