Académique Documents
Professionnel Documents
Culture Documents
Ob jectif et moyens
Objectifs du cours Apprendre les principales techniques de statistique descriptive univari
ee et bivari
ee.
Etre capable de mettre en oeuvre ces techniquesere
de mani`
appropri
ee dans un contexte donn
e.
Etrecapable dutiliserles commandes debase duLanguage
R.
Pouvoir
appliquer les techniques de
statistiques descriptivesau moyen du language R.
ReferencesDo dge Y.(2003), Premiers pas en statistique, Springer.
Dro esb eke J.-J. (1997), Elements de statistique, Editions deelibre
lUniversit
de Bruxelles/Ellipses.
Le language R Shareware : gratuit et installe en 10 minutes. Open source (on sait ce qui est ree
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
5
5
5
6
6
6
7
7
7
9
10
10
11
11
12
12
12
12
14
15
2 Statistiquedescriptiveunivariee 17
2.1 Param`etresdeposition . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 17
2.1.1 Le mode . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 17
2.1.2 La moyenne . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 172.1.3 Remarques sur le signe de sommation
Letendue .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 242.2.2 La distance interquartile . .. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. . 272.4.2 Coefficient dasymetrie de Yule .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 272.4.3 Coefficient dasy
2.5
2.6
2.7
2.8
2.9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
28
29
29
31
31
3 Statistique descriptivebivari
ee
3.1 Seriestatistique bivari
ee. . . . . . . . . . . . . . . . . . .
3.2 Deuxvariablesquantitatives.. . . . . . . . . . . . . . . .
3.2.1 Representationgraphique dedeux variables
. . . .
3.2.2 Analyse des variables.. . . . . . . . . . . . . . . .
3.2.3 Covariance .. .. ..
. . . . . . . . . . . . . . . .
3.2.4 Correlation .. .. ...
. . . . . . . . . . . . . . .
3.2.5 Droite de regression .. .. . . . . . . . . . . . . .
3.2.6 Residuset valeursajustees.
. . . . . . . . . . . .
3.2.7 Sommes de carreset variances.
. . . . . . . . . .
3.2.8 Decomposition de la variance . .... . . . . . . .
3.3 Deux variablesqualitatives .. .. .. .. ..
. . . . . . .
3.3.1 Donnees observees . . . . . . . . . . .. . . . . . .
3.3.2 Tableau de contingence .. .. .. .. ...
. . . .
3.3.3 Tableau des frequences. .. .. .. .. .. ..
. . .
3.3.4 Profilslignesetprofilscolonnes . . . . . . . . ..
.
3.3.5 Effectifstheoriqueset khi-carre .. .. .. .. .. ..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
35
35
36
36
37
37
41
41
42
43
43
44
44
45
46
4 Theoriedesindices,mesuresdinegalite 51
4.1 Nombres indices . . . . . . . . . . . . . . . . . . . . . . . . . . ..
. . . . . . . . . . . . . . . 51
4.2 Definition .. .. .. .. .. .. .. .. .. . .. .. .. .. .. .. ..
. . . . . . . . . . . . . . 51
4.2.1 Proprietesdes indices .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . . 52
4.2.2 Indices synthetiques . . . . . . . . . . . . . . . . . . . . . . . . . ..
. . . . . . . . . . 52
4.2.3 Indice de Laspeyres .. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . 52
4.2.4 Indice de Paasche. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ...
. . . . . . . 53
4.2.5 Lindice de Fisher .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . 53
4.2.6 Lindice de Sidgwick .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ...
. . . . 54
4.2.7 Indices chanes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
. . . 54
4.3 Mesuresde linegalite .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ...
. 54
4.3.1 Intro duction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..
54
4.3.2 Courbe de Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.3.3 Indice de Gini. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 56
4.3.4 Indice de Hoover .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 564.3.5 Quintile et Decile share ratio .. .. .. .. .. ..
Exemples .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 595.2 Description de la tendance . .. .. .. .. .. .. .. .. .. .. .. ..
ecalage .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 665.3.2 Operateur difference .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
5.3.3 Diff
erence saisonni`
ere . . . . . . . . . . . . . .
5.4 Filtres lineaireset moyennes mobiles
. . . . . . . . . .
5.4.1 Filtres lin
eaires. . . . . . . . . . . . . . . . . .
5.4.2 Moyennesmobiles : efinition.
d
. . . . . . . . .
5.4.3 Moyenne mobile et composante saisonni`
ere . .
5.5 Moyennesmobiles particuli`
eres . . . . . . . . . . . . .
5.5.1 Moyenne mobile de Van Hann.
. . . . . . . . .
5.5.2 Moyenne mobile de Spencer.
. . . . . . . . . .
5.5.3 Moyennemobilede Henderson. . . . . . . . .
5.5.4 Medianes mobiles.
. . . . . . . . . . . . . . . .
5.6 Desaisonnalisation .. .. . . . . . . . . . . . . . . . .
5.6.1 Methode additive . ... . . . . . . . . . . . . .
5.6.2 Methode multiplicative.. . . . . . . . . . . .
5.7 Lissage exponentiel . . . . . . . .. . . . . . . . . . . .
5.7.1 Lissage exponentiel simple ... . . . . . . . . .
5.7.2 Lissage exponentiel double . . ... . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
67
69
69
70
70
71
71
71
71
72
72
72
73
73
73
76
Chapitre1
Variables, donn
ees statistiques,
tableaux, effectifs
des entreprises, des menages. En sciences humaines,on sinteresse dans la plupart des cas `a un nombrefin
dunites. Sur ces unites, on mesure un caract`ere ou une variable , le chiffre daffaires de lentreprise,
le revenu
du menage, lage de la p ersonne, la categorie so cio-professionnelle dune personne. On suppose q
variable prend toujours une seule valeur sur chaque unite. Les variables sont designees
e par simplici
par une lettre (X,Y,Z). Les valeurs possibles de la variable, sont appelees modalites. Lensemble des vale
fait de pouvoir ou non ordonner les modalites est parfois discutable. Par exemple :dans les categories soc
Une variable est dite continue, si lensemble des valeurs possibles estcontinu.Remarque 1.1 Ces definitio
En langageR
>X=c(Marie(e),Marie(e),Divorce(e),Celibataire,Celibataire,Marie(e),Celibataire,
Celibataire,Celibataire,Marie(e),Celibataire,Marie(e),Veuf(ve),Marie(e),
Veuf(ve),Divorce(e),Celibataire,Celibataire,Celibataire,Marie(e))
>T1=table(X)> V1=c(T1)> data.frame(Eff=V1,Freq=V1/sum(V1))
Eff FreqCelibataire 9 0.45Divorce(e) 2 0.10Marie(e) 7 0.35Veuf(ve) 2 0.10 1.2.2
Diagrammeensect
Le tableau statistique peut etre represente par un diagramme en barres ou en secteurs (ou camemb e
ou piecharten anglais) (voirFigures 1.1 et 1.2).Clibataire
Divorc(e)
Veuf(ve)
Mari(e)
Fig. 1.1 Diagramme en secteursEn langage R> pie(T1,radius=1.0)En langage R> barplot(T1)1.3
Var
8
6
4
2
0
Clibataire
Divorc(e)
Mari(e)
Veuf(ve)
Fig.1.2Diagramme enbarres
La notation x1 x2 se lit x1 prec`ede x2 .Si la variable est ordinale, on peut calculer les effectifs cumul
es:
Nj =j
k=1n k .
La co dificationa
etefaite selon le Tableau 1.1. On a obtenu la serie statistique presentee dans le tableau 1.2. Finalemen
obtientletableaustatistiquecompletpresentedansleTableau1.3.Tab.1.1CodificationdelavariableYDernierdip
UEnlangageR>YY=c("Sd","Sd","Sd","Sd","P","P","P","P","P","P","P","P","P","P","P","Se","Se","Se","Se","Se","
nj N j
4
4
11 15
14 29
9 38
12 50
50
fj
0.08
0.22
0.28
0.18
0.24
1.00
Fj
0.08
0.30
0.58
0.76
1.00
T2=table(YF)V2=c(T2)> data.frame(Eff=V2,EffCum=cumsum(V2),Freq=V2/sum(V2),FreqCum=cumsum(V2/
Eff EffCum Freq FreqCumSd 4 4 0.08 0.08P 11 15 0.22 0.30Se 14 29 0.28 0.58Su 9 38 0.18 0.76U 12 50 0.24
Figure 1.3).Sd
P
Se
U
Su
10
12
14
Se
Su
10
20
30
40
50
Figure 1.5).Sd
Se
Su
En langageR
>T3=cumsum(T2)
>barplot(T3)
2 2 2 2 2
22 233
3 3 3 3
33 33 33
3 3 4
4 4 4 4 444
4 5
5 5 5 5 66 68
8
Comme p our les variables qualitatives ordinales, on peut calculer les effectifs,
les effectifs cumul
es, les
frequences, les frequences cumulees. `A nouveau, on peut construire le tableau statistique:
xj nj Nj fj Fj1 5 5 0.10 0.102 9 14 0.18 0.283 15 29 0.30 0.584 10 39 0.20 0.785 6 45 0.12 0.906 3 48 0.06 0.
15
10
5
0
1
Fig. 1.6 Diagramme en batonnets des effectifs pour une variable quantitative
ete
discr`
1.4.2 Diagramme en batonnets des effectifsQuand la variableest discr`ete, les effectifs son
Fonction de repa
esent
ee
1.0
0.8
0.6
0.4
0.2
0.0
0
Exemple 1.7 On mesure la taille de 50 el`eves dune classe :152 152 152 153 153154 154 154 155 15515
50 0.20 1.0050 1.00Le tableau regroupe en classe est souvent appele distribution groupee. On note, de
N j leffectif cumul
ede la classe j,
fj la frequencede la classe j,
Fj la frequence cumul
eede la classe j.
Enlangage R> S=c(152,152,152,153,153,154,154,154,155,155,156,156,156,156,156,
+157,157,157,158,158,159,159,160,160,160,161,160,160,161,162,
+162,162,163,164,164,164,164,165,166,167,168,168,168,169,169,
+ 170,171,171,171,171)> T5=table(cut(S, breaks=c(151,155,159,163,167,171)))
>T5c=c(T5)> data.frame(Eff=T5c,EffCum=cumsum(T5c),Freq=T5c/sum(T5c),FreqCum=cumsum(T5c/sum(T
Eff EffCum Freq FreqCum(151,155] 10 10 0.20 0.20(155,159] 12 22 0.24 0.44(159,163] 11 33 0.22 0.66(163
10
12
h j = n jc+j cj .0
151.5
155.5
159.5
163.5
167.5
171.5
0.00
0.02
0.04
0.06
151.5
155.5
159.5
163.5
171.5
151.5
155.5
159.5
15
163.5
167.5
171.5
En langageR
>y=c(0,0,cumsum(T5c/sum(T5c)),1)
>x=c(148,151.5,155.5,159.5,163.5,167.5,171.5,175)
> plot(x,y,type="b",xlab="",ylab="",xaxt ="n")
> axis(1, c(151.5,155.5,159.5,163.5,167.5,171.5))
16
Chapitre2
xj nj fjC 9 0.45M 7 0.35V 2 0.10D 2 0.10n= 20 1le mode est C: celibataire.Remarque 2.1 Le mode peut e
On peut aussi faire les calculs avec les valeurs distinctes et les effectifs.ere
Onleconsid`
tableau:
xj
0
1
2
3
4
nj
2
3
1
1
1
8
x = 2 0+ 3 1+ 1 2 +1 3+ 14
8
= 3+ 2 +3 +4
8
= 1.5.Remarque 2.2 La moyenne nest pas necessairementune valeurpossible.
Remarques sur le
xi =x 1 +x 2 +x 4 +x 5.
i=1
i=3
=na
n
(a constante).
fois
2.1.4 Moyenne g
eom
etrique
Si xi 0, on app elle moyenne
eom
g
etrique la quantit
e
G=
xi
1/n
=(x 1 x 2 xn )
1/n
=exp
1
logxi .
n i=1
Le bon taux moyen est bien G et non x, car si on applique 4 fois le taux moyen G aux 100 francs, on obtien
100 Fr G4 = 100 1.0994313774 = 146.1075 Fr.
Remarque 2.3 Il est possible de montrer que la moyenne harmonique est toujours
erieure ou
inf
egale `a la
moyennegeometrique qui est toujours
erieure
infou
egale `a la moyenne arithm
etique
H G x.
i=1 wi xi
n
i=1 wi
Exemple 2.5 Supp osons que les notes soient ponderees par le nombre
edits,et
de cr
que les notes de
letudiant soient les suivantes : Note 5 4 3 6 5Credits 6 3 4 3 4La moyenne ponderee des notes par les c
20=
92
= 4.6.
20
2.1.7 La medianeLa mediane, notee x1/2, est une valeur centrale de la serie statistique obtenue d
On trie la serie statistique par ordre croissant des valeurs observees. Avec la serie observee :3 2 1 0
epartition pour la valeur 1/2 :x1/2 =F1(0.5).En langage R 21
1.00
0.00
0.50
0 01 1 2 234
La mediane est alors la moyenne de ces deux valeurs :x1/2 = 1+22 = 1.5.La Figure 2.2 montre la f
0.00
0.50
1.00
En g
en
eral on note
x(1) , ....,x(i) , ....,x(n)
la serie ordonn
ee par ordre croissant. On app elle cette
erie ordonn
s eela statistique dordre. Cette notation,
tr`es usuelle en statistique, permet
efinir
de d
la m
ediane de mani`
ere tr`
es synth
etique.
Si n estimpair
x1 /2 =x ( n+1 )
2
Si n estpairx
1 /2 =
1
x n +x ( n +1) .
2
2 (2)
eralise la m
ediane. Formellement un quantile este donn
par linverse de la fonction de repartition : xp =F1(p).
Le troisi`
eme quartile : Comme np = 0.75 12 = 9 est un nombre entier, ona
x3 /4 =
x(9) +x (10)
25 +27
=
= 26.
2
2
En langage Rx=c(12,13,15,16,18,19,22,24,25,27,28,34)
quantile(x,type=2)Exemple 2.7 Soitlaseriestatistique 12,13, 15, 16,18, 19, 22, 24,25, 27 contenant10obs
Le premier quartile : Comme np = 0.25 10 = 2.5 nest pas un nombre entier, ona
x1 /4 = x( 2 .5) =x (3) = 15.
La mediane : Comme np = 0.5 10 =5 est un nombre entier, ona
x1/2 = 12 x(5) + x(6) = (18 + 19)/2 = 18.5.
Le troisi`eme quartile : Comme np = 0.75 10 = 7 .5 nest pas un nombre entier, ona
x3/4 = x( 7.5 ) = x(8) = 24.En langage Rx=c(12,13,15,16,18,19,22,24,25,27)quantile(x,type=2) 2.2
Para
2.2.3 La variance
La variance estla somme des es
carr
des
ecarts `a la moyennedivis
ee par le nombredobservations:
n
s2x =
1
2
(xi x)
.
n i=1
s2x =
1
x2 x2.
n i=1 i
(2.1)
(x2i 2xi x + 2x
)
i=1
n
n
= 1n ni=1 x2i 2 1n ni=1 xix
nn+1
1
1
2
2
x
=
x2i 2x
xi + x
n
n
i=1
i=1
i=1
La variance peut egalementetre definie `a partir des effectifs et des valeurs distinctes:
s2x = 1n Jj=1nj(xj x)2.La variance peut aussi secrire s2x = 1n Jj=1njx2j x2.Quand on veut estimer une va
selectionnee au hasard) de taille n, on utilise la variance corrigee divisee par n1.S2x = 1n1 ni=1(xi
2+3+4+4+5+6+7+98 = 5,25
1
2
(xi x)
n i=1
sx2=
=1
2
2
2
2
2
2
2
8 (2 5)2 + (3 5)
+ (4 5)
+ (4 5)
+ (5 5)
+ (6 5)
+ (7 5)
+ (9 5)
= 18 [9 + 4 + 1 + 1 + 0 + 1 + 4 + 16]
= 368= 4.5.On peutegalement utiliser la formule (2.1) de la variance,
ce quin
ecessitemoins de calcul
(surtout quand
la moyenne nest pas un nombreentier).
s2x = 1n ni=1 x2i x
2
= 18 (22 + 32 + 42 +4
2
+5 2 +62 +72 +9 2) 52
= 18(4 +9 + 16 + 16 + 25 + 36 + 49 + 81) 25
r
i=1x i .
mr = 1n ni=1 (xi x)r .Les moments generalisent la plupart des param`etres. On a en particulier m1 = x
etrie
et laplatissement.2.4 Param`etres de forme2.4.1 Coefficient
normalise par la distance interquartile :AY = x3/4 +x1/4 2x1/2x3/4 x1/4 .27
dasymetrie de Fi
0.0175
0.6
0.015
0.5
0.0125
0.4
0.01
0.3
0.0075
0.2
0.005
0.1
0.0025
2
2.6 2.8
i=1x i
= a+ bx.
Theor`eme 2.3 Si on effectueun changement dorigine et dunitesur une variable x, alors sa varianceest
affectee par le carre du changement duniteet pas parle changement dorigine.
Demonstration Si yi = a+ bxi, alorss2y = 1n ni=1 (yi y)2 = 1n ni=1 (a + bxi a b x)2 = b2 1n ni=1 (xi
s2x .
Remarque 2.71. Les param`etres de position sont tous affectes par un changement dorigine et dunite.2
dorigine.3. Les param`etres de forme et daplatissement ne sont affectes ni par un changement dunite n
, xnA+1, xnA+2, .. ., xn1, xnobservations de GB .On definit les moyennes des deux groupes : 29
1
la moyenne du premier groupA e=x
nA
nA
xi ,
i=1
1
lamoyenne du deuxi`
eme group eB x
=
xi .
nB i=n +1
A
La moyenne generale est une moyenne
er
eepond
par la taille des groupes des moyennes des deux group es.
En effet x=
nA
n
1
1
xi +
xi = (nA x
A +n B x
B ).
n i=1
n
i =n +1
A
On note que nAi=1(xi x)2= nAi=1(xi xA + xA x)2= nAi=1(xi xA)2 + nAi=1(xA x)2 +2 nAi=1(xi xA)(xA
Evidemment,
les tiges peuvent
etre
definies par les centaines, ou des millers, selon lordre de grandeur deetudi
la variable
ee.
qui p ermet de representer la distribution dune variable. Ce diagramme est comp ose de : Un rectangle
pondant `a la mediane. Ce rectangle est complete par deux segments de droites. Pour les dessiner, on
extremes.Exemple 2.9 On utilise une base de donnees de communes suisses de 2003 fournie par lOffic
etriedeladistribution,ausenso`uilyabeaucoupdepetitescommunesetpeudegrandescommunes.Legraphiquem
1000
2000
3000
4000
5000
Fig. 2.5 Botes `a moustaches p our la variable sup erficie en hectares (HApoly) des communes du canton
de Neuchatel# Etape 1: installation du package sampling
Exemple 2.10 On utilise une base de donnees belges fournie par lInstitut National (b elge) de Statistique
contenant des infirmations sur la population et les revenus des p ersonnes physiques dans les communes. O
sinteresse `a la variable revenu moyen en euros par habitant en 2004 pour chaque commune (variable a
rageincome) et lon aimerait comparer les 9 provinces b elges : Anvers, Brabant, Flandre occidentale, Fland
orientale,Hainaut, Li`ege, Limboug, Luxembourg, Namur. La Figure 2.6 contientles botes`amoustachesdec
noms des provincesb=list("Anv."=averageincome[Province==1],"Brab."=averageincome[Province==2],"Fl.
40000
35000
30000
25000
20000
Anv.
Brab.
Fl.occ.
Fl.or.
Hainaut
Lige
Limb.
Lux.
Namur
Fig. 2.6 Botes `a moustaches du revenu moyen des habitants des communes selon les provinces belge
esum
es dans le tableau
suivant : 43 43 43 47 4848 48 48 49 4949 50 50 51 5152 53 53 53 5454 56 56 56 5759 59 59 62 6263 63 6
classes.Exercice 2.3 33
1. Montrez que
s2x =
1
2n2
(xi x j )2.
i=1 j=1
2. Montrez que
sx E
3. Montrez que, si xi >0,
n1
.
2n
1
|xi x| 2x.
n i=1
34
Chapitre3
Chacune des deux variables peut etre, soit quantitative, soit qualitative. On examine deux cas.
Les deux variablessont quantitatives. Les deux variablessont qualitatives. 3.2
Deux variables
100
90
80
60
70
poids
155
160
165
170
175
180
185
190
taille
y = 1n ni=1 yi, s2y = 1n ni=1(yi y)2.Ces param`etres sont appeles param`etres marginaux : variances ma
ecarts-types
marginaux, quantiles marginaux, etc...3.2.3
Demonstration
n
sxy
1
(xi x )(y
i y)
n i=1
1
(xi yi y i x
yxi + x
y)
n i=1
1
1
1
1
xi yi
yi x
y
xi +
x
y
n i=1
n i=1
n i=1
n i=1
=1
n
xi yi x
y x
y + x
y
i=1
= 1n ni=1 xiy
i
x
y.
r2xy = s2xys2x s2y .Remarque 3.2 Le coefficient de correlation mesure la dependance lineaire entre deux
cependant avoir une dependance non-lineaire avec un coefficient de correlation nul. 3.2.5 Droite de
commet (voir Figure 3.3) en utilisant la droite de regression pour predireyi `a partir de xi. Les residus peu
r=1
r=1
r=0
r>0
r<0
r=0
ei
y *i
70
80
yi
60
poids
90
100
155
160
165
170
175
180
185
taille
190
En langageR
# Graphique avec le residus
plot(taille,poids)
segments(158,a+b*158,190,a+b*190)
segments(180,a+b*180,180,96,col="red")
#text(178,90,expression(e))
text(178.7,89.5,"i")#arrows(180,a+b*180,156,a+b*180,col="blue",length=0.14)
arrows(180,60,180,a+b*180,col="blue",length=0.14)
arrows(180,96,156,96,col="blue",length=0.14)
#text(154.8,86,expression(y))text(155.5,85.5,"i")#text(154.8,97,expression(y))text(155.5,97.8,"*")text(155
es qui consiste `a
chercher la droite qui minimise la somme des carres des residus :M(a, b) = ni=1 e2i = ni=1 (yi a bxi)2 .Th
es sont donn
es par:
b = sxys2x et a= y bx.Demonstration Le minimum M (a,b) en a,b sobtient en annulant les derivees
et b. M(a,b)a = ni=1 2 (yi a bxi) = 0M(a,b)b = ni=1 2 (yi a bxi) xi = 0On obtient un sys
La premi`
ereequation montre que la droite passe par le point
y). On
( x,
obtient
a =y bx.
En remplacant a par
y bx dans la seconde
equation, ona
n
1
1
xi yi (y bx) x b x2i
n i=1
n i=1
n
1
1
xi yi x
y b
x2 x2
n i=1
n i=1 i
=s
xy
bs2x
= 0,
ce qui donnes
xy
bs2x =0.
Donc b=
sxy
.
s2x
On a donc identifie les deux param`etres b= sxys2x (la pente)a = y b x = y sxys2x x (la consta
80
60
70
poids
90
100
160
165
170
175
180
185
190
taille
De plus, ni=1 xiei = 0.La demonstration est un peu plus difficile. 3.2.7
e2i .
SCR ES =
i=1
s2e =
SCR ES
1
=
e2.
n
n i=1 i
i=1
(yi y i)(yi y)
= SCRES + SCREGR +2 ni=1(yi yi )(yi y).Le troisi`eme terme est nul. En effet,ni=1(yi yi )(yi y) = ni=
Demonstration
n
s2y
1
(y y)2
n i=1 i
1
n i=1
s2xy 1
2
(xi x)
s4x n i=1
sxy
y
+ 2 (xi x)
y
sx
s2xy
s2x
s2xy
=s 2y 2 2
sx sy
= s2y r2.
=
ei2.
Theor`eme 3.5 La variance residuelle peut egalement secrires 2e = s2y(1 r2),o`u r2 est le coefficient d
....,yk , ....,yK .
yk
n1k
..
yK
n1K
..
.
total
n1.
njk
..
njK
..
.
nj.
nJK
nJ.
n
x J nJ 1 nJk
total n. 1 n.kn
.K
Les nj. et n.k sont app eles les effectifs marginaux. Dans ce tableau,
nj. represente le nombre de fois que la mo dalite xt,
j appara
n.k represente le nombre de fois que la mo dalite yk apparat, nj k represente le nombre de fois que
On a les relations Jj=1njk = n.k, pour tout k= 1,...,K,Kk=1njk = nj., pour tout j= 1,...,J,et Jj=1nj. = Kk=1n.k = Jj=1 Kk=1n
Le Tableau 3.1 reprend le tableau de contingence.Tab. 3.1 Tableau des effectifs njkBleu Vert Marron TotalHo
f .k =
n.k
, k = 1, ..., K.
n
Le tableaudes fr
equences est
x1
..
.
y1
f 11
..
.
yk
f 1k
..
.
yK
f 1K
..
.
total
f 1.
xj
..
.
f j1
..
.
f jk
..
.
f jK
..
.
f j.
xJ
f J1
total f .1
f Jk
f .k
f JK
f .K
f J.
1
Total
0.40
0.60
1.00
equences
en colonnes (appeles aussi profils lignes et profils colonnes).Les profils lignes sont definis parf(j)k = njknj. =
nj. n.k
.
n
(3.1)
Le khi-carre p eut etre normalise p our ne plus dep endre du nombre dobservations.
On d
efinit le phideux par : 2 = 2obsn .Le 2 ne depend plus du nombre dobservations. Il est possible de montrer que2
tableau ait le meme nombre de lignes quede colonnes).Exemple 3.5 Le Tableau 3.5 reprend le tableau de
Homme
Femme
Total
Bleu Vert
-2
6
2
-6
0
0
Marron Total
-4
0
4
0
0
0
Le khi-carre observe vaut 2obs = 3.03. Le phi-deux vaut 2 = 0.01515. Comme le tableau a deux lig
au 2 . On a V = 0.01515. La dep endance entre les deux variables est tr`
es faible.
egal
rep("bleu",times=20),rep("vert",times=60),rep("marron",times=40))sexe= c(rep("homme",times=80),rep("f
Tableaudecontingence: effectifsnjkNiveaudinstruction Statutprofessionneldufilsdufilsparrapport parrapporta
Egal inf
erieur
0.231 0.147
0.079 0.058
0.038 0.053
0.349 0.257
total
0. 700
0. 192
0. 108
1. 000
Egal inf
erieur total
0. 330 0. 210
1
0. 413 0. 300
1
0. 356 0. 489
1
0. 349 0. 257
1
Tab. 3.12 Tableau des effectifs theoriques njkX\Y Plus eleve Egal inferieur totalplus eleve 114.72
1.24 12.52 2obs = 25.81On a donc 2obs = 25.812 = 2obsn = 25.81416 = 0.062V = 2min(J 1,K 1) =
ni=i
yi = 10783, ni=i xi = 1473,ni=i y2i = 4001293, ni=i x2i = 80145,ni=i xiyi = 553747,1. Donnez les moyennes
2. Donnez la droite de regression, avec comme variable dep endante la consommation de glaces et com
variableexplicativelatemperature.3. Donnezlavaleurajusteeetleresidupourlapremi`ereobservationdutable
etationdececoefficient.3. DeterminezladroitederegressionY enfonctiondeX.4. Etablissez,surbasedumod`e
2 14 16 8 13 20 24 7 5 11
3 13 17 12 10 8 20 7 2 8
Chapitre4
Un indice est la
ef
erence. Prenons lexemple du tableau
4.1 contenant le prix (fictif) dun bien de consommation de 2000 `a 2006. Le temps varie de 0, 1, 2, .. ., 6 e
est considere comme le temps de reference par rapp ort auquel lindice
e.
est calcul
4.2.1 Propri
et
es des indices
Consid
erons un indice quelconque I (t/0) . On dit que cet indice
edeples
oss`
propri
et
es de
2
reversibilit
e si I (t/0) = 100
I (01 /t) ,
identite si I(t/t) = 100,
circularite(ou transitivit
e) si I (t/u) I (u/v ) = 100 I (t/v).
Il est facile de montrerque ces quatre propri
et
es sont satisfaites pour un indice simple.
Temps 0 12
Prix ( p0 i ) Quantites ( q0 i ) Prix ( p1 i ) Quantites (q 1i ) Prix
es (q2i )
2i )(p Quantit
Bien 1 100 14 150 10 200
8
Bien 2 60 10 50 12 40
14
Bien 3 160 4 140 5 140
5
Il existe deux metho des fondamentales p our calculer les indices de prix, lindice de Paasche et lindice
Laspeyres.4.2.3 Indice de LaspeyresLindice de Laspeyres, est defini parL(t/0) = 100 ni=1 q0iptini=
w0iIi(t)ni=1 w0i = ni=1 p0iq0i100 ptip0ini=1 p0iq0i = 100 ni=1 q0iptini=1 p0iq0i .Lindice de Laspeyres ne poss`ede n
n
i=1
n
i=1
q0i p1i
14 150 + 10 50+4 140
= 100
= 119 .6970,
14 100 +10 60+ 4 160
q0i p0i
n
i=1
n
i=1
n
i=1
n
i=1
q0i p2i
14 200 + 10 40+4 140
= 100
= 142 .4242,
14 100 +10 60+ 4 160
q0i p0i
q1i p2i
10 200 + 12 40+5 140
= 100
= 113 .5714.
q1i p1i
10 150 +12 50+ 5 140
On utilise, pour le calculer, les quantites qti du temps par rapp ort auquel on veut calculer lindice.
Lindice de Paasche peut aussi etre presente comme une moyenne harmonique
er
ee des
p ond
indices
simples. Soient lindice simple du bien i : Ii(t/0) = 100 ptip0i ,et le poids wti correspondant `a la recette tota
er
es par
les recettes au temps t :P (t/0) = ni=1 wtini=1 wti/Ii(t/0) = ni=1 ptiqtini=1 ptiqti p0i100pti = 100 ni=1 qtiptini=1 qtip0i .L
difficile `a calculer que lindice de Laspeyres, car on doit connatre les quantites pour chaque valeur de t.E
FisherLindice de Laspeyres est en general plus grand que lindice de Paasche, ce qui peut sexpliquer p
L(t/0) P (t/0).
F(2/0)=
F(2/1)=
4.2.6 Lindice de SidgwickLindice de Sidgwick est la moyenne arithmetique des indices de Paasch
S (t/0) = L(t/0) + P (t/0)
2.
4.2.7 Indices chanesLe defaut principal des indices de Laspeyres, de Paasche, de Fisher et de Sidg
edent
pas la propriete de circularite. Un indice qui poss`ede cette propriete
eindice cha
est
ne.
app
Pour
el construire
un indice chane, avec lindice de Lasp eyres, on peut faire un produit dindice de Lasp eyre annuels.
CL(t/0) = 100 L(t/t 1)100 L(t 1/t 2)100 L(2/1)100 L(1/0)
100.
Pour calculer un tel indice, on doit evidemment connatre les quantites pour chaqueLindice
valeur de t.
suisse des prix `a la consommation est un indice chane de Laspeyres.Exemple 4.4 En utilisant encore les
j=1 x(j)
nj =1x
(j)
La courb e de Lorenz est la representation graphique de la fonction qui `a la part des individus les moin
riches asso cie la part y du revenu total quils p ercoivent.
Plus pr
ecis
ement,la courb e de Lorenz relie les
points (i/n, qi) pour i = 1, .. ., n. En abscisse, on a donc une proportion dindividus
esclass
par ordre de
revenu, et en ordonnee la prop ortion du revenu total recu par ces individus.
Exemple 4.5 On utilise une enquetemenage sur le revenudans
egion
une
desrPhilippines app
eeel
Ilo cos.
Cette enquete de 1997 sur le revenu des menages a ete pro duite par lOffice philippin La
de Statistique.
courbe de Lorenz est presentee en Figure 4.1.Fig. 4.1 Courb e de Lorenz 0.0
1.0
proportionderevenu
0.8
0.6
0.4
0.2
0.0
0.2
0.4
0.6
0.8
1.0
proportiondemenages
Remarque4.1Surlegraphique,onindiquetoujoursladiagonale.LacourbedeLorenzestegale`aladiagonalesitou
##CourbedeLorenzetindicesdinegalite
##Etape1:oninstallelapackageineq
utils:::menuInstallPkgs()
#choisirineqdanslaliste
##Etape2:onchargelepackageineq
local({pkg<-select.list(sort(.packages(all.available=TRUE)))
+if(nchar(pkg))library(pkg,character.only=TRUE)})
#choisirineqdanslaliste
##UtilisationdelabasededonneesIlocos
#Enqu^etesurlerevenudelOfficedeStatistiquePhilippin
data(Ilocos)attach(Ilocos)#plot(Lc(income),xlab="proportiondemenages",
ylab="proportionderevenu",main="")4.3.3IndicedeGiniLindicedeGini,noteGestegal`adeuxfoislasurf
Ilestpossibledemontrerque:G=1n(n1)ni=1nj=1|xixj|2x.Enutilisantlastatistiquedordrex(1),...,x(i),...,x(n),lindiced
ecrire
G=1n12ni=1ix(i)nx(n+1).LindicedeGiniestcomprisentre0et1.Silestprochede0,touslerevenussontegaux.S
1,lesrevenussonttr`esinegaux.4.3.4IndicedeHooverLindicedequirepartitiondeHoover(ouRobinHoo
e`alacourbedeLorenz,carilestpossibledemontrerquilcorrespond`alaplusgrandedistanceverticaleentrelacour
Lequintileshareratioestdefinitpar
QSR=
S80
.
S20
DSR=
S90
.
S10
Ledecileshareratioestd
efinitpar
Cesquantitessonttoujoursplusgrandesque1etaugmententaveclin
egalit
e. Cesdeuxrapportssont
facilementinterpretables,parexemplesi
leQSR=5, celasignifiequelerevenumoyendes20%lesplus
richesest5foisplusgrandquelerevenumoyende20%lespluspauvres.
4.3.6IndicedepauvreteUnindicesimpledepauvreteconsiste`acalculerlepourcentagedelapopulationg
moitiedelamediane.4.3.7IndicesselonlespaysLetableau4.4reprendpourtouslespayslindicedeGini
etlerapportdes20%lesplusrichessurles
20%lespluspauvres.(reference:UnitedNations2005DevelopmentProgrammeReport,page270).
ExercicesExercice4.1Etudiezlesproprietes(circularite,reversibilite,identit
eettransitivit
e)detouslesindicesde
prixpresentes.57
Tab.4.4Mesuresdelinegalit
eparpays
Rang
Pays
Indice
deGini
24.7
24.9
25
25
25.4
25.8
DSR
QSR
Annee
delenquete
1997
1993
2000
1996
1996
2000
1996
2001
2000
2000
2002
1998
2002
2000
1998
1983
2001
1999
1997
1999
2002
1998
2000
1999
2002
1
Denmark
8.1
4.3
2Japan
4.5
3.4
3Sweden
6.2
4
4Belgium
7.8
4.5
5CzechRepublic
5.2
3.5
6Norway
6.1
3.9
7Slovakia25.8
6.7
4
8BosniaandHerzegovina
26.2
5.4
3.8
9Uzbekistan26.8
6.1
4
10Finland26.9
5.6
3.8
11Hungary26.9
5.5
3.8
12RepublicofMacedonia
28.2
6.8
4.4
13Albania28.2
5.9
4.1
14Germany28.3
6.9
4.3
15Slovenia28.4
5.9
3.9
16Rwanda28.9
5.8
4
17Croatia29
7.3
4.8
18Ukraine296.4
4.3
19Austria307.6
4.7
20Ethiopia306.6
4.3
21Romania30.38.1
5.2
22Mongolia30.317.89.1
23Belarus30.46.94.6
24Netherlands30.99.25.1
25Russia317.14.8
26SouthKorea31.67.84.71998
27Bangladesh31.86.84.62000
28Lithuania31.97.95.12000
29Bulgaria31.99.95.82001
30Kazakhstan32.37.55.12003
31Spain32.595.4199032India32.57.34.9199933Tajikistan32.67.85.2200334France32.79.15.6199535Pakistan337.64.819983
a57.833.117.92000117Brazil59.36826.42001118Guatemala59.955.124.42000119Swaziland60.949.723.81994120CentralAf
Chapitre5
Seriestemporelles,filtres,moyennes
mobilesetdesaisonnalisation
5.1Definitionsgeneralesetexemples
5.1.1DefinitionsDefinition5.1Uneserietemporelleestunesuitedobservationsdunequantit
erep
et
eedansletemps.
Onenonceengenerallhypoth`esequelesintervallesdetempssontequidistants.Las
erietemporelleestnot
ee
y1,...,yt,...,yT.OnnoteegalementT={1,2,...,t,...,T}lensembledesinstantsauxquelslesobservationssontr
ealis
ees.
Uneserietemporellepeutsecomposerde:unetendanceTt,unecomposantecycliqueCt(nousnetudieronspasc
isoleretestimerunecomposantesaisonni`ere,etdesaisonnaliserlaserie,realiseruneprevisionpourdesvaleu
QTR:Quarter,trimestresdepuisle1ertrimestre1978jusquau4`emetrimestre198559
DISH:Nombredelave-vaisselles(dishwashers)exp
edi
es(milliers)
DISP:Nombredebroyeurdordures(disposers)exp
edi
es(milliers)
FRIG:Nombreder efrig
erateursexp
edi
es(milliers)
WASH:Nombredemachines`alaver(washingmachine)exp
edi
es(milliers)
DUR:DepensesenbiensdurablesUSA(milliardsdedollarsde1982)
RES:Investissementresidentielpriv
eUSA(milliardsdedollarsde1982)
Tab.5.1BiensmanufacturesauxUSA
QTRDISH
DISP FRIG WASH DUR RES
1841
798 1317 1271 252.6 172.9
2957837
1615 1295 272.4 179.8
3999821
1662 1313 270.9 180.8
4960858
1295 1150 273.9 178.6
58948371271
1289 268.9 174.6
68518381555
1245 262.9 172.4
78638321639
1270 270.9 170.6
88788181238
1103 263.4 165.7
979286812771273
260.6 154.9
1058962312581031
231.9 124.1
1165766214171143
242.7 126.8
1269982211851101248.6
142.2
1367587111961181258.7
139.3
1465279114101116248.4
134.1
1562875914171190255.5122.3
165297349191125240.4110.4
174807069431036247.7101.2
1853058211751019249.1103.41955765912691047251.8100.120602837973918262.0115.8216588671102
erateursvendusamanifestementunecomposantesaisonni`ereetunetendance.EnlangageRQTR=c(1,2,3,4,5,
DUR
1978
1980
1982
1984
1986
Time
1400
1000
FRIG
Fig.5.1DepensesenbiensdurablesUSA(milliardsdedollarsde1982)
1978
1980
1982
1984
1986
Time
Fig.5.2Nombrederefrigerateursvendusde1978`a1985
DISP=c(798,837,821,858,837,838,832,818,868,623,662,822,871,791,759,734,706,
582,659,837,867,860,918,1017,1063,955,973,1096,1086,990,1028,1003)
FRIG=c(1317,1615,1662,1295,1271,1555,1639,1238,1277,1258,1417,1185,1196,1410,1417,919,943,1175
1242,1684,1764,1328)WASH=c(1271,1295,1313,1150,1289,1245,1270,1103,1273,1031,1143,1101,1181,1
4,161.9,159.9,170.5,173.1,170.3,169.6,170.3,172.9,175,179.4)plot(QTR,DUR,type="l")plot(QTR,FRIG,type=
Tab.5.2Indicedesprix`alaconsommation(France)
1974
127.4
129.1
130.6
132.7
134.3
135.8
137.5
138.6
140.1
141.8
143.1
144.3
1975
145.9
147.0
148.2
149.5
150.6
151.7
152.8
153.8
155.1
156.3
157.3
158.2
1976
159.9
161.0
162.4
163.8
164.9
165.6
167.2
168.4
170.2
171.8
173.2
173.8
1977
174.3
175.5
177.1
179.4
181.1
182.5
184.1
185.1
186.7
188.2
188.9
189.4
1978
190.3
191.7
193.4
195.5
197.4
198.9
201.5
202.5
203.8
205.7
206.8
207.8
140
100
Iprix
180
pt
1970 1971 1972 1973
janvier
97.9 102.5 108.3 115.5
fevrier98.2
103.0 108.9 115.8
mars98.5
103.4 109.4 116.4
avril99.0
104.0 109.8 117.2
mai99.4
104.7 110.4 118.3
juin99.8105.1
111.0 119.2
juillet100.0105.6
111.9 120.2
aout100.4106.0
112.5 121.0
septembre100.8106.5 113.2 122.1
octobre101.2107.1114.2
123.4
novembre101.6107.5114.9
124.5
decembre101.9108.0115.5125.3
1970
1972
1974
1976
1978
Time
1.010
1.000
Iprix/lag(Iprix,1)
Fig.5.3Indicedesprix`alaconsommationptTime
1970
1972
1974
1976
1978
1.14
1.10
1.06
Iprix/lag(Iprix,12)
Fig.5.4Rapportmensueldesindicesdeprixpt/pt1Time
1972
1974
1976
1978
Fig.5.5Rapportenglissementannueldesindicesdeprixpt/pt12#Iprix=c(97.9,98.2,98.5,99,99.4,99.8,100,100.4
108.3,108.9,109.4,109.8,110.4,111,111.9,112.5,113.2,114.2,114.9,115.5,
115.5,115.8,116.4,117.2,118.3,119.2,120.2,121,122.1,123.4,124.5,125.3,
127.4,129.1,130.6,132.7,134.3,135.8,137.5,138.6,140.1,141.8,143.1,144.3,
145.9,147,148.2,149.5,150.6,151.7,152.8,153.8,155.1,156.3,157.3,158.2,
159.9,161,162.4,163.8,164.9,165.6,167.2,168.4,170.2,171.8,173.2,173.8,
174.3,175.5,177.1,179.4,181.1,182.5,184.1,185.1,186.7,188.2,188.9,189.4,
190.3,191.7,193.4,195.5,197.4,198.9,201.5,202.5,203.8,205.7,206.8,207.8)
Iprix<-ts(Iprix,start=c(1970,1),frequency=12)
plot(Iprix)plot(Iprix/lag(Iprix,-1))plot(Iprix/lag(Iprix,-12))Exemple5.4Donneesdunombredevoyageurs-kilom`
etresendeuxi`
emeclasseexprim
eesenmillionsde
kilom`etres.Tab.5.3TraficdunombredevoyageursSNCF
mois/anneejanv.fev.marsavrilmaijuinjuil.
aout sept.
oct.
nov.
d
ec.
trafic
19631750156018202090191024103140
2850 2090 1850 1630 2420
19641710160018002120210024603200
2960 2190 1870 1770 2270
196516701640177021902020261031902860
2140 1870 1760 2360
196618101640186019902110250030302900
2160 1940 1750 2330
196718501590188022102110248028802670
2100 1920 1670 2520
1968183417921860213821152485258126392038
1936 1784 2391
1969179818501981208521202491283427251932
2085 1856 2553
19701854182320052418221927222912277121532136
1910 2537
19712008183521202304226421752928273821782137
2009 2546
19722084203421522522231826842971275922672152
1978 2723
197320812112227926612281292930892803229622102135
2862
197422232248242127102505302133273044260725252160
2876
197524812428259629232795328735983118287527542588
3266
1976266726682804280629763430370530532764280227073307
1977270625862796297830533463364930952839296628633375
19782820285733063333314135123744317929842950289636111979331326442872326733913682
1965
1970
1975
Fig.5.6TraficdunombredevoyageursSNCF63
1980
5.2Descriptiondelatendance
5.2.1Lesprincipauxmod`
eles
Plusieurstypesdemod`
elespeuvent
etreutilis
espourdecrirelatendance.
Mod`elesdependantdutemps.Las
eried
ependdirectementdutemps.Lemod`
elepeutetreadditif:
yt =f(t)+E
t,
=f(t)E
t.
oumultiplicatify
t
Mod`elesexplicatifsstatiques:las
eriechronologiqued
ependdesvaleursprisesparuneouplusieurs
autresserieschronologiques.y
t =f(x t )+E t
Lecaslineaireestleplusfacile`atraiteryt=b
0
+b1xt +E t .
Mod`elesauto-projectifs.Laseriechronologiqueautempstd
ependdesespropresvaleurspass
ees
yt=f(yt1,yt2,yt3,...,y
tp )+E t
Mod`elesexplicatifsdynamiques:laseriechronologiquedependdesvaleurspr
esentesetpass
eesdune
oudeplusieursautresserieschronologiques,parexemple:yt=+1yt1+2yt2++pytp+1xt1+2xt2
++
qxtq
+E t .
5.2.2TendancelineaireLatendancelaplussimpleestlineaire.Onpeutestimerlesparam`etresaumoyend
ethodedes
moindrescarres.Cestuneregressionsimple.Tt=a+bt.5.2.3TendancequadratiqueOnpeututiliserune
desmoindrescarres.Cestuneregressionavecdeuxvariablesexplicatives.Tt=a+bt+ct25.2.4Tendancepo
eaire,onpeutseramener`aunprobl`emelineaire.Enposantzt=1/Tt,onazt=1+beatc64
zt+1
=
=
=
=
Enposant=
1+bea(t+1)
c
1+beat ea
c
1+(1+be at )ea ea
c
1e a
+z t ea .
c
1e a
, et=e
c
onobtientz
t+1
=+z t ,
cequiestunmod`eleauto-projectif.Onpeutalorsd
eterminerlesvaleursdeetparunesimpler
egression
lineaire.Ensuiteondeduitadelamani`eresuivante:
a=log,
etcomme=1eac=1
c,
0.3
0.2
0.1
0.0
logis(x)
0.4
0.5
ondeterminecparc=1.Enfin,onremarquequezt1c=beatc,onpeutdeterminerautantdevaleursdebquelo
Fig.5.7Exempledefonctionlogistiqueavecc=0.565
5.3Op erateursded
ecalageetdediff
erence
5.3.1Operateursded
ecalage
Afindesimplifierlanotation, onutilisedesoperateursded
ecalage.Ondefinitlop
erateurded
ecalage
retard(enanglaislagoperator)Lpar
Ly t =y t1 ,
etloperateur(enanglaisforwardoperator)avanceF
Fy t =y t+1 ,
loperateuridentiteIy
t
=y t .
Loperateuravanceestlinversedeloperateurretard
FL=LF=I.
OnpeutdoncecrireF1=LetL
=F.
OnaegalementL2yt=LLyt=yt2,Lqyt=ytq,Fqyt=yt+q,L0=F0=I,Lqyt=Fqyt=yt+q.5.3.2Operateurdiff
eedanslegraphique5.9.EnlangageR##Tendancelineaireetdifference#lin=10+0.3*(0:50)+rnorm(50,0,1)p
25
20
15
10
0
10
20
30
40
50
0 1 2
Fig.5.8S erieavecunetendancelin
eaired
ependantdutemps
10
20
30
40
50
Fig.5.9Differencedordreundelaserieavecunetendancelin
eaire
Onpeutconstruireloperateurdifferencedordredeuxenelevantaucarr
e:
2==I2L+L2Loperateurdifferencedordredeuxpermetdenleverunetendancequadratique.Eneffet,sila
eries
ecrit
yt=a+bt+ct2+Et,alors2yt=(I2L+L2)yt=a+bt+ct2+Et2a2b(t1)2c(t1)22Et1+a+b(t2)+
erateurs,lacomposantesaisonni`eredisparat.EnlangageR67
200
0
300
FRIGm4
1979
1980
1981
1982
1983
1984
1985
1986
Time
Fig.5.10Differencedordre4delavariableventeder
efrig
erateurs
##Ventederefrigerateursdifferencedordre4
#FRIGm4=FRIG-lag(FRIG,-4)plot(FRIGm4)Exemple5.7Sionappliqueunedifferencesaisonni`eredordre12sur
eesdunombredevoyageurskilom`etresytendeuxi`emeclasseexprimeesenmillionsdekilom`etresdelaSNCF,
latendancesaisonni`
ere
disparat(voirFigure5.12).Onaainsilanouvellevariablezt=12yt=(IL12)yt=ytyt12.Uneautremani`eredefairec
trafic
erence,
cequirevient`aprendrelelogarithmedurapportdelavariable(voirFigure5.13).Ond efinitainsi une
nouvellevariablevt:vt=12logyt=(IL12)logyt=logytlogyt12=logytyt12.Time
1965
1970
1975
1980
Fig.5.11TraficdunombredevoyageursSNCFEnlangageRtrafic=c(1750,1560,1820,2090,1910,2410,3140,285
1.2
1.0
0.8
difftrafic
1965
1970
1975
1980
Time
0.0
0.2
raptrafic
0.2
Fig.5.12Differencedordre12surlas
erietraficdunombredevoyageursSNCF
1965
1970
1975
1980
Time
Fig.5.13Logarithmedurapportdordre12surlaserietraficdunombredevoyageursSNCF
1834,1792,1860,2138,2115,2485,2581,2639,2038,1936,1784,2391,1798,1850,1981,2085,2120,2491,2834
806,2976,3430,3705,3053,2764,2802,2707,3307,2706,2586,2796,2978,3053,3463,3649,3095,2839,2966,2
eairesUnfiltrelineairedordrem=p1+p2estdefiniparFL=p2j=p1wjLj=wp1Lp1+wp1+1Lp11++w1L+w0I+w
o`up1,p2 Netw
R.
5.4.2Moyennesmobiles:d
efinition
Unemoyennemobiledordrem=p
1 +p 2 +1estunfiltrelineairetelque
p2
Beaucoupdemoyennesmobilesontdespoidsw
j positifs,maispastoutes.
Unemoyennemobileestsym
etriquesip1 =p 2 =p,et
wj =w j , pourtoutj=1,...,p.
Unemoyennemobilesymetriqueestditenon-pond
er
eesi
wj=cstpourtoutj=,p
1,...,p 2.
5.4.3Moyennemobileetcomposantesaisonni`
ere
Unemoyennemobileestunoutilinteressantpourlisserunes
erietemporelleetdoncpourenleverune
composantesaisonni`ere.Onutilisedepreferencedesmoyennesmobilesnon-pond
er
eesdordreegal`ala
periode,parexempledordre7pourdesdonneesjournali`eres,dordre12pourdesdonn
eesmensuelles.Par
exemple,pourenleverlacomposantesaisonni`eredueaujourdelasemaine,onpeutappliquerunemoyenne
mobilenon-pondereedordre7.MM(7)=17L3+L2+L+I+F+F2+F3
.
Cettemoyennemobileaccordelememepoids`achaquejourdelasemaine.Eneffet,
MM(7)yt=17(yt3+yt2+yt1+yt+yt+1+yt+2+yt+3).Pourlescomposantessaisonni`eresduneperiodepaire,iln
ees
non-ponderees.Ilexistedeuxtypesdemoyennemobilecentree:Silaperiodeestpaireetegale`am,(m=4pour
mobiledordreimpairaccordantundemi-poidsauxdeuxextremites.Parexemple,pourdesdonn
ees
trimestrielles,lamoyennemobileestdefinieparMM(4)=18L2+2L+2I+2F+F2.Ainsi,chaquetrimestreconservelem
eesserontperduesauxextremitesdelaseries.Exemple5.8Lavariablerefrigerateurestlisseegrace`a
1400
1000
FRIG
1978
1980
1982
1984
1986
Time
Fig.5.14Nombreder efrig
erateursetmoyennemobiledordre4
EnlangageRdec=decompose(FRIG)moving_average=dec$trendplot(FRIG)lines(moving_average)Unemoyen
sonni`ere.5.5Moyennesmobilesparticuli`eres 5.5.1MoyennemobiledeVanHan
eriode4et5etconservelestendancespolynomialesjusqu`alordre3. 5.5.3MoyennemobiledeHender
MoyennemobiledeHendersondordre2m3,o`um4
m+1
j L j ,
MM H =
j=m1
o`uj=
MoyennemobiledeHendersondordre2m3=5(m=4)
1286(21L
2
+84L+160I+84F21F
MoyennemobiledeHendersondordre2m3=9(m=6)
12431(99L424L3288L2+648L+805I+648F+288F2
24F 3 99F 4)
MoyennemobiledeHendersondordre2m3=11(m=7)
192378(2574L52475L4+3300L3+13050L2+22050L+25676I
+22050F+13050F2+3300F32475F
2574F5)
MoyennemobiledeHendersondordre2m3=15(m=9)1193154(2652L74732L62730L5+4641L4+160
+37422F+28182F2+16016F3+4641F42730F54732F62652F 7)
5.5.4MedianesmobilesSilesdonneescontiennentdesvaleursaberrantesouextremes,onpeutremplac
unemedianemobile.Parexemplelamedianemobiledordre5estdefiniepar:Med(5)t=Mediane(yt2,yt1,yt,yt+
eesetlatendanceSm=1A1a(YamTam).72
Engen
eral,onnedisposepasdum
emenombredobservations,pourchaquemois.Onproc`
ede`aunajustement
afinquelasommedescomposantessaisonni`
eressoit
egale`az
ero:
Sm =S m
1
M
Sm .
m
Onpeutensuiteproc
eder`alad
esaisonnalisationdelas
eriepar
Yam =Y am S m .
5.6.2Methodemultiplicative
Soituneserietemporelleregieparunmod`
elemultiplicatifdutype
Yam =T am S m E am .
o`ua=1,...,Arepresenteparexemplelanneeetm=1,..,Mrepr
esenteparexemplelemois.Latendance
estsupposeeconnuesoitparunajustement,soitparunemoyennemobile.
Onisolelacomposantesaisonni`ereenfaisant,pourchaquemois,lamoyennedesrapportsentrelesvaleurs
observeesetlatendance:Sm=1A1aY
am
.
Tam
`Anouveau,onrealiseunajustementafinquelamoyennedescomposantessaisonni`
eressoitegale`a1.On
corrigedonclescoefficientsSmparSm=Sm11MmSm.LadesaisonnalisationserealisealorsparunedivisionYam=YamS
erateurs.LeTableau5.4contientlavariableventederefrigerateurs,lamoyennemobiledordre4,lacomposantesaisonni`
ere
etseriedesaisonnaliseeaumoyendelamethodeadditive.LeTableau5.6presenteladesaisonnalisationau
moyendelamethodemultiplicative.EnlangageRdeco=decompose(FRIG,type="multiplicative")plot(deco) 5.
ediction`alhorizon1,etconsiste`arealiserunemoyennedesvaleurspasseesenaffectantdespoidsmoinsimpor
Tab.5.4D ecompositiondelavariableFRIG,m
ethodeadditive
QTR FRIG
MM FRIG-MM Desaison
1
1317
1442.58
2
1615
1505.13
3
1662 1466.50
195.50 1451.20
4
1295 1453.25
-158.25 1490.09
5
1271 1442.88
-171.88 1396.58
6
1555 1432.88
122.13 1445.13
7
1639 1426.50
212.50 1428.20
81238
1390.13
-152.13 1433.09
91277
1325.25
-48.25 1402.58
101258
1290.88
-32.88 1148.13
1114171274.13
142.88 1206.20
1211851283.00
-98.00 1380.09
1311961302.00
-106.00 1321.58
1414101268.75
141.25 1300.13
1514171203.88213.13
1206.20
169191142.88-223.88
1114.09
179431095.00-152.00
1068.58
1811751083.2591.75
1065.13
1912691109.88159.13
1058.20
209731150.88-177.881168.09
2111021218.50-116.501227.58
2213441296.5047.501234.13
2316411368.88272.131430.20
2412251454.13-229.131420.092514291512.00-83.001554.582616991512.00187.001589.132717491475.1
Tab.5.6D ecompositiondelavariableFRIG,m
ethodemultiplicative
QTR FRIG
MM FRIG/MM
Desaison
1
1317
1453.85
2
1615
1493.76
3
1662 1466.50
1.13 1434.00
4
1295 1453.25
0.89 1516.45
5
1271 1442.88
0.88 1403.07
6
1555 1432.88
1.09 1438.26
7
1639 1426.50
1.15 1414.15
81238
1390.13
0.89 1449.70
91277
1325.25
0.96 1409.70
101258
1290.88
0.97 1163.56
1114171274.13
1.11 1222.61
1211851283.00
0.92 1387.64
1311961302.00
0.92 1320.28
1414101268.75
1.11 1304.15
1514171203.881.18
1222.61
169191142.880.80
1076.15
179431095.000.86
1040.99
1811751083.251.08
1086.79
1912691109.881.14
1094.91
209731150.880.851139.39
2111021218.500.901216.51
2213441296.501.041243.10
2316411368.881.201415.88
2412251454.130.841434.482514291512.000.951577.492616991512.001.121571.452717491475.131.1915
eeparunedroitehorizontale.Autrementdit,onsupposequeXTa.75
Fig.5.15D ecompositiondelas
eriedeventesder
efrig
erateurs5.1
trend
1400
1500
1000
1300
1.15
1100
seasonal
1.00
100
0.85
0
random
100
observed
Decompositionofmultiplicativetimeseries
1978
1980
1982
1984
1986
Time
Lelissageexponentielpeutetreobtenuaumoyendelamethodedesmoindrescarr
esenminimisantena
lecrit`ereQ=T1j=0j(XTja)2.Enannulantladeriveeparrapport`aa,onobtient2T1j=0j(XTja)=0,cequidonne
eeparunedroitequelconquedetypea+b(tT).Onappliquealorsunlissageexponentieldoublepourobtenirlapred
Enannulantlesd
eriv
eespartiellesparrapport`aaetb,onobtient
T1
2
j (X Tj a+bj)=0
j=0
T1
2
j (X Tj a+bj)j=0.
j=0
cequidonne
T1
T1
T1
j X Tj a
j +b
j j =0
j=0
T1j=0jj
j=0
T1
j=0
T1
j j +b
X Tj a
j=0
j=0
Commeona
j=0
j 2j =0.
1
1
j=0jj=
(1) 2
j=0j2j=(1+)(1)3ona T1j=0jXTja1+b(1)2=0T1j=0jjXTja(1)2+b(1+)(1
EnnotantmaintenantS1TlaserielisseeS1T=(1)T1j=0jXTj,etS2TlaseriedoublementlisseeS2T=(1)T1j=0
Lesyst`
eme(5.1)peutalorss
ecrire
1
b
ST a +
=0
1
1
(1) 2
ST2
S1
a
b(1+)
T
+
=0.
2
(1)
1
(1) 2
(1) 3
Enresolvantcesyst`emeenaetb,onobtientfinalement
a=2S T1 S T2
1 1
(ST S T2 ).
b=
Exemple5.10Letableau5.8rendcompteduprixmoyendumazoutpour100 (achatentre800et1500
)enCHFpourchaquemoisde2004`a2007(Source:Officef
ed
eraldelastatistique,2008).
Tab.5.8PrixmoyenduMazoutpour100
(achatentre800et1500)
mois/annee200420052006
2007
janvier54.2363.0086.16
79.39
fevrier51.5167.3288.7081.32
mars55.6075.5288.9282.06
avril55.7279.8392.5888.05
mai58.7173.2293.6588.24juin58.8275.3891.8888.95juillet58.4183.9795.3592.10aout64.9284.2395.839
ecursiveXt(1)=(1)Xt+Xt1(1),X0(1)=X1,o`uS1t=Xt(1).Onobtient:S11=X1(1)=(1)X1+X0(1)=(1
Onobtient:
S12 =(1)S
1
1
+S 02 =(1)S
1
1
+S 11 =S 11 =54.23,
S22 =(1)S
1
2
+S 12 =0.353.414+0.754.23=53.99,
S32 =(1)S
1
3
+S 22 =0.354.070+0.753.99=54.01,
etainsidesuite.Oncherchealors
X t (k)=a+bk
pourchaquet.Onprendicik=1, X t (1)=a+bavec:
a =2S t1 S t2
1
0.3 1
b =
St1 S t2 =
S S t2
0.7 t
Letableau5.9rendcomptedesresultatspourlesann
ees2004`a2007.
Lafigure5.16representelaserieinitiale,lelissageexponentielsimpleetlelissageexponentieldoubleet
peutetreobtenueenlanguageRaumoyenducodesuivant:
#Lissageexponentieldoubleaveck=1mazout=c(54.23,51.51,55.60,55.72,58.71,58.82,+58.41,64.92,63.95,72
+79.83,73.22,75.38,83.97,84.23,97.29,99.31,89.88,87.18,+86.16,88.70,88.92,92.58,93.65,91.88,95.35,95.
+p*liss2[i-1]#formulerecursive}#Lissageexponentieldoubleaveck=1a=2*liss-liss2b=((1-p)/p)*(liss-liss2)liss
Tab.5.9Lissageexponentielsimpleetdoubledelas
erietemporellePrixmoyenduMazoutpour100litres
(achatentre800et1500litres)enCHF
ann
ee mois
Xt
St1
St2
a
b
a+b
2004
1
54.23 54.230 54.230 54.230 0.000 54.230
2
51.51 53.414 53.985 52.843 -0.245 52.598
3
55.60 54.070 54.011 54.129 0.025 54.154
455.72
54.564 54.177 54.952 0.166 55.119
558.71
55.808 54.666 56.950 0.489 57.440
658.82
56.712 55.280 58.144 0.614 58.757
758.41
57.221 55.862 58.580 0.582 59.163
864.9259.531
56.963 62.099 1.101 63.199
963.9560.857
58.131 63.582 1.168 64.750
1072.9864.494
60.040 68.947 1.909 70.856
1170.2566.22161.894
70.547 1.854 72.401
1268.2466.82663.374
70.279 1.480 71.759
2005163.0065.67864.065
67.292 0.691 67.983
267.3266.17164.697
67.645 0.632 68.277
375.5268.97665.98171.971
1.284 73.254
479.8372.23267.85676.608
1.875 78.483
573.2272.52869.25675.799
1.402 77.201
675.3873.38470.49676.272
1.238 77.510
783.9776.56072.31580.8051.819
82.624
884.2378.86174.27983.4431.964
85.407
997.2984.39077.31291.4673.033
94.501
1099.3188.86780.77896.9533.466100.420
1189.8889.17083.29695.0442.51897.562
1287.1888.57384.87992.2671.58393.850
2006186.1687.84985.77089.9280.89190.819288.7088.10486.47089.7380.70090.439388.9
1.41380.486281.3284.03487.15680.911-1.33879.573382.0683.44186.04180.842-1.11479.
110
90
prix
50 60 70 80
Lissageexponentielsimple
Lissageexponentieldouble
2004
2005
2006
2007
2008
temps
Fig.5.16EvolutionduprixdumazoutenCHF(achatentre800et1500),lissageexponentieldoubleetlissageexponen
Exercices
Exercice5.1Desaisonnalisezlas
eriesuivante(cestunes
erietrimestriellesur3ann
ees)
2417,1605,1221,1826,2367,1569,1176,1742,2804,1399,1063,1755
parlamethodeadditive,enutilisantunemoyennemobiledordre4.
Exercice5.2EnlangageRutilisezlaserieldeathsquiestunes
eriequisetrouvedanslepackagedebase
datasets.Lisezladocumentation,puisd
esaisonnalisezcettes
erieparlesm
ethodesadditiveetmultiplicative.82
Chapitre6
Calculdesprobabilit
esetvariables
aleatoires6.1Probabilites6.1.1Evenement
Uneexperienceestditeale
esultat.Onnoteunr esultat
possibledecetteexperiencealeatoire.Lensembledetouslesresultatspossiblesestnot
e.Parexemple,si
onjettedeuxpi`ecesdemonnaie,onpeutobtenirlesresultats={(P,P,),(F,P),(P,F),(F,F)},avecFpourfaceetPpour
erienceal
eatoire
commeavoirdeuxfoispileouavoiraumoinsunefoispile.Formellement,unev
enementestunsousensemblede.Levenementavoirdeuxfoispileestlesousensemble{(P,P,)}.Levenementavoiraumoinsu
Lensembleestappeleevenementcertain,etlensemblevideestappeleevenementimpossible.
6.1.2OperationssurlesevenementsSurlesevenements,onpeutappliquerlesoperationshabitu
enementAestobtenirunnombrepairetlevenementBobtenirunmultiplede3,levenementABestleve
Exemple6.1Lexperiencepeutconsister`ajeterund
e,alors
={1,2,3,4,5,6},
etunevenement,not
eA,estobtenirunnombrepair.Onaalors
A={2,4,6}etA={1,3,5}.
6.1.3Relationsentrelesev
enements
Evenementsmutuellementexclusifs
SiAB=onditqueAetBsontmutuellementexclusifs,cequisignifiequeAetBnepeuventpas
seproduireensemble.Exemple6.2Sionjetteunde,levenementobtenirunnombrepairetl
ev
enementobtenirunnombre
impairnepeuventpasetreobtenusenmemetemps.Ilssontmutuellementexclusifs.
Dautrepart,si lon
jetteunde,lesevenementsA:obtenirunnombrepairnestpasmutuellementexclusifavecl
ev
enement
B:obtenirunnombreinferieurouegal`a3.Eneffet,lintersectiondeAetBestnon-videetconsisteen
levenementobtenir2.InclusionSiAestinclusdansB,onecritAB.OnditqueAimpliqueB.Exemple6.3Sionje
A={2}etB={2,4,6}.OnditqueAimpliqueB.6.1.4Ensembledespartiesdunensembleetsyst`em
eP(.)estuneapplicationdeAdans[0,1],telleque:Pr()=1,PourtoutensembledenombrabledevenementsA 1
Tab.6.1Syst` emecompletd
ev
enements
A1
111111
000000
1111111
0000000
An
Apartirdesaxiomes,onpeutdeduirelespropri
et
essuivantes:
Propriete6.1Pr()=0.DemonstrationCommeestdintersectionvideavec,onaquePr()=Pr()+Pr()
Donc,Pr()=2Pr(),cequiimpliquequePr()=0.
Propriete6.2Pr(A)=1Pr(A).DemonstrationOnsaitqueAA=etAA=.Ainsi,onaquePr()=Pr(AA)=Pr(A
Propriete6.3Pr(A)Pr(B)siAB.DemonstrationCommeAB,onaB=(BA)A.Maisonaque(BA)A=.Ains
Demonstration
OnaqueAB=A(BA),
avecA(BA=).
AinsiPr(AB)=Pr(A)+Pr(BA).
Ilreste`amontrerquePr(B)=Pr(BA)+Pr(AB)
MaisB=(BA)(BA)
avec(BA)(BA)=
DoncPr(B)=Pr(BA)+Pr(BA)
Propriete6.5Prni=1Aini=1Pr(Ai)DemonstrationNotonsrespectivementB1=A1,B2=(A2\A1),B3=(A3\(A1A
2)),
B4=(A4\(A1A2A3)),...,Bn=(An\(A1A2A
n1 )).
Commeni=1Ai=ni=1Bi,etqueBiBjpourtoutj=i,alorsPrni=1Bi=ni=1Pr(Bi).Deplus,comme,pourtouti,BiAi,onaquePr(B
6.1.6Probabilit
esconditionnellesetind
ependance
Definition6.3Soientdeux
ev
enementsAetB,siPr(B)>0,alors
Pr(A|B)=
Pr(AB)
.
Pr(B)
Exemple6.5Sionjetteund e,etquelonconsid`
erelesdeux
ev
enementssuivants:
Alaprobabilitedavoirunnombrepairet
Blaprobabilitedavoirunnombresup
erieurouegal`a4.
OnadoncPr(A)=Pr({2,4,6})=12,Pr(B)=Pr({4,5,6})=36=12,Pr(AB)=Pr({4,6})=26=13,Pr(A|B)=Pr(AB)Pr
Pr(A|B)=Pr(A).OnpeutmontrerfacilementquesiAetBsontindependants,alorsPr(AB)=Pr(A)Pr(B).6.1.7The
Pr(B)=ni=1Pr(Ai)Pr(B|Ai).Tab.6.2Illustrationdutheor`emedesprobabilitestotales 00000
A1
An
Ai
111111
1111111
0000000
Eneffet,ni=1Pr(Ai)Pr(B|Ai)=ni=1Pr(BAi).CommelesevenementsAiBsontmutuellementexclusifs,ni=1Pr(BAi)=
Theor`
eme6.2(deBayes)SoitA 1,...,A
unsyst`
emecompletd
ev
enements,alors
Pr(A i |B)=
Pr(A i )Pr(B|A i )
.
Pr(A j )Pr(B|A j )
n
j=1
Eneffet,parletheor`
emedesprobabilit
estotales,
Pr(A i )Pr(B|A i )
Pr(BA i )
=
=Pr(A i |B).
Pr(B)
Pr(A j )Pr(B|A j )
n
j=1
Exemple6.6Supposonsquunepopulationdadultessoitcompos
eede30%defumeurs(A 1)etde70%
denon-fumeur(A2).NotonsBlevenementmourirduncancerdupoumon.Supposonsenoutreque
laprobabilitedemourirduncancerdupoumonestegale`aPr(B|A1) =20%si lonestfumeuretde
Pr(B|A2)=1%silonestnon-fumeur.Leth eor`
emedeBayespermetdecalculerlesprobabilit
esapriori,
cest-`a-direlaprobabilitedavoiretefumeursionestmortduncancerdupoumon.Eneffet,cetteprobabilit
e
estnoteePr(A1|B)etpeutetrecalculeeparPr(A1|B)=Pr(A1)Pr(B|A1)Pr(A1)Pr(B|A1)+Pr(A2)Pr(B|A2)=
0.30.2
0.06
=
0.896.
0.30.2+0.70.01 0.06+0.007
Laprobabilitedenepasavoiretenonfumeursionestmortduncancerdupoumonvautquant`aelle:
Pr(A2|B)=Pr(A2)Pr(B|A2)Pr(A1)Pr(B|A1)+Pr(A2)Pr(B|A2)=0.70.01
0.07
=
0.104.
0.30.2+0.70.01 0.06+0.007
6.2Analysecombinatoire6.2.1IntroductionLanalysecombinatoireestletudemathemat
natoireestunoutilutilisedanslecalculdesprobabilites. 6.2.2Permutations(sansrepetition)Unep
lensemble{1,2,3}.Ilexiste6mani`eresdordonnercestroischiffres:{1,2,3},{1,3,2},{2,1,3},{2,3,1},{3,1,2},{3
6.2.3Permutationsavecr
ep
etition
Onpeutegalementseposerlaquestiondunombredemani`
eresderangerdesobjetsquinesontpastous
distincts.Supposonsquenousayons2boulesrouges(not
eesR)et3boulesblanches(not
eesB).Ilexiste10
permutationspossiblesquisont:
{R,R,B,B,B},{R,B,R,B,B},{R,B,B,R,B},{R,B,B,B,R},{B,R,R,B,B},
{B,R,B,R,B},{B,R,B,B,R},{B,B,R,R,B},{B,B,R,B,R},{B,B,B,R,R}.
Silondisposedenobjetsappartenant`adeuxgroupesdetaillesn
1 etn 2,lenombredepermutationsavec
repetitionestn!
n1!n2!
Parexemplesilona3boulesblancheset2boulesrouges,onobtient
n!n1!n2!=5!
120
=
=10.
2!3! 26
Silondisposedenobjetsappartenant`apgroupesdetaillesn
1,n 2,...,n
avecrepetitionestn!n1!n2!np!.
p ,lenombredepermutations
6.2.4Arrangements(sansrepetition)Soitnobjetsdistincts.Onappelleunarrangementunemani`er
electionnerkobjetsparmilesnet
delesrangerdansdesbotesnumeroteesde1`ak.Danslapremi`erebote,onpeutmettrechacundesnobjets.Da
te, onpeutmettre
chacundesn1objetsrestants,danslatroisi`emebote,onpeutmettrechacundesn2objetsrestantset
ainsidesuite.Lenombredarrangementspossiblesestdoncegal`a:Akn=n(n1)(n2)(nk+1)=n!(nk)
tenircomptedeleurordre.Lenombredecombinaisonsestlenombredesous-ensemblesdetaillekdansun
ensembledetaillen.Soitlensemble{1,2,3,4,5}.Ilexiste10sous-ensemblesdetaille3quisont:{1,2,3},{1,2,4},{1,
ements,silonneveutpartenircomptedelordreondiviseAknpark!.Lenombredecombinaisonsdekobjetsparminva
6.3Variablesaleatoires
6.3.1Definition
Lanotiondevariableal
eatoireformaliselassociationdunevaleuraur
esultatduneexp
erienceal
eatoire.
Definition6.5Unevariableal
eatoireXestuneapplicationdelensemblefondamental
dansR.
Exemple6.7Onconsid`ereuneexp
erienceal
eatoireconsistant`alancerdeuxpi`
ecesdemonnaie.Lensemble
desresultatspossiblesest={(F,F),(F,P),(P,F),(P,P)}.
Chacundeselementsdeauneprobabilit
e1/4.Unevariablealeatoirevaassocierunevaleur`achacundes
elementsde.Consideronslavariableal
eatoirerepr
esentantlenombredeFacesobtenus:
X=
0 avecuneprobabilit
e1/4
1avecuneprobabilite1/2
2avecuneprobabilite1/4.
0.0
0.1
0.2
0.3
0.4
0.5
Cestunevariablealeatoirediscr`etedontladistributiondeprobabilit
esestpr
esent
eeenFigure6.1.
6.4.2Variableindicatriceoubernoullienne
LavariableindicatriceXdeparam`
etrep[0,1]aladistributiondeprobabilit
essuivante:
X=
1avecuneprobabilit
ep
0avecuneprobabilit
e1p.
Lesperancevaut=E(X)=0(1p)+1p=p,
etlavariancevaut2=var(X)=E(Xp)
2
=(1p)(0p)
+p(1p) 2 =p(1p).
Exemple6.8Ontireauhasardunebouledansuneurnecontenant18boulesrougeset12boulesblanches.Si
Xvaut1silabouleestrougeet0sinon,alorsXauneloibernoulliennedeparam`
etrep=18/(18+12)=0.6.
6.4.3VariablebinomialeLavariablealeatoirebinomialedeparam`etresnetpcorrespond`alexp
eriencesuivante.
Onrenouvelle
nfoisdemani`ereindependanteuneepreuvedeBernoullideparam`
etrep,o`upestlaprobabilit
edesucc`
es
pouruneexperienceelementaire.Ensuite,onnoteXlenombredesucc`
esobtenus.Lenombredesucc`
esest
unevariablealeatoireprenantdesvaleursenti`eresde0`anetayantunedistributionbinomiale.
UnevariableXsuituneloibinomialedeparam`etre0<p<1etdexposantn,si
Pr(X=x)=nxpxqnx,x=0,1,...,n1,n,
o`uq=1p,etnx=n!x!(nx)!.Demani`eresynthetique,siXaunedistributionbinomiale,onnote:XB(n,p).Rappe
dubinomedeNewton(p+q)n.(p+q)0=1(p+q)1=p+q=1(p+q)2=p2+2pq+q2=1(p+q)3=p3+3p2q+3pq2+q3=1(p
Lesp
erancesecalculedelamani`
eresuivante:
n
E(X)
xPr(X=x)
x=0
n
n x nx
pq
x
n x nx
pq
(onpeutenleverletermex=0)
x
x=0
n
=
x=1
=n
x=1n
n1
x1
=npnx=1n1
x1
=npn1z=0n1zp
px qnx
px1 q(n1)(x1)
z (n1)z
(enposantz=x1)
=np(p+q)n1=np.Lavarianceestdonnee(sansdemonstration)parvar(X)=npq.Exemple6.9Ontireauhasardav
18boulesrougeset12boulesblanches.SiXestlenombredeboulesrougesobtenues,alorsXauneloi
binomialedeparam`etrep=18/(18+12)=0.6,etdexposantn=5.Donc,Pr(X=x)=5x0.6x0.45x,x=0,1,...,4,5,cequ
eedanslaFigure6.2.Exemple6.10Supposonsque,dansunepopulationdelecteurs,60%deselecteurssappre
0.30
0.15
0.00
0
Fig.6.2Distributiondunevariablealeatoirebinomialeavecn=5etp=0.6.
6.4.4VariabledePoissonLavariableXsuituneloidePoisson,deparam`
etreR
Pr(X=x)=e
si
x
x!,x=0,1,2,3,.....
OnnotealorsXP(1).Lasommedesprobabilitesestbienegale`a1,eneffet
x=0Pr(X=x)=x=0exx!=ex=0 x
x!
=e e =1.
LesperanceetlavarianceduneloidePoissonsontegalesauparam`etre.Eneffet
E(X)=x=0xPr(X=x)=x=0xexx!=ex=1xxx!=ex=1x1(x1)!=ez=0zz!enposantz=x1=ee=
0.2
0.0
0
Fig.6.3DistributiondunevariabledePoissonavec=1.
lwd=3,xlab="",ylab="",main="",frame=FALSE)
#PoissonP(1)plot(dpois(0:7,1),type="h",lwd=3,xlab="",ylab="",main="",frame=FALSE)
6.5Variablealeatoirecontinue6.5.1Definition,esperanceetvarianceUnevari
Laprobabilitequunevariablealeatoirecontinuesoitinferieure`aunevaleurparticuli`
ereestdonn
eepar
safonctionderepartition.Pr(Xx)=F(x).Lafonctionderepartitiondunevariablealeatoirecontinueesttoujours:
erieure`aunevaleurquelconquevaut:Pr[Xa]=af(x)dx=F(a).DanslaFigure6.4,laprobabilitePr[Xa]estlaire
Pr[Xa]=F(a)
Fig.6.4Probabilit equelavariableal
eatoiresoitinf
erieure`aa
Silavariablealeatoireestcontinue,laprobabilit
equelleprenneexactementunevaleurquelconqueestnulle:
Pr[X=a]=0.
Lesperancedunevariablealeatoirecontinueestd
efiniepar:
E(X)=
xf(x)dx,
etlavariancevar(X)=(x)2f(x)dx.
6.5.2VariableuniformeUnevariablealeatoireXestditeuniformedansunintervalle[a,b],(aveca<b)sisar
epartitionest:
F(x)=0six<a(xa)/(ba)siaxb1six>b.Sadensiteestalorsf(x)=0six<a1/(ba)siaxb0six>b.Onpe
Resultat6.2
2 =var(X)=
(ba) 2
.
12
DemonstrationDemani`eregenerale,unevariancepeuttoujourss
ecrirecommeunmoment`aloriginedordre2moinsle
carredelamoyenne.Eneffet,
2=var(X)
=b
a(x)
=ba(x2+
f(x)dx
2x)f(x)dx
b
=bax2f(x)dx+
a
=bax2f(x)dx+22
2f(x)dx2
b
a
xf(x)dx
=bax2f(x)dx2.Oncalculeensuiteunmoment`aloriginedordre2: bax2f(x)dx=bax21badx=1babax2dx=1bax
1
ba
f(x)
a
b
Fig.6.5Fonctiondedensitedunevariableuniforme
a1b
F(x)
Fig.6.6Fonctionderepartitiondunevariableuniforme
6.5.3VariablenormaleUnevariablealeatoireXestditenormalesisadensitevautf,2(x)=12exp12x
o`uRetR2sontlesparam`etresdeladistribution.Leparam`etreestappelelamoyenneetle
param`etrelecart-typedelavariablenormale.++Fig.6.7Fonctiondedensitedunevariablenorma
Lafonctionderepartitionvaut
x
F , 2 (x)=
1
1 u
exp
2
du.
0.51
Fig.6.8Fonctionder epartitiondunevariablenormale
6.5.4VariablenormalecentreereduiteLavariablealeatoirenormalecentreereduiteestunevaria
desp
erancenulle,=0etde
variance2=1.Safonctiondedensitevautf0,1(x)=12expx22.etsarepartitionvaut(x)=F0,1(x)=x12exp
Enposant
z=
u
,
onobtientu=z+,etdoncdu=dz.Donc,
F , 2 (x)=
1
z2
exp
2
2
dz=
Lestablesdelavariablenormalenesontdonneesquepourlanormalecentr
eereduite.Lestablesne
donnent(x)quepourlesvaleurspositivesdex, carlesvaleursnegativespeuvent
etretrouv
eesparla
relationdesymetrie.6.5.5Distributionexponentielle
UnevariablealeatoireXaunedistributionexponentiellesisafonctiondedensit
eestdonn
eepar:
f(x)=exp(x),
0sinon
six>0
Leparam`etreestpositif.Quandx>0,safonctionderepartitionvaut:
F(x)=x0f(u)du=x0eudu=eu
x
0
=1e
Onpeutalorscalculerlamoyenne:Resultat6.4E(X)=1DemonstrationE(X)=0xf(x)dx=0xexdx=1+x
1
.
Ilestegalementpossibledemontrerquelavariancevaut:var(X)=12.6.6DistributionbivarieeDeu
1.0
0.8
0.6
0.4
0.2
0.0
0
Fig.6.10Fonctiondedensitedunevariableexponentielleavec=1.
Aveclesdistributionsmarginales,onpeutdefinirlesmoyennesmarginales,etlesvariancesmarginales:
X=xfX(x)dx,etY=yfY(y)dy,
2X=(xX)2fX(x)dx,et2Y=(yY)2fY(y)dy.
Onappelledensitesconditionnelles,lesfonctionsf(x|y)=f(x,y)fY(y)etf(y|x)=f(x,y)fX(x).Aveclesdistributionscond
tionnelles:X(y)=xf(x|y)dx,etY(x)=yf(y|x)dy,2X(y)={xX(y)}2f(x|y)dx,et2Y(x)={yY(x)}2f(y
ejointedesdeuxvariables,alorsXetYsontindependantssifXY(x,y)=fX(x)fY(y),x,yR.100
6.7Propriet
esdesesp
erancesetdesvariances
Demani`
ereg
en
erale,pourdesvariablesal
eatoiresXetY,
suivants.Resultat6.5E(a+bX)=a+bE(X)
etavecaetbconstants, onalesresultats
DemonstrationE(a+bX)=R(a+bx)f(x)dx=a
f(x)dx+b
xf(x)dx=a+bE(X).
Resultat6.6E(aY+bX)=aE(Y)+bE(X)
DemonstrationE(aY+bX)=RR(ay+bx)f(x,y)dxdy
=aRRyf(x,y)dxdy+bRR
xf(x,y)dxdy
=aRyRf(x,y)dxdy+bRxRf(x,y)dydx
=aRyf(y)dy+bRxf(x)dx=aE(Y)+bE(X)
Resultat6.7var(a+bX)=b2var(X).Demonstrationvar(a+bX)=R[a+bxE(a+bX)]2f(x)dx=R[a+bx(a+bE(X
Demonstration
var(X+Y)
[x+yE(X+Y)]
R
f(x,y)dxdy
[xE(X)+yE(Y)]
=R
[xE(X)]
f(x,y)dxdy
+[yE(Y)]
+2[xE(X)][yE(Y)]f(x,y)dxdy
=var(X)+var(Y)+2cov(X,Y)
Resultat6.9Deplus,siXetYsontindependantes,onaf(x,y)=f(x)f(y)pourtoutx,y
E(XY)=E(X)E(Y).
DemonstrationE(XY)=RRxyf(x)f(y)dxdy
=Rxf(x)dxRyf(y)dy
=E(X)E(Y).
Enfin,siXetYsontindependantes,onacov(X,Y)=0,etdoncvar(X+Y)=var(X)+var(Y).Enfin,ilestpossibledecalc
ependantes,
etidentiquementdistribuees.Theor`eme6.3SoitX1,...,Xnunesuitedevariablesaleatoires,independanteseti
ees
etdontlamoyenneetlavariance 2existentetsontfinies,alorssiX=1nni=1Xi,onaE(X)=,etvar(X)=2n.Demon
6.8Autresvariablesaleatoires
6.8.1Variablekhi-carr
ee
Soitunesuitedevariablesal
eatoiresind
ependantes,normales,centr
eesr
eduites,X1,...,X
demoyennenulleetdevariance
egale`a1),alorslavariableal
eatoire
p ,(cest-`a-dire
2p =
X i2,
i=1
estappeleevariablealeatoirekhi-carr
e`apdegr
esdelibert
e.
IlestpossibledemontrerqueE(
2
p )=p,
etquevar(
2
p )=2p.
0.35
0.3
0.25
0.2
0.15
0.1
0.05
10
12
14
Fig.6.11Densitedunevariabledechi-carreavecp=1,2,...,106.8.2VariabledeStudentSoitunevariable
es
deliberte,independantedeX,alorslavariablealeatoiretp=X2p/pestappeleevariablealeatoiredeStudent`ap
0.4
0.3
0.2
0.1
Fig.6.12DensitesdevariablesdeStudentavecp=1,2et3etdunevariablenormale103
6.8.3VariabledeFisher
2
2
Soientdeuxvariablesal
eatoireskhi-carr
esind
ependantes
esdelibert
e,
p , q,respectivement`apetqdegr
alorslavariableal
eatoire
2p/p
F p,q = 2
q/q
estappeleevariableal
eatoiredeFisher`apetqdegr
esdelibert
e.
0.7
0.6
0.5
0.4
0.3
0.2
0.1
Fig.6.13DensitedunevariabledeFisher
Remarque6.1IlestfaciledemontrerquelecarredunevariabledeStudent`aqdegr
esdelibert
eestune
variabledeFisher`a1etqdegresdeliberte.6.8.4VariablenormalemultivarieeLevecteurdevariable
eedemoyenne
=(1,...,p)etdematricevariance-covariance(onsupposeparsimplicitequeestdepleinrang),
sisafonctiondedensiteestdonneeparfX(x)=1(2)p/2||1/2exp12(x)1(x),(6.2)
pourtoutxRp.Fig.6.14DensitedunenormalebivarieeRemarque6.2Sip=1,onretrouvelexpression(6.1).104
1
1
exp (x) 1 (x)
2
(2)p/2 ||1/2
1
1
exp (x) 1 (x)
p
2
(2)p/2 ( j=1 j2)1/2
p
2
1
(x
)
j
j
exp
p
2j2
(2)p/2 ( j=1 j )
j=1
p
=1
(2)p/2(
p
j=1
j ) j=1
=pj=11(2)1/2jexp
exp
(xj j )2
2j2
(xj j )2
2j2
=pj=1fXj(xj),o`ufXj(xj)=1(22j)1/2exp(xj
22
)2
estladensitedelavariableXj.Onconstatequesilyaabsencedecorr
elationentrelesvariablesnormales,
alorsladensiteduvecteurnormalpeutsecrirecommeunproduitdedensit
es.Danslecasmultinormal(et
seulementdanscecas),labsencedecorrelationimpliquedonclindependancedesvariablesal
eatoires.
Demani`eregenerale,siXestunvecteurdevariablesaleatoiresdemoyenneetdematricevariancecovariance,etsiAestunematriceqpdeconstantes,alorsE(AX)=AE(X)=A,etvar(AX)=Avar(X)A=AA.Dansl
pendantsamatricevariance-covariancenestpasnecessairementdepleinrang).Donc,siXestunvecteurmultinor
Exercice6.2Determinezlesvaleursjdelavariablenormalecentr
eer
eduiteZtellesque:
1.Pr[Zj]=0,9332;
2.Pr[jZj]=0,3438;
3.Pr[Zj]=0,0125;
4.Pr[Zj]=0,0125;
5.Pr[jZ3]=0,7907.
Exercice6.3Soitunevariableal
eatoireXN(53; 2 =100)repr
esentantler
esultatdunexamenpour
unetudiantdunesection.Determinezlaprobabilit
epourqueleresultatsoitcomprisentre33,4et72,6.
Exercice6.4SoitunevariablealeatoireXN(50;2 =100). D
eterminezlepremierquartiledecettedistribution.Exercice6.5Ensupposantquelestaillesencmdesetudiantsdunpaysadmettentladistributionnormale
N(172;2=9).Ondemandededeterminerlepourcentagetheorique:
a)detudiantsmesurantaumoins180cm.b)detudiantsdontlatailleestcompriseentre168et180.Exercice6.6S
elavitesse
detouteslesautomobilespendantunejournee.Ensupposantquelesvitessesrecueilliessoientdistribu
ees
normalementavecunemoyennede72km/hetunecart-typede8km/h,quelleestapproximativementla
proportiondautomobilesayantcommisunexc`esdevitesse?Exercice6.7Pourlassemblagedunemachine,onpr
esune
loinormaledemoyenne10cmetdecart-type0,2cm.Ongroupelescylindresen3categories:A:defectueuxetinut
ee`a17degresdeliberte;3.dunevariabledeStudent`a8degresdeliberte;4.dunevariabledeFisher(uniquem
Chapitre7
Tablesstatistiques
Tab.7.1Tabledesquantilesdunevariablenormalecentr
eer
eduite
0+zppOrdreduquantile(p)quantile(zp)Ordreduquantile(p)Quantile(zp)0.5000.00000.9751.96
Tab.7.2Fonctionder epartitiondelaloinormalecentr
eer
eduite
(Probabilit
edetrouverunevaleurinf
erieur`au)
p=F(u)
+
u0.0.01.02.03
.04
0.0.5000.5040.5080.5120.5160
0.1.5398.5438.5478.5517.5557
0.2.5793.5832.5871.5910.5948
0.3.6179.6217.6255.6293.6331.6368
0.4.6554.6591.6628.6664.6700.6736
.05
.06
.07
.08
.5199 .5239 .5279 .5319
.5596 .5636 .5675 .5714
.5987 .6026 .6064 .6103
.6406 .6443 .6480
.6772 .6808 .6844
0.5.6915.6950.6985.7019.7054.7088.7123
0.6.7257.7291.7324.7357.7389.7422.7454
0.7.7580.7611.7642.7673.7704.7734.7764
0.8.7881.7910.7939.7967.7995.8023.8051.8078
0.9.8159.8186.8212.8238.8264.8289.8315.8340
.09
.5359
.5753
.6141
.6517
.6879
1.0.8413.8438.8461.8485.8508.8531.8554.8577
.8599
1.1.8643.8665.8686.8708.8729.8749.8770.8790.8810
1.2.8849.8869.8888.8907.8925.8944.8962.8980.8997
1.3.9032.9049.9066.9082.9099.9115.9131.9147.9162
1.4.9192.9207.9222.9236.9251.9265.9279.9292.9306.9319
.8621
.8830
.9015
.9177
1.5.9332.9345.9357.9370.9382.9394.9406.9418.9429.9441
1.6.9452.9463.9474.9484.9495.9505.9515.9525.9535.95451.7.9554.9564.9573.9582.9591.9599
43.9945.9946.9948.9949.9951.99522.6.9953.9955.9956.9957.9959.9960.9961.9962.9963.9964
7.9997.9998108
0+
0.09
02.57582.32632.17012.05371.96001.88
0.11.64491.59821.55481.51411.47581.43
0.21.28161.25361.22651.20041.17501.15
0.31.03641.01520.99450.97410.95420.93
u+u/2/200.010.020.030.040.050.060.070.08
Tab.7.3quantilesdelaloinormalecentr
eereduite
(u:valeurayantlaprobabilit
edetred
epass
eenvaleurabsolue)
Tab.7.4Tabledesquantilesdunevariable 2 `andegr
esdelibert
e
ordreduquantile
0.01
0.025
0.05
0.95
n=1 0.000157 0.000982 0.003932 3.841
2
0.02010 0.05064
0.103 5.991
3
0.115
0.216
0.352 7.815
40.297
0.484
0.711 9.488
50.554
0.831
1.145 11.07
60.872
1.237
1.635 12.59
71.239
1.690
2.167 14.07
81.646
2.180
2.733 15.51
92.0882.700
3.325 16.92
102.5583.247
113.0533.816
123.5714.4045.226
134.1075.0095.892
144.6605.6296.571
155.2296.2627.261
165.8126.9087.96226.30
176.4087.5648.67227.59
187.0158.2319.39028.87
197.6338.90710.1230.14
3.940
4.575
18.31
19.68
21.03
22.36
23.68
25.00
0.975
5.024
7.378
9.348
11.14
12.83
14.45
16.01
17.53
19.02
0.99
6.635
9.210
11.34
13.28
15.09
16.81
18.48
20.09
21.67
20.48
21.92
23.34
24.74
26.12
27.49
28.85
30.19
31.53
32.85
23.21
24.72
26.22
27.69
29.14
30.58
32.00
33.41
34.81
36.19
208.2609.59110.8531.4134.17
37.57
218.89710.2811.5932.6735.48
38.93
229.54210.9812.3433.9236.7840.29
2310.2011.6913.0935.1738.0841.64
2410.8612.4013.8536.4239.3642.98
2511.5213.1214.6137.6540.6544.312612.2013.8415.3838.8941.9245.642712.8814.5716.1540.
14425.1527.5729.7960.4864.2068.714626.6629.1631.4462.8366.6271.204828.1830.7533.1065
Tab.7.5TabledesquantilesdunevariabledeStudent`andegr
esdelibert
e
ordreduquantile
0.95 0.975 0.99 0.995
n=1 6.314 12.71 31.82 63.66
2 2.920 4.303 6.965 9.925
3 2.353 3.182 4.541 5.841
4 2.132 2.776 3.747 4.604
5 2.015 2.571 3.365 4.032
6 1.943 2.447 3.143 3.707
7 1.895 2.365 2.998 3.499
81.860
2.306 2.896 3.355
91.833
2.262 2.821 3.250
101.8122.228
2.764 3.169
111.7962.201
2.718 3.106
121.7822.179
2.681 3.055
131.7712.1602.650
3.012
141.7612.1452.624
2.977
151.7532.1312.602
2.947
161.7462.1202.5832.921
171.7402.1102.5672.898
181.7342.1012.5522.878
191.7292.0932.5392.861201.7252.0862.5282.845211.7212.0802.5182.831221.71
.3812.648801.6641.9902.3742.639901.6621.9872.3682.6321001.6601.9842.3642
104.9654.1033.7083.4783.3263.2173.1353.0723.0202.9782.9132.8652.8282.7742.7002.538
114.8443.9823.5873.3573.2043.0953.0122.9482.8962.8542.7882.7392.7012.6462.5702.404
124.7473.8853.4903.2593.1062.9962.9132.8492.7962.7532.6872.6372.5992.5442.4662.296
134.6673.8063.4113.1793.0252.9152.8322.7672.7142.6712.6042.5542.5152.4592.3802.206
144.6003.7393.3443.1122.9582.8482.7642.6992.6462.6022.5342.4842.4452.3882.3082.131
154.5433.6823.2873.0562.9012.7902.7072.6412.5882.5442.4752.4242.3852.3282.2472.066
164.4943.6343.2393.0072.8522.7412.6572.5912.5382.4942.4252.3732.3332.2762.1942.010
174.4513.5923.1972.9652.8102.6992.6142.5482.4942.4502.3812.3292.2892.2302.1481.960
184.4143.5553.1602.9282.7732.6612.5772.5102.4562.4122.3422.2902.2502.1912.1071.917
194.3813.5223.1272.8952.7402.6282.5442.4772.4232.3782.3082.2562.2152.1552.0711.878
204.3513.4933.0982.8662.7112.5992.5142.4472.3932.3482.2782.2252.1842.1242.0391.843
214.3253.4673.0722.8402.6852.5732.4882.4202.3662.3212.2502.1972.1562.0962.0101.812
224.3013.4433.0492.8172.6612.5492.4642.3972.3422.2972.2262.1732.1312.0711.9841.783
234.2793.4223.0282.7962.6402.5282.4422.3752.3202.2752.2042.1502.1092.0481.9611.757
244.2603.4033.0092.7762.6212.5082.4232.3552.3002.2552.1832.1302.0882.0271.9391.733
254.2423.3852.9912.7592.6032.4902.4052.3372.2822.2362.1652.1112.0692.0071.9191.711
264.2253.3692.9752.7432.5872.4742.3882.3212.2652.2202.1482.0942.0521.9901.9011.691
274.2103.3542.9602.7282.5722.4592.3732.3052.2502.2042.1322.0782.0361.9741.8841.672
284.1963.3402.9472.7142.5582.4452.3592.2912.2362.1902.1182.0642.0211.9591.8691.654294.1833.3282.9342.7012.5452.
0772.0031.9481.9041.8391.7441.509504.0343.1832.7902.5572.4002.2862.1992.1302.0732.0261.9521.8951.8501.7841.6871
208.0965.8494.9384.4314.1033.8713.6993.5643.4573.3683.2313.1303.0512.9382.7782.421
218.0175.7804.8744.3694.0423.8123.6403.5063.3983.3103.1733.0722.9932.8802.7202.360
227.9455.7194.8174.3133.9883.7583.5873.4533.3463.2583.1213.0192.9412.8272.6672.305
237.8815.6644.7654.2643.9393.7103.5393.4063.2993.2113.0742.9732.8942.7812.6202.256
247.8235.6144.7184.2183.8953.6673.4963.3633.2563.1683.0322.9302.8522.7382.5772.211
257.7705.5684.6754.1773.8553.6273.4573.3243.2173.1292.9932.8922.8132.6992.5382.169
267.7215.5264.6374.1403.8183.5913.4213.2883.1823.0942.9582.8572.7782.6642.5032.131
277.6775.4884.6014.1063.7853.5583.3883.2563.1493.0622.9262.8242.7462.6322.4702.097
287.6365.4534.5684.0743.7543.5283.3583.2263.1203.0322.8962.7952.7162.6022.4402.064297.5985.4204.5384.0453.7253.
8012.6652.5632.4842.3692.2031.805507.1715.0574.1993.7203.4083.1863.0202.8902.7852.6982.5622.4612.3822.2652.0981
Listedestableaux
1.1CodificationdelavariableY
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2SeriestatistiquedelavariableY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3Tableaustatistiquecomplet....
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1Tableaudeseffectifsnjk.........
. . . . . . . . . .
3.2Tableaudesfrequences..........
. . . . . . . . .
3.3Tableaudesprofilslignes...........
. . . . . . .
3.4Tableaudesprofilscolonnes..........
. . . . . .
3.5Tableaudeseffectifstheoriquesnjk........
. . . .
3.6Tableaudesecarts`alindependanceejk.......
. . .
3.7Tableaudese2jk/njk....................
.
3.8Tableaudecontingence:effectifsnjk.............
3.9Tableaudesfrequencesfjk....................
3.10Tableaudesprofilslignes......................
3.11Tableaudesprofilscolonnes......................
3.12Tableaudeseffectifstheoriquesnjk....................
3.13Tableaudesecarts`alindependanceejk..................
3.14Tableaudese2jk/njk...............................
3.15Consommationdecr`emesglacees.........................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4.1Tableauduprixdunbiendeconsommationde2000`a2006.............
4.2Tableaudelindicesimpleduprixdutableau4.1.....................
4.3Exemple:prixetquantitesdetroisbienpendant3ans..................
4.4Mesuresdelinegaliteparpays..................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
8
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
44
45
45
46
46
47
47
47
48
48
48
48
48
48
49
. . . . . .
. . . .
. . .
.
51
51
52
58
5.1BiensmanufacturesauxUSA....................................60
5.2Indicedesprix`alaconsommation(France)............................62
5.3TraficdunombredevoyageursSNCF...............................635.4DecompositiondelavariableFRIG,methode
erietemporellePrixmoyenduMazoutpour100litres(achatentre800et1500litres)enCHF...........................806.
e....................1107.5TabledesquantilesdunevariabledeStudent`andegresdeliberte...............1117.6Tab
115
Tabledesfigures
1.1Diagrammeensecteurs....
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2Diagrammeenbarres......
. . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3Diagrammeensecteursdesfrequences
. . . . . . . . . . . . . . . . . . . . . . .
1.4Diagrammeenbarresdeseffectifs. . . . . . . . . . . . . . . . . . . . . . . . .
1.5Diagrammeenbarresdeseffectifscumul
es . . . . . . . . . . . . . . . . . . . .
1.6Diagrammeenbatonnetsdeseffectifspourunevariablequantitativediscr`
ete .
1.7Fonctionderepartitiondunevariablequantitativediscr`
ete . . . . . . . . . . .
1.8Histogrammedeseffectifs.............
. . . . . . . . . . . . . . . . .
1.9Histogrammedeseffectifsaveclesdeuxderni`eresclassesagr
eg
ees. . . . . . . .
1.10Fonctionderepartitiondunedistributiongroupee..
. . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
8
9
10
10
12
13
14
15
15
2.1Medianequandnestimpair..................
. . . . . . . . . . . . . . . . . . . 22
2.2Medianequandnestpair....................
. . . . . . . . . . . . . . . . . . 22
2.3Asymetriedunedistribution....................
. . . . . . . . . . . . . . . . 28
2.4Distributionsmesokurtiqueetleptokurtique.............
. . . . . . . . . . . . . . . 28
2.5Botes`amoustachespourlavariablesuperficieenhectares(HApoly)descommunesducanton
deNeuchatel.................................
. . . . . . . . . . . . 32
2.6Botes`amoustachesdurevenumoyendeshabitantsdescommunesselonlesprovincesbelges
33
3.1Lenuagedepoints...................................
3.2Exemplesdenuagesdepointsetcoefficientsdecorrelation..............
3.3Lenuagedepoints,leresidu................................
3.4Ladroitederegression.....................................
4.1CourbedeLorenz...........................................
. . . . . . .
. . . . . .
. . . .
. . .
36
38
38
40
55
5.1DepensesenbiensdurablesUSA(milliardsdedollarsde1982).................61
5.2Nombrederefrigerateursvendusde1978`a1985.........................615.3Indicedesprix`alaconsommation
erencedordre4delavariableventederefrigerateurs....................685.11TraficdunombredevoyageursSNC
erateurs5.1.....................765.16EvolutionduprixdumazoutenCHF(achatentre800et1500),lissageexponent
6.3DistributiondunevariabledePoissonavec=1. . . . . . . . . . . . . . . . . .
6.4Probabilitequelavariableal
eatoiresoitinf
erieure`aa . . . . . . . . . . . . . . .
6.5Fonctiondedensitedunevariableuniforme. . . . . . . . . . . . . . . . . . . . .
6.6Fonctionder epartitiondunevariableuniforme.. . . . . . . . . . . . . . . . . .
6.7Fonctiondedensitedunevariablenormale . . . . . . . . . . . . . . . . . . . . .
6.8Fonctionder epartitiondunevariablenormale. . . . . . . . . . . . . . . . . . .
6.9Densitedunenormalecentr
eer
eduite,sym
etrie. . . . . . . . . . . . . . . . . . .
6.10Fonctiondedensit
edunevariableexponentielleavec=1.. . . . . . . . . . . .
6.11Densitedunevariabledechi-carr
eavecp=1,2,...,10. . . . . . . . . . . . . . .
6.12DensitesdevariablesdeStudentavecp=1,2et3etdunevariablenormale.
. .
6.13DensitedunevariabledeFisher. . . . . . . . . . . . . . . . . . . . . . . . . . .
6.14Densitedunenormalebivari
ee . . . . . . . . . . . . . . . . . . . . . . . . . . . .
117
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
94
95
97
97
97
98
98
100
103
103
104
104
Index
analysecombinatoire,88arrangement,89axiomatique,84Bernoulli,91bernoullienne,91binome
esaisonnalisation,72diagrammeenbarres,7deseffectifs,10enbatonnetsdeseffectifs,12enboite,31enfeuilles,3
deprobabilit
e,90
exponentielle,99
group
ee,13
leptokurtique,28
m
esokurtique,28
marginale,100
normalemultivari
ee,104
domaine,5
donn
eesobserv
ees,43
droitederegression,37
ecart`alind
ependance,46
medianabsolu,27
moyenabsolu,27
ecart-type,25marginal,36effectif,6dunemodalite,6dunevale
epartition,12,15,21discontinue,23118
identite,52independance,100indice,51chaine,54dequirepartition,56deFisher,53deGini,56deHoover,56de
jointe,99
erieurs,27moyenne,17,18,20,22,29,36,49conditionnelle,100geometrique,20,54harmonique,20,53margin
parpalier,22
sym
etrique,70
forwardoperator,66
VanHann,71
frequence,6groupe,29histogrammedeseffectifs,14 pond
er
ee,21,30
op
erateur
avance,66
dedecalage,66
dediff
erence,66
forward,66
identit
e,66
lag,66
retard,66
param`
etres
daplatissement,28
dedispersion,24
deforme,27
deposition,17
marginaux,36
percentile,23
permutation
avecr
ep
etition,89
sansrepetition,88
piechart,7probabilite,83,84conditionnelleetind
ependance,87
theor`emedesprobabilit
estotales,87
profilscolonnes,45lignes,45proprietes,102proprietesdese
quantile,23,36,106,107,109111quartile,23quintile,23sharerat
desprofilslignes,45statistique,7,11,12tendance,64lineaire,64,66logistique,64parabolique,64polynomiale,64
univari
ee,17
ee,104ordinale,8qualitative,5nominale,5,6ordinale,5,7quantitative,5,35continue,5,12discr`ete,5,11uniform
syst`emecompletd
ev
enements,84
indicatrice,91
deregression,41,42
tableaudecontingence,44
marginale,36,100
propri
et
es,101
defrequences,44
r
esiduelle,42,43
desprofilscolonnes,45
120