Académique Documents
Professionnel Documents
Culture Documents
D. Merabet et F. Ladjimi
1) Introduction
Soient X et Y deux caractères (qualitatifs ou quantitatifs) observés sur une population de taille
n. On checrhe à mettre en évidence la liason entre X et Y . Soient x1 , x2 , ....., xp les valeurs de X.
Soient y1 , y2 , ....., yq les valeurs de Y.
Les données se présentent alors sous la forme de tableau à doubles entrées à p lignes et q colonnes,
appelé tableau de contingence.
X \ Y y1 ........yj ............yq ni•
x1 n11 ......n1j ...........n1q n1•
.. .. .. .. ..
. . . . .
xi ni1 ......nij ............niq ni•
.. .. .. .. ..
. . . . .
xp np1 ......npj ...........npq np•
n•j n•1 ......n•j ...........n•q n
2) Distribution conjointe
On appelle fréquence jointe, et on note fij du couple (xi , yj ) la proportion des individus ayant
les valeurs xi et yj à la fois.
nij
fij = .
n
q X
X p
Remarque. fij = 1.
j=1 i=1
On appelle distribution conjointe du couple (X, Y ), la donnée des couples (xi , yj ) et les fréquences
fij , i = 1, ..., p et j = 1, ..., q.
3) Distributions marginales
3.1) Distribution marginale de X
ni•
On appelle fréquence marginale de la valeur xi de X, le rapport fi• = , i = 1, ..., p.
n
1
xi ni• fi•
x1 n1• f1•
La distribution marginale de X est l’ensemble des
p
X . . .
couples (xi , fi• ), i = 1, ..., p. On a fi• = 1. . . .
i=1
xp np• fp•
Total n 1
p
X
Moyenne marginale de X : x = fi• xi .
i=1
p p
fi• (xi − x)2 = fi• x2i − x2 .
X X
Variance marginale de X : V (X) =
i=1 i=1
4) Indépendance statistique
Deux caractères X et Y sont indépendants si et seulement si :
ni• × n•j
fij = fi• × f•j ou bien nij = , ∀i, j.
n
Exemple.
n1• × n•1 20 × 75 n1• × n•2
X Y 0 1 ni• On a n11 = 15 = = , n12 = 55 = ,
100 100 100
1 15 5 20 n2• × n•1 80 × 75 n2• × n•2 80 × 25
n21 = 60 = = et n22 = 20 = = .
2 60 20 80 100 100 100 100
n•j 75 25 100 ni• × n•j
Donc nij = , ∀i, j. On déduit que X et Y sont indépendantes.
n
5) Distributions conditionnelles
On peut considérer la distribution de X sur la partie de la population qui présente la valeur yj de
Y . Cette distribution est appelée distribution conditionnelle de X sachant que Y = yj et est notée
X/Y = yj . Inversement la distribution de Y sur la partie de la population qui présente la valeur xi
de X est appelée distribution conditionnelle de Y sachant X = xi , notée Y /X = xi .
Remarque.
Il y a q distributions conditionnelles X/Y = yj : (X/Y = y1 , X/Y = y2 , ..., X/Y = yq .)
Il y a p distributions conditionnelles Y /X = xi : (Y /X = x1 , Y /X = x2 , ..., Y /X = xp .)
Si X ou Y est continu, alors on note X/Y ∈ [ei−1 , ei [, Y /X ∈ [ei−1 , ei [.
2
5.1) Distributions conditionnelle de X sachant que Y = yj (X/Y = yj .)
L’effectif de la sous-population est égal à n•j (l’effectif marginal de Y ). Les valeurs de X/Y = yj
sont les valeurs de X. Les fréquences conditionnelles de cette variable sont :
nij fij
fi/j = = , i = 1, ...., p.
n•j f•j
xi nij fi/j
x1 n1j f1/j
On appelle distribution conditionnelle de X/Y = yj . . .
l’ensemble des couples (xi , fi/j ), i = 1, ........., p. . . .
xp npj fp/j
Total n•j 1
La moyenne conditionnelle de X/Y = yj est
p
X
xj = (x/Y = yj ) = fi/j xi .
i=1
La variance conditionnelle de X/Y = yj est
p
fi/j x2i − (xj )2 .
X
V (X/Y = yj ) =
i=1
3
1) Déterminer les distributions marginales et calculer leur moyenne et leur variance respectives.
2) Déterminer les distributions conditionnelles de Y /X = −1 et X/Y = 1.
3) X et Y sont-elles indépendantes ?
Solution.
1) Déterminons les distributions marginales. On a
X Y 0 1 ni•
-1 12 28 40
0 25 5 30
1 3 27 30
n•j 40 60 100
a) Distribution marginale de X.
La moyenne marginale de X :
3
X ni• fi• 1X 1
x= ni• xi = (−40 + 30) = −0.1.
-1 40 0.4 n i=1 100
0 30 0.3
1 30 0.3 La variance marginale de X :
Total 100 1 3
1X 1
V (X) = ni• x2i − x2 = (40 + 30) − (−0.1)2 = 0.69.
n i=1 100
b) Distribution marginale de Y.
La moyenne marginale de Y :
2
1X
Y n•j f•j y= n•j yi = 0.6.
n i=1
0 40 0.4
1 60 0.6 La variance marginale de Y :
Total 100 1
2
1 X 1
V (Y ) = n•j yj2 − y2 = (60) − (0.6)2 = 0.24.
n i=1 100
2) a)Distribution conditionnelle de Y /X = −1 :
ni• × n•j
3) X, Y sonts indépendantes ⇔ nij = , ∀i, j.
n
4
n1• × n•1 40 × 40 n1• × n•1
On a n11 = 12 et = = 16. D’où n11 6= . Ce qui implique que X, Y
n 100 n
ne sont pas indépendantes.
Ou bien
p X
X q p X
X q
Cov(X, Y ) = fij (xi − x)(yj − y) = fij xi yj − x y.
i=1 j=1 i=1 j=1
Propriétés :
1) Cov(X, X) = V (X).
2) Cov(aX + b, cY + d) = acCov(X, Y ).
3) V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ).
Remarque. Si X et Y sont indépendantes, alors Cov(X, Y ) = 0, mais la réciproque est fausse c-à-d
si Cov(X, Y ) = 0 ; X et Y sont indépendantes.
Coefficient de corrélation linéaire.
On appelle coefficient de corrélation linéaire de X et Y, le nombre réel ρ défini par
Cov(X, Y )
ρ= ,
σX σY
q q
où σX = V (X), σY = V (Y ).
On a −1 ≤ ρ ≤ 1.
7) Représentation graphique
Dans le plan rapporté à un repère orthogonal, on appelle nuage de points associé à une série
statistique à deux variables X, Y observés sur n individus d’une même population, l’ensembles des
n points M1 (x1 , y1 ), M2 (x2 , y2 ), ......., Mn (xn , yn ).
Le nuage de poins est un bon indicateur pour vérifier une corrélation entre les caractères X et
Y . Si les points sont sous la forme d’un nuage, les phénomènes ne sont pas corrélés (absence de
corrélation). S’ils semblent tracer une courbe, on cherche à déterminer la nature de la courbe en
procédant à un ajustement.
5
Effectuer un ajustement de Y en X d’un nuage de points consiste à trouver une fonction f telle
que la courbe d’équation y = f (x) passe au plus près des points du nuage.
Remarques :
1) pour les statisticiens, une telle formule est appelée un modèle : X est la variable explicative
et Y la variable expliquée.
2) Un ajustement permet de faire des prévisions.
3) Une des méthodes les plus employées pour déterminer un ajustement est celles des moindres
carrés.
Dans la figure 2, les points semblent presque alignés. On va donc faire un ajustement affine. On
cherche une relation y = ax + b qui exprime de façon approchée les valeurs de la série (yi ) en fonction
de la série (xi ). Graphiquement, cela signifie qu’on cherche une droite qui passe au plus prés de tous
les points du nuage.
6
Si l’on note Mi le point(xi , yi ) et par di
la distance entre Mi et Qi = (xi , axi +b),
alors la droite de régression est la droite
n n
2
d2i est
X X
pour laquelle (Mi Qi ) =
i=1 i=1
minimale.
Théorème 1. Lors d’un ajustement af-
fine de Y en X par la méthode des
moindres carrés, l’unique droite (∆) qui
représente dans un repère la fonction
f obtenue, passe par le point moyen
G(x, y) du nuage de points et a une
équation y = ax + b avec
Cov(X, Y )
a= et b = y − ax.
V (X)
Remarque 1.
a) Cette droite est appelée droite de régression (ou droite d’ajustement) de Y en X. Elle passe
par le point moyen G(x, y)
b) La droite de régression de X en Y a pour équation
Cov(X, Y )
(∆0 ) : x = a0 y + b0 , où a0 = et b0 = x − a0 y.
V (Y )
Cette droite passe par le point moyen G(x, y).
Remarque 2.
Le coefficient de corrélation linéaire mesure l’efficacité de l’ajustement linéaire.
a) Si ρ > 0, il y a une corrélation positive entre les variables X, Y. C-à-d si X augmente, Y
augmente.
b) Si ρ < 0, il y a une corrélation négative entre les variables X, Y. C-à-d si X augmente, Y
diminue.
c) Si |ρ| = 1, la corrélation linéaire est maximale (la plus forte). Tous les points sont sur la droite
d’ajustement. La liaison entre X et Y est parfaitement linéaire.
d) Si ρ = 0, il y a absence de corrélation linéaire (mais il peut y avoir une corrélation non linéaire
entre X et Y ). √
3
e) On peut considérer que la corrélation est forte et que l’ajustement linéaire est valide si |ρ| > ,
2
c-à-d ρ ≤ −0, 86 ou ρ ≥ 0, 86.
Exemple.
La tension U aux bornes d’une batterie de force électromotrice e et de résistance interne R s’écrit
théoriquement U = −Ri + e. On a procédé à plusieurs mesures
7
Solution
Posons Y = U et X = i. L’équation
de la droite de régression linéaire de Y
en X est : y = −11.07x + 11.90. Donc
U = −11.07i + 11.90, c-à-d la force élec-
tromotrice est e = 11.90 et la résistance
interne est donnée par R = 11.07.
Si les points du nuage semblent tracer une exponentielle, il n’est pas adéquat de tenter un
ajustement affine. Pour vérifier la corrélation exponentielle, on trace un noveau nuage de points de
coordonnées (xi , zi ) où zi = ln yi . Si les poins (xi , zi ) semblent alignés, on fait un ajustement affine
de zi en fonction de xi .
Si la droite d’ajustements a pour équation z = ax + b, alors ln y = ax + b. Il existe donc une
relation exponentielle entre Y et X :
Cov(X, Z) ez
a= , K = ax .
V (Z)
X) e
0
La courbe passe par le point G (x, yG ), où yG est la moyenne géométrique de Y.
Exemple. Evolution du chiffre d’affaires d’une entreprise industrielle de 1988 à 1997.
année 88 89 90 91 92 93 94 95 96 97
Chiff. d’aff. yi 5.89 6.77 7.87 9.11 10.56 12.27 13.92 15.72 17.91 22.13
zi = ln(yi ) 1.7733 1.9125 2.0631 2.2094 2.358 2.5072 2.6333 2.8854 2.8854 3.0969
y = e−10.813 .e0.143x .
8
9.2) Ajustement sous forme de puissance
y = eb .xa = Kxa , où K = eb .
Les constantes a et K sont données par
Cov(T, Z) ez
a= , K = at .
V (T ) e
La courbe passe par le point M (XG , YG ), où XG , YG sont les moyennes géométriques de X et Y.
Exemple.