Vous êtes sur la page 1sur 9

Distribution statistiques à deux dimensions

D. Merabet et F. Ladjimi

1) Introduction
Soient X et Y deux caractères (qualitatifs ou quantitatifs) observés sur une population de taille
n. On checrhe à mettre en évidence la liason entre X et Y . Soient x1 , x2 , ....., xp les valeurs de X.
Soient y1 , y2 , ....., yq les valeurs de Y.
Les données se présentent alors sous la forme de tableau à doubles entrées à p lignes et q colonnes,
appelé tableau de contingence.
X \ Y y1 ........yj ............yq ni•
x1 n11 ......n1j ...........n1q n1•
.. .. .. .. ..
. . . . .
xi ni1 ......nij ............niq ni•
.. .. .. .. ..
. . . . .
xp np1 ......npj ...........npq np•
n•j n•1 ......n•j ...........n•q n

nij : nombres d’individus pour lesquels X prend la valeur xi et Y prend la valeur yj .


nij estXappelé effectif joint du couple (xi , yj ).
ni• = nij : nombre d’individus pour lesquels X prend la valeur xi indifféremment de Y.
ni• est appelé effectif marginal de la valeur xi .
p
X
n•j = nij : nombre d’individus pour lesquels Y prend la valeur yj indifféremment de X.
i=1
n•j est appelé effectif marginal de la valeur yj .
p X
X q q X
X p
Remarque. nij = nij = n.
i=1 j=1 j=1 i=1

2) Distribution conjointe
On appelle fréquence jointe, et on note fij du couple (xi , yj ) la proportion des individus ayant
les valeurs xi et yj à la fois.
nij
fij = .
n
q X
X p
Remarque. fij = 1.
j=1 i=1
On appelle distribution conjointe du couple (X, Y ), la donnée des couples (xi , yj ) et les fréquences
fij , i = 1, ..., p et j = 1, ..., q.

3) Distributions marginales
3.1) Distribution marginale de X
ni•
On appelle fréquence marginale de la valeur xi de X, le rapport fi• = , i = 1, ..., p.
n

1
xi ni• fi•
x1 n1• f1•
La distribution marginale de X est l’ensemble des
p
X . . .
couples (xi , fi• ), i = 1, ..., p. On a fi• = 1. . . .
i=1
xp np• fp•
Total n 1
p
X
Moyenne marginale de X : x = fi• xi .
i=1
p p
fi• (xi − x)2 = fi• x2i − x2 .
X X
Variance marginale de X : V (X) =
i=1 i=1

3.2) Distribution marginale de Y On appelle fréquence marginale de la valeur yj de Y , le


n•j
rapport f•j = , j = 1, ..., q.
n
yj n•j f•j
y1 n•j f•j
La distribution marginale de Y est l’ensemble des
Xp . . .
couples (yj , f•j ), j = 1, ..., q. On a f•j = 1. . . .
i=1
yq n•q f•q
Total n 1
p
X
Moyenne marginale de Y : y = f•j yj .
i=1
p p
2
f•j yj2 − y2 .
X X
Variance marginale de Y : V (Y ) = f•j (yj − y) =
i=1 i=1

4) Indépendance statistique
Deux caractères X et Y sont indépendants si et seulement si :
ni• × n•j
fij = fi• × f•j ou bien nij = , ∀i, j.
n
Exemple.
n1• × n•1 20 × 75 n1• × n•2
X Y 0 1 ni• On a n11 = 15 = = , n12 = 55 = ,
100 100 100
1 15 5 20 n2• × n•1 80 × 75 n2• × n•2 80 × 25
n21 = 60 = = et n22 = 20 = = .
2 60 20 80 100 100 100 100
n•j 75 25 100 ni• × n•j
Donc nij = , ∀i, j. On déduit que X et Y sont indépendantes.
n

5) Distributions conditionnelles
On peut considérer la distribution de X sur la partie de la population qui présente la valeur yj de
Y . Cette distribution est appelée distribution conditionnelle de X sachant que Y = yj et est notée
X/Y = yj . Inversement la distribution de Y sur la partie de la population qui présente la valeur xi
de X est appelée distribution conditionnelle de Y sachant X = xi , notée Y /X = xi .
Remarque.
Il y a q distributions conditionnelles X/Y = yj : (X/Y = y1 , X/Y = y2 , ..., X/Y = yq .)
Il y a p distributions conditionnelles Y /X = xi : (Y /X = x1 , Y /X = x2 , ..., Y /X = xp .)
Si X ou Y est continu, alors on note X/Y ∈ [ei−1 , ei [, Y /X ∈ [ei−1 , ei [.

2
5.1) Distributions conditionnelle de X sachant que Y = yj (X/Y = yj .)

L’effectif de la sous-population est égal à n•j (l’effectif marginal de Y ). Les valeurs de X/Y = yj
sont les valeurs de X. Les fréquences conditionnelles de cette variable sont :
nij fij
fi/j = = , i = 1, ...., p.
n•j f•j
xi nij fi/j
x1 n1j f1/j
On appelle distribution conditionnelle de X/Y = yj . . .
l’ensemble des couples (xi , fi/j ), i = 1, ........., p. . . .
xp npj fp/j
Total n•j 1
La moyenne conditionnelle de X/Y = yj est
p
X
xj = (x/Y = yj ) = fi/j xi .
i=1
La variance conditionnelle de X/Y = yj est
p
fi/j x2i − (xj )2 .
X
V (X/Y = yj ) =
i=1

5.2) Distribution conditionnelle de Y sachant que X = xi (Y /X = xi .)

L’effectif de la sous-population est égal à ni• (l’effectif marginal de X).Les valeurs de Y /X = xi


sont les valeurs de Y. Les fréquences conditionnelles de cette variable sont :
nij fij
fj/i = = , j = 1, ...., q.
ni• fi•
yj nij fj/i
y1 ni1 f1/i
On appelle distribution conditionnelle de Y /X = xi . . .
l’ensemble des couples (yj , fj/i ), j = 1, ........., q. . . .
yq niq fq/i
Total ni• 1
La moyenne conditionnelle de Y /X = xi est
q
X
yi = (y/X = xi ) = fj/i yj .
j=1
p
fj/i yj2 − (yi )2 .
X
La variance conditionnelle de Y /X = xi est V (Y /X = xi ) =
i=1
Remarque.
X et Y sont indépendantes si et seulement si : fi/j = fi• et fj/i = f•j , ∀i, j.
Exercice
Soit le tableau de contingence du couple de variables statistiques (X, Y ) observé sur une popu-
lation de 100 individus.
X Y 0 1
-1 12 28
0 25 5
1 3 27

3
1) Déterminer les distributions marginales et calculer leur moyenne et leur variance respectives.
2) Déterminer les distributions conditionnelles de Y /X = −1 et X/Y = 1.
3) X et Y sont-elles indépendantes ?
Solution.
1) Déterminons les distributions marginales. On a
X Y 0 1 ni•
-1 12 28 40
0 25 5 30
1 3 27 30
n•j 40 60 100
a) Distribution marginale de X.
La moyenne marginale de X :
3
X ni• fi• 1X 1
x= ni• xi = (−40 + 30) = −0.1.
-1 40 0.4 n i=1 100
0 30 0.3
1 30 0.3 La variance marginale de X :
Total 100 1 3
1X 1
V (X) = ni• x2i − x2 = (40 + 30) − (−0.1)2 = 0.69.
n i=1 100
b) Distribution marginale de Y.
La moyenne marginale de Y :
2
1X
Y n•j f•j y= n•j yi = 0.6.
n i=1
0 40 0.4
1 60 0.6 La variance marginale de Y :
Total 100 1
2
1 X 1
V (Y ) = n•j yj2 − y2 = (60) − (0.6)2 = 0.24.
n i=1 100
2) a)Distribution conditionnelle de Y /X = −1 :

Y/X=-1 n1j fj/1 La moyenne de cette variable est


12
0 12 40 2
1 28 28 1 X 1 28
40 y1 = n1j yj = (12 × 0 + 28 × 1) = .
Total n1• = 40 1 n1• j=1 40 40
b) Distribution conditionnelle de X/Y = 1.

X/Y=1 ni2 fi/2 La moyenne de cette variable est


28
-1 28 60
5
0 5 60 1 X 3
1 -3
13
1 25 25 x2 = 28× (−1) + 0 × 5 + 25 × 1) = .
ni2 xi = (12
60 n•2 i=1 60 60
Total n•2 = 60 1

ni• × n•j
3) X, Y sonts indépendantes ⇔ nij = , ∀i, j.
n

4
n1• × n•1 40 × 40 n1• × n•1
On a n11 = 12 et = = 16. D’où n11 6= . Ce qui implique que X, Y
n 100 n
ne sont pas indépendantes.

6) Covariance et coefficient de corrélation


On appelle covariance de X et Y le nombre réel defini par
p X q p Xq
1X 1X
Cov(X, Y ) = nij (xi − x)(yj − y) = nij xi yj − x y.
n i=1 j=1 n i=1j=1

Ou bien
p X
X q p X
X q
Cov(X, Y ) = fij (xi − x)(yj − y) = fij xi yj − x y.
i=1 j=1 i=1 j=1

Propriétés :
1) Cov(X, X) = V (X).
2) Cov(aX + b, cY + d) = acCov(X, Y ).
3) V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ).
Remarque. Si X et Y sont indépendantes, alors Cov(X, Y ) = 0, mais la réciproque est fausse c-à-d
si Cov(X, Y ) = 0 ; X et Y sont indépendantes.
Coefficient de corrélation linéaire.
On appelle coefficient de corrélation linéaire de X et Y, le nombre réel ρ défini par

Cov(X, Y )
ρ= ,
σX σY
q q
où σX = V (X), σY = V (Y ).
On a −1 ≤ ρ ≤ 1.

7) Représentation graphique
Dans le plan rapporté à un repère orthogonal, on appelle nuage de points associé à une série
statistique à deux variables X, Y observés sur n individus d’une même population, l’ensembles des
n points M1 (x1 , y1 ), M2 (x2 , y2 ), ......., Mn (xn , yn ).
Le nuage de poins est un bon indicateur pour vérifier une corrélation entre les caractères X et
Y . Si les points sont sous la forme d’un nuage, les phénomènes ne sont pas corrélés (absence de
corrélation). S’ils semblent tracer une courbe, on cherche à déterminer la nature de la courbe en
procédant à un ajustement.

5
Effectuer un ajustement de Y en X d’un nuage de points consiste à trouver une fonction f telle
que la courbe d’équation y = f (x) passe au plus près des points du nuage.
Remarques :
1) pour les statisticiens, une telle formule est appelée un modèle : X est la variable explicative
et Y la variable expliquée.
2) Un ajustement permet de faire des prévisions.
3) Une des méthodes les plus employées pour déterminer un ajustement est celles des moindres
carrés.
Dans la figure 2, les points semblent presque alignés. On va donc faire un ajustement affine. On
cherche une relation y = ax + b qui exprime de façon approchée les valeurs de la série (yi ) en fonction
de la série (xi ). Graphiquement, cela signifie qu’on cherche une droite qui passe au plus prés de tous
les points du nuage.

8) Ajustement affine par la méthode des moindres carrés


Effectuer un ajustement de Y en X d’un nuage de points par la méthode des moindres carrés
consiste à trouver une fonction du modèle retenu, qui minimise la somme des écarts entre les valeurs
yi observées et les valeurs f (xi ) données par le modèle. La fonction f doit donc minimiser l’expres-
n
[yi − f (xi )]2 .
X
sion
i=1

6
Si l’on note Mi le point(xi , yi ) et par di
la distance entre Mi et Qi = (xi , axi +b),
alors la droite de régression est la droite
n n
2
d2i est
X X
pour laquelle (Mi Qi ) =
i=1 i=1
minimale.
Théorème 1. Lors d’un ajustement af-
fine de Y en X par la méthode des
moindres carrés, l’unique droite (∆) qui
représente dans un repère la fonction
f obtenue, passe par le point moyen
G(x, y) du nuage de points et a une
équation y = ax + b avec

Cov(X, Y )
a= et b = y − ax.
V (X)
Remarque 1.
a) Cette droite est appelée droite de régression (ou droite d’ajustement) de Y en X. Elle passe
par le point moyen G(x, y)
b) La droite de régression de X en Y a pour équation
Cov(X, Y )
(∆0 ) : x = a0 y + b0 , où a0 = et b0 = x − a0 y.
V (Y )
Cette droite passe par le point moyen G(x, y).
Remarque 2.
Le coefficient de corrélation linéaire mesure l’efficacité de l’ajustement linéaire.
a) Si ρ > 0, il y a une corrélation positive entre les variables X, Y. C-à-d si X augmente, Y
augmente.
b) Si ρ < 0, il y a une corrélation négative entre les variables X, Y. C-à-d si X augmente, Y
diminue.
c) Si |ρ| = 1, la corrélation linéaire est maximale (la plus forte). Tous les points sont sur la droite
d’ajustement. La liaison entre X et Y est parfaitement linéaire.
d) Si ρ = 0, il y a absence de corrélation linéaire (mais il peut y avoir une corrélation non linéaire
entre X et Y ). √
3
e) On peut considérer que la corrélation est forte et que l’ajustement linéaire est valide si |ρ| > ,
2
c-à-d ρ ≤ −0, 86 ou ρ ≥ 0, 86.
Exemple.

La tension U aux bornes d’une batterie de force électromotrice e et de résistance interne R s’écrit
théoriquement U = −Ri + e. On a procédé à plusieurs mesures

intensité i (A) 0 0.1 0.4 1


Tension U (V) 12 11 7 1
a) Placer dans un repère orthogonal les quatre points correspondant à ces mesures et tracer, dans
ce même repère, la droite d’ajustement linéaire.
b) Exploiter cette droite pour déterminer la force électromotrice e et la résistance interne R.

7
Solution
Posons Y = U et X = i. L’équation
de la droite de régression linéaire de Y
en X est : y = −11.07x + 11.90. Donc
U = −11.07i + 11.90, c-à-d la force élec-
tromotrice est e = 11.90 et la résistance
interne est donnée par R = 11.07.

9) Exemple d’ajustement non affine


9.1) Ajustement exponentiel

Si les points du nuage semblent tracer une exponentielle, il n’est pas adéquat de tenter un
ajustement affine. Pour vérifier la corrélation exponentielle, on trace un noveau nuage de points de
coordonnées (xi , zi ) où zi = ln yi . Si les poins (xi , zi ) semblent alignés, on fait un ajustement affine
de zi en fonction de xi .
Si la droite d’ajustements a pour équation z = ax + b, alors ln y = ax + b. Il existe donc une
relation exponentielle entre Y et X :

y = eax .eb = Keax , où K = eb .


Les constantes a et K sont données par

Cov(X, Z) ez
a= , K = ax .
V (Z)
X) e
0
La courbe passe par le point G (x, yG ), où yG est la moyenne géométrique de Y.
Exemple. Evolution du chiffre d’affaires d’une entreprise industrielle de 1988 à 1997.
année 88 89 90 91 92 93 94 95 96 97
Chiff. d’aff. yi 5.89 6.77 7.87 9.11 10.56 12.27 13.92 15.72 17.91 22.13
zi = ln(yi ) 1.7733 1.9125 2.0631 2.2094 2.358 2.5072 2.6333 2.8854 2.8854 3.0969

Le nuage de points de coordonnées


(xi , zi ) donne des points presque alignés.
L’ajustement affine de z en fonction de x
conduit à l’équation z = 0.14x − 10.813
avec un coefficient de corrélation proche
de 1. On peut donc dire que l’évolution
du chiffre d’affaires est une fonction ex-
ponentielle de l’année :

y = e−10.813 .e0.143x .

8
9.2) Ajustement sous forme de puissance

On trace un nuage de points (ti , zi ), où ti = ln xi et zi = ln yi . Si les points (ti , zi ) semblent


alignés, on fait un ajustement affine de zi en fonction de ti .
Si la droite d’ajustement a pour équation z = at + b, alors ln y = a ln x + b. Il exsite donc une
relation de puissance entre y et x :

y = eb .xa = Kxa , où K = eb .
Les constantes a et K sont données par

Cov(T, Z) ez
a= , K = at .
V (T ) e
La courbe passe par le point M (XG , YG ), où XG , YG sont les moyennes géométriques de X et Y.
Exemple.

La série suivante correspond à l’évolution du poids et à l’âge de 5 nouveaux nés :

Age xi (en mois) Poids yi (en Kg) ti = ln xi zi = ln yi


1 1.50 0 0.405
2 2.611 0.693 0.96
3 3.612 1.098 1.284
4 4.547 1.386 1.514
5 5.435 1.609 1.692

La droite d’ajustement de zi en ti est


z = 0.8t + 0.405. En remplaçant z par
ln x et t par ln y, on aura y = 1.499x0.8 .
On peut prévoir par exemple le poids
d’un bébé de 8 mois avec
y = 1.499(8)0.8 = 7.911 Kg.

Vous aimerez peut-être aussi