Académique Documents
Professionnel Documents
Culture Documents
State À 2 Variables PDF
State À 2 Variables PDF
Dans la partie précédente, nous avons étudié une population selon un seul caractère.
Cependant, il est souvent utile de considérer à la fois plusieurs caractères de la population
(exemple : taille, poids…)
Une série statistique double peut être donnée comme l'énumération d'un certain nombre de
résultats. Le tableau 1 donne le poids et la taille d'un groupe d'élèves.
Dans ce tableau figure un numéro, arbitrairement attribué, il permet un repérage des indices
i des xi et yi. et peut être utilisé pour la représentation graphique.
N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Taille (cm) 153 158 160 159 155 170 163 153 165 170 158 163 155 152 165 162 152 156 158 167
Poids (kg) 45 45 50 51 53 60 55 48 60 51 52 52 45 49 45 50 45 48 46 49
N° 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Taille (cm) 172 154 172 150 160 156 160 166 175 165 159 155 151 163 168 156 155 162 175 166
Poids (kg) 60 45 55 45 50 48 60 45 61 45 45 53 45 54 45 42 58 45 51 45
Sur une population P, d'effectif N, on étudie simultanément un caractère X qui peut prendre
les valeurs ou modalités x1, x2, …, xr et un caractère Y qui peut prendre les valeurs y1, y2, …,
ys.
X et Y peuvent être indifféremment des caractères quantitatifs ou qualitatifs. Les xi et les
yj désignent les classes des caractères X et Y dans le cas d'une série classée.
On utilise un tableau dit à double entrée ou tableau carré.
Caractère Y
y1 y2 yj ys totaux
Caractère X
x1 n11 n12 n1j n1s n1.
x2 n21 n22 n2.
Effectifs partiels
On appelle effectif partiel nij du couple (xi ; yj) le nombre d'individus présentant la modalité
xi du caractère X et la modalité yj du caractère Y.
Distributions marginales
La dernière ligne et la dernière colonne du tableau représentent les distributions marginales
(dans la marge), c’est-à-dire la distribution de X sans tenir compte du caractère Y ou celle de
Y sans tenir compte de X.
Les distributions marginales peuvent être traitées comme une série simple.
Effectifs marginaux
La somme des effectifs partiels contenus dans la ligne xi est égal à l’effectif des éléments
dont la valeur du caractère X est xi
De la même manière, La somme des effectifs partiels contenus dans la colonne yj est égal à
l’effectif des éléments dont la valeur du caractère Y est yj
On les appelle effectifs partiels marginaux.
Fréquences marginales
Poids (kg)
] 40;45] ] 45;50] ] 50;55] ] 55;61] totaux
Taille (cm)
]149 ; 155] 6 2 2
]155 ; 160] 3 5 2 1 11
]160 ; 165] 3 1 3 1 8
]165 ; 170] 3 1 1 1 6
]170 ; 175] 0 0 2 2 4
totaux 15 9 10 6 40
Dans un repère orthogonal xOy, on marque les points de coordonnées (xi ; yj). On obtient un
graphique appelé "nuage de points".
Fréquences conditionnelles
On suppose que tous les effectifs marginaux sont différents de zéro.
On appelle fréquence conditionnelle de la valeur xi sachant yj le nombre noté fi/j.
Eléments caractéristiques
On définit en particulier les moyennes et , les variances V(X) et V(Y) et les écart-
types (X) et (Y).
Moyennes arithmétiques
La moyenne de X est ou
La moyenne de Y est ou
Variances
La variance de X est ou
La variance de Y est ou
ou
et de même ou
Covariance
On appelle covariance du couple (X ; Y), et on note cov (X ; Y),la moyenne
de
On démontre que :
La covariance joue un rôle analogue à celui de la variance dans le cas d’une série statistique
simple.
Si l’on fait X=Y on retrouve la formule de la variance.
Changement de variable
Soit le changement de variable défini par : xi = x0 + hx’i et yi = y0 + ky’j
La covariance s’écrit :
cov ( X, Y) = hk cov(X', Y')
II - Ajustement linéaire
Nous avons étudié, précédemment, des tableaux d'effectifs traduisant l'observation de deux
caractères X et Y, quantitatifs ou qualitatifs d'une même population.
Le problème est de savoir si ces deux caractères sont liés ou indépendants. A priori,
puisqu'on les étudie ensemble, on soupçonne qu'ils ne sont pas indépendants.
Lorsque les deux variables X et Y sont numériques, on représente chaque individu par le
couple (xi, yj) où xi et yj sont respectivement les valeurs des caractères X et Y.
2.1. Définition
Pour représenter graphiquement les couples (xi , yj), on marque dans un repère xOy les
points de coordonnées (xi , yj). On obtient un graphique appelé nuage de points.
Ajuster un ensemble de points consiste à déterminer une courbe C simple "aussi proche que
possible" de l'ensemble des points Mij(xi, yj).
Ajustement linéaire : C'est le cas où l'on peut prendre pour C une droite. Cette droite est dite
droite ajustée à l'ensemble de points.
On appelle point moyen G d'un ensemble de points Mij(xi, yj), le point ayant:
- pour abscisse la moyenne de xi :
Afin d'éliminer les irrégularités que peut présenter la suite de points Mi (xi ; yi) du graphique, on
remplace alors chaque valeur de yi par la moyenne de yi et de deux ou trois valeurs voisines.
Exemple : On considère la série du tableau 2
Ce tableau devient (Tableau 3) en groupant deux valeurs consécutives par leur moyenne.
Tableau 3
x 0,8 1,4 1,8 2,2 2,5 2,9 3,3 3,6 3,9 4,2 4,7
y 9,5 13,5 17 19,5 26 26,5 31,5 38,5 36,5 34,5 41,5
On obtient le tableau 4 si l'on prend pour trois valeurs consécutives de x, la valeur centrale et
si l'on associe à cette valeur centrale la valeur moyenne des yi associés.
Tableau 4
x 1,2 2,4 3,4 4,5
y 12,7 22,3 34 49
Droite d'estimation de y en x
La droite d'ajustement a pour équation y* = ax + b. y* estimée par opposition a y ( y
observée).
Les coefficients a e b sont déterminés à partir des formules :
et .
On montre que :
Exemple : Déterminer l'équation de la droite de régression de y en x de la série du tableau 2.
Présentation des calculs
xi yi xi2 yi2 xi yi
x1 y1
x2 y2
… …
xn yn
On rappelle que pour le calcul des moyennes et des variances de x et y on utilise les
formules:
Les moyennes et
Les variances et
Droite d'estimation de x en y.
Le calcul précédent fait jouer un rôle dissymétrique aux variables x et y. Or, rien ne permet
de dire si l'une des variables dépend de l'autre. Il est alors aussi logique de recommencer les
calculs précédents, mais en inversant les rôles des deux variables.
On définit une droite d'ajustement de x en y d'équation x= a' y + b' avec :
et .
Exemple :Reprendre le cas de l'exemple précédent pour déterminer l'équation de la droite
d'estimation de x en y.
Remarques
Cette deuxième droite d'estimation est différente de la précédente, mais on ne peut dire si
elle représente un meilleur ajustement.
Le carré du coefficient de corrélation est égal au produit des pentes
.
Si les deux droites sont identiques, on aurait | r | = 1. Si les droites sont proches, | r | est
voisin de 1, ce qui correspond à un ajustement valide. Par contre, si | r | n'est pas très
différent de zéro, les deux pentes a et a' sont loin d'être inverses l'une de l'autre, et par
conséquent les droites d'ajustement sont sensiblement différentes : les points (xi ; yi) sont
loin d'être alignés.
et
Y
X y1 y2 ... yj ... ys ni. xi ni. xi ni. xi2
n.j N
yj
n.j yj
n.j yj2
On remarque que :
Dans la partie précédente, nous avons étudié une population selon un seul caractère.
Cependant, il est souvent utile de considérer à la fois plusieurs caractères de la population
(exemple : taille, poids…)
Une série statistique double peut être donnée comme l'énumération d'un certain nombre de
résultats. Le tableau 1 donne le poids et la taille d'un groupe d'élèves.
Dans ce tableau figure un numéro, arbitrairement attribué, il permet un repérage des indices
i des xi et yi. et peut être utilisé pour la représentation graphique.
N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Taille (cm) 153 158 160 159 155 170 163 153 165 170 158 163 155 152 165 162 152 156 158 167
Poids (kg) 45 45 50 51 53 60 55 48 60 51 52 52 45 49 45 50 45 48 46 49
N° 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Taille (cm) 172 154 172 150 160 156 160 166 175 165 159 155 151 163 168 156 155 162 175 166
Poids (kg) 60 45 55 45 50 48 60 45 61 45 45 53 45 54 45 42 58 45 51 45
Effectifs partiels
On appelle effectif partiel nij du couple (xi ; yj) le nombre d'individus présentant la modalité
xi du caractère X et la modalité yj du caractère Y.
Distributions marginales
La dernière ligne et la dernière colonne du tableau représentent les distributions marginales
(dans la marge), c’est-à-dire la distribution de X sans tenir compte du caractère Y ou celle de
Y sans tenir compte de X.
Les distributions marginales peuvent être traitées comme une série simple.
Effectifs marginaux
La somme des effectifs partiels contenus dans la ligne xi est égal à l’effectif des éléments
dont la valeur du caractère X est xi
De la même manière, La somme des effectifs partiels contenus dans la colonne yj est égal à
l’effectif des éléments dont la valeur du caractère Y est yj
On les appelle effectifs partiels marginaux.
Fréquences marginales
Poids (kg)
] 40;45] ] 45;50] ] 50;55] ] 55;61] totaux
Taille (cm)
]149 ; 155] 6 2 2
]155 ; 160] 3 5 2 1 11
]160 ; 165] 3 1 3 1 8
]165 ; 170] 3 1 1 1 6
]170 ; 175] 0 0 2 2 4
totaux 15 9 10 6 40
Dans un repère orthogonal xOy, on marque les points de coordonnées (xi ; yj). On obtient un
graphique appelé "nuage de points".
Fréquences conditionnelles
On suppose que tous les effectifs marginaux sont différents de zéro.
On appelle fréquence conditionnelle de la valeur xi sachant yj le nombre noté fi/j.
Eléments caractéristiques
On définit en particulier les moyennes et , les variances V(X) et V(Y) et les écart-
types (X) et (Y).
Moyennes arithmétiques
La moyenne de X est ou
La moyenne de Y est ou
Variances
La variance de X est ou
La variance de Y est ou
ou
et de même ou
Covariance
On appelle covariance du couple (X ; Y), et on note cov (X ; Y),la moyenne
de
On démontre que :
La covariance joue un rôle analogue à celui de la variance dans le cas d’une série statistique
simple.
Si l’on fait X=Y on retrouve la formule de la variance.
Changement de variable
Soit le changement de variable défini par : xi = x0 + hx’i et yi = y0 + ky’j
La covariance s’écrit :
cov ( X, Y) = hk cov(X', Y')
II - Ajustement linéaire
Nous avons étudié, précédemment, des tableaux d'effectifs traduisant l'observation de deux
caractères X et Y, quantitatifs ou qualitatifs d'une même population.
Le problème est de savoir si ces deux caractères sont liés ou indépendants. A priori,
puisqu'on les étudie ensemble, on soupçonne qu'ils ne sont pas indépendants.
Lorsque les deux variables X et Y sont numériques, on représente chaque individu par le
couple (xi, yj) où xi et yj sont respectivement les valeurs des caractères X et Y.
2.1. Définition
Pour représenter graphiquement les couples (xi , yj), on marque dans un repère xOy les
points de coordonnées (xi , yj). On obtient un graphique appelé nuage de points.
Ajuster un ensemble de points consiste à déterminer une courbe C simple "aussi proche que
possible" de l'ensemble des points Mij(xi, yj).
Ajustement linéaire : C'est le cas où l'on peut prendre pour C une droite. Cette droite est dite
droite ajustée à l'ensemble de points.
On appelle point moyen G d'un ensemble de points Mij(xi, yj), le point ayant:
Afin d'éliminer les irrégularités que peut présenter la suite de points Mi (xi ; yi) du graphique, on
remplace alors chaque valeur de yi par la moyenne de yi et de deux ou trois valeurs voisines.
Exemple : On considère la série du tableau 2
Ce tableau devient (Tableau 3) en groupant deux valeurs consécutives par leur moyenne.
Tableau 3
x 0,8 1,4 1,8 2,2 2,5 2,9 3,3 3,6 3,9 4,2 4,7
y 9,5 13,5 17 19,5 26 26,5 31,5 38,5 36,5 34,5 41,5
On obtient le tableau 4 si l'on prend pour trois valeurs consécutives de x, la valeur centrale et
si l'on associe à cette valeur centrale la valeur moyenne des yi associés.
Tableau 4
x 1,2 2,4 3,4 4,5
y 12,7 22,3 34 49
; -1 r 1
Si la valeur absolue de r est voisin de 1, l'ajustement est valide. ( 0,7 < |r| < 1).
Droite d'estimation de y en x
La droite d'ajustement a pour équation y* = ax + b. y* estimée par opposition a y ( y
observée).
Les coefficients a e b sont déterminés à partir des formules :
et .
On montre que :
Exemple : Déterminer l'équation de la droite de régression de y en x de la série du tableau 2.
Présentation des calculs
xi yi xi2 yi2 xi yi
x1 y1
x2 y2
… …
xn yn
On rappelle que pour le calcul des moyennes et des variances de x et y on utilise les
formules:
Les moyennes et
Les variances et
Droite d'estimation de x en y.
Le calcul précédent fait jouer un rôle dissymétrique aux variables x et y. Or, rien ne permet
de dire si l'une des variables dépend de l'autre. Il est alors aussi logique de recommencer les
calculs précédents, mais en inversant les rôles des deux variables.
On définit une droite d'ajustement de x en y d'équation x= a' y + b' avec :
et .
Exemple :Reprendre le cas de l'exemple précédent pour déterminer l'équation de la droite
d'estimation de x en y.
Remarques
Cette deuxième droite d'estimation est différente de la précédente, mais on ne peut dire si
elle représente un meilleur ajustement.
Le carré du coefficient de corrélation est égal au produit des pentes
.
Si les deux droites sont identiques, on aurait | r | = 1. Si les droites sont proches, | r | est
voisin de 1, ce qui correspond à un ajustement valide. Par contre, si | r | n'est pas très
différent de zéro, les deux pentes a et a' sont loin d'être inverses l'une de l'autre, et par
conséquent les droites d'ajustement sont sensiblement différentes : les points (xi ; yi) sont
loin d'être alignés.
et
Y
X y1 y2 ... yj ... ys ni. xi ni. xi ni. xi2
n.j N
yj
n.j yj
n.j yj2
On remarque que :