Académique Documents
Professionnel Documents
Culture Documents
On définit en particulier les moyennes et , les variances V(X) et V(Y) et les écart-
types (X) et (Y).
Moyennes arithmétiques
La moyenne de X est ou
ou
et de même ou
Covariance
On appelle covariance du couple (X ; Y), et on note cov (X ; Y),la moyenne
de
Si on effectue le changement de variable xi = x0 + hx’i et yi = y0 + ky’j , on obtient
Le coefficient de corrélation est donc invariant par ce changement de variable.
Propriétés
On montre que : -1 r 1.
Si X et Y sont indépendants alors r = 0. La réciproque est fausse.
II - Ajustement linéaire
Nous avons étudié, précédemment, des tableaux d'effectifs traduisant l'observation de deux
caractères X et Y, quantitatifs ou qualitatifs d'une même population.
Le problème est de savoir si ces deux caractères sont liés ou indépendants. A priori,
puisqu'on les étudie ensemble, on soupçonne qu'ils ne sont pas indépendants.
Lorsque les deux variables X et Y sont numériques, on représente chaque individu par le
couple (xi, yj) où xi et yj sont respectivement les valeurs des caractères X et Y.
Exemple : On considère la série du tableau 2
x 0,4 1,2 1,6 2 2,4 2,6 3,2 3,4 3,8 4 4,5 5
y 11 8 19 15 24 28 25 38 39 34 35 48
On peut représenter graphiquement ces données.
On constate que les points représentatifs de la série de notes ne sont pas rigoureusement
alignés mais qu'ils forment un "nuage de points" relativement allongé.
On peut se demander si l'on peut déterminer une droite qui résume approximativement
l'ensemble de ces points.
La recherche d'une telle droite est un ajustement linéaire.
2.1. Définition
Pour représenter graphiquement les couples (xi , yj), on marque dans un repère xOy les
points de coordonnées (xi , yj). On obtient un graphique appelé nuage de points.
Ajuster un ensemble de points consiste à déterminer une courbe C simple "aussi proche que
possible" de l'ensemble des points Mij(xi, yj).
Ajustement linéaire : C'est le cas où l'on peut prendre pour C une droite. Cette droite est dite
droite ajustée à l'ensemble de points.
2.2. Ajustement linéaire graphique (ou ajustement à "main levée")
Théoriquement, diverses sortes d'ajustement linéaire sont possibles, le plus simple
est l'ajustement graphique réalisé par le dessinateur.
Cette méthode consiste à placer une droite D qui semble être la plus proche possible des
points, ceux-ci se répartissent à peu près également de part et d'autre de D. On détermine
ensuite son équation à l'aide de deux de ses points.
Il est commode d'utiliser une règle transparente comportant des parallèles équidistantes.
Cette méthode donne un résultat approximatif qui dépend de l'opérateur.
2.3. Méthode de Mayer (ou méthode des moyennes discontinues)
On appelle point moyen G d'un ensemble de points Mij(xi, yj), le point ayant:
- pour abscisse la moyenne de xi :
et .
On rappelle que pour le calcul des moyennes et des variances de x et y on utilise les
formules:
et .
Exemple :Reprendre le cas de l'exemple précédent pour déterminer l'équation de la droite
d'estimation de x en y.
Remarques
Cette deuxième droite d'estimation est différente de la précédente, mais on ne peut dire si
elle représente un meilleur ajustement.
Le carré du coefficient de corrélation est égal au produit des pentes
.
Si les deux droites sont identiques, on aurait | r | = 1. Si les droites sont proches, | r | est
voisin de 1, ce qui correspond à un ajustement valide. Par contre, si | r | n'est pas très
différent de zéro, les deux pentes a et a' sont loin d'être inverses l'une de l'autre, et par
conséquent les droites d'ajustement sont sensiblement différentes : les points (xi ; yi) sont
loin d'être alignés.
b - Applications de la méthode des moindres carrés à des données groupées
Le principe de calcul est le même. Les coefficients a et b sont calculés à partir des
expressions
et
Présentation des calculs
Pour calculer les moyennes et , les variances V(X) et V(Y) et la covariance cov(X,Y), on
complète le tableau suivant :
Y
X y1 y2 ... yj ... ys ni. xi ni. xi ni. xi2
yj
n.j yj
n.j yj2
On remarque que :
On définit en particulier les moyennes et , les variances V(X) et V(Y) et les écart-
types (X) et (Y).
Moyennes arithmétiques
ou
et de même ou
Covariance
On appelle covariance du couple (X ; Y), et on note cov (X ; Y),la moyenne
de
Si on effectue le changement de variable xi = x0 + hx’i et yi = y0 + ky’j , on obtient
; -1 r 1
Si la valeur absolue de r est voisin de 1, l'ajustement est valide. ( 0,7 < |r| < 1).
Première droite des moindres carrés
Soit Mij le point de coordonnées (xi ; yj). On appelle distance de Mij parallèlement à Oy à une
droite (D) d'équation y = ax + b le nombre
dij = Mij M'ij = | yj - ax + b |.
et .
On montre que :
Exemple : Déterminer l'équation de la droite de régression de y en x de la série du tableau 2.
Présentation des calculs
xi yi xi2 yi2 xi yi
x1 y1
x2 y2
… …
xn yn
On rappelle que pour le calcul des moyennes et des variances de x et y on utilise les
formules:
et .
Exemple :Reprendre le cas de l'exemple précédent pour déterminer l'équation de la droite
d'estimation de x en y.
Remarques
Cette deuxième droite d'estimation est différente de la précédente, mais on ne peut dire si
elle représente un meilleur ajustement.
Le carré du coefficient de corrélation est égal au produit des pentes
.
Si les deux droites sont identiques, on aurait | r | = 1. Si les droites sont proches, | r | est
voisin de 1, ce qui correspond à un ajustement valide. Par contre, si | r | n'est pas très
différent de zéro, les deux pentes a et a' sont loin d'être inverses l'une de l'autre, et par
conséquent les droites d'ajustement sont sensiblement différentes : les points (xi ; yi) sont
loin d'être alignés.
b - Applications de la méthode des moindres carrés à des données groupées
Le principe de calcul est le même. Les coefficients a et b sont calculés à partir des
expressions
et
Présentation des calculs
Pour calculer les moyennes et , les variances V(X) et V(Y) et la covariance cov(X,Y), on
complète le tableau suivant :
Y
X y1 y2 ... yj ... ys ni. xi ni. xi ni. xi2
n.j N
yj
n.j yj
n.j yj2
On remarque que :