Académique Documents
Professionnel Documents
Culture Documents
Introduction
Dans les chapitres précédents, nous avons présenté les méthodes qui permettent de
résumer et représenter les informations relatives à une variable.
Dans la suite, nous introduisons l'étude globale des relations entre deux
variables (en nous limitant au cas de deux variables).
Tableau de Données
Un tableau de donnée pour une série statistique à deux variables peut être présenté
sous deux formesdifférentes:
Forme 1:
Forme 2:
Où "n" est l'effectif total de la population ; et "xi","yi" représentent les valeurs des
caractères "X" et "Y" respectivement, observées pour chaque individus "i".
Example
Exemple (1): "Forme 1"
Nuage de points
Pour chaque couple d'observation (xi , yi), i=1....n, on lui associe un point "Mi" de (xi ,
yi) dans un repère orthonormé.
Example
Pour l'exemple (2) précédent:
Droite de régression et Ajustement Linéaire
L'idée est de transformer un nuage de point en une droite. Celle-ci doit être la plus
proche possible de chacun des points.
Cette distance matérialise l'erreur, c'est à dire la différence entre le point réellement
observé et le point prédit par la droite.
Si la droite passe au milieu des points, cette erreur sera alternativement positive et
négative, la somme des erreurs étant par définition nulle.
Ainsi, la méthode des moindres carrés (MCO) consiste à chercher la valeur des
paramètres "a" et "b" qui minimise la somme des erreurs élevées au carré.
On pose:
avec "ei" est l'erreur commise sur chaque observation, c'est à dire;
La méthode des moindres carrées (MCO) consiste donc à minimiser la fonction U (la
somme des erreurs commises). Nous avons la condition de minimisation suivante:
Syntax
Donc, la droite de régression est donnée par:
Method
Moyenne de "X":
Variance de "X":
Moyenne de "Y":
Variance de "Y":
Definition
La quantité:
Note
Exemple
Revenons à l'exemple 2. (Afin de trouver la droit de regression "Y"en "X"):
On a le tableau suivant:
On a alors:
Donc l'équation de la droite de régression de "y" en "x"est:
Note
*On déduit alors que l'ajustement linéaire est bon (0.86 >0.7 et proche de 1).