Académique Documents
Professionnel Documents
Culture Documents
Dénition. On appelle série statistique à 2 variables (ou série statistique double), une série
statistique où 2 variables sont étudiées simultanément.
1 Nuage de points
On donne la série sous forme de tableau:
variable X x1 x2 ... xn
variable Y y1 y2 ... yn
Exemple. Un responsable de ventes a dressé le tableau des dernières années de son chire d'aaires
ainsi que des frais de publicité engagés (en miliers d'euros). Son but est d'étudier la relation pouvant
exister entre ces 2 variables.
On représente graphiquement cette série double dans un repère orthogonal en plaçant les points
Mi(xi; yi) :
2 Paramètres caractéristiques
Dénition. On dénit le point moyen G de cette série double comme le point de coordonnées
,Y) où X
(X est la valeur moyenne de X et Yla valeur moyenne de Y.
1
2.2 Variance et écart-type
n
1X 2 2
V (X) = xi ¡ X
n
i=1
p
L'écart-type est : X = V (X)
X ;Y
rX ;Y =
X Y
Le coecient de corrélation linéaire est un indice qui mesure le degré de relation entre les 2 variables
étudiées X et Y.
Dans l'exemple, r = 0; 95
Remarques:
Le coecient vaut 0 s'il n'y a absolument aucune relation entre les 2 variables, 1 ou -1 si
les points sont parfaitement alignés.
X ;Y
Proposition. La droite de regression a pour équation Y=aX+b où a= 2 et b est déterminé
X
par le fait que cette droite passe par le point moyen G du nuage de points donc b=Y ¡ a X.
30; 36
Dans l'exemple: a = 7; 49 et b = 243; 90 ¡ 7; 49 8; 65 179; 09
2; 012
La droite de regression a donc pour équation Y = 7; 49X + 179; 09
2
Remarque: Ceci est une méthode d'ajustement ane, il en existe d'autres.