Vous êtes sur la page 1sur 3

Caroline Anjot-Mourrain

Statistiques à deux variables

Dénition. On appelle série statistique à 2 variables (ou série statistique double), une série
statistique où 2 variables sont étudiées simultanément.

1 Nuage de points
On donne la série sous forme de tableau:
variable X x1 x2 ... xn
variable Y y1 y2 ... yn

Exemple. Un responsable de ventes a dressé le tableau des dernières années de son chire d'aaires
ainsi que des frais de publicité engagés (en miliers d'euros). Son but est d'étudier la relation pouvant
exister entre ces 2 variables.

Frais de publicité X 10 6 6,5 11,5 11 8 7 6,5 11 9


Chire d'aaires Y 250 220 228 262 268 244 240 222 259 246

On représente graphiquement cette série double dans un repère orthogonal en plaçant les points
Mi(xi; yi) :

2 Paramètres caractéristiques

2.1 Point moyen

Dénition. On dénit le point moyen G de cette série double comme le point de coordonnées
,Y) où X
(X  est la valeur moyenne de X et Yla valeur moyenne de Y.

Dans l'exemple, G(8; 65; 243; 90)

1
2.2 Variance et écart-type

Dénition. La variance de X est donnée par :

n
1X 2 2
V (X) = xi ¡ X
n
i=1

p
L'écart-type est : X = V (X)

Dans l'exemple, X = 2; 01 et Y =15,80

2.3 Covariance et coecient de corrélation linéaire

Dénition. La covariance des variables X et Y est donnée par la formule suivante:


n
1X Y
X ;Y = xiyi ¡ X
n
i=1

Dans l'exemple, X ;Y = 30; 36

Dénition. Le coecient de corrélation linéaire est déni par:

X ;Y
rX ;Y =
X  Y

Le coecient de corrélation linéaire est un indice qui mesure le degré de relation entre les 2 variables
étudiées X et Y.
Dans l'exemple, r = 0; 95
Remarques:

 Un coecient de corrélation est un nombre compris entre -1 et 1.

 Un coecient de corrélation positif (respectivement négatif) indique que le nuage de points


est croissant (respectivement décroissant).

 Le coecient vaut 0 s'il n'y a absolument aucune relation entre les 2 variables, 1 ou -1 si
les points sont parfaitement alignés.

2.4 Droite de regression (ou ajustement ane)


On cherche à déterminer une droite approchant le nuage de points. Ceci permettra de faire des
prévisions pour le futur. On utilise la méthode dite  des moindres carrés .

X ;Y
Proposition. La droite de regression a pour équation Y=aX+b où a= 2 et b est déterminé
X
par le fait que cette droite passe par le point moyen G du nuage de points donc b=Y ¡ a  X.

30; 36
Dans l'exemple: a =  7; 49 et b = 243; 90 ¡ 7; 49  8; 65  179; 09
2; 012
La droite de regression a donc pour équation Y = 7; 49X + 179; 09

2
Remarque: Ceci est une méthode d'ajustement ane, il en existe d'autres.

La droite de régression permet de faire des prédictions.


Par exemple pour une dépense de 9,5 milliers d'euros de publicité, on peut s'attendre à un chire
d'aaires de y=7,499; 5 + 179; 09 = 250; 2 milliers d'euros.

Vous aimerez peut-être aussi