Vous êtes sur la page 1sur 7

1

Série statistique double à l’aide d’un exemple

Série statistique double: exemple.......................................................................... 2


Série statistique double: questions posées............................................................. 3
Calcul de la covariance sur la base de l'exemple .................................................. 4
Calcul du coefficient de corrélation sur la base de l'exemple............................... 5
La droite des moindres carrés de y en x pour l'exemple ...................................... 6
La prévision ........................................................................................................... 7

Cliquer sur le chapitre désiré


Cliquer sur Haut du document pour revenir ici
2

Série statistique double: exemple

i 1 2 3 4 5 6
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Ce tableau donne pour une société le chiffre des ventes en milliers et le budget
de publicité correspondant pour les 6 dernières années notées i de 1à 6.
Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i .

Exercice
Calculer le chiffre des ventes et le budget de publicité moyen pour les 6
dernières années.
6 6
∑ ix ∑ yi
x = i =1 , y = i =1
6 6

Calculer la variance est l'écart pour les chiffres des ventes et les budgets de
publicité pour les 6 dernières années.
Dans un repère orthogonal adapté placer les points

M ( x i , y i ) avec i = 1,2,3,4,5, 6
et le point M (x, y) appelé " point moyen".
Réponse
x = 30
y=5

Vocabulaire
L'ensemble des points obtenus s'appelle nuage statistique (associé à la statistique
double considérée).

Haut du document
3

Série statistique double: questions posées

On reprend l'exemple précédent:

i 1 2 3 4 5 6
x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
Ce tableau donne pour une société le chiffre des ventes en milliers et le budget
de publicité en milliers d'euros correspondant pour les 6 dernières années notées
i de 1à 6.
Pour l'année i le budget de publicité est x i ,le chiffre des ventes est y i .

Question 1
Y a t il une corrélation entre le chiffre des ventes et le budget de publicité,
comment mesurer cette corrélation?
Pour répondre à cette question il faut calculer la covariance et le coefficient de
corrélation (voir plus loin).
Question 2
Peut-on donner une évaluation du montant des ventes pour un budget de
publicité par exemple de 37000 euros?
Pour répondre à cette question il faut effectuer un ajustement, par exemple
trouver l'équation d'une droite d'ajustement, par exemple: la droite des
moindres carrés (voir plus loin)
Question 3
L'évaluation effectuée dans la question 2 est-elle valable?
Si le coefficient de corrélation est proche de 1 ou de −1 l'évaluation effectuée
dans la question précédente est valable, sinon elle ne l'est pas (voir plus loin).

Haut du document
4

Calcul de la covariance sur la base de l'exemple

Le tableau suivant est une série statistique double:

xy
ii
26 27 29 31 32 35
4.5 4.8 4.95 5.1 5.25 5.4

Cette série double est la suite des 6 couples

( x i , yi ) pour i = 1,2,3,4,5,6.

{ ( x1 = 26; y1 = 4.5) , ( x 2 = 27, y 2 = 4.8) , ( x 3 = 29 , y3 = 4.95) ,


( x 4 = 31 , y 4 = 5.1) , ( x 5 = 32 , y5 = 5.25 ) , ( x 6 = 35 , y 6 = 5.4) }.

Définition de la covariance
i =6
∑ ( x i − x ) × ( y i − y)
cov(x , y) = i =1
6

La covariance se calcule plus simplement ainsi

i =6
∑ x i × yi
cov(x , y) = i =1 − x×y
6

Exercice
Calculer de deux manières la covariance de la série statistique double de
l’exemple.
Réponse
cov(x , y) = 0.875

Haut du document
5

Calcul du coefficient de corrélation sur la base de l'exemple

x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4
1) On calcule la variance de la série statistique x donnée par :
x i 26 27 29 31 32 35

i =6 i=6
∑ (x i − x) 2 ∑ xi2
V( x ) = i =1 = i =1 − (x) 2
6 6
2) On calcule la variance de la série statistique y donnée par :
y i 4.5 4.8 4.95 5.1 5.25 5.4

i =6 i =6
∑ ( y i − y) 2 ∑ yi 2
V( y) = i =1 = i =1 − ( y) 2
6 6
3) Le coefficient de corrélation entre x et y est :
cov(x , y)
r ( x , y) =
V ( x ) × V ( y)
Remarque
cov(x , y)
r ( x , y) =
σx × σY
Ecart type de la série statistique x
σ x = V( x )
Ecart type de la série statistique y
σ y = V ( y)
Information très importante
Pour une série statistique double on a toujours :
cov(x , y)
− 1 < r ( x , y) = < +1
σ x × σY

Exercice Calculer le coefficient de corrélation de la série double de l’exemple.


Réponse
r ( x , y) = 0.968 Haut du document
6

La droite des moindres carrés de y en x pour l'exemple


La droite des moindres carrés de y en x admet dans le repère dans lequel le
nuage statistique a été représenté l’équation :
y − y = a ( x − x ).
Le coefficient directeur de cette droite ce calcule ainsi :
cov(x , y)
a= .
V( x )
Remarques
1) La droite des moindres carré de y en x passe par le point moyen
M ( x , y)
2) La droite des moindres carré de y en x admet pour équation
y = ax + b
avec : b = y − ax
3) Le coefficient directeur de la droite des moindres carrés de y en x est relié au
coefficient de corrélation par :
V ( y)
a = r ( x , y)
V( x )
σy
a = r ( x , y) ×
σx

Exercice
Donner une équation de la droite des moindres carrés de l’exemple.
Réponse
a = 0.093
y − 5 = 0.093( x − 30)
y = 0.093x + 2.21

Haut du document
7

La prévision
On connaît les chiffres des ventes qui correspondent à 6 budgets de publicité,
sur la base de ces informations on prévoit le chiffre des ventes pour un budget
de publicité hypothétique p en remplaçant x par p dans l’équation de la droite
des moindres carrés de y en x et en calculant la valeur de y correspondante.

x i 26 27 29 31 32 35
y i 4.5 4.8 4.95 5.1 5.25 5.4

Les calculs effectués ont donné les résultats suivants


x = 30
y=5
v( x ) = 9.333
V( y) = 0.0875
cov(x , y) = 0.875
r ( x , y) = 0.968
a = 0.093
y − 5 = 0.093( x − 30)
y = 0.093x + 2.21

Une prévision du chiffre des ventes pour un budget de publicité de 37 milliers


d’euros est :
y = 0.093 × 37 + 2.21
y = 5.651
Le chiffre des ventes prévu pour un budget de publicité de 37 milliers d’euros
est : 5.651 milliers d’unités.
Cette prévision est valable car le coefficient de corrélation est proche de 1 :
r(x, y)= 0.968.

Haut du document