Vous êtes sur la page 1sur 12

Vous vous occupez d'une chaîne de magasins

Vous disposez de statistiques concernant 10 magasions que vous avez contrôlés et dont les données sont fiables

x1 x2 y
N° magasin Superficie (m²) Effectif CA en m€ Modèle linéaire
1 100 24 11 y=a1*x1+a2+x2+b
2 600 28 23
3 600 20 20
4 700 23 21
5 700 26 21
6 500 21 13
7 800 28 30
8 300 28 18
9 200 20 7
10 200 25 18

Vous décidez de vous baser sur les données de cet échantillon pour vérifier la déclaration de CA d'un autre magasin
que penseriez vous d'un magasin de superficie 500, 22 salariés qui n'aurait déclaré qu'un CA de 10 m€

Procédure
On construit un modèle expliquant le CA par le nombre de salariés et la superficie du magasin
on teste la validité de ce modèle sur l'échantillon (validité interne)

1ère étape : Validation interne :

0.9861525606 0.01798934 -14.218495 => toujours 5 lignes et autant de colonnes que de variables
0.299152296 0.00387441 7.15319946 Formule droitereg : faire shift+ctrl+entrée (pas OK sinon
0.8544465177 2.83159276 #N/A ça donne :
20.5461440296 7 #N/A
329.4745772154 56.1254228 #N/A a2 a1
ecart type a2 ecart type σ a1
R² = 0,85 donc validation interne confirmée R² ecart type σ y
puisque > à 0,75 (très bonne correlation) Fobs n-k-1
Ve Vr

Variation expliquée Variation résiduelle

VT = VE + VR
VT = variation totale

2ème étape : Validation externe :


si LOI.F(Fobs;k;n-k-1) < (α =5%)
Fobs = 0.0011764652 est inférieur au risque fixé α de 5% alpha 5% = écart/risque fixé acceptable en général
k= nbre de variables du problème
n= taille de l'échantillon

3ème étape : stabilité des coefficients :


a) stabilité de a1 :
Fa1 21.5585137978 Fa1= (a1/ σ écart type de a1)²
0.24% SI LOI.F(Fa1;1;n-k-1)< α (5%) alors a1 est
Cette proba est inférieure à 5% donc a1 est stable a) stabilité de a2 :
Fa2 10.8668465015 SI LOI.F(Fa2;1;n-k-1)< α (5%) alors a2 est
1.32%
Cette proba est inférieure à 5% donc a2 est stable

Le modèle linéaire y=a1*x1+a2+x2+b est valide

Pour répondre à la question posée, on calcul l'intervalle de confiance au risque de 5% qui est de la forme :
I = [yp-2 σ y ; yp+2 σ y]
pour trouver yp on remplace dans y=a1 x1 + a2 x2+b)
x1 = 500
x2 = 22 yp= 16.4715292
Intervalle valeur mini 10.8083437 -7.5% -39.3%
Intervalle valeur maxi 22.1347147

Le CA du magasin analysé est inférieur à l'intervalle mini de 10,8 m€ (-7,5% sur l'intervalle mini et -39% par rapport à la moy
La déclaration est douteuse. Il faut demander explications et vérifier
Méthodo :
données sont fiables
a1, a2, et b sont donnés par la fonction "DROITEREG"
1 - validation interne du modèle :
si R² ≥ 0,75 => la validation interne est vérifiée coefficient de corrélation
2 - Validation externe : règle de Fisher
On détermine Fobs (fisher observé)
grace à DROITEREG
si LOI.F(Fobs;k;n-k-1) < (α =5%) alors on a la validation externe
alpha 5% = écart/risque fixé acceptable en général
k= nbre de variables du problème
n= taille de l'échantillon
3 - Stabilité des coefficients :
a) stabilité de a1 :
Fa1= (a1/ σ écart type de a1)²
SI LOI.F(Fa1;1;n-k-1)< α (5%) alors a1 est stable
a) stabilité de a2 :
SI LOI.F(Fa2;1;n-k-1)< α (5%) alors a2 est stable
e CA d'un autre magasin

utant de colonnes que de variables +1


aire shift+ctrl+entrée (pas OK sinon la formule ne fonctionne pas)

b R : coéfficient de corrélation
ecart type σ ab R² : coefficient de détermination
σ

VE
VE+VR = R²
xé acceptable en général
du problème

bilité de a1 :
(a1/ σ écart type de a1)²
I.F(Fa1;1;n-k-1)< α (5%) alors a1 est stable
bilité de a2 :
I.F(Fa2;1;n-k-1)< α (5%) alors a2 est stable

st de la forme :

e mini et -39% par rapport à la moyenne)


Vous vous occupez d'une chaîne de magasins
Vous disposez de statistiques concernant 10 magasions que vous avez contrôlés et dont les données sont fiables

x1 x2 y
N° magasin Superficie (m²) Effectif CA en m€ Modèle linéaire
1 100 24 11 y=a1*x1+a2+x2+b
2 600 28 23
3 600 20 20
4 700 23 21
5 700 26 21
6 500 21 13
7 800 28 30
8 300 28 18
9 200 20 7
10 200 25 18

Vous décidez de vous baser sur les données de cet échantillon pour vérifier la déclaration de CA d'un autre magasin
que penseriez vous d'un magasin de superficie 500, 22 salariés qui n'aurait déclaré qu'un CA de 10 m€

Procédure
On construit un modèle expliquant le CA par le nombre de salariés et la superficie du magasin
on teste la validité de ce modèle sur l'échantillon (validité interne)

1ère étape : Validation interne :

0.9861525606 0.01798934 -14.218495 => toujours 5 lignes et autant de colonnes que de variables
0.299152296 0.00387441 7.15319946 Formule droitereg : faire shift+ctrl+entrée (pas OK sinon
0.8544465177 2.83159276 #N/A ça donne :
20.5461440296 7 #N/A
329.4745772154 56.1254228 #N/A a2 a1
ecart type a2 ecart type σ a1
R² = 0,85 donc validation interne confirmée R² ecart type σ y
puisque > à 0,75 (très bonne correlation) Fobs n-k-1
Ve Vr

Variation expliquée Variation résiduelle

VT = VE + VR
VT = variation totale

2ème étape : Validation externe :


si LOI.F(Fobs;k;n-k-1) < (α =5%)
Fobs = 0.0011764652 est inférieur au risque fixé α de 5% alpha 5% = écart/risque fixé acceptable en général
k= nbre de variables du problème
n= taille de l'échantillon

3ème étape : stabilité des coefficients :


a) stabilité de a1 :
Fa1 21.5585137978 Fa1= (a1/ σ écart type de a1)²
0.24% SI LOI.F(Fa1;1;n-k-1)< α (5%) alors a1 est
Cette proba est inférieure à 5% donc a1 est stable a) stabilité de a2 :
Fa2 10.8668465015 SI LOI.F(Fa2;1;n-k-1)< α (5%) alors a2 est
1.32%
Cette proba est inférieure à 5% donc a2 est stable

Le modèle linéaire y=a1*x1+a2+x2+b est valide

Pour répondre à la question posée, on calcul l'intervalle de confiance au risque de 5% qui est de la forme :
I = [yp-2 σ y ; yp+2 σ y]
pour trouver yp on remplace dans y=a1 x1 + a2 x2+b)
x1 = 500
x2 = 22 yp= 16.4715292
Intervalle valeur mini 10.8083437 -7.5% -39.3%
Intervalle valeur maxi 22.1347147

Le CA du magasin analysé est inférieur à l'intervalle mini de 10,8 m€ (-7,5% sur l'intervalle mini et -39% par rapport à la moy
La déclaration est douteuse. Il faut demander explications et vérifier
Méthodo :
données sont fiables
a1, a2, et b sont donnés par la fonction "DROITEREG"
1 - validation interne du modèle :
si R² ≥ 0,75 => la validation interne est vérifiée coefficient de corrélation
2 - Validation externe : règle de Fisher
On détermine Fobs (fisher observé)
grace à DROITEREG
si LOI.F(Fobs;k;n-k-1) < (α =5%) alors on a la validation externe
alpha 5% = écart/risque fixé acceptable en général
k= nbre de variables du problème
n= taille de l'échantillon
3 - Stabilité des coefficients :
a) stabilité de a1 :
Fa1= (a1/ σ écart type de a1)²
SI LOI.F(Fa1;1;n-k-1)< α (5%) alors a1 est stable
a) stabilité de a2 :
SI LOI.F(Fa2;1;n-k-1)< α (5%) alors a2 est stable
e CA d'un autre magasin

utant de colonnes que de variables +1


aire shift+ctrl+entrée (pas OK sinon la formule ne fonctionne pas)

b R : coéfficient de corrélation
ecart type σ ab R² : coefficient de détermination
σ

VE
VE+VR = R²
xé acceptable en général
du problème

bilité de a1 :
(a1/ σ écart type de a1)²
I.F(Fa1;1;n-k-1)< α (5%) alors a1 est stable
bilité de a2 :
I.F(Fa2;1;n-k-1)< α (5%) alors a2 est stable

st de la forme :

e mini et -39% par rapport à la moyenne)


EXERCICE
on a observé sur 10 magasins les effets de différentes combinaisons de médias sur les ventes
B A1 A2
Publicité
Observations Ventes PLV
presse
i Y X1 X2 Modèle linéaire
1 30 2 6 y=a1*x1+a2+x2+b
2 22 1 3
3 29 6 2
4 35 4 5
5 25 3 3
6 40 2 8
7 24 6 1
8 21 2 2
9 32 7 2
10 15 1 1

1 - Donner l'équation du modèle en précisant a1, a2 et b


2- Valider le modèle
3- Donner la prévision des ventes pour un investissement de 10 en publicité et de 6 en PLV

1ère étape : Validation interne :

3.1346214428 2.1496902237 9.64680248


0.2245896638 0.2337603335 1.33598073
0.9689694429 1.4709576527 #N/A
109.2920453 7 #N/A
472.95398509 15.1460149113 #N/A

R² = 0,97 donc validation interne confirmée


puisque > à 0,75 (très bonne correlation)

2ème étape : Validation externe : si LOI.F(Fobs;k;n-k-1) < (α =5%)


alpha 5% = écart/risque fixé acceptable en général
Fobs = 0.00000526 est Inférieur au risque fixé α de 5% k= nbre de variables du problème
n= taille de l'échantillon

3ème étape : stabilité des coefficients :


a) stabilité de a1 :
Fa1 84.5687918589 Fa1= (a1/ σ écart type de a1)²
0.00% SI LOI.F(Fa1;1;n-k-1)< α (5%) alors a1 est st
Cette proba est inférieure à 5% donc a1 est stable a) stabilité de a2 :
Fa2 194.800770393 SI LOI.F(Fa2;1;n-k-1)< α (5%) alors a2 est st
0.00%
Cette proba est inférieure à 5% donc a2 est stable

pour trouver yp on remplace dans y=a1 x1 + a2 x2+b)


x1 = 10
x2 = 6 yp= 49.9514334 Vérif : 49.95143337

La prévision des ventes pour un investissement de 10 en publicité et de 6 en PLV est de 50 (49,95)

Intervalle valeur mini 47.0095181 Pour répondre à la question posée, on calcul l'intervalle de confiance au risque de
Intervalle valeur maxi 52.8933487 I = [yp-2 σ y ; yp+2 σ y]
table en général

art type de a1)²


n-k-1)< α (5%) alors a1 est stable

n-k-1)< α (5%) alors a2 est stable


le de confiance au risque de 5% qui est de la forme :