Académique Documents
Professionnel Documents
Culture Documents
- Dans le cas de la prédiction, l’objectif est de maximiser le pouvoir prédictif des variables
indépendantes.
• L’hypothèse nulle est qu’il n’y a pas de relation linéaire entre la combinaison des variables
indépendantes (X1, X2, X3… Xn) et la variable dépendante (Y).
• L’hypothèse inverse stipule que la combinaison des variables indépendantes est associée
significativement à la variable dépendante.
- Introduire (par défaut) : toutes les variables (d’un bloc) sont introduites en une seule
opération ;
- Éliminer bloc : Toutes les variables dans un bloc sont supprimées en une seule étape ;
- Hiérarchique Descendante (backward) : toutes les variables sont entrées initialement
dans l’équation et sont ensuite éliminées une à une. La variable ayant la plus petite
corrélation avec la variable dépendante est d’abord étudiée pour l’élimination. Si
elle est éliminée par le modèle, la prochaine variable avec le plus petit coefficient
de corrélation est étudiée, jusqu’à ce qu’aucune variable ne satisfasse plus au
critère d’élimination ;
Pour obtenir une RLM, allez dans le menu Analyse/ Régression / Linéaire / placer la
variable à expliquer « prix de la première voiture » dans Variable dépendante / placez
les 3 variables explicatives dans « variables indépendantes »
5. OUTPUT DE SPSS
a. Statistiques descriptives
b. Corrélations
c. Colinéarité
Évaluation de la colinéarité:
Une méthode simple pour détecter une trop grande corrélation entre variables
indépendantes consiste à demander des tests de colinéarité : tolérance et facteur
d’inflation de la variance (VIF). La tolérance est définie comme « la part de
variabilité de la variable indépendante qui n’est pas expliquée par une ou d’autres
variables indépendantes ». Une tolérance élevée correspond à un faible degré de
colinéarité. Le seuil de 0,3 est recommandé. À l’inverse, le seuil du facteur
d’inflation de la variance (VIF) doit être faible (< 3). Dans cet exemple, la
colinéarité ne pose pas de problème pour l’analyse car Tolérances et facteurs
d’inflation de la variance (VIF) sont largement dans les limites recommandées
(tolérance > 0,3 et VIF < 3). Les variables explicatives sont donc peu corrélées entre
elles, ce qui est un indice de qualité du modèle.
2
Moyennant une transformation adéquate, R permet
de tester l’hypothèse H0 : b1 = b2 = ... = bk = 0, c’est-
à-dire l’hypothèse qu’aucune variable explicative
n’exerce une incidence sur la variable dépendante.
Si, au seuil de signification retenu (a), F calculé> Ftable, on rejette l’hypothèse que b1 = b2 = ... =
bk = 0 pour lui préférer l’hypothèse qu’au moins un bi = 0, c’est-à-dire qu’au moins une variable
explicative a une incidence sur la variable dépendante. C’est dire que le test F effectué à partir de
2
R envisage une hypothèse très minimale.
Sur SPSS, il est inutile de faire appel à une table de décision. On doit considérer seulement la
signification du test (valeur p). Ces données (Fcalculé et le résultat de sa confrontation avec la
table F) figurent dans le tableau d’analyse de variance (ANOVA).
Significatif au
niveau de …
On constate à la lecture du tableau que selon la valeur F obtenue, on peut rejeter l’hypothèse nulle.
En effet, la valeur de 3604,275 est significative au seuil de signification 5% (p=0.000 < 0,05), ce
qui indique que nous pouvons accepter, sans grand risque (Sig. = 0,000) de se tromper, qu’au moins
une variable explicative a une incidence sur la variable Prix du premier véhicule.
f. Coefficients de détérminantion : R2
R2 prend ses valeurs entre 1 et 0. Les 3 variables prises en compte, ensemble, expliquent 77
% du prix du premier véhicule(R2). R2ajusté, plus faible que R2, tient compte de la perte
d’information liée aux degrés de liberté.
Les coefficients de la pente de régression sont donnés dans la 2ème colonne du tableau
« coefficients ». À partir de ces coefficients on peut écrire :
Nous pouvons conclure que le modèle est satisfaisant, car il explique 77,7 % du prix
2
du premier véhicule (R ). Il est significatif (voir tableau ANOVA. Sig.,000), les
coefficients de la pente de régression sont significatifs et il n’y a pas de problème de
colinéarité (tolérances > 0,3)