Académique Documents
Professionnel Documents
Culture Documents
1. SPÉCIFICATION DU MODÈLE
L'approche linéaire est inadéquate lorsque la variable dépendante est de nature qualitative. Nous
préférerons alors un modèle de régression logistique binaire ou multinomiale lorsque la variable dépendante en comprend plus de
deux modalités. A noter aussi que deux variables peuvent être parfaitement liées mais, si leur rapport n'est pas linéaire, le
coefficient de corrélation n'est pas une statistique adaptée pour mesurer leur association. Alors il est recommandé de tracer le
diagramme de dispersion pour soupçonner le type de relation existante entre nos deux variables.
1
Dans notre cas de régression simple, normalement les valeurs de la variable dépendante
(Y) sont calculées à partir des valeurs de la variable indépendante (X) par l’équation
2. VALIDATION DU MODÈLE
La deuxième étape consiste à vérifier le modèle dans sa globalité.
Il existe trois mesures possibles pour quantifier l’intensité de la relation entre X et Y:
– Le coefficient de détermination de Y en fonction de X
– Le coefficient de corrélation entre X et Y
– La covariance entre X et Y
Le coefficient de détermination théorique de Y en fonction de X, noté ρ2 mesure la proportion de la variance de Y qui est expliquée
par la variable X au niveau de toute la population. A noter que 0≤ ρ2 ≤1.
En pratique ρ2 est inconnu, car nous ne possédons pas d’information sur toute la population mais seulement sur un échantillon de
taille n, alors nous l’estimerons par la statistique r2.
Nous appelons résidu ou erreur empirique ou écart de prévision (ei ) la différence (l’écart vertical) entre la valeur
La linéarité est importante car le concept de corrélation est fondé sur une relation linéaire. La linéarité d'une relation bivariée
est vérifiée par l'examen des résidus.
L'homoscédasticité est vérifiée par l'examen des résidus ou par des tests statistiques. Son utilisation est souvent recommandée.
L'indépendance des termes d'erreur est une autre condition de l'analyse de régression multiple. Outre l'examen du graphique
des résidus peut aussi être validée par le test de Durbin-Watson, notamment dans le cas de données temporelles.
3
2. REGRESSION LINEAIRE SIMPLE : APPLICATION SUR LOGICIEL
Si R2 est égale à 0,76 veut dire que 76% de la variance du rendement est expliquée par la variance de la motivation.
1- La spécification du modèle consistant à tracer le nuage de point - dit encore diagramme de dispersion - et à soupçonner
l’existence et le type de la relation entre les deux variables.
Procédure sous SPSS : Analyse – Régression – Ajustement de fonction.
2- La validation du modèle se fait à travers plusieurs indicateurs et nous retenons l’analyse de la variance(ANOVA)
Règle de décision : Si la signification de l’ANOVA est inférieure au seuil choisi (α) nous acceptons le modèle, autrement nous
confirmons l’existence de relation entre la variable à expliquer et la variable explicative.
Procédure sous SPSS : Analyse – Régression – Linéaire – Statistiques – Qualité de l’ajustement.