Vous êtes sur la page 1sur 2

NOVEMBRE 2020

2 année SE/SD/AF/ROAD
ENSEIGNANT : M. BERROUYNE

ANALYSE DE LA REGRESSION
TRAVAUX PRATIQUES
SERIE 2

II. REGRESSION LINEAIRE MULTIPLE


EXERCICE N°1.

On cherche à expliquer les ventes d’une société (VENTES.dta). Nous utiliserons une base de données
qui contient des informations sur plusieurs semaines (120 observations). Les variables incluses dans
cette base sont :
TABLEAU DESCRIPTIF DES VARIABLES
NOM DE LA VARIABLE DESCRIPTION
VENTES Ventes de la société (en unités)
INV Volume des investissements (en dhs)
PRIX Prix de l’unité à vendre (en dhs)
PUBLICITE Frais engagés pour la publicité (en dhs)
FV Frais engagés pour les ventes (en dhs)
Le modèle de la régression que nous estimons est le suivant :
𝑽𝑬𝑵𝑻𝑬𝑺𝒊 = 𝒃𝟎 + 𝒃𝟏 𝑰𝑵𝑽𝒊 + 𝒃𝟐 𝑷𝑹𝑰𝑿𝒊 + 𝒃𝟑 𝑷𝑼𝑩𝑳𝑰𝑪𝑰𝑻𝑬𝒊 + 𝒃𝟒 𝑭𝑽𝒊 + 𝒊 (1)
1. Donner le code STATA pour construire les digrammes du nuage de points et obtenir la matrice des
corrélations.
2. Donner une lecture à ces résultats.
3. Donner le code STATA pour estimer le modèle (1) par les moindres carrés ordinaires.
4. Commenter les résultats obtenus (R2, R2-ajusté, significativité globale, significativité des
coefficients).
5. Ces résultats sont-ils cohérents, sur le plan signe des coefficients, avec ceux obtenus pour la
question (1) ? Justifier votre réponse.
6. A votre avis, quelles sont les raisons derrières ces résultats ? Justifier votre réponse.
7. Est-ce qu’il y a des remèdes à cette situation ? Si oui, lesquels ?

Page 1 sur 2
8. On s’intéresse aux résidus de l’estimation par les moindres carrés ordinaires.
- Donner le code STATA pour créer dans la base de données les résidus non standardisés (variable
résidus).
- Donner le code STATA pour construire le graphique de la distribution de ces résidus avec courbe
Gaussienne.
- Commenter ce graphique et conclure.
- Comment doit-être la loi des résidus ? Pourquoi cette hypothèse est-elle cruciale ?
- Citer et discuter trois techniques statistiques pour tester la normalité des résidus.
9. On cherche à vérifier l’hypothèse du non autocorrélation des résidus. Pour cela, on préconise le test
de Durbin-Watson.
- Rappeler l’hypothèse nulle (H0) et les hypothèses alternatives (H1) de ce test.
- Donner le code STATA pour compiler le test de Durbin-Watson.
- Commenter ce résultat et conclure.
Pour n=120 et k=4, la table de Durbin-Watson donne les informations suivantes:
DL = 1.64 et DU = 1.78. Comparer ce résultat avec celui trouvé précédemment et conclure.
10. On cherche à vérifier l’hypothèse d’homoscédasticité des résidus.
- Donner le code STATA permettant d'établir le test approprié pour la vérification de cette hypothèse
- Analyser ce résultat et conclure.
- En cas d’hétéroscédasticité (absence d’homoscédasticité), quelles sont les conséquences sur les estimateurs
« MCO » de a et la variance des erreurs ? Justifier votre réponse.
- Enumérer et discuter les deux stratégies utilisées pour remédier au problème d’hétéroscédasticité ?
11. On s’intéresse maintenant à la sélection d’un modèle optimal.
Pour cela, nous avons choisi la méthode "BACKWARD".
- Donner le code STATA pour faire ce choix.
- Quand est ce que la sélection d'un modèle optimal est nécessaire ? expliquer soigneusement le principe
de la sélection d'un modèle optimal.
- Donner une lecture aux résultats trouvés et dégager, s'il existe, ce modèle optimal.
EXERCICE N°2.

Reprendre l'exercice n°1 en traitant, dans le cas du possible, les questions par le logiciel SPSS.

EXERCICE N°3.

Reprendre l'exercice n°1 en traitant, dans le cas du possible, les questions par le logiciel R/Rcmdr/R-
Studio.

Page 2 sur 2

Vous aimerez peut-être aussi