Vous êtes sur la page 1sur 3

Université Hassan II Casablanca Année universitaire 2015 - 2016

Faculté des Sciences et Techniques Module M29 - GMI2


Département de Mathématiques Pr. Belmaati

Examen du module : Séries chronologiques


(Durée : 3 heures)

Questions de cours

1. On considère le modèle de régression linéaire simple où l’on observe n réalisations


(xi , yi ), avec i = 1, . . . , n, d’un couple de variables aléatoires liées par la relation

yi = β0 + β1 xi + εi , i = 1, . . . , n

On suppose que les εi sont iid de loi N (0, σ 2 ) où σ 2 est inconnue.
Montrer que β̂0 l’estimateur des moindres carrés de β0 est de variance minimale.
2. Montrer qu’une moyenne mobile M centrée conserve les suites constantes ssi la
somme de ses coefficients valent 1. Si M est symétrique et conserve les constantes,
montrer que M conserve les polynômes de degrés 1 (i.e Xt = at + b).

Exercice 1
On considère les données observées sur un échantillon de 474 employés tirés au sort dans
une entreprise. Les variables étudiées ici sont les suivantes :
• salary : salaire brut actuel en DH par an
• salbegin : salaire de départ en DH par an
• minority : appartenance à une minorité (0 (Non), 1 (Oui))
• jobtime : nombre de mois depuis l’entrée dans l’entreprise
• prevexp : nombre de mois de travail avant l’entrée dans l’entreprise
• educ : nombre d’années d’étude
On souhaite expliquer la variable ”salary” en fonction de toutes les autres variables à
l’aide de la régression linéaire multiple. En utilisant le logiciel R, on a obtenu la sortie
suivante :

Call:
lm(formula = salary ~ ., data = salaire1)
Residuals:
Min 1Q Median 3Q Max
-29607 -3816 -1212 2528 45935

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.601e+04 3.256e+03 -4.917 1.22e-06 ***
salbegin 1.759e+00 5.921e-02 29.714 < 2e-16 ***
jobtime 1.634e+02 3.427e+01 4.767 2.50e-06 ***

1
revexp -1.668e+01 3.566e+00 -4.679 3.79e-06 ***
educ 6.718e+02 1.655e+02 4.059 5.78e-05 ***
minority -1.007e+03 8.498e+02 -1.185 0.237
---
Signif. codes:
0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1

Residual standard error: 7462 on 468 degrees of freedom


Multiple R-squared: 0.8111,Adjusted R-squared: 0.809
F-statistic: 401.8 on 5 and 468 DF, p-value: < 2.2e-16

1. Donner l’équation de la droite de régression qu’on a utilisé.


2. Quelles sont les variables significatives au seuil 5% ?
3. Tester la nullité de chaque coefficient au risque 5% en n’oubliant pas de donner les
hypothèses nulle et alternative du test et la loi de la statistique du test. Que peut-on
conclure ?
4. Tester la significativité globale du modèle à un niveau de risque de 5% en n’oubliant
pas de donner les hypothèses nulle et alternative du test et la loi de la statistique
du test. Que peut-on conclure ?
5. Relever et interpréter la valeur observée du coefficient R2 .
6. Pensez vous que le modèle ajusté est pertinent ? Justifier votre réponse.
On a décidé d’éliminer la variable ”minority” de notre étude. Sous R, on a obtenu

Call:
lm(formula = salary ~ . - minority, data = salaire1)
Residuals:
Min 1Q Median 3Q Max
-29600 -4119 -1246 2642 46079

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.615e+04 3.255e+03 -4.961 9.84e-07 ***
salbegin 1.768e+00 5.873e-02 30.111 < 2e-16 ***
jobtime 1.615e+02 3.425e+01 4.715 3.19e-06 ***
revexp -1.730e+01 3.528e+00 -4.904 1.30e-06 ***
educ 6.699e+02 1.656e+02 4.045 6.11e-05 ***
---
Signif. codes:
0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1

Residual standard error: 7465 on 469 degrees of freedom


Multiple R-squared: 0.8105,Adjusted R-squared: 0.8089
F-statistic: 501.5 on 4 and 469 DF, p-value: < 2.2e-16

Comparer avec le modèle utilisé au début.

2
Exercice 2
Un magasin commercialise un article et dispose d’un ensemble de données comportant les
ventes de cet article pour chaque année depuis 5 ans. Le magasin est intéressé par une
prévision des ventes futures. Les tableaux ci-dessous contiennent les données de ventes (à
gauche) et les ventes lissées par une moyenne mobile centrées d’ordre 3 (à droite).

2009 2010 2011 2012 2013 2009 2010 2011 2012 2013
I 6 9 6 12 15 I *** 10 11 14 ***
II 6 12 12 15 18 II *** 12 11 16 ***
III 9 15 15 21 24 III *** 11 13 17 ***

1. Compléter les entrées du tableau de gauche marquées avec ***.


2. Obtenir les coefficients saisonniers.
3. Obtenir les valeurs de la série corrigée par variations saisonnières (CVS).
4. L’estimation de la tendance de cette série, sous R, est donnée par
Call:
lm(formula = CVS ~ seq(1:15))

Coefficients:
(Intercept) seq(1:15)
4.629 1.046
Calculer une prévision des ventes à un horizon de deux périodes.