Académique Documents
Professionnel Documents
Culture Documents
Rapport d’étude
THÈME
Modélisation économétrique de la
consommation d’électricité au Sénégal
de 1999 à 2015
Rédigé par :
Atoumane DIAGNE
Décharge :
L’ENSAE-Sénégal N’ENTEND DONNER AUCUNE
APPROBATION NI IMPROBATION AUX OPINIONS ÉMISES
DANS CE DOCUMENT. CES OPINIONS DOIVENT ÊTRE
CONSIDÉRÉES COMME PROPRES A L’AUTEUR.
janvier 2017
Table des matières
Introduction générale 5
Conclusion générale 28
Annexe 30
2
Table des figures
3
Modélisation économétrique de la consommation d’électricité au Sénégal
L’activité économique des pays en développement promet une accélération du fait d’une forte
demande de biens, une économie en restructuration et un défi d’émergence. Pour stimuler
l’activité économique, la demande a un grand rôle à jouer. Parmi les composantes de la demande,
il y a entre autres la consommation (publique et privée), les investissements (publics et privés)
et les exportations. Le Sénégal, faisant partie des pays sous-développés, peut miser sur les
investissements pour aspirer à l’émergence. Toutefois, dans les faits récents, le taux de croissance
économique est passé de 3,5% en 2013 à 4,3% en 2014 alors que le taux d’investissement
(approché par le taux de FBCF) a légèrement augmenté en passant de 24,4% en 2013 à 25,6%
en 2014. Le volume des investissements a connu une petite hausse d’environ 4,0% en 2014 se
traduisant par une légère reprise de la dynamique économique. Pendant ce temps, le taux de
croissance de la consommation finale est de 4,5% en 2014 contre 2,5% en 2013.
Il existe ainsi une inadéquation entre le niveau d’activité économique et l’évolution de la de-
mande intérieure. L’analyse de la consommation d’électricité (partie intégrante de la demande
de biens et services) peut permettre de comprendre le lien entre production et consommation
et de répondre au problème posé. Pour cela, cette étude vise à cerner les facteurs explicatifs
de l’évolution de la consommation d’électricité au Sénégal de 1999 à nos jours.
Le plan qui sera suivi dans ce document pour atteindre les objectifs fixés est constitué de
trois chapitres. Dans un premier temps, il sera décrit une revue de littérature en deux compo-
santes (théorique et empirique) avant de présenter les données et la méthodologique adoptée. Le
deuxième chapitre aura trait à la modélisation univariée de la consommation d’électricité. C’est
la méthode de Box-Jenkins qui sera utilisée. Un dernier chapitre portera sur la modélisation
multivariée des déterminants de la consommation d’électricité. Cette modélisation économé-
trique 1 s’effectue globalement comme suit : tests et correction de la non stationnarité, prise
en compte d’une saisonnalité éventuelle, identification du modèle, tests de causalité, test de
cointégration, validation du modèle, estimations des paramètres, prévision et interprétation
des résultats. C’est le logiciel R qui est utilisé dans la phase pratique.
5
Chapitre 1
Trois sections composent ce chapitre, à savoir la revue de littérature, la présentation des données
et l’adoption de la méthodologie d’étude. La première se divise en deux sous-sections : la revue
théorique et la revue empirique. Quant à la deuxième, il sera présenté les données utilisées. La
dernière section explicitera la méthodologie adoptée dans cette étude.
6
Modélisation économétrique de la consommation d’électricité au Sénégal
Pour des soucis de simplicités, les variables seront notées comme suit : Les deux valeurs de
l’année 2016 seront volontairement ignorées dans la modélisation économétrique. Elles serviront
à vérifier si les prévisions ont été bonnes. Il reste à signaler que la production de ciment est
plutôt une variable de contrôle du modèle. Elle devrait permettre de vérifier si les paramètres
ont été bien estimés.
Analyse descriptive :
Les graphiques tracés sont le chronogramme, le périodogramme, le corrélogramme, la courbe de
la PACF, la décomposition additive de la série (en tendance, saisonnalité et perturbations), le
lagplot, le monthplot avec les données mensuelles, etc. Les deux derniers graphiques permettent
d’étudier la saisonnalité. Les commentaires sur les graphiques serviront à avoir une idée sur
l’appartenance du modèle suivi par les données. En outre, les statistiques descriptives seront
fournies et discutées plus amplement.
En ce qui concerne le premier test, l’hypothèse nulle est la non stationnarité de la série.
Trois cas se présentent face à l’économètre : test sur un modèle avec tendance déterministe
et constante (modèle 1) ; test sur un modèle avec constante seulement (modèle 2) ; et test sur
un modèle sans constante ni tendance déterministe (modèle 3). S’il la tendance est significative
alors on estime le modèle 1 et on fait le test. Sinon, on estime le modèle 2 et si la constante est
significative alors on fait le test. Sinon, le modèle 3 est estimé suivi d’un test de stationnarité.
Pour chaque modèle, la statistique du test est définie sous H0 comme suit :
W ∗∗ (1) − 1
t1 ∼ R1 1/2
2( 0 W ∗∗ (s) ds)
W 2 (1)−1
− W (1) 01 W (s) ds
R
2
t2 ∼ 1/2
( 01 W 2 (s) ds − 01 W (s) ds)
R R
2
W (1) − 1
t3 ∼ R1 1/2
2( 0 W 2 (s) ds)
Où W(.) est un mouvement browien standard (processus de Wiener) sur [0,1] et W ∗∗ (1) et égal
à
Z 1 Z 1 Z 1 Z 1
W ∗∗ (s) = W (s) − 4 W (z) dz + 6 zW (z) dz + 6 W (z) dz − 2 zW (z) dz s
0 0 0 0
Ces distributions sont tabulées et l’hypothèse nulle ne sera acceptée que si la statistique du test
est inférieure à la valeur critique.
Dans le second test, Kwiatkowski et al. (1992) suppose que la série est la somme d’une marche
aléatoire, d’un trend déterministe et d’une erreur stationnaire. La stationnarité est testée en
posant comme hypothèse nulle la non significativité de la composante marche aléatoire. La
statistique du test est celle du test du multiplicateur de Lagrange. Elle s’écrit sous la forme
suivante : PT
St2
LM = t=1
T 2 σbε2
Avec St la somme partielle des résidus de 1 à t, T le nombre d’observations et σbε2 un estimateur
de la variance des résidus.
Cette statistique de test est aussi tabulée et l’hypothèse nulle est rejetée si elle est supérieure
à la valeur critique (le modèle étant avec ou sans tendance).
Après avoir testé la non stationnarité, il sera procédé à une correction de cette dernière. Pour
cela, deux cas de figure sont possibles : les séries stationnaires en différence (DS) et les séries
stationnaire en tendance(TS). Les séries DS et TS prennent les formes suivantes :
(
4y t = δ + εt avec εt un BB pour une série DS
4y t = δ + 4ut avec ut un ARM A (p, q) pour une série T S
Un bruit blanc est ajouté à une constante pour obtenir la série différenciée des DS. Ainsi, les
valeurs de la série différenciée des DS s’écartent avec une amplitude plus ou moins constante
d’une situation déterministe (par exemple la tendance linéaire). Les séries différenciées des TS
ont plutôt des valeurs suivant une tendance de moins en moins importante (tendant vers zéro).
Lorsque certaines séries sont de type DS alors il faudra considérer la série différenciée. Si une
première différenciation ne convient pas à stationnariser la série alors une seconde est effectuée.
Le nombre de fois où la série a pu être différencié avant d’être stationnaire s’appelle l’ordre
d’intégration (voir plus loin pour des éclaircissements). Lorsque d’autres séries sont de type
TS, elles seront régressées par mco sur t (le temps). Ensuite, pour la correction de la non
stationnarité, il sera retranché de la série la tendance déterministe (at+b).
Identification du modèle :
Un test de significativité des coefficients est effectué sur chaque modèle admissible. Il s’agit des
tests de Bartlett et Quenouille. Considérons un processus ARMA(p,q) stationnaire.
Le test de Quenouille a pour hypothèse nulle φh,h = 0 ∀ h > p. La statistique de test est
φ
tφ = √h,h1 suivant la loi de Student sous H0 à T-k ddl, où T le nombre d’observations et k le
T
nombre de paramètres estimés. Ce test permet d’identifier l’odre p tout en sachant que φh,h = 0
au delà de p.
Pour ce qui est du test de Bartlett, il s’écrit H0 : ρ(h) = 0 ∀ h > q. La statistique de test est
ρ(h)
tρ = q σ2
suivant la loi de Student sous H0 à T-k ddl. Ce dernier test permet d’identifier l’ordre
ρ
T
q selon que ρh,h = 0 pour tout h dépassant q.
Validation du modèle :
Pour tester la normalité des résidus, la littérature en a proposé plusieurs. D’abord, il y a le test
de Jarque-Bera qui fait la synthèse de l’information contenue dans le Skewness et le kurtosis.
Sa statistique de test qui suit un Chi-deux (K) sous l’hypothèse nulle est la suivante :
N N
JB = × SK 2 + × (Ke − 3)2
6 24
µ3 µ4
avec SK = σ3
le Skewness et Ke = σ4
le kurtosis où µk est le moment empirique d’ordre k.
L’autocorrélation des erreurs signifie que les erreurs sont autocorrélées. Autrement dit, la valeur
de la série des résidus dépend des valeurs passées de la série. Le nombre de retards considéré
est noté p. Elle est observée sur des données temporelles ou financières. Tout comme l’hétéros-
cédasticité, l’autocorrélation des erreurs doit être testée en priorité et corrigée le cas échéant.
Le test de breush-Godfrey généralise le nombre de retards considérés à p quelconque contrai-
rement au test de White qui se limite à un retard et le test de Wallis qui concerne un p=4.
Il se fait en deux étapes : l’estimation par mco du modèle ; l’estimation par moindres carrés
ordinaires (mco) des résidus sur les résidus retardés. Ainsi, le test se présente comme suit :
Y = Xb + u
p
X
ut = ρi × ut−i + εt
i=1
H0 : ρ1 = ρ2 = · · · = ρp
La statistique du test est un Fisher. Cependant, il est possible avant de conclure d’y ajouter la
statistique de test Box-Pierce qui suit un Chi-deux.
p
ρbi 2
X
BP = T
i=1
Alors, si la statistique de test est supérieure à la valeur critique lue sur la table de loi alors on
rejette l’hypothèse nulle. Il y a donc autocorrélation des erreurs.
Pour de petit échantillon, le test de Box-Pierce est amélioré par le test de Ljung-Box ayant
pour statistique de test
p
0 X ρbi 2
Q = T (T + 2)
i=1 T − i
Cointégration :
La stationnarisation a permis d’éviter des régressions fallacieuses. Cependant, le nombre de fois
où une série a pu être différencié avant d’être stationnaire n’est pas forcément le même pour
toutes les variables. D’où, l’idée d’étudier ce phénomène de façon commune : la cointégration.
Cette notion est apparue vers les années 1974 par Engel et Newbold avant d’être formalisée par
Engel et Granger en 1987. Tout récemment, Johansen en a donné des idées plus claires.
Par définition, une série Xt est dite intégrée d’ordre d -qu’on note I(d)- si 4d−1 X t n’est pas
stationnaire et 4d X t est stationnaire. En outre, deux séries Xt et Yt sont cointégrées d’ordre d
-qu’on note CI(d,b)- si
– Les deux séries sont intégrées d’ordre d
– Il existe une combinaison linéaire des séries qui soit intégrée d’ordre inférieur à d (c’est-
à-dire égal à d-b) avec b un entier strictement positif.
Le vecteur (α, β) tel que αXt + βXt ∼ I(d − b) est appelé vecteur d’intégration.
Ce petit détour n’est pas vain dans la mesure où l’estimation du modèle à correction d’erreur
(MCE) fera usage de la cointégration. En effet, ce modèle dynamique étudie l’évolution com-
mune à court et long terme des séries. Ceci est possible grâce au vecteur de cointégration. La
spécification du modèle dans le cas du vecteur (α, β) pour une CI(1,1) des séries Xt et Yt est
la suivante :
4Y t = γ4X t + µ (βYt−1 + αXt−1 ) + εt
Cette spécification est connue sous le nom de représentation de Granger. Des démonstrations
supplémentaires sont fournies dans l’article « Cointegration and error-correction : représenta-
tion, estimation and testing » de Engle,R.E. & Granger,C.W.J. (1987). Plus généralement, le
modèle à correction d’erreur obtenu est le suivant :
p
X q
X
4Y t = π + bi × 4Y i−1 + ai × 4X i−1 + c [βYt−1 + αXt−1 ] + ηt
i=1 i=0
Il est possible d’étudier la cointégration d’un vecteur de k variables. C’est l’approche de Johan-
sen qui propose de partir du modèle VAR pour détecter des variables cointégrées. Considérons
un modèle VAR(p) de la forme (Yt étant un vecteur de k variables) qui suit :
Modélisation univariée de la
consommation d’électricité
Cette modélisation commencera par une analyse descriptive de la variable étudiée. Ensuite, des
tests (stationnarité, causalité, cointégration. . .) seront effectués dans ce processus de modélisa-
tion. Enfin, l’estimation des paramètres et l’analyse des résultats termineront ce chapitre.
Les amplitudes sont plus importantes en début de période qu’en fin de période. C’est ainsi que
la consommation d’électricité passe de 181,5 millions de KWh en décembre 1999 à 12,1 millions
de KWh en janvier 2000, puis de 178 millions de KWh en décembre 2000 à 21 millions de KWh
14
Modélisation économétrique de la consommation d’électricité au Sénégal
en janvier 2001, un phénomène qui continue ainsi jusqu’en janvier 2005 à partir de laquelle les
fluctuations sont modérées.
Pour avoir une idée sur la saisonnalité de la série, le périodogramme est tracé. Il apparait des
pics répétitifs de manière régulière entre fréquences.
Donc, la présence de saisonnalité de période l=12 (données mensuelles) est soupçonnée. Afin
de s’assurer de cette possibilité de présence de saisonnalité, il est tracé le monthplot qui donne
l’évolution comparée de la consommation d’électricité pour chaque mois (voir graphique 3.8 en
annexe).
De même, le lagplot consigné dans le graphique 3.9 en annexe montre une évolution répétitive
de la série à longueur régulière (l=12).
Le graphique 3.10 en annexe est une décomposition additive de la série en tendance déterministe,
saisonnalité et terme aléatoire. La présence de tendance linéaire est soupçonnée ainsi que le
caractère saisonnière de la série de période l=12.
Les données sont ainsi saisonnières de période l=12 avec une tendance. Le chronogramme
de la série montre qu’il y a autocorrélation des valeurs de la série avec les valeurs passées.
L’affirmation de la stationnarité de la variable peut être remise en cause. Des test aideront à
conclure sur ce point.
Du point de vue quantitative, la consommation moyenne d’électricité sur toute la période
d’étude est de 151,6604 millions de KWH avec un écart-type de 46,92047 millions de KWH
(soit un coefficient de variation de 31%). Elle varie entre 12,1 millions de KWH (minimum) et
256,8 millions de KWH (maximum)
D’après le tableau 2.1 on choisit donc p=11 pour le test ADF. Ce dernier donne les résultats
consignés dans le tableau 2.2.
La p-value associée à la tendance est supérieure à 0,05. Donc, la tendance n’est pas significative
au seuil de 5%. Avec le modèle sans tendance, la p-value de la constante est inférieure à 0,05.
Donc, le test ADF se fera sur le modèle avec constante et sans tendance. Dans ce cas, la
statistique de test en valeur absolue (0.778) est inférieure à la valeur critique en valeur absolue
(2.88). L’hypothèse nulle de racine unitaire est acceptée. La série sera différenciée par la suite.
Le même raisonnement sur la série différenciée aboutit au résultat suivant : avec une constante
significative, la statistique de test en valeur absolue (7.9464) est supérieure à la valeur critique
en valeur absolue (2.88). L’hypothèse nulle de racine unitaire est rejetée. La série est stationnaire
en différence avec constante.
Un deuxième test de stationnarité est effectué : le test KPSS. La statistique de test (pour un
modèle avec constante) est égale à 3.7549 dépassant la valeur critique 0.463 au seuil de 5%.
L’hypothèse nulle de stationnarité est rejetée. Avec la série différenciée, la stationnarité est
acceptée (une statistique de test de 0.0317 inférieure à la valeur critique 0.463).
Par la suite, la saisonnalité sera prise en compte dans la série en intégrant une composante
saisonnière (1, 0, 0)12 .
En outre, l’ACF et la PACF de la série différenciée sans saisonnalité permet d’identifier les
ordre p et q relatifs aux modèles ARMA. Il ressort du graphique ci-dessus que p est inférieur
ou égal à 2 tandis que q est inférieur ou égal à 3.
De ce fait, les modèles admissibles sont AR(1),AR(2) MA(1), MA(2),MA(3), ARMA(1,1),
ARMA(1,2), ARMA(1,3), ARMA(2,1), ARMA(2,2) et ARMA(2,3). Il faudrait faire les tests
Le modèle AR(2) est aussi gardé pour les mêmes raisons (voir graphique 3.13 en annexe). Ainsi,
deux modèles sont retenus pour la suite : AR(1) et AR(2). Les critères RMSE (racine carré
de l’erreur quadratique moyenne) et BIC (critère d’information bayésien) permettent de choisir
le modèle qui ajuste au mieux la série de données. Les calculs donnent un RMSE de 6,306753
pour le modèle AR(1) contre 6,159825 pour le modèle AR(2). S’agissant du BIC, il est minimal
pour le modèle AR(2) avec 6,242322 contre 6,361751 pour le modèle AR(1). Donc, le modèle
AR(2) présente une meilleure représentation de la série ajustée.
Comme la série présente une saisonnalité de période 12, le modèle estimé est en réalité SAR(2).
Il ressort que les deux valeurs pour l’année 2016 (janvier et février) sont entre les bornes infé-
rieure et supérieure de prévision.
Les valeurs de la consommation d’électricité dépendent négativement de ses deux valeurs pas-
sées. Cependant, une composante saisonnière (pour chaque mois) fait augmenter cette consom-
mation.
Modélisation multivariée de la
consommation d’électricité
L’analyse descriptive sera reprise avec les autres variables cette fois-ci. Des tests se feront pour
identifier les modèles retenus par la suite. L’estimation des paramètres est effectuée avec le
modèle validé. Les prévisions et interprétations des résultats termineront ce chapitre.
Les histogrammes montrent une fréquence plus élevée des valeurs de la production de ciment
autour de 100 milliers de tonne. Par contre, il y a plus de valeurs de la consommation d’électricité
moyenne et basse tension proches respectivement de 50 et 100 millions de KWH.
20
Modélisation économétrique de la consommation d’électricité au Sénégal
En moyenne, la production de ciment est de 258,6 milliers de tonne par mois. La consommation
moyenne d’électricité basse tension (92,69 milliers de tonne) est supérieure à la consommation
moyenne d’électricité moyenne tension (54,39 milliers de tonne).
La p-value pour chacun de ces tests est inférieure à 0,05. Donc, l’hypothèse nulle est rejetée au
seuil de 5%. Toutes les autres variables sont donc maintenues exogènes dans la modélisation
multivariée.
Les composantes des résidus multivariés donnent une stabilité du modèle. Donc, le modèle
estimé est stable. Il en est de même du modèle VEC issu du VAR.
Le signe attendu des coefficients par rapport à la variable prodC n’est vérifié qu’à long terme.
En effet, la littérature suggère un signe positif de ces coefficients.
Les valeurs prédites se trouvent sur un intervalle de confiance à 95%. Le graphique 3.7 fait état
de la prévision avec une décomposition de la variance de l’erreur de prévision consignée dans
le tableau 3.7.
Pour h=1, la valeur prédite pour la consommation d’électricité dépend à 100% de ses valeurs
passées, une part qui diminue au fil du temps. A partir de l’horizon h=2, la consommation
moyenne tension a de plus en plus de l’importance dans l’erreur de prévision (atteignant 20%
au bout de 2 ans). Les autres séries participent peu à l’erreur de prévision.
Cette étude a pour objectif l’analyse des déterminants de la consommation d’électricité au Sé-
négal sur la période 1999 à 2015. Les données sont mensuelles et ont pour source la DPEE, une
structure au sein du système Statistique National (SSN).
Pour atteindre l’objectif fixé, une modélisation univariée puis multivariée est effectuée sur les
données comportant la consommation d’électricité totale, basse tension, moyenne tension et la
production de ciment.
28
Bibliographie
[1] Agence internationale de l’énergie atomique, Modèle pour l’Analyse de la Demande d’Éner-
gie (MAED-2), Manuel de l’utilisateur, VIENNE, 2007.
[2] Association des entreprises électriques suisses , Facteurs d’influence sur la demande en
électricité, Méthodologie statistique, Document connaissances de base, état : août 2015.
[3] Cameron A. Colin et Trivedi Pravin K. , Microeconometrics : Methods and Applications,
Published in the United States of America by Cambridge University Press, New York,
2005.
[4] Direction de la Prévision et des Études Économiques (DPEE), Structure du PIB,
www.dpee.sn, consulté le 10 juillet 2016.
[5] GBAGUIDI Ochozias A., Communication : Les déterminants de la demande d’énergie
dans l’espace CEDEAO, Associate Economic Affairs Officer, UNECA SRO-West Africa,
gochozias@uneca.org, 2005.
[6] PIGENET Nazim, Mise en place des outils de suivi et de prédiction de la demande
électrique à l’échelle d’un territoire, application au département du Lot, Thèse en vue de
l’obtention du Doctorat de l’université de TOULOUSE, septembre 2009.
29
Annexe
30
Modélisation économétrique de la consommation d’électricité au Sénégal