Académique Documents
Professionnel Documents
Culture Documents
Presentation Mafia
Presentation Mafia
Nolwen Huet
Groupe MAFIA
Laboratoire de Statistique et Probabilités,
Université Toulouse 3
Plan
1 Problématique
Qu’est-ce qu’une courbe de charge ?
Pourquoi estimer des courbes de charge ?
Prédire une courbe de charge
2 Méthode
Prétraitement des données
Classification
Prédiction
3 Résultats
Erreurs de prédiction
Graphique récapitulatif des résultats
Exemples de prédiction
4 Perspectives
Plan
1 Problématique
Qu’est-ce qu’une courbe de charge ?
Pourquoi estimer des courbes de charge ?
Prédire une courbe de charge
2 Méthode
Prétraitement des données
Classification
Prédiction
3 Résultats
Erreurs de prédiction
Graphique récapitulatif des résultats
Exemples de prédiction
4 Perspectives
200
puissance (en kW)
150
100
50
0 J F M A M J J A S O N D
120
100
80
60
40
20 L M M J V S D
Intérêts de la CdC :
équilibre « production – consommation »
reconstitution des flux, dans le cadre réglementaire de la CRE
(Commission de Régulation de l’Energie)
recherche de comportements types de consommation pour construire
des offres de prix
prévision de consommation d’un portefeuille de clients
Intérêts de la CdC :
équilibre « production – consommation »
reconstitution des flux, dans le cadre réglementaire de la CRE
(Commission de Régulation de l’Energie)
recherche de comportements types de consommation pour construire
des offres de prix
prévision de consommation d’un portefeuille de clients
La télérelève des CdC est compliquée et coûteuse :
avec : 40 000 sites / sans : 32 millions de sites
Intérêts de la CdC :
équilibre « production – consommation »
reconstitution des flux, dans le cadre réglementaire de la CRE
(Commission de Régulation de l’Energie)
recherche de comportements types de consommation pour construire
des offres de prix
prévision de consommation d’un portefeuille de clients
La télérelève des CdC est compliquée et coûteuse :
avec : 40 000 sites / sans : 32 millions de sites
=⇒ prédiction de CdC ou de profils
But recherché
Plan
1 Problématique
Qu’est-ce qu’une courbe de charge ?
Pourquoi estimer des courbes de charge ?
Prédire une courbe de charge
2 Méthode
Prétraitement des données
Classification
Prédiction
3 Résultats
Erreurs de prédiction
Graphique récapitulatif des résultats
Exemples de prédiction
4 Perspectives
Les données
100
puissance (en kW)
80
60
40
20
0 J F M A M J J A S O N D
100
puissance (en kW)
80
60
40
20
0 J F M A M J J A S O N D
1.4
1.2
0.8
0.6
0.4
0.2
0 J F M A M J J A S O N D
100
puissance (en kW)
80
60
40
20
0 J
5
puissance (en kW)
0 J
2.5
puissance (en kW)
1.5
0.5
0 L M M J V S D
compression ACP
Classification
Courbes de charge
composantes globales Variables explicatives
et locales
Classes
Classification
Courbes de charge
composantes globales Variables explicatives
et locales
comportements
Classes
Classification
Courbes de charge
composantes globales Variables explicatives
et locales
comportements apprentissage
Classes
Boucle classification/discrimination
Classification Discrimination
- CdC - var. expl.
- non supervisée - supervisée
- K -means - RN
Initialisation K , centr nos
- var. expl. de classe
- CAH
∼ ∼
K , centr
boucle
(nouvelle intialisation)
Remarque :
Rien ne dit théoriquement que le nombre de mal classé devienne
effectivement très petit, même si en pratique, c’est le cas.
Question :
Comment prédire une CdC ? i.e. construire une application
puis moy
Idée :
Les numéros de classe sont de nouvelles variables explicatives.
Idée :
Les numéros de classe sont de nouvelles variables explicatives.
Idée :
Les numéros de classe sont de nouvelles variables explicatives.
Idée :
Les numéros de classe sont de nouvelles variables explicatives.
Plan
1 Problématique
Qu’est-ce qu’une courbe de charge ?
Pourquoi estimer des courbes de charge ?
Prédire une courbe de charge
2 Méthode
Prétraitement des données
Classification
Prédiction
3 Résultats
Erreurs de prédiction
Graphique récapitulatif des résultats
Exemples de prédiction
4 Perspectives
17520
X
|CdC préditeind (h) − CdC réelleind (h)|2
h=1
erreur(ind ) = 17520
X
|CdC réelleind (h)|2
h=1
Graphique récapitulatif
Récapitulatif des erreurs sur base d’(a)pp et ech (t)est avec (9) classes ou (4) classes Legende
1.3 1.3 1.3
1.1 1.1 1.1
0.9 0.9 0.9
0.7 0.7 0.7 max
//////// //////// ////////
0.25 0.25 0.25
changement
d’échelle
erreur quadratique relative pondérée
1er−3ème quartile
(50% des ind)
0.15 0.15 0.15
int de confiance
à 5% pour la moy
med
int de confiance
0.05 0.05 0.05
à 5% pour la med
min
0 0 0
a t a t a t a t a t a t a t a t a t a t a t a t t (t)est ou (a)pp
9 4 9 4 9 4 9 4 9 4 4 nb de classes
GxL GxL Fourier GxL Fourier Fourier coeff régressé
λ λ’ centroides mod lin gbic gbic méthode
100
puissance (en kW)
80
60
40
20
J F M A M J J A S O N D
0
150
100
50 J F M A M J J A S O N D
70
50
40
30
20
10 J F M A M J J A S O N D
Plan
1 Problématique
Qu’est-ce qu’une courbe de charge ?
Pourquoi estimer des courbes de charge ?
Prédire une courbe de charge
2 Méthode
Prétraitement des données
Classification
Prédiction
3 Résultats
Erreurs de prédiction
Graphique récapitulatif des résultats
Exemples de prédiction
4 Perspectives
Perspectives
Aller-retour classification/discrimination
Perspectives
Perspectives
The end
Nolwen Huet
Groupe MAFIA
Laboratoire de Statistique et Probabilités,
Université Toulouse 3
Bonus
5 Bonus-données
Variables explicatives
Prétraitement des données II
6 Bonus-classification/prediction
Initialisation de la première classification
Sélection des fréquences de Fourier
Sélection de modèle
Variables explicatives
4 variables qualitatives :
naf17 : secteurs d’activité (17 modalités)
DCECL : localisation (8 modalités)
zone gaz : accès au réseau de gaz (2 modalités)
version tarifaire : taux d’utilisation de la puissance souscrite (4
modalités : courte à très longue utilisation)
Les données
Variables explicatives
4 variables qualitatives :
naf17 : secteurs d’activité (17 modalités)
DCECL : localisation (8 modalités)
zone gaz : accès au réseau de gaz (2 modalités)
version tarifaire : taux d’utilisation de la puissance souscrite (4
modalités : courte à très longue utilisation)
autres : chauffage, climatisation et eau chaude électriques
Les données
Variables explicatives
4 variables qualitatives :
naf17 : secteurs d’activité (17 modalités)
DCECL : localisation (8 modalités)
zone gaz : accès au réseau de gaz (2 modalités)
version tarifaire : taux d’utilisation de la puissance souscrite (4
modalités : courte à très longue utilisation)
autres : chauffage, climatisation et eau chaude électriques
12 variables quantitatives :
puissance souscrite pour chacun des 5 postes tarifaires : HP, HPH,
HCH, HPE, HCE
consommation annuelle par poste
ratio hiver/été
ratio heures creuses/heures pleines
Les données
100
puissance (en kW)
80
60
40
20
0 J F M A M J J A S O N D
Classification
100
puissance (en kW)
80
60
40
20
0 J F M A M J J A S O N D
Classification
1.4
1.2
0.8
0.6
0.4
0.2
0 J F M A M J J A S O N D
Classification
100
puissance (en kW)
80
60
40
20
0 J
Classification
2.5
puissance (en kW)
1.5
0.5
0 L M M J V S D
Classification
100
puissance (en kW)
80
60
40
20
0 J F M A M J J A S O N D
Classification
100
puissance (en kW)
80
60
40
20
0 J
Classification
5
puissance (en kW)
0 J
Classification
2.5
puissance (en kW)
1.5
0.5
0 L M M J V S D
Classification
Classification
Dendrogramme :
dendrogramme, classification hiérarchique, critère ward
180
160
140
120
100
80
60
40
20
Classification
35
30 9 classes
25
15 classes
20
15
10
Classification
Périodogramme cumulé :
sélection des fréquences de Fourier, p=150
0.15
0.1
0.05
−0.05
0 2000 4000 6000 8000 10000
fréquence (en année−1)
X
S(f ) = |F (CdCi )(f )|2
ind i
Analyse de la covariance
Sélection de modèle
critère GBIC :
2
GBICk (m) = Y − Ŷm + k. |m|
critère AIC : k = 2
critère BIC : k = log n
Analyse de la covariance