Académique Documents
Professionnel Documents
Culture Documents
A. Latouche
aurelien.latouche@cnam.fr
1 / 62
STA 112 Statistique Spatiale et Longitudinale
2 / 62
Evaluation
3 / 62
Données spatiales et visualisation avec R
La page de référence
http://cran.r-project.org/web/views/Spatial.html
4 / 62
Géostatistique
Définition
La Géostatistique a pour objet de Modéliser des covariations
spatiales et de Prédire la mesure en un point non observé
5 / 62
Singularité des données spatiales
I Par exemple
I un épisode de pollution à l’ozone
I une région agricole particulière
I une épidémie . . .
6 / 62
Singularité des données spatiales
Exemple Données de pluviométrie (package geoR, data(parana))
I Les mesures sont discrètes : 143 stations, pluviométrie
moyenne de plusieurs années de mai à juin
I Le phénomène spatial est définit partout sur le domaine
d’étude
600
500
400
N−S (km)
200 300
100
0
7 / 62
Singularité des données spatiales
8 / 62
Données spatiales : exemple et format
ozone.txt, jura.txt
9 / 62
Covariance non spatialisé
●
● ● ●●
● ●● ● ●
●● ●
●● ● ●●
● ●● ●
●
● ●●●●
weight
●
120
● ● ●●
●●● ● ● ●● ● ●
● ● ●● ● ● ●●●
●● ●
●●
●
● ●●
● ●
● ●● ● ●
100
● ●● ●
● ● ● ●●
●●● ●●
● ●●
● ●●
●
●● ●●
80
●
●
120
●
●
●● ● ●●
● ● ● ●
● ●
● ● ● ●●●
● ● ●● ●
● ● ●● ●●
intelligence
● ● ● ● ●
●
100
● ● ● ●
●●
●
●●● ●● ● ●●
●
● ●● ● ● ● ●
● ● ●●●● ● ● ● ● ●● ●
●
●● ●
● ● ● ●
● ●
●●
●
80
●
● ●
● ● ● ● ●
● ●
●
60
4 6 8 10 12 14 16
shoeSize
11 / 62
Loi normale Multivariée
U ∼ MVN(µ, Σ)
12 / 62
Loi normale Bivariée
Dependance Independance
●
0.10 0.10
44
44
● ●
0.08 0.08
42
42
●●
●●● ● ● ●
● ● ● ●● ●
● ●
●●● 0.06 ● ●● 0.06
● ●
●● ●● ●
● ●
40
40
● ● ●
y
y
●● ● ● ● ●●●● ●
● ● ●● ●
● ● ● 0.04 ●●
●
●
0.04
● ● ● ●
● ●
38
38
●● ● ●
● ● ●
0.02 ● ● 0.02
●
●
36
36
0.00 0.00
●
90 95 100 105 110 90 95 100 105 110
x x
13 / 62
Phénomènes/Processus aléatoire
En espace
En temps
6
cancer rate
2 04
14 / 62
Covariance et champs aléatoire
pour y ∈ D
15 / 62
Processus Stationnaire et covariance
16 / 62
Processus stationnaire intrinsèque
Le cas stationnaire suppose que l’espérance est constante mais ceci
n’assure pas l’existence d’une covariance
On suppose donc
E [Z (x + h) − Z (x)] = 0
Var [Z (x + h) − Z (x)] ne dépend que de h
Définition
On appelle variogramme
1
γ(h) = Var(Z(x + h) − Z(x))
2
Stationnaire ⇒ Intrinsèque
17 / 62
Processus Stationnaire : Propriété de la covariance
1. C (0) = σ 2
2. C (h) = C (−h)
3. |C (h)| ≤ C (0)
4. γ(h) = C(0) − C(h)
18 / 62
Stationnarité : A quoi ça ressemble ?
19 / 62
Stationnaire, Isotrope
20
20
15
15
10
10
y
y
5
5
0
0
0 5 10 15 20 0 5 10 15 20
x x
20 / 62
Non-Stationnaire
20
20
15
15
10
10
y
y
5
5
0
0
0 5 10 15 20 0 5 10 15 20
x x
21 / 62
Stationnaire, Anisotrope
1.0
1.0
0.8
0.8
0.4 0.6
0.4 0.6
Y Coord
Y Coord
0.2
0.2
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
X Coord X Coord
22 / 62
Variogramme Empirique : estimation
N(h)
1 X
∗
γ (h) = [Z (xi + h) − Z (x)]2
2 N(h)
i=1
où
I xi : lieu de prélévement
23 / 62
Variogramme 1D
24 / 62
Paires distantes de 5m :
1
γ(5) = [22 + 22 + 12 + 32 + 12 + 22 +
2 ∗ 12
52 + 6 2 + 1 2 + 4 2 + 1 2 + 3 2 ]
= 4.625
I γ ∗ (10) = 4.82
I γ ∗ (15) = 6
25 / 62
Variogramme empirique : Vertical
Forage 1 Forage 2
5.2 5.2
2.3 4.6
3.7 6.3
9.1 2.7
26 / 62
Paires distantes de 9m
1. (5.2, 9.1)
2. (5.2,2.7)
3. (5.2,5.2)
4. (2.3,4.6)
5. (3.7,6.3)
6. (9.1,2.7)
N(9) = 6
27 / 62
Variogramme experimental 2D
28 / 62
Variogramme experimental 2D
26 22 19 14 16 19 16 14
23 20 17 20 14 23 21 17
22 17 18 19 18 25 20 19
21 15 20 18 20 20 18 13
19 18 15 15 18 23 22 20
18 16 10 16 14 18 20 18
17 14 10 13 13 15 14 17
15 13 11 10 17 16 15 11
29 / 62
Variogramme experimental 2D: Direction Nord-Sud
26 22 19 14 16 19 16 14
23 20 17 20 14 23 21 17
22 17 18 19 18 25 20 19
21 15 20 18 20 20 18 13
19 18 15 15 18 23 22 20
18 16 10 16 14 18 20 18
17 14 10 13 13 15 14 17
15 13 11 10 17 16 15 11
Direction Nord-Sud :
I N(1)=56 et γ ∗ (1) = 5.88;
I N(2)=48 et γ ∗ (2) = 9.11
30 / 62
Variogramme experimental 2D: direction N-E S-O
I Calculer N(4) γ ∗ (4)
Les prélèvements étants distants d”une unité dans les directions
N-S et E-O, la distance entre√ des blocs sur les 2 directions
diagonales est multiple de 2
26 22 19 14 16 19 16 14
23 20 17 20 14 23 21 17
22 17 18 19 18 25 20 19
21 15 20 18 20 20 18 13
19 18 15 15 18 23 22 20
18 16 10 16 14 18 20 18
17 14 10 13 13 15 14 17
15 13 11 10 17 16 15 11
√
h = 4 ≈ 3 2, on dénombre les paires distantes de 3 diagonales ainsi que la valeur des prélèvements
31 / 62
Variogramme experimental 2D: direction N-E S-O
I Calculer N(4) γ ∗ (4)
Les prélèvements étants distants d”une unité dans les directions
N-S et E-O, la distance entre√ des blocs sur les 2 directions
diagonales est multiple de 2
26 22 19 14 16 19 16 14
23 20 17 20 14 23 21 17
22 17 18 19 18 25 20 19
21 15 20 18 20 20 18 13
19 18 15 15 18 23 22 20
18 16 10 16 14 18 20 18
17 14 10 13 13 15 14 17
15 13 11 10 17 16 15 11
√
h = 4 ≈ 3 2, on dénombre les paires distantes de 3 diagonales ainsi que la valeur des prélèvements
I (19,16) 3
I (18,14) 4 , (18,19) 1,
I (17,18) 1, (16,23) 7,(15,16) 1
I (15,20) 5, (14,25) 11 ,(10,21) 11, (15,14) 1
I (13,20) 7,(10,20) 10,(16,17) 1
I (11,18) 7 ,(13,19) 6
I (10,13) 3
31 / 62
Variogramme experimental 2D: direction N-E S-O
I Calculer N(4) γ ∗ (4)
Les prélèvements étants distants d”une unité dans les directions
N-S et E-O, la distance entre√ des blocs sur les 2 directions
diagonales est multiple de 2
26 22 19 14 16 19 16 14
23 20 17 20 14 23 21 17
22 17 18 19 18 25 20 19
21 15 20 18 20 20 18 13
19 18 15 15 18 23 22 20
18 16 10 16 14 18 20 18
17 14 10 13 13 15 14 17
15 13 11 10 17 16 15 11
√
h = 4 ≈ 3 2, on dénombre les paires distantes de 3 diagonales ainsi que la valeur des prélèvements
I (19,16) 3
I (18,14) 4 , (18,19) 1,
I (17,18) 1, (16,23) 7,(15,16) 1
I (15,20) 5, (14,25) 11 ,(10,21) 11, (15,14) 1
I (13,20) 7,(10,20) 10,(16,17) 1
I (11,18) 7 ,(13,19) 6
I (10,13) 3
Soit N(4)=16
31 / 62
Variogramme experimental 2D: direction N-E S-O
I Calculer N(4) γ ∗ (4)
Les prélèvements étants distants d”une unité dans les directions
N-S et E-O, la distance entre√ des blocs sur les 2 directions
diagonales est multiple de 2
26 22 19 14 16 19 16 14
23 20 17 20 14 23 21 17
22 17 18 19 18 25 20 19
21 15 20 18 20 20 18 13
19 18 15 15 18 23 22 20
18 16 10 16 14 18 20 18
17 14 10 13 13 15 14 17
15 13 11 10 17 16 15 11
√
h = 4 ≈ 3 2, on dénombre les paires distantes de 3 diagonales ainsi que la valeur des prélèvements
I (19,16) 3
I (18,14) 4 , (18,19) 1,
I (17,18) 1, (16,23) 7,(15,16) 1
I (15,20) 5, (14,25) 11 ,(10,21) 11, (15,14) 1
I (13,20) 7,(10,20) 10,(16,17) 1
I (11,18) 7 ,(13,19) 6
I (10,13) 3
Soit N(4)=16
1
γ ∗ (4) = 32 + 42 + 12 + 12 + 72 + 12 + 52 + 112 + 112 + 12 + 72 + 102 + 12 + 72 + 62 + 32 =
2 ∗ 16
589/32 = 18.4
31 / 62
√
A titre d’exemple voici les paires distances de 2 2 ≈ 3 :
26 22 19 14 16 19 16 14
23 20 17 20 14 23 21 17
22 17 18 19 18 25 20 19
21 15 20 18 20 20 18 13
19 18 15 15 18 23 22 20
18 16 10 16 14 18 20 18
17 14 10 13 13 15 14 17
15 13 11 10 17 16 15 11
I (21,14),
I (19,20), (15,16),
I (18,19), (18,14), (20,19)
I (17,18), (16,18), (15, 23), (18,16)
I (15,15), (14,20), (10,25),(15,21), (20,14)
√
par symétrie on obtient 25 paires distantes de 2 2 i.e. N(3)=25
32 / 62
Correlation spatial
33 / 62
Exemple de semi-variogramme γ
1.0
exponential
spherical
gaussian
0.8
0.6
γ(h)
0.4
0.2
0.0
distance
1. Le problème
2. Estimation par krigeage
I Estimation de la variable
I Estimation de l’erreur locale
3. Etude de la corrélation spatiale
I Modélisation du variogramme
4. Application au krigeage
35 / 62
Position du problème
36 / 62
Le problème
3. Comment la cartographier ?
37 / 62
Variable spatialisée
Z (X )
où
I X s’entend comme une localisation dans le plan ou l’espace
38 / 62
Estimation (ponctuel) par Krigeage
Idée : Un barycentre local
⇒ Interpolation linéaire sans biais de variance minimale
I On cherche un estimateur de la forme
X
zv∗ = λi z(xi )
i
39 / 62
Propriétés de la variable Zv∗ =
P
i λi Z (xi )
40 / 62
E [Z (x)] est inconnu : Krigeage ordinaire
On suppose que Z (x) est stationnaire de moyenne m sur
l’ensemble du domaine V
V peut être un volume, une surface ou un point .
E [Z (x)] = m = E [Zv ]
L’erreur d’estimation,[Zv∗ − Zv ], vaut en moyenne :
X X hX i
E[ λi Z (xi ) − Zv ] = λi m − m = m λi − 1
i
42 / 62
Krigeage Ordinaire: Variance minimale
XX X
Var [Zv∗ − Zv ] = λi λj C (xi , xj ) + C̄ (V , V ) − 2 λi C̄ (xi , V )
X XX
σ2 = 2 λi γ̂(xi , V ) − λi λj γ(xi , xj ) − γ̄(V , V )
1 R
où γ̂(xi , V ) = γ(xi − x)dx
V v
42 / 62
Minimisation sous contrainte : rappel
Multiplicateur de Lagrange
Supposons qu’on veuille minimiser f (x, y ) = x 2 + y 2 sous la
contrainte g (x, y ) = x 2 y − 16 = 0
On pose
L(x, y , µ = f (x, y ) − µg (x, y )
et on veut minimiser
43 / 62
Multiplicateur de Lagrange
∂L
= 2x + µ2xy = 0 (1)
∂x
∂L
= 2y + µx 2 = 0 (2)
∂y
∂L
= x 2 y − 16 = 0 (3)
∂µ
44 / 62
Minimisation sous contrainte de la variance de krigeage
X
φ = Var [Zv∗ − Zv ] − 2µ λi − 1
45 / 62
Formulation
b (X ) − Z (X ))2 ] = E (Z
E [Z b (X )2 ) − 2E (Z (X )Z
b (X )) + E (Z (X )2 )
XX X
= λi λj E (Zi Zj ) − 2 λi E (Zi Z (X )) + C (0)
i j i
46 / 62
Que sont les coefficients C ?
47 / 62
Krigeage ordinaire
XX X X
L(λ1, . . . , λn , ν) = λi λj Cij −2 λi CiX +C (0)+2µ( λi −1)
i j i
n
∂L X
= 2 λi Cij − 2CiX + 2µ = 0
∂λi
i
∂L X
= λi − 1 = 0
∂µ
48 / 62
Krigeage Ordinaire
K Λ = KX
où
C11 C12 ... C1n 1
C21 C22 ... C2n 1
K =
Cn1 Cn2 ... Cnn 1
1 1 ... 1 0
Λ = (λ1 , . . . , λn , µ)T
et KX = (C1X , . . . , CnX , 1)T
d’où
b = K−1 KX
Λ
49 / 62
Krigeage ordinaire : Erreur
b = K−1 KX
Comme Λ
Var (Z
b) = Λ b Var (Z ) = KX T K−2 KX C(0)
bT Λ
50 / 62
Krigeage simple (m est connu)
Nous allons
1. dériver l’espérance de l’erreur quadratique par rapport aux
différents λ
51 / 62
XX X
E2 = λi λj Cij − 2 λi CiX + C (0)
i j i
X
dE2 /dλi = 0 ↔ 2 λj Cij − 2CiX = 0
j
D’où X
λj Cij = CiX
j
n équations
52 / 62
Equations normales
Qu’on reformule C Λ = CX
D’où
b = C−1 CX
Λ
53 / 62
I Le krigeage simple est donc aisé à mettre en oeuvre
I On définit le vecteur CX
54 / 62
L’erreur
55 / 62
Illustration : données topo
● ● ●
● ●
●
6
●
●
●
● ● ●
●
5
●
●
● ● ●
● ● ● ●
4
● ●
●
●
topo$y
● ● ●
●
3
●
● ● ●
2
● ● ● ● ●
● ● ● ●
1
● ●
● ●
● ●
● ● ●
0
0 1 2 3 4 5 6
topo$x
56 / 62
Illustration : données topo
Estimations par krigeage simple
85 0
0 80
● ● ●
● ●
6
● 5
82
●
●
725
●
● ●
●
5
●
0
75 ●
● ● ●
● ●
● ●
4
●
775
●
85
0 ●
●
● ● ●
3
●
●
●
2
● ● ●
● 875 ●
900
0
90
900 ● ●
1
● ●
92 ● 57 / 62
5 ●
Illustration : données topo
Erreurs de prédictions
25
25
25
● ● ●
● 20 ● ● 20
6
25
20
20
● 20
●
●
● ● ●
20
●
5
25
●
●
20 ● ● ●
● ● ● ●
20 20
4
20
● ● 20
● ●
20
● ● ● 20
●
3
20
25
●
●
20
●
25
20
●0
2
● ● ● ● ●
20
20
● ● ● ●
1
● 58 / 62
20
0
Pour finir
59 / 62
Geostatistique : Pollution de la rivière Meuse
I Un example classique
60 / 62
Pollution de la Meuse
61 / 62
Pollution de la Meuse
62 / 62