Vous êtes sur la page 1sur 55

/D

PTS

SG

Interpolation spatiale

Pierre Bosser

(Pierre.Bosser@ensg.eu)

EN

Ecole
Nationale des Sciences Geographiques

Departement Positionnement Terrestre et Spatial

Annee Scolaire 2011-2012

EN

SG

/D

PTS

Table des mati`


eres
1 Introduction

Table des mati`eres

/D
PTS

INTERPOLATION SPATIALE

1.1 Objectifs du cours . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3 Caracteristiques des methodes dinterpolation . . . . . . . . . . . . .

1.4 Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.5 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Linterpolation d
eterministe globale

10

2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Polygone de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

SG

2.3 Methode des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . 12


2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3 Linterpolation d
eterministe locale

15

3.1 Polygones de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . 15


3.2 Interpolation `a partir dune triangulation . . . . . . . . . . . . . . . . 16
Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

EN

3.2.1
3.2.2

Interpolation lineaire . . . . . . . . . . . . . . . . . . . . . . . 17

3.2.3

Methode dAkima . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3 Methodes barycentriques . . . . . . . . . . . . . . . . . . . . . . . . . 22


3.3.1

Inverse des distances . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.2

Interpolation bilineaire . . . . . . . . . . . . . . . . . . . . . . 24

3.4 Les surfaces de tendances . . . . . . . . . . . . . . . . . . . . . . . . . 25


Pierre Bosser

2011-2012

INTERPOLATION SPATIALE

Table des mati`eres

3.5 Les splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27


Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.5.2

Spline dinterpolation . . . . . . . . . . . . . . . . . . . . . . . 27

3.5.3

Les splines de lissage . . . . . . . . . . . . . . . . . . . . . . . 29

/D
PTS

3.5.1

3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4 Linterpolation stochastique

34

4.1 Notion de fonction aleatoire . . . . . . . . . . . . . . . . . . . . . . . 34


4.1.1

Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.1.2

Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2 Inference statistique

. . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.2.1

Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.2

Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2.3

Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.2.4

Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . 39

4.2.5

Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.3 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . 40


Proprietes du variogramme . . . . . . . . . . . . . . . . . . . . 41

4.3.2

Inference du variogramme . . . . . . . . . . . . . . . . . . . . 42

SG

4.3.1

4.4 Le krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Origine de la methode . . . . . . . . . . . . . . . . . . . . . . 47

4.4.2

Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.4.3

Proprietes du krigeage . . . . . . . . . . . . . . . . . . . . . . 50

4.4.4

Impact du mod`ele de variogramme . . . . . . . . . . . . . . . 51

EN

4.4.1

4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5 Conclusion

Pierre Bosser

53

2011-2012

1
1.1

Introduction
Objectifs du cours

1 Introduction

/D
PTS

INTERPOLATION SPATIALE

` partir dobservations georeferencees, pas necessairement reparties reguli`erement,


A
on cherche `a estimer les valeurs prises par le param`etre observe en dautres points
de lespace. On parle alors destimation spatiale : cest une procedure consistant
a` estimer la valeur dune grandeur en un site `a partir de dechantillons de cette
grandeur recoltes dans dautres sites.
Ce besoin sapplique `a de nombreux domaines o`
u la connaissance de la distribution spatiale de phenom`enes est importante : altimetrie, gravimetrie, meteorologie,
geologie, etc.

EN

SG

Lors de ce cours, nous allons donc etudier les methodes permettant lestimation
et linterpolation de donnees georeferencees. Ce cours sera une introduction aux
differentes methodes existantes, mais pas une etude exhaustive (base pour des etudes
plus approfondies). Les idees developpees ici sont largement inspirees des ouvrages
suivants :
Akima, H., A method of bivariate interpolation and smooth surface fitting for
values given at irregularly distributed points , OT Report 75-70, U.S. Department
of Commerce.
Arnaud, M. & Emery, X., Estimation et interpolation spatiale : methodes
deterministes et geostatistiques , Hermes, 2000.
Baillargeon, S., Le krigeage : revue de la theorie et application a` linterpolation spatiale de donnees de precipitation , Memoire de M. Sc., Universite
LAVAL, 2005.
Verdun, J., Methodes destimation et dinterpolation spatiales , Cours donne
aux IT2, ENSG, 2006.

Pierre Bosser

2011-2012

INTERPOLATION SPATIALE

1.2

1 Introduction

Notations

/D
PTS

On definit une variable r


egionalis
ee comme etant une fonction numerique prenant
ses valeurs dans une region limitee, appelee champ.
Par la suite, on utilisera les notations suivantes :
z, la variable regionalisee.
D, le champ de la regionalisation, cest `a dire le domaine dans lequel la variable
regionalisee est definie. En general, D R, R2 ou R3 .
~s D, le vecteur de coordonnees (x, y, z) qui indique la position dun site dans le
champ D.
z(~s), la valeur prise par la variable regionalisee z au site ~s D.
z(V ), la valeur moyenne de z sur le domaine V D.
n, le nombre de sites o`
u la variable a ete mesuree.
z(~s1 ), ..., z(~sn ), les valeurs prises par z aux sites dobservation ~s1 ...~sn .
z(~s0 ), une estimation de z(~s0 ) avec ~s0 D.

1.3

Caract
eristiques des m
ethodes dinterpolation

SG

Dans le cas general, la variable regionalisee ne peut etre representee par une fonction
mathematique explicite. Cependant, elle presente une structuration spatiale bien
definie, avec une correlation des valeurs prises en deux sites proches. Ceci rend
possible la prevision dune valeur inconnue `a partir dobservations. On parle ainsi
dinterpolation pour lestimation de cette valeur. On parle dextrapolation lorsque
le site inconnu est situe hors des limites du domaine geographique engendre par
lechantillonnage des sites dobservation.

EN

On sinteresse dans de ce cours `a ces methodes de prevision. Elles se divisent usuellement en deux groupes, selon les mod`eles mathematiques sur lesquels elles reposent :
M
ethodes d
eterministes : elles reposent sur des proprietes purement mathematiques, generalement geometriques, sans tenir compte du phenom`ene physique qui
nous interesse.
M
ethodes stochastiques : elles font appel `a des mod`eles probabilistes et decoulent de lanalyse statistique des donnees considerees. On parle alors de techniques
g
eostatistiques.

Pierre Bosser

2011-2012

INTERPOLATION SPATIALE

1 Introduction

Modle dterministe

Modle probabiliste

Phnomne naturel

Variable rgionalise

Fonction alatoire

fz(s)/ s 2 Dg

fZ(s)/ s 2 Dg

Valeurs rgionalises

Variables alatoires

z(si) pour i = 1, ..., n

Z(si) pour i = 1, ..., n

Interpolation spatiale
dterministe

Interpolation spatiale
stochastique

/D
PTS

Ralit Physique

FIG 1 - Methodes deterministes et stochastiques : un


phenom`ene physique observe en certains sites peut etre estime en des sites quelconques via lutilisation de methodes
deterministes (basees sur de simples constats geometriques)
ou de methodes stochastiques (basees sur des constats statistiques).

On differencie egalement ces methodes selon quelles soient globales ou locales. Une
methode globale consiste `a calculer la moyenne de la variable generalisee sur le
champ `a partir de lensemble des observations disponibles ; une methode locale
realise une estimation de cette moyenne sur une partie plus reduite du champ, voire
en un site ponctuel.

SG

Une methode exacte conserve les valeurs des echantillons originaux, contrairement
`a une methode approch
ee.

EN

Enfin, on parle deffet d


ecran lorsquune observation commande limpact dune
autre observation lors de linterpolation. Linfluence de lobservation ecrantee sera alors :
nulle dans le cas dun ecran total,
peu elevee dans le cas dun ecran partiel,
moderee dans le cas dun ecran faible.

Pierre Bosser

2011-2012

INTERPOLATION SPATIALE

1 Introduction

S3

/D
PTS

S6
S7

S0

S2

S5

S1

FIG 2 - Effet decran : le site S7 peut potentiellement masquer le site S6 ; linterpolateur va donner moins dimportance
au site masque, S6 , par rapport au site masquant S7 .

1.4

Repr
esentations

SG

` partir dun champ dont on connait certaines valeurs prises par la variable regionaliA
see, on veut deduire la representation densemble de cette variable sur le champ.
Cette representation peut se faire sous la forme :
de lignes de niveau,
de niveaux de couleur,
dune perspective 3D, etc.
On retrouve sur les figures suivantes differents modes de representation du champ
interpole.
240

220

200

180

160

140

EN

120

140

160

180

200

220

240

260

280

FIG 3 - Exemple de representation dune variable regionalisee : sites dobservation.

Pierre Bosser

2011-2012

INTERPOLATION SPATIALE

1 Introduction

240
240

220

650

200

200

180

/D
PTS

700

220

160

600

180

160

550

140

140

500

120

120

140

160

180

200

220

240

260

280

140

160

180

200

220

240

260

280

FIG 4 - Exemple de representation dune variable regionalisee : representations planes.

800

800

700

700

600

240

240

600

220

500

220

500

200

400
140
180

180

140

160

160

200

400

180

160

160

180

200

140
220

200

140

220

240

120

260

240

120

260

280

280
X

SG

700

650

800

600

700

240

600

220

500

550

200

400

180

140

500

160

160

180

200

140

220

240

EN

260

120

280

FIG 5 - Exemple de representation dune variable regionalisee : perspectives.

Pierre Bosser

2011-2012

INTERPOLATION SPATIALE

1.5

1 Introduction

Applications

EN

SG

/D
PTS

Linterpolation spatiale est outil que lon retrouve dans differents domaines. Citons
par exemple :
En meteorologie : mesures sol du champ de pression, de temperature, dhumidite,
de pluviometrie.
En geodesie : mesures du champ de gravite, retards tropospheriques et ionospheriques, hauteur du geode.
En geologie : teneur du sol en elements mineraux.
Les figures suivantes presentent differentes visualisations dinterpolation spatiale
dun jeu dobservation (pression, temperature, pluviometrie, retards tropospherique
GPS, anomalie de gravite).

FIG 6 - Exemple dobservations interpolees spatialement :


mesures de pression, temperature, precipitation ( MeteoFrance).

Pierre Bosser

2011-2012

1 Introduction

/D
PTS

INTERPOLATION SPATIALE

FIG 7 - Exemple dobservations interpolees spatialement :


retards tropospheriques GPS ( RGP / IGN), anomalies
de gravite ( LAREG / IGN) et temperature `a 500 m de
profondeur ( BRGM).

EN

SG

Pierre Bosser

2011-2012

2
2.1

Linterpolation deterministe globale

/D
PTS

INTERPOLATION SPATIALE

Linterpolation d
eterministe globale
D
efinition

Lestimation globale vise `a estimer la moyenne arithmetique dune ensemble dobservations (valeurs de la variable regionalisee) dans un domaine geographique (le
champ). Cette estimation nest pas triviale puisque les observations ne sont pas
forcement representatives et peuvent presenter une densite differentes en fonction
de la zone du champ, donnant alors une influence trop importante a` certaines parties
de la zone etudiee.

2.2

SG

Deux solutions sont alors envisageables. La premi`ere consiste en une selection des
donnees observees. Le probl`eme reside alors dans le choix des observations a` prendre
en compte. Aucun crit`ere objectif ne peut permettre detre certain ni de la qualite ni de la pertinence des observations choisies. Une seconde solution consiste a`
ponderer lensemble des observations lors du calcul de la moyenne. Nous allons ici
nous interesser `a des methodes globales basees sur cette solution.

Polygone de Thiessen

EN

Pour tous les points dobservation du champs, on definit un polygone dinfluence tel
que chaque point du polygone est plus proche du point dobservation que de tout
autre site :
~s Pi , ~sj D r Pi , k~si ~sk 6 k~sj ~sk

D est alors partitionne en une famille de polygone convexes, nommes polygone de


Thiessen (aussi appeles polygones de Voronoi ou cellules de Dirichlet).

Pierre Bosser

10

2011-2012

INTERPOLATION SPATIALE

Linterpolation deterministe globale

S3

/D
PTS

S6
S0

S2

S5

S1

FIG 8 - Construction des polygones de Thiessen.

Les observations groupees vont ainsi se voir affecter un polygone dinfluence de petite
surface, les donnees isolee un polygone de grande surface. Notons que le decoupage
de Thiessen depend uniquement de la configuration geometrique et non pas des
valeurs observees. Les polygones ne sont pas necessairement fermes dans certaines
directions de lespace : il faut ainsi limiter la partition aux fronti`eres de D, ou fixer
une distance dinfluence limite.
S3

S6

S0

S2

S5

SG

S1

FIG 9 - Decoupage en polygones de Thiessen.

Les surfaces des polygones de Thiessen ainsi obtenus vont alors permettre la ponderation des observations pour le calcul de la moyenne de la variable regionalisee sur
le champ detude :

EN

z(D) =

n
X

|Pi |
z~si
i=1 |D|

(1)

O`
u |Pi | est laire du polygone Pi associee au site ~si et |D| laire du champ :
|D| =

n
X

|Pi |

(2)

i=1

Par construction, les zones `a observations denses sont les zones a` polygones de
Thiessen de surface moindre : linfluence de ces zones est donc limitee.
Pierre Bosser

11

2011-2012

INTERPOLATION SPATIALE

Linterpolation deterministe globale

200

150

100

140

160

180

/D
PTS

250

200

220

240

260

280

FIG 10 - Exemple de decoupage en polygones de Thiessen.

2.3

M
ethode des cellules

SG

La methode des cellules consiste `a diviser le champ en cellules rectangulaires de


meme taille, contenant chacune un nombre variable de sites dobservation. La ponderation des observations lors de lestimation globale est realisee a` laide du nombre
de sites contenus dans chaque cellule.
La procedure destimation est la suivante :

1. On calcule la moyenne des sites dobservations contenus dans chaque cellule.


2. On calcule ensuite la moyenne des moyennes de toutes les cellules, sans ponderation.

EN

Lestimation globale du champ etudie est donc donne par la formule :

n
N
X
1 X

~s(i )
z(D) =
N =1 i =1

(3)

O`
u N est le nombre de cellules de decoupage du domaine D contenant au moins un
site dobservation, ~s(i ) les sites dobservation localises dans la cellule .
En pratique, on rep`ete lalgorithme plusieurs fois (5 `a 10) avec differents decoupages
dans le but dobtenir une estimation globale independante du reseau.

Pierre Bosser

12

2011-2012

INTERPOLATION SPATIALE

Linterpolation deterministe globale

250

200

150

100

140

160

180

/D
PTS

Notons que si la taille des cellules est trop petite, chacune contiendra au plus un
site dobservation et les donnees auront toutes le meme poids. Si la taille est trop
grande, toutes les observations appartiendront `a la meme cellule et auront donc
le meme poids. Dans ces 2 cas, lestimation globale reviendra alors a` calculer la
moyenne arithmetique de toutes les observations.

200

220

240

260

280

2.4

SG

FIG 11 - Exemple de decoupage en cellules.

Conclusion

Les methodes destimation globale presentees ici reposent uniquement sur la configuration geometrique des donnees. Elles permettent donc de quantifier la quantite
totale ou moyenne dun ensemble dobservations de repartition variable dans lespace.

EN

Les methodes abordees sont appliquees sur un jeu de donnees test (tableau suivant).
Mis a` part un cas (decoupage en cellules de taille minimale), on observe que les
resultats obtenus sont dans lensemble relativement homog`ene.

Pierre Bosser

13

2011-2012

INTERPOLATION SPATIALE

z(D)
620.6693
609.9030
615.4803
618.9132
619.6649
614.0666

/D
PTS

Interpolation
Polygones de Thiessen
Cellules, pas de 1 m
Cellules, pas de 10 m
Cellules, pas de 20 m
Cellules, pas de 50 m
Cellules, pas de 100 m

Linterpolation deterministe globale

TAB 1 - Estimation globale par differentes methodes : estimation de laltitude moyenne.

EN

SG

Il est cependant plus important de pouvoir localiser / cartographier les zones de


fortes valeurs et celles de valeurs moindres : cest le but de lestimation locale que
nous allons voir par la suite.

Pierre Bosser

14

2011-2012

3 Linterpolation deterministe locale

/D
PTS

INTERPOLATION SPATIALE

Linterpolation d
eterministe locale

Nous nous interessons ici aux methodes deterministes pour lestimation locale et
ponctuelle dune valeur de la variable regionalisee. Cette estimation sera realisee a`
partir de combinaisons lineaires des observations en tenant compte de leur disposition les unes par rapport aux autres mais aussi de la distance entre le secteur a`
estimer et les points de donnees.

3.1

Polygones de Thiessen

SG

Nous avons aborde precedemment lutilisation des polygones de Thiessen dans le cas
de lestimation globale. Linterpolation par la methode de Thiessen consiste a` affecter a` lensemble des points dun polygone donne la valeur de la variable regionalisee
correspondante (on parle aussi de plus proche voisin). On obtient alors une surface discontinue ; ces discontinuites nont rien `a voir avec de possibles discontinuites
reelles, mais sont simplement liees `a la configuration geometrique des observations.
On trouve dans la litterature differentes methodes pour palier ce probl`eme de discontinuites (methode de Sibson par exemple basee sur linterpolation par combinaison
lineaire des valeurs aux sommets voisins).
S3

S6

EN

S?

S0

S2

S5

S1

FIG 12 - Interpolation par la methode de Thiessen (plus


proche voisin).

Pierre Bosser

15

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

800
700

/D
PTS

Sur la figure suivante, on represente un exemple dinterpolation par plus proche voisin. On remarque que le resultat obtenu est peu esthetique en raison des nombreuses
discontinuites.

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

FIG 13 - Interpolation par plus proche voisin : application


sur un champ dobservations - vue en perspective.

3.2.1

Interpolation `
a partir dune triangulation
D
efinition

SG

3.2

La triangulation consiste `a diviser le champ en triangles disjoints dont les sommets


sont les sites dobservation. On calcule alors la valeur en un point donne a` partir
des valeurs des sommets du triangle auquel il appartient.

EN

Il existe plusieurs methode de triangulation, la plus utilisee etant la triangulation


de Delaunay : les sommets de chaque triangle sont les sites du champ D tels que
les polygones de Thiessen associes ont un cote en commun. Notons les proprietes
dune telle triangulation :
La triangulation est independante de lordre de traitement.
Lensemble du domaine nest pas recouvert : on op`ere uniquement dans lenveloppe
convexe des sites.
Les cercles circonscrits `a chacun des triangles ne contiennent pas dautre site
dobservation.
Pierre Bosser

16

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

Tous les points sont relies `a leur plus proche voisin.


S6

/D
PTS

S3
S?

S2

S0

S5

S1

FIG 14 - Triangulation de Delaunay.

Il existe plusieurs methodes pour linterpolation de donnees `a partir dune triangulation. Ici, deux dentres elles seront exposees.
3.2.2

Interpolation lin
eaire

On consid`ere le triangle (~s1 , ~s2 , ~s3 ) contenant le point dinteret ~s. La valeur recherchee de la variable regionalisee secrit sous la forme :
z(~s) = z(x, y) = x + y +

SG

S3
S?

S2

S1

FIG 15 - Interpolation lineaire : Geometrie du probl`eme.

EN

La solution est determinee `a partir dune combinaison lineaire des valeur observees
au sommet du triangle en resolvant le syst`eme :

O`
u zi = z(~si ).

Pierre Bosser

x1 + y1 + = z1
x2 + y2 + = z2

x3 + y3 + = z3

17

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

Lequation matricielle secrit sous la forme :


x1 y1 1
x2 y2 1
x3 y3 1

z1
z2
z3

/D
PTS

On peut alors montrer que cette solution secrit sous la forme :


z(~s) =

|~s1 , ~s, ~s2 | z3 + |~s1 , ~s, ~s3 | z2 + |~s2 , ~s, ~s3 | z1


|~s1 , ~s2 , ~s3 |

O`
u |~s1 , ~s2 , ~s3 | represente laire du triangle forme par les vecteurs (~s1 , ~s2 , ~s3 ) : la
solution devient donc la somme ponderee des aires des triangles formes par les 3
sommets et le point dinteret.
S3
jS2,S,S3j jS1,S,S3j

S2

jS1,S,S2j

S3

jS2,S,S3j

S1

S2

jS1,S,S3j

jS1,S,S2j

S1

SG

FIG 16 - Interpolation lineaire : interpretation geometrique


de la solution : plus le point auquel on souhaite estimer la
valeur de la variable regionalisee est proche dun site dobservation, plus la proportion de surface occupee par le triangle oppose `
a ce sommet est importante ; le poids associe
est donc plus important et la valeur estimee proche de celle
du sommet.

Chaque site dobservation recoit donc un poids egal `a la proportion de surface occupee par le triangle qui lui est oppose : plus le point recherche est proche dun
site dobservation plus la valeur de la variable regionalisee est proche de la valeur
observee en ce site.

EN

Un exemple de cette methode dinterpolation est represente ci-dessous.

Pierre Bosser

18

2011-2012

3 Linterpolation deterministe locale

800
700

/D
PTS

INTERPOLATION SPATIALE

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

FIG 17 - Interpolation lineaire : application sur un champ


dobservations - vue en perspective. On observe laspect pyramidal de la surface obtenue.

3.2.3

SG

Linterpolation lineaire presente les proprietes suivantes :


Lestimation est unique pour une triangulation donnee.
Cette methode est exacte.
La surface obtenue est continue ; elle est composee de pyramides juxtaposees.
Lextrapolation nest pas possible au del`a de lenveloppe convexe des sites dobservation.
M
ethode dAkima

EN

La methode dAkima est une autre methode dinterpolation `a partir dune triangulation. On ajuste cette fois-ci `a chaque triangle une surface dont lequation est un
polynome de degre 5 :
z(~s) = z(x, y) =

5 5j
X
X

jk xj y k

j=0 k=0

Il faut donc 21 conditions pour determiner les 21 coefficients jk :


les 3 premi`eres conditions sont obtenues `a partir des valeurs prises par la variable

Pierre Bosser

19

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

regionalisee aux 3 sommets de chaque triangle :


z(~s2 ),

z(~s3 )

/D
PTS

z(~s1 ),

6 autres conditions sont obtenues `a partir des derivees premi`eres aux sommets de
chaque triangle :
z
(~s1 )
y
z
(~s2 )
y
z
(~s3 )
y

z
(~s1 ),
x
z
(~s2 ),
x
z
(~s3 ),
x

9 autres conditions sont obtenues `a partir des derivees secondes aux sommets de
chaque triangle :
2z
2z
(~
s
)
,
(~s1 )
1
y 2
xy
2z
2z
(~
s
)
,
(~s2 )
2
y 2
xy
2z
2z
(~
s
)
,
(~s3 )
3
y 2
xy

2z
(~s1 ),
x2
2z
(~s2 ),
x2
2z
(~s3 ),
x2

SG

Les 3 derni`eres conditions sont obtenues `a laide de considerations de continuite


et de derivabilite aux limites de chaque triangle. La derivee partielle de la fonction dinterpolation dans la direction normale `a chaque cote du triangle est un
polyn
ome de degre 3, au plus, de la variable mesuree selon ce cote.
5z
(~s2 ) = 0,
nt4

5z
(~s1 ) = 0,
nt4

n1

S3

t1

EN

S?

S2

5z
(~s3 ) = 0
nt4
n2
t2
S1

t3
n3

FIG 18 - Interpolation dAkima : Geometrie de la solution.

Pierre Bosser

20

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

/D
PTS

La derni`ere condition assure donc la continuite et la derivabilite de la surface obtenue. Le passage (x, y) (n, t) est lineaire : les valeurs de la fonction et de ses
derivees partielles premi`eres et secondes selon x et y suffisent donc a` determiner les
valeurs de la fonction et de ses derivees selon n et t aux sommets.
Ainsi, En limite de 2 triangles, la section de la surface est un polynome de degre
5 en t ; ses coefficients sont donnes par les valeurs de la fonction et de ses derivees
aux sommets : on a donc continuite de la surface. Sur chaque cote dun triangle, les
derivees premi`ere selon n et seconde selon n puis t aux sommets permettent decrire
la derivee premi`ere selon n sous forme dun unique polynome de degre 3, en t : on
a donc egalement la derivabilite.
Pour calculer les derivees partielles en chaque sommet du triangle, Akima propose
lutilisation des sites (entre 3 et 5) les plus proches de chaque sommet du triangle.
Les derivees premi`eres sont obtenues en estimant le plan moyen (par rapport aux
differents sites voisins choisis) passant par le sommet dinteret. Les derivees secondes sont calculees en repetant cette operation, mais cette fois-ci en considerant
les derivees premi`eres au lieu des valeurs de la variable regionalisee.
Bien quen apparence complexe, limplementation de cette methode est relativement
directe (un formulaire complet existe).

EN

SG

Cette methode est assez efficace puisque robuste et rapide. Elle est exacte et permet
lestimation dune surface continue et derivable. Il existe des variantes permettant
une extrapolation au del`a de lenveloppe convexe formee par lensemble des triangles.

Pierre Bosser

21

2011-2012

3 Linterpolation deterministe locale

800
700

/D
PTS

INTERPOLATION SPATIALE

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

FIG 19 - Interpolation par la methode dAkima : application sur un champ dobservations - vue en perspective. On
observe que la surface obtenue est beaucoup plus esthetique
que celle issus dune interpolation lineaire.

M
ethodes barycentriques

SG

3.3

Netant pas limitees au voisinage direct du point dinteret, les methodes barycentriques presentent lavantage de prendre en compte plus de donnees du champ dobservation. Un poids plus important est affecte aux sites les plus proches, un poids
moindre aux sites plus eloignes.
3.3.1

Inverse des distances

EN

Cest la methode barycentrique la plus employee. elle consiste a` attribuer un poids


inversement proportionnel `a la distance entre les sites et le point `a estimer :
n
X

z(~si )
si ~sk
i=1 k~
z(~s) = X
n
1
si ~sk
i=1 k~

On peut generaliser cette formule en prenant comme ponderation une puissance p

Pierre Bosser

22

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

800
700

/D
PTS

de la distance entre sites et point `a estimer


p 0 : moyenne arithmetique
p + : methode de Thiessen

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

FIG 20 - Interpolation barycentrique par inverse des distances : application sur un champ dobservations - vue en
perspective.

SG

Cette methode dinterpolation est exacte et fournit une surface continue. Les valeurs
interpolees sont limitees par les valeurs minimale et maximale du champ dobservation, la ponderation etant positive.

EN

Elle presente cependant quelques inconvenients. Elle est indifferente a` la configuration geometrique des observations, seule la distance compte. Elle tend a` surponderer les donnees groupees alors quelles sont redondantes. Les cartes disovaleur
presentent des structures en forme dil de buf autour des sites dobservation
en raison de linfluence du site le plus proche. Plus la puissance de la distance est
elevee, plus cet est important.

Pierre Bosser

23

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

220

200

180

160

140

120

140

160

180

/D
PTS

240

200

220

240

260

280

FIG 21 - Interpolation barycentrique par inverse des distances : application sur un champ dobservations - representation par courbes de niveau, vue de dessus. On distingue
nettement leffet doil de buf lie `a lutilisation de cette
methode.

Interpolation bilin
eaire

SG

3.3.2

Linterpolation bilineaire necessite un


echantillonnage r
egulier des sites dobservation. On cherche les quatre points entourant le point dinteret. On effectue alors
une interpolation `a laide de linverse des distances. Linterpolation est exacte et
restitue une surface continue. Les calculs sont rapides.

EN

z2

z1
Si+1,j+1

Si,j+1

Si,j

a1

b2

S
b1
Si+1,j

a2

FIG 22 - Interpolation bilineaire : geometrie de la solution.

Pierre Bosser

24

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

Le valeur de la variable regionalisees au point ~s est donnee par :

Avec :

b1 zi+1,j+1 + b2 zi,j+1
b1 + b2
b1 zi+1,j + b2 zi,j
=
b1 + b2

z1 =
z2

a1 z1 + a2 z2
a1 + a2

/D
PTS

z (~s) =

Comme nous lavons dit, cette methode necessite un echantillonnage regulier des
sites dobservation, ce qui la rend inutilisable dans la majorite des cas.

3.4

Les surfaces de tendances

On cherche `a ajuster par moindre-carre une surface polynomiale aux valeurs observees. Cette surface se presente sous la forme :
z(~s) = z(x, y) =

p X
pi
X

ij xi y j

i=0 j=0

x01 y10 . . . x01 y1p


..
..
.
...
.
0 0
0 p
xn yn . . . xn yn

EN

SG

O`
u p est le degre du polynome ou ordre de la surface. Les ij sont obtenus par
P
minimisation de la quantite ni=1 [
z (~si ) z(~si )]2 par moindre-carre par exemple. Il
faut alors que le degre du polynome verifie 21 (p + 1)(p + 2) n. Linversion peut
secrire sous la forme matricielle suivante :

0,0

.
p 0

. . . x1 y1
..

..

...
.
0,p

.
..
. . . xpn yn0

p,0

z1
..
.

zn

On represente sur les figures suivantes, linterpolation par des surfaces de tendance
dordre respectif 2, 3 et 5.

Pierre Bosser

25

2011-2012

3 Linterpolation deterministe locale

800
700

/D
PTS

INTERPOLATION SPATIALE

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

800

700
600
500
400
140

SG

FIG 23 - Interpolation par une surface de tendance dordre


2 : application sur un champ dobservations - vue en perspective.

240
220
200
180
160

160

EN

180

200

140

220
240

120

260

280
X

FIG 24 - Interpolation par une surface de tendance dordre


3 : application sur un champ dobservations - vue en perspective.

Pierre Bosser

26

2011-2012

3 Linterpolation deterministe locale

800
700

/D
PTS

INTERPOLATION SPATIALE

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

FIG 25 - Interpolation par une surface de tendance dordre


5 : application sur un champ dobservations - vue en perspective.

La solution est unique. Linterpolateur est approche. La duree du calcul depend de


lordre de la surface.

SG

Les test statistiques concernant la significativite des resultats sont a` utiliser avec
prudence car ils reposent sur une hypoth`ese dindependance des valeurs, ce qui est
rarement verifie dans le contexte spatial.

3.5

Les splines

3.5.1

G
en
eralit
es

3.5.2

EN

Les splines sont une famille de fonctions qui minimisent lenergie de flexion sous
certaines contraintes dajustement. Dans notre contexte, il existe deux categories
de fonctions de splines : les splines dinterpolation qui passent exactement par les
points dobservation et les splines de lissage qui passent `a proximite.
Spline dinterpolation

On desire obtenir une fonction qui soit la plus lisse possible tout en restituant
les valeurs mesurees aux differents sites dobservation. Cette fonction (notee z(~s))
Pierre Bosser

27

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

ZZ

/D
PTS

represente la surface par une plaque mince et flexible que lon contraint a` passer par
chaque site. Elle doit ainsi minimiser lenergie de flexion :
2 z
2 z
2 z
+
2
+
dxdy
x2
xy y 2

Avec comme contrainte z(~si ) = z(~si ).

On peut montrer que la fonction spline solution secrit alors sous la forme :
z(~s) = z(x, y) = a0 + a1 x + a2 y +

n
X

bi K (~s ~si )

i=1

Avec :

K(~h) = k~hk2 ln(k~hk)

Les inconnues a0 , a0 , a0 , b1 , ..., bn sont solutions du syst`eme suivant :

a0 + a1 xi + a2 yi +

n
P

j=1

bj = 0,

n
P

j=1

n
P

j=1,j6=i

bj xj = 0,

bj K (~si ~sj ) = z(~si )

n
P

j=1

bj yj = 0

On traduit ce syst`eme sous forme matricielle :

. . . K1,n
a
0
..
a

...
.
1
a

...
0
2
b

...
1
1
..
. . . xn .

SG

1 x1 y1
0

.
.
..
..
..
..
.
.

1 xn yn Kn,1

0 0
0
1

0 0
0
x1

0 0 0
y1

...

yn

bn

z
1
..
.

zn
0
0
0

EN

Lestimation en un point donne necessite la resolution de n+3 equations. Lexistence


et lunicite de la solution sont garanties lorsque les points ne sont pas alignes. Les
splines dinterpolation sont des interpolateurs exacts.

Pierre Bosser

28

2011-2012

3 Linterpolation deterministe locale

800
700

/D
PTS

INTERPOLATION SPATIALE

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

FIG 26 - Interpolation par spline dinterpolation : application sur un champ dobservations - vue en perspective.

3.5.3

Les splines de lissage

n
X
i=1

SG

Il peut etre judicieux dans certaines situations (mesures presentant une incertitude
importante) de chercher une surface qui sapproche au mieux des observations tout
en restant la plus lisse possible. Dans R2 , on traduit ces conditions en cherchant a`
minimiser la fonction qui minimise :
[
z (~si ) z (~si )]2 +

ZZ

2 z
2 z
2 z
+
2
+
dxdy
x2
xy y 2

O`
u est un param`etre strictement positif et fixe a priori.

EN

On peut montrer que la solution se presente alors sous la forme de la solution obtenue
dans le cas des splines dinterpolation :
z(~s) = z(x, y) = a0 + a1 x + a2 y +

Avec :

n
X

bi K(~s ~si )

i=1

K(~h) = k~hk2 ln(k~hk)

Pierre Bosser

29

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

Les inconnues a0 , a0 , a0 , b1 , ..., bn sont solutions du syst`eme suivant :


n
P

a0 + a1 xi + a2 yi + bi +

n
P

j=1

bj = 0,

n
P

j=1

bj K (~si ~sj ) = z(~si )

/D
PTS

j=1,j6=i
n
P
bj yj
j=1

bj xj = 0,

=0

On traduit ce syst`eme sous forme matricielle :

1 x1 y1

..
..
..
..
.
.
.
.

1 xn yn Kn,1

0 0
0
1

0 0
0
x1

0 0 0
y1

. . . K1,n
..
..
.
.
...

...
1
. . . xn
. . . yn

a0
a1
a2
b1
..
.
bn

z
1
..
.
zn
0
0
0

800

600
500
400
140

SG

700
240
220
200
180
160

160

180

200

140

220

240

120

260

280

EN

FIG 27 - Interpolation par spline de lissage - = 103 : application sur un champ dobservations - vue en perspective.

Pierre Bosser

30

2011-2012

3 Linterpolation deterministe locale

800
700

/D
PTS

INTERPOLATION SPATIALE

240

600

220

500

200

400

180

140

160

160
180
200

140

220

240

120

260

280

FIG 28 - Interpolation par spline de lissage - = 106 : application sur un champ dobservations - vue en perspective.
La surface obtenue tend vers un plan.

3.6

SG

Le terme permet de faire un compromis entre la contrainte dajustement et contrainte de lissage :


Si = 0, linterpolation est exacte : on est dans le cas des splines dinterpolation.
Plus augmente, plus les valeurs calculees aux sites dobservation seloignent des
valeurs observees.
Lorsque +, la surface estimee tend vers un plan dequation z(x, y) =
a0 + a1 x + a2 y : les termes bi tendent vers 0 pour compenser la forte valeur de .

Conclusion

EN

Nous avons maintenant un apercu de differentes techniques deterministes permettant


lestimation locale de variables regionalisees en des sites non echantillonnes. Dans le
tableau suivant, on represente une synth`ese de ces methodes.

Pierre Bosser

31

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

Interpolation Exacte
oui
oui

Effet decran
total
total

Akima
Inverse des distances

oui
oui

total
faible

non
oui
non

faible
partiel
faible

Surface de tendance
Spline dinterpolation
Spline de lissage

Limite(s)
Discontinuites
Aspect
pyramidal
Implementation
Effet
il-de-buf
Peu robuste

/D
PTS

Interpolation
Polygones de Thiessen
Lineaire

FIG 29 - Quelques caracteristiques des methodes dinterpolation. Si une observation est masquee par une autre
observation par rapport au site `a estimer, elle peut recevoir un poids nul (ecran total), peu eleve (ecran partiel) ou
modere (ecran faible).

Ces differentes methodes peuvent etre evaluees en suivant la technique de lechantillon test (ou Jackknife ou bootstrap). Cette technique consiste a` partager les observations en deux ensembles : un ensemble permettant la determination du mod`ele,
un second permettant le test de ce mod`ele. On effectue ainsi une sorte de validation
croisee.

SG

On est cependant incapable de dire laquelle de ces methodes est la plus proche de
la verite, leur reussite etant largement dependante du contexte : une methode peut
fournir de bons resultats dans un cas, mais moins efficace dans un autre. Il est en
fait impossible de dire quelle methode fournit globalement les meilleurs resultats.
Aucune methode deterministe ne parait universellement meilleure.

EN

` titre indicatif, on presente dans le tableau suivant, les valeurs daltitude interpolees
A
pour les differentes methodes presentees en un point quelconque de lespace. Si une
majorite des methodes fournissent des valeurs coherentes (de lordre de 670), on ne
peut pas vraiment conclure quant `a la valeur exacte de laltitude du point estimee.

Pierre Bosser

32

2011-2012

INTERPOLATION SPATIALE

3 Linterpolation deterministe locale

/D
PTS

Interpolation
z (~s)
Thiessen
680.0000
Lineaire
674.3876
Methode dAkima
675.8825
2
Inverse des distances (d )
660.6881
Surface de tendance dordre 2 647.6674
Surface de tendance dordre 3 654.2670
Surface de tendance dordre 5 672.3207
Spline dinterpolation
674.7240
Spline de lissage ( = 103 )
668.2837
6
Spline de lissage ( = 10 )
630.6910

TAB 2 - Valeur de la variable regionalisee estimee en un


meme point par les differentes methodes : estimation de laltitude.

EN

SG

Notons enfin une limite importante des methodes ici presentees : celles-ci sappliquent aveuglement sans tenir compte dune eventuelle structure spatiale de la
variable regionalisee etudiee. La surface obtenue peut certes etre esthetique, mais
pas necessairement precise. Nous allons voir par la suite des methodes permettant
la prise en compte dune eventuelle structuration spatiale en faisant appel a` des
mod`eles probabilistes : les methodes stochastiques.

Pierre Bosser

33

2011-2012

4 Linterpolation stochastique

/D
PTS

INTERPOLATION SPATIALE

Linterpolation stochastique

On sinteresse desormais `a lutilisation de mod`eles probabilistes pour la description


du comportement de la variable regionalisee. Lutilisation de telles methodes doit
nous permettre egalement devaluer la precision dune estimation. On parle alors de
g
eostatistique : on utilise `a la fois les valeurs observees et linformation de position
pour ameliorer lestimation dans le contexte spatial.

SG

On utilise donc un mod`ele probabiliste pour decrire le phenom`ene naturel a` laide


dun processus aleatoire. On est cependant limite par la statistique classique qui
necessitent que les valeurs mesurees soient :
Independantes.
Identiquement distribuees.
Ces hypoth`eses ne sont pas verifiees dans notre contexte (dependance spatiale, conditions dobservation differentes). Un nouvelle approche doit etre envisagee.
Dans ce chapitre, on suppose la notion de variable al
eatoire connue. On rappelle quune variable aleatoire est une fonction renvoyant une valeur resultante
dune experience aleatoire. Dans notre cas elle permet dassurer la relation entre
un phenom`ene et les resultats chiffres dune experience portant sur ce phenom`ene.
On appelle ce resultat r
ealisation de la variable aleatoire.

4.1.1

Notion de fonction al
eatoire

EN

4.1

D
efinition

Le concept de fonction al
eatoire fournit des outils permettant danalyser le caract`ere a` la fois incertain et structure dun phenom`ene, permettant ulterieurement
destimer les valeurs en des sites inconnus (non echantillonnes). La fonction aleatoire
permet de prendre en compte le fait que la variable regionalisee peut prendre des
valeurs tr`es erratiques (inconstantes, ne suivent pas de mod`ele, difficiles a` predire) et
que ces valeurs ne sont par vraiment independantes mais structurees dans lespace.
Pierre Bosser

34

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

/D
PTS

On rappelle que z(~s) represente la valeur prise par la variable regionalisee z au site
~s D. On linterpr`ete comme une realisation dune variable aleatoire Z (~s) definie
en ~s. On appelle alors fonction aleatoire (aussi appelee processus al
eatoire ou
processus stochastique) la famille des variables aleatoires {Z (~s) /~s D}.
Chaque valeur z(~s) de la variable regionalisee z est donc interpretee comme un
realisation de la variable aleatoire Z(~s) definie en ~s. La fonction aleatoire represente
lensemble des variables aleatoires qui interpr`ete la variable regionalisee. Les differentes variables aleatoires ne sont pas independantes : une correlation existe et permet
de decrire la structure de la variable regionalisee.
La variable regionalisee constitue donc une realisation de la fonction aleatoire.
4.1.2

Moments

Du point de vue mathematique, une fonction aleatoire est caracterisee par sa loi
spatiale qui correspond `a la donnee de toutes les lois de probabilite de tous les
vecteurs aleatoires {Z(~s1 ), ...Z(~sn )} que lon peut extraire de la fonction aleatoire
Z(~s). Pratiquement, en raison de la complexite de la determination de loi spatiale
enti`ere, on limite la description de la loi spatiale `a ses deux premiers moments. Le but
est alors de retrouver les caracteristiques de la loi `a partir de la seule connaissance
de ces 2 moments.

SG

Moments du premier ordre : Le moment du premier ordre dune fonction


aleatoire se situe dans le cas de letude de sa loi monovariable (soit la loi en un
site) : on sinteresse `a lesp
erance math
ematique qui est dependante du point ~s :
E [Z(~s)] = mZ (~s)

EN

Cest la moyenne autour de laquelle les realisations en un point ~s de la variable


aleatoire Z(~s) se distribuent. Cest une moyenne sur les realisations et non une
moyenne spatiale.
Moments du second ordre : Les moments du second ordre fournissent une
description de la loi spatiale bivariable de la fonction aleatoire Z(~s), cest a` dire
la loi de probabilite entre les valeurs prises en deux sites ~s1 et ~s2 quelconques.

Pierre Bosser

35

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

La covariance centree entre Z (~s1 ) et Z (~s2 ) est donnee par :

/D
PTS

cov [Z (~s1 ) , Z (~s2 )] = E {[Z (~s1 ) mZ (~s1 )] [Z (~s2 ) mZ (~s2 )]}


= E [Z (~s1 ) Z (~s2 )] mZ (~s1 ) mZ (~s2 )
= C (~s1 , ~s2 )

Elle caracterise le degre de ressemblance (ou correlation) entre les valeurs prises en
~s1 et ~s2 .
On appelle variance (ou variance a priori), la covariance entre la variable aleatoire
Z (~s1 ) et elle-meme :
var [Z (~s1 )] = cov [Z (~s1 ) , Z (~s1 )]

= E [Z (~s1 ) mZ (~s1 )]2

Elle mesure la dispersion de la variable aleatoire Z (~s1 ) autour de sa moyenne.


Enfin, le (semi-)variogramme entre Z (~s1 ) et Z (~s2 ) est donne par
~ (~s1 , ~s2 ) =

1
var [Z (~s1 ) Z (~s2 )]
2

SG

Il caracterise la dissemblance entre les valeurs prises par la variable aleatoire entre
les sites ~s1 et ~s2 . On verra par la suite que cette quantite est un outil essentiel de la
geostatistique, en particulier du krigeage.
Ces moments sont les principaux param`etres de la fonction aleatoire : ils contiennent
linformation la plus pertinente et la plus utile. Ils seront largement utilises par la
suite.

4.2

Inf
erence statistique

EN

Nous venons dintroduire le concept de fonction aleatoire qui est loutil necessaire
`a letude geostatistique dune variable regionalisee. Nous allons voir maintenant
comment rattacher la mesure dune variable regionalisee au concept de fonction
aleatoire pour pouvoir exploiter ses proprietes.

Pierre Bosser

36

2011-2012

INTERPOLATION SPATIALE

4.2.1

4 Linterpolation stochastique

D
efinition

/D
PTS

Linf
erence statistique consiste `a reconstituer les caracteristiques de la fonction
aleatoire (en loccurrence ses deux premiers moments) `a partir dune realisation de
la variable regionalisee (soit un ensemble de donnees experimentales).
La variable regionalisee constitue une unique realisation de la fonction aleatoire : il
nexiste pas de bijection entre cette fonction et une realisation. La fonction aleatoire
ne peut donc etre definie sans ambig
uite `a partir de la seule variable regionalisee.
Pour permettre linference, deux hypoth`eses limitatives supplementaires doivent etre
realisees :
lergodicite de la fonction
la stationnarite du processus
Signalons enfin quen fonction des hypoth`eses realisees, nous serons limites sur les
possibilites doperations `a effectuer sur la fonction aleatoire.
4.2.2

Ergodicit
e

SG

Lhypoth`ese dergodicit
e suppose que linformation statistique peut etre obtenue
a` partir dune seule realisation quelconque de la fonction aleatoire definie sur un
domaine spatial infiniment grand. Autrement dit, une realisation de la fonction
aleatoire sur un grand domaine (cest `a dire pour un grand nombre de variables
aleatoires) apporte la meme information quun grand nombre de realisations de la
fonction aleatoire.
En particulier, dans notre cas, la connaissance dun grand nombre de valeurs de la
variable regionalisee (une realisation de la fonction aleatoire) est suffisant pour la
description de la fonction aleatoire (cest-`a-dire la restitution de ces moments).
En particulier, la moyenne spatiale realisee sur la variable regionalisee est alors
supposee egale `a lesperance mathematique de la fonction aleatoire :

EN

mZ = E [Z (~s)]
ZZZ
1
z (~s) d~s
= lim
D+ D
D

Letude des moments de la fonction aleatoire `a partir dune realisation est alors
possible.

Pierre Bosser

37

2011-2012

INTERPOLATION SPATIALE

4.2.3

4 Linterpolation stochastique

Stationnarit
e

/D
PTS

Nous allons detailler de la plus exigeante `a la plus flexible les differentes hypoth`eses
de stationnarite qui peuvent etre formulees.
Hypoth`
ese de stationnarit
e du second ordre : Une fonction aleatoire {Z (~s)}
est dite stationnaire dordre 2 quand son esperance mathematique
existe et nest
n
o
pas dependante du point et que la covariance entre chaque paire Z(~s + ~h), Z(~s)
existe et ne depend que de ~h (et pas du point de lespace ~s) :
(1) ~s D, E [Z (~s)] = m
h
i
 
(2) ~s D, (~s + ~h) D, cov Z(~s + ~h), Z(~s) = C ~h

Formule autrement, cette hypoth`ese signifie donc que la variable regionalisee z fluctue autour dune meme valeur dans lespace et que la covariance entre deux sites ne
depend pas de leur position mais du vecteur qui les separe.
Deux proprietes en decoulent :
La variance est la meme en chacun des sites ~s.
Le variogramme entre deux sites depend uniquement de la distance qui les separe.

SG

(3) ~s D, var [Z(~s)] = cov [Z(~s), Z(~s)] = C(~0)


h
i
(4) ~s D, (~s + ~h) D, var Z(~s + ~h) Z(~s) /2 = (~h) = C(~0) C(~h)
La relation (3) souligne quen chaque site, la dispersion autour de la valeur moyenne
est la meme. La relation (4) montre que la dissemblance entre deux sites est seulement fonction du vecteur qui les separe. Elle souligne egalement que, sous cette
hypoth`ese, lutilisation du variogramme ou de la covariance est equivalente pour
quantifier la dependance entre deux mesures separees par ~h.

EN

Lhypoth`ese de stationnarite dordre 2 ne peut etre validee de mani`ere rigoureuse


et infaillible `a partir de mesures experimentales : cest une decision plus ou moins
judicieuse prise par lutilisateur.
Hypoth`
ese intrins`
eque : Lhypoth`ese intrins`
eque est une version affaiblie de
lhypoth`ese de stationnarite du second ordre. Elle est basee uniquement sur les
accroissements de la fonction aleatoire.
Une fonction aleatoire est dite intrins`eque quand ses accroissements sont stationPierre Bosser

38

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

naires au second ordre :

/D
PTS

~s D, (~s + ~h) D,
h
i
(1) E Z(~s + ~h) Z(~s) = 0

(2) var Z(~s + ~h) Z(~s) = E


h

Z(~s + ~h) Z(~s)

i2

= 2(~h)

Selon cette hypoth`ese, lesperance des accroissements est donc nulle et sa variance
ne depend que du vecteur separant les deux points. Notons que les variance et
covariance de la fonction aleatoire ne sont pas forcement definies.
On remarque que lhypoth`ese de stationnarite du second ordre implique lhypoth`ese
intrins`eque. La reciproque est fausse.
Hypoth`
eses quasi-stationnaire et quasi-intrins`
eque : En pratique on suppose que la fonction aleatoire est intrins`eque mais egalement quasi-stationnaire
dordre 2 sur un domaine borne :
(1) ~s D, E [Z (~s)] = m
h 

i
 
(2) ~s D, (~s + ~h) D/k~hk < b, cov Z ~s + ~h , Z (~s) = C ~h

4.2.4

SG

Il faut alors concilier deux facteurs :


La zone choisie ne doit pas etre trop etendue par rapport `a la taille du champs
considere.
Le nombre de sites selectionnes ne doit pas etre trop faible.
Combinaisons lin
eaires autoris
ees

EN

On a choisi dutiliser uniquement les deux premiers moments de la loi spatiale, ce


qui entraine des limites quand `a la manipulation de la fonction aleatoire : on ne peut
utiliser que des combinaisons lineaires ponderees de Z (~s), seules expressions pour
lesquelles ont peut calculer esperance et covariance.
Lhypoth`ese de stationnarite choisie impose de plus des contraintes supplementaires
car elle ne garantit pas necessairement lexistence de lesperance et de la variance
de toutes les combinaisons lineaires ponderees. On appelle combinaison lin
eaire
autoris
ee une combinaison lineaire qui poss`ede une esperance et une variance.

Pierre Bosser

39

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

E
var

"
"

/D
PTS

Hypoth`
ese stationnaire dordre 2 : Dans ce cas, toutes les combinaisons lineaires ponderees sont autorisees :
X

wi Z (~si )

wi Z (~si )

= m

wi

XX
i

wi wj C (~si ~sj )

Hypoth`
ese intrins`
eque : Si la fonction aleatoire est intrins`eque, seules les combinaisons lineaires de poids total nul sont autorisees car elles peuvent secrire sous
la forme daccroissements :
X
i

4.2.5

wi = 0

var

P
i

P
i

Conclusion

wi Z (~si )

= 0

wi Z (~si )

PP
i

wi wj (~si ~sj )

SG

Le mod`ele probabiliste constitue une meilleure alternative lorsque les donnees etudiees sav`erent complexes. Pour rendre le mod`ele operationnel `a partir dune mesure
de la variable regionalisee, il est necessaire de se ramener `a des hypoth`eses. Les
hypoth`eses de stationnarite (second ordre ou intrins`eque) sont choisies en fonction
de lhomogeneite des donnees.
Maintenant que nous avons detaille le choix du mod`ele probabiliste, nous allons nous
focaliser sur un outil indispensable pour la modelisation spatiale des donnees : le
variogramme.

4.3

Analyse variographique

EN

Nous avons vu que le variogramme refletait la structure de la regionalisation. On


appelle analyse variographique linference du variogramme a` partir de donnees
experimentales. Elle permet de restituer des informations quant `a la distribution spatiale de la variable regionalisee, cest-`a-dire de la realisation de la fonction aleatoire
` titre de precision, on sattache usuellement `a letude du variogramme
dinteret. A
plutot que de la covariance, celle-ci netant pas necessairement definie dans le cadre
intrins`eque.
Lanalyse variographique constitue une etape cruciale dans un etude geostatistique :

Pierre Bosser

40

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

4.3.1

/D
PTS

elle permet posterieurement destimer les valeurs inconnues de la variable regionalisee et dassortir leur estimation dune precision.
Propri
et
es du variogramme

Propri
et
es math
ematiques :
Cas stationnaire dordre 2 : dans le cas stationnaire dordre 2 le variogramme est
une fonction paire, nulle pour ~h = ~0, positive et bornee. On dit que cest une
fonction de type n
egatif conditionnelle puisque elle obeit a` la relation :

k N , w1 , ..., wk R /

k
X

wi = 0, ~s1 , ..., ~sk D ,

n X
n
X

wi wj (~si ~sj ) 0

i=1 j=1

i=1

De plus,

lim

k~hk+

(~h) = C(~0)

Ce palier, C(0) est atteint au niveau de la port


ee (distance a` partir de laquelle
2 valeurs ne sont plus correlees) et correspond donc `a la dissemblance maximale.
Cas intrins`eque : Dans le cas intrins`eque, la covariance nexiste pas forcement. Le
variogramme nest pas borne et augmente indefiniment avec k~hk. On a de plus :
(~h) = o+ (k~hk2 )

SG

Anisotropie Le variogramme depend `a la fois du module k~hk de ~h mais aussi de


sa direction.

EN

Comportement `
a lorigine Le comportement `a lorigine refl`ete de degre de
regularite spatiale de la variable regionalisee. On distingue usuellement trois types
de comportements :
Parabolique : cas dune grande regularite spatiale avec une variable regionalisee
derivable et daspect lisse.
Lineaire : comportement moins regulier de la variable regionalisee ; regionalisation
continue mais plus derivable
Discontinu : saut abrupt `a lorigine en raison de labsence (totale ou partielle) de
correlation entre les valeurs prises par deux sites proches. La variable regionalisee
est discontinue. On parle alors deffet de p
epite du fait de lexemple des teneurs
en or des gisements aurif`eres qui varient `a tr`es courte echelle.
Ces differents types de comportement sont representes sur cette figure :

Pierre Bosser

41

2011-2012

INTERPOLATION SPATIALE

(h)
(a)

(h)
(c)

(b)

/D
PTS

(h)

4 Linterpolation stochastique

FIG 30 - Differents comportement `a lorigine du variogramme : (a) : comportement parabolique ; (b) : comportement lineaire ; (c) : comportement discontinu.

4.3.2

Inf
erence du variogramme

On cherche maintenant `a estimer le variogramme `a partie dun ensemble de donnees


experimentales {z(~si )}/~si D}.

SG

Variogramme exp
erimental : Le variogramme experimentale est calcule empiriquement `a partir des observations de la variable regionalise. Il est donne par la
formule :
X
1
(~h) =
[z(~si ) z(~sj )[2
~
2|N(h)| (i,j)N (~h)
O`
u N(~h) = {(i, j)/~si ~sj = ~h/i 6= j} est lensemble des paires distinctes et |N(~h)|
est le cardinal de N(~h). En pratique, les donnees netant pas reguli`erement espacees,
on definira lensemble N(~h) par N(~h) = {(i, j)/~si ~sj ~h /i 6= j}.

EN

Le variogramme experimental est un nuage de point. Le calcul sans pas induit la


restitution dun variogramme tr`es bruite `a partir duquel il est difficile de deduire
tout information ; Le choix dun calcul moyen par pas permet lobtention dun variogramme plus lisse dont les valeurs seront plus fiables.

Pierre Bosser

42

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

x 10

2
1.8

1.4

(h)

1.2
1
0.8
0.6
0.4
0.2
0

(a)

50

100

150

200

250

150

200

250

150

200

250

h [m]

x 10

1.8
1.6
1.4

(h)

1.2
1
0.8
0.6
0.4
0.2
0

(b)

50

100

h [m]

x 10

1.8
1.6
1.4

(h)

1.2
1
0.8
0.6
0.4
0.2
0

(c)

/D
PTS

1.6

50

100

h [m]

SG

FIG 31 - Exemple de variogramme experimental calcule :


(a) sans pas, (b) pour un pas de 5 m, (c) pour un pas de 10
m.
h

La variogramme experimental est non biaise (E (~h) = (~h)), mais sa dispersion


augmente fortement quand k~hk devient grand. Cest un estimateur peu robuste car

EN

sensible aux valeurs extremes ou aberrantes en particulier pour des pas faibles en
comparaison des distances entre sites dobservation.
Mod
elisations : Le variogramme experimental permet lestimation du variogramme theorique pour un nombre defini de distances, cest-`a-dire uniquement des valeurs
ponctuelles. De plus, il ne respecte pas necessairement les proprietes theoriques
du variogramme (en particulier la propriete negative conditionnelle, complexe a`
etablir). Lidee est donc dajuster un mod`ele variographique classique presentant les
caracteristiques necessaires et defini pour un ensemble de vecteurs ~r.

Pierre Bosser

43

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

Lajustement se fait alors par moindre-carre en minimisant la quantite :

[
(~rk ) (~rk )]2

/D
PTS

On trouve dans la litterature differents types de mod`ele. En fonction du variogramme


experimental, on choisira le mod`ele variographique qui sen rapproche le plus.
Mod`eles isotropes avec palier :
Mod`ele pepitique de palier C : comportement discontinu a` lorigine. Il est caracteristique des gisements miniers, en particulier aurif`eres.

(r) =

(a)

(r)

pour r = 0

pour r > 0

SG

FIG 32 - Mod`ele pepitique.

Mod`ele spherique de portee a et de palier C : lineaire `a lorigine.


C 3 r

(r) =

2a

1 r3
2 a3

pour 0 r a
pour r > a

EN

Pierre Bosser

44

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

(b)

/D
PTS

(r)

FIG 33 - Mod`ele spherique.

Mod`ele cubique de portee a et de palier C : parabolique `a lorigine.


C 7 r22
a

(r) =

35 r 3
4 a3

7 r5
2 a5

3 r7
4 a7

pour 0 r a

pour r > a

(c)

(r)

SG

FIG 34 - Mod`ele cubique.

Mod`ele exponentiel de param`etre a et de palier C : lineaire a` lorigine.


r

(r) = C 1 e a

(d)

(r)

EN

C
0.95C

3a
r

FIG 35 - Mod`ele exponentiel.

Pierre Bosser

45

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

Mod`ele gaussien de param`etre a et de palier C : parabolique a` lorigine.


2

r2

(e)

(r)

C
0.95C

/D
PTS

(r) = C 1 e

1.7a
r

FIG 36 - Mod`ele gaussien.

Mod`ele `a effet de trou : parabolique `a lorigine ; il permet de modeliser un


variogramme moins stable, presentant des fluctuations autour du palier : il est
caracteristique de donnees plus heterog`enes.
(r) =

1.21C

C 1

sin


r
a

r
a

(f)

(r)

SG

4.49a

FIG 37 - Mod`ele `
a effet de trou.

EN

Mod`eles isotropes sans palier : ils sont utilises dans le cadre non stationnaire
dordre 2 :
Mod`ele puissance dexposant et de facteur dechelle : [0; 2]. Plus est
proche de 2, plus la variable regionalisee est reguli`ere. Plus est proche de 0,
plus son comportement est erratique.

Pierre Bosser

(r) = r

46

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

/D
PTS

(r)

(a)

FIG 38 - Mod`ele puissance dexposant ( = 0, 5)

Mod`ele lineaire de pente : lineaire `a lorigine.


(r) = r

(r)

(b)

SG

FIG 39 - Mod`ele lineaire.

Les methodes utilisees pour des mod`eles non-isotropes existent mais sont plus complexes a` mettre en uvre. On cherchera en general `a se ramener a` un ou plusieurs
variogramme isotrope en fonction des directions privilegiees.

4.4.1

Le krigeage

EN

4.4

Origine de la m
ethode

Le krigeage est une methode dinterpolation applicable `a des donnees spatiales.


Elle sappuie sur la geostatistique lineaire, notamment le variogramme. La theorie
du krigeage a ete developpee par un mathematicien francais (G. Matheron) a` partir
des travaux de lingenieur minier sud-africain D. G. Krige. Dans les annees 50,
Krige a developpe une serie de methodes statistiques empiriques afin de determiner
la distribution de minerais `a partir dun ensemble de forages.
Pierre Bosser

47

2011-2012

INTERPOLATION SPATIALE

4.4.2

4 Linterpolation stochastique

Principe

/D
PTS

Voisinage : On appelle voisinage du krigeage le domaine du champ qui contient


le site a` estimer et les donnees utilisees pour linterpolation : dans la plupart des cas,
il nest pas necessaire de prendre toutes les donnees disponibles (trop nombreuses
ou trop eloignees : le calcul en serait plus long et pas necessairement plus precis).
Les sites dinteret sont selectionnes par un crit`ere de nombre (les n plus proches)
ou de distances (les n sites situes `a une distance inferieure `a rmax ). En general, 15
sites sont necessaires pour une estimation optimale (trop peu de sites peut rendre
la solution moins precise : un bon compromis est donc necessaire).
Contraintes : Lobjectif est destimer le plus precisement possible la grandeur
recherchee par une combinaison lineaire ponderee des observations. Ce crit`ere de
precision se traduit par une minimisation de lerreur quadratique moyenne. Ces
conditions se traduisent mathematiquement en 4 contraintes.
Contrainte de linearite : Lestimee doit etre une combinaison lineaire des donnees :
z(~s0 ) =

n
X

i (~s0 )z(~si )

i=1

SG

Contrainte dautorisation : Lesperance et la variance de lerreur de prevision


z(~s0 ) z(~s0 ) doivent obligatoirement exister (cette contrainte intervient dans le
cas stationnaire intrins`eque puisquelles existent obligatoirement dans le cas de la
stationnarite dordre 2).
Contrainte de non biais : Lesperance de lerreur de prevision est nulle :
E [
z (~s0 ) z(~s0 )] = 0

Contrainte doptimalite : les poids i doivent etre estimes de mani`ere a` minimiser


la variance de lerreur de prevision var [
z (~s0 ) z(~s0 )]

EN

Estimation : On sinteresse au cas le plus commun avec letude dune seule variable regionalisee, sous lhypoth`ese de stationnarite intrins`eque : on parle de krigeage ordinaire. Cest le type de krigeage le plus communement utilise.
Le krigeage doit donc repondre aux 4 contraintes enoncees precedemment.
Contrainte de linearite : Lestimee est donc une combinaison lineaire des observations :
n
X
s0 ) =
i (~s0 )Z(~si )
Z(~
Pierre Bosser

i=1

48

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

s0 ) Z(~s0 ) =
Z(~
=
=

"

n
X

i=1
" n
X

i=1
" n
X

/D
PTS

Contrainte dautorisation : On doit assurer lexistence de lesperance et de la variance de lerreur de prevision.


#

i (~s0 )Z(~si ) Z(~s0 )


#

i (~s0 )Z(~si )

" n
X

i (~s0 )Z(~s0 ) +

i=1

i (~s0 ) [Z(~si ) Z(~s0 )] + Z(~s0 )

i=1

" n
X

i (~s0 )Z(~s0 ) Z(~s0 )

i=1

" n
X

i (~s0 ) 1

i=1

Lerreur de prevision prend donc la forme dune combinaison lineaire daccroisseP


ments si et seulement si i i (~s0 ) = 1. Dans ce cas, on a bien lexistence de la
variance et de lesperance sous lhypoth`ese de stationnarite intrins`eque.
Contrainte de non biais : On doit sassurer que lestimateur de lerreur de prevision
est non biaise :
s0 ) Z(~s0 ) =
E Z(~

"

n
X

i (~s0 ) E [Z(~si ) Z(~s0 )] cf. equations precedentes

i=1

SG

Lesperance des accroissements etant nulle sous lhypoth`ese intrins`eque, on a bien


un estimateur de lerreur de prevision non biaise.
s0 )
Contrainte doptimalite : On cherche `a minimiser lerreur de prevision Z(~
P
Z(~s0 ). Cette minimisation sous la contrainte i i (~s0 ) = 1 se ram`ene a` la recherche
des extrema du lagrangien suivant :

L(1 (~s0 ), ..., n (~s0 ), ) = E

n
X

j (~s0 )Z(~sj ) Z(~s0 )

j=1

+ 2

n
X

i (~s0 )

i=1

O`
u represente un multiplicateur de Lagrange.
Apr`es developpement, on peut reecrire le lagrangien sous la forme :
i (~s0 )j (~s0 )ij + 2

EN

L=

n X
n
X

i=1 j=1

n
X

j=1

j (~s0 )j0 + 2 1

n
X
i=1

i (~s0 )

O`
u ij = (~si , ~sj )
Le calcul des derivees partielles premi`eres de L par rapport aux i (~s0 ) donne les

Pierre Bosser

49

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

equations constituant le syst`eme krigeage :

Soit, pour tout i [1; n[,

n
X

j=1

/D
PTS

n
X
L
= 2
i (~s0 )ij + 2i0 2
i (~s0 )
i=1
= 0

j (~s0 )ij + = i0

Au final, le syst`eme `a resoudre secrit donc :


n
P

j=1

j (~s0 )ij + = i0
n
P

j=1

j (~s0 )

Ce que lon peut reecrire sous forme matricielle :

0 12 13
21 0 23
..
..
..
.
.
.
n1 n2 n3
1
1
1

. . . 1n
. . . 2n
.
. . . ..

1
1
..
.

...
...

1
0

0
1

1 (~s0 )
2 (~s0 )
..
.

n (~s0 )

10
20
..
.

n0
1

(4)

4.4.3

SG

Notons que la mise en place du syst`eme de krigeage necessite une unique inversion
de la matrice carree de lequation de krigeage (mod`ele du krigeage), celle-ci etant
valide pour le domaine entier. Seul le vecteur du membre de droite doit etre calcule
en chaque point. Le vecteur estime est lui aussi valable en un point.
Propri
et
es du krigeage

La variance de lerreur destimation au point ~s0 est donnee par :

EN

2 (~s0 ) = var [
z (~s0 ) z(~s0 )[
=

n
X

i (~s0 )i0 +

i=1

La variance depend donc des param`etres du krigeage (termes i ) ainsi que de la


structure spatiale de la fonction aleatoire (variogramme).

Pierre Bosser

50

2011-2012

INTERPOLATION SPATIALE

4.4.4

4 Linterpolation stochastique

Impact du mod`
ele de variogramme

/D
PTS

On evalue en un point quelconque limpact de differents mod`eles de variogrammes


sur lestimation de la variable regionalisee.
Les variogrammes modelises estimes `a partir du variogramme experimental sont
representes sur la figure suivante. Dapr`es la structure de ce dernier, on choisit de
sinteresser uniquement aux variogrammes exponentiel, gaussien et a` effet de trou.
Le mod`ele `a effet de trou semble etre le plus adequat pour representer le variogramme determine experimentalement : comportement plus conforme a` lorigine,
meilleure restitution egalement de la dispersion. Cette dispersion nest cependant
pas representative dun phenom`ene physique reel, sa representation nest donc pas
forcement la plus judicieuse. Elle est vraisemblablement plutot liee au manque de
robustesse de lestimateur du variogramme.
8000
7000
6000

(h)

5000
4000
3000
2000
1000

50

100

150

200

250

SG

0
0

h [m]

FIG 40 - Variogramme experimental et differents mod`eles


variographiques associes : mod`eles exponentiel (magenta),
gaussien (vert) et `
a effet de trou (rouge).

EN

Les valeurs estimees `a laide du krigeage pour ces differents mod`eles de variogrammes, ainsi que leur precision, sont presentees dans le tableau suivant. On
constate que la variance de lestimateur est minimale pour un mod`ele de variogramme de type exponentiel.

Pierre Bosser

51

2011-2012

INTERPOLATION SPATIALE

4 Linterpolation stochastique

/D
PTS

Mod`ele
Valeur estimee Incertitude formelle
Exponentiel
653.2109
0.2729
Gaussien
660.6695
0.1796
Effet de trou
671.9119
0.4602

TAB 3 - Interpolation par krigeage en un point quelconque


pour differents mod`eles de variogramme.

La surface obtenue par krigeage `a partir du jeu dobservation dont on dispose est
alors :

800
700
Z

240

600

220

500

200

400

180

140

160

160
180
200

140
220

SG

240

120

260

280

FIG 41 - Krigeage : application sur un champ dobservations


- vue en perspective.

Conclusion

EN

4.5

La geostatistique permet de modeliser la structure du phenom`ene regionalise etudie


`a laide doutils simples (covariance et/ou variogramme) et de resoudre efficacement
les probl`emes dinterpolation.
Letude geostatistique debute avec lanalyse variographique qui consiste a` estimer
le variogramme experimental et `a le modeliser `a laide dune fonction standard.
Le mod`ele variographique peut alors etre utilise pour construire un syst`eme de
krigeage qui permettre dobtenir des estimations locales et les variances destimation

Pierre Bosser

52

2011-2012

INTERPOLATION SPATIALE

Conclusion

Conclusion

/D
PTS

associees.

EN

SG

Nous avons aborde deux types de methodes pour la resolution des probl`emes dinterpolation spatiale :
Les methodes deterministes globales : elles permettent lestimation de la moyenne
sur un domaine donne dune grandeur mesuree en differents points dobservation.
Elles sont basees sur des proprietes purement geometriques de lechantillon dobservation.
Les methodes deterministes locales : elles sont aussi basees sur des proprietes
purement geometriques de lechantillon dobservation et ne permettent pas une
evaluation de leur precision. Il est de plus generalement difficile de conlcure quant
`a la fiabilite globale dune technique deterministe.
Les methodes stochastiques : elles font appel `a un mod`ele cense mieux sadapter
aux donnees observees. Ce mod`ele permet lestimation de la variable en des sites
non echantillonnes apr`es letude de la distribution spatiale (variogramme) de la
variable.
Lutilisation de techniques de validation croisee (bootstrap) permet de controler la
conformite du mod`ele choisi `a la realite.

Pierre Bosser

53

2011-2012