Vous êtes sur la page 1sur 13

VINCENT VALLES

INITIATION AUX OUTILS MATHEMATIQUES ET


STATISTIQUES APPLIQUES AUX SCIENCES DE LA TERRE

CALCUL DE CARTE FONCTIONS EMPIRIQUES KRIGEAGE COKRIGEAGE


Dans le chapitre précédent, les variations spatiales ou temporelles ont été caractérisées
à partir des variogrammes et corrélogrammes. Des paramètres tels que la portée ou la
semivariance maximale ont pu être déterminés.
Il est possible de mettre à profit la détermination de ces caractéristiques afin de
faciliter l’intrapolation temporelle ou le calcul de carte.
En géoscience, nous disposons fréquemment de données ponctuelles, parfois
nombreuses et de bonne qualité, mais en l’état, elles ne sont pas facilement interprétables par
des aménageur ou des gestionnaires de l’environnement. Il faut transformer les données
ponctuelles en carte aisément interprétable.
Pour passer de donner ponctuelles à une carte, il faut effectuer des calculs de type
géostatistiques, calculs qui font l’objet de ce chapitre.
INTRODUCTION: Notion intuitive d’estimation cartographique
Nous avons tous une manière intuitive pour analyser les variations spatiale et
temporelles ainsi que pour estimer des valeurs.

Pour une distribution bidimensionnelle (en haut) ou monodimensionnelle (en bas), la


plupart d’entre nous estimerons une valeur voisine de 170 pour la position représenté en rouge
et proche de 190 pour la position marquée en bleu.
Intuitivement nous intégrons les valeurs des points les plus proches et nous réalisons
un intrapolation. Ceci revient à donner un poids important, « une influence importante »
d’autant plus que le point de mesure est proche du lieu où l’on souhaite estimer la valeur.
Calculer une carte revient à estimer en chaque point la valeur du paramètre à partir des
données acquises ponctuellement sur cette zone.
Les différentes méthodes de calcul diffèrent sur la manière de pondérer le poids des
différents points. Ceci fait l’objet du prochain paragraphe.
Dans ce qui suit, seul le cas de distribution bidimensionnelles seront présentées, mais
elles s’appliquent au cas de la chronostatistique et de distributions spatiales
monodimensionnelles.
CALCUL DE CARTE : UNE AFFAIRE D’ESTIMATION :

Le paramètre x a été mesuré sur n points d’acquisition : point 1, point 2, .. , point i, . , point n.
Le lieu ou l’on souhaite effectuer le calcul est le point B, figuré en bleu sur le schéma.
Les valeurs obtenues en ces points sont respectivement x1, x2, …., xi, … xn.

La valeur estimée xB est :

xB = i . xi

avec i =1

i représente le poids du point i (de sa valeur xi) dans l’estimation de xB. Nous savons
instinctivement que plus la distance entre le point i et le point B est importante, plus le poids
i est faible.

Illustration intuitive :

Pour la distribution monodimensionnelle ci-dessus:


Pour le point rouge situé à mi chemin entre les valeurs mesurées 150 et 199,
intuitivement on considérera que la valeur probable est la moyenne (arithmétique) de ces deux
valeurs.
xB = (0.5 * 150) + (0.5 * 199) = 174.5 = 175
Pour les deux points situés à proximité du lieu à estimer = 0.5 pour tous les autres
points = 0.
Pour le point bleu, on prendra des coefficients différents car la distance aux deux
valeurs mesurées voisines est différente. Ainsi, on prendra par exemple
xB = (0.14 * 150) + (0.86 * 199) = 192.14 = 192

Pour les deux points situés à proximité du lieu à estimer = 0.14 et = 0.86 pour
tous les autres points = 0.

Pour la distribution bidimensionnelle ci-dessus:

De la même manière que pour le cas monodimensionnel, on estimera intuitivement de


la manière suivante:
xB = (0.3*140) + (0.3 * 150) + (0.2 * 200) + (0.2 * 190)

les valeurs 0.3 ; 0.3 ; 0.2 et 0.2 sont les valeurs des points utilisés pour l’estimation,
les autres valeurs de sont prises égales à 0.

xB = (0.05*140) + (0.1 * 150) + (0.75 * 200) + (0.1 * 190)

Dans ce cas on a utilisé 4 données voisines pour réaliser l’estimation. Toutes les autres
valeurs de sont prises égales à 0.
Donc effectuer une estimation revient à choisir une méthode de calcul des valeurs 1,
2, …, i, …. , n, qui sera noté vecteur par la suite.
Les différentes méthodes de calcul de carte diffèrent uniquement dans la façon
d’estimer les valeurs . Deux grands types de méthodes existent : les méthodes empiriques
telles que la méthode de triangulation très prisées des TD et les méthodes de krigeage
fréquemment sollicitées par les logiciels de calcul,

FONCTIONS EMPIRIQUES :
Il a été vu précédemment dans l’approche intuitive, que lorsque la distance entre le
point i et le point B augmente, la valeur i diminue. C’est donc une fonction inverse.
Différentes fonctions inverses peuvent être utilisées pour les fonctions empiriques.
Habituellement, elles sont du type :
i = k/din

n étant un paramètre empirique positif


k est déterminé aisément par la relation : i =1

Selon les valeurs de n, l’allure de la carte est différente :


- Pour des valeurs de n petit (0.4 à 1.0), le tracé de la carte est « mou »
atténuant les contours, arrondissant les sommets (pour les représentations 3D
des cartes), les limites entre zones sont découpées par des lignes à fort rayon
de courbure.
- Pour des valeurs de n élevées (n=1.5 ; n=2.0 ou 2.5,..) le tracé est « tendu » :
les contours sont des lignes à faible rayon de courbure. Pour les
représentations en 3D des cartes, les sommets sont pointus.

Le choix de la valeur n et donc le caractère « mou » ou « tendu » et laissé au libre


choix de l’utilisateur. C’est un caractère empirique.

Remarque 1:
La méthode de triangulation est une méthode empirique de ce type et correspond à
n=1. On choisi les trois points les plus proches pour lesquels on calcule une valeur avec i,
cette valeur étant choisi nulle pour tous les autres points.

Remarque 2:
Les méthodes empiriques sont très faciles d’utilisation. L’exemple de la triangulation
en est une démonstration. Elle permet d’avoir rapidement une idée des zones présentant de
fortes valeurs et des zones avec des valeurs faibles. Ces méthodes ne sont pas à rejeter, mais à
garder comme moyen d’estimation rapide.
Cependant, elles présentent deux inconvénients majeurs:
- il est impossible de connaître la fiabilité de l’estimation. Dans un cas par
exemple de cartographie de teneurs en nitrates dans une nappe, si l’on obtient
en un point donnée une estimation de 50 mg/l, quelle sera la qualité de cette
estimation 50 +/- 3 ou bien 50 +/- 30 ? Avec la méthode empirique, il n’est
pas possible de savoir. Pour une valeur aussi importante que la limite de
distribution par les AEP, la connaissance de la précision de l’estimation est
cruciale.
- il faut remarquer que pour effectuer un calcul de type empirique, la
connaissance de la structure spatiale n’est pas utilisée, elle n’est pas mise à
profit. Dans le cas de la triangulation, seuls les trois points les plus proches
sont utilisés, c'
est-à-dire que tout se passe si la portée était arbitrairement
choisie égale à la distance entre le point B et les trois points utilisés pour
l’estimation. Ce n’est pas forcément le cas. Si la portée est plus grande,
l’information donnée par d’autres points que les trois les plus proches, n’est
pas valorisée, ce qui est dommage.
- La méthode empirique est une méthode biaisée, la moyenne des valeurs
estimées étant en général différente de la moyenne des valeurs mesurées.
- Si on estime la valeur sur un point où une mesure a été réalisée, alors on ne
trouve pas la valeur mesurée.

Ainsi, malgré les avantages incontestables des méthodes empiriques, que l’on
réservera pour des calculs préliminaires rapides, il conviendra de passer à des méthodes
krigées pour des calculs de cartes sérieux, digne de travail de vrais professionnels, pour les
cartes définitives incluses dans les rapports officiels.

KRIGEAGE/KRIGING: KRIGEAGE SIMPLE


Le krigeage est le BLUE Best Linear Unbiased Estimation, (meilleure estimation
linéaire non biaisée).
La méthode de krigeage repose sur un certain nombre d’hypothèses. Peu d’utilisateurs
des méthodes de calcul par krigeage prennent le soin de contrôler si elles sont effectivement
vérifiées. Ils supposent par défaut qu’elles le sont.
Ces hypothèses concernent le type de distribution normale des fréquences des valeurs
xi sur la zone étudiée et aussi des conditions sur la non stationnarité de la variance. Ce dernier
point sera développé ultérieurement.

On définit le vecteur colonne B suivant :


[B] :

sx1B
sx2B
.
sxiB
.
sxnB
1

Les valeurs sxiB représentent la semivariance correspondant à la distance entre le


point de mesure xi et le point B où est réalisé l’estimation. Pour calculer cette valeur sxiB,

De la même manière il est possible de calculer la matrice [A].

[A] =

sx1x1 sx1x2 …. …. …. sx1xn 1


sx2x1 sx2x2 …. …. …. sx2xn 1
…… … …. …. …. ….. 1
sxix1 sxIx2 …. …. …. sxixn 1
….. …. …. …. …. …. 1
sxnx1 sxnx2 …. …. …. sxnxn 1
1 1 1 …. …. 1 0

La matrice [A] est une matrice carrée d’ordre (n+1). Elle est symétrique car sxixj =
sxjxi puisque la distance entre le ième et le jème point de mesure est la même évidemment
qu’entre le jème et le ième point de mesure.
Si la variogramme ne présente pas d’effet de pépite la diagonale des sxixi est une
diagonale de 0. Dans le cas de l’effet de épite, elle est constituée de la valeur c1 de cet effet de
pépite.
Et enfin le vecteur [ ]:

[ ]=

1
2
.
i
.
n

Enfin la relation liant ces vecteurs :

[B]=[A] . [ ]

D’où
[ ] = [A]-1. [B]

On peut aussi calculer la précision de l’estimation par :

²(B) = BT[ ] - s(B,B)

avec = BT la transposée de [B].

Pour calculer le vecteur [ ], il faut donc calculer la matrice [A] et ensuite l’inverser.
La matrice [A] est une matrice carrée car elle possède autant de lignes que de colonnes
(n+1 lignes et autant de colonnes). C’est donc un tableau de (n+1)² valeurs. Plus le nombre de
points de mesures est important, meilleure sera la carte. Cependant, la taille de la matrice qu’il
faut inverser augmente comme le carré du nombre de points de mesures, ainsi que le temps de
calcul. Ce dernier devient rapidement important même pour les calculateurs modernes dont la
puissance croit sans cesse.

En résumé, nous obtenons deux cartes.


- la carte du paramètre faisant l’objet du calcul
- la carte de la variance ²(B) ou de l’écart type (B), qui nous
permet de connaître en tout point la fiabilité de l’estimation.
Cependant, dans de nombreux cas d’application en géoscience l’hypothèse de
stationnarité de la variance n’est pas respectée. Par exemple dans le cas de cartographie
hydrochimique de zones polluées, à l’extérieur des taches de pollution, les valeurs sont faibles
et la variance est faible. A la rigueur à l’intérieur de la tache de pollution les valeurs fortes
peuvent générer une variance faible si la pollution est homogène au sein de la tache.
Cependant dans les zones frontières en eaux polluées et eaux non polluées, la variabilité est
très forte de manière localisée.
Normalement, le krigeage ne peut être utilisé en l’état pour ces cas. Les
mathématiciens montrent que l’on peut limiter les conséquences négatives du non respect des
hypothèses de non stationnarité en réalisant un krigeage glissant.
KRIGEAGE GLISSANT
Le principe du krigeage glissant est le suivant. Si on considère la position du point B
pour lequel il faut réaliser l’estimation, on trace un cercle de rayon a (la portée) et de centre B.
Seul certains points de mesure sont à l’intérieur de ce cercle et seront utilisés pour réaliser le
krigeage, selon la méthode de calcul explicitée précédemment.
Ainsi, le nombre de point utilisé pour l’élaboration de la matrice [A] est nettement
moins important, ce qui facilite le calcul, et les points retenus sont les plus importants. Les
points rejetés se trouvant au-delà de la portée, ils n’apportent rien en terme de qualité de
l’estimation.
Au premier abord, il semblerait que cette méthode diminue le temps de calcul car les
matrices à inverser sont plus petites. Dans la pratique, il n’en est rien. Le temps de calcul est
souvent beaucoup plus long que pour un krigeage ordinaire. En effet, comme la position du
point B se déplace afin de couvrir toute la zone, les points pris en compte changent. A chaque
fois, il faut les sélectionner, créer la matrice et surtout inverser. Avec un krigeage ordinaire, la
matrice [A] intègre tous les points, elle est grande et longue à inverser, mais ce calcul est fait
une seule fois. Au bilan le krigeage simple est bien plus rapide que le krigeage glissant.

Illustration du principe du krigeage glissant. Selon la position de


B, les points pris en compte pour l’estimation changent ce qui
implique de recalculer à chaque fois la matrice [A] et son
inverse.
Ici, le nombre de points sélectionnés par leu appartenance dans
la portée est insuffisant (n<10) il faut étendre la zone de
sélection des points utilisés pour le calcul.

CO KRIGEAGE
Le co krigeage consiste à utiliser la corrélation qui existe entre deux paramètres, le
paramètre à cartographier et un autre paramètre, plus la distribution spatiale de l’autre
paramètre pour « enrichir » le calcul de la carte.
COMPARAISON DES METHODES EMPIRIQUES ET DE KRIGEAGE
Il est très utile de comparer pour un même jeu de données le résultat de calcul avec des
méthodes différentes.
Quelque soit la méthode, les zones de fortes valeurs et celles présentant les valeurs les
plus basses sont identiques. Cependant des différences importantes apparaissent selon le mode
d’estimation.

Fonction empirique restreinte aux points situés dans la portée.


L’expérience montre que si on veut effectuer un calcul rapide avec une fonction
empirique, une manière d’intégrer de manière sommaire la structure spatiale, on peut faire un
calcul avec une fonction empirique glissante n intégrant uniquement les points les plus
proches, par exemple ceux contenus dans le cercle de centre B et de rayon a.
L’amélioration par rapport à une fonction empirique simple est en général assez
importante. Cependant, pour un calcul définitif, il faut toujours utiliser les méthodes krigées.
Exemple de carte : comparaison des différents modes de calcul.
AQUA W Géostatistiques NO3-
0.0003842 to 0.0004803 0.0004803 to 0.0005763 0.0005763 to 0.0006724 0.0006724 to 0.0007684 0.0007684 to 0.0008645 0.0008645 to 0.0009605
Calcul de carte
0.0009605 to 0.0010566 0.0010566 to 0.0011526 0.0011526 to 0.0012487 0.0012487 to 0.0013447 0.0013447 to 0.0014408
avec une
167.5
fonction
165.0 empirique.
162.5

160.0
km

157.5

155.0

152.5

750.0 752.5 755.0 757.5 760.0


km
AQUA W Géostatistiques NO3-
-0.0003175 to 0.0000000 0.0000000 to 0.0003175 0.0003175 to 0.0006350 0.0006350 to 0.0009525 0.0009525 to 0.0012700 0.0012700 to 0.0015874
Calcul de carte
0.0015874 to 0.0019049 0.0019049 to 0.0022224 0.0022224 to 0.0025399 0.0025399 to 0.0028574 0.0028574 to 0.0031749
par krigeage
167.5
ordinaire.
165.0

162.5

160.0

157.5

155.0

152.5

750.0 752.5 755.0 757.5 760.0

AQUA W Géostatistiques NO3-


-0.0003422 to 0.0000000 0.0000000 to 0.0003422 0.0003422 to 0.0006844 0.0006844 to 0.0010266 0.0010266 to 0.0013688 0.0013688 to 0.0017110
Calcul de carte
0.0017110 to 0.0020533 0.0020533 to 0.0023955 0.0023955 to 0.0027377 0.0027377 to 0.0030799 0.0030799 to 0.0034221
par krigeage
167.5
glissant.
165.0

162.5

160.0

157.5

155.0

152.5

750.0 752.5 755.0 757.5 760.0


AQUA W Géostatistiques NO3-
0.0000000 to 0.0001607 0.0001607 to 0.0003214 0.0003214 to 0.0004820 0.0004820 to 0.0006427 0.0006427 to 0.0008034 0.0008034 to 0.0009641
Calcul de carte
0.0009641 to 0.0011247 0.0011247 to 0.0012854 0.0012854 to 0.0014461 0.0014461 to 0.0016068 0.0016068 to 0.0017674
avec une
167.5
fonction
165.0 empirique
162.5
restreinte à la
portée.
160.0
km

157.5

155.0

152.5

750.0 752.5 755.0 757.5 760.0


km

AQUA W Géostatistiques NO3-


0.0000000 to 0.0000548 0.0000548 to 0.0001095 0.0001095 to 0.0001643 0.0001643 to 0.0002190 0.0002190 to 0.0002738 0.0002738 to 0.0003285

0.0003285 to 0.0003833 0.0003833 to 0.0004381 0.0004381 to 0.0004928 0.0004928 to 0.0005476 0.0005476 to 0.0006023

167.5
Position des points d’acquisition et calcul
165.0 de la qualité de l’estimation.
162.5

160.0
km

157.5

155.0

152.5

750.0 752.5 755.0 757.5 760.0


km
c o rré l a t i o n

AQUAW: variogramme directionnel


NO3

Direction 2 Direction 1
0.75
C o e fficie n t d e

0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
Distance (km)
AQUAW: variogramme directionnel
S e m iv a r ia n c e [ e - 6 ]

NO3

Direction 2 Direction 1
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
Distance (km)
AQUA W Géostatistiques NO3
-0.0001744 to 0.0000000 0.0000000 to 0.0001744 0.0001744 to 0.0003487 0.0003487 to 0.0005231 0.0005231 to 0.0006974 0.0006974 to 0.0008718

0.0008718 to 0.0010462 0.0010462 to 0.0012205 0.0012205 to 0.0013949 0.0013949 to 0.0015692 0.0015692 to 0.0017436

155.5

155.0

154.5

154.0

153.5

153.0
km

152.5

152.0

151.5

151.0

150.5

751.5 752.0 752.5 753.0 753.5 754.0 754.5 755.0


km
AQUA W Géostatistiques NO3
0.0000000 to 0.0000481 0.0000481 to 0.0000962 0.0000962 to 0.0001443 0.0001443 to 0.0001924 0.0001924 to 0.0002406 0.0002406 to 0.0002887

0.0002887 to 0.0003368 0.0003368 to 0.0003849 0.0003849 to 0.0004330 0.0004330 to 0.0004811 0.0004811 to 0.0005292

155.5

155.0

154.5

154.0

153.5

153.0
km

152.5

152.0

151.5

151.0

150.5

751.5 752.0 752.5 753.0 753.5 754.0 754.5 755.0


km

Vous aimerez peut-être aussi