Vous êtes sur la page 1sur 4

LE KRIGEAGE : LA MTHODE OPTIMALE DINTERPOLATION SPATIALE

Yves Gratton
INSTITUT NATIONAL DE LA RECHERCHE SCIENTIFIQUE INRS-Eau-Terre-Environnement B.P. 7500, Qubec, Qc, Canada, G1V4C7 Yves_Gratton@inrs-ete.uquebec.ca

Nous prsentons une introduction informelle la mthode destimation (interpolation) spatiale connue sous le nom de Krigeage. La notion de variogramme est introduite et discute. La supriorit du Krigeage est illustre laide dun exemple simple. Mots cls : Krigeage, gostatistiques, analyse objective, interpolation spatiale, interpolation optimale, interpolation de Gauss-Markov.

1. INTRODUCTION
Lobjectif de cet article est de prsenter informellement les principes de la mthode dinterpolation spatiale connue sous le nom de Krigeage . Le Krigeage est la mthode optimale, au sens statistique du terme, destimation. On peut lutiliser autant pour linterpolation que lextrapolation. Ici nous nous restreindrons linterpolation et lextrapolation spatiales en deux dimensions. Le Krigeage porte le nom de son prcurseur, lingnieur minier sud-africain D.G. Krige. Dans les annes 50, Krige1 a dvelopp une srie de mthodes statistiques empiriques afin de dterminer la distribution spatiale de minerais partir dun ensemble de forages. Cest cependant le franais Matheron2 qui a formalis lapproche en utilisant les corrlations entre les forages pour en estimer la rpartition spatiale. Cest lui qui a baptis la mthode Krigeage . Il a aussi t le premier a utiliser le terme gostatistiques pour dsigner la modlisation statistique de donnes spatiales. Les mmes ides ont t dveloppes paralllement en URSS par L.S. Gandin3. Gandin a baptis sa mthode interpolation optimale . Il a introduit la notion d analyse objective pour dcrire cette approche base sur les corrlations. Cest le nom sous lequel la mthode est connue en mtorologie. En ocanologie, la mthode a t introduite par Bretherton et al.4 et elle est connue sous le nom de mthode dinterpolation de Gauss-Markov , daprs le nom quon lui donne

formellement dans les livres de statistiques (voir Liebelt5, par exemple). Dans les prochaines sections, nous prsenterons une description du variogramme, le cur du Krigeage. Suivront une prsentation du Krigeage ordinaire, un exemple illustrant la supriorit de la mthode, ainsi que la conclusion.

2. LE VARIOGRAMME
Linterpolation spatiale est un problme classique destimation dune fonction F(x), o x = (x,y), en un point xp du plan partir de valeurs connues de F en un certain nombre, m, de points environnants xi:

F( xp) = Wi F( xi )
i =1

(1)

Le problme consiste dterminer la pondration, i.e. les Wi, de chacun des points environnants. Il existe plusieurs faons de choisir ces poids. Les deux mthodes les plus connues sont linterpolation linaire (en fonction de linverse de la distance) et la mthode des splines cubiques (ajustement de polynmes cubiques). Le Krigeage choisit plutt les poids partir du degr de similarit entre les valeurs de F, i.e. partir de la covariance entre les points en fonction de la distance entre ces points. Un utilisateur srieux du Krigeage se doit de bien

Gratton Y., les articles de lInstitut dAnalyse Gographique, Juin 2002, www.iag.asso.fr

connatre les conditions dutilisation de la mthode. Ici, nous dirons simplement que la seule condition indispensable pour utiliser le Krigeage est que la moyenne et la variance (voir lAnnexe) de la fonction F soient stationnaires, cest--dire quelles ne dpendent pas de la position des points, seulement de la distance entre les points. Le variogramme est alors simplement la variance totale moins la covariance, en fonction de la distance entre les points. Le livre de Journel et Huijbregts6 prsente une excellente description formelle du variogramme (et aussi du Krigeage), tout en maintenant le niveau mathmatique son minimum. Le Krigeage utilisera alors le semi-variogramme (la moiti du variogramme) pour dterminer les poids dans lquation (1). Le semivariogramme est calcul laide de lquation (2) pour les n(h) points xi et yi spars par une distance h = | xi - y i | :

leurs comportements. Le choix du semi-variogramme doit ensuite tre valid par des tests statistiques.

3. LE KRIGEAGE ORDINAIRE
Le Krigeage consiste ensuite calculer les Wi de lquation (1) l'aide des valeurs de la fonction (h) correspondant aux m points choisis. Il existe trois types de Krigeage univari (i.e. une seule variable) : le Krigeage simple, le Krigeage ordinaire et le Krigeage universel. La diffrence entre ces types d'estimation rside dans la connaissance de la statistique de la variable interpoler : (1) Krigeage simple : variable stationnaire de moyenne connue; (2) Krigeage ordinaire : variable stationnaire de moyenne inconnue et (3) Krigeage universel : variable non-stationnaire (qui contient une tendance). Ici, nous nous restreindrons au Krigeage ordinaire, aussi appel Krigeage ponctuel par certains auteurs, car il est le plus frquemment utilis. La mthode consiste dterminer la combinaison de poids, i.e. la combinaison des Wi de lq. (1), qui garantit que les semi-variances calcules laide du point cible xp se retrouveront sur la courbe de la figure 1. Les poids sont obtenus en multipliant les Wi, pour chacun des m points, par chacune des m semi-variances associes ce point (les lignes de la matrice A de lq. (3)). Le problme sexprime finalement sous la forme du systme de m+1 quations linaires m+1 inconnues suivant (Davis 1986)

1 n (h ) (h ) = (xi yi )2 2n (h ) i=1

(2)

La figure 1 prsente un exemple de semi-variogramme (h). Il suffit dajuster une fonction analytique tous ces points laide de la mthode des moindres carrs et nous obtenons alors une fonction continue caractrisant compltement la semi-variance en fonction de la distance entre les points.

AW = B (h11) (h12 ) (h 21) (h 22 ) o A = ... ... (hm1) (hm 2 ) 1 1 W1 W2 W = ... Wm ... (h1m ) 1 ... (h 2 m ) 1 ... ... ... , ... (hmm ) 1 ... 1 0 ( h1 p ) ( h 2 p) B = ... . ( hmp) 1

(3)

Figure 1. Exemple de semi-variogramme. Les points (cercles) sont obtenus laide de lq. (2) pour lensemble des distances h possibles, o h = |xi - yi|. Une fonction continue (la ligne continue) a ensuite t ajuste laide de la mthode des moindres carrs.

Le choix et lajustement dune fonction au semivariogramme est la partie la plus dlicate du Krigeage : cest presquun art plutt quune science. Le lecteur est une fois de plus renvoy au livre de Journel et Huijbregts6 qui prsente, mon avis, la meilleure discussion des types de variogramme et de

et

Gratton Y., les articles de lInstitut dAnalyse Gographique, Juin 2002, www.iag.asso.fr

Les (hij) sont les valeurs du semi-variogramme qui correspondent la distance hij entre les points xi et xj. Les (hij) ont dj t calculs partir des donnes laide de lq. (2), tandis que les (hip) sont calculs laide de la fonction analytique qui a t ajuste aux points au semi-variogramme de la fig. 1. Pour que la solution soit non-biaise, la somme des poids, les Wi, doit tre gale 1. Cette dernire contrainte introduit un degr de libert supplmentaire dans le problme. Ce degr supplmentaire est utilis en ajoutant une variable libre, (un multiplicateur de Lagrange), dans le but de minimiser l'erreur d'estimation. Le vecteur W est obtenu en multipliant les deux cts de l'quation (3) par l'inverse de la matrice A. La valeur recherche au point xp est ensuite calcule en utilisant les valeurs connues de F, les F(xi), l'aide de l'quation (1). La variance de l'estimation s 2 , c'est--dire le carr p de l'erreur standard en chaque point, est obtenue par la relation

Dans le but de vrifier lefficacit de la mthode, nous (Gratton et al.8) avons chantillonn cette fonction laide de la grille irrgulire que nous avions utilise lors dune campagne ocanographique en mer dAlborn (en Mditerrane occidentale). Les figures 3a et 3b prsentent deux estimations des contours de la fonction F(R) obtenues en calculant les pondrations laide de la mthode de la distance inverse et par Krigeage. La grille irrgulire dchantillonnage est aussi reproduite sur ces figures. Autrement dit, nous tentons de reproduire, par interpolation et extrapolation, les contours parfaitement circulaires de la figure 2, partir des valeurs de F(R) calcules aux points identifis sur les figures 3a,b.

s2 = W T B . p

(4)

o le T indique qu'il faut utiliser la transpose du vecteur W. Si nous supposons que les erreurs d'estimation sont normalement distribues autour de la vraie valeur, alors la probabilit que la vraie valeur soit F(xp) sp est de 68%, tandis que la probabilit que la vraie valeur soit F(xp) 2sp est de 95% (Davis 1986).

Figure 3a. Estimation de la fonction F(R) laide dune interpolation linaire base sur linverse de la distance. La grille irrgulire dchantillonnage est aussi prsente.

4. EXEMPLE DE KRIGEAGE ORDINAIRE


La figure 2 propose les contours de la fonction

F( R ) =

sin R , o R R

= ( x 2 + y 2 )1 / 2

(5)

On observe que linterpolation laide du Krigeage est de beaucoup suprieure lautre. De plus, le Krigeage nous permet dobtenir une estimation raisonnable de la fonction lextrieur (extrapolation) de la grille dchantillonnage. Il est aussi possible (et souhaitable) de tracer les contours de lerreur destimation donne par lq. (4).

Figure 2. Contours de F(R), o F(R) est dfini par lq. (5)

Figure 3b. Mme chose que la figure 3a, mais laide du Krigeage ordinaire.

Gratton Y., les articles de lInstitut dAnalyse Gographique, Juin 2002, www.iag.asso.fr

5. DISCUSSION ET CONCLUSIONS
Nous avons prsent une introduction informelle au Krigeage et son outil privilgi, le semivariogramme. Nous avons eu recours un exemple en deux dimensions mais le Krigeage sapplique tout aussi bien en trois dimensions. Lors du calcul du variogramme, nous avons utilis le fait, sans lnoncer, que le variogramme tait isotrope, cest--dire que la variabilit tait la mme dans les toutes les directions du plan. Ce nest gnralement pas le cas. Lorsque cela se produit, nous devons dfinir un variogramme pour chacun des axes du plan. De plus, nous avons utilis tous les points disponibles pour calculer les Wi : la plupart des logiciels de contouring nen utilise quun sousensemble. Davis7 prsente une description des diffrentes mthodes de contouring. Finalement, il existe une version multivarie (i.e. plusieurs variables distinctes) du Krigeage. Le lecteur intress est invit consulter larticle de Marcotte9 et le livre de Deutsch and Journel10 qui nous proposent des logiciels crits en Matlab et en Fortran, respectivement. Nous (Gratton et Lafleur11) les avons runis en une seule bote outils en Matlab. Il existe cependant plusieurs autres logiciels gratuits aussi disponibles sur Internet. Le site suivant de lUniversit de Lausanne, entre autres, est un excellent point de dpart pour obtenir plus dinformations sur les logiciels disponibles : http://www.ai-geostats.org/. Le Krigeage est la mthode optimale, au sens statistique, dinterpolation et dextrapolation. Cest la mthode destimation la plus prcise. Contrairement toutes les autres mthodes, elle nous permet aussi de calculer lerreur destimation. Il faut cependant ajouter que dans plusieurs cas, et spcialement dans le cas dune grille rgulire dchantillonnage, la mthode des splines cubiques produit des rsultats peu prs quivalents ceux obtenus par Krigeage12, tout en tant plus rapide et plus simple utiliser. Si la prcision des rsultats est importante, le Krigeage demeure, mme dans ce dernier cas, la mthode de prdilection.

de zooplancton, etc. Une fonction alatoire est un ensemble de variables alatoires dfinies sur une rgion dintrt : {Z(x), x une zone d'tude}. Les deux premiers moments dune fonction alatoire sont Moment dordre un ou lesprance mathmatique. La moyenne: m(x) = E{Z(x)}

Moments du second ordre. a) La variance: Var{Z(x)} = E{ [Z(x) - m(x)]2 } b) La covariance: C(x1,x2) = E{ [Z(x1)-m(x1)] [Z(x2) - m(x2)] } c) Le variogramme: 2(x1,x2) = Var{ Z(x1) - Z(x2) } Si la fonction alatoire est stationnaire, alors Var{Z(x)} = E{Z(x) - m2} = C(0) et (h) = E{[Z(x+h) - Z(x)]2} = C(0) - C(h).
REFERENCES
1) Krige, D.G. A statistical approach to some basic mine valuation problems on the Witwatersrand. 1951. J. of Chem., Metal. and Mining Soc. of South Africa, 52, 119-139. 2) Matheron, G. 1963. Principles of Geostatistics. Economic Geol., 58, 1246-1268. 3) Gandin, L.S. 1965. Objective Analysis of Meteorological fields. Isral Program for Scientific Translations, No. 1373, 242 p. 4) Bretherton, F.B., R.E. Davis and C.B. Fandry. 1976. A technique for objective analysis and design of oceanographic experiments applied to MODE-73. Deep-Sea Res., 23, 559-582. 5) Liebelt, P.B. 1967. An introduction to Optimal Estimation, Addison-Wesley, 267 p. 6) Journel, A.G. and C.J. Huijbregts. 1978. Mining Geostatistics. Academic Press, 600 p. 7) Davis, J. C. 1986. Statistics and Data Analysis in Geology. 2nd ed, John Wiley & Sons. New York, 289 p. 8) Gratton, Y., L. Prieur, R.G. Ingram, et C. Lafleur. 2002. Les courants en mer dAlborn Est pendant la campagne Almofront-I. Rapport interne, INRS-ETE. 9) Marcotte, D. 1991. Cokriging with MATLAB. Computers & Geosciences, 17(9): 1265-1280. 10) Deutsch, C.V. et A.G. Journel. 1992. GSLIB - Geostatistical Software Library. Oxford Univ. Press, New York, 340 p. 11) Gratton, Y. et C. Lafleur . 2001. Le Matlab Kriging Toolbox. Version 4.0. Manuel de rfrence, INRS-ETE. Le logiciel est disponible gratuitement ladresse suivante : http://www.inrs-ete.uquebec.ca/activites/repertoire/ yves_gratton/krig.htm 12) Dubrule, O. 1984. Comparing Splines and Kriging. Computers & Geosciences, 10(2-3): 327-33.

ANNEXE : Moments dordre un et deux


Une variable alatoire, Z(x) o x est le vecteur (x,y), est une fonction qui prend un ensemble de valeurs ou de ralisations selon une distribution de probabilits quelconque. Ces ralisations peuvent tre des tempratures, des concentrations de minerai, labondance

Gratton Y., les articles de lInstitut dAnalyse Gographique, Juin 2002, www.iag.asso.fr

Vous aimerez peut-être aussi