Académique Documents
Professionnel Documents
Culture Documents
Cours Geostat Appliquée-M2-Biodiversité 231125 075238
Cours Geostat Appliquée-M2-Biodiversité 231125 075238
ـــــــ
Ministère de l'Enseignement Supérieur et de la Recherche Scientifique
ـــــ ــــ ــــــ ـــــــ ــــن ـــــو ـــــ ــــــ – ا ــــ ـــــ ــــــف ــــــــ ــــ ـــــ
ـــــ ـــــــم ا ــــــ ــــــ ء و ا ــــ ــــــ ـــــــ ـــــــ و ا ـــــ ـــــ!ــــــ ــــــ ا ـــــ ـــــ ـــــــ ــــــدا ــــــــــ
Département d’Eau, Environnement et Développement Durable
Notes de cours
Master 2, Eau et Environnement
Filière : Agronomie
Domaine : Sciences de la Nature et de la Vie
GÉOSTATISTIQUE
APPLIQUÉE
Notes de cours
ABDELHAMID BRADAÏ
)(a.bradai@univ-chlef.dz
INTRODUCTION
Nous allons essayer au cours de ce cours introductif de présenter les principes de mise en
œuvre d'une analyse géostatistique. Le TP qui prolonge ce cours, a deux objectifs: d'une part,
montrer la mise en œuvre pratique de la géostatistique, d'autre part, montrer que la
géostatistique se fonde sur les bases des statistiques classiques mieux connue et maitrisées par
les étudiants.
Pour un étudiant confronté à un problème de variabilité spatiale, le premier choix qu'il aura à
faire concerne le type d'approche qu'il met en œuvre. Deux grandes voies lui sont ouvertes :
- Employer une démarche statistique, basée sur les statistiques classiques (recherche de
moyennes, de variances au sein d'une population ou de strates) ou sur la géostatistique
(obtention de cartes). On reproche souvent à ces techniques leurs exigences élevées en
matière d'échantillonnage. Il demeure que ces techniques sont incontournables dès lors que
l'on désire obtenir des estimations dont on connaît la précision. Ces techniques sont
également les seules que l'on puisse mettre en œuvre dans certains cas: phénomène
naturelle, propriété dont la variabilité ne dépend que de l'action de l'homme (pollution) ...
Les querelles d'école entre ces deux types d'approches restent nombreuses. On peut proposer
une approche pragmatique pour faire le choix. On envisagera l'approche déterministe quand le
paysage est très contrasté et que l'on sait que ces contrastes correspondent à des états
différents de la propriété étudiée. On préférera l'approche statistique quand il est utile d'avoir
des estimations de précision connue ou que le paysage varie peu.
C’est dans cet objectif que ce cours est inscrit. Il vise à introduire les concepts de la
géostatistique. En raison du public visé, cette présentation part de considérations intuitives
pour aboutir à des ébauches de formalisme mathématique.
1
1. Définition
L’innovation ne réside pas non plus dans l’arsenal mathématique requis. L’introduction et
l’étude des « Fonctions Aléatoires » dès les années 1930 par les écoles française et russe ; les outils
théoriques que nous utilisons en Géostatistique linéaire étaient en place dès les années 1940 ; et les
méthodes comme les moindres carrés de Gauss ou les paramètres de Lagrange, sont des plus
classiques et font partie du bagage mathématique de base de l’ingénieur.
Le déclic, si l’on peut dire, qui a conduit à l’élaboration de ce que nous appelons ici et
aujourd’hui la Géostatistique, c’est le rapprochement de ces deux domaines : des problèmes
techniques parfois forts terre-à-terre d’une part, et d’autre part un arsenal de méthodes mathématiques.
Sans doute d’ailleurs, dans l’espace d’une décennie, la Géostatistique s’est élaborée indépendamment
dans le domaine minier, dans le domaine forestier (B. Matéron, en Suède), en météorologie (L.S.
Gandin, en URSS). Sans doute une recherche bibliographique approfondie trouverait-elle une
évolution semblable dans d’autres disciplines encore
2
3. Objectifs de la géostatistique
L’objectif principal de la géostatistique est d’établir des cartes des phénomènes naturels qui
soient :
- claires,
- faciles à comprendre,
- fiables.
Parmi ces phénomènes étudiés, on peut citer :
- contamination des sites,
Objectifs d’apprentissage
A la fin du cours, l'étudiant doit :
(ii). familier avec les notions de variance et saura estimer et modéliser un variogramme ;
(iii). comprendre les principales propriétés des estimateurs du krigeage et le lien qu'ils
présentent avec le variogramme ;
(iv). aura été sensibilisé à diverses applications de ces techniques dans le domaine d’écologie
et environnement;
(v). saura utiliser la géostatistique pour ses propres recherches de cartographie (rapport, Master
ou doctorat)
3
CHAPITRE I : VARIABLES REGIONALISEES
CHAPITRE I
I. VARIABLES REGIONALISEES
I.1.1. Définitions
-Définition simple
Une variable aléatoire (v.a) est fonction dont les résultats possibles sont connus mais
dont le résultat final ne peut être déterminé, à priori, avant d'effectuer la mesure (expérience).
-Définition mathématique
Une variable aléatoire est définie en associant un nombre réel à chaque éventualité
d’une expérience aléatoire. Une variable aléatoire X est une fonction de l’ensemble
fondamental Ω à valeurs dans R, X : Ω → R.
Lorsque la variable X ne prend que des valeurs discrètes, on parle de variable aléatoire
discrète.
4
CHAPITRE I : VARIABLES REGIONALISEES
(4) Si a ≤ b , P (a ≤ X ≤ b) = Fx (b) − Fx (a )
5
CHAPITRE I : VARIABLES REGIONALISEES
Exemple 1 :
Imaginons l'expérience suivante pour quantifier la biomasse d’un champ agricole :
Nous creusons 10 trous dans un champ agricole, et comptons le nombre de ver de terre
dans chacun d'eux (voir figure).
- dans quatre (4) des dix trous nous n'en trouvons aucuns (0 vers de terre),
- trois (3) autres trous contiennent chacun un ver de terre (1 ver de terre),
- nous en comptons deux (2) dans chacun des deux autres trous (2 vers de terre),
- le dernier trou donne trois (3) vers de terre (3 vers de terre).
Figure 12. Illustration du nombre de vers de terre par trou creusé dans un champ agricole.
Solution
Les résultats de l’expérience peuvent être représentés dans un tableau en attribuant un
numéro pour chaque trou creusé et le nombre de ver de terre trouvé dans chaque trou comme
suit :
N° Trou 1 2 3 4 5 6 7 8 9 10
Nbr. Ver de
0 0 0 0 1 1 1 2 2 3
terre
Si on note le nombre de vers de terres trouvées dans chaque trou comme variable
aléatoire X, elle est définie X
Ω → R avec Ω ={0, 0, 0, 0, 1, 1, 1, 2, 2, 3}
On voit que X (Ω) = {0, 1, 2, 3} et on peut déterminer aussitôt les évènements [X=xi] et
P(X=xi) :
[X=0] = (0, 0, 0, 0) et P (X=0) = 4/10 = 0.4
[X =1] = (1, 1, 1) et P(X=1) = 3/10 = 0.3
[X=2] = (2, 2) et P(X=2) = 2/10 = 0.2
[X=3] = (3) et P(X=1) = 1/10 = 0.1
Onn peut organiser les résultats de l’expérience
l’expérience dans un tableau en représentant P(X=xi) et Fx
comme suit :
Tableau 2. Répartition des vers de terre par trou creusé dans le champ agricole.
agricole
X (Nbr.
Nbr. Vers
0 1 2 3
de terres/trou )
P(X=x
X=xi) 4/10 3/10 2/10 1/10
6
CHAPITRE I : VARIABLES REGIONALISEES
Si X est une variable aléatoire ayant une espérance E(X), on appel Variance
mathématique de X le réel de :
7
CHAPITRE I : VARIABLES REGIONALISEES
V ( X ) = E ([ X − ( E ( X )]²) (2)
Comme on peut écrire aussi :
V ( X ) = E ( X ²) − [ E ( X )]² (3)
Remarque 3.2 : Comme [X-E(X)]² ≥ 0, nécessairement V(X) ≥ 0. Par définition, une variance
est toujours positive.
Enfin, Si X est une variable aléatoire ayant une variance mathématique V(X), on appelle
l’écart- type (σ(x)) de X, le réel de :
σ ( X ) = V ( x) (4)
-Exemple 2 :
On poursuit avec les mêmes données de l’exemple précédent, le nombre de vers de
terre par trou comme une variable aléatoire (v.a en abrégé) notée X.
Les fréquences précédentes deviennent des probabilités X vaut 0 avec la probabilité
0.4 ("4 chances sur 10"), 1 avec la probabilité 0.3, 2 avec 0.2 et enfin 3 avec 0.1.
L’espérance mathématique E(X) de la v.a X vaut :
E(X) = 0 x 0.4 + 1 x 0.3 + 2 x 0.2 + 3 x 0.1 =1 (12.)
C’est la valeur probable, de X, notée E(X) = 1.
On peut calculer de la même façon l'espérance du carré de la variable ou la Variance
mathématique V(X):
V(X) = 0²x0.4 + 1²x0.3 + 2²x0.2 + 3²x0.1= 2
8
CHAPITRE I : VARIABLES REGIONALISEES
Elle traduit la façon dont évoluent la covariance des observations lorsque leur distance
augmente. Lorsque h est égal à 0, la covariance est égale à la variance.
C ( − h) = C ( h)
( 8)
C (h) ≤ C (0)
On définit la fonction d’autocorrélation ρ(h) comme une fonction de h par le rapport
C (h)
. Sa valeur est comprise entre (-1) et (+1). On peut montrer les relations suivantes
C (0 )
lorsque la stationnarité à l’ordre 2 est vérifiée :
γ ( h ) = C ( 0) − C ( h )
(9)
γ (h) = σ ²(1 − ρ (h))
Pour justifier l’existence de la covariance d’une variable aléatoire, deux cas se présentent :
- Si (X, Y)(Ω) est fini, alors le couple (X, Y) admet une covariance
- Si X et Y admettent un moment d’ordre 2, alors le couple (X, Y) admet une
covariance
cov( X , Y ) = E ( XY ) − E ( X ) E (Y ) (14)
9
CHAPITRE I : VARIABLES REGIONALISEES
Cov ( X , Y )
ρ XY + (15)
σ ( X )σ (Y )
10
CHAPITRE I : VARIABLES REGIONALISEES
Une fonction aléatoire est intrinsèque à l'ordre 0 (FAI-0) si ses accroissements d'ordre
1 sont stationnaires d'ordre 2, autrement dit, si les espérances et les variances des incréments
Z (x+h) - Z (x) existent et ne dépendent pas de x, soit :
E (Z(x+h)-Z(x)) = m (19)
Var (Z(x+h)-Z(x)) = E((Z(x+h)-Z(x)- m)²) = 2γ(h) (20)
avec (h) une fonction nommée demi-variograme (ou semi-variogramme), ou selon l'usage le
plus répandu «variogramme».
11
CHAPITRE I : VARIABLES REGIONALISEES
(ii) un aspect structuré (elle doit refléter à sa manière les caractéristiques structurales
du phénomène régionalisé).
Exemple 3.3
Revenons aux trous et à leur vers de terre, et supposons que ces trous soient creusés le
long de deux lignes (A et B) de telles sorte que le nombre de vers de terre trouvées le long de
la ligne soit, dans cet ordre (fig.12).
Figure 13. Illustration du nombre de vers de terre par trou creusé dans deux transects dans
un champ agricole.
Les trous de la séquence A possède une structure symétrique très nette et dans le cas B,
si la structure existe, elle est très faible et montre une forte irrégularité ; cependant ces 2 séries
de 10 mesures admettent la même moyenne et la même variance. Ceci montre qu'on ne peut
donc pas appréhender la distribution d'une variable spatiale uniquement à l'aide
de ces notions classiques.
Il est donc nécessaire de recourir à une méthode qui analyse à la fois la localisation, la
continuité, l'anisotropie et le caractère transitif d'une telle variable. Pour ce faire,
on retient pour hypothèse que les valeurs prises par une variable régionalisée sont une
réalisation particulière d'une fonction aléatoire stationnaire douée d'une fonction
d'auto-corrélation. Cette fonction aléatoire F (x) est définie par :
- son espérance mathématique (ou moyenne) : m (x) - E (F(x)),
- sa variance V(x) = V (F(x)),
- sa covariance C(x1,x2) - E F(x1) F(x2) - m(x1) m(x2),
Avec la condition dite de stationnarité : la moyenne, la variance et la covariance sont
invariantes par translation :
- m(x) = m la moyenne de F(x) est la même en tous points,
- V(x) = v la variance de F(x) est la même en tous points,
- la covariance de F(x) dépend de la distance h qui les sépare x1 et x2 dans l’espace,
- l'accroissement F(x + h) - F(x) ne dépend que de h.
12
CHAPITRE II : LA VARIOGRAPHIE
CHAPITRE II
II. LA VARIOGRAPHIE
Pour simplifier, prenons deux points pour lesquels on connaît des valeurs y(x1) et
y(x2) de la propriété Y dans un espace géographique tel que le montre la figure ci-dessous.
Pour comparer ces deux valeurs, la façon la plus simple est d'utiliser la variance entre les
observations de ces deux sites, notée « S² ». Elle est par définition égale à :
__ __
S ² = [(Y ( x1 ) − Y )]² + [(Y ( x 2 ) − Y ]² (21)
__
où : Y est la moyenne entre ces deux observations.
Cette variance « S² », qui traduit l'importance des écarts à la moyenne, est d'autant plus grande
que les observations sont différentes et, au contraire, si elle est faible les observations sont de
plus en plus identiques. L'équation 22 peut être développée pour obtenir une autre expression
de la valeur S²:
1
S ² = [Y ( x1 ) − Y ( x2 )]² (23)
2
Cette nouvelle équation pour déterminer la variance (eq.23) peut être écrite pour tout couple
de sites. Pour cela, considérons deux sites Y(xi) et Y(xi +h) où Y(xi) représente les
coordonnées géographiques d'un des sites et « h » est un vecteur caractérisant la distance
entre les sites.
13
CHAPITRE II : LA VARIOGRAPHIE
1
S ² = [Y ( xi ) − Y ( xi + h)]² (24)
2
Calculons à présent la distance géographique séparant y(x1), y(x2), y(x3), y(x4) chacun
des points d'observation et considérons les « m » couples de point séparés par une même
distance géographique h.
On peut comme précédemment, calculer la variance des observations pour les sites pris deux
à deux. La moyenne S² de ces m variances s'écrit en employant (24) :
1 m
S² = ∑ [ y( xi ) − y( xi + h)]²
2m i =1 (25)
De manière intuitive, on conçoit que deux observations soient en général d'autant plus
semblables qu'elles sont proches géographiquement l'une de l'autre. Le calcul de S² pour
différentes distances h, va permettre de quantifier cette idée: il permet de suivre l'évolution
des écarts entre des observations en fonction de la distance qui les sépare.
- Pour toute distance h, la différence « [Y(x) -Y(x+h)] » a une variance finie, qui ne
dépend que de la distance h séparant les points.
14
CHAPITRE II : LA VARIOGRAPHIE
Quand ces deux conditions sont vérifiées, la valeur S² définie dans l'équation (25)
constitue un estimateur non biaisé de la fonction λ(h) définie en éqution (33). Cette fonction
λ(h) est nommée « variogramme ».
1 m(h)
λ ( h) = ∑
2m(h) i = 2
( y( xi ) − y ( xi + h)) 2 (28)
Intérêt du variogramme :
En étudiant l'évolution du variogramme λ(h) en fonction de la distance h séparant des couples
d'observation, on va analyser la façon dont se détériore l'information acquise en un point au
fur et à mesure que l'on s'éloigne de ce point.
La construction du variogramme est illustrée ci-dessous par des schémas établis à partir
de 8 points d'observation répartis à distance égale de 1 mètre le long d'un transect.
Figure 1. Illustration du calcul du varriogramme sur un transect de 8 points séparés par une
distance h = 1m
Exemple de calcul
Soit deux exemples (série A et série B) fictifs correspondant à des observations disposées
le long d'un transect à des intervalles réguliers de 1 mètre.
- Calculez pour chacun des exemples: la moyenne, la variance, γ (1), γ (2), γ (3) et γ(4).
- Que peut-on conclure ?
15
CHAPITRE II : LA VARIOGRAPHIE
Solution
- La moyenne A
1 1
XA=
n
∑ X i = [( 4 + 3 + 2 + 1 + 0 + 1 + 2 + 3 + 4)] = 2,22
8
- La moyenne B
1 1
XB =
n
∑ X i = [(4 + 2 + 1 + 0 + 3 + 1 + 2 + 4 + 3)] = 2,22
8
- La variance A
1 1
S A2 =
n
∑ ( X i − X ) ² = [(4 − 2,22)² + (3 − 2,22)² + (2 − 2,22)² + (1 − 2.22)² + (0 − 2.22)² + (1 − 2.22)² + ( 2 − 2.22) +
8
(3 − 2.22)² + ( 4 − 2.22)²] = 1.94
- La variance B
1 1
S B2 =
n
∑ ( X i − X )² = 8 [(4 − 2,22)² + (2 − 2,22)² + (1 − 2,22)² + (0 − 2.22)² + (3 − 2.22)² + (1 − 2.22)² + (2 − 2.22) +
( 4 − 2.22)² + (3 − 2.22)²] = 1.94
16
CHAPITRE II : LA VARIOGRAPHIE
1
2h 7 γ ( 2) = [(4 − 2)² + (3 − 1)² + ( 2 − 0)² + (1 − 1)² + (0 − 2)² + (1 − 3)² + ( 2 − 4)²] = 1.92
2*7
1
3h 6 γ (3) = [(4 − 0)² + ( 2 − 3)² + (1 − 1)² + (0 − 2)² + (3 − 4)² + (1 − 3)² = 3.08
2*6
1
4h 5 γ ( 4) = [(4 − 3)² + (2 − 1)² + (1 − 2)² + (0 − 4)² + (3 − 3)² = 1.9
2*5
- Conclusions?
• Les deux séries ont même moyenne et même variance, toutefois on constate
clairement qu’elles n'ont pas le même degré de continuité spatiale, la première série
(série A) étant nettement plus continue que la seconde (série B) (voir fig. 16).
4.5
4 Série "A"
3.5 Série "B"
3
2.5
γ (h)
2
1.5
1
0.5
0
1 2 Distance (m) 3 4
17
CHAPITRE II : LA VARIOGRAPHIE
1 45 15
2 3 γ (2,0°) = [(3 − 5)² + (7 − 2)² + (4 − 0)²] = = = 7.5
(2 * 3) 6 2
illustration de calcul
1
Parcelle de la station expérimentale de la faculté des Sciences de la Nature et de la Vie, Université de Chlef (Douaoui, 1993)
18
CHAPITRE II : LA VARIOGRAPHIE
(i) Jusqu’à un pas de 20 mètres, le variogramme est croissant. Les écarts moyens entre les
observations augmentent donc quand la distance séparant ces observations augmente. Les
observations "se ressemblent donc de moins en moins", ce qui est conforme à l'intuition.
On peut dire également que les observations sont spatialement dépendantes ou liées sur
cette distance de 20m.
(ii) Au-delà de vingt mètres, le variogramme reste quasi-constant. Quelle que soit la
distance, les écarts moyens entre les observations sont identiques. On parlera pour cette
gamme de distance d'indépendance spatiale entre les observations.
19
CHAPITRE II : LA VARIOGRAPHIE
2. Allure linéaire : γ(h) reste continue à l'origine mais n'est plus dérivable, donc
moins régulière (fig.5.b).
3. Discontinuité à l'origine : γ(h) ne tend pas vers (0) lorsque h tend vers (0), cette
discontinuité en h = 0 du variogramme est appelée effet de pépite (fig.5.c) qui est
dû : soit à la présence d'une structure dont l'échelle est très inférieure à
l'espacement des données et on parle de micro régionalisation des données, soit à
la présence d'erreurs de mesures, soit au nombre insuffisant de couples de mesures
à faible distance induisant éventuellement une incertitude sur la détermination de
l'effet de pépite.
4. Effet de pépite pur (Aléatoire pure) : c'est le cas limite du cas précèdent quand γ
(h) ne traduit plus que la seule discontinuité à l'origine (fig.5.d)
γ(h) = 0 est (h) = C0 dès que h > 0
20
CHAPITRE II : LA VARIOGRAPHIE
Cela indique que Z(x) et Z(x+ h) sont sans corrélation quelle que soit leur distance
(h) non nulle, ce type de modèle s'explique généralement par l'absence d'une
structure spatiale, plus fréquemment, par l'existence d'une structure marquée par
des erreurs expérimentales ou inférieures au plus petit intervalle d'observation.
Dans ce cas, la stationnarité d'ordre II de la variance est vérifiée. Cette longueur est
interprétée comme la distance maximale pour laquelle un point présentera une influence sur
son entourage. Cette valeur donne la distance au-delà de la quelle elles sont indépendantes
(fig.6a, 6b et 6c)
Dans le variogramme non borné (fig. 6d), la stationnarité d'ordre II n'est pas vérifiée et
le variogramme continu à croître sans atteindre un palier. Voltz (1986) donne trois
interprétations possibles :
- Le palier n'a pas atteint la portée à l'échelle de notre travail (l’espace étudié)
- La variance infinie représentative d'une variable régionalisée respectant
l'hypothèse intrinsèque
- La présence d'une dérive pourrait être aussi une explication à ce type de
variogramme.
21
CHAPITRE II : LA VARIOGRAPHIE
22
CHAPITRE II : LA VARIOGRAPHIE
C'est le cas d'un variogramme plat appelé pépidique (effet de pépite pûre)
* fonction puissance :
γ (h) = C0 + bhα………………………………………(33)
0 < α <2
* Modèle Sphérique :
γ (h) = C0 + C[3h/2a – 1/2(h/a)3]……….si h < a
γ (h) = C0 + C………………………..……...si h > a …………….(34)
* Modèle Exponentiel :
γ (h) = C0 + C[1 – exp(-h/r)]………………………………….(35)
23
CHAPITRE II : LA VARIOGRAPHIE
modèle linéaire
modèle pépitique
semi- variance
fonction puissance
1,8
fonction puissance
0,2
fonction puissance
0,5
0 0,5 1 1,5 2
Distance h
Figure 7 : Modèles croissants d'ajustement à des variogrammes : linéaire, pépitique et
fonction puissance de l'ordre 1.8, 0.5 et 0.2
semi- variance
modèle sphérique
modèle exponentiel
Distance h
24
CHAPITRE II : LA VARIOGRAPHIE
Direction principale
d’anisotropie
Figure 10. Exemple d’un variogramme surfacique montrant la présence d’une anisotropie
selon une direction principale
25
CHAPITRE II : LA VARIOGRAPHIE
Bien que dans la nature il existe une très grande variété d'anisotropies, en
géostatistique, on ne peut modéliser aisément que les anisotropies géométriques.
- Les portées maximales (ag) et minimales (ap) s'observent selon deux directions
orthogonales. Ce qui forme une ellipse (fig.11a).
Figure 11. (a) ellipse formé par ag et ap ; (b) variation de de la porté du variogramme
dans le cas d’une anisotropie géométrique
Pour rendre les portées identiques (et égales à ag suivant toutes les directions en multipliant la
composante de la portée parallèle à ap par le facteur (ag/ap). Bref, les portées décrivent une
ellipse dont l'axe majeur est orienté parallèlement à ag.
( aθ cos θ )² ( aθ sin θ )²
+ =1 (36)
aθ2 a 2p
Connaissant ag et ap, on peut trouver aƟ, où Ɵ désigne l'angle mesuré par rapport à la direction
où est rencontrée la potée ag (la direction privilégiée).
ag a p
aθ =
{a 2
p cos ²θ + ag2 sin ²θ } 0.5 (37)
On peut ainsi évaluer γ (h, Ɵ) soit en utilisant aƟ , soit en corrigeant la distance h pour tenir
compte de l'anisotropie et on aura :
γ (hƟ, Ɵ) = γ(hg)
Avec hg calculé comme suit :
26
CHAPITRE II : LA VARIOGRAPHIE
2
a
hg = (hθ cosθ )² + g hϑ sin θ (38)
a
p
Exemple
Un gisement 2D est modélisé par un modèle avec anisotropie géométrique. Le modèle est
sphérique avec C=17%2 et effet de pépite C0=13%2 et les portées sont de 100m dans la
direction de la plus grande continuité (30o) et de 60m dans la direction de la plus petite
continuité (120o).
- Quelle est la valeur du variogramme entre deux observations situées aux coordonnées
(x1,y1)=(10,30) et (x2,y2)=(40,20)
Solution
On peut résoudre le présent problème par deux méthodes :
- Première méthode :
On calcul la distance séparent les deux points et la direction qui les définissent :
y2 − y1 (−10)
θ = arctan = arctan = −18.43°
x2 − x1 (30)
Cette direction forme un ange de 48.43° (30° -(-18.43°) = 48.43°) avec la direction de la plus
grande continuité. On calcul la portée dans cette direction aƟ (éq. 40)
100 * 60
aθ = =70.8m
{(60)² * cos ²(48.43) + (100)² * sin ²(48.43)}0.5
On calcule la valeur du variogramme en utilisant l’équation du modèle sphérique (eq.37) pour
la distance calculée plus haut (31.63 m) et avec la portée 70.81m :
31.63 31.63
3
γ (31.63) = 13%² + 17%² * 1.5 * − 0.5 = 23.63%²
70.81 70.81
- Deuxième méthode
Elle consiste à calculer la distance équivalente dans la direction de meilleure continuité
avec la formule précédente, où Ɵ représente l’angle entre la direction de meilleure
continuité et la direction définie par les deux points (48.43°).
On calcul donc hg en employant l’équation (41) :
2
100
hg = [31.63 * cos( 48.43)] +
2
* 31.63 * sin( 48.43) = 44.65m
60
27
CHAPITRE II : LA VARIOGRAPHIE
Etant donné que : γ (hƟ, Ɵ) = γ(hg), on calcul la valeur du variogramme en utilisant l’équation
du modèle sphérique (éq.37) pour la distance 44.65 m et avec la portée ag = 100m :
44 . 65 44 . 65
3
γ (44.65) = 13%² + 17%² * 1.5 * − 0.5 = 23.63%²
100 100
II.5. Stratégie pour le calcul de variogrammes et l’ajustement des modèles
Pour le calcul et l’ajustement des variogrammes il faut tenir compte des points suivants :
- On accorde plus de poids aux points du variogramme expérimental calculés avec
beaucoup de paires.
- On essaie d’avoir un nombre de couple supérieur à 30 minimum (idéal 50 couples)
pour chaque point expérimental du variogramme. Si ce n’est pas possible pour
certaines classes, on accorde moins d’importance à ces points. Si le nombre de
paires est très faible, on ne considère plus du tout le point.
- On accorde plus de poids aux premiers points du variogramme (h petit) car ce
sont ces valeurs qui ont le plus d'impact dans les calculs géostatistiques.
- Lorsque « h » dépasse environ dmax/2, on ne tient pas compte des valeurs du
variogramme. (dmax est la taille du phénomène étudié dans la direction considérée).
- On cherche à obtenir des modèles les plus simples possible qui rendent bien compte
des valeurs expérimentales.
II.6. Exercices
1. On vous donne 2 portions de forage sur lesquelles sont indiquées les teneurs d’un
polluants du sol (en ppm) pour des carottes séparées de 3m. les 2 forages sont espacés de 9m
de centre à centre (le dessin n’est pas à l’échelle).
2. La figure suivante montre les mesures du pH du sol sur une carotte de 20 cm de profondeur
en certains points.
28
CHAPITRE II : LA VARIOGRAPHIE
b) Soit deux points espacés de 20m et définissant un azimut de 43°. Quelle est la
covariance entre ces deux points?
c) Les données ayant servi au calcul des variogrammes ont été obtenues à partir
d’une procédure analytique assurant une bonne précision. Quelle serait la
conséquence sur le variogramme d’utiliser une procédure d’analyse moins
précise ?
29
CHAPITRE III : ESTIMATION D'UNE TENEUR PONCTUELLE (KRIGEAGE)
CHAPITRE III
III.1. Introduction
Le krigeage, le deuxième outil de la géostatistique, est une méthode d’interpolation
applicable à des données spatiales et qui consiste a estimé la teneur ponctuelle de la variable
étudiée en des sites non échantillonnés. La théorie du krigeage a été développée par un
mathématicien français G. Matheron, école des Mines de Paris au début des années 1960 (voir
chapitre III), à partir des travaux de l’ingénieur minier sud-africain D. G. Krige. En effet,
durant les années 50, Krige a développé une série de méthodes statistiques empiriques afin de
déterminer la distribution de minerais à partir d’un ensemble de forages. Pour rendre
hommage à D. Krige, Mathéron a nommé ce deuxième outil de la géostatistique par le
« Krigeage ». Il existe plusieurs types de krigeages, nous allons exposer, dans le cadre de ce
chapitre, le krigeage ordinaire (KO) et le krigeage simple (KS)
La forme la plus simple et la plus employée de cette technique est celle du krigeage
linéaire. L'estimation y*(x0 ) faite en un point x0 par le krigeage linéaire est telle que:
n
Y * ( x0 ) = ∑ λiY ( xi ) (37)
i =1
Ou : n est le nombre expérimentaux pris en compte dans l’estimation
λi est le poids affecté au point expérimental xi
30
Plus simple, pour résoudre le système d’équation induit par la recherche des poids λi , il
faut introduire les conditions d’optimisation. Ces conditions sont les suivantes :
- non biais
E[Y * ( x ) − Y ( x )] = 0 (38)
- variance d’estimation minimale
VAR[Y * ( x) − Y ( x)]minimale (39)
Le problème à résoudre pour estimer la valeur d'une propriété Y consiste donc à calculer le
poids λi affecté à chaque point observé.
Quand l'hypothèse intrinsèque est vérifiée (Chapitre IV), l'ajustement d'une fonction
autorisée au variogramme expérimental permet de résoudre le système défini par les équations
42, 43 et 44. De la sorte, on peut calculer les poids λi de l'équation 42 et donc la valeur de
l'estimation Y*(x0).
On indique, en chaque point observé, le poids qu'il prend dans l'estimation avec trois
types de variogrammes différents.
- Cas (A), le variogramme est de type pépitique indiquant une distribution aléatoire de la
variable dans l'espace. Il n'y a donc pas lieu de privilégier dans l'estimation les points
proches par rapport aux points éloignés. Les poids affectés à l'ensemble des points
observés sont donc identiques. L'estimation consiste dans ce cas à faire une moyenne
locale.
- Cas (B), le variogramme est de type linéaire croissant. Les points proches du point à
estimer sont donc beaucoup plus corrélés au point à estimer que les points éloignés. De ce
fait, les quatre points situés à une distance "1" du point à estimer sont prépondérants dans
l'estimation: ils se voient attribuer 88 % du poids total.
- Cas (C), le variogramme est de type exponentiel avec une portée de l'ordre de 2. Le poids
affecté aux points observés est donc maximal pour les points distants de "1" et minimal
31
pour ceux distants de "3". Mais pour une distance de "1", la valeur de la semi-variance est
déjà importante, de l'ordre de 75 % de celle observée au palier. Entre les distances "1" et
"3", le niveau de corrélation entre les points observés et le point à estimer varie donc
relativement peu. Ceci explique que les poids sont proches les uns des autres dans ce cas
de figure.
Figure 12. Poids affectés (* 100) aux points observés dans l'estimation par krigeage en un point de
coordonnées (0,0). Trois situations sont présentées:
A: Le variogramme est de type pépitique: λ (h ) = 0,079
B: Le variogramme est linéaire croissant: λ (h ) = 0.05h
C: Le variogramme est exponentiel: λ (h ) = 0.79 (1- exp(-h/0.7))
32
III.3. Le krigeage simple
Comme pour le krigeage ordinaire, l’idée est de choisir les λi de façon à minimiser la
variance d’estimation σ e . Pour cela, il faut trouver le minimum, on dérive σ e2
2
par rapport à
chacun des valeurs de λi et l’on pose ces dérivées partielles égales à 0.
N.B : En règle générale, l’estimation par Krigeage ordinaire est préférable au krigeage simple
car elle beaucoup plus fiables
33
V.5. La variance d'estimation
Il est indispensable de disposer d'une grandeur indiquant la précision des estimations
faites. Cette grandeur est fournie en un point x0 par la variance d'estimation σ e2 ( x0 )
La résolution des équations (42), (43) et (44) conduit à une écriture de la variance
d'estimation telle que:
n
σ = ∑ λiγ ( xi , x0 ) + ψ
2
e (42)
i =1
34
Exemple :
Si l'utilisateur cherche à estimer la Conductivité électrique du sol (CE) avec une précision de
± 0.1 dS/m et que l'intervalle de confiance lui indique une précision de ±0.5 dS/m, ses
exigences de précision ne sont pas satisfaites. La solution passe alors en règle générale par un
échantillonnage supplémentaire.
- le krigeage disjonctif: l'estimation d'un point à estimer se fait par une fonction plus générale
qu'une simple combinaison linéaire des valeurs aux points observés. Cette technique permet
de tracer des cartes de probabilité qu'une variable dépasse un seuil donné. Elle est donc
souvent utilisée dans des problèmes de pollution.
- le co-krigeage: il exploite la corrélation pouvant exister entre deux variables. Il est utilisé
quand on dispose de deux variables corrélées entre elles, l'une étant difficile à acquérir (par
exemple, mesure physique de laboratoire), l'autre étant facile d'accès (par exemple,
observation de terrain). Le co-krigeage permet de cartographier une variable peu
échantillonnée en utilisant les observations plus nombreuses d'une variable facile d'accès. Un
exemple d’emploi est la cartographie d’une propriété du sol en se fondant sur ses corrélations
avec la topographie déduite d’un Modèle Numérique de Terrain.
35
III.7. La validation croisée
La validation croisée consiste à enlever un nombre de points Parmi les points
échantillonnés, pour faire la validation des méthodes de krigeage Ces points ne sont pas
introduits dans le calcul des variogrammes et d'estimation par krigeage, mais ils sont, pour
toutes les variables confondues, estimés en leurs localisations à partir d'autres points mesurés,
ce qui permet de comparer les valeurs de variables mesurées Y(.) à celles estimés Y*(.). Les
critères retenus pour cette validation sont :
• L'erreur moyenne (EM) : elle doit être proche de zéro pour qu'il n'y ait ni surestimation, ni
sous-estimation systématique. Elle est calculée par la formule suivante :
1 n
EM = ∑ (Y * ( xi ) − Y ( xi )) (49)
n i =1
• La racine quadratique de l'erreur moyenne (RQEM) : elle est calculée par la formule (50),
autant sa valeur est faible, autant l'estimation est bonne.
n
1
RQEM =
n
∑[Y * ( x ) − Y ( x )]²
i =1
i i (50)
• L'erreur standardisée moyenne (ESM) : qui est le rapport entre l'écart quadratique et la
variance d'estimation, elle vérifie la précision de l'estimation de l'écart type d'estimation.
Les meilleurs résultats sont obtenus lorsque sa valeur est proche de 1.
1
∑ [Z * ( x ) − Z ( x )]²
i =1
i i
ESM = (51)
n σ ( xi )
• La racine de l'erreur standardisée quadratique moyenne (RQESM) : on aura une sous-
estimation si sa valeur est inférieure à 1, et dans le cas contraire une surestimation. Elle est
calculée par la formule suivante :
n
1
∑ [Z * ( x ) − Z ( x )]²
i =1
i i
RQESM = (52)
n σ ( xi )
III.8. Exercices
1. On vous présente les six profils suivants obtenus par krigeage ordinaire avec des
modèles différents et en utilisant les observations indiquées par des ∆ .
36
a) Associez à chaque modèle de variogramme le profil de krigeage correspondant (A à F)
N Modèle Figure
1 Sphérique C0/C = 0 ; a = 50
2 Sphérique C0/C = 0.1 ; a = 50
3 Sphérique C0/C = 1.0 ; a = 50
b) À la question précédente, seul le ratio C0/C est fourni au lieu des valeurs séparées de
C0 et C. Qu’est-ce quichange dans le krigeage si le ratio C0/C=1 est obtenu avec
C0=10,C=10 plutôt que C0=5 et C=5?
b) Est-il possible d’avoir les poids λi , i=1...n, de krigeage ordinaire(KO) tous égaux à
zéro? Si oui, indiquez dans quelle situation. Si non, dites pourquoi.
3. Soit les points X0 (0,1), X1 (1,0) , X2(0,0) et X3(3, 0) sur les quelles on a mesuré la
propriété Z dont les valeurs sont comme suit : Z1 = 9 ; Z2 = 9 et Z3 = 4 (voir figure ci-
dessous
37
- On cherche à estimer la propriété Z0 sur le point x0 (0,1)
On suppose que la variable Z possède un variogramme sphérique avec :effet de pépite
C0 =1 ; un pallier C=1 et une portée a = 3.
38
CHAPITRE IV : LE KRIGEAGE D’INDICATRICES
V.1. Introduction
Le krigeage d’indicatrices (KI), initié par Journel (1983), a été développé
mathématiquement (Davis, 1984 ; Cressie, 1991 ; Bierkens et Burrough, 1993). L'idée de base
du krigeage d'indicatrices consiste à effectuer l'analyse spatiale non pas directement de la
propriété étudiée, mais des différentes fonctions dites « indicatrices » issues d'un codage
binaire de cette propriété. La transformation en une variable indicatrice avec une distribution
binaire se fait comme suit:
1 if Z(xi ) ≥ Z c
I ( xi , Z c ) = i = 1,......., n (42)
0 if Z(xi ) < Zc
Où, I (xi; Zc), est la valeur indicatrice à un emplacement xi ; Z (xi) est la valeur mesurée à un
emplacement xi, et Zc est le seuil. La valeur I (xi ; Zc), conditionnelle à n données environnant,
peut être exprimée comme suit :
E[ I ( xi ; Z c ) = Pr ob{Z ( x) ≤ Z c ] = F ( xi ; Z c ) (43)
39
CHAPITRE IV : LE KRIGEAGE D’INDICATRICES
Cette dernière formule appliquée donne des valeurs comprises entre 0 et 1 qui est une
estimation en un point donné de la probabilité que la valeur Zi soit inférieure ou égale à
la valeur seuil «Zc » choisie. En combinant ces estimations, on peut obtenir en tout point
la probabilité que la variable soit égale à une valeur seuil déterminée.
40
CHAPITRE IV : LE KRIGEAGE D’INDICATRICES
41
CHAPITRE V : LA GEOSTATISTIQUE MULTIVARIE
V.1. Introduction
La géostatistique multipamétrique est une méthode consiste à cartographier les valeurs des
coordonnées des individus sur l'axe d'ACP1 ou AFD2 pris en considération, elle permet de
dégager un fond régional des mesures, c'est à dire la tendance en grand de la zone d'étude
(Goulard & al., 1987 ; Douaoui, 1993). Les valeurs des coordonnées seront considérées
comme étant des variables régionalisées dont on détermine leur structure spatiale par l'étude
du variogramme.
La structure des données de base est formée d’un espace géographique et d’un espace
factoriel, constituant ensemble les 348 variables régionalisées (Tab. V.1).
Tableau n° V.1. Structure des données de base relative aux variables régionalisées
1
ACP : Analyse en Composante Principale (voir cours statistique appliquée)
2
AFD : Analyse Factorielle Discriminante (voir cours statistique appliquée)
- par sa valeur relative à sa projection dans l’un des axes factoriels issu de
l’ACP ou de l’AFD. C’est la variable qui caractérise chacun des sondages du
sol.
Voir chapitre II
- 43 -
- 44 -
BIBLIOGRAPHIE
BIBLIOGRAPHIE
ALLARD D. (2012). Statistiques spatiales : introduction à la géostatistique. Cours Université
Montpellier II (France). 42P.
BAJJALI W.(2018). ArcGIS for Environmentaland Water Issues. Ed. Sringer. 363p
https://doi.org/10.1007/978-3-319-61158-7
BOSSER P. (2012). Interpolation Spatiale. Cours de l’Ecole Nationale Des Sciences Géographiques
(ENSG)- France. 53P
BURGESS T.M. et WEBSTER R. (1980a) - Optimal interpolation and isarithmic mapping of soil
properties. I. The semi-variogram and punctual kriging. J. of Soil Sci., 31: 315-331
BURGESS T.M. et WEBSTER R. (1980b) - Optimal interpolation and isarithmic mapping of soil
properties. II.Block kriging. J. of Soil Sci., 31: 333-341
CRESSIE N. (1991) - Statistics for spatial data. Wiley Series in Probability and Mathematical
Statistics. John Wiley and Sons, 900 p.
DELHOMME J.P. 1976. Application de la théorie de la variable régionalisée dans la science de l'eau.
Thèse Doc. Ing.. ENSM de Paris. 130P
DOUAOUI A., 1993. Variabilité spatiale de quelques propriétés physico-chimiques des sols du moyen Chéliff,
incidences cartographique. Thèse Magist., INA Alger. PP 22 – 97
GOOVAERTS P. (1999) Geostatistics in soil science: state-of-the-art and perspectives. Geoderma 89,
1-46.
62
BIBLIOGRAPHIE
GOOVAERTS, P. 1997. Geostatistics for natural resources evaluation. Oxford University Press New
York, 483 p.
JOURNEL A.G., 1977. Géostatistique minière. Centre de géostatistique. Ecole des mines;
Fontainebleu. 737 P
MARSMAN B.A. et GRUIJTER De J.J (1986) - Quality of soil maps. A comparison of soil survey
methods in a sandy area. Soil Survey Papers n° 15, Stiboka, Wageningen
MATHERON G. (1965) - Les variables régionalisées et leur estimation. Paris. MASSON 305 p.
McBRATNEY A.B. et WEBSTER R. (1981a) - The design of optimal sampling schemes for local
estimation and mapping of regionalized variables. I. Theory and method. Computers and
Geosciences, Vol.7(4), 331-334.
OLEA R. (1999) Geostatistics for Engineers and Earth Scientists. Kluwer, 328 p.
OLIVER M.A. et WEBSTER R. (2015). Basic Steps in Geostatistics: The Variogram and Kriging.
Ed. Springer. DOI 10.1007/978-3-319-15865-5
SAMARA D.D. (2002).Geostatistics with Applications In Earth Sciences, Second Edition. Ed.
Springer. ISBN 978-1-4020-9380-7 (e-book). 220p
SITES WEBS
SITES INTERNET
- du Centre de Géostatistique de l’Ecole des Mines : http://www.cg.ensmp.fr/
- du Stanford Center for Reservoir Forecasting : http://ekofisk.stanford.edu/SCRF.html
- de la liste AI-GEOSTAT : http://www.ai-geostats.org/
- de la revue Computer and Geosciences : http://www.iamg.org/candg.html
- du Centre d’Agriculture de Précision de l’Université de Sydney :
http://www.usyd.edu.au/su/agric/acpa/
63