Cours de Geostatistique Drias Partie 1

« Master I Hydrogéologie » Cours de géostatistique / Dr Drias T
I- NOTIONS GENERALES
I.1 : Définition :
La géostatistique est l’application de la théorie des variables régionalisées à

l’estimation des phénomènes régionalisés.
- Par phénomène régionalisé nous entendons un phénomène naturel qui se déploie

dans l’espace. Il s’agit le plus souvent de notre espace géographique à 1, 2 ou 3
dimensions ; mais il peut s’agir aussi du temps.
La géostatistique consiste à étudier les phénomènes corrélés dans l’espace, au moyen

d’un outil probabiliste : “ la théorie de variables régionalisées ”.
 Le but initial de la géostatistique est donc d’estimer (prédire, évaluer) la

répartition de ces variables régionalisées dans un espace connu.
 Typiquement, on ne connaît que les mesures de la variable en certains points

(stations de mesure) ou le long de lignes, mais on dispose également d’une
information qualitative importante (géologie, conditions d’échantillonnage,
expérience…).
Le terme Variable régionalisée, a été choisi par Matheron (1965, 1970) pour souligner
les deux aspects apparemment contradictoires de ce type de variable :
- un aspect aléatoire, qui explique les irrégularités locales `
- et un aspect structuré, qui reflète les tendances du phénomène à grande échelle.
Les modèles statistiques courants d’analyse de tendance concentrent l’aspect aléatoire

dans le terme correctif et l’aspect structuré dans le terme déterministe.
Malheureusement, cette dichotomie n’est pas réaliste pour les phénomènes
géologiques.
Une meilleure façon de représenter la réalité est d’introduire l’aspect aléatoire par le
biais de termes de fluctuation autour d’une surface fixée que nous appellerons
désormais dérive pour éviter toute confusion avec le terme tendance. Les fluctuations
ne sont pas des erreurs, mais bien des traits du phénomène à part entière, possédant
une structuration qui lui est propre. La première étape dans une étude géostatistique
consiste à identifier cette structure, le nom d’analyse structurale. Par la suite, le
géostatisticien peut résoudre plusieurs types de problèmes, comme l’estimation ou la
Simulation
1.2 : Fonction Aléatoire :
La valeur observée à chaque point de donnée x est considérée comme la réalisation

z(x) d’une variable aléatoire Z(x). Sa moyenne au point x est notée m(x). Aux points
où, aucune mesure n’a été réalisée, les valeurs z(x) sont bien définies, même si elles
sont inconnues. En peut également les concevoir comme étant les résultats (ou
réalisations) des variables aléatoires correspondantes Z(x). En termes mathématiques,
1
la famille de toutes ces variables aléatoires est une fonction aléatoire (ou processus
stochastique, champ aléatoire). La relation entre une fonction aléatoire et une de ses
réalisations est la même que la relation entre une variable aléatoire et un de ses
tirages, si ce n’est que la réalisation d’une fonction aléatoire est une fonction
ordinaire, alors que le tirage d’une variable aléatoire est un nombre.
Une fonction aléatoire est caractérisée par sa loi spatiale, c’est-à-dire par l’ensemble
des lois simultanées de tout jeu de variables Z(x1), Z(x2), ..., Z(xk), pour tout k, et pour
tout point xI, x2, ..., xk. Bien entendu, il serait impossible de faire quoi que ce soit avec
ce modèle sans faire d’hypothèses sur les caractéristiques de ces lois. En particulier,
dans la mesure où, une seule réalisation est disponible, nous devons faire des
hypothèses concernant sa stationnarité. En rencontre le même problème avec les
variables aléatoires.
que pourrait-on dire d’une variable aléatoire sur la seule base d’une réalisation
1.3. Hypothèse de stationnarité et intrinsèque
Une fonction aléatoire est stationnaire, au sens strict si la loi spatiale (la variance
des incréments) est invariante par translation du vecteur h, de la même manière, une
fonction aléatoire stationnaire se répète elle-même dans l’espace. Dans ce cas les deux
variables aléatoires vectorielles à k composants :
(Z(x1), .....,Z(xk)) et (Z(x1+ h),....,Z(xk+ h)) présentent la même loi de distribution à k variables,
quel que soit le vecteur translation h. Cette hypothèse permet de résoudre le problème
posé par
l’inférence statistique, car à partir d’une réalisation on peut obtenir

plusieurs. Sous l’hypothèse que les incréments sont stationnaires, on a :
ar ((x + h) − (x)) = E(|(x + h) − (x)| 2 ) ∀ x (Équation 10)
Il existe différents degrés de stationnarité, selon le ou les moments qui existent. On

parle de stationnarité d’ordre 1 quand l’espérance E (Z(x)) de la variable z existe est
reste constante sur tout le domaine étudié.
4u= E((x)) ∀ x (Équation 11)
On parle de stationnarité d’ordre 2 si la covariance (((x + h), (x)) est fonction

seulement du vecteur h qui sépare les points(((x + h), (x)). On aura :
((x),(x + h)) = E[((x + h) − 4u)((x) − 4u)] x (Équation 12)
11
2
Dans son sens le plus strict, la stationnarité nécessaire que tous les moments soient
invariants par translation, mais comme cela ne peut être vérifié avec un nombre limité
de données expérimentales, on se contente généralement de demander que les deux
premiers moments (la moyenne et la covariance) soient invariants par translation. On
parle alors de stationnarité faible ou d’ordre 2.
Des fonctions aléatoires dont les incréments sont stationnaires d’ordre deux et de
moyenne nulle sont réputés satisfaire l’hypothèse intrinsèque, ce qui par abus de
langage a été qualifié de stationnarité intrinsèque dans la littérature statistique.
La fonction aléatoire Z(xi) est très souvent modélisée sous une hypothèse de
stationnarité de second ordre ou de stationnarité intrinsèque. C’est l’hypothèse la plus
courante, laquelle est définie pour des fonctions aléatoires stationnaires d’ordre deux
de moyenne μ (Wackernagel, 2004). Z(xi) étant la fonction aléatoire représentant la
variable étudiée. Elle est dite intrinsèque si :
- L’espérance mathématique existe et ne dépend que du point x : E ((x)) = 4u, ∀ x
- Pour tout vecteur h, l’accroissement ((x + h) − (x)) aura une variance finie qui ne
dépend pas de x.
De la sorte, la moyenne est constante à travers le domaine d’intérêt et la structure

de dépendance spatiale (covariance ou variogramme) entre deux emplacements ne
dépend que du vecteur de distance les séparant.
L’existence et la stationnarité de la covariance impliquent l’existence et la

stationnarité de la variance. En effet :
ar ((x)) = E(|(x) − 4u| 2 ) = (0) ∀ x (Équation 13)
Mais certains phénomènes physiques présentent une capacité de dispersion

illimitée, c'est-à-dire qu’ils ne présentent ni covariance ni variance à priori finie. Pour
les traiter, il convient de considérer leur accroissement ce qui conduit à l’hypothèse
intrinsèque qui ne suppose que l’existence du variogramme.
12
3
II : Analyse structurale :
II.1- Variogramme expérimental
Nous allons mesurer la variabilité à différentes échelles d’une variable régionalisée

z(x) tout simplement en calculant une mesure de dissemblance entre deux données z1
et z2 situées en deux points x1 et x2 d’un domaine spatial.
Cette dissemblance entre deux valeurs, désignée par γ vaudra :
C’est-à-dire la moitié du carré de la différence entre deux valeurs.
On fait dépendre la dissemblance γ de la distance et de l’orientation d’une paire de

points, décrits par le vecteur h = x2 - x1, indifféremment de la position de la paire dans
le domaine étudié
En formant la moyenne des dissemblances γ entre valeurs pour toutes

les nh paires de points reliées par un vecteur h donné pour une maille donnée
(avec, le cas échéant, une certaine tolérance sur la longueur et l’angle du
vecteur), on obtient la notion de variogramme expérimental
Habituellement on observe que la dissemblance des valeurs augmente en moyenne en

fonction de l’éloignement spatial des points de mesure et atteint fréquemment un
palier de variation aux grandes distances. Lorsque la pente du variogramme change
abruptement, on peut penser à des paliers intermédiaires.
Le comportement aux très petites échelles, près de l’origine du variogramme, est

d’une importance capitale, car il est un indicateur du degré de continuité de la variable
régionalisée, à savoir: différentiable, continue mais non différentiable, ou carrément
discontinue. Dans ce dernier cas on aura affaire à une variable régionalisée donnant
lieu à un effet de pépite, symptôme de valeurs changeant abruptement à très petite
échelle par rapport à la maille, comme les teneurs de l’or lorsqu’il y a des pépites.
Lorsque la dissemblance moyenne des valeurs est constante pour toutes les distances
jhj, il y a une absence complète de structuration spatiale des valeurs. A l’inverse, une
pente non nulle du variogramme près de l’origine indique une structuration des
données. Un changement soudain de la pente du variogramme indique le passage à
une structuration des valeurs de nature différente.
4
Ces transitions seront d’abord modélisées par des variogrammes gigognes, puis les
différents types de structuration spatiale des valeurs pourront être visualisés
séparément sous forme de cartes en effectuant le krigeage de composantes spatiales.
Exercice. Suite à l'exercice qu'on a effectué dans la classe (cas d'une seule
dimension), maintenant on va calculer le variogramme dans deux directions
orthogonales. Calculer le variogramme expérimental suivant les deux axes principaux
"Est-Ouest et Nord-Sud" pour une distance (h= 5, h=10).
II.2- Variogramme théorique :
Le variogramme théorique γ (h) est défini par l’hypothèse intrinsèque. L’hypothèse

intrinsèque est formée de deux conditions sur les accroissements Z(x+h) - Z(x) de la
fonction aléatoire:
- La moyenne des accroissements est invariante pour toute translation du

vecteur h dans le domaine. Plus spécifiquement, la moyenne des
accroissements est supposée nulle, quelle que soit la position de h dans le
domaine.
- La variance des accroissements admet une valeur finie en fonction de h
et indépendante de la position de h dans le domaine.
C’est-à-dire,
ce qui donne le variogramme théorique
2
1
2

 h  varZ  x   Z  x  h    Z  x   Z  x  h 
1 2

L’existence de l’espérance des accroissements d’une fonction aléatoire intrinsèque
n’implique pas celle de l’espérance de la fonction aléatoire. Une fonction aléatoire
intrinsèque peut avoir une variance infinie, tout en ayant une variance des
accroissements finie pour tout vecteur h.
La fonction de covariance C(h) est définie sur la base de l’hypothèse de stationnarité

des deux premiers moments, moyenne et covariance, de la fonction aléatoire.
5
La covariance entre Z  x  et Z  x  h  ne dépend que de h
CovZ  x , Z  x  h   C h  ; stationnarité du second ordre, C h  est appelé

fonction de covariance ou covariogramme.
Le variogramme  h  ne dépend pas de la localisation x , seulement de h (soit en module,

soit en module et en direction).
II-2-1- LA FORME DU VARIOGRAMME :
La forme du variogramme indique les propriétés structurales

structurales de la série, l’éch
l’échelle des
changements.
6
La figure ci-dessus montre des modèle de variogrammes. "a" et "b" montrent

l’existence d’un gradient."c" et "d" variance à l’origine. ."c" indique l’intervalle
(portée) à partir duquel il y indépendance entre les stations. d observations
indépendantes.
Par ordre d’irrégularité croissante on distinguera :
a)- L’allure parabolique :
Qui caractérise une variable extrêmement régulière (très lissée). La variable est
dérivable en moyenne quadratique. Plus les points sont éloignés et plus les différences
sont progressivement accentuées. Il y a donc un fort gradient.
b)- La forme linéaire : Qui représente une variable un peu moins régulière et non
dérivable.
c) - Le variogramme dit à effet de pépite :
h = 0 est toujours estimée en extrapolant la tendance générale de la fonction.

Cependant si on dispose de plusieurs mesures instantanées entre valeur peut être
obtenue par la variance de celles-ci. Si cette valeur est nulle cela sous entend que le
processus est régulier, et que la mesure n’est pas entachée d’une variabilité
instrumentale ou de l’effet de la micro distribution.
d) - L’effet de pépite pur :
Dans ce cas la fonction fluctue d’une valeur constante ce qui signifie qu’il y a
indépendance totale des observations. En principe, seules des variables ayant cette
propriété sont susceptibles d’être traitées par l’inférence statistique. Notons ici que
lorsqu’il n’y a aucune dépendance entre des observations, faire une cartographie à
base d’interpolation n’a pas plus de sens que de tracer une régression non
significative.
II-2-2- LA MODELISATION DU VARIOGRAMME :
II-2-2-1- MODELES SANS PALLIER :
a) -LE MODELE LINEAIRE :
Il suffit d’établir la régression linéaire de la forme :  h   ah  c
Le modèle de Wijsian (linéarité du variogramme en fonction du logarithme de h).
Le modèle s’écrit :  h   aLnh   c
les estimation de a et c sont faites de la même manière que précédemment : la pente

de la droite donne le coefficient a.
7
II-2-2-2- MODELES AVEC PALLIER :
a) - LE MODELE SPHERIQUE :
On peut montrer que le pallier d’un variogramme est égal à la variance totale de la
série car en effet varZ  x  h   Z  x  devient égal à varZ  x  h   varZ  x 

1 1
2 2
A partir du moment où Z  x  h  et Z  x  deviennent indépendants entre eux ( au

au-
delà de la portée). Cette propriété sera utilisée largement lors de l’adaptation de
modèles.
Le modèle sphérique est correct pour des courbes ayant l’allure (plus bruitée en
pratique) de celle de la figure (effet de pépite). Le modèle se définit par 3 paramètres,
C , C0 et a (la portée) :
 1 h 1 h3 
 h   C   3
 C0 sih a
2 a 2 a 
 h   C  C0 sih  a
 0  0
on commence par ajuster une tangente à l’origine de la courbe afin de définir C0 la

valeur de pépite. La pallier du variogramme est égal à la variance classique. Cela
définit C  C0 . La tangente à l’origine intercepte la pallier à une distance égale à 2/3
de a. Cette méthode simple peut valablement remplacer une estimation par les
moindres carrés non linéaires.
Exemple : David 1977. Quantités de molybdène.
8
La tendance à l’origine donne un effet de pépite C  0.1 . La variance des

échantillons est connue et égale à 0.81, ce qui définit le pallier, C  C0 , d’où C =0.71.
Finalement la tangente coupe le plateau pour h=400 d’où la portée est donc de 400 X
3/2 = 600. L’équation est :
  h   h3  
 h   0.711.5   0.5   0.1sih  600
3 
  600   600 
 h   0.81
 0  0
b) - LES MODELES THEORIQUES :
 3 h   1 h3 
● Le modèle sphérique :  h   C0  C1     
3 
 2 a   2 a 
● Le modèle linéaire :  h   C0  C1h
   
h
● Le modèle exponentiel :  h   C0  C1 1  e  a  
 
 
 h2 

● Le modèle gaussien :  h   C0  C1 1  e   
 a 
 
 
● Le modèle de puissance
II.3.3. Anisotropies
La continuité spatiale n'est pas nécessairement la même dans toutes les directions.
ex.
- gisement présentant une forme lenticulaire; on peut avoir une meilleure continuité selon
l'allongement principal des lentilles;
- gisement stratiforme; meilleure continuité parallèlement aux strates que perpendiculairement.
9
- placer; meilleure continuité le long des paléochenaux que perpendiculairement.

- etc.
Bien que dans la nature il existe une très grande variété d'anisotropies, en géostatistique, on ne
peut modéliser aisément que les anisotropies géométriques.
- Anisotropie géométrique
Caractéristiques :
- On observe dans diverses directions des paliers et des composantes pépitiques identiques
mais des portées différentes.
- Les portées maximales (ag) et minimales (ap) s'observent selon deux directions orthogonales.
On peut rendre les portées identiques (et égales à ag suivant toutes les directions en multipliant
la composante de la portée parallèle à ap par le facteur (ag/ap). Bref, les portées décrivent une
ellipse dont l'axe majeur est orienté parallèlement à ag.
Connaissant ag et ap, on peut trouver aθ , où θ désigne l'angle mesuré par rapport à la direction
où est rencontré ag.
- Remarques concernant le calcul de variogrammes et l’ajustement de

modèles
 On accorde plus de poids aux points du variogramme expérimental calculés avec
beaucoup de paires.
 On essaie d’avoir N(h) ≥ 30 pour chaque point expérimental du variogramme. Si ce
n’est pas possible pour certaines classes, on accorde moins d’importance à ces points.
Si le nombre de paires est très faible (≤10), on ne considère plus du tout le point.
 On accorde plus de poids aux premiers points du variogramme (h petit) car ce sont
ces valeurs qui ont le plus d'impact dans les calculs géostatistiques.
 Lorsque h dépasse environ dmax/2, on ne tient pas compte des valeurs du
variogramme. dmax est la taille du phénomène étudié dans la direction considérée.
 On cherche à obtenir des modèles les plus simples possible qui rendent bien compte
des valeurs expérimentales.
10
Stratégie de modélisation (cas 2D)
 Calculer les variogrammes directionnels selon différentes directions (ex. 0°, 45°, 90°,
135°) ainsi que le variogramme omnidirectionnel (i.e. sans tenir compte de la
direction).
 La géologie peut apporter une information précieuse dans le choix des directions et la
présence ou non d'anisotropies.
 Vérifier les critères ci-dessus : N(h) ≥ 30, h < dmax/2
 Si nécessaire, augmenter la tolérance angulaire ou le pas de calcul de façon à
augmenter N(h).
 Déterminer s'il y a anisotropie (différences de palier ou de portées qui ne peuvent
raisonnablement être imputées à des fluctuations aléatoires du variogramme). Une
bonne méthode consiste d'abord à ajuster le variogramme omnidirectionnel et de
vérifier si ce modèle est acceptable pour les différents variogrammes directionnels.
L'effet de pépite et le palier en particulier devraient être estimés à l'aide du
variogramme omnidirectionnel et gardés constants lors de l'ajustement des
variogrammes directionnels. Si les paliers changent d’une direction à l’autre, on peut
soit essayer de modéliser une anisotropie zonale, soit adopter un palier compromis,
surtout si l’ajustement est adéquat à courte distance.
 Procéder à l'ajustement d'un modèle anisotrope ou isotrope selon le cas
(habituellement par essai et erreur, bien que l'on puisse aussi obtenir ces ajustements
de façon automatique par régression (pondérée, et souvent, non-linéaire).
 Chercher à respecter la règle de la parcimonie: adopter les modèles les plus simples
possibles qui permettent un ajustement adéquat. Comparer des modèles concurrents à
l'aide de la technique de validation croisée.
Note:
 - Plus les classes sont larges, plus il y a de paires dans chaque classe, et plus le
variogramme expérimental est lisse (et donc facile à modéliser) mais moins on a de
définition pour connaître le comportement du variogramme, surtout à faible distance.
On cherche habituellement à avoir au moins trois ou quatre classes, et si possible
davantage, avant d'atteindre le palier.
 - Pour les variogrammes directionnels, plus l'angle de tolérance est grand, plus on a
de paires pour chaque point du variogramme mais moins le variogramme
expérimental permettra de déceler les anisotropies. On ne devrait pas excéder 22.5
degrés de part et d'autre de la direction considérée. On peut descendre jusqu'à 0+
degrés si les données sont abondantes et sur une grille parfaitement régulière. Une
valeur typique pourrait être de 10 degrés de part et d'autre de la direction considérée.
On spécifie le calcul du variogramme omnidirectionnel en utilisant un angle de
tolérance de 90 degrés de part et d'autre d'une direction arbitraire, le choix de la
direction n'ayant dès lors aucune importance.
11

Cours de Geostatistique Drias Partie 1

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours de Geostatistique Drias Partie 1

Transféré par

Droits d'auteur :

Formats disponibles

« Master I Hydrogéologie » Cours de géostatistique / Dr Drias T

La géostatistique est l’application de la théorie des variables régionalisées à

- Par phénomène régionalisé nous entendons un phénomène naturel qui se déploie

La géostatistique consiste à étudier les phénomènes corrélés dans l’espace, au moyen

 Le but initial de la géostatistique est donc d’estimer (prédire, évaluer) la

 Typiquement, on ne connaît que les mesures de la variable en certains points

Les modèles statistiques courants d’analyse de tendance concentrent l’aspect aléatoire

1.2 : Fonction Aléatoire :

La valeur observée à chaque point de donnée x est considérée comme la réalisation

1.3. Hypothèse de stationnarité et intrinsèque

l’inférence statistique, car à partir d’une réalisation on peut obtenir

ar ((x + h) − (x)) = E(|(x + h) − (x)| 2 ) ∀ x (Équation 10)

Il existe différents degrés de stationnarité, selon le ou les moments qui existent. On

4u= E((x)) ∀ x (Équation 11)

On parle de stationnarité d’ordre 2 si la covariance (((x + h), (x)) est fonction

((x),(x + h)) = E[((x + h) − 4u)((x) − 4u)] x (Équation 12)

- L’espérance mathématique existe et ne dépend que du point x : E ((x)) = 4u, ∀ x

De la sorte, la moyenne est constante à travers le domaine d’intérêt et la structure

L’existence et la stationnarité de la covariance impliquent l’existence et la

ar ((x)) = E(|(x) − 4u| 2 ) = (0) ∀ x (Équation 13)

Mais certains phénomènes physiques présentent une capacité de dispersion

II.1- Variogramme expérimental

Nous allons mesurer la variabilité à différentes échelles d’une variable régionalisée

C’est-à-dire la moitié du carré de la différence entre deux valeurs.

On fait dépendre la dissemblance γ de la distance et de l’orientation d’une paire de

En formant la moyenne des dissemblances γ entre valeurs pour toutes

Habituellement on observe que la dissemblance des valeurs augmente en moyenne en

Le comportement aux très petites échelles, près de l’origine du variogramme, est

II.2- Variogramme théorique :

Le variogramme théorique γ (h) est défini par l’hypothèse intrinsèque. L’hypothèse

- La moyenne des accroissements est invariante pour toute translation du

ce qui donne le variogramme théorique

La fonction de covariance C(h) est définie sur la base de l’hypothèse de stationnarité

La covariance entre Z  x  et Z  x  h  ne dépend que de h

CovZ  x , Z  x  h   C h  ; stationnarité du second ordre, C h  est appelé

Le variogramme  h  ne dépend pas de la localisation x , seulement de h (soit en module,

II-2-1- LA FORME DU VARIOGRAMME :

La forme du variogramme indique les propriétés structurales

La figure ci-dessus montre des modèle de variogrammes. "a" et "b" montrent

Par ordre d’irrégularité croissante on distinguera :

a)- L’allure parabolique :

c) - Le variogramme dit à effet de pépite :

h = 0 est toujours estimée en extrapolant la tendance générale de la fonction.

d) - L’effet de pépite pur :

II-2-2- LA MODELISATION DU VARIOGRAMME :

II-2-2-1- MODELES SANS PALLIER :

a) -LE MODELE LINEAIRE :

Il suffit d’établir la régression linéaire de la forme :  h   ah  c

Le modèle de Wijsian (linéarité du variogramme en fonction du logarithme de h).

Le modèle s’écrit :  h   aLnh   c

les estimation de a et c sont faites de la même manière que précédemment : la pente

II-2-2-2- MODELES AVEC PALLIER :

série car en effet varZ  x  h   Z  x  devient égal à varZ  x  h   varZ  x 

A partir du moment où Z  x  h  et Z  x  deviennent indépendants entre eux ( au

on commence par ajuster une tangente à l’origine de la courbe afin de définir C0 la

Exemple : David 1977. Quantités de molybdène.

La tendance à l’origine donne un effet de pépite C  0.1 . La variance des

b) - LES MODELES THEORIQUES :

● Le modèle linéaire :  h   C0  C1h

- placer; meilleure continuité le long des paléochenaux que perpendiculairement.

- Remarques concernant le calcul de variogrammes et l’ajustement de

Stratégie de modélisation (cas 2D)

Vous aimerez peut-être aussi