Vous êtes sur la page 1sur 11

1- introduction 1

1. Rappels statistiques et introduction




Variable alatoire (v.a.) : fonction dont les rsultats possibles sont connus mais dont le rsultat final
ne peut tre dtermin, priori, avant d'effectuer la mesure.

ex. : - teneur de cuivre d'une carotte de 1 m
- paisseur d'une veine minralise
- concentration d'un polluant dans l'eau souterraine
- pH de l'eau de pluie

Description d'une v.a. : sans connatre la valeur que prendra le rsultat final, on peut parfois connatre la
probabilit qu'une v.a. prenne chacun des rsultats possibles. C'est la
description la plus complte que l'on puisse faire de la v.a.

La fonction qui dcrit ces probabilits est la fonction de densit (pour les v.a.
continues; pour les v.a. discrtes, cest la fonction de masse).

Proprits : f
X
(x) > 0 , toute probabilit est positive

, lintgrale de la fonction de densit donne 1


- X
f (x) dx = 1

, probabilit que x prenne une valeur comprise


entre [a et b]
a
b
X
f (x) dx = P a X b ( )

Certaines quantits rsument les caractristiques principales de la variable alatoire.

*Mesures de tendance centrale:
- mode : x tel que f
x
(x) est maximum
- mdiane : x tel que P(X < x) = 0.5
- moyenne (ou esprance mathmatique) :
X - X
ou E [X] = x f (x) dx



*Mesures de dispersion :

-Variance :
X
2 2
= E[(X - E[X] ) ]


X
2
-
2
X
= (x - E [X] ) f (x) dx



-cart-type :
X X
=


2


-Asymtrie : E
X - E [X]

3
X

|
\

|
.
|

(
(

1- introduction 2
-Aplatissement : E
X - E [X]

4
X

|
\

|
.
|

(
(


Toutes ces quantits sont gnralement, priori, inconnues. On doit donc les estimer partir d'un ensemble
d'observations appel l'chantillon (par abus de langage, on parlera souvent des chantillons pour dsigner ces
observations).

partir de l'chantillon, on peut construire des estimateurs:

de la moyenne:
1
n

x
= x
i=1
n
i

de la variance:
1
n
(
x
- x ) =
i=1
n
i
2 2


ou
1
n - 1
(
x
- x ) =
s
i=1
n
i
2 2


de la fonction de densit : histogramme,

de la fonction de densit cumulative : courbe des frquences cumules estime par: rang
(x
x
F
(x) = P(X x)
i
)/n

Une des caractristiques importantes d'un estimateur est d'tre sans biais i.e. d'avoir la mme esprance
mathmatique que la quantit qu'il cherche valuer.

Ex. :

[ ]
E [ X ]

1
n
E
X
= X

sans biais pour
i=1
n
i
X
est
X


de mme, biais est que alors pour biais sans est
s
2
2
x
2

1- introduction 3
Passage plus d'une variable :

On peut aussi tudier et dcrire le comportement simultan de plus d'une variable alatoire.
La fonction de densit conjointe : f
xy
(x,y) donne la probabilit que, simultanment X = x et Y = y.

On a :
- - XY XY

1 2
1 2
x
x
y
y
XY
f (x, y) dx dy = 1 , f (x, y)

P [
x
X
x
, y Y y ] = f (x, y) dx dy
1
2
1
2


< < < <



Deux mesures additionnelles permettent de dcrire des caractristiques importantes de fonction de densit
conjointe.

La covariance:
Cov(X,Y) = E [ (X - ) (Y - ) ]
X Y
mesure la force du lien linaire
entre les variables X et Y.
La corrlation
XY
X Y
=
Cov(X,Y)


comme la Cov mais avec des units "normalises"

Proprits de
XY
:

-1 1
=
XY
XY aX,bY


(avec a et b des constantes quelconques )


Note :
XY
= 0 ---> absence de lien linaire
indpendance de x et y (en effet, on a indpendance ssi
f
XY
(x,y) = f
X
(x).f
Y
(y)).
Par contre, l'indpendance de X et Y --->
XY
= 0.


L'interprtation propre la gostatistique

Les v.a. sont rgionalises i.e. elles dpendent de leur localisation dans le gisement.

Z(x) Ex. Z : teneur de cuivre mesure au point x.
(ou dans un volume centr en x)

Diffrentes visions du mme gisement : G

collection infinie de valeurs ponctuelles

G
G
Z
=
1
G
Z(x) dx




1- introduction 4
Z
G
est la teneur moyenne du gisement obtenue en faisant la moyenne de toutes les valeurs ponctuelles.

collection finie de petits blocs v
G
i=1
N
v
Z
=
1
N

Z
(x)
collection finie de gros blocs V
G V
i
M
Z
=
1
M
Z x ( )
=

1


et ainsi de suite... Le gisement est donc assimil un ensemble fini ou infini (cas ponctuel) de variables
alatoires. Si on connat le comportement de la variable alatoire au niveau ponctuel (ou quasi-ponctuel) alors
on peut aussi dcrire le comportement de Z
v
, Z
V
et Z
G
.

Cette collection de variables alatoires s'appelle fonction alatoire. Le gisement en est une ralisation limite
dans le temps et dans l'espace. On cherchera caractriser Z(x) pour pouvoir dire quelque chose sur Z
v
, Z
V
et
Z
G
.


Support des observations :

Dans la pratique, Z(x) ne sera jamais mesur sur un support ponctuel mais sur un support physique
relativement trs petit par rapport la taille du gisement (disons v avec v << G). Il est de toute premire
importance de s'assurer que toutes les observations proviennent de supports identiques.

En effet, les statistiques habituelles calcules sur des supports diffrents n'ont aucun sens physique prcis.

Ex.
Z
1
Z
2
Z
3
Z
4



La teneur de la carotte entire nest pas donne par la simple moyenne arithmtique des teneurs des bouts de
carotte; i.e.:
c
i=1
4
i
Z

1
4

Z



De plus, on pourrait dmontrer que Var (Z
1
) > Var (Z
3
) > Var (Z
4
) > Var (Z
2
). Les variances sont inversement
proportionnelles aux tailles des supports.

Ex.: Sans perte de gnralit, supposons que les valeurs des teneurs de cuivre mesures dans des carottes
de 1 m ne montrent aucune corrlation d'une carotte l'autre (i.e. Cov(Z
1
,Z
1
)=0).

Supposons que l'on regroupe les carottes de 1 m en carottes de 2 m. i.e. la teneur moyenne dune
carotte de 2 mtres (Z
2
) forme de deux carottes de 1m. (Z
1
et Z
1
) est:

Z
2
=(Z
1
+Z
1
) / 2

Si on avait
1- introduction 5
Var (
Z
) = = Var (
Z
)
1
1
2
1

'
on aura maintenant
Var (
Z
) =
2
2
1
2

en effet

[ ]
Var (
Z
) = Var
1
2
(
Z
+
Z
) =
1
4
Var (
Z
) + Var (
Z
) + 2 Cov (
Z
,
Z
)
=
1
2

2 1 1 1 1 1
1
2
' '
|
\

|
.
|

1
'

S'il y a des corrlations entre les carottes, on aura quand mme Var (Z
2
) < Var (Z
1
).

On voit donc que la distribution statistique d'une v.a. est toujours dfinie en relation avec un support physique.

Quelques proprits des distributions normales et lognormales :

Normale :
Z

N ( , )
Z -

N (0 ,1)
2





Une table unique d'une N(0,1) suffit pour calculer les probabilits de toute loi normale.

La fonction de densit est:
1
2

e
-
1
2

z -
2

|
\

|
.
|

Note: La moyenne, la mdiane et le mode d'une loi normale sont gaux .

Lognormale :

Z est lognormale avec moyenne "m" et variance s
2
si ln Z ~ N (u ,
2
).

Lien entre m, s
2
et u ,
2

m = e =
m
(
e
1)
2 2

2
2
2

Inversant les relations, on obtient:




2
2
2
2
1
2
= +
|
\

|
.
|
|
= ln ln( )
m
m et
Note: Pour la loi lognormale, la mdiane vaut et le mode vaut e .

e
2



Application des lois normale et lognormale: rserves en fonction d'une teneur de coupure c.

Notons : T(c) = tonnage au-dessus de la teneur de la coupure.
1- introduction 6
Q(c) = quantit de mtal au-dessus de la coupure.
m(c) = teneur moyenne de ce qui est au-dessus de c.

T(c) en termes statistiques peut s'crire P (Z > c)
.
T
o
o T
o
dsigne le tonnage total du gisement.

T(c) =
T
f (z) dz
Q(c) =
T
z f (z) dz
m(c) = Q(c) / T(c)
o
c Z
o
c Z



Si on connat la loi de distribution (et ses paramtres), on peut calculer ces quantits.
Loi normale Loi lognormale
T(c) =
T
1 - F
c - m
o

|
\

|
.
|
|
\

|
.
|


T(c) =
T
F
1

m
c
-
2
o


ln
|
\

|
.
|
|
\

|
.
|

Q(c) = m T(c) +
T
f
c - m
o

|
\

|
.
|


Q(c) = m
T
F
1

m
c
+
2
o


ln
|
\

|
.
|
|
\

|
.
|


o : m: moyenne des Z
cart-type des Z
: cart-type des ln Z

F(t) = f (x) dx
-
t
N(0,1)

(cumulative dune N(0,1))



f(t) =
1
2

e
-
1
2

t
2

, (fonction de densit dune N(0,1))



Consquences: Les rserves in-situ vont dpendre de la loi de distribution et de ses paramtres.


Ex. : Supposons que l'on connaisse m et
2
pour les units de slection dtermines, voyons quelle est
l'influence du type de la loi.

Soit m = 3%
c = 4.5%
= 1.5%
T
o
= 1 Mt

Si la distribution est normale, on trouve :

1- introduction 7
T(4.5) = Mt 1 - F
4.5 - 3
1.5
= 0.16 Mt
Q(4.5) = 3 0.16Mt + Mt 1.5 f
4.5 - 3
1.5
= 0.84 x
10
Mt
m(4.5) =
x Mt
Mt
5.25%
-2
1
1
0 84 10
016
2
|
\

|
.
|
|
\

|
.
|
|
\

|
.
|
=

note: F(1) = 0.84


note: f(1) = 0.24 %* * %
.
.



Si la distribution est lognormale, on a alors:

472 . 0 1
% 9
% 25 . 2
ln
2 / 1
2
2
=

|
|
.
|

\
|
+ =

et

T(4.5) = Mt F
3
.5
= Mt F Mt
Q(4.5) = Mt 3 F
3
.5
= Mt F 0.8 x
10
Mt
m(4.5) =
x Mt
Mt
5. %
-2
1
1
0 472 4
0 472
2
1 1095 014
1
1
0 472 4
0 472
2
1 3% 0 623 0
0 80 10
014
71
2
.
ln
.
( . ) .
%*
.
ln
.
* * ( . )
.
.
|
\

|
.
|

|
\

|
.
| =
|
\

|
.
|
+
|
\

|
.
| =
=


*


Si l'exploitation impose la slection sur de plus gros blocs ayant un cart-type de 1% (au lieu de 1.5% dans
l'exemple prcdent), alors, toujours en supposant une loi lognormale,

= 0.325

et
T(4.5) = .08 Mt
Q(4.5) = .4210
-2
Mt
M(4.5) = 5.25%

la quantit de mtal est rduite de moiti!

Si on dfinit le profit par T(c) . (m(c) - c), on passerait de 0.16910
-2
Mt .0610
-2
Mt donc une rduction de
prs des 2/3 du profit escompt.


Deux problmes complexes:

L'exemple prcdent illustre l'importance de tenir compte du support sur lequel s'opre la slection lors de
l'exploitation. On reconnat donc un premier problme: l'information dont on dispose est dfinie sur de petites
units chantillonnales (carottes, chantillons en vrac, canelures). Comment, partir de cette information,
prdire ce que sera la distribution d'units de slection d'un volume trs suprieur?

1- introduction 8
Supposons que l'on connaisse la loi de distribution des teneurs des bloc. On peut calculer, comme on l'a fait
l'exemple prcdent, les rserves rcuprables en fonction des diffrentes teneurs de coupure. Ces rserves
calcules correspondent ce que nous obtiendrions si lon connaissait effectivement la vraie teneur de tous les
blocs du gisement. En pratique, ces vraies valeurs ne sont jamais connues et doivent tre estimes partir de
l'information disponible. Quel estimateur choisir? Quelle quantit d'chantillonnage effectuer? Peut-on
prdire maintenant ce qui sera effectivement rcupr plus tard partir d'une quantit d'information
suprieure?

Ces deux problmes sont fondamentaux en gostatistique, on leur a donn un nom: l'effet support et l'effet
information. L'effet support indique que la distribution des teneurs dpend de la taille des blocs que l'on
considre. Ainsi pour un mme tonnage extrait et supposant que l'on connaisse les vraies valeurs des blocs, on
retire toujours plus de mtal si la slection s'effectue sur de petits blocs plutt que sur des gros blocs
(l'opration sur de petits blocs est plus slective). L'effet information indique que l'on ne dispose pas des vraies
teneurs des blocs qui nous intressent mais seulement d'une estimation de celles-ci. Pour un mme tonnage
extrait, la slection s'effectuant sur des blocs d'une taille donne, on rcuprera toujours moins de mtal avec
un estimateur qu'avec les vraies valeurs. Normalement plus on amliore l'estimateur, soit en recourant de
meilleures mthodes d'estimation, soit en augmentant le nombre de donnes, plus on retire de mtal pour un
mme tonnage.

Un problme trs important reli l'effet information et l'effet support est le problme de biais conditionnel.
Trs souvent, pour un tonnage extrait donn, on aura retir beaucoup moins de mtal que ne le prvoyait
l'estimation, ce qui risque d'tre ruineux pour la compagnie minire. Pour minimiser ce biais conditionnel, il
faut utiliser des estimateurs qui tiennent compte la fois de l'effet support et de l'effet information. C'est ce
que fait le krigeage.

1- introduction 9
Exemple numrique (tir de Armstrong, 1998
1
)

Supposons une portion de gisement forme de 16 blocs eux-mmes diviss en 4 parcelles. On connat la vraie
teneur de la parcelle du coin suprieur gauche. La teneur de coupure est 300 (reprsente les cots pour extraire
et traiter le bloc). On dfinit le profit comme .

> =

16
300 1
300
i
t , i
i
) t (


735

45 125 167
450 337 95 245
124 430 230 460
75 20 32 20

Les vraies teneurs des blocs sont galement connues:

505 143 88 207
270 328 171 411
102 220 154 263
101 54 44 155

Profit maximum que l'on puisse atteindre?
Profit: (505-300)+(328-300)+(411-300)=205+28+111=344

Quels seraient les profits prvu et ralis si lon estime la teneur de chaque bloc par la parcelle connue?

Profit prvu: (735-300)+(450-300)+(337-300)+(430-300)+(460-300)=435+150+37+130+160=912
Profit ralis: (505-300)+(270-300)+(328-300)+(220-300)+(263-300)=205-30+28-80-37=86

1
M. Armstrong, 1998, Basic linear geostatistics, Springer.
1- introduction 10
Quels seraient les profits prvu et ralis si l'on estime la teneur de chaque bloc par la moyenne des parcelles
du bloc et des blocs voisins par le ct?

Rp: Les valeurs estimes seraient alors:


410 310.5 108 179
411.5 271.4 206.4 241.8
269.8 228.2 249.4 238.8
73 139.3 75.5 170.7
Profit prvu: (410-300)+(310.5-300)+(411.5-300)=110+10.5+111.5=232
Profit ralis: (505-300)+(143-300)+270-300)=205-157-30=18

Une estimation obtenue par krigeage a fourni les valeurs suivantes:

442 190 142 204
354 276 212 279
189 226 216 271
99 81 88 125
Profit prvu: (442-300)+(354-300)=142+54=196
Profit ralis: (505-300)+(270-300)=205-30=175

Dans cet exemple, on note que:
-Dans tous les cas, le profit ralis est infrieur au profit optimum (effet information)
-Seul le krigeage a fourni un profit prvu s'approchant du profit ralis (absence de biais conditionnel).


Quelques exemples de problmes, dans le domaine minier, auxquels la gostatistique peut apporter une
contribution:

- Lorsque les limites du gisement sont floues, sans contrle structural, dfinies en fonction d'une teneur de
coupure (ex. cuivre porphyrique) et que l'on doit dterminer l'emplacement d'un chantier d'abattage.

- A partir de l'information recueillie lors de l'exploration, dterminer la rentabilit du gisement en regard de
diffrentes mthodes d'exploitation (elles influencent le type de slection et la taille des blocs) et de diffrents
scnarios conomiques. Ceci peut ensuite tre utilis pour comparer divers projets entre eux et leur accorder
une cote de priorit.

- Dterminer si des forages (ou un autre type d'chantillonnage) additionnels permettront de dgager
suffisamment de profits supplmentaires pour couvrir leurs cots.

- Aider dterminer la squence d'exploitation optimale permettant de maximiser les profits (on a
gnralement intrt exploiter les zones les plus riches d'un gisement le plus tt possible).
1- introduction 11

- Aider dterminer la teneur de coupure optimale.

- Aider dterminer les contours optimaux d'une fosse d'exploitation ciel ouvert.

- Prdire la teneur et la variabilit de la teneur du minerai envoy au concentrateur (moulin) et ainsi aider
prdire le taux de rendement de celui-ci.

- Dterminer si un processus dhomognisation ("stockpiling", points de prlvements multiples, etc.) est
justifi afin d'amliorer le rendement du concentrateur. Comparer divers scnarios pour l'homognisation.

- Prdire le plus exactement possible la teneur du minerai qui sera exploit court terme. Dterminer si le
minerai ainsi extrait sera suffisant pour alimenter seul une fonderie ou s'il faudra prvoir importer du
concentr d'autres mines et/ou d'autres pays.


Exemples d'applications de la gostatistique dans divers domaines.

- Estimation et planification des mines et des gisements ptroliers.
- Prospection gochimique et gophysique.
- Cartographie automatique (par ordinateur).
- Filtrage de signal.
- Simulations d'coulements, prdiction et simulation de conductivits hydrauliques.
- Caractrisation de sites contamins.
- Cartographie mtorologique.
- Classification de sols.
- Estimation de la biomasse et de sa localisation en pches.
- Estimation de la compaction du noyau impermable d'un barrage (gotechnique).
- Rpartition spatiale de la dformabilit des roches au pourtour d'une excavation.
- Charges hydrauliques et directions d'coulement.
- Analyse et caractrisation d'images (biomdical, tldtection).
- Reprsentation numrique-analytique de surfaces pour la CAO-DAO.