Vous êtes sur la page 1sur 14

S ~rofils sismiques AP et ~~ a;r8nt.injection de béton sont présentés au § 4.4.5.B.

'
, d en:ondreme~t est assoc,le a 1 atteinte de la nappe phréatique (marqueur CI) CHAPITRE H ANNtAr:::. 1
turbation du tott d~ ~a.craie (marqueur C), l'absence de vide à la continuné des
Cl et C, La POSSIbilité de presence de vide peut être associée au mauv .
. La fi" ais raPPolt·
.sur bnul
' ..
con irmauon de remplissage est liée à l'amélioration de la conf . é
, d bé
teurs apres llljectIon e ton. La comparaison des profils sismiques réalisé
Jnlllt dca Éléments
.. . d bé . s avant et 1
mjecnon e ton a permis d'évaluer le degré de restauration du site en loc l'
: ou, 1e remp l'issage d es VIid es a éte' effectivement réalisé (fig. 8.27). Il lSant les d'interprétation sismique

L'interprétation des données sismiques comprend une phase d'interprétation structurale


et une phase d'interprétation stratigraphique, les deux phases pouvant être conjointes. Nous
donnons quelques informations nécessaires à l'interprétation des profils sismiques

8A1.i INTERPRÉTATION STRUCTURALE

33,-----4~~----~5~1----~N~---7~1----~8~~----~9~a--~~1~~~I~W~~
L'interprétation structurale de la sismique consiste à suivre une réflexion qui est l'image
SlUface du proûl (ID)
0.000
d'un certain niveau géologique et d'en donner une représentation spatiale. Les problèmes
posés par cette interprétation sont liés au pointé, à la cartographie et aux variations de vites-
10,000
ses de propagation des ondes, c'est-à-dire à la restitution en profondeur.
20.000

30.000

.40.000
SA1.1.l Le pointé
»
50.000
La première opération à faire est le calage aux puits. Cela consiste à affecter à un niveau
.fJIdi8ll~~~1-l 80.000 géologique un événement sismique tel qu'un maxinium, un minimum d'arche ou un point
~"-'11'~ ~~wy 70.000 d'inflexion. Pour ce faire il faut établir une relation entre un temps de propagation et une
profondew- en définissant une loi de vitesse obtenue par un sonic calé à "aide d'un sismo-
sondage ou mieux un PSP (profil sismique de puits). On construit alors une trace modèle
synthétique ou une trace PSP dans la bande de fréquence de la sismique. La meilleure façon
de rassembler toute I'information nécessaire au calage est de réaliser une fiche d'identité
Fi&ure 8.27 Sismique réflexion répétitive en génie civil' comparaison des sismique par puits (fig. 8At.l).
profils AS, site d'Anzin (d'après Moreaux, 1997). ' Le pointé consiste à suivre l'événement sismique défini par le ou les calages. Le pointé
a) Profil avant injection de béton. b) Profil après injection de béton. présente deux sortes de difficulté, l'arrêt de continuité et le changement de caractère. L'arrêt
312 C;",pitre 8 Annexe 1 • ÉLÉMEN1S IYJIVI1:'XJ'I<J:.IAt Jl..l!V .}/.lJVIII.'ve

de continuité peut avoir une cause liée à la réflexion elle-même, c'est le cas d'une faille
ar
exemple. il peut aussi être dû à une forte baisse de la qualité sismique, par de mauvat
. . d' ses 8A1.1.2 La cartographie
corrections statiques ou ynarmques, par des perturbations dans les couches sus~jacente
swtout celles proches de la surface et générant du bruit, etc. L'Interprétateur cherche :
passer "obstacle soit en le contournant, soit en corrélant le caractère ou en se calant SUt Une fois toutes les sections pointées, il faut les chronométrer, reporter ces valeurs sur un
puits de part et d'autre de J'obstacle. plan de position et tracer les courbes isochrones. À présent il existe des logiciels qui per-
L'autre difficulté est une évolution du caractère de la réflexion suivie. Ce phénomène lllenent de faire l'ensemble de ces opérations sur une station de travail. Lorsqu'il s'agit
lié à, des c?ange~ents de faciès ~u d'épaisseur aux 'alentours du niveau géologique suivi. ~~ d'une sismique 3D, l'intégration se fait à partir du pointé. Celui-ci ne se fait plus sur section
?st~me d interférence évolue. d .a~t plus que la bande de fréquence de la sismique est lllais dans l'espace à partir de surfaces cohérentes de phases sismiques. Quel que soit le
~tro.lte. Le r~è?e es.t !a multl~hcatJOn des calages et la modélisation pour comprendre et procédé employé il faut savoir qu'il y a toujours une part d'interprétation dans un tracé. Les
Justifier le pomte ChOtSI et le raisonnement geologique qui permettra de faire un choix pa . points délicats sont le tracé des isochrones aux abords des failles pour définir des rejets
les différentes hypothèses. La figure 8A1.2 en donne un exemple. Trois niveaux Ont ': apparents corrects et le respect du style régional, du moins pour l'interprétation d 'une sis-
pointés. On voit que le niveau intermédiaire est délicat à pointer du fait qu'il disparaît e nûque 2D. Dans ce cas on peut avoir recours à des programmes d'interpolation spécifique
endroits. n peut être interprété grâce aux fiches de calage aux puits. par (krigeage) pour prendre en compte des directions tectoniques.

11~
' ' I Impédanct
ilcousti(lue
Si~l"I,ogn1tl1Jle
!i)'nÙl~lique
8A1.1.3 La restitution en profondeur

Par nature la sismique fournit la position des réflecteurs en temps double de trajet pour

~--«~.
''-- ',-'. ,(_ (
les atteindre et en revenir. Pour avoir la profondeur réelle en mètres il faut connaître la
vitesse de propagation des ondes. Acruellernent, avec les traitements élaborés, en particulier
la migration, il est nécessaire de définir un champ de vitesse. Aussi après la migration, la
restitution pourrait être faite sur l'ensemble de ta sismique. Souvent l'interprétateur préfère
ne restituer que les événements pointés qui sont nécessaires à son étude.

~m - 75m
,--._
Les sources de connaissance des vitesses sont la sismique elle-même et les mesures dans
les puits. Partant de là, les façons de restituer la sismique en profondeur sont nombreuses,
elles dépendent de la quantité d'informations disponibles, de la région considérée et de sa
géologie. Souvent les principales variations de vitesse proviennent des couches proches de
la surface. Dans certains cas elles peuvent être décrites par des lois et des formules, d'autres
fois elles sont quelconques et leur cartographie est empirique. À titre d'illustration et sans
Figure SAI.I Exemple de calage sismique
être exhaustif voici quelques méthodes de restitution.
(d'après Boyer et al.• 1994). '

A. Vitesse moyenne
Avec un seul puits on ne peut qu'utiliser la loi de vitesse tirée du sonic calé par un Si5-
,JO
Loll d'impédlDCC Loi d'impédance ...
..
' mosondage ou un PSP. Le lien entre le temps du marqueur et sa profondeur est la vitesse
moyenne: P = vr /2. .
Avec plusieurs puits, un cross plot temps-profondeur donne l'organisation des vitesses.

-_
Plusieurs cas peuvent se présenter, le plus simple correspond à une loi unique. Les vitesses
peuvent aussi se regrouper suivant plusieurs lois. Dans d'autres cas plus compliqués, il est
nécessaire de tracer une carte d'isovitesses moyennes. Les temps du cross plot peuvent être
ISO",
ceux du sonic calé ou ceux de la sismique. Dans le premier cas il peut exister un décalage
Figure SAI.2 Exemple de pointé fin après calage sur plusieurs puits entre ce temps sonic et celui de la section. Si ce décalage est variable il faudra le carter.
(d'après Boyer el al.• 1994).
314 Chapirre 8 A"""x~ J • ÈLÉMENTS V'INTERPRÉTATION SISMIQUE Chapitre tl An ...... J • JiL/:.MJ!-'YJ.' i.J"" .. -- ,

couches pour connaître leur épaisseur, Pour chacune d'elle, à partir des puits on détermine
B. Méthode des Po
=
statistiquement un VOl' et un coefficient k, tel que: Vi VOl + k ,Pj' avec PI = épaisseur de la
Cette méthode est adaptée au cas O'Ù l'on a plusieurs puits et des variations lat' al couche i. La profondeur du marqueur à restituer est alors :
'. ' d er es de
vitesse se Situant au- essus d'un certain temps c'est-à-dire à une profondeur relatl
faibl
l e.
Eli
fion deur au purts
'à '
e consiste tracer a partir des données puits une carte dite des P qui e tIvement
its d' un temps constant T , Pour aller de ce temps T, au marqueur
o
0
1
s a'. pro• P=- Lp;:= L v~ TI étant le temps double dans la couche i,
'l' al ' 0 SUl\!} on
u t'.Ise ors une VJ~esseconstante ou une loi de la forme V;: Vo + kP (fig. 8Al.3), En .
point de la section le marqueur est au temps; T T, + T. et sa profond = un D. Vitesses extraites de la sismique
p=po+V(r-To)/2. 0 1 eur est

Une variante de cette méthode consiste à prendre comme intermédiaire non 1 La détermination des vitesses par la sismique se fait par j'analyse de la courbure des in-
P
temps constant mais un horizon. Il faut alors que celui-ci ait une structuration calm USe un dicatrices d'un horizon (l'indicatrice est l'image d'une réflexion sur un point miroir com-
'th de 'li . e, ette mun en fonction du déport), Les vitesses obtenues correspondent à des vitesses quadratiques
me 0' est utï see pour des horizons ante-salifères dans des régions affect'
l'bal ocmese,
,. l e marqueur intermédiaire
'. étant la base du sel (fig, 8AI.4), ees par
moyennes (root mean square) O'U Vrms- Elles sont plus rapides que les vitesses moyennes Vm
qui interviennent dans la restitution, Aussi faut-il les diminuer, selon les régions de 4% à
10%, Elles sont obtenues systématiquement par un certain nombre d'analyses de vitesse,
réparties sur toute l'étude, afin de réaliser correctement les corrections dynamiques néces-
T.
saires au traitement.
Dans certains cas, pour une étude spécifique, elles peuvent être obtenues sur un horizon
d'une section (fig, 8Al.5), On obtient alors des attributs sismiques, temps, amplitudes et
vitesses qui peuvent servir à d'autres fins que la restitution,

Amp'iCud8 de "Horllon

Figure 8Al.3 Restitution en profondeur par la méthode des Po,

Temps de "Horizon

1600

....
N°d.! point da Hf

Vitesse d. l'Horizon

Figure 8AI.4 Restitution en profondeur par la méthode du marqueur de référence,


Horizon viIeue

C. Statistiques régionales
Cette méthode s'applique dans des zones où les variations latérales de vitesse sont en- li"" ..
IIrI°dtl pOint d. IL'
gendrées par des va:iations d'épaisseur des couches de recouvrement, qui chacune d'elles,
sont homogènes lateralement. Il faut alors pointer et carter les marqueurs qui délimitent ces Fi~re 8A1.S Horizon vitesse (d'après Henry, 1994),
316 Chapitre 8 Anlle." 1 • ELBMENT'S D'fNTERPRÉl'ATION SISMIQUE

{OVERLYING TRUNCATION
8A1.2 INTERPRÉTATION STRATIGRAPHIQUEI TOPLAP UNCONFORMITYI
'"
Durant les années soixante et le début des années soixante-dix, l'interprétation des sec.
rions sismiques était orientée vers une appréciation structurale de la subsurface.
Les progrès effectués, tant au niveau de l'acquisition que du traitement sismique el la
multiplication des exemples ont, par la suite, permis d'extraire des informations et de forger DOWNLAP INTERNAl
une technique portant non seulement sur les formes structurales, mais aussi sur la nature des CONVERGENCE
dépôts, l'environnement et les processus de sédimentation. C'est ce que l'on appelle la
Figure 8A1.6 Section structurale et géologique montrant les séquences de dépôt
stratigraphie sismique (Mitchum et al., 1977). • (d'après Mitchumet al., 1977).
Pour l'exploration, la connaissance d'une lithologie globale est suffisante. Pour les gi-
sements et les problèmes profonds de génie civil, il peut s'avérer, par contre, que ce qui
paraissait globalement homogène soit en fait hétérogène par ses conséquences d'un point de
vue mécanique des roches ou des fluides. .
Dans ce paragraphe nous ne ferons qu'évoquer les notions de base et le vocabulaire de a)
la sismique stratigraphique.
----------~
:.;;>
8A1.2.1 Les séquences de dépôt en sismique ~- .ONLAP,

Les surfaces physiques qui provoquent des réflexions sont principalement des surfaces
de strates ou de discontinuités. Une surface de strates représente une période de non-dépôt
ou un changement du type de dépôt. Les surfaces de strates et les discordances ont une
signification temps dans la mesure où les couches qui les recouvrent sont plus jeunes que
b)
celles situées au-dessous d'elles. On peut ainsi, dans ce cas-là, considérer que les réflexions,
dans leur continuité, peuvent être parallèles à des lignes temps géologiques. Elles peuvent
représenter d'anciennes paléotopographies comme celle constituée aujourd'hui par le fond
de la mer relayé par les plages et les sols, etc.
La continuité d'une réflexion est liée à la continuité d'une strate. Le changement de ca-
ractère d'une réflexion est provoqué par un changement du coefficient de réflexion le long
d'une surface de strate. L'enveloppe du changement de caractère des réflexions peut recou-
per la continuité d'une réflexion comme les limites de faciès peuvent recouper les lignes
temps géologiques. Les changements lithologiques le long d'une réflexion qui serait l'image
d'une ancienne paléotopographie se traduiront par des changements de caractère de la ré-
flexion.
À partir de cette notion. on peut définir des séquences de dépôt en sismique. Globale-
ment, une séquence de dépôt comprend un paysage sédimentaire, du continent au bassin,
formé dans un intervalle de temps, limité par des discontinuités en général d'origine tecto-
nique. Cette séquence est définie en sismique par un ensemble de réflexions concordantes
limitées à la base et au sommet par des discontinuités reconnues à la terminaison latérale
des réflexions (fig. 8A1.6). Les différents types de terminaisons latérales des réflexions sont
illustrés sur la figure SA 1.1(Nely, 1989).
Figue SAl.7 Exemple de terminaisons latérales des réflexions
(d'après Nely, 1989).
'Ce paragraphe a été rédigé à partir d'un texte de J.M. Planchon, géophysicien à Elf Aquitaine Production.
318 Chapill>! a Annu e 1 # tLEMENlS D'rNTERPRÉTA770N SISMIQUE ClkJpirn a A"" ... e 1 • ÉLÉMENTS D 'INTERPRÉTATION SISMIQUE 319

Un onlap (fig. 8A1.7a) représente une relation entre strates à la base d'une séquence • Une configuration de drapage en bosse et en creux. Elle est constituée de fragments
dans laquelle les strates horizontales se terminent contre une séquence sous-jacente dont les de réflexions irrégulières, discontinues et subparallèles. Le relief des bosses est fai-
strates sont plus inclinées que celles de la séquence considérée. ble. Cette configuration évolue latéralement vers des figures de progradation mieux
La présence d'une discontinuité au sommet d'une séquence se traduit par une troncature définies et verticalement vers un parallélisme des réflexions. Cette configuration est
latérale et progressive de ses strates supérieures qui sont recouvertes par les strates de la interprétée comme résultant de strates formant des petits lobes de progradation inter-
séquence sus-jacente. Cette troncature peut être due à une érosion ou à une absence de dé- digités, construits en eau peu profonde en position de front de delta.
pôt (discontinuité sédimentaire). Lorsque les strates de la série sus-jacente sont moins pen- • Les réflexions progradantes. Elles peuvent être obliques, planes ou sigmoïdes:
tées que les strates de la séquence tronquée, la discontinuité est appelée toplap. C'est Je cas _ une configuration sigmoïde implique un faible apport sédimentaire dans un mi-
du non-dépôt (fig. 8A 1.7b). lieu de dépôt à faible énergie, ou une variation rapide du niveau de la mer préser-
Un downlap (fig. 8A1.7c) représente des relations entre strates à la base d'une séquence vant ainsi le dépôt des unités supérieures;
dans laquelle les strates inférieures sont inclinées et se terminent en troncature sur la surface - une configuration en oblique plane suppose une accrétion frontale avec apport
de dépôt horizontale ou légèrement inclinée. important de sédiments dans un milieu d'énergie élevé, ce qui explique que les
Une séquence de dépôt a une signification chronostratigraphique car elle s'est déposée unités supérieures soient érodées au fur et à mesure qu'elles se déposent. Le ni-
durant un intervalle de temps géologique déterminé par les âges des limites de la séquence, veau de la mer doit être stable.
qui ne sont définies que lorsque la séquence est complète et qui se traduisent par une con- • Une configuration chaotique, où les réflexions sont discontinues et présentent un
cordance des dépôts. On trouve deux types de surfaces cbronostratigraphiques : les discon- grand désordre, suggère un arrangement désordonné des surfaces de réflexion. Dans
tinuités, en particulier les limites de séquence; les réflexions à l'intérieur des séquences, certaines configurations, quand le désordre n'est pas trop grand, les strates anciennes
c'est-à-dire les surfaces des strates. peuvent être encore visibles. Ces configurations se rencontrent dans les structures de
À ce stade, on essaiera de dater la séquence de manière absolue. En J'absence glissement, de remplissage de canyons ou de chenaux et dans les zones faillées ou
d'informations puits, on utilisera les cycles eustatiques. En effet, la séquence correspond plissées.
souvent à un cycle eustatique, c'est-à-dire à un changement relatif du niveau de la mer.
Dans le cas où des données de puits sont disponibles dans la zone étudiée, on les utilisera
ZONE STR"TIFIEE
pour caler la sismique aussi bien d'un point de vue stratigraphique que lithologique.

8Al.2.2 Analyse des faciès sismiques

L'analyse faciologique des sections sismiques par l'interprétation de la configuration des


/I===-:!
..: 1\
COHflGIJRATIOI< SIMPlE CONAGUIIATlOH COMPlElCE

réflexions met en œuvre les paramètres sismiques tels que : amplitude, fréquence, phase,
continuité, vitesse d'intervalle, géométrie des réflexions. Une fois ces paramètres analysés
permettant de caractériser une unité de faciès sismique avec son enveloppe, et les relations
latérales et verticales de cette unité avec les autres, on peut interpréter une unité de faciès
sismique en terme d'environnement, d'énergie de dépôt et de lithologie. On peut rencontrer
différents types de configurations de réflexions (fig. 8AI.8) que l'on peut classer en zone
sourde et en zones stratifiées. Ces dernières peuvent être simples ou complexes:
• Zone sourde et transparente. Certaines zones ne donnent pas de réflexion: cela sup-
pose l'absence de réflecteur, donc de strate, et une certaine homogénéité des dépôts.
Des unités géologiques très déformées peuvent donner ce type de configuration. Cette
absence de réflexion traduit une continuité du dépôt et si l'intervalle est épais, une sé- ZONE SOUROE ZONE TRANSPARENTE

dimentation rapide et uniforme dans U11 contexte de dépôts argileux.


• Zones stratifiées. Elles peuvent être simples ou complexes:
• Les réflexions parallèles, fréquentes sur la plate-forme ou dans le bassin .
• Les réflexions divergentes, elles indiquent la variation de la vitesse de sédimentation
le long du profil ou inclinaison progressive de la surface de dépôt. Fi&1Il1"eSAl.S Configuration des réflexions (d'après Nely, 1989).
320 Cltapilre Il Ann e..-e 1 • BLÈMIiNTS O·JNTI!.'RPRÉTATION SISMIQUE Ch""i,,,, 8 A.... ex. J • tLÉMSNTS D·lNJbHYIŒ,,..'lul. ,)1.M1I1J1I1!

La forme externe des réflexions peut être de différents types (fig. 8AI.9) :

• Les formes en feuillets parallèles ou divergents : elles peuvent être de grandes dimen_
sions. On peut y observer des configurations parallèles, divergentes. ou de prograda_
tien, C'est la forme la plus connue des unités de faciès sismiques sur la plate-fonne.
• Les formes en feuillets drapants: elles supposent une faible énergie de dépôt. Les
~mplwog.
feuillets viennent mouler des formes préexistantes, dt m:u •
• Les lentiJJes se rencontrent dans les dépôts de pente.
• Les monticules : ils peuvent être dus à des constructions organiques, des coulées vol-
caniques, des amas de clastiques tels que des turbidites, des lobes deltaïques, des off-
shore bars des marnes glissées, des contourites, Très souvent, ces unités sont liées à
un niveau d'énergie relativement élevé. Figure 8Al.IO Formes externes des réflexions pour des remplissages
• Les creux (fig. 8A1.l0) : les remplissages de dépression peuvent être classés selon (d'après Mitchum el 01., 1977).
leur forme externe (canyons, chenaux, bassin, bas de pente) et leur configuration in-
terne (fig. 8AI.II) ; remplissage de canyons, coulées, fan, etc.
REl'lPUSSACE DE CREUX
U existe une relation entre l'énergie de transport des sédiments et les réflexions issues du
dépôt. Un haut niveau d'énergie de dépôt tend à produire des réflexions complexes souvent __.

discontinues variables en amplitude, fréquence et phase. Inversement, un faible niveau ........ ?


" ;;;-
" 7
d'énergie de dépôt se traduira par des réflexions très continues en amplitude, fréquence et
phase sur de grandes surfaces. Rtmpliwlle rn onlap

~=
Rem~ comp!ex.e

Figure 8AI.lI Configurations internes de remplissage


(d'après Mitchum el 01.,1977).

Pour l'exploration, la connaissance de cette lithologie globale est suffisant~. Po~ le.s
problèmes de gisements ou de génie civil, il peut s'avérer, par contre, que ce qUI parais sali
globalement homogène pour I'explorateur soit hétérogène pour le producteur ou le géotec~-
nlcien. Il convient alors d'analyser plus finement la sismique pour tenter de m.ettre en éVI-
denee des effets de fluides, des variations lithologiques et/ou pétroP~YSI~ues. Nous
Figure 8A1.9 Formes externes des réflexions n'étudions plus globalement une série de réflexions, mais une ou deux réflexions : nous
(d'après Mitchum el ai., 1977). entrons dans le domaine de la sismique lithologique.
322 Chapilr~ 8Annue 1 • ÉLÉME~ D'INTERPRÉTATION SISMIQUE

Dans le cas d'une interprétation lithologique, les paramètres amplitude, fréquence, phase
CHAPITRE 8 ANNEXE 2
des réflexions, deviennent prépondérants en regard, par exemple, de la configuration ex-
trême des réflexions utilisées en sismique stratigraphique. On va s'intéresser en particulier à
la forme du signal sismique et à son amplitude, car ces paramètres contiennent des informa-
tions à la fois sur Ja lithologie, sur les paramètres pétrophysiques et sur le remplissage en Les indicateurs directs
fluide. .
Le premier problème qui se posera à l'inrerprétareur est de savoir s'il existe une relation d'hydrocarbure
entre les paramètres physiques et l'impédance acoustique c'est-à-dire vitesse et densité. Ce
problème est complexe car de nombreux paramètres sont susceptibles d'influer SUr
l'impédance acoustique et ceux-ci sont souvent liés entre eux. La réflexion sismique en-
globe ces paramètres et la difficulté reste de déterminer ceux qui influent sur l'impédance
acoustique. Il faut faire appel pour cela à différents outils de modélisations/inversions pour
aider à faire un choix.
Une fois caractérisées les liaisons entre les paramètres et l'impédance acoustique d'un
côté et l'impédance acoustique et Ja forme de la réflexion (amplitude, phase dédouble-
ment...), d'un autre côté, on définit les unités de faciès. L'interprétateur peut alors recon-
naître les faciès sur les lignes sismiques et réaliser une carte de faciès sismiques et en dé- De nombreux auteurs ont étudié les influences de la présence de gaz dans les roches sur
duire J'extension d'une lithologie. le comportement sismique. Dilay (1982) présente une bonne synthèse des phénomè~~s
La résolution des problèmes lithologiques peut être abordée par des méthodes statisti- observés appelés généralement IDH (indicateurs directs d'hydrocarb~e). L:s .ID~ sont h~s
ques ou déterministes, c'est-à-dire par l'utilisation de formules qui sont présentées au cha- au changement des propriétés acoustiques du réservoir, notamment a la durunuti~n de VI-
pitre Il pour le cas des sols par exemple. tesse de l'onde P dans le réservoir à gaz, diminution relative par rapport à la vitesse de
l'onde P dans le même réservoir saturé en eau.
La présence d'hydrocarbures peut être mise en évidence par :
• Anomalie d'amplitude: on peut observer une réflexion avec une amplitude ano~a-
lement forte au-dessus du réservoir à gaz. C'est le phénomène de bright spot qUI est
dû à la faible impédance acoustique de la roche à gaz et qui est clairement mis en évi-
dence sur les sections représentant l'enveloppe du signal analytique (fig. 8A2.lb).I.
• Flat spot: on peut observer une réflexion isochrone associée au contact gaz-huile ou
gaz-eau, bien marquée SUI les sections en phase instantanée (fig. 8A2.1c). .
• Changement de polarité: on peut observer un changement de .polarité ~e l~ réfleXlo?
aux frontières du réservoir à gaz dû au changement du coefficient de réflexion au toit
ou au mur de la roche réservoir.
• Diffraction: la diffraction est créée par un changement abrupt du coefficient de ré-
flexion au toit ou au mur de la roche réservoir (à ses limites latérales).
• Retard temporel: on peut observer un retard en temps des réflexions située~ so.us le
réservoir à gaz dû à une augmentation relative du temps de trajet des ond~s sismiques
à travers le réservoir entre la zone à gaz et la zone à eau. Des exemples d observation
de retard temporel sont présentés au paragraphe 8.3.1.
• Zone à faible amplitude: on peut observer sous le réservoir à gaz une zone où les
réflexions ont une faible amplitude, due à une perte d'énergie des ondes lors de leur
traversée du réservoir. C'est le phénomène de dim spot .

. IVoirla figure BA2.1 en couleor à la fin du volwne.


324 Chapitre 8 A""~xe 2 • Les INDICATEURS DIRECTS D'HYDROCARBURE Chapun 8,.""u. 1. LES INDICATEURS DIRECTS D'HYDROCARBURE 325

• Diminution de fréquence: on peut observer à l'intérieur du réservoir une zone où les Limites du réservoir
réflexions sont basse fréquence. Ce phénomène dû à l'absorption et à la vitesse faible Ouvcrnay N° 11·26 r:
W
de propagation des ondes dans le gaz apparaît clairement sur les sections en fréquence 2060 2 050 2 ()4() 2 030 2 ()20
instantanée (fig. 8A2.1 d)'. • ! ~
0.20

Malheureusement les IDH ne sont pas toujours dus à la présence d'hydrocarbures. Ils
î
"i,.l
peuvent avoir leur origine dans la stratification ou être engendrés par des roches à vitesse Î: 030
lente encaissées dans un milieu à vitesse beaucoup plus rapide. Les fluides étant insensibles ::>
';1

aux contraintes de cisaillement, les ondes S offrent une possibilité de faire la distinction ~
~
entre les vrais IDH et les faux IDH, les vrais IDH étant observables uniquement sur les ~ 0.40

sections sismiques P, les faux IDH étant observables à la fois sur les sections sismiques en '"
g'"
ondes P et en ondes S. ~
Il 0,50
Ensley (1984) montre de très beaux exemples synthétiques et réels de vrais et de faux
E
IDH. Les figures 8A2.2 et 8A2.3 montrent un exemple réel de bright spot lié à la présence .3
.g
de gaz dans un réservoir (observable sur la section sismique en onde de compression et non 0,60
observé sur la section en onde de cisaillement), et un exemple de brtght spot litholOgique ~
(observable sur les sections sismiques en onde de compression et en onde de cisaillement).
a
E
Après calage sur les données de puits la comparaison des sections sismiques en ondes P ~ 0,70
0 1000 Section en oodes /'
et en ondes S fournit, du moins théoriquement, des indications Sm' la porosité pour les ro-
ches imprégnées en utilisant le rapport VplVs (cf chapitre 3). • •
l'cel
De plus, la combinaison des ondes P et S peut être un bon moyen d'évaluer l'anisotropie
relative du milieu. Limites du réservoir
Un milieu est dit anisotrope si ses vitesses verticale et horizontale en ondes de compres- Duvcrnay N° 11-26 E
sion et/ou de cisaillement sont différentes. Les rapports entre les vitesses verticale et hori- 2 070 2 060 2 050 2 040 2 030 2020
zontale sont des coefficients d'anisotropie. 0.11
Les analyses de vitesse des enregistrements sismiques fownissent des vitesses de tranche Sic
qui sont les vitesses horizontales. Entre deux horizons géologiques identifiés sur les sections
"'">
t.;

P et S à partir des informations de puits fournies par les diagraphies et les profils sismiques 'ë 1.0
verticaux, il est possible de déterminer à partir des données sismiques les vitesses horizon- -::l "
tales de tranche et les temps de parcours verticaux, et de calculer les coefficients '"'"
~
'-' 1,2
d'anisotropie. ï'
En conclusion, la comparaison des sections sismiques en ondes P et en ondes S peut '""
8
fournir des indications sur la lithologie, la porosité, l'anisotropie et permet de distinguer les ~
Il 1,4
vrais indicateurs d'hydrocarbure des faux. De tels résultats ne pourront être valablement e:
E
obtenus qu'à l'aide de données sismiques de bonne qualité, présentant un fort rapport signal -e'"
sur bruit et une haute résolution. 1.6
~
aE
~ l,II
0 1000 Sedi,," en (lIlcks'<;
, 1 1

re.:r

Fipre 8Al.2 Bright spot lié à la présence d'hydrocarbures


(d'après Ensley, 1984).

·Voir la figure SAl.l en couleur li la fin du volume.


326
Chapitre 8 AMe",. Z. LES INDICATEURS DIRECTS D'HYDROCARBURE

w Duvemay N° .5 • 28 Stawu N· 7 • 28
2 ISO E
2 19()
• CHAPITRE 8 ANNEXE 3
j
'"
~
'c:" 0,30 Statistique
..
'"
"tl

a
~::> 0,40
et analyse de données
" par A, Faraj'
8
~
Il 0.50
E
3
'"
."

'"
~ 0,60

E
a
u
1-
0,70

Section en ondes P
Feet 8A3.1 NOTIONS DE BASE

W Duvernay :-;0.5 .2R Slawa N" 7 . 28 8A3.1.1 Les mots de la statistique


2190 2 IBO
:! 170 2 160 2 150
~ " On applique les méthodes de la statistique à un ensemble d'objets - appelés individu!!
; ou unité!! st.atistiques - comparables les uns au;'( autres et formant un ensemble appelé
:-
:l population. Si ces objets ne constituent qu'une partie de la population, nous parlerons
'C:: 1,0
d'échantillon. Aux objets correspondent des caractéristiques appelées variables ou carac-
." '"
"
~ tères. Une variable est une application qui, à chaque individu, associe une entité mesurée
t ou observée.
1,2
~r- Nous parlerons de variables quantitatives quand ces entités sont des valeurs exprimées
i< par des nombres réels. Ces valeurs peuvent aussi bien être discrètes (en nombre fini ou
~
1,4 dénombrable) que continues.
"
:; Nous parlerons de variables qualitatives dans le cas où les individus sont caractérisés
;;;
"=' par leur appartenance à des catégories ou modalités. Les variables quantitatives discrètes
"
~ i.e ayant un nombre fini de modalités peuvent être considérées et analysées comme des varia-
a
ë
bles qualitatives.
'"
1-
1,8
Les opérations arithmétiques (somme, moyenne ...) et statistiques usuel1es (varlance",
covariance, corrélation3 ... ) effectuées sur les variables quantitatives n'ont pas de sens dans
1 1 1 1 1 St.'CtHIR .m ondes S le cas des variables qualitatives.
Feer

Fi&ure 8Al.J Bright spot lithologique (d'après Ensley, 1984).


IExtrait des actes du séminaire ENSPM. Formation Industrie, inti~ Fonnation gisement, 23/10 au 11/12/1996.
~ueîl-Malmaison. préseotë par A. Faraj, ingénieur de recherche ll'lnstitut Français du Pétrole.
~ varia.ce mesure la dispersion des valeurs d'une variable autour de sa moyenne. La racine carrée de la va-
rance est appelée écart type.
Le coefficient de corrélation entre deux variables est une quantité comprise entre -1 et + 1 qui mesure le degré de
la relation linéaire entre les deux variables
328 Ch",,;/,.., 8 Annexe 3 • STATISTIQUE ET ANA L YSli'S DE DONNÉES Cltapure 8 AlVlU' J • STATIST/QUE ET ANALYSES DE DONNÉES 329

La statistique consiste à étudier l'inconstance et l'imprévisibilité des valeurs prises appliquées successivement ou conjointernent aux données. En troisième phase peuvent être
I~s variables. On parle de variable aléatoire dont nous connaissons une série de réaJi~: appliquées les métbodes de classement.
taons que sont les mesures que nous avons à analyser. Cette analyse peut être descriptive 0
prédictive. Selon le cas, les outils mathématiques utilisés reposent sur des représenlati u
a lgeêb nques
. d d'
es onnees ou sur d es concepts empruntés au calcul des probabilités. ons 8A3.1.2 Les méthodes factorielles
La phase descriptive consiste à « visualiser » des relations d'interdépendance ou d
modèles éventuels. Elle précède la phase inférentielle dont le but est d'estimer certaï es Ces méthodes sont des outils fondamentaux d'analyse de grands tableaux de données
nes
quantités et les incertitudes qui leur sont liées, de tester les hypothèses ou modèles mis (plusieurs lignes et colonnes). Elles visent à réduire le nomb~e de variables initiales e~ cal-
év~d~n~e, ou de ~ré~jre des .va!eurs i~~~es ~ fonction de celles connues. Cene Ph; cotant. par optimisation de certains critères (tels que la vanance), de nouvelles vanables
prédictive pourrait erre aussi 1 occasion d établir et de tester des modèles exprimant d (appelées composantes factorielles). Celles-ci p~tt;nt, par projections d:s indi~i~~ et
variables à expliquer en fonction de variables explicatives. es des variables initiales, de mettre en évidence les liens eventuels entre les van ables initiales
~otre point de vue est que la frontière entre techniques descriptives et méthodes infé. induisant à la fois leur typologie et celle des individus qu'elles décrivent.
rentielles ne constitue pas une barrière infranchissable pour le praticien désireux d'avoir un Selon la nature des données et le type de problème posé, le praticien peut choisir parmi
vision objective et moins réductrice des données qu'il analyse. Sans perdre de vue l'intérê~ tout un éventail de techniques multivariées. La régression est utilisée pour déterminer la
des techniques inférentielles, nous nous limitons cependant, dans cet exposé, aux méthodes combinaison de variables explicatives qui soit le « meilleur ) prédicteur d'une variable à
descripti ves. expliquer. La corrélation canonique donne une combinaison linéaire d'un groupe de va-
Les techniques de la statistique descriptive se sont enrichies face à des données de plus riables qui corrèle le mieux avec une combinaison linéaire d'un autre groupe de variables.
en plus nombreuses, conséquence du développement informatique et du nombre croissant L'analyse factorielle discriminante détermine un nouvel espace de représentation des
des mesures. Les techniques de calcul ont, par ailleurs, beaucoup contribué à ce dévelop- données qui opère la meilleure séparation entre des groupes prédéfinis. L'analyse en com-
pement. Une nouvelle génération de logiciels, combinant visualisation et techniques de posantes principales et l'analyse factorielle des correspondances sont appliquées res-
calcul, permet de rendre des données colossales plus accessibles et plus « palpables ». pectivement à des variables quantitatives ou à des variables qualitatives pour déterminer un
L'exposé présente les éléments mathématiques de base nécessaires à l'utilisation de ces espace de dimension réduite en vue de représenter et de mettre en évidence les interdépen-
techniques et à une meilleure exploitation des résultats auxquelles elles aboutissent. Ces dances entre les données.
techniques sont efficaces quand le nombre des variables est supérieur à deux. Les cas mODO
et b~-var~ables (analyse d'une ou de deux variables) demandent très peu d'outils descriptifs
et necessitent généralement l'utilisation de statistiques inférentielles. 8A3.1.3 Les méthodes de classification ,
'.".,

..~ ;
.... , . 'v
. ?ans les cas ~ue nous aurons à traiter, le nombre de variables est plus important. On
utilisera des techniques dites multivariées ou mulCidimensionoeUes. Celles-ci ont l'intérêt Ces méthodes consistent à organiser les individus en grO~p~~6-~~ogènes et bien séparés
~e cOt~idérer les variables et les unités statistiques dans leur globalité, tenant compte des qui permettraient de déceler d'éventuelles structures dans la population. Ces méthodes de
mterdépendances qu'elles présentent les unes par rapport aux autres. classification sont de deux sortes: hiêrarchique ou de partitionnement.
L'analyse exploratoire des doanêes utilise un ensemble de techniques descriptives Les méthodes de classification hiérarchique produisent, par étapes successives, des par-
pour synthétiser l'information. Elles offrent, également, un ensemble d'outils d'aide à titions emboîtées s'échelonnant entre une partition initiale (la plus fine où chaque classe est
l'interprétation des résul~ts visant à rendre cette information plus claire et plus précise. Ces un singleton constitué par une seule unité statistique) et une finale (la plus grossière formée
techniques se servent tres peu des hypothèses a priori; les méthodes probabilistes n'y d'une seule classe contenant toutes les unités statistiques à classifier). Le résultat final est
Jouant qu'un rôle assez limité laissent une place plus importante aux techniques algébriques. présenté par une structure arborescente appelée arbre de classification montrant les em-
boîtements des partitions successives ..Différents outils permettent de déterminer un niveau
Quelques méthodes appartenant au domaine de l'analyse des données multivariées de coupure de cet arbre qui donne la « meilleure» classification.
s~nt prés:l\tées. Elles permettent de décrire globalement les interdépendances entre plu- Les méthodes de partitionnement produisent, par itérations successives, des partitio~s
sieurs v~ables mesurées sur un ensemble d'individus. Les données analysées sont usuelle- noo emboîtées. L'algorithme part d'une partition initiale - donnée aléatoirement ou choi-
ment pr~sentées.s~us forme de tableau croisant, en lignes, les individus (pouvant atteindre sie par l'utilisateur - qui est transformée à chaque itération par une ré-affectation des uni-
la centame de milliers) avec, en colonnes, les variables (entre la dizaine et la vingtaine dans tés statistiques. L'algorithme cesse quand, d'une itération à la suivante, aucun élément ne
les. cas que nous traitons mais dépassant, dans d'autres cas, ces valeurs). Le but est de ré- change de classe. La classification ainsi obtenue est considérée comme déflruüve.
d~re une ~elle quantité d'information pour la rendre plus accessible à l'utilisateur. Les prin- Une classification hiérarchique conduit à des résultats plus stables qu'une classification
cipales Methodes de l'analyse exploratoire des données multivariées se classent en deux par partitionnement. Les résultats de cette dernière dépendent de la partition initiale. Mais
groupes: les méthodes ractorielles et les méthodes de c:lassificatioll. Elles peuvent être une classification hiérarchique est onéreuse en temps de calcul et en place mémoire dès que
330
CN.p;trI81fNNx1 J • STATISTIQUE ET ANALYSES DE DONNÉES
. 8/1Ntu, 3 •.........TJS17nUE
Cltaprtn n '" ET ANALYSES DE OONNÉES 331
le nombre des observations est élevé. Dans ce cas, il est préférable d'appliquer plusieurs
classifications en série et de croiser ensuite les partitions obtenues pour déterminer des Chaque individu pourrait alors être représenté dans l'espace RJ par le point
classes stables.

Mi = (z/, ... ,Z; ,... ,Z/ . ,... ,Z;J)


8A3.1.4 Les méthodes de classement
L' nsemble des .individus.. . . dans cet espace • un nuage de n points . appelé
forme ainsr, l'
Ces méthodes pourraient intervenjr dans une troisième phase. Elles nécessitent e ... J-dimeosionnelle va nous intéresser en prenuer leu.
nuage des lDdlVldus dont la structure Ir dans l'espace RJ traduit d'une
l'existence d'un échantillon d'apprentissage. Celui-ci est formé d'individus dont .. d es points les uns par rapport aux au es,
l'appartenance à des classes préétablies est connue. Cette connaissance a priori pourrait être La d~sposltton e C 'ême des données: deux points proches l'un de l'autre dans ~t
certame façon la structure ~ ( 'triq e) qu'il s'agit de définir _ montrent une SI-
aussi bien propre aux données (naturelle) qu'obtenue par une méthode de classification. EUe au sens d'une distance ou me u " 1
est utilisée par les méthodes de classement pour affecter des individus non classés aux clas- espace -t'- 1 .
essemblance entre es fi IVI'dus auxquels ces deux points sont associes, a
d'
ses préexistantes. oülara e ou rdu nuage montre une structure liID éaire , des sous-nuages indiquent des classes
forme étirée
La technique utilisée s'appelle analyse d~rjminante. EUe consiste à associer un indi-
de ressemblance, etc.. .. , h t à décrire la structure J-dimensionnelle complexe
vidu, dont on ne connaît pas le groupe d'appartenance, à la classe qui lui est la plus con- Les méthodes multivariées s attac en d' . .duit
forme. Deux règles sont utilisées pour définir cette conformité : h hant le visualiser dans des sous-espaces de imension re 1 e: .
â

d'un tel nuage en r;c erc iable consiste à remplacer chacune de ses mesures par sa diffé-
• La règle géométrique part d'une représentation algébrique des données. Les distances Le centrage d une van dl' ble Le centrage et réduction d'une variable con-
entre les individus et les groupes sont calculées relativement à un espace algébrique de
siste à remplacer ses mesures par e quo ti1e'nt de la variable centrée et la valeur de l'écart
renee avec la valeur moyenne e ~ varia
représentation des individus. La technique géométrique consiste à affecter un individu non
classé au groupe qui lui est le plus proche au sens d'une distance définie sur cet espace. typeOn' no t e par C zz la matrice des variances-covariances des données (variables cen-
• La règle bayestenne repose sur la formule de Bayes. Celle-ci donne la probabilité trées) :
conditionnelle d'affectation d'un point à un groupe connaissant les mesures des J variables
1 r
quantitatives au point en question. La règle baye sienne affecte un individu non classé au Czz =-2 Z (1)
groupe le plus probable au sens de cene probabilité. Pour cela il est important d'estimer la n
densité de probabilité conditionDeUe. L'estimation d'une telle quantité peut aussi bien être
faite par des méthodes Don paramétriques (aucun paramètre n'intervient dans l'écriture de Cette matrice est de dimension JJ. Ses termes diagonaux représentent la variance des J
la fonction de densité) que par des méthodes paramétriques (des hypothèses spécifiques
variables. " . avec 1a ma t TI'ce des corrélations
La matrice Czz coïncide ,. si les variables sont centrées
sont faites sur la loi de probabilité conditionnelle qui est alors paramétrée: exemple du
modèle multi-gaussien). et réduites. Dans ce cas, les terrnes diagonaux sont tous egaux al.

8A3.1.5 Tableau des données - covariances et corrélations 8A3.1.6 Codage statistique de données: exemple de la sismique

La démarche des méthodes factorielles est basée sur un codage des données qui permet . 1 fi' le traitement statistique et les résul-
L'étape de codage est très ~mportant~ a a Ol~. pour rètent en fonction de ce codage. Les
leur présentation dans des espaces algébriques munis de métriques appropriées. Le choix de tats qu'elle induit sur les donnee~. ~s ~esulta~s s ~t~ i ues dans le cadre du calibrage
ces métriques est déterminant quant aux résultats obtenus. Cette représentation algébrique méthodes multivariées sont apph~uees ~ des, onnees SlS; ~
de données de puits sur le
permet de « visualiser» les variables et les unités statistiques dans un but exploratoire met- géologique de ces d,onD~ .. Ceci clons).Ist~v::;n~r::~tan~ entre la réponse sismique et les
tant en évidence des strucrures et modèles. réservoir et de donnees sismiques, e ien
En vue de leur traitement, les données s'organisent dans des tableaux de données. Soit paramètres lithologiques ou pétrophysiques. , 1 fi rme d'une section sismique
Jle nombre des variables (que nous noterons Zi .i= 1, ...,J) connues par leurs mesures zl Généralement les données sis~que.s se pr~se~tent ~us a tOun bloc 3D. La méthodolo-
sur n individus (n réalisations i= I, ..., n)_ À ces données correspond un tableau Z à n lignes verticale (20) ou d'un ensemble d honzons sismiques orman 1 (Mathieu el al
gie statistique que nous présentons et qui est ap~liquée p~ es a~teurs 1 1992 1995':
(indiVidus) et J colonnes (variables), dont le terme courant est z/ (malrice rectangulaire de l )988' Fournier 1989 Fourruer et ai., , ,
dimension nJ). 1969; Doyen, 1988; ~yenà et ~., e une'petite fenêtre si~que à l'intérieur du réservoir.
Joseph el al.• 1993) consiste ~ rié r r ée à d e s portions de traces dans cette fenê-
Les techniques statistiques multivan es app rqu s
·....1QUE Er ANAI.rsES Da DONNÉES
333
Chapilre 8 AIIM.xe J • $1'111'1.,.. •
332 C""P/lre 8 A""exe J • STATISTIQUE ET ANALYSES DE DONNÉES

d'"tte orthogonales deux à deux; ce qui signi-


., é

tre, permettent de décrire la morphologie de ces traces dans le but de les classifier en fonc- . santes obtenues ont, par ailleurs, la propnet e ariables i itiales
éli . d dance éventuene des v es uu .
tion de cette morphologie. Dans de teUes fenêtres, les traces sont mesurées sur un nombre fie qu'elles un ment toute re on . . les domaines d'utilisation. Elle est connue
assez faible d'échantillons sismiques (de l'ordre de la dizaine ou de la vingtaine). La méthod~ porte des nomLosd:fféren:é~::POSitiOn en valeun singulières (Glangeaud
Les traces sont considérées comme des unités statistiques (ou individus) caractérisées sous l'appellauon ((arbuneD- eve ou
par des .ttributs sisllÛques. Les méthodes factorielles leur sont alors appliquées pour dé- et Mari, 1994), éolo ique des données sismiques (analyse, à partir de
terminer des groupes de morphologie similaire mettant ainsi en évidence des faciès sism], . Dans le ca~e du calibrag~ gt de ~onnéeS sismiques, du lien éventuel existant entre la
ques. Les techniques multivariées utilisées s'apparentent aux méthodes de reconnaissance . données ~e p.Ultssurlie r~:~ lithologiques ou pétrophysiques), une étape préliminaire
de formes. Les attributs utilisés sont divers: amplitudes sismiques, impédance, énergie répOnse sismique et es P . ne retenir qu'une partie de celle-ci considérée comme
totale d'une trace, caractéristiques statistiques de dispersion, composantes principales obte- serait de filtrer l'informatiOn ~o~ les peuvent dans cette optique, se substituer aux don-
nues à partir des amplitudes sismiques, coefficients de décomposition en polynômes ... pertinente. Les composantes pnncipa nributs et servir dans l'étape de calibrage. Par
(Justice et 01., 1985). nées sismiques en tant .que nO~:c~~t~er les amplitudes sismiques à l'aide des premières
Le but étant de mettre en évidence le lien éventuel entre la géologie et les attributs sis- ailleurs, l' ACP p~ servir ?our litudes « épurées ) de tout bruit aléatoire.
miques, deux approches sont possibles : sans apprentissage ou avec apprentissage. . composantes ce qm rendrait alculer variable synthétiquej(') combinaison linéaire des
L'analyse en composantes principales pourrait être appliquée, dans un premier temps, L'idée de }'ACP est de ca c er ~e '. '
aux données sismiques pour « filtrer)} le bruit aléatoire ou pour substituer aux amplitudes variables initiales, dont la variance CJ f est maximale :
sismiques les composantes principales utilisées alors en tant qu'attributs sismiques dans la j = u,Z , + 1.12
Z2 +... + U j z' - Zu
-
(1)
phase de reconnaissance de forme.
L'analyse en composantes principales peut être aussi utilisée en tant que phase prépara-
toire des données établissant une première typologie des traces précédant la classification de
celles-ci, U2 est le vecteur-colonne de Ri des} coefficients de l'écriture (1).
.. U""
L'approche saDS appreQtissa~e consiste à appliquer des méthodes de classificarion hié-
rarchique aux traces caractérisées par les attributs sismiques pour classifier celles-ci en
Il)
groupes homogènes et bien séparés. L'information géologique est utilisée a posteriori pour
une caractérisation lithologique de ces classes. • 2 e la dis ersion des valeurs de la variable f autour de .sa .v~leur
La variance CJ f mesur PI' J:d'mensionnel de représentation des individus,
L'approche avec apprentissage utilise les méthodes de classement. Elle intègre la con- moyenne. Donc j correspond, dans espace Id' t individus L'écriture matricielle
naissance a priori relative à un sous-ensemble de traces au voisinage de puits dont on a à la direction d'allongement maximal du nuage es pom s- .
connaissance des propriétés géologiques. La technique de classement consiste à utiliser de cette variance est :
cette information a priori pour prédire les propriétés géologiques des traces entre les puits, 1 T T TC (2)
"r2 ""," Z ZU=1l ZZU
n
L'expression (2) suppose que les variables sont centrées. Ceci ne modifie en rien la gé-

néralité de la méthode. . bl .., 1 d t la variance est maximale est celle


8A3.2 INFORMATIONS COMPLÉMENTAIRES La combinaison linéaire j des varia es
tla
17
e~. on C des variances-covariances des
correspondant à 1.1 E RJ. vecteur ,~ropr~ de(3)3 ~ lIce ulZZrangéspar ordre décroissant des
données. Il existe J solutions de 1 équation u , u ,..., ,
8A3.2.I Analyse en composantes principales (ACP) . x sur le plan cie position des données. Ces traces
, Soit nie nombre des traces localisées aUXabsclss.es ~I' x:'3t>·d;.n; une fenêtre cie temps autour du réservoir. Les
Le point de départ de l'analyse en composantes principales (ACP) est un ensemble constituent une section sismique 20 ou un bloc s.s~~q:e. ns-temps (èchantillons sismiques) l,. 1')) ' •.••• " qui
amplitudes sismiques cie ces traces c:orrespondant . Orlm.. échantillon 1 sera considéré en tant que
d'individus caractérisés par un nombre assez élevé de variables quantitatives. La méthode sont désignées par les valeurs zo, t). Pour les notll\l~s ~tlSl .•ques.~ncet1e variable ~ur l'individu 1 (trace sismi-
permet de réduire le nombre de ces données en calculant de nouvelles variables - combinai- variableet Zi = zo, 1). désignera ~ors 18:es~re (~~~~::~~e~. U est fonné de n lignes(traces) et J colon-
sons linéaires des variables initiales - appelées composantes priqcipales qui, tout en syn- que xJ Le tableau Z éorrespondant a ces onnees es .
thétisant l'information, mettent en évidence les interdépendances des données. Les premiè-
res composantes sont porteuses d'information principale « épurée» du bruit aléatoire (celui-
nes (horizoos-tetnps). . . •
Une trace, si elle est au VOlslD~e dun puits.
.
rcaractérisée des propriétés litbologiques mesurees au
ése ~ Ces caractéristiques sont codées par de~
puits (forte ou faible porOSIté, cnvllormeroent sabeWl oud!., p~"~nstitue un tdlantiUoo d'apprentissage qUi
. _,.' L'ensemblc: des traces au vossmage ~ . .
ci, dû aux incohérences des mesures, est rattaché aux dernières composantes). Les comPO- vanables qu....tauves, . "-"';on cI'information lithologique a pt'IOf1.
sert dans la phase cie classement nec IlI( ....&'-
Chapitre 8 AMexe 3 • STATISTIQUE ET ANALYSES DE DONNÉES 33:
334 Ch4pilre 8 Annexe 3 • STAT/STIQUE ET ANALYSES DE DONNÉES

valeurs propres À-t ;2; ~ ;2; .•• ;2; À-J. Ces vecteurs propres génèrent respectivement les varia- Dans le cadre du calibrage géologique par la sismique, les unités statistiques sont de
blesfl,f2, ...,fJPourj = 1, J on a: traces sismiques que l'on se propose de regrouper en classes de morphologie similair
(faciès sismiques). Dans ce cas, aucune connaissance lithologique n'est utilisée.
Czzui = À iui (3)
Plusieurs techniques existent et sont utilisées selon la taille des données traitées. Le
La variable fl générée par le vecteur u j est la j "Ille composante priocipale. C'est un méthodes de classification ascendante biérarchique (CAH), méthodes basées aussi bie:
variable synthétique (combinaison linéaire des variables initiales) dont la variance est égal: sur des représentations algébriques des données que sur l'estimation de la fonction de den
à ..lj. .
sité, les méthodes de partitionnement et la classification par estimation des modes. Plusieur
Les premières préservent l'information principale - au sens de la variance - du signal algorithmes de ces deux méthodes existent. Nous présentons deux classiques pour avoir tm
alors que les dernières sont rattachées à tm bruit aléatoire. idée sur la mise en œuvre de ces techniques: la méthode ascendante hiérarchique d
Si l'utilisateur décide de retenir les q premières composantes, celles-ci lui permettent d Ward et la méthode de partitionnement des nuées dynamiques.
reconstituer les données d'origine dans un tableau T portant l'information principale. Soit;
le tableau (à n lignes et q colonnes) associé aux q composantes, A la matrice diagonale de
dimension qq des q premières valeurs propres et U la matrice de dimension Jq dont les A. La méthode de classification de Ward
colonnes sont constituées des q premiers vecteurs propres de Ca, alors Z' s'écrit: Rappelons qu'une classification des individus est l'organisation de ceux-ci en classe:
La variance J-dimensionnelle du nuage de ces individus peut être décomposée en un
Z· = FUT =/(u1t +... +fq(uqf (4)
somme de deux variances: la variance intraclasse (égale à la somme des variances
· l'intérieur des classes) et la variance interclasse (égale à la variance du nuage des centre
La part d'information conservée par les q premières composantes principales retenues
est donnée par la quantité: · de gravité des classes).
Une bonne partition est celle dont les classes sont homogènes (variance intrac1asse fa
(5) · ble) et bien séparées (variance interclasse forte). L'algorithme de classification de War
utilisera ce principe par étapes itératives: il part de la partition la plus fine (où chaqr
Cette quantité est généralement remplacée par la part de la variance totale des données classe est un singleton) et agrège à chaque étape les classes pour lesquelles la perte de :
expliquée par les q premières composantes: · variance interclasse est la plus faible. La différence entre la variance interclasse après agn
. ~+ ...+À.q gation et la variance interclasse avant agrégation est utilisée en tant que distance entre h
~=lOO----------~--- (6) · individus (ou entre les classes formées d'individus agrégés). Sa valeur, si elle est faible poi
Àt +... +2q + 2q+1 +... +2) deux individus (ou deux classes d'individus), signifie que les deux individus (ou les del
qui indique le pourcentage de l'information (variance) restitué par les q premières compo- classes) en question, en étant agrégé(e)s, formeront une nouvelle classe bien homogène.
santes principales. L'ensemble des agrégations fournies aux différentes itérations est schématisé par un a
Les colonnes du tableau T de l'expression (4) correspondent aux variables initiales fil- bre (appelé arbre de classification) dont les niveaux décrivent les partitions emboîté
trées par les q premières composantes principales. Les variables sont restituées avec un · obtenues par agrégations successives.
pourcentage d'inertie égal à 1'1' Par exemple, si q = 2, les) variables initiales peuvent être
représentées par leurs covariances ou corrélations avec les 2 premières composantes princi- B. La méthode des nuées dynamiques
pales. Ces variables sont alors représentées par des points à l'intérieur d'un cercle de rayon
l'unité appelé cercle des eerrétanens (si c'est la corrélation qui est utilisée comme critère Le déroulement de cette méthode est le suivant:
de comparaison des variables entre elles). • On initialise (aléatoirement ou par choix de l'utilisateur) k points dans l'espace d·
Ce graphique permet à l'utilisateur de visualiser les variables initiales sur un plan pero individus k étant le nombre de classes désiré par l'utilisateur.
mettant à la fois de réduire la dimension des données et d'obtenir la classification des varia- • On affecte à chaque point les individus qui s'en trouvent les plus proches au se:
bles initiales en fonction de l'information mise en évidence par 2 seules composantes. d'une métrique donnée. Ceci permet de partitionner le nuage des points en k groupes
• On calcule le centre de gravité de chacun des k groupes qui remplacent les k poir
désignés initialement,
8A3.2.2 Les méthodes de classification • On recommence l'opération d'affectation des individus aux k points ...
Et ainsi de suite jusqu'à ce qu'aucun individu ne change de classe entre <jeuxétapes su
Les méthodes de classification consistent à organiser les unités statistiques en classes
cessives. Les groupes (dont le nombre est au plus égal à k) obtenus à la dernière étape so
homogènes et bien séparées.
alors retenus.
ChcpiIn 8 Anne.u J • STATISTIQUE ET ANALYSëS DE DONNÊES 337
336 ChapI,,,,, 8 ANW.lr~ J • STA T1ST1QUE ET ANALYSES DE DONNÉBS

La loi bayesienne consiste à affecter l'observation Z, au groupe qui a la probabilité


8A3.2.3 Les métbodes de classement p(G/z) maximale. Pour ceci, il est nécessaire de co~tre !t(zl' ~ene. quantité n:ét~t pas
connue, il est question de l'estimer. Deux approches existent : 1 esnmanon parametnque et
l'estimation non paramétrique.
Étant en possession d'une population partitionnée en K groupes (ces groupes sont obt _
nus par une méthode de classification ou sont des groupes d'apprentissage), il s'agit, pan;t
•. Estimation paramétrique de la densité
de cette connaissance a priori, d'affecter des individus non classés à l'un de ces groupes.
Les classes d'apprentissage peuvent être constituées, dans le cadre du calibrage géologi- Ces méthodes consistent à se donner une famille paramétrée de lois de probabilité pour
que par la sismique, de traces sismiques au voisinage des puits dont on connaît les proprié- fk(z) et à estimer les paramètres à ~artir des do~~es el.les-m~mes. Le cas gaussien f-dimen-
tés lithologiques. On se sert alors de cette information pour déterminer les propriétés litho- sionnel suppose que z suit une 101 de probabilité J.dimensionnelle N Jv.Ik>"E.k) pour chaque
logiques associées à des traces entre les puits. groupe k. Cette loi de probabilité s'écrit:
Les méthodes de classement servent à associer les individus non classés aux groupes qui
leur sont les plus conformes. La méthode utilisée s'appelle analyse discriminante. Deux
règles d'affectation sont utilisées pour définir celte conformité : la règle géométrique et la
J.(,)=
(2a )
J/2~e)
det I..I: ~
_2.(z_ p,)' L,'(,-
2
P.)] (9)

règle bayesiuDe.

I. est estimée par nC/(n - 1) et f.l/c est estimée par gk Cie et gk représentent respective-
A. La règle géométrique d'affectation men/la matrice de variance intraclasse et le centre de gravité relatifs au groupe k.
Les individus, caractérisés par les J variables quantitatives, sont représentés en tant que
points de l'espace J-dimensionnel RJ La règle géométrique consiste à calculer les distances b. Estimation Don paramétrique de la densitè
des individus au K groupes et d'affecter chaque individu au groupe le plus proche. Cette dénomination désigne une famille de méthodes qui - sans faire d'hypothèse spé-
Cette distance est définie par une métrique Q de sorte que la distance entre un individu cifique sur la distribution J-dimensionnelle du vecteur z = (zl, ... , zl) - estimenth(z). par la
Z; et le centre de gravité g" du groupe k s'écrit: .proportion des points dans un voisinage local autour de z dans 1'es~ace. RI ..
C'est ainsi que l'estimation par boules, par exemple, consiste a estimer fk(z) par la
(7) quantité:
fk·=~
On affecte l'individu Z, au groupe k qui correspond au minimum de cette distance. c».
La métrique utilisée peut être aussi bien la matrice de variance totale que des métriques 1=I,K

,dites locales correspondant, par exemple, aux matrices de variances interclasses.


L'utilisation des métriques locales se justifie par ce qu'elles influent sur l'affectation en où nAreprésente le nombre d'individus du groupe k dans une boule de rayon r donné autour
faisant intervenir les formes des sous-nuages de points associées aux classes. du point z = (z], ..., z-") de l'espace RI. . .. .
L'estimation par les K plus proches voisins (KPPV) opère de façon .. similaire ~
l'estimation par boules; c'est cependant le nombre d'individus, fixé par l'utlhsate~, qID
B. La règle bayesienne d'affectation
influe sur le rayon de la boule. Celui-ci est alors modifié à chaque voisinage en fonction de
Cette règle est basée sur le théorème de Bayes. Celui-ci donne la probabilité que le point la concentration des points dans le voisinage considéré.
ZI de coordonnées (Z:.Z;, ... ,Z/, ... ,Z/) appartienne à la classe Gk (.k== l ,..., K) par la
fonnule:

(8)

On suppose que la distribution de probabilité du vecteur z == (ZI, ... , ZJ) est donnée, pour
chaque groupe Gk> par une densitéh(z). Les K groupes sont en proportions PI' P2>PK dans la
population totale.

Vous aimerez peut-être aussi