Vous êtes sur la page 1sur 49

REPUBLIQUE DU CAMEROUN REPUBLIC OF CAMEROON

Paix – Travail - Patrie Peace – Work - Fatherland


--------------------------- ---------------------------
UNIVERSITE DE DOUALA THE UNIVERSITY OF DOUALA
--------------------------- ---------------------------
FACULTE DES SCIENCES FACULTY OF SCIENCES
--------------------------- ---------------------------

CENTRE DE FORMATION ET DE RECHERCHE EN SCIENCES PETROLIERES ET MINIERES


PETROLEUM AND MINING TRAINING AND RESEARCH CENTER

Matricule : 19S38076

MACHINE LEARNING APPLIQUE A LA


CLASSIFICATION LITHOLOGIQUE : CAS DE LA
PARTIE NORVEGIENE DE LA MER DU NORD

Mémoire de fin stage présenté en vue de l’obtention du


Master Professionnel en Mines et Pétrole
End of internship dissertation submitted to obtain the Professional Master in Mining and Oil

Option/Option
Géophysique Pétrolière/Petroleum Geophysics

Par/By
OWONA MBOUH Noël Raphaël

Encadreur professionnel Encadreur académique


Professional supervisor Academic supervisor
Ing Axel Dorian PIEPI Dr Joseph Bertrand IBOUM
Ingeneer Resevoir Chargé de Cours
University of Cape Town Université de Douala

Année Académique/Academic Year : 2020-2021


DECLARATION

Ce mémoire représente mon travail original et le sujet abordé dans ce travail n’a pas été l’objet
d’un précédent travail dans une autre université, pour la délivrance d’un diplôme. Toute
information mentionnée a été correctement citée et non plagiée.

This thesis is my original work and the matter embodied in this work has not been presented
earlier for the award of degree or diploma in any other University. Any information referred to
has been properly cited and not plagiarized.

Signature : …………………… Date…………………


Noms et Prénoms : OWONA MBOUH Noël Raphaël
Name
Matricule : 19S38076
Matric N°

CERTIFICATION

Ceci atteste que ce projet a été réalisé par OWONA MBOUH Noël Raphaël, Matricule Numéro,
19S38076 sous ma supervision au Centre PETROMINES, Faculté des Sciences, Université de
Douala, Cameroun

This is to certify that this project was carried out by OWONA MBOUH Noël Raphaël, Matric
No. 19S38076 under my supervision in the PETROMINES Center, Faculty of Sciences,
University of Douala, Cameroon.

Signature………………………… Date………………….

Encadreur : Dr Joseph Bertrand IBOUM


Grade/ Chargé de cours
Institution/Structure : Faculté des Sciences

Signature………………………… Date………………….

Encadreur : Ing Axel Dorian PIEPI


Grade/ Ingeneer Reservoir
Institution/Structure : University of CapeTown

Signature………………………… Date………………….

Encadreur …….
Grade/ …….
Institution/Structure …….

i
DEDICACE

Je dédie ce travail à :

A mes parents
REMERCIEMENTS

Je tiens tout d’abord à remercier Mme le Doyen de la Faculté des Science et du centre
PETROMINES, le Pr NTAMAK-NIDA Marie Joseph pour avoir créé le centre PETROMINE
et pour m’avoir accepté aux seins de cette formation.

Je remercie chaleureusement mon animateur pédagogique et encadreur académique, le Dr


IBOUM Joseph pour avoir mis à ma disposition une formation de qualité et pour m’avoir encadré,
motivé et conseillé le long de mon cursus. Trouvez ici l’expression de ma profonde
reconnaissance.

Je remercie particulièrement mon encadreur professionnel, Mr Axel Dorian PIEPI, pour avoir
cru en moi et pour m’avoir fait confiance durant ces travaux sans laquelle je n’aurais pas pu donner
le meilleur de moi-même.
Grâce à vos compétences, votre sagesse, vos encouragements, vos conseils, votre ouverture
d’esprit et votre disponibilité, j’ai pu mener mon projet d’étude en toute sérénité et avec beaucoup
d’enthousiasme. Trouvez ici l’expression de ma profonde reconnaissance

J’exprime un grand remerciement à mes professeurs, qui m’ont formé avec patience et attention,
il s’agit du Pr MVONDO, Mr NKOT Jean Blaise, Mr MBELEG MBELEG Scotty, Mr
KOTTO KOMBI, Dr ECOTTO, Mr TCHATO Dynis, Mr TSOBLEFACK Wilfried, Mr
NYETTO Fulbert.
Je remercie également les membres du jury qui me font l’honneur d’évaluer ce travail
Ma reconnaissance sincère va à l’endroit de l’équipe de GEORESCH pour m’avoir donné
l’opportunité de réaliser ce travail et pour avoir mis à ma disposition leur expérience professionnel,
notamment Mr MOUAFO Dieubeni, Mr AMALIGA Yves et Mme Dominique.

Finalement, toute ma gratitude va à la famille MBOUH, à ma maman Mme Mireille MBOUH,


à ma grand-mère Mme MBOUH MENGUE Louise, ma grande sœur Mme MENGUE MBOUH
Crance, mon petit frère Mr MBOUH NZIBI Erik ainsi qu’à mon grand frère Mr MBOUH
Marcel Aristide et sa famille qui m’ont apporté un soutien quotidien. Merci de m’avoir soutenues
et encouragés surtout de n’avoir jamais douté de moi.

Je profite de l’occasion pour remercier ma promotion, tous ceux qui ont contribué d’une façon ou
d’une autre à l’élaboration de ce travail. Distinctement, Mr Joseph KOMBI et Mr Abdouramane
MBASSA.
SOMMAIRE

DEDICACE.................................................................................................................................... ii
REMERCIEMENTS ....................................................................................................................iii
SOMMAIRE ................................................................................................................................. iv
LISTE DES FIGURES.................................................................................................................. v
LISTE DES TABLEAUX ........................................................................................................... vii
LISTE DES ABREVIATIONS .................................................................................................viii
RESUME ....................................................................................................................................... ix
ABSTRACT ................................................................................................................................... x
INTRODUCTION ......................................................................................................................... 1
Chapitre 1 : Généralité ................................................................................................................. 2
1- Présentation de la structure d’accueil ................................................................................... 2
2- Présentation de la zone d’étude : cas de la partie norvégienne de la mer du nord ............... 2
3- Revue de la littérature .......................................................................................................... 6
4- Le machine learning ........................................................................................................... 10
Chapitre 2 : Données, outils et méthodes .................................................................................. 12
1- Données .............................................................................................................................. 12
2- Outils .................................................................................................................................. 13
3- Méthode .............................................................................................................................. 13
Chapitre 3 : Résultat et discussion............................................................................................. 21
1- Résultat ............................................................................................................................... 21
2- Discussion .......................................................................................................................... 32
CONCLUSION ............................................................................................................................ 33
BIBLIOGRAPHIE ...................................................................................................................... 34
ANNEXE 1 ................................................................................................................................... 35
ANNEXE 2 ................................................................................................................................... 36
ANNEXE 3 ................................................................................................................................... 37
ANNEXE 4 ................................................................................................................................... 38
F
iFg u
riguree1345::C aN
rC
tDeloasghridfm
scatcihoanm p
srdesédcnaulpultaiorteensl
F
iFg u
riguree678910::A
LISTE DES FIGURES

lg o r i t
h m e d
u continental norvégien ....................................................... 3
Figure 2 : Colonne litho stratigraphique de la mer du nord ............................................................ 5

D s b u o n spa ti l e à a f o
i
......................................................................................................................... 6

Po r c e t g ed r
on Folk 1962 .................................................................. 8
-sonic (a) et densité en fonction du facteur photoélectrique

F
iFg u
riguree1123567::N 'A m b ap it o n d e ch
aq
u
e
l
i
t
ho
g
ie
p
a
r
p
or
t
a
u
n
o
mb
r
e
t
oa
l
d
e
o

e
s
(b) .................................................................................................................................................. 10

lg o ri
t hm e d cr s p l t s1
: algorithme principale du machine learning .................................................................. 11
e l'apprentissage supervisé ...................................................................... 11

Ex a c n o n
: Importation des données ............................................................................................... 13

Re n o m i t d u t i r e d l
ac
o
ne
d
so
n
é
e
s
s ders puits d'entrainement et du teste .............................. 13

D é t r a s n é sm
q
ua
t
ésence des diagraphies ................................................................... 13

F
iFg u
riguree1228903::S u p s o n e l g à ve
r
: Nombre d'apparition de chaque lithologie sur l’ensemble des puits .......................... 14

Co l i tr d o d
'

e
.. 14

D n é
e a b s
......................................................................................... 14

é im t o n d
e n é e a
br
a
t
s
e 14 : Données d'entrée et de sortie ...................................................................................... 14

A lg o r hm cro p l t 2
ées ............................................................................................... 14

P a e t s d s
...................................................... 15

F
iFg u
riguree22456789::iM
..................................................................... 15

m p o rt i o n c
l a if e u r
.............................................................. 15

d e l s K N
........................................................................ 15

V a r é d c l a si
f
e
u
r
..................................................................................................... 15

A
............................................................................ 16
........................................................................................... 16

Figure3012:S cC
rA o
elgbidthum c'alpreondtilsagcelsifeur
............................................................................................ 16
Fractionnement des données ....................................................................................... 16
................................................................................................ 17
.......................................................................................... 17
................................................................................. 17
lgorithme de courbe de validation, .......................................................................... 17
: Validation croisée de recherche par grille .................................................................. 17
assifieur ..................................................................................................... 18
............................................................................................... 18
................................................................................. 18
F
iF
g u
riguree3345678::A lP
g
rD
iN
tiéum
so
e
p
ro
c
bn h
a
tm
i g
'ene dp o
ad
s
te
l
i
l
r
o n
n d c
él
e
s
c
ea su
li
m
if
t
hp
soe
o
du r

g( s
f
r nit
he
uj
i )
u
e
r p
s
ld r p u
its
F
iF
g u
riguree34490123::C o
r s p l
o t sa p it d q u e lit o g r le 97 p u
i
t
s
..................................................................... 19

Ex
t a c i n d e o
n é e s ' nt ré d e s t
i
......................................................................... 20

Do
n ée m a q u t
............................................................. 21

Su
p r s o sl
i
g a y d e s v al u r m a n qu tes
...................................................................................... 21

C l ti n d e Sp r s m n
.................................................... 22

F
iF
g u
riguree445567890::Do
n ée a b r nt
....................................................... 22

Ei
m o so é e ab r a n t es
......................................... 23

Cr s p l t p è a i m nt
................................................................................................................... 24

F
iF
g
rF u
:iig e 1 D
Co
n
o ée
e r é m t
pr a d’ap re n tis a g e t v a lid t o n
............................................................... 25

u b d v a l d o
.................................................................................................. 25

Ma trix c o n f u
si n
............................................... 25
........................................................................................... 26

u
rguree552346::R éR
sE u
lréseultareenxcppoéérrtim
em
tedntaanllsde'exacclussioinfcdaetilo'angdouripthm
ite1X
65/G
29B
..................................................................................................... 26
............................................................................ 27
.......................................................................................... 28
..................................................................................................... 29

O
S
T
................................................................................................... 29
.................................................................................................... 30
............................................... 30
-11 A %s (Prédiction 4) ........ 31
-13 %s (Prédiction 1) ............ 35
du puit 35/9-6S %s (Prédiction 2) .......... 36
de la classification du puit 33/6-3 S %s (Prédiction 3) ........... 37
................................ 38
LISTE DES TABLEAUX

Tableau 1 : Classification selon l'origine des éléments constituant la roche .................................. 7


Tableau 2 : Classification selon la taille des constituants .............................................................. 7
Tableau 3 : Classification selon la composition chimique .............................................................. 7
Tableau 4 : Signature des diagraphies de puits communs pour l'identification de lithofacies ........ 9
Tableau 5 : Lithologie et code correspondant ............................................................................... 12
Tableau 6 : Tableau indicatif des lithologies ................................................................................ 23
LISTE DES ABREVIATIONS

GSERC Geo-system Engineering Research center


KNN K-Nearest Neighbors
GR Gamma Ray
RDEP A definir
RHOB A definir
NPHI A definir
DTC A definir
RESUME

Au cours de notre stage au centre de recherche GSERC, nous avons réalisés une lecture
automatisée des lithologies utilisant le concept de machine learning. Nous avons dans le cadre de
notre étude utilisé quatre-vingt-dix-huit (98) puits situé dans la zone de la partie norvégienne de la
mer du nord. Au cours de cette étude, nous avons observés les lithologies qui ont été interprétés
par les géologues et nous les avons utilisées comme données de sorties et choisi cinq (5)
diagraphies comme données d’entrée. Ces données nous ont permis de classer les lithologies sur
un puits que nous avons gardé pour évaluer notre classificateur nommé KNN et comparer nos
résultats avec l’interprétation obtenu par les géologues.
L’objectif de cette étude était de montrer que le machine learning est un atout non négligeable
pour la classification des lithologies et un remplaçant de choix pour une lecture rapide et sécurisée.
Nous avons appliqué comme méthode un apprentissage supervisé au moyen du langage de
programmation Python et de l’application web Jupiter. Les résultats que nous avons obtenus, nous
ont permis d’aboutir à la conclusion que l’algorithme KNN que nous avons utilisés pour classifier
les lithologies est valide avec une moyenne de 27% de réussite.

Mots clés : machine learning, lithologie, KNN, apprentissage supervisé


ABSTRACT

During our internship at the GSERC research centre, we performed an automated lithology reading
using the concept of machine learning. In our study we used ninety-eight (98) wells located in the
Norwegian part of the North Sea. In the course of the study, we observed the lithologies that were
interpreted by the geologists and used them as output data and selected five (5) logs as input data.
These data allowed us to classify the lithologies on a well that we kept to evaluate our classifier
named KNN and compare our results with the interpretation obtained by the geologists. The aim
of this study was to show that machine learning is a valuable asset for lithology classification and
a good substitute for fast and secure reading. We applied a supervised learning method using the
Python programming language and the web application Jupiter. The results we obtained allowed
us to conclude that the KNN algorithm we used to classify the lithology is valid with an average
of 25% success rate.

Keywords: machine learning, lithology, KNN, supervised learning


INTRODUCTION

La lithologie est une discipline de la géologie qui a pour objet d’étude les propriétés
physiques et chimiques des roches, de même que la disposition des composants des roches entre
eux. Cependant, dans l’industrie pétrolière la classification lithologique est très importante dans la
mesure où elle joue un rôle déterminant au niveau de la caractérisation des réservoirs pétroliers.
C’est à partir de cette classification de la lithologie qu’on pourra estimer la distribution des
caractéristiques pétro-physiques au sein du réservoir tels que la porosité, la perméabilité et la
saturation en eau. Elles sont indispensables pour une bonne appréciation des réservoirs en vue
d’une meilleure sélection des techniques de production adéquates durant la phase de
développement. Par ailleurs, la classification lithologique dans le domaine pétrolier se fait
généralement de deux manières, nous avons l’analyse des carottes et la méthode dite
conventionnelle qui consiste à l’analyse manuelle des diagraphies par un géologue expérimenté.
Bien que la classification de la lithologie par l’analyse des carottes soit la plus précise elle est
cependant très couteuse et ne peut donc être réalisée sur tous les puits de forage. Par contre, la
méthode conventionnelle utilisant les digraphies nécessite moins d’investissements en termes de
cout et permet d’avoir une classification lithologique satisfaisante sur l’ensemble des puits. Mais
alors la méthode conventionnelle pose des difficultés dans la mesure où elle est très fastidieuse et
très longue à cause du grand volume de données mis à l’appréciation du géologue. Pour pallier à
cette limite, nous allons dans notre travail proposer une technique ayant pour but de classifier la
lithologie. Cette technique est basée sur le machine learning (apprentissage automatique) qui est
une sous-catégorie de l’intelligence artificielle. Elle permet à l’ordinateur d’apprendre de manière
autonome à effectuer une tache grâce à des algorithmes spécifiques en fonction du résultat
souhaité. On se pose alors la question de savoir est-ce que le machine learning pourra être une
alternative future pour le travail de classification des lithologies ?
Pour essayer d’apporter des éléments de réponses à notre problématique, nous avons divisé ce
travail en trois chapitres :

 Généralité qui présente la zone d’étude et la revue de littérature ;

 Donnée, outils et méthodes qui montrent les outils utilisés et la méthode exploitée dans
cette étude ;

 Résultats et discussions qui présentent les résultats obtenus.


Chapitre 1 : Généralité

1- Présentation de la structure d’accueil

Cette recherche a été couverte par Geo-system Engineering Research center (GSERC), à travers
des travaux en ligne et des échanges physiques. Le GSERC a été fondé en mars 2020 avec pour
objectif principal de se consacrer à la résolution de problèmes liés à l'industrie pétrolière et gazière.
Au GSERC, nous sommes désireux de développer, par le biais de la recherche théorique et
pratique, d'améliorer les méthodes de l’industrie pétrolière pour augmenter la récupération des
hydrocarbures dans les réservoirs de pétrole et de gaz. Par ailleurs, de transférer les nouvelles
technologies à l'industrie et aux institutions indépendantes locales.
Le GSERC est principalement responsable de la recherche sur la stratégie de développement du
génie pétrolier, de l'organisation et du développement de grands projets de recherche d'importance
fondamentale et prévisionnelle, d'outils et de logiciels, y compris le transfert/application des gains
scientifiques.

2- Présentation de la zone d’étude : cas de la partie norvégienne de la mer du nord

Le plateau continental norvégien couvre une superficie de plus de deux millions de kilomètres
carrés (2 039 951 km2). Il est subdivisé en trois grands champs, dont la mer du nord (north sea),
la mer de norvege (norvegian sea) et la mer de Barents (Barents sea). Cependant, la mer du Nord
reste le moteur de l'industrie pétrolière norvégienne avec environ 71 champs en production. On
compte également 21 champs en production dans la mer de Norvège et deux dans la mer de Barents
(Snøhvit et Goliat). Chacune de ces zones est divisée en quadrants correspondant à un degré de
longitude et de latitude. Chaque quadrant est à son tour divisé en 12 blocs. Les quadrants de la mer
du Nord sont numérotés de 1 à 36, tandis que ceux de la mer de Norvège et de la mer de Barents
sont nommés en fonction du degré de longitude et de latitude.
Figure 1 : Carte des champs du plateau continental norvégien

1-1- Le contexte géologique

Le cadre structurel de base de la mer du Nord est principalement le résultat d'un rifting du
Jurassique supérieur/Crétacé inférieur, partiellement contrôlé par des éléments structurels plus
anciens.

▪ Carbonifère-Permien : Rifting majeur avec volcanisme et dépôt de grès fluviatiles et


éoliens rougeâtres (Rotliegendes). Deux bassins se sont développés avec le dépôt d'épaisses
séquences évaporées (Zechstein). Lorsqu'il est recouvert d'une quantité suffisante de
sédiments plus jeunes, les forces de flottabilité provoquent le déplacement du sel vers le
haut (halocinèse). Ceci est important pour la génération de structures fermées, y compris
les pièges à hydrocarbures, dans la partie sud de la mer du Nord et aussi comme contrôle
de la topographie locale et de la sédimentation ultérieure.

▪ Trias : Rifting majeur de N-S à NE-SW avec d'épais sédiments fluviaux grossiers déposés
le long des marges du rift, se transformant en dépôts fluviaux et lacustres à grain plus fin
au centre des bassins. La transition entre le Trias et le Jurassique est marquée par une
transgression marine étendue du nord au sud.

▪ Jurassique : La transgression marine a été suivie par la croissance d'un dôme volcanique
centré sur le point triple entre le Fossé Viking, le Fossé Central et le bassin de Moray Firth.
Le dôme a provoqué un soulèvement et une érosion, et a été suivi d'un rifting. De grands
systèmes deltaïques contenant du sable, du schiste et du charbon se sont développés dans
le nord de la mer du Nord et dans la plate-forme de Horda (groupe de Brent). Dans le bassin
norvégien-danois et le bassin de Stord, le groupe de Vestland contient des séquences
deltaïques similaires recouvertes par des grès marins peu profonds/marginaux. La phase de
rifting jurassique la plus importante dans la région de la mer du Nord a eu lieu au Jurassique
supérieur et a duré jusqu'au Crétacé inférieur. Au cours de cet épisode tectonique,
d'importantes failles de blocs ont provoqué un soulèvement et un basculement, créant une
topographie locale considérable avec l'érosion et l'apport de sédiments. Dans les bassins
anoxiques, d'épaisses séquences de schiste se sont accumulées, produisant la roche mère la
plus importante ainsi que la formation Draupne, qui constitue un important joint pour les
pièges à hydrocarbures dans la région de la mer du Nord.

▪ Crétacé : Le rifting a cessé et a été suivi par une subsidence thermique. Le Crétacé
supérieur de la mer du Nord est dominé par deux lithologies contrastées. Au sud de 610 N,
il y a eu un dépôt de craie, tandis qu'au nord, les carbonates ont laissé place à des sédiments
siliclastiques à dominante argileuse.

▪ Cénozoïque : Au Paléocène/Eocène, il y a eu d'importants mouvements terrestres avec le


début de l'expansion des fonds marins dans l'Atlantique Nord et la formation de montagnes
dans les Alpes/Himalaya. Dans la mer du Nord, le dépôt de craie s'est poursuivi jusqu'au
Paléocène précoce. Le soulèvement des marges du bassin, dû à l'inversion, a produit une
série de ventilateurs sous-marins transportés de la plate-forme des Shetland vers l'est. Ces
sables s'interfacent avec des schistes marins dans les groupes de Rogaland et d'Hordaland.
Au Miocène, un système deltaïque s'est développé depuis la plate-forme des Shetland vers
le secteur norvégien de la mer du Nord, et est représenté par les formations de Skade et
d'Utsira. En raison d'un soulèvement important et de l'érosion glaciaire quaternaire du
continent norvégien, d'épaisses séquences ont été déposées dans la mer du Nord au cours
du Néogène. Cela a conduit à l'enfouissement des roches mères jurassiques à des
profondeurs où des hydrocarbures pouvaient être générés et où les joints étaient efficaces.
Figure 2 : Colonne litho stratigraphique de la mer du nord

1-2- Contexte géographique

Au nord il est limité par la mer de norvège, au sud par la limite maritime avec le Danemark, à
l’ouest part la paritie continentale de la norvège et à l’est par la limite maritime avec le Royaume-
Uni. Les puits présentés dans notre travail sont situés dans le central north sea.
Figure 3 : North sea

3- Revue de la littérature

1-1- La lithologie

La lithologie est la branche de la géologie qui étudie la composition des sédiments ou des roches,
comprenant les caractéristiques physiques et chimiques, telles que la couleur, la composition
minéralogique, la dureté ou la taille des grains. L’aspect physique, chimique ou biologique d’une
roche observable en macroscopie est appelé faciès et on peut ainsi distinguer les lithofaciès.
1-2- Classification des roches sédimentaires

Les roches sédimentaires sont classées en selon les critères suivants : l’origine des éléments de la
roches, la taille des constituants et selon leur composition chimique (voir tableau 1, 2 et 3).

Tableau 1 : Classification selon l'origine des éléments constituant la roche

ORIGINE DES CONSTITUANTS DE LA EXEMPLES DE


LES ROCHES
ROCHE ROCHE
Les éléments proviennent des roches Sable, grès,
Détritiques
préexistantes conglomérat, argile
Calcaire, gypse,
Résultent du dépôt des éléments solubles
Chimiques dolomie, évaporite, sel
dans l’eau
gemme
Résultent de l’activité de synthèse assurée Travertin, charbon,
Biochimiques
par les êtres vivants charbon

Tableau 2 : Classification selon la taille des constituants

CLASSE TAILLE ROCHES MEUBLES ROCHE CONSOLIDEES


Galets
Rudites ˃2mm Conglomérats
Graviers
Arénites 2mm-63µm Sables Grès
Silts
Lutites ˂63µm Pélite
Argiles

Tableau 3 : Classification selon la composition chimique

COMPOSITION
CLASSES DE ROCHES EXEMPLES DE ROCHES
CHIMIQUE
Siliceuse Silice Le silex

Argileuse Silicate d’alumine L’argile

Carbonatée Carbonate de calcium Le calcaire

Phosphatée Phosphate de calcium Le phosphate

Carbonée Matière organique Le charbon

Chlorure de potassium,
Evaporitique Le sel gemme
sodium…
▪ Classification de Folk

Cette classification concerne les roches calcaires et est purement descriptive. Son but est que le
nom de la roche identifiée apporte le maximum d'information sans nécessiter une description
complète. Folk distingue trois principaux types de roches calcaires en fonction des proportions
D’allochèmes et de la constitution sparitique ou micritique (microcristalline) du ciment.
Sa classification étant très précise et complexe suppose une description fine des caractéristiques
avec une quantification. Elle a été simplifiée par la suite sous la forme ci-dessous (figure 4).

Figure 4 : Classification des calcaires selon Folk 1962


▪ Classification utilisant les diagraphies

Une diagraphie est un enregistrement continu des variations d'un paramètre donné en fonction de
la profondeur. Les diagraphies sont enregistrées lors d'un arrêt ou en fin de forage. Des outils, ou
sondes, conçus dans ce but, sont descendus dans le trou de forage placé à l'extrémité d'un câble
qui assure la liaison avec les instruments de surface commandant les opérations et groupés soit
dans un camion, soit dans une cabine fixe pour les forages en mer. Une diagraphie qui est
enregistrée pendant le forage est dite instantanée tandis que celle qui est enregistrée après le forage
est dite différée. Parmi les paramètres enregistrés par les diagraphies lorsqu’elles traversent un
matériau on peut citer entre autres, la résistivité, la radioactivité, le potentiel spontané, la densité,
la vitesse du son, le diamètre du sondage, la vitesse d’avancement de l’outil de forage pour ne citer
que ceux-là (voir tableau 4).
Pour autant que l'on sache relier les paramètres mesurés et leurs variations aux propriétés
physiques et/ou chimiques des formations géologiques et des fluides contenus dans ces formations,
on dispose d'un instrument sans égal pour étudier les roches et leur contenu éventuel. Il existe des
relations étroites entre les paramètres physiques enregistrés et les paramètres géologiques comme
le montre la figure 5.

Tableau 4 : Signature des diagraphies de puits communs pour l'identification de lithofacies

Mesures Réponses aux lithofaciès

Gamma ray La radioactivité mesurée est généralement une indication


de la teneur en argile.
Densité Des lithologies différentes peuvent avoir des densités
différentes, mais avec des
Chevauchements corrélés à la lithologie
Neutron La concentration d'hydrogène mesurée dans les pores et la
matrice rocheuse peut être corrélée à la lithologie.
Sonic La vitesse et le temps de transit des diagraphies
acoustiques peuvent varier en fonction de la lithologie.
Résistivité La résistance mesurée au courant électrique est liée aux
types et aux quantités de fluides et peut être corrélée aux
lithofaciès (généralement utilisé avec d'autres diagraphies)
Effet photoélectrique Des lithologies différentes ont tendance à avoir des effets
photoélectriques différents.
Potentiel spontané La résistivité mesurée de l'eau de la formation peut refléter
indirectement les changements de lithofaciès
Figure 5 : Diagramme croisé neutron-sonic (a) et densité en fonction du facteur
photoélectrique (b)

4- Le machine learning

Le Machine Learning a émergé dans la seconde moitié du XXème siècle du domaine de


l’intelligence artificielle et correspond à l’élaboration d’algorithmes capables d’accumuler de la
connaissance et de l’intelligence à partir d’expériences, sans être humainement guidés au cours de
leur apprentissage, ni explicitement programmés pour gérer telle ou telle expérience ou donnée
spécifique (voir figure 6).
Le machine learning apprend à partir de données et utilise ces données pour reconnaître des
modèles. Jay Wilpon, vice-président senior de la recherche sur le langage naturel chez Interactions,
décrit le mieux le fonctionnement de l'apprentissage automatique en utilisant l'analogie des fruits.
Par exemple, supposons que quelqu'un vous remette une orange et un pamplemousse, et que vous
ne les ayez jamais vus auparavant. Comment les différencier ? Ils sont tous deux ronds, mais le
pamplemousse est légèrement plus gros. Vous pouvez donc déterminer que la taille est une
caractéristique qui permet de les distinguer. Maintenant, disons que quelqu'un vous tend une
pomme. Bien que les formes soient similaires, ce fruit est rouge, ce qui vous fait réaliser que la
couleur est un autre élément de différenciation potentiel. Enfin, quelqu'un vous donne une
banane... vous pouvez maintenant ajouter la forme comme autre caractérisation.Cette analogie
simple est similaire au fonctionnement de l'apprentissage automatique.
Le travail de l'apprentissage automatique n'est pas seulement de reconnaître que ce qu'on lui donne
est un fruit, mais aussi de s'assurer qu'il ne qualifie pas un pamplemousse de banane, s'assurer qu'il
n'appelle pas un pamplemousse une banane et vice versa. On regroupe les algorithmes du ML en
trois grandes classes, qui correspondent à différents types d’apprentissage dont l’apprentissage
supervisé, l’apprentissage non supervisée et l’apprentissage par renforcement.
Figure 6 : algorithme principale du machine learning

▪ L'apprentissage supervisé :

Le fait que les données aient été étiquetées ou non détermine si elles sont supervisées ou non
supervisées. L'apprentissage supervisé utilise des données étiquetées par des humains et est
généralement utilisé lorsque les données peuvent prédire des événements probables. En d'autres
termes, il s'agit d'une entrée lorsque la sortie souhaitée est connue. L'algorithme apprend un
ensemble d'entrées avec les sorties correctes correspondantes et apprend en comparant sa sortie
réelle avec les sorties correctes pour trouver les erreurs. Une fois qu'il a trouvé les erreurs, il peut
modifier le modèle en conséquence (voir figure 7).
L'apprentissage supervisé aide les organisations à résoudre une variété de problèmes du monde
réel, comme la classification des spams dans un dossier distinct de votre boîte de réception.

Figure 7 : Algorithme de l'apprentissage supervisé


Chapitre 2 : Données, outils et méthodes

1- Données

Les données utilisées ici sont les diagraphies et elles sont de nature numérique et sont au format
CSV. Le CSV est le fichier de base des données recueillies sans formatage particulier. Chaque
champ est séparé par une virgule. Nous avons utilisés dans notre travail les diagraphies de 98 puits
de forage pétroliers (WELL, DEPTH_MD, X_LOC, Y_LOC, Z_LOC, GROUP, FORMATION,
CALI, RSHA, RMED, RDEP, RHOB, GR, SGR, NPHI, PEF, DTC, SP, BS, ROP, DTS, DCAL,
DRHO, MUDWEIGHT, RMIC, ROPA, RXO, FORCE_2020_LITHOFACIES_LITHOLOGY,
FORCE_2020_LITHOFACIES_CONFIDENCE).
Pour classifier les lithologies nous allons utiliser cinq diagraphies de base qui sont : RDEP, RHOB,
GR, NPHI, DTC à cause de l’information géologique qu’elles peuvent apporter indirectement.

▪ Les diagraphies RDEP, RHOB, GR, NPHI, DTC seront nos données d’entrée tandis que
les éléments de la colonne FORCE_2020_LITHOFACIES_LITHOLOGY seront nos
données de sorties.
▪ La colonne FORCE_2020_LITHOFACIES_LITHOLOGY représente les différentes
lithologies obtenues après interprétation des diagraphies par un géologue expérimenté.
Cependant lithologies sont sous forme d’entier naturel et leur correspondance lithologique
sont observés dans le tableau 5 suivant.

Tableau 5 : Lithologie et code correspondant

Nom de la lithologie Valeurs numériques de la lithologie


Sandstone 30000
Sandstone/shale 65030
Shale 65000
Marl 80000
Dolomite 74000
Limestone 70000
Chalk 70032
Halite 88000
Anhydrite 86000
Tuff 99000
Coal 90000
Basement 93000
2- Outils

Pour le traitement des données dans ce travail, nous avons utilisés Python et Jupyter.
Python est un langage de programmation Open Source, multiplateforme et gratuit, à la fois puissant
et facile à appréhender. Il est largement utilisé et pris en charge
Le Jupyter Notebook est une application web open-source permettant de créer et de partager des
documents contenant du code, des équations, des visualisations, et du texte narratif. Anciennement
appelé IPython Notebooks, il s’agit d’un environnement de calcul interactif basé sur le web
permettant de créer des documents notebooks.

3- Méthode

1-1- Exploration et visualisation des données

▪ Importation des données : Il s’agit d’importer les 98 puits. Pour se faire nous avons utilisés
la bibliothèque pandas.

Figure 8 : Importation des données

▪ Distribution spatiale des différents puits

Figure 9 : Distribution spatiale à la fois ders puits d'entrainement et du teste

▪ Pourcentage de présence des différentes diagraphies sur l’ensemble des puits

Figure 10 : Pourcentage de présence des diagraphies


▪ Nombre d’apparition de chaque lithologie sur l’ensemble des puits

Figure 11 : Nombre d'apparition de chaque lithologie sur l’ensemble des puits

▪ Pourcentage d’apparition de chaque lithologie par rapport au nombre total de données

Figure 12 : Nombre d'apparition de chaque lithologie par rapport au nombre total


de données

▪ Crossplots 1 : Ce sont des outils familiers en géoscience qui permettent de visualiser


comment deux propriétés varient avec le type de roche.

Figure 13 : Algorithme de crossplots 1

1-2- Nettoyage et préparation des données

▪ Définition des données d’entrée et de sortie

Figure 14 : Données d'entrée et de sortie

▪ Extraction des données utiles du grand ensemble de données

Figure 15 : Extraction des données


▪ Renomination du titre de la colonne des données de sortie en « lithologie »

Figure 16 : Renomination du titre de la colonne des données

▪ Détermination des valeurs de données manquantes

Figure 17 : Détermination des données manquantes

▪ Suppression des lignes ayant des valeurs manquantes

Figure 18 : Suppression des lignes à valeur manquantes

▪ Corrélation entre les données d’entrée (méthode de Spearman)

Figure 19 : Corrélation entre les données d'entrée

▪ Détermination des données aberrantes

Figure 20 : Données aberrantes


▪ Elimination des données aberrantes

Figure 21 : élimination des données aberrantes

▪ Crossplots 2

Figure 22 : Algorithme de crossplot 2

1-3- Conditionnement des données

▪ Prétraitement des données

Figure 23 : Prétraitement des donées

▪ Fractionnement des données

Figure 24 : Fractionnement des données


1-4- Entrainement du classifieur KNN

Il s’agit à travers les étapes qui vont suivre de déterminer le meilleur modèle de classifieur KNN
pour la prédiction de la lithologie.

▪ Importation du classifieur

Figure 25 : importation classifieur

▪ Model de classifieur KNN

Figure 26 : Model de classifieur KNN

▪ Validation croisée du classifieur

Figure 27 : Validation croisée du classifieur

▪ Courbe de validation

Figure 28 : Algorithme de courbe de validation,

1-5- Optimisation des performances du classifieur

▪ Validation croisée de recherche par grille

Figure 29 : Validation croisée de recherche par grille


▪ Score du classifieur sur les données test

Figure 30 : Score du classifieur

▪ Courbe d'apprentissage

Figure 31 : Courbe d'apprentissage

1-6- Application du model de classifieur sur un puit nouveau

Figure 32 : Algorithme model de classifieur


Figure 33 : Algorithme model de classifieur (suite)
Figure 34 : Algorithme model de classifieur (fin)
Chapitre 3 : Résultat et discussion

1- Résultat

1-1- Exploration et visualisation

▪ Importation des données

Figure 35 : Présentation des données importé sur jupiter

▪ Distribution spatiale des différents puits

Figure 36 : Disposition spatiale des puits


▪ Pourcentage de présence des différentes diagraphies sur l’ensemble des puits

Figure 37 : Pourcentage de présence des diagraphies des puits

▪ Nombre d’apparition de chaque lithologie sur l’ensemble des puits

Figure 38 : Nombre d'apparition des lithologies sur les puits


▪ Nombre d’apparition de chaque lithologie au nombre total de données

Figure 39 : Nombre d'apparition de chaque lithologie sur les 97 puits

Tableau 6 : Tableau indicatif des lithologies

Noms des lithologies Anciens numéros Numéros assignés Couleurs assignés


Sandstone 30000 1
Sandstone/shale 65030 2
Shale 65000 3
Marl 80000 4
Dolomite 74000 5
Limestone 70000 6
Chalk 70032 7
Halite 88000 8
Anhydrite 86000 9
Tuff 99000 10
Coal 90000 11
Basement 93000 12
▪ Crossplot

Figure 40 : Crossplots
1-2- Nettoyage et préparation des données

▪ Extraction des données d’entrée du grand ensemble de donnée

Figure 41 : Extraction des données d'entrée et de sortie

▪ Détermination des valeurs de données manquantes

Figure 42 : Données manquantes

▪ Suppression des lignes ayant des valeurs manquantes

Figure 43 : Suppression des lignes ayant des valeurs manquantes


▪ Corrélation entre les données d’entrées et de sorties (méthode de Spearman)

Figure 44 : Corrélation de Spearsman

▪ Détermination des données aberrantes

Figure 45 : Données aberrantes


▪ Elimination des données aberrantes

Figure 46 : Elimination des données aberrantes


▪ Crossplots après traitement

Figure 47 : Crossplot après traitement


1-3- Conditionnement des données

▪ Prétraitement des données

Figure 48 : Données prétraitées

1-4- Entrainement du classifieur KNN

▪ Validation croisée

▪ Courbe de validation

Figure 49 : Courbe de validation


▪ Validation croisée de recherche par grille

Meilleur score :

Meilleurs paramètres :

Score accuracy du meilleur modèle :

Confusion matrix

Figure 50 : Matrix de confusion

▪ Courbe d'apprentissage

Figure 51 : Courbe de comparaison d’apprentissage et validation


▪ Application du model de classifieur sur un puit nouveau

Figure 52 : Résultat expérimental de la classification du puit 16/2-11 A %s (Prédiction 4)


2- Discussion

2-1- Comparaisons des résultats du traitement des données

Nous observons les syntaxes d’un algorithme qui commence de la figure 8 à la figure 34. Cet
algorithme nous a permis d’obtenir nos résultats que nous observons sur les figures 52, 53, 54, 55.
Il parait clairement que la figure 52 présente de meilleurs résultats qui se confirment au niveau des
concordances des lithologies entre la classification des géologues et la classification expérimentale
faite à partir de l’algorithme KNN. En effet la figure 52 présente de similitudes satisfaisantes entre
800ms et 1200ms de profondeurs notament avec les lithologies 1 et 3 qui sont respectivement les
sandstones et les shales. Entre 1200ms et 2050ms environs nous avons des lithologies pas très bien
classé.

2-2- Recommandation

Pour l’amélioration d’un meilleur programme nous proposons :

 D’appliquer l’augmentation des données c’est une opération qui consiste à augmenter les
données d’entrée en utilisant une fonction polynomiale pour mieux séparer les classes dans
un espace plus large

 D’appliquer l’encodage des données

 D’utiliser d’autres algorithmes de classification tels que le support vecteur machine, le


decision tree ou XgBOOST

 De mettre sur pieds un algorithme hybride constitué de plusieurs algorithmes de


classification
CONCLUSION

Parvenue au terme de cette étude, rappelons qu’il était question pour nous d’évaluer l’aptitude du
machine learning comme alternative future pour le travail de classification des lithologies. Nous
avons présenté à cet effet l’entreprise qui nous a permis de réaliser nos travaux, les donnée, outils
et méthodes qui montrent les outils utilisés et la méthode exploitée dans cette étude et enfin les
résultat et discussions issu du programme appliqué.
Notre objectif, était de montrer la rapidité de travail que présente le machine learning et les limites
qui y sont attachés. Le machine learning peut être utilisé comme un outil indispensable pour la
lecture des faciès. Nous pensons que dans les années à venir il pourra remplacer les géologues
dans ces opérations.
BIBLIOGRAPHIE

[1] R. B. Færseth, «geological society of nothway,» NORWEGIAN JOURNAL OF GEOLOGY, vol. 60,
n° %1corresponding author (Roald B. Færseth): roaldf@broadpark.no, pp. 1-4, 2021.

[2] Pairform, «classification de folk,» chez Roches sédimentaires, pairform.fr.

[3] N. P. DIRECTORATE, «geology of the north sea,» chez CO2 Atlas for the norvegian north sea,
www.npd.no.

[4] J. Beauchamp, «principe types de roches sedimentaires,» chez Sediments et roches sédimentaire, 2013.

[5] B. Srinivas et Interactions, «what is machine learning,» chez the fundamentals fundamentals of machine
learning, pp. 3,4,9.

[6] M. ZEE, «Well-log signatures of lithofaciès,» chez Quantitative Geosciences : Data analytics, Geostatistics,
Reservoir characterization and Modeling, Springer, 2019, pp. 236,237.

[7] M. GANG, «Main machine learnig algorithme,» Research gate, november 2008. [En ligne]. Available:
www.researchgate.net. [Accès le 04 may 2022].
ANNEXE 1

Figure 53 : Résultat expérimental de la classification du puit 15/9-13 %s (Prédiction 1)


ANNEXE 2

Figure 54 : Résultat expérimentale de la classification du puit 35/9-6S %s (Prédiction 2)


ANNEXE 3

Figure 55 : Résultat expérimental de la classification du puit 33/6-3 S %s (Prédiction 3)


ANNEXE 4

ERREUR

Figure 56 : Erreur rencontrée dans l'execusion de l'algorithme XGBOOST

Vous aimerez peut-être aussi