Académique Documents
Professionnel Documents
Culture Documents
données Géologiques
Introduction
Distribution Uni-variée
Distribution Bi-variée
Théorie
Analyse spatiale
Pratique (Excel, R,
Machine Learning Python…)
Analyse Multivariée
Visualisation des données
• Affichage des données
brutes / carte de
localisation
• Pas de biais spatial
• Pas de modèle
• Pratique souvent en 2D
• Peu pratique en 3D
Visualisation des données
• La distribution statistique - la
distribution d'une variable est une
description du nombre relatif de fois que
chaque résultat possible se produira
dans un ensemble suffisamment grand
d‘experiences.
• Qu’est ce qu’il nous apprend:
• Quel est le minimum et le maximum ?
• Avons-nous beaucoup de valeurs basses ?
• Avons-nous beaucoup de valeurs élevées ?
• Avons-nous des valeurs extrêmes (aberrantes)
(valeurs qui n'ont pas de sens et qui doivent être
expliquées) ?
Histogramme uni-varié
Comment visualizer les distributions ?
• L'histogramme est une fréquence pour un ensemble
exhaustif de classes.
a b
• Exemple :
Quelle est la probabilité qu'une carotte
aléatoire ait une porosité égale ou
inférieure à 26% ?
Histogramme uni-varié
Comment utiliser un FDC ?
• Une fonction de la probabilité que
tout échantillon aléatoire soit inférieur
à un seuil.
• Exemple :
quelle est la probabilité qu'une porosité 12%
aléatoire de la carotte soit > 15% et 15%
égale ou inférieure à 26%.
• Exemple :
quel est le 90ème percentile (la valeur 28%
pour laquelle 90% des valeurs aléatoires
seraient inférieures à celle-ci) ?
P50 ? = 24%
P20 ? = 18%
Histogramme uni-varié
Oui Oui (Présence d’un pique) Oui, pas de données Non, Negative Prob
Histogramme uni-varié
Comment générer un CDF ?
• Étape 1 : Triez les points de données dans un ordre croissant
de sorte que 𝑋1 ≤𝑋2 ≤ 𝑋3 ≤ ... ≤ 𝑋𝑛 .
• Étape 2 : Attribuer une probabilité 𝑓𝑖 à chaque événement
(Typiquement uniforme pour chacun) :
• Étape 3 : Intégrer en additionnant les probabilités pour
calculer la probabilité cumulative d'être ≤ à chaque valeur de
données.
Perméabilité (%)
Histogramme uni-varié
Moyenne de l'échantillon
Si N est impair
• Médiane (P50) Si N est pair
Mode = Calcaire
Mode = 27%
Mode: Valeur la plus dominante
• Continu
Sensible aux classes
• Catégorique
Fréquence la plus élevée
Statistiques uni-variée
Mesures de la tendance centrale
La fraction suivante de schiste a été mesurée à partir de 9 échantillons de
carottes. Elles ont été triées par ordre croissant.
3%, 4%, 8%, 8%, 8%, 10%, 13%, 16%, 20%.
Médiane
Statistiques uni-variée
Mesures de la tendance centrale
• Moyenne géométrique
• Cas d'une progression, d'une suite, et non pas d'une suite d'entités indépendantes.
• Plus souvent utilisée pour des séries de valeurs de nature exponentielle
• Moyenne harmonique
• La perméabilité effective pour l'écoulement le long des couches est une moyenne
arithmétique.
Statistiques uni-variée
Mesures de la tendance centrale
• Une forme plus générale est la moyenne de la loi de puissance
• Utile pour calculer la perméabilité effective lorsque l'écoulement n'est ni parallèle ni perpendiculaire à des
couches de perméabilité distinctes.
• La simulation de l'écoulement est utilisée pour calibrer à un calcul la puissance appropriée.
Mesure de la dispersion
Variance
Variance de l'échantillon
Écart-type
Mesure de la dispersion
Gamme
Exemple :
Problème
• Le min et le max sont les mesures les moins fiables.
Intervalle interquartile :
IQR=
Exemple
IQR = 26,8-19,0 = 7,8
Mesure de la dispersion
Détection de valeurs extrêmes
• Clôture inférieure = P25-1,5(IQR)
inferieure
supérieure
Clôture
Clôture
• Valeur aberrante si :
• X< Clôture inférieure
• X> Clôture supérieure
• Exemple :
• P25 = 19,0, P75=26,8
• IQR = P75 - P25 = 7,8
• Clôture inférieure = 19,0 - 1,5 (7,8) = 7,3 Les Extrêmes
• Clôture supérieure = 26,8 + 1,5(7,8) = 38.5
Mesure de la dispersion
Détection de valeurs extrêmes
inferieure
supérieure
Clôture
Clôture
• 1. Supprimer : il faut être capable de
démontrer que les données sont
erronées.
• 2. Transformer (voir plus loin) :
remodeler la distribution pour l'analyse.
• 3. Séparer : Retirer les valeurs aberrantes
et les traiter séparément. Supposons
qu'il s'agit de populations différentes.
Les Extrêmes
Box Plots
(Diagrammes en boîte)
Box Plots
• Visualisation / comparaison de
distributions multiples
Probabilité de x succès
dans N expériences
Exp Pile ou face
Exemple: PPF, PFP, FPP
Exemple : distribution avec des tentatives et une probabilité de succès variables.
Distribution binomiale
Exemple
Le taux d'échec du forage d'exploration est de 70 %. Votre entreprise a
prévu de forer jusqu'à 10 puits.
• Distribution de Poisson :
• Lorsque l'on connaît le nombre moyen de réussites
d'un événement par intervalle, unité de temps (ou
cycle) ou espace, on utilise la distribution de
Poisson.
• Supposons : Taux constant, événements
indépendants, binaire
• Comparer avec la distribution binomiale
• Utilisez la distribution binomiale lorsqu'on vous
donne la probabilité exacte de succès pour un Le volcan Cumbre Vieja, Iles Canaris
essai et que vous voulez des succès sur un certain
nombre d'essais.
• Par exemple, pourriez-vous utiliser la distribution
binomiale pour un volcan ? Combien d'essais en un
an ?
Distribution de Poisson
Distribution de Poisson
Où λ est le nombre moyen d'occurrences dans la période de temps et x est le nombre réel
d'occurrences.
Distribution de Poisson
Exemple
Lors du forage dans une formation spécifique, il y a eu en
moyenne 3 incidents de perte de fluide. Quelle est la
probabilité de 5 incidents de perte de fluide pour le prochain
puits?
POISSON.DIST(5.3.FALSE) = 0.101
POISSON.DIST(0.3.FALSE) = 0.050
Géostatistiques et analyse des
données Géologiques
Introduction
Distribution Uni-variée
Distribution Bi-variée
Théorie
Analyse spatiale
Pratique (Excel, R,
Machine Learning Python…)
Analyse Multivariée
Statistiques bivariées
Analyse bivariée
• Analyse bivariée : Comprendre et quantifier la relation entre deux variables.
• Exemple : Relation entre la porosité et la perméabilité
Statistiques bivariées
Analyse bivariée
• Analyse bivariée : Comprendre et quantifier la relation entre deux variables.
• Exemple : Relation entre la concentration des minéraux dans les roches
Statistiques bivariées
Analyse bivariée
• Analyse bivariée : Comprendre et quantifier la relation entre deux variables.
• Exemple : Relation entre magnitude séismique et volume de glissement de
terrain
Statistiques bivariées
Analyse bivariée
• Analyse bivariée : Comprendre et quantifier la relation entre deux
variables.
• Relation générale
Statistiques bivariées
Analyse bivariée
• Analyse bivariée : Comprendre et quantifier la relation entre deux variables.
• Contrainte physique
Statistiques bivariées
Analyse bivariée
• Analyse bivariée : Comprendre et quantifier la relation entre deux variables.
• Segmentation
Statistiques bivariées
Analyse bivariée
• Variance: Une mesure de la façon dont une variable varie avec elle-même.
Statistiques bivariées
Coefficient de corrélation de Pearson
• Interprétation du coefficient de corrélation
Vincent Valles Professeur d'Université UMR 1114 EMMAH - Michael Pyrcz, an Associate Professor in both the Cockrell
Environnement Méditerranéen et Modélisation des School of Engineering and the Jackson School of
AgroHydrosystèmes Département Hydro-Géologie Geosciences at the University of Texas at Austin
https://michaelpyrcz.com/
https://www.researchgate.net/profile/Vincen
https://github.com/GeostatsGuy
t-Valles