Vous êtes sur la page 1sur 17

REPUBLIQUE DU CAMEROUN REPUBLIC OF CAMEROON

Paix – Travail - Patrie Peace – Work – Fatherland


---------- ---------
UNIVERSITE DE MAROUA THE UNIVERSITY OF MAROUA
---------- ----------
B.P. : 46 Maroua P.O. Box : 46 Maroua
Tél. : (237) 677975997 Tel. : (237) 677975997
---------- ----------
FACULTE DES MINES ET DES INDUSTRIES FACULTY OF MINES AND PETROLEUM
PETROLIERES INDUSTRIES
_______ _______

UE : GEOSTATISTIQUE

CHAPITRE 1 : STATISTIQUE A UNE VARIABLE

FILIERE : XPG-IC 1

Supervisé par : Dr NGUIMBOUS


NOMS DES EXPOSANTS

 ABDOULBAGUI
 ABDOURAMAN Ziladou (Chef)
 AMINOU
 ANTSELE KALATA Cédric
 ASSOA Angoa Gariel
 BIGWAMBE
 BIBOUM Jean Paul
PLAN DE L’EXPOSE

I- ORGANISATION DES DONNEES


DEFINITION ET VOCABULAIRE
1. Collecte des informations
2. Les différents modes de collecte d’information

II- ORGANISATION DES DONNEES

1.Tableaux statistiques

III- CARACTERISTIQUES DE POSITION

IV- CARACTERISTIQUES DE DISPERSION

V- GRAPHIQUES
DOMAINE D’APPLICATION
EXEMPLES D’APPLICATION
I- ORGANISATION DES DONNEES

DEFINITION ET VOCABULAIRE

La statistique est une méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles nombreux puis à
analyser, à commenter et à critiquer ces données.

1- COLLECTE DES INFORMATIONS

Le premier objectif de la méthode statistique est de réunir les informations avant de les traiter.
Exemple : si l’on réalise des études sur l’emploi dans un secteur déterminé, il ne faut oublier aucune variable. On peut demander aux
personnes interrogées leur âge, leur qualification professionnelle, etc… mais si ensuite on s’aperçoit que le salaire est un paramètre
important, il est trop tard et il faut refaire l’enquête. (Les paramètres topographiques, pétrographiques, géophysiques, pétrophysiques,
structuraux d’un bassin sédimentaire)

2-LES DIFFERENTS MODES DE COLLECTE D’INFORMATION

- La collecte d’information peut être faite par un dénombrement instantané ou recensement, elle peut aussi se faire en continu,
aussi de façon exhaustive ou partielle. C’est pourquoi on a recours aux enquêtes partielles faites sur un échantillon d’information. Ce
type de collecte d’information s’appelle le sondage.
(Enquête pétrographique sur le terrain, sondage géoélectriques, forages de prospections).
Dans ce sondage, il faut déterminer un échantillon représentatif de manière que les résultats statistiques trouvés sur cette échantillon
soit voisin de ceux qu’on aurait obtenus si on avait étudié l’échantillon entier.
- La collecte de l’information peut aussi se faire par observation directe.

Exemple : l’enquête menée par les statisticiens à l’aide d’un questionnaire. (Collecte des échantillons de roches par les
géologues, forages et étude des carottes)

La collecte peut aussi se faire par observation indirecte.


Exemple : statistique des naissances, des décès tirés des états civils (Enquêtes, satellitaires ou photogramétriques, sondages
géoélectriques)
II- ORGANISATION DES DONNEES

La statistique consiste dans un premier temps à recueillir des


données concernant un caractère commun à tous les individus
d’une population. On procède ensuite à la mise en ordre des
données dans chaque modalité (≪𝑣𝑎𝑙𝑒𝑢𝑟≫ non nécessairement
numérique prise par le caractère), on fait correspondre son effectif,
c’est-à-dire le nombre d’individus relatif à cette modalité. On
obtient ainsi une série statistique.

TABLEAUX STATISTIQUES

On peut représenter les données brutes dans un tableau


mais il est possible d’en déduire un tableau plus clair en faisant un
regroupement par classe. On peut fixer le nombre de classe selon
l’une des formules suivantes :
- la règle de Sturge

Qui stipule que le nombre de classe est défini par :


Nombres de classes = 1 + (3,3 ln n)

- La règle de Yule

Nombre de classes = 𝒏𝒐𝒎𝒃𝒓𝒆 𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒆𝒔 = 𝟐, 𝟓𝟒√𝒏

L’amplitude de la classe est donnée par :

𝑽𝑨𝑳𝑬𝑼𝑹 𝑴𝑨𝑿𝑰𝑴𝑨𝑳𝑬 − 𝑽𝑨𝑳𝑬𝑼𝑹 𝑴𝑰𝑵𝑰𝑴𝑨𝑳𝑬


𝑵𝑶𝑴𝑩𝑹𝑬 𝑫𝑬 𝑪𝑳𝑨𝑺𝑺𝑬𝑺
Exemple : caractère quantitatif
Une enquête portant sur le nombre d’enfant dans chacun des 50
foyers d’un village a donner (Teneur en or de 50 carottes d’un
ensemble de forages réalisés dans d’un territoire donné)

Définitions
Soit ( 𝑋𝑖; 𝑛𝑖 ) 1 ≤ 𝑖 ≤ 𝑝 une série statistique dont les modalités sont
ranger par ordre croissant.

On appel effectif cumulés de la modalité 𝑿𝒌 la somme des


modalités inferieures ou supérieure ou égale à 𝑋𝑘 .

On appel fréquence cumulée de la modalité 𝑿𝒌 le quotient de son


effectif cumule par l’effectif totale de la série.
I. CARACTERISTIQUES DE POSITION

Il arrive que l'on veuille résumer une série statistique par un seul
nombre appelé caractéristique de position qui donne une idée sur
les valeurs prises par le caractère. Les trois caractéristiques de
position les plus utilises sont le mode, la moyenne et la médiane
les deux dernières ne concernant que des séries à caractère
quantitatifs, dont nous supposerons ici les modalités non
regroupées en classe.
On appelle mode d’une série statistique toute modalité d’effectif
maximal.
 MOYENNE
Pour une série statistique (𝑥𝑖 ;𝑛𝑖 )1 ≤ 𝑖 ≤ 𝑝′ la moyenne est le nombre, notée𝑥, définie par :
𝑁
𝑥𝑖
𝑋 =
𝑁
𝑖=1
Lorsque la variable est discrète, on emploi la formule de la moyenne pondéré, pour k classe,
d’effectif ni ou de fréquence 𝑓𝑖 : exemple : la résistivité apparente d’une couche sédimentaire
constituée de plusieurs couches de résistivités 𝝆𝒊 et hauteurs 𝒉𝒊 :
𝑓𝑖 𝑥𝑖 ℎ𝑖 𝜌𝑖
𝑋 = 𝜌 =
𝑓𝑖 ℎ𝑖

On appelle médiane d’une série statistique d’effectif total N tout nombre réel M tel que le nombre d’individus
de modalité supérieure ou égale à M et le nombre d’individus de modalité inférieure ou égale à M soient deux
𝑵
au moins égaux à .
𝟐
REMARQUE : La médiane n’est pas toujours une modalité de la série.
• Une médiane peut être un nombre réel unique ou tout nombre d’un intervalle (fermé) de R. En effet, il existe
d’autre définition plus restrictive de la médiane tout mettent en évidence le fait d’un partage de la
population en deux groupes.
IV. CARACTERISTIQUES DE DISPERSION
La moyenne est une caractéristique de position, elle n’apporte aucune information sur la
répartition des individus autour d’elle :on sait pas s’ils sont plutôt proches ou plutôt éloignes
d’elle. Une caractéristique de dispersion est un nombre qui permet de rendre compte de cette
situation, ce nombre peut être considéré en un certain sens comme « l’éloignement moyen » on
obtiendra différentes caractéristiques de dispersion. Nous ne définirons ici que deux
caractéristiques de dispersion : l’écart type et la variance .

Soit une série statistique (𝑥𝑖 , 𝑛𝑖 ) 1≤ i ≤ p de moyenne 𝑥 :


 LA VARIANCE
𝒑
𝒊=𝟏 𝒏𝒊 (𝒙𝒊− 𝒙)²
C’est le nombre réel v défini par : v = 𝒑
𝒊=𝟏 𝒏𝒊
 L’ECART TYPE
L’écart type est un nombre réel positif σ défini par : σ= 𝑽
 FORMULE DE KOENIG

𝟏 𝑷 𝒏𝒊 𝒙𝟐
V= 𝒊=𝟏 𝒏𝒊 𝒙𝒊 ² -𝒙² ; σ = 𝑽= − (𝒙)𝟐
𝑵 𝒏

Propriétés sur la sommation :


Soit p un nombre entier naturel non nulle, 𝑈1 , 𝑈2 , … , 𝑢𝑝 ,𝑣1 , 𝑣2 ,…,𝑣𝑝 , et r et a des nombre
réels

𝑃 𝑝

𝑢𝑖 + 𝑟 = 𝑢𝑖 + 𝑝𝑟
𝑖=1 𝑖=1
𝑃 𝑝 𝑝

𝑢𝑖 + 𝑣𝑖 = 𝑢𝑖 + 𝑣𝑖
𝑖=1 𝑖=1 𝑖=1
𝑃 𝑝 𝑝

𝑎𝑢𝑖 + 𝑏𝑣𝑖 = 𝑎 𝑢𝑖 + 𝑏 𝑣𝑖
𝑖=1 𝑖=1 𝑖=1
I. GRAPHIQUES
Ils sont normalement réalisés en portant en abscisse la variation observée et en ordonnée
l’effectif on l’effectif ou la fréquence. Dans le cas d’une variable discrète, le graphique est un
diagramme en bâton, aussi apparait la discontinuité entre deux variables.
Dans le cas d’une variable continue, le graphique est un histogramme. La surface limitée par
l’histogramme doit être proportionnelle à l’effectif ou à la fréquence.
La formule de la hauteur du rectangle est donnée par :
𝒆𝒇𝒇𝒆𝒄𝒕𝒊𝒇 𝒐𝒖 𝒇𝒓é𝒒𝒖𝒆𝒏𝒄𝒆 𝑿𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅𝒆
𝒉𝒂𝒖𝒕𝒆𝒖𝒓 𝒅𝒖 𝒓𝒆𝒄𝒕𝒂𝒏𝒈𝒍𝒆 =
𝒂𝒎𝒑𝒍𝒊𝒕𝒖𝒅𝒆 𝒅𝒆 𝒍𝒂 𝒄𝒍𝒂𝒔𝒔𝒆

NB : Le diagramme en bâton et l’histogramme sont des graphes utilisés lorsqu’on a des


distributions quantitatives. Par contre, lors des distributions qualitatives, on peut réaliser des
diagrammes en bande ou des diagrammes à secteur.
DIAGRAMME CIRCULAIRES 6
HISTOGRAMME
5
5
4 4,3 4,4 4,5
9%
10%
3 3,5
3 2,8
23% 58% 2 2,4 2,5
2 2 1,8
1

0
Catégorie 1 Catégorie 2 Catégorie 3 Catégorie 4

1er trim. 2e trim. 3e trim. 4e trim.


Série 1 Série 2 Série 3

DIAGRAMME EN BATONS Nuage de point


Série 1 Série 2 Série 3 10

C AT É G O R I E 4 4,5 2,8 5 5

C AT É G O R I E 3 3,5 1,8 3 0
0 1 2 3 4 5 6
C AT É G O R I E 2 2,5 4,4 2 -5

C AT É G O R I E 1 4,3 2,4 2 Ventes


Radar
Ventes

1
10
5
5 2
0

4 3

Ligne 3D
Surface 3D
10
10
5
5
Ventes 0 Ventes
0
1 1
2 2
3
3 4
4 5
5

0-5 5-10 Ventes


DIAGRAMME DE ROSE UTILISE LORS DE L’EXTRACTION DES LINEAMENTS

BOX-PLOT : POUR MEDIANNE, MOYENNE, QUARTILE


Domaine d’application
En 1982, le statisticien Pierre Dagnelie propose trois grandes tendances de la statistique :
- la statistique qualifiée d'« administrative » ou « gouvernementale » faite dans les instituts de
statistique à propos de grands ensembles de données ;
- la statistique dite « mathématique » ou « universitaire » faite avec peu de données et qui a
pour but la novation ;
- enfin la statistique « appliquée » ou « de terrain » faite dans les instituts de sondage d'opinion
ou les facultés de médecine pour des problèmes concrets.

Dans la pratique, les méthodes et outils statistiques sont utilisés dans des domaines tels que :
- géophysique, pour les prévisions météorologiques, la climatologie, la pollution, les études des
rivières et des océans ;
- démographie : le recensement permet de faire une photographie à un instant donné d'une
population et permettra par la suite des sondages dans des échantillons représentatifs ;
- sciences économiques et sociales, et en économétrie : l'étude du comportement d'un groupe
de population ou d'un secteur économique s'appuie sur des statistiques.
Merci pour votre aimable
attention…

Vous aimerez peut-être aussi