Vous êtes sur la page 1sur 53

Statistiques

Statistiqueset Probabilités
Discriptives
Statistiques Descriptives

Formation : LBC
LSG
LBC
Niveau : 1ère année
1ère année
A.U : 2023-2024
2022-2023
2023-2024
2023-2024
Table des Matières

I. Introduction
II. Définitions
III. Variables statistiques
1- Variables statistiques qualitatives
2- Variables statistiques quantitatives
III. Quelques types de représentations graphiques
Supports de cours

G. Saporta, Probabilités, analyse de données et statistiques, éditions technip,


2006

Cornillon P.A., Guyader A., Husson F., Jégou N., Josse J., Kloareg M., Matzner-
Løber E., Rouvière L. Statistiques avec R (2012) Presses Universitaires de Rennes.

Notes de cours de B. Ycart, UJF Grenoble http


://ljk.imag.fr/membres/Bernard.Ycart/STA230/cours STA230.pdf

2021-2022
2022-2023
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Vocabulaire

 La statistique: Le mot statistique désigne à la fois un ensemble de

données d’observations et l’activité qui consiste dans leur recueil, leur


traitement et leur interprétation

Les statistiques: des faits classifiées concernant une catégorie


particulière d’objets. Exemple : les statistiques relatives aux taux de
chômage dans un pays, les statistiques sur les accidents automobiles
durant une année, ...

2022-2023 5/50
5/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Divers domaines d’applications


Economie, assurance, finance : études quantitatives de marchés,
prévisions économétriques, analyse de la consommation des ménages,
taxation des primes d’assurances et de franchises, gestion de
portefeuille, évaluation d’actifs financiers, ...

Biologie, médecine : essais thérapeutiques, épidémiologie, dynamique


des populations, analyse du génome, ...

Sciences de la terre : prévisions météorologiques, exploration


pétrolière, ...

Sciences de l’ingénieur : contrôle qualité, sûreté de fonctionnement,


évaluation des performances, ...
2022-2023 6/50
6/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Information statistique en Tunisie (1/2)

La plupart des instituts étatiques de statistique réservent une place de choix pour les
données démographiques.
INS : http://www.ins.tn/fr/statistiques

2022-2023 7/50
7/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Démarche statistique (1/5)

Recueil des Statistique Statistique Décision


données descriptive inférentielle statistique

2022-2023 8/50
8/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Collecte des données (2/5)


Source des données

Consiste à rassembler de l’information qui est déjà disponible dans des documents
préétablis ou encore à recueillir des données originales construction d’un échantillon

Sources de données

Primaire Secondaire
Collecte des données Compilation de données

Observation
Imprimées ou
Électroniques
Sondage

Expérimentation
2022-2023 9/50
9/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Collecte des données (2/5)


Méthodes d’enquêtes et de sondages

 Méthode exhaustive (Procéder par recensement ): Observer la


totalité de la population statistique (on a une information
complète sur le phénomène étudié)

 Méthode partielle (Procéder par Échantillonnage ou sondage):


Observer une partie de la population statistique appelé un
échantillon (on a une information incomplète sur le phénomène
étudié )

2022-2023 10/50
10/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Statistique Descriptive (3/5)


Traitement et exploration des données

 Présenter les données  Résumer et décrire les


collectées sous une forme principales caractéristiques
exploitable : graphiques des données collectées par
des paramètres (moyenne,
100
80
60
40
East
West variance...)
North
20
0
1st 2nd 3rd 4th
Xi
Moyenne : 
Qtr Qtr Qtr Qtr

Graphique Tableau statistique


i N

2022-2023 11/50
11/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Statistique inférentielle (4/5)


Estimation et Modélisation
Regroupe l’ensemble des méthodes (Estimation de paramètres, Tests
d’hypothèses, Régression linéaire, …) qui permettent de tirer des interprétations
sur une population à partir d’une information partielle provenant d’un
échantillon.

Échantillon

population
Information sur
Information sur la
population l’échantillon

2022-2023 12/50
12/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Décision statistique (5/5)


Techniques d’aide à la décision

 Baser sur un ensemble des techniques permettant de déterminer


la meilleure décision: Techniques de prévisions, Data Mining,
Clustering, Machine learning, Deep learning…
.

2021-2022 13/50
13/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Définitions
On étudie un ensemble d’objets équivalents sur lesquels on observe des
caractéristiques appelées variables. Un caractère ou une variable statistique
c’est l’aspect que l’on désire étudier chez un individu. On note : X, Y, Z,….

Une population (P) se définit comme l’ensemble de ces objets équivalents ou


d’unités statistiques (individus, entreprises, dossiers, projets, …) qui ont des
caractéristiques communes.
On note par N la taille de la population.

Une unité statistique ou un élément : un être humain, un objet concret ou un


objet abstrait.

Un échantillon est tout sous-ensemble de la population. On note par n la taille


de l’échantillon.
Série statistique : C’est l’ensemble des données associées aux individus d’un
échantillon ou d’une population
2022-2023 14/50
Exemple :

Population : peut être l’ensemble des étudiants de Licenses, d’Esprit School


of Business, de Tunis, de Tunisie etc.

Variables étudiées : peuvent être des caractéristiques physiques (taille,


poids, couleurs des cheveux ou des yeux,…) ou des caractéristiques socio-
démographiques ( le sexe, âge, etc.)

2022-2023 1/50
Variables Statistiques
Chaque individu est décrit par un ensemble de variables X. Ces
variables peuvent avoir plusieurs types :

Variables
Statistiques

Variables Variable
qualitatives quantitatives

2022-2023 1/50
Variable statistique
qualitative
1. Variable qualitative : si ses modalités ne s’expriment pas par un
nombre (non quantifiable). Elle s’exprime par l’appartenance à une
modalité ( possibilité de réponse à cette variable)

Variable
Qualitative

Variable qualitative Variable qualitative


nominale ordinale

2022-2023 1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Nature de variables
1.1 Variable qualitative nominale :
- Sexe Ω={Homme, Femme},
- État matrimonial Ω={Célibataire, marié, divorcé, veuf }, Milieu
Ω={Urbain, Rural}

1.2 Variable qualitative ordinale :


il existe une relation d’ordre entre les modalités
exp - Niveau d’études
Ω={L1, L2, L3, M1, M2}
- Test de niveau TOEIC Ω={A1, B1, C1}
2022-2023 20/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Motivation: Distribution à un caractère qualitatif

Tableau non Numéro de Sexe


l’Individu
informatif sondé
??? 1 H

2 F
3 F

4 H

5 F

6 F
7 H
8 F

2022-2023 21/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en effectifs (1/2)

Modalités = possibilités de réponse


Numéro de Sexe
l’Individu Modalités de la Nombre
sondé variable sexe xi d’observations=
1 H i ={ 1,2] Effectif
F ni i={ 1,2]
2
F H n1= 3
3
4 H F n2= 5
5 F
Effectif total =
6 F
Nombre total
7 H d’individus
8 F N=8

2022-2023 22/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en effectifs (2/2)

X variable Effectif ni
•X est le caractère étudié
De xi
modalités •xi représente la ième modalité du
x1 n1 caractère X
x2 n2 •ni est l’effectif correspondant à la ième
x3 n3 modalité du caractère X
x4 n4 •Il y a k modalités.
x5 n5
x6 n6
•N est l’effectif total :
… …
xk nk
Total N

2022-2023 23/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en fréquences relatives (1/2)

Modalités xi de la variable ni (effectif)


sexe
H 3
F 5
Nombre total
d’observations
N=8

Modalités de la variable sexe ni (effectif) Fréquence relative


xi fi =ni/N
H n1= 3 f1= 3/8= 0.375 = 37.5 %
F n2= 5 f2= 5/8= 0.625= 62.5 %
N=8 1 = (100%)

2022-2023 24/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en fréquences relatives (2/2)

Modalités Fréquence
xi relative fi La fréquence fi est la proportion des
x1 f1 individus qui présentent la modalité xi .
x2 f2
x3 f3
x4 f4
x5 f5 Et on a toujours :
x6 f6
… …
xk fk
1
(ou 100%)
2022-2023 25/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Représentations graphiques : Diagramme en bâtons (1/2)

Donner un aperçu visuel plus « parlant » :

Modalités de la Fréquence
variable sexe relative
H 3/8= 0.375
F 5/8= 0.625
Total = 1

Diagrammes en bâtons : à chaque modalité correspond un rectangle vertical


dont la hauteur est proportionnelle à la fréquence relative de la modalité
(L’Hauteur des bâtons peut être proportionnelle à l’effectif )

2022-2023 26/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Représentations graphiques : Diagramme circulaire (2/2)

Modalités de la Fréquence
variable sexe relative
H 3/8= 0.375
F 5/8= 0.625
Total = 1

Diagrammes circulaires ou sectoriels ou en camemberts : à chaque modalité


correspond un secteur de disque dont l’aire est proportionnelle à la
fréquence relative de la modalité.

2022-2023 27/50
1/50
Variable statistique quantitative

2022-2023 1/50 28
Variable quantitative s’exprimant par des nombres réels. Les modalités sont
numériques (quantifiables, mesurables )

Variable
Quantitative

Variable Variable
quantitative quantitative
discrète continue

2022-2023 1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Nature de variables
Variable quantitative discrète: les modalités de ce caractère ne peuvent prendre
que des valeurs isolées (le plus souvent entières)
Exemple: nombre d’enfants, nombre de chambres, ...
Ω est une suite finie ou infinie d’éléments de N (ex : Ω = {1, 2, 3} ; Ω = N)

Variable quantitative continue: si toutes les valeurs d’un intervalle de R sont


acceptables. Continue : lorsque les modalités de ce caractère sont susceptibles de
prendre n’importe quelle valeur dans un intervalle donné généralement dans R
Exemple: salaire, taille, poids, ….
Le caractère X présente k modalités
Xi (i=1,…,k) pour tout type.
2022-2023 30/50
1/50
Variable statistique quantitative
discrète

2022-2023 1/50 31
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Distribution à caractère quantitatif discret


Série statistique : C’est l’ensemble des données associées
aux individus d’un échantillon ou d’une population
Numéro de Nombre d’enfants
l’Individu sondé
1 2
2 0
Tableau non
3 2
4 3 informatif
5 1 ???
6 4
7 5
8…… 2
2022-2023 32/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en effectifs (1/3)

Modalités de la Nombre
Numéro de Nombre d’enfants
variable Nombre d’observations
l’Individu sondé
d’enfants xi ni (effectif)
1 2
0 15
2 0
1 25
3 2
2 40
4 3
3 20
5 1
4 5
6 4
5 5
7 3 Nombre total
8…… 2 d’individus
N=110

2022-2023 33/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en fréquences relatives (2/3)

Un tableau en effectifs peut s’avérer insuffisamment informatif


=> utilisation de pourcentages, fréquences.

Nombre d’enfants xi Effectif Fréquence relative


ni fi =ni/N
0 10 10/110 = 0,09 = 9%
1 20 20/110 = 0,18 = 18%
2 40 40/110= 0,36 = 36%
3 30 30/110 = 0,27 = 27%
4 5 5/110 = 0,045 = 4.5%
5 5 5/110=0,045=4.5%
Total N=110 1 (100%)

2022-2023 34/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en fréquences cumulées croissantes (3/3)

La fréquence cumulée Fi est la proportion des individus de la population qui


présentent au plus la valeur xi pour le caractère X :
Modalités Effectif Fréquence relative Fi  Fi 1 cumulée
Fréquence   fi
xi ni fi =ni/N
0 10 f1= 0,09 F1 = 0,09
1 20 0,18 F2 = 0.09+0.18=0.27
2 40 0,36 0.27+0.36=0.63
3 30 0,27 0.63+0.27=0.9
4 5 0,045 …
5 5 0,045 1 (100 %)
Total N=110 1 (100%)

• 63 % (F3 ) ont « entre 0 et 2 enfants » ou « au plus 2 enfants »


• 36% exactement 2 enfants

2022-2023 35/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Présentation en fréquences cumulées (3/3)

xi fi Fi
x1 f1 F1=f1
x2 f2 F2=f1+f2
x3 f3 F3=F2+f3

…. ….. …..

xi fi Fi=Fi-1+fi

… … …
xk fk 1
2022-2023 36/50
1/50
Quelques types de représentations
graphiques

2022-2023 1/50 37
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Représentations graphiques : Diagramme en bâtons (1/3)

Donner un aperçu visuel plus « parlant » :

Diagrammes en bâtons : à chaque modalité correspond un rectangle vertical


dont la hauteur est proportionnelle à la fréquence relative de la modalité
(L’Hauteur des bâtons peut être proportionnelle à l’effectif )
2022-2023 38/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Représentations graphiques : Diagramme circulaire (2/3)

Diagrammes circulaires ou sectoriels ou en camemberts : à chaque modalité


correspond un secteur de disque dont l’aire est proportionnelle à la
fréquence relative de la modalité.
2022-2023 39/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Représentations graphiques : Diagramme en escalier (3/3)

Diagramme en escalier : Représentation de la fréquence cumulée Fi


Courbe en escalier discontinue aux points représentant les modalités de X

2022-2023 40/50
1/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Représentations graphiques : Diagramme en escalier (3/3)

Diagramme en escalier : Représentation de la fréquence cumulée Fi


Courbe en escalier discontinue aux points représentant les modalités de X
Toutes les représentations précédentes présentées dans le cas des variables quantitatives
discrètes sont inadaptées aux caractères quantitatifs continus.
2022-2023 1/50
Question : Donner le tableau statistiqueStatistique descriptive
de cette série. Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Exercice d’application 1 : var quantitative discrète

Question : Donner le tableau statistique de cette série.

2022-2023
Question : Donner le tableau statistiqueStatistique descriptive
de cette série. Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Exercice d’application 1 : var quantitative discrete (correction)

2022-2023 1/50
Distribution à un caractère
quantitatif continu
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Données brutes
Dans un échantillon d’étudiants, on a mesuré la taille des individus. N=150

Numéro de Taille
l’individu
1 1.60 Tableau non informatif
2 1.71 ???
3 1.65
4 1.80
5 1.77
6 2
7 1.70

150 1.91
REBHI Ibtihel, 2020-202 45/50
Statistique descriptive Introduction : la méthode
Théorie de probabilités statistique
Applications Etude des distributions statistiques
Les indices statistiques
Données groupées
 Lorsque la variable est continue, ou que la variable peut prendre
un grand nombre de valeurs différentes, il convient de regrouper
ces valeurs en classes.

 À chaque classe on fait correspondre un effectif ou une fréquence


relative, et l’on obtient alors une distribution de fréquence
relative ou de fréquence relative cumulée pour valeurs groupées.

● Comment définir les classes ?

1. Déterminer le nombre de classes


2. Déterminer l’amplitude des classes
3. Déterminer les différentes classes

REBHI Ibtihel, 2020-2021 46/50


Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Nombre de classes

Numéro de Taille
l’individu
1 1.60 1. Déterminer le nombre
2 1.71
de classes :
3 1.65
4 1.80 1) N=1+
C 3.3Log(N)
5 1.77 (règle de Sturges)
6 2
N: nombre d’individus
7 1.70 de la série statistique

150 1.91 Utiliser la règle de Sturges

REBHI Ibihel, 2020-2021 47/50


Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Amplitude de classes

Numéro de Taille
l’individu 2. Calculer l’amplitude
1 1.60 des classes :
2 1.71 On calcule d’abord
3 1.65 l’Etendue
4 1.80 E = xmax - xmin
5 1.77 Plus grande valeur de la série Plus petite valeurde la
6 2 statistique série statistique
7 1.70 Puis l’amplitude :

E
150 1.91 AC =
NC
REBHI Ibtihel, 2020-2021 48/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques Les
Applications indices statistiques

Détermination des classes


Numéro de Taille
l’individu
1 1.60
3. Déterminer les classes
2 1.71 xmin ≤Classe1 < xmin + Ac
3 1.65 xmin + Ac ≤ Classe2 < xmin + 2 Ac
4 1.80
5 1.77
6 2
xmin + (N c -1) Ac ≤ Classe en < xmin + N c Ac
7 1.70 c


150 1.91

49/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Pour une classe : Amplitude, Centre, fréquence relative, fréquence


cumulée
Numéro de Taille
Numéro de
l’individu
Taille - Classes : X i = [xi-1 , xi [,i = 1,..,k
l’individu
1 1.60
2 1 1.71
1.60 Amplitude de la classe X i

3 1.65 a i = : x i – x i -1
4 2 1.80
1.71 Centre de la classe X i
5 3 1.77
1.56 x: i + x i -1
C =i
6 4 2 1.80 2
5 1.77
7 1.70
6 2 fréquence relative : fi =ni / N
… 7 1.70
150… 1.91 Fréquence cumulée :
REBHI Ibtiel, 2020-2021 50/50
150 1.91
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Grouper les données


Numéro de Taille Données
l’individu
Numéro de groupéesEffectifs
Taille enTaille
mètres
l’Individu sondé Taille Effectifs
1 1.60 [1.60;1.65[
1 1.60 (en mètres) Xi 35 ni
2 1.71 [1,60 – 1,65[ 23
[1.65;1.70[ 35
2 1.71
3 1.65 [1,65 – 1,70[ 43
[1.70;1.75[ 23
3 1.65
4
4 1.80
1.80 [1,70 – 1,75[ 30
[1.75;1.80[ 43
5 1.771.77 [1,75 – 1,80[ 15
[1.80;1.85[ 30
5
6 2 1.62 [1,80 – 1,85[ 2
[1.85;1.90[ 15
6
[1,85 – 1,90[ 1
[1.90;1.95[ 2
7 7 1.701.70
[1,90 – 1,95[ 0
[1.95;2[
1
… 8…… 1.91 … .
[1,95 – 2,00[ 1
150 1.91 [2;2.05[ 1
N=150
REBHI Ibtihel, 2020-2021 51/50
Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Tableau statistique variable quantitative continue


Classes Effectifs,Centre
Classes, de classe
Fréquences Effectif
relatives, Amplitudes, Fréquences relatives cumulées
Centres, Fréquences Fréquences Cumulées
[1.60;1.65[ 1.625 35 0.23 0.23

[1.65;1.70[ 1.675 23 0.15 0.38

[1.70;1.75[ 1.725 43 0.29 0.67

[1.75;1.80[ 1.775 30 0.2 0.87

[1.80;1.85[ 1.825 15 0.1 0.97

[1.85;1.90[ 1.875 2 0.01 0.98

[1.90;1.95[ 1.925 1 0.006 0.986

[1.95;2[ 1.975 0 0 0.986

[2;2.05[ 2.25 1 0.006 0.99


Statistique descriptive Introduction : la méthode statistique
Théorie de probabilités Etude des distributions statistiques
Applications Les indices statistiques

Types de variables

Vous aimerez peut-être aussi