Vous êtes sur la page 1sur 100

Motivation Description unidimensionnelle des données

Cours de Statistique descriptive


Représentation et description des données

STATISTIQUE DESCRIPTIVE UNIDIMENSIONNELLE

Abdeljalil SETTAR
a.settar.fstm@gmail.com
Code Classroom : z6jgx6f

Université Hassan 2 – Faculté des sciences et techniques

MIP/S4 2023-2024

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 1 / 99


Motivation Description unidimensionnelle des données

Plan du chapitre

1 Motivation
Statistique vs statistique(s) !
Donnée, c’est quoi en fait ?

2 Description unidimensionnelle des données


Présentation des données : Tableau statistique et Visualisation
graphique
Paramètres de tendance centrale
Paramètres de dispersion
Paramètres de dispersion relatif

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 2 / 99


Motivation Description unidimensionnelle des données

MOTIVATION

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 3 / 99


Motivation Description unidimensionnelle des données

Statistique vs statistique(s) !

Statistique vs statistique(s) !

statistique(s) : Collection de chiffres relatif à un phénomène.


Statistique : L’ensemble des techniques et des procédés quantitatives
de traitement des données (statistiques). (Méthodologie,
approche,. . .).

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 4 / 99


Motivation Description unidimensionnelle des données

Statistique vs statistique(s) !

Exemples

Exemple 1 : Sexe des étudiants


On s’intéresse à la variable "Sexe" notée X de 15 ètudiant(e)s.
Les données brutes sont fournies comme suit :

M, F, F, M, M, M, F, M, F, M, F, M, M, F, F

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 5 / 99


Motivation Description unidimensionnelle des données

Statistique vs statistique(s) !

Exemples

Exemple 1 : Sexe des étudiants


On s’intéresse à la variable "Sexe" notée X de 15 ètudiant(e)s.
Les données brutes sont fournies comme suit :

M, F, F, M, M, M, F, M, F, M, F, M, M, F, F

Exemple 2 : Nombre de modules validés


On s’intéresse au nombre de modules validés X parmi 8 modules du
premier semestre de 15 étudiant(e)s. Les données brutes sont fournies
comme suit :

2, 1, 0, 2, 3, 0, 1, 2, 4, 1, 3, 6, 4, 3, 7

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 5 / 99


Motivation Description unidimensionnelle des données

Donnée, c’est quoi en fait ?

Donnée, c’est quoi en fait ?

Donnée : Ce qu’on observe comme valeur (modalité) d’un caractère


étudié chez un individu appartenant à une population ciblée.
Décrire une donnée commence par l’identification de :
- La population ciblée (Les étudiants d’une faculté, les coopératives
dans une zone rurale, les entreprise productrice du beurre . . .)
- L’individu (unité statistique)(étudiant, vache, entreprise . . .)
- Le caractère étudié :

Qualitatif nominal (type de technologie utilisée dans la production)


Qualitatif ordinal (niveau de difficulté d’un examen selon les étudiants
qu’ils l’ont passé)
Quantitatif discrèt (nombre de modules validés),
Quantitatif continu(regroupé par classes) (la production laitière)

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 6 / 99


Motivation Description unidimensionnelle des données

Donnée, c’est quoi en fait ?

Pourquoi ? et Comment décrire ?

Les outils de statistique descriptive permet de répondre à ces questions


selon la démarche suivante :
1 Représenter numériquement et graphiquement les données ;
2 Synthétiser l’information portée par les données sous forme
d’indicateurs (paramètres) permettant de comprendre la structure des
données ainsi que faire des comparaison entre deux ou plusieurs
populations.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 7 / 99


Motivation Description unidimensionnelle des données

Donnée, c’est quoi en fait ?

DESCRIPTION UNDIMENSIONNELLE DE
DONNEES

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 8 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique

Les données sont souvent disponible sous la forme brute telle qu’elles
ont été collectées ou mesurées.
Pour des données de grande taille, une telle forme est difficilement
exploitable. L’extraction des informations statistiques est quasiment
impossible !
Le tableau statistique permet de regrouper les modalités
x1 , x2 , . . . , xk d’un caractère étudié X en fonction de leurs fréquences
d’occurrence (les effectifs ni ou les fréquences fi , i = 1, . . . , k).
La série {(x1 , n1 ); (x2 , n2 ); . . . ; (xk , nk )} est appelée la série statistique
associée à X .

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 9 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

DONNEES QUALITATIVES

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 10 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données qualitatives

Exemple 1 : Sexe des étudiants


On s’intéresse à la variable "Sexe" notée X de 15 ètudiant(e)s.
Les données brutes sont fournies comme suit :

M, F, F, M, M, M, F, M, F, M, F, M, M, F, F
→ En regroupant ces données sous forme de tableau statistique, on
obtient :
Sexe Effectif
F 7
M 8
Total 15
Table – Sexe des étudiants en effectifs

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 11 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Visualisation graphique
Diagramme en rectangles (ou en tuyaux d’orgue)

→ Repésentation des effectifs (ou fréquences) des modalités d’un


caractère qualitatif.

Figure – Répartition des étudiants selon le sexe

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 12 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Visualisation graphique
Diagramme en secteurs (ou camembert)

→ L’effectif de chaque modalité est représenté par un angle


ni
αi = 360o = 360o fi
Ni

Figure – Répartition des étudiants selon le sexe

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 13 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

DONNEES QUANTITATIVES DISCRèTES

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 14 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives discrètes

Exemple 2 : Nombre de modules validés


On s’intéresse au nombre de modules validés X parmi 8 modules du
premier semestre de 15 étudiant(e)s. Les données brutes sont fournies
comme suit :

2, 1, 0, 2, 3, 0, 1, 2, 4, 1, 3, 6, 4, 3, 7

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 15 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Données quantitatives discrètes


Tableau statistique-série statistique

→ En regroupant ces données sous forme de tableau statistique :


xi ni
0 2
1 3
2 3
3 3
4 2
6 1
7 1
Total 15
Table – Nombre de modules validés en effectifs

{(0, 2); (1, 3); . . . ; (8, 0)} est la série statistique associée à X .
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 16 / 99
Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Visualisation graphique
Diagramme en bâtons

→ Repésentation des effectifs (ou fréquences) des modalités d’un


caractère quantitatif.

Figure – Répartition des étudiants


A.SETTAR (FSTM) selon
Cours de Statistique le nombre des modules
descriptive validés
MIP/S4 2023-2024 17 / 99
Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Notations

Les notations suivantes n’ont aucun sens analytique ou algèbrique des


fonctions et des applications.

n(#) : Nombre des individus ayant une valeur du caractère vérifiant la


propriété #.
n(X ≤ 3) : Nombre des étudiants ayant validé au plus 3 modules [15]
f (#) : Proportions des individus ayant une valeur du caractère
vérifiant la propriété #.
f (4 ≤ X ≤ 5) : Proportion des étudiants ayant validé entre 4 et 5
modules [15].

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 18 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Au moins/au plus/moins de/plus de

à noter !
au moins=moins que, i.e. n(X ≥ a) = N − n(X < a)
au plus=plus que, i.e. n(X ≤ a) = N − n(X > a)

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 19 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulé-Fréquence cumulée

Modalité Effectif Effectif cumulé Fréquence Fréquence cumulée


xi ni N(xi ) = N(xi−1 ) + ni fi = ni /N F (xi ) = F (xi−1 ) + fi
x1 n1 N(x1 ) = n1 f1 F (x1 ) = f1
x2 n2 N(x2 ) = N(x1 ) + n2 f2 F (x2 ) = F (x1 ) + f2
x3 n3 N(x3 ) = N(x2 ) + n3 f3 F (x3 ) = F (x2 ) + f3
.. .. .. .. ..
. . . . .
xk nk N(xk ) = N fk F (xk ) = 1
Total N = Σki=1 ni 1 = Σki=1 fi

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 20 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulé-Fréquence cumulée

à retenir (Interprétation)
N(xi ) = n(X ≤xi ) : l’effectif des individus ayant une valeur du
caractère ≤ xi (au plus xi ).
N(xi )
F (xi ) = f (X ≤xi ) = : la proportion des individus ayant une
N
valeur du caractère ≤ xi (au plus xi ).

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 21 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulé-Fréquence cumulée

Exemple 2 (suite) :
xi ni N(xi )
0 2 2
1 3 5
2 3 8
3 3 11
4 2 13
6 1 14
7 1 15
Total 15
Table – Nombre de modules validés en effectifs

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 22 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulé-Fréquence cumulée

Le nombres des étudiants qui ont validé au plus 2 modules ? [3]

N(2) = n(X ≤ 2) = n1 + n2 + n3 = 2 + 3 + 3 = 8

La proportion des étudiants qui ont validé au plus 2 modules ?

2 3 3 8
F (2) = f (X ≤ 2) = f1 + f2 + f3 = + + =
15 15 15 15

Ou bien :
N(2) 8
F (2) = =
N 15

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 23 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulé-Fréquence cumulée

Le nombre des étudiants ayant validé au moins 2 modules : [3]

n(X ≥ 2) = N − n(X < 2) = N − n(X ≤ 1) = N − N(1) = 10

Le nombre des étudiants ayant validé moins de 2 modules

n(X < 2) = n(X ≤ 1) = N(1) = N1 = 5

Le nombre des étudiants ayant validé plus de 2 modules

n(X > 2) = N − n(X ≤ 2) = N − N(2) = 15 − 8 = 7

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 24 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulé-Fréquence cumulée

La proportion des étudiants ayant validé entre 1 et 3 modules


f (1 ≤ X ≤ 3) = f (X ≤ 3) − f (X <1) = f (X ≤ 3) − f (X ≤ 0) =
F (3) − F (0) = 60%

à noter !
Pour un caractère quantitatif discrèt X , on a :

f (xi−1 ≤ X ≤ xi ) = F (xi ) − F (xi−2 )

(Ne pas compter la frq́uence de xi deux fois !).

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 25 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

DONNEES QUANTITATIVES CONTINUES

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 26 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives continues

Exemple 3 : Production laitière


On s’intéresse au caractére X exprimant la production laitière journalière
en litre de 12 coopératives. Les données brutes sont fournies comme suit :

22.6, 31.2, 19.8, 18.1, 31.6, 21.3, 23.8, 31.0, 25.7, 22.5, 32.1, 29.4

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 27 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives continues

→ En regroupant ces données sous forme de tableau statistique, on


obtient :
Ci = [xi−1 , xi [ ni
[18, 20[ 2
[20, 24[ 4
[24, 30[ 2
[30, 35] 4
Total 12
Table – Production laitière journalière en effectifs

{(C1 , 2); (C2 , 4); (C3 , 2); (C4 , 4)} est la série statistique associée à X .

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 28 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Visualisation graphique
Histogramme

→ Une représentation graphique des effectifs (ou fréquences) par unité de


mesure(= densités ou effectif/fréquence corrigées).
[xi−1 , xi [ ni ai hi = ni /ai
[18, 20[ 2 2 1
[20, 24[ 4 4 1
[24, 30[ 2 6 0.33
[30, 35] 4 5 0.8
Total 12 − ̸= N
Remarque
L’appellation "effectif" ou "fréquence" corrigées peut être trompeuse
car ki=1 hi ̸= N (resp. ̸= 1) si hi est la densité d’effectif (resp. de
P

fréquence).
ni
D’une manière génerale hi = × α, avec α = pgcd(ai ).
ai
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 29 / 99
Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Visualisation graphique
Histogramme

L’effectif ni d’une classe [xi−1 , xi [ est la surface du rectangle qui lui


correspond dans l’histogramme ni = ai × hi ⇔ hi = ni /ai

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 30 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulée-Fréquence cumulée

→ Tableau statistique en effectifs :


Modalité Amplitude Centre Effectif Effectif cumulé
Ci = [xi−1 , xi [ ai = xi − xi−1 ci = xi +x2 i−1 ni N(xi ) = N(xi−1 ) + ni
C1 a1 c1 n1 N(x1 ) = n1
C2 a2 c2 n2 N(x2 ) = N(x1 ) + n2
C3 a3 c3 n3 N(x3 ) = N(x2 ) + n3
.. .. .. .. ..
. . . . .
Ck ak ck nk N(xk ) = N
Total − − N = Σki=1 ni −

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 31 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Effectif cumulée-Fréquence cumulée

→ Tableau statistique en fréquences :


Modalité Amplitude Centre Fréquence Fréquence cumulée
Ci = [xi−1 , xi [ ai = xi − xi−1 ci = xi +x2 i−1 fi = nNi F (xi ) = F (xi−1 ) + fi
C1 a1 c1 f1 F (x1 ) = f1
C2 a2 c2 f2 F (x2 ) = F (x1 ) + f2
C3 a3 c3 f3 F (x3 ) = F (x2 ) + f3
.. .. .. .. ..
. . . . .
Ck ak ck fk F (xk ) = 1
Total − − 1 = Σki=1 fi −

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 32 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives continues

Exemple 3 [27] (suite) :

[xi−1 , xi [ ai ci fi F (xi )
[18, 20[ 2 19 1/6 1/6
[20, 24[ 4 22 1/3 1/2
[24, 30[ 6 27 1/6 2/3
[30, 35] 5 32.5 1/3 1
Total − − 1 −
Table – Production laitière journalière en effectifs

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 33 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives continues

La proportion des coopératives qui produisent au plus 24 l/jr est


F (24) = f (X ≤ 24) = f (18 ≤ X < 20) + f (20 ≤ X < 24) =
2/12 + 4/12 = 50% [5]
La proportion des coopératives qui produisent au moins 20 l/jr est

f (X ≥ 20) = 1 − F (20) = 1 − 1/6 = 5/6 = 83.3% [5]

La proportion des coopératives qui produisent entre 20 l/jr et 30 l/jr


est

f (20 ≤ X ≤ 30) = F (30) − F (20) = 2/3 − 1/6 = 50% [5]

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 34 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives continues

à noter !
Pour un caractère quantitatif continu X , on a :

f (xi−1 ≤ X ≤ xi ) = F (xi ) − F (xi−1 )

Car f (X < xi ) = f (X ≤ xi ). ̸= [25]

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 35 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives continues

Quelle est l’effectif et la proportion des coopératives qui produisent une


quantité du lait entre 25 et 28 l/jr ?
L’effectif n correspondant à la classe [25, 28] n’est pas observable !
Sous l’hypothèse d’équirépartition des observations à l’intérieur de
chaque classe, on suppose que les deux classe ont la même densité,
i.e.,
n n3 f f3
= ⇔ =
28 − 25 30 − 24 28 − 25 30 − 24

28 − 25
→ n =2× =1
30 − 24
1 28 − 25
→ f = × = 8, 33%
6 30 − 24

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 36 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique
Données quantitatives continues

à noter !
L’effectif n correspondant à une classe [a, b] ⊂ [xi−1 , xi [ d’effectif ni est
calculé comme suit :
b−a b−a
n = ni ⇔ f = fi
xi − xi−1 xi − xi−1

Exemple 3 (suite) [27] : Calculer la proportion des coopératives qui


produisent une quantité de lait comprise entre 22 et 33 l/j.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 37 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

f (22 ≤ X ≤ 33) = f (22 ≤ X ≤ 24) + f (24 ≤ X ≤ 30) + f (30 ≤ X ≤ 33)

1 24 − 22 1 1 33 − 30
   
= + + = 53, 33%
3 24 − 20 6 3 35 − 30

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 38 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Autre méthode : On présente les données de l’exemple 3 [27] en se


donnant seulement les fréquences cumulées :
[xi−1 , xi [ F (xi )
[18, 20[ 1/6
[20, 24[ 1/2
[24, 30[ 2/3
[30, 35] 1
Total −
D’apès (35), on a f (22 ≤ X ≤ 33) = F (33) − F (22)
On a :
F (22) = F (20) + F (24)−F
24−20
(20)
(22 − 20) = 1/6 + 1/2−1/6
24−20 (22 − 20) ≃ 33, 33%
F (35)−F (30) 1−2/3
F (33) = F (30) + 35−30 (33 − 30) = 2/3 + 35−30 (33 − 30) ≃ 86, 66%
D’où :

f (22 ≤ X ≤ 33) = 86, 66% − 33, 33% ≃ 53, 33%

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 39 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

Tableau statistique

Remarques :
Le calcul de l’effectif ni (resp.Ni ) par ni = fi N (resp. N(xi ) = F (xi )N)
est à éviter lorsque la partie décimale de fi (resp. F (xi )) est inexacte !
Pour une classe Ci = [xi−1 , xi [, il est plus rigoureux de noter sa
fréquence (resp. son effectif) cumulée par F (xi ) (resp. N(xi )) au lieu
de Fi (resp. Ni ).

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 40 / 99


Motivation Description unidimensionnelle des données

Présentation des données : Tableau statistique et Visualisation graphique

PARAMETRES DE TENDANCE CENTRALE

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 41 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

MOYENNE(S)

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 42 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Moyenne arithmétique
Motivation

Exemple 4
On choisit deux échantillons de 10 étudiants appartenant à deux groupes
de TD de Statistique pour comparer leurs notes d’examen (/20).

A 10 12.5 7 9 14 11 15.5 18 6 10
B 16.5 14 17 8 18.5 13 13 15.5 12 9.5

10 + 12.5 + 7 + 9 + 14 + 11 + 15.5 + 18 + 6 + 10
xA = = 11.3
10
16.5 + 14 + 17 + 8 + 18.5 + 13 + 13 + 15.5 + 12 + 9.5
xB = = 13.7
10
Le meilleur groupe de TD est donc... ?
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 43 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Moyenne arithmétique
Pour un caractère quantitatif discrèt

à retenir
La moyenne arithmétique d’une série statistique discrète
{(xi , ni ), i = 1, . . . , k}, notée x , est donnée par
k k k
1 X X X
x= ni xi = fi xi avec N = ni
N i=1 i=1 i=1

Exercice
Calculer la moyenne arithmétique de l’exemple 2 [15] sous les données
brutes et regroupées.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 44 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

39
x=
15

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 45 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Moyenne arithmétique
Pour un caractère quantitatif continu

Soit X un caractère statistique quantitatif continu dont les valeurs sont


regroupées par classes [xi−1 , xi [ de centres ci , i = 1, . . . , k.

à retenir
La moyenne arithmétique d’une série statistique continue
{(ci , ni ), i = 1, . . . , k}, notée x , est donnée par
k k k
1 X X X
x= ni ci = fi ci avec N = ni
N i=1 i=1 i=1

Exercice
Calculer la moyenne arithmétique de l’exemple 3 [27] sous les données
brutes et regroupées.
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 46 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

310
x=
12

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 47 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Moyenne arithmétique
Propriétés générales : linéarité de la moyenne

à noter !
Pour tout caractères quantitatifs X et Y , et tout scalaire λ, on a :
x +λ=x +λ
λx = λx
x +y =x +y
xy ̸= x y

Mais à quoi ceux-ci servent-ils... ?

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 48 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Moyenne arithmétique
Propriétés générales : linéarité de la moyenne

Exercice
Un magasin vend trois types de produits, A, B et C. Soient X , Y et Z ,
respectivement, les profits mensuels en DH de la vente des produits A, B
et C durant les six derniers mois :

X : 4015, 4000, 4026, 4005, 4074, 4018


Y : 4200, 3700, 3200, 4000, 3900, 4100

1 Calculer le profit mensuel moyen de la vente du produit A et du


produit B.
2 Calculer le profit mensuel moyen de la vente du produit C sachant que
le profit moyen total de la vente des produits A et C est de 4025,5.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 49 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Moyenne des moyennes !


à retenir
Soit X un caractère statistique quantitatif et soient A1 , A2 , . . . , Ak une
partition de k sous populations d’une population P d’effectifs respectifs
N1 , N2 , . . . , Nk et de moyennes respectives x 1 , x 2 , . . . , x k . La moyenne
globale par rapport à P est donnée par :
N1 x 1 + N2 x 2 + . . . + Nk x k
x=
N1 + N2 + . . . + Nk

Exemple : Calculons la note moyenne de l’ensemble des étudiants des


deux TD de l’exemple [43] :
10x A + 10x B
x= = 12, 5
10 + 10

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 50 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Moyenne
Pour un caractère qualitatif

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 51 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

MODE

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 52 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Mode
Motivation

Le tableau ci-dessous représente le nombre de recommandations ni


données pour 4 médecins sur une page facebook :
Nom du médecin ni fi (%)
Dr. xxxx 1 ≈ 8, 3%
Dr. yyyy 7 ≈ 58, 3%
Dr. zzzz 2 ≈ 16, 6%
Dr. tttt 2 ≈ 16, 6%
Totale 12 100%
. . .Quel médecin allez-vous choisir ?
à retenir
Le mode d’une série statistique est la modalité la plus représentée dans la
population. Pour un caractère statistique X, le mode est noté Mo (X ).
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 53 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Mode
Pour un caractère qualitatif ou quantitatif discret

à retenir
Le mode d’une série statistique correspondant à un caractère qualitatif ou
quantitatif discret et la modalité qui posséde le plus grand effectif ou
fréquence.

Dans l’exemple 1, Mo (X ) = ”M” avec un effectif de 8 parmi 15. [11]


La série est dite unimodale
Dans l’exemple 2, les modalités 1,2 et 3 possèdent les trois le plus
grand effectif (=3). [15]
La série est dite trimodale,

Mo (X ) = {1, 2, 3}

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 54 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Mode
Pour un caractère quantitatif continu

Dans ce cas, le mode n’est pas forcément observable !, on observe plutôt


une classe modale.
à retenir (Classe modale)
La classe modale d’une série statistique quantitative continue est la classe
qui posséde le plus grand effectif corrigé ou la plus grande fréquence
corrigée. On dit souvent la classe qui possd̀e la plus grande densité.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 55 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Mode
Pour un caractère quantitatif continu

Exemple 5
Dans une course à pied qui se dispute sur une distance de 42 Km, on a
observé à un instant donné la position des coureurs en fonction de leurs
distances par rapport à la ligne de départ. Les données sont regroupées par
classes comme suit :
[xi−1 , xi [ ni
[5, 10[ 15
[10, 20[ 36
[20, 30[ 7
[30, 40[ 4
Total 62
Table – Nombre des coureurs par distances parcourue

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 56 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Mode
Pour un caractère quantitatif continu

à retenir (Mode)
Soit [xi−1 , xi [ la classe modale d’une série statistique quantitative
continue. Le mode est donné sous l’hypothèse d’équirépartition des
observation à l’intérieur de chaque classe, par :
∆1
Mo (X ) ≈ xi−1 + ai
∆1 + ∆ 2
Avec : ∆1 = hi − hi−1 , ∆2 = hi − hi+1 où hi est la densité de la classe
[xi−1 , xi [

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 57 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Mode
Pour un caractère quantitatif continu

Exercice
Calculer le mode dans l’exemple 5 [6].
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 58 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Mo (X ) ∈ [10, 20[⇒

3, 6 − 3
Mo (X ) ≈ 10 + 10
(3, 6 − 3) + (3, 6 − 0, 7))

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 59 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

QUANTILES

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 60 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Quantiles d’ordre α, 0 < α < 1

Les quantiles permettent de "zoomer" sur la distribution d’une série


statistique par "tranches".
à retenir
Les quantiles ou les fractiles d’ordre α sont des valeurs qui partagent la
série statistique ordonnée en 1/α parties contenant chacune (α × 100)%
d’observations

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 61 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Quartiles, α = 0, 25

à retenir
Les quartiles sont des valeurs qui partagent la série statistique ordonnée en
4 parties contenant chacune 25% des observations. Ils sont au nombre de
3 et sont notés Q1 , Q2 et Q3

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 62 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Déciles, α = 0, 1

à retenir
Les déciles sont des valeurs qui partagent la série statistique ordonnée en
10 parties contenant chacune 10% des observations. Ils sont au nombre de
9 et sont notés D1 , D2 , D3 , . . . , D9

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 63 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Centiles, α = 0, 01

à retenir
Les centiles sont des valeurs qui partagent la série statistique ordonnée en
100 parties contenant chacune 1% des observations. Ils sont au nombre de
99 et sont notés C1 , C2 , C3 , . . . , C99

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 64 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

à retenir
Caractérisation des Quantiles

à retenir (Caractérisation des Quantiles)


Soit qα le quantile d’ordre α d’une série statistique quantitative. Alors :

N(qα ) = αN (resp. F (qα ) = α)

On dit que α × 100% des individus ont une valeur du caractère ≤ qα .

Me = q0.5 ⇒ N(Me) = N/2 et F (Me) = 0, 5


→ 50% des individus ont une valeur du caractère ≤ Me
Q3 = q0.75 ⇒ N(Q3 ) = 3N/4 et F (Q3 ) = 0, 75
→ 75% des individus ont une valeur du caractère ≤ Q3
D2 = q0.2 ⇒ N(D2 ) = 2N/10 et F (D2 ) = 0, 2
→ 20% des individus ont une valeur du caractère ≤ D2
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 65 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Détérmination des Quantiles


Pour un caractère quantitatif discrèt

Considérons une série statistique quantitative discrète ordonnée telle que


x(1) ≤ x(2) ≤ x(3) ≤ . . . ≤ x(N) .

à retenir (Cas de données brutes)


x(Nα) + x(Nα+1)
Si Nα ∈ N alors qα = (*)
2
Si Nα ∈
/ N alors qα = x(⌊Nα⌋)+1
(⌊.⌋ : Partie entière)

Dans l’exemple 4 [43], la médiane de la série des notes de la classe A


(aprèrs l’avoir ordonner !) est Me (X ) = x(5) = 10. (10 × 0, 5 = 5 ∈ N).
Dans le même exemple, le 3 eme quartile de la série est
Q3 = x(8) = 14. (10 × 0, 75 = 7, 5 ∈
/ N et ⌊7, 5⌋ = 8).

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 66 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Détermination des Quantiles


Pour un caractère quantitatif discrèt

à retenir (Cas de données regroupées)


xi + xi+1
Si ∃xi tel que N(xi ) = Nα (ou F (xi ) = α) alors qα = (*)
2
Sinon qα = xi tel que N(xi−1 ) < Nα < N(xi ) (ou
F (xi−1 ) < α < F (xi ))

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 67 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Quantiles
Exemple 6
Le tableau ci-dessous représente les notes sur 5 attribuées par un groupe
d’interrogés la qualité d’un certain produit.

xi ni
0 1
1 5
2 20
3 6
4 17
5 15
Total 64
Table – Notes données par des interrogés

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 68 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Quantiles

xi ni N(xi ) F (xi )
0 1 1 2%
1 5 6 9%
2 20 26 41%
3 6 32 50%
4 17 49 77%
5 15 64 100%
Total 64
3+4
− N(3) = N/2 = 32 ⇒ Me(X ) = = 3, 5.
2
N
−6< = 16 < 26 = N(2) ⇒ Q1 = 2
4
3N
− 32 < < 49 = N(4) ⇒ Q3 = 4
4
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 69 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Détermination des Quantiles


Pour un caractère quantitatif continu

à retenir (Classe quantile d’ordre α)


La classe quantile d’ordre α est la classe qui contient qα . C’est la première
classe pour laquelle l’effectif cumulé est supérieur ou égale à αN (ou la
fréquence cumulèe dèpasse α).

Dans l’exemple 5 [6] et à partir du tableau ci-dessous :


[xi−1 , xi [ ni N(xi )
[5, 10[ 15 15
[10, 20[ 36 51
[20, 30[ 7 58
[30, 40[ 4 62
Total 62 −
Table – Nombre des coureurs par distances parcourue
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 70 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Détermination des Quantiles


Pour un caractère quantitatif continu

N
La classe médiane est [10, 20[ car 15 < = 62/2 = 31 ≤ 51.
2
La classe décile d’ordre 0,9 (9 eme décile) est [20, 30[ car
9N
51 < = 55, 8 ≤ 58.
10

à retenir (Quantile d’ordre α par Interpolation linéaire)


Soit [xi−1 , xi [ la classe quantile d’ordre α. La valeur de qα est donnée par
interpolation linéaire comme suit :

qα − xi−1 αN − N(xi−1 )
=
xi − xi−1 N(xi ) − N(xi−1 )

Calculer Me et D9 dans l’exemple 5 [8].


A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 71 / 99
Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Cas particulier : exemple

[xi−1 , xi [ ni N(xi )
[5, 10[ 15 15
[10, 20[ 6 21
[20, 30[ 5 26
[30, 40[ 26 52
Total 52 −

N
= 52/2 = 26 ≤ 26.
La classe médiane est [20, 30[ car 21 <
2
Me − 20 N(Me) − N(20)
Me ∈ [20, 30[ ⇒ =
30 − 20 N(30) − N(20)
Me − 20 26 − 21
⇒ = =1
10 26 − 21
⇒ Me = 30

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 72 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Quantiles et valeurs aberrante (Plage interquantile)

Les quartiles Q1 , Q2 et Q3 permet de détecter la présence de valeurs


aberrantes en définissant un intervalle d’aberrance.
à retenir (Régle de Tukey)
On pose Linf = Q1 − 1.5(Q3 − Q1 ) et Lsup = Q3 + 1.5(Q3 − Q1 ).
Toute valeur xi ∈
/ [Linf , Lsup ] est jugée aberrante.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 73 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Quantiles et valeurs aberrante (Plage interquantile)

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 74 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Quantiles et valeurs aberrante

Q1 = 4300, Q3 = 6500
Linf = Q1 − 1.5(Q3 − Q1 ) = 1000 et
Lsup = Q3 + 1.5(Q3 − Q1 ) = 9800
500, 750 et 10100 sont considérées aberrantes.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 75 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

Transformation linéraire des données

Tous les paramètres de tendance centrale vus précédemment conservent la


transformation linéraire des données, i.e.,
à noter !
Soit U le caractère statistique transformé d’un caractère quantitatif X tel
que U = βX + δ, alors :
u = βx + δ
Mo (U) = βMo (X ) + δ
Me (U) = βMe (X ) + δ
qα (U) = βqα (X ) + δ

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 76 / 99


Motivation Description unidimensionnelle des données

Paramètres de tendance centrale

PARAMETRES DE DISPERSION

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 77 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Motivation
Exemple 7
Considérons les séries brutes des salaires des employés de deux boites de
communication A et B.
i xiA j xjB
1 4000 1 2000
2 4300 2 2200
3 4700 3 3200
4 5500 4 5500
5 6200 5 6500
6 6700 6 9000
7 7100 7 10100
Moyenne 5500 5500
Médiane 5500 5500
étendue 3100 8100
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 78 / 99
Motivation Description unidimensionnelle des données

Paramètres de dispersion

Motivation

Figure – (A)

Figure – (B)
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 79 / 99
Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion

L’information basée sur les écarts entres les observation est appelée
"dispersion" ou "variabilité" de la série statistique .
Pour des séries statistiques de grande taille, les écarts entre les
observation 2 à 2, i.e., |xi − xj | est diffcilement exploitable !
Un paramètre de dispersion est basé sur la mesure synthétique des
écarts par rapport à une ou plusieurs valeurs de r éf érence dans la
série statistique.
Les valeurs de référence doivent représenter l’ensemble des
observations → Paramètres de tendance centrale.

à vérfier !
La dispersion d’une série statistique qualitative est hors question car l’écart
entre deux modalités qualitatives n’a pas de sens !

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 80 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

ETENDUE

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 81 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion
L’étendue

à retenir
L’étendue d’un caractère statistique X , noté ∆X , est la différence entre la
plus grande valeur et la plus petite valeur observée :

∆X = Max (X ) − Min(X ) = xmax − xmin

Exercice
Calculer l’étendue des données de l’exemple 5 [6].

MAIS... !
La présence de valeurs aberrantes dans la série statistique rend l’utilité de
l’étendue très limité.
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 82 / 99
Motivation Description unidimensionnelle des données

Paramètres de dispersion

ECART ABSOLU MOYEN

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 83 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion
L’écart absolu

Les mesures de dispersion vues précédement ne mettent pas en oeuvre


l’ensemble des observations x1 , x2 , . . . , xN , mais plutôt utilisent des
écarts entre des valeurs extrêmes (∆X ) de la série statistique.
Il est donc pensable d’introduire des mesures de dispersion synthétique
mettant en oeuvre toutes les observations de la série statistique.
En Statistique, la moyenne arithmétique est souvent utilisé pour
construire des paramètres synthétique.
Dans ce qui suit, les xi représentent les modalités dans le cas discret
ou les centres des classes dans le cas continu.

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 84 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion
L’écart absolu

à retenir (L’écart absolu moyen)


L’écart absolu moyen d’un caractère statistique X , noté Em (X ), est la
moyenne arithmétique des valeurs absolues des écarts à la moyenne :
N
1 X
Em (X ) = ni |xi − x |
N i=1

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 85 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion
L’écart absolu

à retenir (L’écart absolu médian)


L’écart absolu médian d’un caractère statistique X , noté EMe (X ), est la
moyenne arithmétique des valeurs absolues des écarts à la médiane :
N
1 X
EMe (X ) = ni |xi − Me |
N i=1

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 86 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Remarques :
EMe (X ) est moins sensible aux valeurs aberrantes que Em (X ).
Les deux écarts sont à la même unité de la série statistique.
Les deux écarts sont peu maniables à cause de la valeur absolue !

⇒ On introduit par suite un paramètre de dispersion synthétique basé sur


une forme d’écart facilement maniable...

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 87 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

VARIANCE-ECART TYPE

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 88 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion
La Variance

à retenir
La variance d’un caractere statistique X, notée V (X ), est la moyenne
arithmétique des carrés des écarts à la moyenne :
N
1 X
V (X ) = ni (xi − x )2
N i=1

Pour un caractère quantitatif continu, les xi sont remplacés par les centres
des classes ci .

Contrairement à Em (X ) et EMe (X ), la variance n’est pas à la même unité


de la série statistique mais plutôt au carré ! D’où l’introduction de
l’écart-type :

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 89 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Cas discrèt : exemple 2 (15)

2
159 39

V (X ) = −
15 15
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 90 / 99
Motivation Description unidimensionnelle des données

Paramètres de dispersion

Cas continu : exemple 3 (27)

2
8341 310

V (X ) = −
12 12

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 91 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion
L’écart-type

à retenir
L’écart-type, noté σ(X ), est la racine carrée de la variance :
q
σ(X ) = V (X )

à retenir (Propriétés)
1 Pk 2 2 Pk 2 2
V (X ) = N i=1 ni xi − x = i=1 fi xi − x .
V (aX + b) = a2 V (X ) ⇔ σ(aX + b) = |a|σ(X ).
V (X ) = 0 ⇔ toutes les valeurs sont identiques et égales à x .
En général V (X + Y ) ̸= V (X ) + V (Y ).
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 92 / 99
Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion

Exercice d’application
Dans chacun des exemples 5 et 6 :
1 Calculer x et Me (X ).
2 Calculer Em (X ), EMe (X ), V (X ) et σ(X ). En déduire.
X −x
 
3 Calculer V .
σ(X )

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 93 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

Paramètres de dispersion
Exercice d’application

xi ni N(xi ) ni xi ni xi2
x1 n1 N(x1 ) = n1 n1 x1 n1 x12
x2 n2 N(x2 ) = N(x1 ) + n2 n2 x2 n2 x22
.. .. .. .. ..
. . . . .
.. .. .. .. ..
. . . . .
xk nk N(xk ) = N nk xk nk x 2
Pk Pk Pk k 2
Total N= i=1 ni − i=1 ni xi i=1 ni xi

1 Pk
→ x= ni xi
N i=1
1 Pk 2 2
→ V (X ) = i=1 ni xi − x
N
p
→ σ(X ) = V (X )
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 94 / 99
Motivation Description unidimensionnelle des données

Paramètres de dispersion

Transformation linéraire des données

Tous les paramètres de dispersion (à part la variance) vus précédemment


sont linéraires par rapport aux modalités de la série statistique transformé,
i.e.,
à noter !
Soit U le caractère statistique transformé d’un caractère quantitatif X tel
que U = βX + δ, alors :
∆U = β∆X
Em (U) = βEm (X )
EMe (U) = βEMe (X )
σ(U) = |β|σ(X )

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 95 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion

PARAMETRES DE DISPERSION RELATIF

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 96 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion relatif

COEFFICIENT DE VARIATION

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 97 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion relatif

Coefficient de variation
Définition

à retenir (Coefficient de variation)


Le coefficient de variation d’une variable statistique X est une mesure de
dispersion relative (sans unité), noté Cv (X ), est défini par :

σ(X )
Cv (X ) =
x

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 98 / 99


Motivation Description unidimensionnelle des données

Paramètres de dispersion relatif

Exemple

Une société assure la livraison du café à 90 réstaurants. Soit Y la quantité


livrée en kg et X la durée de la livraison en h.

X (kg) ni Y (h) nj
20-25 36 2-6 23
25-30 34 6-12 21
30-35 20 12-18 35
18-24 11
N 90 N 90
x 26,6112 y 11,5223
σ(X ) 3,8642 σ(Y ) 5,6554
Cv (X ) 0,1453 Cv (Y ) 0,4909

Y est plus dispersée que X car Cv (Y ) > Cv (X ).

A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 99 / 99

Vous aimerez peut-être aussi