Académique Documents
Professionnel Documents
Culture Documents
Abdeljalil SETTAR
a.settar.fstm@gmail.com
Code Classroom : z6jgx6f
MIP/S4 2023-2024
Plan du chapitre
1 Motivation
Statistique vs statistique(s) !
Donnée, c’est quoi en fait ?
MOTIVATION
Statistique vs statistique(s) !
Statistique vs statistique(s) !
Statistique vs statistique(s) !
Exemples
M, F, F, M, M, M, F, M, F, M, F, M, M, F, F
Statistique vs statistique(s) !
Exemples
M, F, F, M, M, M, F, M, F, M, F, M, M, F, F
2, 1, 0, 2, 3, 0, 1, 2, 4, 1, 3, 6, 4, 3, 7
DESCRIPTION UNDIMENSIONNELLE DE
DONNEES
Tableau statistique
Les données sont souvent disponible sous la forme brute telle qu’elles
ont été collectées ou mesurées.
Pour des données de grande taille, une telle forme est difficilement
exploitable. L’extraction des informations statistiques est quasiment
impossible !
Le tableau statistique permet de regrouper les modalités
x1 , x2 , . . . , xk d’un caractère étudié X en fonction de leurs fréquences
d’occurrence (les effectifs ni ou les fréquences fi , i = 1, . . . , k).
La série {(x1 , n1 ); (x2 , n2 ); . . . ; (xk , nk )} est appelée la série statistique
associée à X .
DONNEES QUALITATIVES
Tableau statistique
Données qualitatives
M, F, F, M, M, M, F, M, F, M, F, M, M, F, F
→ En regroupant ces données sous forme de tableau statistique, on
obtient :
Sexe Effectif
F 7
M 8
Total 15
Table – Sexe des étudiants en effectifs
Visualisation graphique
Diagramme en rectangles (ou en tuyaux d’orgue)
Visualisation graphique
Diagramme en secteurs (ou camembert)
Tableau statistique
Données quantitatives discrètes
2, 1, 0, 2, 3, 0, 1, 2, 4, 1, 3, 6, 4, 3, 7
{(0, 2); (1, 3); . . . ; (8, 0)} est la série statistique associée à X .
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 16 / 99
Motivation Description unidimensionnelle des données
Visualisation graphique
Diagramme en bâtons
Notations
à noter !
au moins=moins que, i.e. n(X ≥ a) = N − n(X < a)
au plus=plus que, i.e. n(X ≤ a) = N − n(X > a)
Tableau statistique
Effectif cumulé-Fréquence cumulée
Tableau statistique
Effectif cumulé-Fréquence cumulée
à retenir (Interprétation)
N(xi ) = n(X ≤xi ) : l’effectif des individus ayant une valeur du
caractère ≤ xi (au plus xi ).
N(xi )
F (xi ) = f (X ≤xi ) = : la proportion des individus ayant une
N
valeur du caractère ≤ xi (au plus xi ).
Tableau statistique
Effectif cumulé-Fréquence cumulée
Exemple 2 (suite) :
xi ni N(xi )
0 2 2
1 3 5
2 3 8
3 3 11
4 2 13
6 1 14
7 1 15
Total 15
Table – Nombre de modules validés en effectifs
Tableau statistique
Effectif cumulé-Fréquence cumulée
N(2) = n(X ≤ 2) = n1 + n2 + n3 = 2 + 3 + 3 = 8
2 3 3 8
F (2) = f (X ≤ 2) = f1 + f2 + f3 = + + =
15 15 15 15
Ou bien :
N(2) 8
F (2) = =
N 15
Tableau statistique
Effectif cumulé-Fréquence cumulée
Tableau statistique
Effectif cumulé-Fréquence cumulée
à noter !
Pour un caractère quantitatif discrèt X , on a :
Tableau statistique
Données quantitatives continues
22.6, 31.2, 19.8, 18.1, 31.6, 21.3, 23.8, 31.0, 25.7, 22.5, 32.1, 29.4
Tableau statistique
Données quantitatives continues
{(C1 , 2); (C2 , 4); (C3 , 2); (C4 , 4)} est la série statistique associée à X .
Visualisation graphique
Histogramme
fréquence).
ni
D’une manière génerale hi = × α, avec α = pgcd(ai ).
ai
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 29 / 99
Motivation Description unidimensionnelle des données
Visualisation graphique
Histogramme
Tableau statistique
Effectif cumulée-Fréquence cumulée
Tableau statistique
Effectif cumulée-Fréquence cumulée
Tableau statistique
Données quantitatives continues
[xi−1 , xi [ ai ci fi F (xi )
[18, 20[ 2 19 1/6 1/6
[20, 24[ 4 22 1/3 1/2
[24, 30[ 6 27 1/6 2/3
[30, 35] 5 32.5 1/3 1
Total − − 1 −
Table – Production laitière journalière en effectifs
Tableau statistique
Données quantitatives continues
Tableau statistique
Données quantitatives continues
à noter !
Pour un caractère quantitatif continu X , on a :
Tableau statistique
Données quantitatives continues
28 − 25
→ n =2× =1
30 − 24
1 28 − 25
→ f = × = 8, 33%
6 30 − 24
Tableau statistique
Données quantitatives continues
à noter !
L’effectif n correspondant à une classe [a, b] ⊂ [xi−1 , xi [ d’effectif ni est
calculé comme suit :
b−a b−a
n = ni ⇔ f = fi
xi − xi−1 xi − xi−1
1 24 − 22 1 1 33 − 30
= + + = 53, 33%
3 24 − 20 6 3 35 − 30
Tableau statistique
Remarques :
Le calcul de l’effectif ni (resp.Ni ) par ni = fi N (resp. N(xi ) = F (xi )N)
est à éviter lorsque la partie décimale de fi (resp. F (xi )) est inexacte !
Pour une classe Ci = [xi−1 , xi [, il est plus rigoureux de noter sa
fréquence (resp. son effectif) cumulée par F (xi ) (resp. N(xi )) au lieu
de Fi (resp. Ni ).
MOYENNE(S)
Moyenne arithmétique
Motivation
Exemple 4
On choisit deux échantillons de 10 étudiants appartenant à deux groupes
de TD de Statistique pour comparer leurs notes d’examen (/20).
A 10 12.5 7 9 14 11 15.5 18 6 10
B 16.5 14 17 8 18.5 13 13 15.5 12 9.5
10 + 12.5 + 7 + 9 + 14 + 11 + 15.5 + 18 + 6 + 10
xA = = 11.3
10
16.5 + 14 + 17 + 8 + 18.5 + 13 + 13 + 15.5 + 12 + 9.5
xB = = 13.7
10
Le meilleur groupe de TD est donc... ?
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 43 / 99
Motivation Description unidimensionnelle des données
Moyenne arithmétique
Pour un caractère quantitatif discrèt
à retenir
La moyenne arithmétique d’une série statistique discrète
{(xi , ni ), i = 1, . . . , k}, notée x , est donnée par
k k k
1 X X X
x= ni xi = fi xi avec N = ni
N i=1 i=1 i=1
Exercice
Calculer la moyenne arithmétique de l’exemple 2 [15] sous les données
brutes et regroupées.
39
x=
15
Moyenne arithmétique
Pour un caractère quantitatif continu
à retenir
La moyenne arithmétique d’une série statistique continue
{(ci , ni ), i = 1, . . . , k}, notée x , est donnée par
k k k
1 X X X
x= ni ci = fi ci avec N = ni
N i=1 i=1 i=1
Exercice
Calculer la moyenne arithmétique de l’exemple 3 [27] sous les données
brutes et regroupées.
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 46 / 99
Motivation Description unidimensionnelle des données
310
x=
12
Moyenne arithmétique
Propriétés générales : linéarité de la moyenne
à noter !
Pour tout caractères quantitatifs X et Y , et tout scalaire λ, on a :
x +λ=x +λ
λx = λx
x +y =x +y
xy ̸= x y
Moyenne arithmétique
Propriétés générales : linéarité de la moyenne
Exercice
Un magasin vend trois types de produits, A, B et C. Soient X , Y et Z ,
respectivement, les profits mensuels en DH de la vente des produits A, B
et C durant les six derniers mois :
Moyenne
Pour un caractère qualitatif
MODE
Mode
Motivation
Mode
Pour un caractère qualitatif ou quantitatif discret
à retenir
Le mode d’une série statistique correspondant à un caractère qualitatif ou
quantitatif discret et la modalité qui posséde le plus grand effectif ou
fréquence.
Mo (X ) = {1, 2, 3}
Mode
Pour un caractère quantitatif continu
Mode
Pour un caractère quantitatif continu
Exemple 5
Dans une course à pied qui se dispute sur une distance de 42 Km, on a
observé à un instant donné la position des coureurs en fonction de leurs
distances par rapport à la ligne de départ. Les données sont regroupées par
classes comme suit :
[xi−1 , xi [ ni
[5, 10[ 15
[10, 20[ 36
[20, 30[ 7
[30, 40[ 4
Total 62
Table – Nombre des coureurs par distances parcourue
Mode
Pour un caractère quantitatif continu
à retenir (Mode)
Soit [xi−1 , xi [ la classe modale d’une série statistique quantitative
continue. Le mode est donné sous l’hypothèse d’équirépartition des
observation à l’intérieur de chaque classe, par :
∆1
Mo (X ) ≈ xi−1 + ai
∆1 + ∆ 2
Avec : ∆1 = hi − hi−1 , ∆2 = hi − hi+1 où hi est la densité de la classe
[xi−1 , xi [
Mode
Pour un caractère quantitatif continu
Exercice
Calculer le mode dans l’exemple 5 [6].
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 58 / 99
Motivation Description unidimensionnelle des données
Mo (X ) ∈ [10, 20[⇒
3, 6 − 3
Mo (X ) ≈ 10 + 10
(3, 6 − 3) + (3, 6 − 0, 7))
QUANTILES
Quartiles, α = 0, 25
à retenir
Les quartiles sont des valeurs qui partagent la série statistique ordonnée en
4 parties contenant chacune 25% des observations. Ils sont au nombre de
3 et sont notés Q1 , Q2 et Q3
Déciles, α = 0, 1
à retenir
Les déciles sont des valeurs qui partagent la série statistique ordonnée en
10 parties contenant chacune 10% des observations. Ils sont au nombre de
9 et sont notés D1 , D2 , D3 , . . . , D9
Centiles, α = 0, 01
à retenir
Les centiles sont des valeurs qui partagent la série statistique ordonnée en
100 parties contenant chacune 1% des observations. Ils sont au nombre de
99 et sont notés C1 , C2 , C3 , . . . , C99
à retenir
Caractérisation des Quantiles
Quantiles
Exemple 6
Le tableau ci-dessous représente les notes sur 5 attribuées par un groupe
d’interrogés la qualité d’un certain produit.
xi ni
0 1
1 5
2 20
3 6
4 17
5 15
Total 64
Table – Notes données par des interrogés
Quantiles
xi ni N(xi ) F (xi )
0 1 1 2%
1 5 6 9%
2 20 26 41%
3 6 32 50%
4 17 49 77%
5 15 64 100%
Total 64
3+4
− N(3) = N/2 = 32 ⇒ Me(X ) = = 3, 5.
2
N
−6< = 16 < 26 = N(2) ⇒ Q1 = 2
4
3N
− 32 < < 49 = N(4) ⇒ Q3 = 4
4
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 69 / 99
Motivation Description unidimensionnelle des données
N
La classe médiane est [10, 20[ car 15 < = 62/2 = 31 ≤ 51.
2
La classe décile d’ordre 0,9 (9 eme décile) est [20, 30[ car
9N
51 < = 55, 8 ≤ 58.
10
qα − xi−1 αN − N(xi−1 )
=
xi − xi−1 N(xi ) − N(xi−1 )
[xi−1 , xi [ ni N(xi )
[5, 10[ 15 15
[10, 20[ 6 21
[20, 30[ 5 26
[30, 40[ 26 52
Total 52 −
N
= 52/2 = 26 ≤ 26.
La classe médiane est [20, 30[ car 21 <
2
Me − 20 N(Me) − N(20)
Me ∈ [20, 30[ ⇒ =
30 − 20 N(30) − N(20)
Me − 20 26 − 21
⇒ = =1
10 26 − 21
⇒ Me = 30
Q1 = 4300, Q3 = 6500
Linf = Q1 − 1.5(Q3 − Q1 ) = 1000 et
Lsup = Q3 + 1.5(Q3 − Q1 ) = 9800
500, 750 et 10100 sont considérées aberrantes.
PARAMETRES DE DISPERSION
Paramètres de dispersion
Motivation
Exemple 7
Considérons les séries brutes des salaires des employés de deux boites de
communication A et B.
i xiA j xjB
1 4000 1 2000
2 4300 2 2200
3 4700 3 3200
4 5500 4 5500
5 6200 5 6500
6 6700 6 9000
7 7100 7 10100
Moyenne 5500 5500
Médiane 5500 5500
étendue 3100 8100
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 78 / 99
Motivation Description unidimensionnelle des données
Paramètres de dispersion
Motivation
Figure – (A)
Figure – (B)
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 79 / 99
Motivation Description unidimensionnelle des données
Paramètres de dispersion
Paramètres de dispersion
L’information basée sur les écarts entres les observation est appelée
"dispersion" ou "variabilité" de la série statistique .
Pour des séries statistiques de grande taille, les écarts entre les
observation 2 à 2, i.e., |xi − xj | est diffcilement exploitable !
Un paramètre de dispersion est basé sur la mesure synthétique des
écarts par rapport à une ou plusieurs valeurs de r éf érence dans la
série statistique.
Les valeurs de référence doivent représenter l’ensemble des
observations → Paramètres de tendance centrale.
à vérfier !
La dispersion d’une série statistique qualitative est hors question car l’écart
entre deux modalités qualitatives n’a pas de sens !
Paramètres de dispersion
ETENDUE
Paramètres de dispersion
Paramètres de dispersion
L’étendue
à retenir
L’étendue d’un caractère statistique X , noté ∆X , est la différence entre la
plus grande valeur et la plus petite valeur observée :
Exercice
Calculer l’étendue des données de l’exemple 5 [6].
MAIS... !
La présence de valeurs aberrantes dans la série statistique rend l’utilité de
l’étendue très limité.
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 82 / 99
Motivation Description unidimensionnelle des données
Paramètres de dispersion
Paramètres de dispersion
Paramètres de dispersion
L’écart absolu
Paramètres de dispersion
Paramètres de dispersion
L’écart absolu
Paramètres de dispersion
Paramètres de dispersion
L’écart absolu
Paramètres de dispersion
Remarques :
EMe (X ) est moins sensible aux valeurs aberrantes que Em (X ).
Les deux écarts sont à la même unité de la série statistique.
Les deux écarts sont peu maniables à cause de la valeur absolue !
Paramètres de dispersion
VARIANCE-ECART TYPE
Paramètres de dispersion
Paramètres de dispersion
La Variance
à retenir
La variance d’un caractere statistique X, notée V (X ), est la moyenne
arithmétique des carrés des écarts à la moyenne :
N
1 X
V (X ) = ni (xi − x )2
N i=1
Pour un caractère quantitatif continu, les xi sont remplacés par les centres
des classes ci .
Paramètres de dispersion
2
159 39
V (X ) = −
15 15
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 90 / 99
Motivation Description unidimensionnelle des données
Paramètres de dispersion
2
8341 310
V (X ) = −
12 12
Paramètres de dispersion
Paramètres de dispersion
L’écart-type
à retenir
L’écart-type, noté σ(X ), est la racine carrée de la variance :
q
σ(X ) = V (X )
à retenir (Propriétés)
1 Pk 2 2 Pk 2 2
V (X ) = N i=1 ni xi − x = i=1 fi xi − x .
V (aX + b) = a2 V (X ) ⇔ σ(aX + b) = |a|σ(X ).
V (X ) = 0 ⇔ toutes les valeurs sont identiques et égales à x .
En général V (X + Y ) ̸= V (X ) + V (Y ).
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 92 / 99
Motivation Description unidimensionnelle des données
Paramètres de dispersion
Paramètres de dispersion
Exercice d’application
Dans chacun des exemples 5 et 6 :
1 Calculer x et Me (X ).
2 Calculer Em (X ), EMe (X ), V (X ) et σ(X ). En déduire.
X −x
3 Calculer V .
σ(X )
Paramètres de dispersion
Paramètres de dispersion
Exercice d’application
xi ni N(xi ) ni xi ni xi2
x1 n1 N(x1 ) = n1 n1 x1 n1 x12
x2 n2 N(x2 ) = N(x1 ) + n2 n2 x2 n2 x22
.. .. .. .. ..
. . . . .
.. .. .. .. ..
. . . . .
xk nk N(xk ) = N nk xk nk x 2
Pk Pk Pk k 2
Total N= i=1 ni − i=1 ni xi i=1 ni xi
1 Pk
→ x= ni xi
N i=1
1 Pk 2 2
→ V (X ) = i=1 ni xi − x
N
p
→ σ(X ) = V (X )
A.SETTAR (FSTM) Cours de Statistique descriptive MIP/S4 2023-2024 94 / 99
Motivation Description unidimensionnelle des données
Paramètres de dispersion
Paramètres de dispersion
COEFFICIENT DE VARIATION
Coefficient de variation
Définition
σ(X )
Cv (X ) =
x
Exemple
X (kg) ni Y (h) nj
20-25 36 2-6 23
25-30 34 6-12 21
30-35 20 12-18 35
18-24 11
N 90 N 90
x 26,6112 y 11,5223
σ(X ) 3,8642 σ(Y ) 5,6554
Cv (X ) 0,1453 Cv (Y ) 0,4909