Vous êtes sur la page 1sur 71

Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Statistique descriptive

Pr. Abderrahmane Moussi

FSJES- Université Mohammed premier, Oujda


Filière: Économie & Gestion (Semestre 1)

Année Universitaire: 2021-2022

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Sommaire

Préliminaires et Vocabulaire

Statistique descriptive à une variable

distributions des effectifs et des fréquences

Groupement des données en classes

Représentations graphiques

Paramètres de Position

Paramètres de dispersion
Pr. Abderrahmane Moussi Statistique descriptive
Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

La statistique est la branche de mathématiques:


I Collecter les données relatives à un sujet d’étude.
I Représenter ces données sous forme facilement
exploitable.
I Les analyser.
I Interpréter.
I Modéliser pour faire des prévisions.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

la statistique descriptive concerne l’étude de données


observées ou mesurées. L’objectif étant de fournir des
indicateurs simples, peu nombreux et concis

I Donner des conclusions sur le phénomène étudié.
I Comparer deux séries de données.
I Étudier le lien existant entre deux sujets d’étude.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

I Population (notée Ω): on appelle population un ensemble


d’éléments de même nature, appelés individus (ou
unité statistique).
I l’effectif total (noté N): le nombre d’éléments de la
population.

On écrit:

card(Ω) = N .

Remarque 1.1
Notons qu’une partie d’une population est appelée Échantillon.
Dans ce cas, le nombre d’éléments est noté n.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

I Caractère (ou variable statistique): désigne la propriété


(ou spécificité) étudiée chez les individus de la population
étudiée. Il est souvent noté x.
I Modalité d’un caractère: on appelle modalité d’un
caractère, une situation dans laquelle se trouve le
caractère étudié. Les modalités sont alors les différentes
spécificités du caractère étudié.
On note x1 , x2 , · · · , xp pour les p valeurs prises par la
variable statistique x.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

Exemple 1.2

I Population étudiée: étudiants S1 Economie et Gestion


I variable statistique (caractère): mention obtenue au
Baccalauréat
I Modalités: Passable, Assez-bien, Bien, Très Bien.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

Les variables statistiques (caractères) que l’on va étudier sont


soit quantitatives, soit qualitatives.
I Variable quantitative: une variable statistique est dite
quantitative lorsque ses modalités sont mesurables.
I Variable qualitative: une variable statistique est dite
qualitative lorsque ses modalités ne sont pas mesurables.
On distingue deux types de variables qualitatives:
Nominale pour laquelle les modalités ne peuvent pas être
ordonnées (par exemple couleur de cheveux...) ou ordinale
pour laquelle les modalités peuvent être ordonnées (par
exemple niveau de satisfaction...).

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

Remarque 1.3

I Variable quantitative discrète: on dit qu’une variable


statistique (caractère) quantitative est discrète si
l’ensemble de ses valeurs est fini ou dénombrable.
Par exemple quand on étudie le nombre d’enfants par
foyer, les résultats d’examens...
I Variable quantitative continue: on dit qu’une variable
statistique (caractère) quantitative est continue si
l’ensemble de ses valeurs est infini.
Par exemple quand on étudie le poids, les longueurs...

Lorsque la variable statistique est quantitative discrète prenant


plusieurs valeurs, elle peut être traitée comme une variable
statistique continue.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

Exemple 1.4

I variables quantitatives: On veut étudier le caractère "notes


des étudiants". Dans ce cas, il s’agit d’une variable
quantitative dont les modalités sont les notes entre la
valeur 0 et la valeur 20.
I variables qualitatives: On veut étudier le caractère "groupe
sanguin des étudiants" ou encore "profession de père".
Dans ce cas, il s’agit du cas qualitatif.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

Notations

Notation
signification
cas d’une population cas d’un échantillon
Effectif total N n
Moyenne µ x̄ ou x̄n
Variance σ2 S 2 ou Sn2
Écart-type σ S ou Sn

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Définitions

Considérons une population Ω de taille N.


Soit x une variable statistique quantitative discrète ou
qualitative.
Les modalités de x sont notés (rangées dans l’ordre croissant)
x1 , x2 , · · · , xp .

On note:

x(Ω) = {x1 , x2 , · · · , xp } .

On note (xi , ni )i=1,···p la série statistique étudiée.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Definition 1
- L’effectif (ou fréquence absolue) d’une modalité est le
nombre noté ni d’individus présentant cette modalité. On a:
p
X
ni = n1 + n2 + · · · + np = N
i=1

- La fréquence d’une modalité (xi ) est le nombre noté fi qui


correspond à la quantité suivante:
ni
fi =
N
- Le pourcentage d’une modalité (xi ) est la quantité suivante:
ni
100 × fi = 100 ×
N
Pr. Abderrahmane Moussi Statistique descriptive
Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Exemple 3.1
On souhaite étudier le nombre d’appels téléphoniques reçues par le standard de la
Faculté pendant la période matinale pendant 60 jours.

Nombre d’appels 0 1 3 4 6 7
Effectifs 2 10 16 20 9 3

La variable statistique ici est:


x:"le nombre d’appels". C’est une variable quantitative discrète. Les modalités de cette
variables sont:

x1 = 0, x2 = 1, x3 = 3, x4 = 4, x5 = 6, x6 = 7 .

L’effectif total N = 60.


2
L’effectif de la valeur x1 = 0 est: n1 = 2 . Par conséquent, f1 = ,
60
10
L’effectif de la valeur x2 = 1 est: n2 = 10 . Par conséquent, f2 = ,
60
..
.
3
L’effectif de la valeur x6 = 7 est: n6 = 3 . Par conséquent, f6 = .
60
Pr. Abderrahmane Moussi Statistique descriptive
Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Remarque 3.2 (Propriétés)


Les fréquences doivent toujours vérifier les propriétés
suivantes:
1. ∀i ∈ {1, · · · , p} , on a:
0 ≤ fi ≤ 1
2. La somme des fréquences est égale à 1:
p
X
fi = f1 + f2 + · · · + fp = 1
i=1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Definition 2

1. L’effectif cumulé croissant d’une valeur xi est la somme


des effectifs de cette valeur et des valeurs inférieures.
C’est à dire:
Ni = n1 + n2 + · · · + ni .
2. La fréquence cumulée croissante, notée Fi d’une valeur
xi est la somme des fréquences de cette valeur et des
valeurs inférieures. C’est à dire:
Fi = f1 + f2 + · · · + fi .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les notions et données présentées ci-dessus peuvent être


regroupées sous-forme d’un tableau récapitulatif (tableau
statistique ou tableau synthèse) comme suit:

Valeur de la variable Effectifs Fréquences Effectif cumulé Fréquences cumulées


(xi ) (ni ) (fi ) croissant (Ni ) croissantes (Fi )
x1 n1 f1 N1 = n 1 F1 = f1
x2 n2 f2 N2 = n1 + n2 F 2 = f1 + f2
. . . . .
. . . . .
. . . . .
xi ni fi Ni = n1 + n2 + · · · + ni F1 = f1 + f2 + · · · + fi
. . . . .
. . . . .
. . . . .
xp np fp n1 + n2 + · · · + np = N F p = f1 + f2 + · · · + fp = 1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Présentations des données:


I Forme brute.
I Modalités discrètes.
I En classes.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Regrouper les données en intervalles appelés classes statistiques


(ou simplement classes).
Nous disposons de N valeurs. Ces valeurs seront regroupées dans q
classes. Pour chaque classe ci =]ai−1 , ai ] (la ième classe), on a:
I ai−1 et ai s’appellent les bornes ou limites de la classe ci .
ai + ai−1
I mi = s’appelle le centre (ou milieu) de la classe ci .
2
I ai − ai−1 s’appelle l’amplitude ou l’étendu de la classe ci .

I l’effectif ni de la classe ci est le nombre d’individus pour lesquels


la variable statistique prend une valeur dans l’intervalle ci .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

ni
I la fréquence fi de la classe ci est le rapport .
N
I la fréquence cumulée Fi de la classe ci est la somme des
fréquences de cette classe et des classes précédentes:
Fi = f1 + f2 + · · · + fi .
I Quand les classes sont d’amplitudes différentes, on
considère la densité de la classe au lieu de considérer la
fréquence. En effet, pour ci (la classe i), la densité est le
rapport suivant:
fi
di =
ai − ai−1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Remarque 4.1

I Nous disposons de N valeurs.


I La valeur minimale doit être incluse dans la première
classe, la valeur maximale doit être dans la dernière
classe.
I Il est préférable que les amplitudes des q classes doivent
être les mêmes.
I Le nombre q de classes à choisir est donné par la règle de
Sturges suivante:
ln N
q ≈ 1 + log2 (N) = 1 + .
ln 2

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Exemple 4.2
Les données suivantes correspondant aux poids de 20
étudiants:

60 80 65 70 72

89 82 67 73 63

62 79 64 68 78

66 77 88 83 79

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Exemple 4.3
La valeur minimale est 60, la valeur maximale est de 89. Par
conséquent, la première classe doit contenir la valeur 60 et la
dernière doit contenir la valeur 89.
En appliquant la règle de Sturges, on trouve que q ≈ 5 . Donc
les classes qui peuvent être choisies sont:
[60, 66[; [66, 72[; [72, 78[; [78, 84[; [84, 90[ .
Ainsi, le tableau statistique avec les données groupées en
classe est le suivant:

Classes Effectifs
[60,66[ 5
[66,72[ 4
[72,78[ 3
[78,84[ 6
[84,90[ 2

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Une étude sur 1000 familles demandant le nombre de pièces


composant leur logements.

Nombre de pièces 1 2 3 4 5
Effectifs (ni ) 300 180 270 200 50
Fréquences (fi ) 0,3 0,18 0,27 0,2 0,05
Fréquences cumulées (Fi ) 0,3 0,48 0,75 0,95 1
Effectifs cumulés (Ni ) 300 480 750 950 1000

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Diagramme en bâtons des effectifs: il s’agit d’un graphe


représentant, sur l’axe des abscisses, les modalités ou valeurs
prises par la variable statistique. Sur l’axe des ordonnées figure
les effectifs.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Diagramme en bâtons des fréquences: il s’agit d’un graphe


représentant, sur l’axe des abscisses, les modalités ou valeurs
prises par la variable statistique. Sur l’axe des ordonnées figure
les fréquences.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Les polygones des effectifs et des fréquences: il s’agit de


joindre les sommets des bâtons pour obtenir des polygones.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Les effectifs cumulés ainsi que les fréquences cumulées


peuvent être représentées par des courbes appelées les
courbes cumulatives.
Pour les effectifs: Il s’agit de la représentation graphique de la
fonction en escalier suivante:


 0 si x < x1
n si x1 ≤ x < x2

1




 .
 .
.
N(x) =
 n1 + · · · + ni si xi ≤ x ≤ xi+1


 ..
.




N si xp ≤ x

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Pour les fréquences: Il s’agit de la représentation graphique de


la fonction en escalier, comprise entre 0 et 1, suivante:


 0 si x < x1
F = f si x1 ≤ x < x2

1 1



 .
 .

.
F (x) =

 Fi = f1 + · · · + fi si xi ≤ x ≤ xi+1

 ..
.




1 si xp ≤ x

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables discrètes

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

On étudie chez 100 personnes, le salaire perçu par semaine en


DH.

classes Effectifs (ni )


[300,600[ 30
[600,900[ 22
[900,1200[ 20
[1200,1500[ 18
[1500,1800[ 10

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

Histogramme:
Histogramme des effectifs: Il s’agit d’un graphe composé de
rectangles dont les bases sont les classes de la variable
statistique et les hauteurs sont les effectifs corrigés:
Effectif ni
ni∗ = = .
Amplitude ai − ai−1
Si l’amplitude est la même pour toutes les classes, les auteurs
les rectangles correspondent simplement aux effectifs ni .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

Histogramme des fréquences: Il s’agit d’un graphe composé de


rectangles dont les bases sont les classes de la variable
statistique et les hauteurs sont les quantités fi . Dans le cas où
les classes sont d’amplitudes différentes, les hauteurs
fi
correspondent aux valeurs suivantes di = .
ai − ai−1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

Polygones des effectifs et fréquences:


Le polygone est obtenu en joignant par des segments de droite
les milieux des bases supérieures des rectangles successives.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

Courbe cumulative:
Definition 3
On appelle fonction de répartition d’une série statistique, la
fonction notée F, définie pour tout x ∈ R par:

F (x) = Fréquence des observations ≤ x


= Proportion des observations ≤ x .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

La courbe cumulative des fréquences s’obtient en joignant


les points d’abscisses: la borne supérieure de la classe et
d’ordonnée: la fréquence cumulée correspondante. C’est à dire
en joignant les points de coordonnées (ai , Fi ).
La courbe cumulative permet de lire pour chaque valeur de x,
le pourcentage des fréquences ≤ x .
La courbe cumulative des effectifs s’obtient en joignant les
points d’abscisses: la borne supérieure de la classe et
d’ordonnée: l’effectif cumulé correspondant. C’est à dire en
joignant les points de coordonnées (ai , Ni ), avec Ni est l’effectif
cumulé jusqu’à ai .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables continues

Remarque 5.1
Pour a < b , on a F (b) − F (a) = Proportion des observations
dans l’intervalle ]a, b] .

Proposition 5.2
Soit F la fonction de répartition d’une variable statistique. On a:
Fi − Fi−1
F (x) = Fi−1 + (x − ai−1 ) , pour tout x ∈]ai−1 , ai ] .
ai − ai−1
où, Fi = F (ai ) = f1 + f2 + · · · + fi est la fréquence cumulée de
ai .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables qualitatives

Dans le cas d’une variable qualitative: le diagramme en


secteurs ou encore le diagramme en barres. Pour ce faire, on
considère le groupe sanguin de 50 personnes. Le tableau
suivant contient les résultats obtenus:

Groupe sanguin Effectifs (ni ) Fréquence (fi )


O 5 0,1
B 15 0,3
A 24 0,48
AB 6 0,12

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables qualitatives

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Cas de variables qualitatives

Pour le diagramme en secteurs circulaire, chaque secteur du


graphe représente une modalité et l’angle du secteur est
proportionnel à l’effectif (ou à la fréquence) de la modalité.
L’angle pour chaque modalité est donné par: θi = 360◦ × fi .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Le mode et classe modale

Definition 4
Le mode d’une série statistique (noté Mod) est la modalité ou
la valeur qui a le plus grand effectif ou encore, la valeur qui
correspond à la fréquence maximale.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Le mode et classe modale

Remarque 6.1

I Une série statistique peut avoir plusieurs modes.


I Dans le cas de distributions groupées, on parle de classe
modale.La classe modale est la classe ayant la densité
maximale parmi les densités de toutes les classes.
I Dans le cas de données groupées en classes, une fois la
classe modale ([ai−1 , ai [)déterminée, le mode est le centre
(milieu) de cette classe.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

La moyenne

On suppose que la variable statistique est quantitative.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

La moyenne

Definition 5
La moyenne notée µ d’une série quantitative est donnée par:
n1 x1 + n2 x2 + · · · + np xp
µ=
n1 + n2 + · · · + np
p p
1X X
= ni xi = fi xi ,
N
i=1 i=1

où les xi sont les valeurs observées.


Pour les données groupées, les xi sont remplacés par les
milieux des classes.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

La moyenne

I La moyenne peut être interprétée comme "le centre" de la


série statistique.
I Si tous les effectifs ni sont égaux à 1, alors N=p et la
moyenne sera alors:
N
x1 + x2 + · · · + xp 1X
µ = x̄ = = xi .
N N
i=1

I Soient Ω1 et Ω2 deux populations de tailles respectives


N1 et N2 avec Ω1 ∩ Ω2 = ∅ . Si une variable statistique X
définie sur Ω1 admet µ1 comme moyenne et si la même
variable définie sur Ω2 admet µ2 . Alors la moyenne de X
sur Ω = Ω1 ∪ Ω2 est:
N1 µ1 + N2 µ2
µ= .
N1 + N2

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

La moyenne

La moyenne présentée dans la définition s’appelle la moyenne


arithmétique. Il existe d’autres types de moyennes utilisées
dans des contextes différents telle que:
1. Moyenne harmonique:
N
x̄h = p
X ni
xi
i=1
2. Moyenne géométrique:
" p
#1/N
xini
Y
x̄g =
i=1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

Definition 6
La médiane (notée M ou encore Me) est le nombre ou la
modalité qui partage en deux parties égales l’effectif total d’une
série statistique (i.e: 50% des valeurs de la série statistique
sont plus grandes (ou plus petites) que la valeur médiane).

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

En pratique:
Pour une variable statistique discrète:
I Pour calculer la médiane, la série statistique doit être
rangée en ordre croissant ou décroissant.
I si le nombre d’éléments de la série (N) est un nombre
impair, alors ce nombre peut être écrit sous forme de 2k+1.
Dans ce cas, la valeur (la modalité) du (k+1)ème élément
est la médiane.
Pour une liste paire, on peut écrire le nombre d’éléments
sous la forme 2k. La médiane dans ce cas correspond à:
k ème él ément + (k + 1)ème él ément
M= .
2

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

En pratique:
Pour une variable statistique continue:
I Dans le cas de variables statistiques continues (en
classes), on parle de classe médiane cm = [ai−1 , ai [ : c’est
la première classe dont l’effectif cumulé dépasse la valeur
N
.
2
I La valeur médiane est une valeur particulière dans la
classe médiane.
I La détermination de la valeur médiane se fait par
interpolation linéaire:
N
− Ncm−1
M = ai−1 + (ai − ai−1 ) × 2 .
Ncm − Ncm−1

Où, Ncm et Ncm−1 sont, respectivement, les effectifs


cumulés jusqu’à la classe médiane et les effectifs cumulés
jusqu’à la classe la précède.
Pr. Abderrahmane Moussi Statistique descriptive
Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

Definition 7
Soit α ∈]0, 1[ . On appelle quantile d’ordre α la valeur xα de
la variable telle que au moins 100 α% des observations sont
inférieures ou égales à xα , autrement, 100 (1-α)% des
observations qui sont supérieures ou égales à xα .

La médiane est un quantile particulier d’ordre α = 0, 5 . Le


tableau ci-après résume quelques quantiles et leurs ordres.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

Quantiles Ordres α Notations


Médiane 0,5 M ou Me
Quartile (0, 25; 0, 5; 0, 75) (Q1 , Q2 , Q3 )
Décile (0, 1; 0, 2; · · · ; 0, 9) (D1 ; · · · ; D9 )

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

La boite à moustaches ou Diagramme de Tukey: C’est un


diagramme représentant une série statistique en explicitant
différents quartiles y compris la médiane, parfois les déciles, la
valeur minimale et maximale. Le graphe ci-après est un
exemple de boite à moustaches.

Figure: Boite à moustaches

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

Détermination des quartiles Q1 et Q3 :


Pour variables discrètes:
I ordonner les valeurs dans l’ordre croissant ou décroissant
I Le premier quartile d’une série statistique est la plus petite
valeur Q1 telle qu’au moins 25% des valeurs sont inférieures ou
égales à Q1 .
En pratique, si 0, 25 × N est un nombre entier naturel (∈ N∗ )
alors le rang de Q1 est 0, 25 × N. Si 0, 25 × N n’est pas entier
naturel, le rang de Q1 correspond à l’entier naturel
immédiatement supérieur à 0, 25 × N.
I Le troisième quartile d’une série statistique est la plus petite
valeur Q3 telle qu’au moins 75% des valeurs sont inférieures ou
égales à Q3 .
En pratique, si 0, 75 × N est un nombre entier naturel (∈ N∗ )
alors le rang de Q3 est 0, 75 × N. Si 0, 75 × N n’est pas entier
naturel, le rang de Q3 correspond à l’entier naturel
immédiatement supérieur à 0, 75 × N.
Pr. Abderrahmane Moussi Statistique descriptive
Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

Pour variables continues:


I On détermine la classe cq = [ai−1 , ai [ (resp.
cl = [bi−1 , bi [ ) qui contient Q1 (resp. Q3 ): c’est la première
classe dont l’effectif cumulé dépasse 0, 25N (resp. 0, 75N).
I Q1 et Q3 s’obtiennent ensuite par interpolation linéaire:
0, 25N − Nq−1
Q1 = ai−1 + (ai − ai−1 ) × ,
Nq − Nq−1
0, 75N − Nl−1
Q3 = bi−1 + (bi − bi−1 ) × .
Nl − Nl−1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Les quantiles

Remarque 6.2
La détermination de déciles ainsi que n’importe quel quantile
d’ordre α se fait en utilisant la même démarche que celle
utilisée pour les quartiles.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

L’étendue

L’étendue d’une série statistique est la différence entre les


deux valeurs extrêmes de la série, c’est à dire la différence
entre la plus grande valeur et la plus petite valeur.

L’écart interquartile d’une série statistique est la différence


entre le troisième quartile et le premier quartile. C’est à dire:

EI = Q3 − Q1 .

L’écart inter-déciles: Il en existe quatre qui sont:

D9 − D1 , D8 − D2 , D7 − D3 , D6 − D4 .

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

La variance

La variance d’une série statistique quantitative est définie par:


p p
1X X
σ2 = ni (xi − µ)2 = fi (xi − µ)2 ,
N
i=1 i=1

où, xi représentent les valeurs observées pour les variables


discrètes et les centres de classes pour les données groupées
(variable continues).

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

La variance

Remarque 7.1

I La valeur σ 2 est toujours positive (ou nulle).


I La variance peut être exprimée de la manière suivante:
p
1X 2
2
σ = ni xi − µ2
N
i=1
p
X
= fi xi2 − µ2 .
i=1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

L’écart-type

L’écart-type est la racine carrée de la variance:



σ = σ2 .

Plus les valeurs observées sont homogènes, plus la variance et


l’écart-type sont petites. De même, plus les valeurs sont
hétérogènes, plus ces deux valeurs sont grandes.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Le coefficient de variation

Le coefficient de variation appelé également coefficient de


dispersion relative, noté CV est le rapport de l’écart-type à la
moyenne. Le résultat est sans unité et généralement exprimé
en pourcentage
σ
CV = × 100% .
µ

Le coefficient de variation permet, notamment, de comparer


des séries statistiques dont les valeurs sont exprimées en
unités différentes.
Plus la valeur du coefficient de variation est élevée (en valeur
absolue), plus la dispersion autour de la moyenne est grande.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Caractéristiques de la distribution normale:


I Une distribution normale est centrée autour de sa
moyenne.
I La moyenne, médiane et le mode sont confondus.
I La courbe cumulative est sous forme de cloche,
symétrique.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Definition 8
Soit x une variable statistique. On appelle moment centré
d’ordre k (k ∈ N∗ ) la quantité suivante:
p p
X 1X
mk = fi (xi − µ)k = ni (xi − µ)k .
N
i=1 i=1

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Mesure de l’asymétrie (skewness)

Si une distribution de données n’est pas centrée, on peut


s’attendre à ce qu’elle soit asymétrique à gauche ou à droite.
Pour déterminer le type de l’asymétrie, on calcule le
coefficient d’asymétrie de Fisher suivant:
p
X
fi (xi − µ)3
m3 i=1
γ1 (x) = =
σ3 σ3

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Mesure de l’asymétrie (skewness)

Selon les valeurs de ce coefficient, on peut conclure de la


nature de la forme de distribution. En effet,
I Si γ1 (x) = 0, alors la distribution est symétrique, le mode,
moyenne et médiane sont confondus.
I Si γ1 (x) < 0, alors la distribution présente une asymétrie
à droite de la médiane et donc la queue de distribution est
plus étalée vers la gauche.
I Si γ1 (x) > 0, alors la distribution présente une asymétrie
à gauche de la médiane et donc la queue de distribution
est plus étalée vers la droite.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Mesure de l’asymétrie (skewness)

Figure: Asymétrie à droite

Figure: Asymétrie à gauche

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Mesure de l’aplatissement (kurtosis)

Pour l’aplatissement d’une distribution d’une variable


statistique, on calcule un des coefficients d’aplatissement
suivants:
I Coefficient d’aplatissement de Pearson:
Xp
fi (xi − µ)4
m4
β2 = 4 = i=1
σ σ4

I Coefficient d’aplatissement de Fisher:


Xp
fi (xi − µ)4
m4
γ2 = 4 − 3 = i=1 −3
σ σ4

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Mesure de l’aplatissement (kurtosis)

1. Si γ2 = 0 (β2 = 3), alors l’aplatissement est le même que


celui d’une distribution normale. Dans ce cas, on dit que la
courbe est mesokurtique.
2. Si γ2 < 0 (β2 < 3), alors la courbe représentant la
distribution est aplatie (plus que celle d’une normale).
Dans ce cas, on dit que la courbe est platikurtique.
3. Si γ2 > 0 (β2 > 3), alors la courbe représentant la
distribution est dite concentrée ou affilée (moins aplatie
que celle d’une normale). Dans ce cas, on dit que la
courbe est leptokurtique.

Pr. Abderrahmane Moussi Statistique descriptive


Préliminaires et Vocabulaire Statistique descriptive à une variable distributions des effectifs et des fréquences Groupement des do

Mesure de l’aplatissement (kurtosis)

Pr. Abderrahmane Moussi Statistique descriptive

Vous aimerez peut-être aussi