Académique Documents
Professionnel Documents
Culture Documents
1. Définitions
Les observations constituent la source d’une information statistique. IL faut donc avant tout
définir l’ensemble étudié et les critères qui permettent cette étude.
L a population: C’est l’ensemble sur lequel on fait l’étude statistique et un élément de cette
population est dit individu ou unité statistique.
Généralement l’étude statistique est faite sur une partie de la population dite échantillon dont
la taille est notée n.
Un caractère ou variable statistique est l’objet de l’étude statistique.
Un caractère peut être quantitatif s’il est mesurable.
Un caractère quantitatif est dit discret ou discontinu s’il ne peut prendre que des valeurs
isolées dans son domaine de variation.
Exemple 1: Nombre d’enfants, nombre de petits par portée, etc.
Un caractère quantitatif est continu s’il peut prendre toutes les valeurs de son domaine de
variation.
Exemple 2: Le poids, la taille, le taux de glycémie, etc.
Un caractère est dit qualitatif s’il n’est pas mesurable.
Exemple 3: Le sexe, la nationnalité,etc.
1
2.2 Caractère quantitatif discret
Exemple 5: Le nombre d’enfants de 20 familles.
Valeur Effectif Effectif cumulé Fréquence Fréquence
(xi) ( ) (Ni) relative (fi) relative cumulée
(Fi)
1 3 3 0.15 0.15
2 8 11 0.4 0.55
3 4 15 0.2 0.75
4 5 20 0.25 1
Total 20 1
Le graphe correspondant est le diagramme en bâtons. En joignant les extrémités des bâtons
on aura le polygone des effectifs.
2
2.3 Caractère quantitatif continu
Il faut d’abord classer les valeurs dans des classes (intervalles) en cherchant les bornes de
chaque intervalle. La longueur de chaque classe est dite amplitude et notée .
En pratique le nombre de classes à construire est donné par l’une des deux règles suivantes :
Règle de Sturges: nombre de classes k=1+[3.3 log(n)].
Règle de Yule: nombre de classes k=2.5
L’amplitude de chaque classe est calculée par
3
Quand les classes n’ont pas la même amplitude, on utilise les effectifs corrigés pour tracer
l’histogramme.
Pour l’exemple 5,
Pour l’exemple 6,
Le mode
C’est la valeur la plus répétée du caractère et elle est notée .
Dans le cas discret, on cherche la valeur qui a le plus grand effectif ni.
Dans le cas continu, on cherche d’abord la classe modale (la classe qui contient le mode) qui
correspond au plus grand effectif et le mode dans ce cas est donné par
4
est la limite inférieur de la classe modale et son amplitude.
est la différence entre l’effectif de la classe modale et celle d’avant.
est la différence entre l’effectif de la classe modale et celle d’après.
Dans l’exemple 5, le plus grand effectif est 8 qui correspond à
Dans l’exemple 6, la classe modale est [0.9, 1[.
=0.9+0.1
La médiane
On ordonne d’abord la série statistique dans l’ordre croissant. La médiane notée Me est la
valeur du caractère qui partage la série statistique en deux parties de même effectif. Pour cette
valeur médiane la fréquence cumulée correspond à 0.5.
Dans le cas discret, on détermine la médiane selon la parité de comme suit :
Si est impair: La médiane est la valeur du caractère
Dans le cas continu, on cherche d’abord la classe médiane (la classe qui contient la médiane)
qui correspond à la première classe pour laquelle dépasse 0.5 et la valeur de la médiane est
donnée par la formule suivante:
Dans l’exemple 6, la classe médiane est [1, 1.1[ et la médiane est calculée comme suit :
Les quartiles
Les quartiles partagent la série en 4 parties de même effectif.
Elles correspondent donc à 25%, 50% et 75% des observations.
3.2 Paramètre de dispersion
L’étendue
C’est la différence entre les deux valeurs extrêmes de la série statistique: .
Dans l’exemple 5, l’étendue est égale à 4-1=3.
5
La variance et l’écart type
On définit la variance notée comme la moyenne des carrées des écarts des valeurs à la
moyenne.
=
Quand les valeurs se répètent fois, alors la variance peut s’écrire
ou bien
L’écart interquartiles
C’est la différence entre le 1er et le 3ème quartile.
Le coefficient de variation
Il est noté CV et donné par