Vous êtes sur la page 1sur 6

Statistique descriptive à une dimension

1. Définitions
Les observations constituent la source d’une information statistique. IL faut donc avant tout
définir l’ensemble étudié et les critères qui permettent cette étude.
L a population: C’est l’ensemble sur lequel on fait l’étude statistique et un élément de cette
population est dit individu ou unité statistique.
Généralement l’étude statistique est faite sur une partie de la population dite échantillon dont
la taille est notée n.
Un caractère ou variable statistique est l’objet de l’étude statistique.
Un caractère peut être quantitatif s’il est mesurable.
Un caractère quantitatif est dit discret ou discontinu s’il ne peut prendre que des valeurs
isolées dans son domaine de variation.
Exemple 1: Nombre d’enfants, nombre de petits par portée, etc.
Un caractère quantitatif est continu s’il peut prendre toutes les valeurs de son domaine de
variation.
Exemple 2: Le poids, la taille, le taux de glycémie, etc.
Un caractère est dit qualitatif s’il n’est pas mesurable.
Exemple 3: Le sexe, la nationnalité,etc.

2. Tableaux et représentations graphiques


2.1 Caractère qualitatif
Exemple 4: La répartition de 100 enfants selon la couleur de leurs cheveux
Modalité Effectif Fréquence relative Pourcentage Angle
( ) ( ) (100%𝗑fi) ( )
Noir 25 0.25 25 90
Châtain 15 0.15 15 54
Blond 30 0.3 30 108
Brun 30 0.3 30 108
Total 100 1 100 360
Les graphes correspondant à ce cas sont le diagramme en barres (en utilisant les effectifs) et
le diagramme en secteurs (en utilisant les angles).

1
2.2 Caractère quantitatif discret
Exemple 5: Le nombre d’enfants de 20 familles.
Valeur Effectif Effectif cumulé Fréquence Fréquence
(xi) ( ) (Ni) relative (fi) relative cumulée
(Fi)
1 3 3 0.15 0.15
2 8 11 0.4 0.55
3 4 15 0.2 0.75
4 5 20 0.25 1
Total 20 1

Le graphe correspondant est le diagramme en bâtons. En joignant les extrémités des bâtons
on aura le polygone des effectifs.

2
2.3 Caractère quantitatif continu
Il faut d’abord classer les valeurs dans des classes (intervalles) en cherchant les bornes de
chaque intervalle. La longueur de chaque classe est dite amplitude et notée .
En pratique le nombre de classes à construire est donné par l’une des deux règles suivantes :
Règle de Sturges: nombre de classes k=1+[3.3 log(n)].
Règle de Yule: nombre de classes k=2.5
L’amplitude de chaque classe est calculée par

Exemple 6: Taux de glycémie de 100 patients.


Taux de Cent Amplitude Effectif Effectif Fréquence Fréquence
glycémie re ( ) ( ) cumulé relative relative
( ) ( ) ( ) cumulée
( )
[0.8, 0.9[ O.85 0.1 10 10 0.1 0.1
[0.9, 1[ 0.95 0.1 40 50 0.4 0.5
[1, 1.1[ 1.05 0.1 30 80 0.3 0.8
[1.1, 1.2[ 1.15 0.1 20 100 0.2 1
Total 100 1
Le graphe correspondant à ce cas est l’histogramme et en joignant les milieux des segments
on aura le polygone des effectifs.

3
Quand les classes n’ont pas la même amplitude, on utilise les effectifs corrigés pour tracer
l’histogramme.

3. caractéristiques numériques d’une série statistique


3.1 paramètres de position
La moyenne arithmétique
La moyenne arithmétique est donnée par

Quand les valeurs se répètent fois, alors

Dans le cas continu, on utilise les centres des classes

Pour l’exemple 5,

Pour l’exemple 6,

Le mode
C’est la valeur la plus répétée du caractère et elle est notée .
Dans le cas discret, on cherche la valeur qui a le plus grand effectif ni.
Dans le cas continu, on cherche d’abord la classe modale (la classe qui contient le mode) qui
correspond au plus grand effectif et le mode dans ce cas est donné par

4
est la limite inférieur de la classe modale et son amplitude.
est la différence entre l’effectif de la classe modale et celle d’avant.
est la différence entre l’effectif de la classe modale et celle d’après.
Dans l’exemple 5, le plus grand effectif est 8 qui correspond à
Dans l’exemple 6, la classe modale est [0.9, 1[.
=0.9+0.1

La médiane
On ordonne d’abord la série statistique dans l’ordre croissant. La médiane notée Me est la
valeur du caractère qui partage la série statistique en deux parties de même effectif. Pour cette
valeur médiane la fréquence cumulée correspond à 0.5.
Dans le cas discret, on détermine la médiane selon la parité de comme suit :
Si est impair: La médiane est la valeur du caractère

Si est pair: La médiane est la moyenne de la et la valeur

Dans le cas continu, on cherche d’abord la classe médiane (la classe qui contient la médiane)
qui correspond à la première classe pour laquelle dépasse 0.5 et la valeur de la médiane est
donnée par la formule suivante:

est la limite inférieur de la classe médiane et son amplitude.


est la fréquence relative de la classe médiane.
est la fréquence cumulée inférieure à .
Dans l’exemple 5, l’effectif est pair, donc

Dans l’exemple 6, la classe médiane est [1, 1.1[ et la médiane est calculée comme suit :

Les quartiles
Les quartiles partagent la série en 4 parties de même effectif.
Elles correspondent donc à 25%, 50% et 75% des observations.
3.2 Paramètre de dispersion
L’étendue
C’est la différence entre les deux valeurs extrêmes de la série statistique: .
Dans l’exemple 5, l’étendue est égale à 4-1=3.

5
La variance et l’écart type
On définit la variance notée comme la moyenne des carrées des écarts des valeurs à la
moyenne.

=
Quand les valeurs se répètent fois, alors la variance peut s’écrire

ou bien

Dans le cas continu, on remplace par .


L’écart type est la racine carrée de la variance

Dans l’exemple 5, la variance est donnée par

L’écart type est


.
Dans l’exemple 6, la variance et l’écart type sont donnés par

L’écart interquartiles
C’est la différence entre le 1er et le 3ème quartile.

Le coefficient de variation
Il est noté CV et donné par

Le coefficient de variation est donné en pourcentage et il est indépendant du choix de l’unité


de mesure, donc il permet de comparer des distributions d’unités différentes.
Dans l’exemple 5, le coefficient de variation est
Dans l’exemple 6, le coefficient de variation est

Vous aimerez peut-être aussi