Académique Documents
Professionnel Documents
Culture Documents
L’objet de la statistique descriptive est de proposer des outils pour l’étude d’un phénomène quantifiable.
Par exemple : donner des informations sur la taille moyenne d’un ensemble de personnes, avoir une idée sur le
niveau des étudiants de 2CP en mathématiques …etc.
1. Notions de base :
L’ensemble sur lequel portent les observations est appelé population, un élément de la population est
appelé individu où unité statistique.
Exemples :
Pour décrire une population, on repère et on classe les individus en sous –ensembles appelés caractères.
Un caractère est donc une propriété commune des individus de la population.
Exemples :
- La population de l’Algérie pourra être décrite par les caractères tels que : sexe, âge, nationalité, nombre
d’enfants,… etc.
- La production automobile par : couleurs, type, puissance du moteur, nombre de places assise,..etc.
Exemples :
Remarque : les différentes modalités d’un caractère doivent être incompatibles, exhaustives et sans ambiguité.
Exemple :
On résume toutes ces données dans un tableau en respectant les règles de représentation : le titre, les intitulés
des lignes et des colonnes, l’unité utilisée et la source
n i
n
Définition : l’ensemble des modalités et des effectifs d’un caractère, forment une distribution statistique ou
série statistique xi , ni .
2.a)- variable statistique discrète : lorsqu’elle est mesurée par des nombres isolés
(exemple : 0, 1,2, …, etc)
Le nombre d’enfants par ménage, le nombre de pièces d’un appartement,….
2.b)- variable statistique continue : lorsque ses valeurs sont en nombre infini.
Le poids, la longueur, la surface, le temps,….
Remarque : on peut considérer « continue » une variable qui peut prendre un si grand nombre de valeurs
qu’on est obligé de regrouper en classes de la forme ei −1 , ei (ou ei −1 , ei ).
ei + ei −1
Le centre de la classe sera : ci =
2
L’amplitude de la classe est : ai = ei − ei −1
n i = n est dit effectif total
ni
fi = la fréquence relative, c’est la proportion d’individus présentant la même modalité dans la
n
population totale.
ni
fi % = 100 , et on a et on a f i = 1 , et f i % = 100 .
n
3. Représentation graphiques :
C’est pour synthétiser de façon usuelle l’information contenue dans les tableaux statistiques.
-les graphiques en tuyaux d’orgues : c’est des rectangles de bases constantes dont les hauteurs sont
proportionnelles aux effectifs ou aux fréquences.
xi ni fi %
[10, 20[ 9 13.85
[20, 30[ 13 20
[30, 40[ 22 33.85
[40, 50[ 10 15.38
[50, 60[ 7 10.77
[60,70[ 4 6.15
n 65 100
b) Les amplitudes inégales : on ajoute une colonne (ai ) = amplitudes et une colonne
(hi ) = hauteur corrigée du rectangle. On repère l’amplitude unité a qui est
généralement la plus petite amplitude (ou parfois le PGCD des amplitudes).
On construit la colonne (hi ) :
a a
hi = f i (ou hi = ni )
ai ai
Cette colonne (hi ) donne les hauteurs des rectangles à tracer sur l’histogramme.
Exemple :
xi ni fi %
[10, 20[ 9 13.85
[20, 30[ 13 20
[30, 40[ 22 33.85
[40, 50[ 10 15.38
[50, 70[ 11 16.92
n 65 100
C) La courbe cumulative :
Pour savoir « combien d’individus dont x i est inférieur à… ? » ou « combien d’individus dont x i
est supérieur à… ? »
Exemple : « combien de ménages ont moins de 2 enfants ou plus de 4 enfants ?»
Il faut calculer les fréquences cumulées, comme suit :
On somme les fréquences relatives f i (ou absolues ni ) dans une colonne du tableau :
Les valeurs croissent de haut en bas à la lecture Les valeurs croissent de bas en haut à la lecture
Les fréquences cumulées sont dites : Les fréquences cumulées sont dites :
ascendantes ou croissantes descendantes
f i , f icc , Fi f i , f icd ,
notées : notées :
ni , nicc , N i ni , nicd ,
La courbe cumulative est une courbe représentative des fréquences cumulées croissantes.
F (−) = 0 , F ( +) = 1
➢ Cas discret :
Tracer la courbe cumulative pour l’exemple de la distribution des ménages selon le nombre
d’enfants.
➢ Cas continu :
Tracer la courbe cumulative pour l’exemple donné en (3/2.B.a)
l’histogramme :
x
F ( x) = f ( x)dx
0
Exercice : Tracer pour les deux exemples précédents le diagramme de la courbe cumulative des
1. Le mode :(M0)
Le mode d’une distribution est la valeur de la variable qui correspond au plus grand effectif ou la plus
grande fréquence relative.
Exemple : la série {5, 6, 7, 7, 8, 8, 8, 9, 11} M0=8 ( valeur la plus fréquente ou dominante)
➢ Cas discret :
2. La médiane :(Me)
C’est la valeur du caractère qui partage la série en deux sous-ensembles égaux, en supposant que les
individus sont rangés dans l’ordre.
Exemple : La série {12, 28, 6, 3, 32, 15, 21}, la série ordonnée est : « 3, 6, 12, 15, 21, 28, 32 », Me=15
Me
Calcul de la médiane :
la série ordonnée.
- Dans le cas des données groupées, i.e xi , ni , la médiane se calcule par les
fréquences cumulées.
On repère la valeur 0.5 ou la valeur n2 sur le graphe ou sur le tableau.
n
Si la valeur 0.5 (ou 2 ) apparaissent « entre 2 lignes » du tableau, la médiane est la
valeur de x i qui correspond à la ligne la plus basse (bien sûr en faisant attention comment on a
représenté le tableau statistique) .
0.5 − F
(Me )
ai
M e = ei +
(Me ) (Me )
(Me ) i
fi
ai
(Me )
est l’amplitude de la classe médiane ei (Me )
, ei +1
(Me )
(Me )
fi la fréquence relative de la classe médiane
(Me )
Fi la fréquence cumulée de la classe médiane
(Me )
n (Me )
(M )
ai ai e
M e = ei + − = + 50 − Fi % ( M e )
(Me ) (Me )
(Me ) 2 N i ou M e e i
ni f i %(Me )
3. La moyenne arithmétique : X
• Moyenne simple : à chaque valeur de x i correspond qu’une seule observation.
1 n
x= xi
n i =1
Exemple : les notes (sur 20) de 8 étudiants sont : 3, 5, 7, 9, 10, 11, 12, 18.
x = 18 (3 + 5 + 7 + 9 + 10 + 11 + 12 + 18) 9.375
• Moyenne pondérée : à chaque valeur de x i peut correspondre ni observations.
k
1 k
x= ni . x i
n i =1
avec n = ni
i =1
• Calcule de X
- V.S.D : on ajoute au tableau xi , ni la colonne « xi ni » (ou « xi f i ») et on somme
dans la colonne en divisant par n .
Les quantiles(ou percentiles) sont des caractéristiques de position puisqu’elle correspondent à des valeurs de
la V.S qui partagent la série statistique ordonnée (ordre croissant) en parties égales.
Quartiles :
Si = 4 , les quantiles sont appelés quartiles. Il y’a donc, trois quartiles que l’on désigne par Q1 , Q2 et Q3
Q1 Q2 Q3
50% 50%
Remarque :
• On dira par exemple ; 25% des valeurs prises par la variable statistique sont
inférieures à Q1 .
• Q2 = M e
• Q3 − Q1 est appelé l’intervalle interquartile et comporte 50% des observations.
• Les quartiles peuvent s’obtenir directement de la courbe cumulative ascendante.
Déciles :
Si = 10 , les quantiles sont appelés centiles, notes D1 , D2 , ...., D8 et D9
10% des observations sont inférieures à D1 ,
20% ……………………………………………………. D2 ,
50%........................................................ D5 = M e
...........etc
Centiles :
Si = 100 , les quantiles sont appelés déciles, notes C1 , C 2 C3 , ...., C98 et C99
On dira par exemple ; 99% des observations sont inférieures à C99 .
Remarque :
De même que les quartiles, on peut déterminer les déciles et centiles, de la courbe cumulative
ascendante (tracée avec précision) ou à partir de la formule d’interpolation linéaire (cas continu seulement).
p = eI +
aI
p.n − FI
fI
p : quantile désirée.
quantile.
a I : amplitude de la classe.
Bien que les deux séries ont même médianes et mêmes moyennes, on ne peut pas conclure
qu’elles sont identiques, on doit recourir aux mesures de dispersion, en mettant en évidence les
écarts.
i. L’étendue : E = X k − X1
X k est la plus grande valeur de la variable X .
X 1 est la plus petite valeur de la variable X .
ii. L’écart absolu moyen : c’est la moyenne arithmétique des écarts par rapport à une valeur
centrale : la moyenne arithmétique ou la médiane.
n
• Par rapport à X : - cas simple : ex = 1
n x
i =1
i −x.
k k
- cas pondéré : e x = 1
n ni x i − x , n = n i
i =1 i =1
n
ou e x = f i xi − x
i =1
n
• Par rapport à M e : - cas simple : eM e = 1
n x i =1
i − Me .
k k
- cas pondéré : e M e = 1
n n
i =1
i xi − M e , n = ni
i =1
k
ou e M e = f i xi − M e
i =1
1 n
a) L’écart-type : - cas simple : ( x) =
n i =1
( xi − x) 2 .
1 k
- cas pondéré : ( x) =
n i =1
ni ( x i − x ) 2
k
ou ( x) = f (x
i =1
i i − x) 2 .
b) La variance : V ( x) = ( x) .
2
1 k
2
1. V ( x) = ni xi2 − x (formule développée de la variance)
n i =1
V ( x) = a 2 V ( X / )
2. Si X = aX + b , a 0 alors
/
( X ) = a ( X )
/