Vous êtes sur la page 1sur 27

Cours de Probalibité Statistique

11 janvier 2023 par:

Moussa KONE

Université Aube Nouvelle


AGRO BIO FMQA GAM
ii
Table des matières

Table des matières iii

1 Chapitre 1 1
1.1 Présentation des données . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 La population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2 L’unité statistique ou l’individu . . . . . . . . . . . . . . . . . . . 2
1.1.3 L’échantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.4 Le caractère ou la variable . . . . . . . . . . . . . . . . . . . . . . 2
1.1.5 Variable quantitative . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.6 Variable quantitative . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.7 Variable quantitative continue . . . . . . . . . . . . . . . . . . . . 3
1.1.8 La modalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.9 La discrétisation . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Chapitre 2 : Indicateurs de la tendance centrale 5


2.0.1 Les fréquences absolue, relative et cumulée . . . . . . . . . . . . . 6
2.1 La moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 La moyenne arithmétique . . . . . . . . . . . . . . . . . . . . . . 7
2.1.2 La moyenne arithmétique pondérée . . . . . . . . . . . . . . . . . 7
2.1.3 Moyenne arithmétique d’une variable continue . . . . . . . . . . . 7
2.1.4 La moyenne géométrique . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.5 La moyenne harmonique . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.6 La moyenne quadratique . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Mode - Classe modale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Classe modale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.3 Densités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Médiane-Classe médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.1 Médiane d’une variable discrète . . . . . . . . . . . . . . . . . . . 11
2.3.2 Médiane d’une variable continue ( groupée en classe) . . . . . . . 12

iii
Chapitre 0 TABLE DES MATIÈRES

3 Chapitre 3 : Indices de dispersion 15


3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Étendue d’une série ou intervalle de variation . . . . . . . . . . . . . . . 15
3.3 Les quartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4 Écart absolu moyen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.5 Fluctuation ou variance - Écart-type ou écart quadratique moyen . . . . 19
3.5.1 Fluctuation ou variance . . . . . . . . . . . . . . . . . . . . . . . 19
3.5.2 Écart-type ou écart quadratique moyen . . . . . . . . . . . . . . . 20
3.5.3 Intérêt de l’écart-type. . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5.4 Coefficient de variation . . . . . . . . . . . . . . . . . . . . . . . . 20
3.6 EXERCICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Bibliographie 21

Moussa KONE iv
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre
1
Chapitre 1

Sommaire
1.1 Présentation des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 La population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2 L’unité statistique ou l’individu . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 L’échantillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.4 Le caractère ou la variable . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.5 Variable quantitative . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.6 Variable quantitative . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.7 Variable quantitative continue . . . . . . . . . . . . . . . . . . . . . . 3
1.1.8 La modalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.9 La discrétisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1 Présentation des données


La statistique est une méthode scientifique qui consiste à réunir des données chiffrées
sur des ensembles nombreux, puis à analyser, à commenter et à critiquer ces données.
En d’autres termes, c’est une science qui a pour objectif :

1. la planification du projet ;

2. la collecte, la codification, la saisie, le traitement et l’analyse des données ;

3. la publication des résultats

Il ne faut pas confondre la statistique qui est la science qui vient définie et une statistique
qui est un ensemble de données chiffrées sur un sujet précis. Les premières statistiques
correctement élaborées ont été celles des recensements démographiques. Ainsi le voca-
bulaire statistique est essentiellement celui de la démographie. Les ensembles étudiés
sont appelés population. Les éléments de la population sont appelés individus ou unités
statistiques. La population est étudiée selon un ou plusieurs caractères.

1
Chapitre 1 1.1. PRÉSENTATION DES DONNÉES

1.1.1 La population
C’est l’ensemble des individus (ou unités statistiques) présentant un caractère com-
mun. Pour une thématique donnée, la population regroupe toujours la totalité des indi-
vidus relatifs à cette thématique (notion d’exhaustivité).

Exemple 1.1.1. la population burkinabé, les fillières de formation, les étudiants de L1


les clients d’une entreprise. La population est en général notée P L’effectif total d’une
population est noté N.

1.1.2 L’unité statistique ou l’individu


C’est l’élément de base constitutif de la population à laquelle il appartient. Il est
indivisible et peut être un pays, un végétal, un humain ou une entreprise.

1.1.3 L’échantillon
C’est un sous-ensemble construit et représentatif d’une population donnée.

1.1.4 Le caractère ou la variable


C’est la (les) caractéristique(s) de l’individu intégrant la population étudiée.

Exemple 1.1.2. a couleur, le sexe, le poids, la taille, la marque, le modèle, l’espèce, le


prix, la surface, etc.

1.1.5 Variable quantitative


Une variable statistique est dite de nature qualitative si ses modalités ne sont pas
mesurables. Les modalités d’une variable qualitative sont les différentes catégories d’une
nomenclature. Ces catégories doivent être exhaustives (chaque individu est affecté à
une modalité) et incompatibles (un individu ne peut être affecté à plusieurs modalités)
de façon à créer une partition. Le sexe, la profession, l’état matrimonial sont quelques
exemples de variables qualitatives. Pour ses enquêtes auprès des ménages, l’Insee uti-
lise la nomenclature des Professions et catégories socioprofessionnelles (PCS-2003). Les
modalités d’une variable qualitative peuvent être classées sur deux types d’échelle : no-
minale ou ordinale. À ces deux types d’échelle correspondent deux types de variables
qualitatives.

Variable qualitative nominale


Une variable statistique qualitative est dite définie sur une échelle nominale si ses
modalités ne sont pas naturellement ordonnées.

Moussa KONE Licence


2 1 : AGRO, BIO, FMQA, GAM/U-AN
1.1. PRÉSENTATION DES DONNÉES Chapitre 1

Exemple 1.1.3. Situation d’activité, statut matrimonial.

Variable qualitative ordinale


Une variable statistique qualitative est dite ordinale si l’ensemble de ses modalités
peut être doté d’une relation d’ordre
Exemple 1.1.4. Niveau d’instruction.

1.1.6 Variable quantitative


Toute variable qui n’est pas qualitative ne peut être que quantitative. Les différentes
modalités d’une variable quantitative constituent l’ensemble des valeurs numériques que
peut prendre la variable. Une variable statistique est dite de nature quantitative si ses
modalités sont mesurables. Les modalités d’une variable quantitative sont des nombres
liés à l’unité choisie, qui doit toujours être précisée. Il existe deux types de variables
quantitatives : les variables discrètes et les variables continues. Ces variables ont en
commun des modalités clairement ordonnées, pour lesquelles l’écart entre les valeurs
possède une signification, et sur lesquelles il est possible de réaliser des opérations ma-
thématiques telles que des calculs de moyennes, etc. Néanmoins, elles ont des propriétés
et des traitements spécifiques qui nécessitent une étude séparée.

Variable quantitative discrète


Lorsque les modalités sont des valeurs numériques isolées, comme le nombre d’enfants
par ménage, on parle de variable discrète.
Exemple 1.1.5. Âge, salaire, nombre de lit dans un hôpital.

1.1.7 Variable quantitative continue


Lorsque la variable, par exemple la taille d’un individu, peut prendre toutes les
valeurs d’un intervalle, ces valeurs peuvent alors être regroupées en classes, et on parle
dans ce cas de variable continue.
Exemple 1.1.6. Poids, taux du sucre, taille, taux du sel, âge, nombre de frères.

1.1.8 La modalité
C’est la valeur qualitative ou quantitative que peut prendre le caractère précédem-
ment défini.
Exemple 1.1.7. sexe féminin ou masculin, poids 45 kg, couleur verte, etc. Attention, les
modalités sont exhaustives et mutuellement exclusives. Chaque individu doit pouvoir être
classé dans une et une seule modalité.

Moussa KONE Licence


3 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 1 1.1. PRÉSENTATION DES DONNÉES

1.1.9 La discrétisation
Lorsque les modalités sont des valeurs numériques isolées, comme le nombre d’enfants
par ménage, on parle de variable discrète. Ce découpage en classes pose de nombreuses
questions : choix des amplitudes, amplitudes constantes ou variables, nombre de classes,
etc. Nous ne rentrerons pas ici dans le détail de ces opérations.

Moussa KONE Licence


4 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre
2
Chapitre 2 : Indicateurs de la tendance
centrale

Sommaire
2.0.1 Les fréquences absolue, relative et cumulée . . . . . . . . . . . . . . . 6
2.1 La moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 La moyenne arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.2 La moyenne arithmétique pondérée . . . . . . . . . . . . . . . . . . . . 7
2.1.3 Moyenne arithmétique d’une variable continue . . . . . . . . . . . . . 7
2.1.4 La moyenne géométrique . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.5 La moyenne harmonique . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.6 La moyenne quadratique . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Mode - Classe modale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Classe modale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.3 Densités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Médiane-Classe médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.1 Médiane d’une variable discrète . . . . . . . . . . . . . . . . . . . . . . 11
2.3.2 Médiane d’une variable continue ( groupée en classe) . . . . . . . . . . 12

Caractéristique de tendance centrale des données


Les paramètres de tendance centrale ou mesures de tendance centrale sont des
grandeurs susceptibles de représenter au mieux un ensemble de données. L’appellation
tendance centrale vient du fait que ces paramètres donnent une idée de ce qui se passe
au centre d’une distribution, d’un ensemble de données. On distingue trois mesures de
tendance centrale :
1. La moyenne
2. Le mode
3. La médiane

5
Chapitre 2 2.1. LA MOYENNE

Tous trois ne décrivent par la même chose et sont, de ce fait, complémentaires dans la
description et l’analyse d’une distribution.
Ces statistiques ne se calculent que dans le cas où nous avons à faire à des variables
quantitatives. Dans le cas où nous avons des variables qualitatives, on procède aux fré-
quences. Avant d’analyser ces trois indicateurs de position, nous allons d’abord aborder
la notion de la fréquence.

2.0.1 Les fréquences absolue, relative et cumulée


A chaque modalité de variable X, peut correspondre un ou plusieurs individus dans
l’échantillon de taille n.
On appelle effectif de la modalité xi , le nombre ni . Il est aussi appelé fréquence
ni
absolue. La fréquence relative est le nombre fi tel que fi = .
n
p
X
La fréquence cumulée croissante est cependant le nombre Fi tel que Fi = fk .
k=1

Exemple 2.0.1. Représentons la fréquence relative et la fréquence cumulée du tableau


ci-dessous
xi ni xi ni fi FCC FCD
1 8 1 8 8/50=0,16 0,16 1
2 18 2 18 18/50 = 0,36 0,16+0,36=0,52 1-,016=0,84
Solution
3 14 3 14 14/50=0,28 0,52+0,28 0,84-0,36=0,48
4 10 4 10 10/50=0,2 0,8+0,2=1 0,48-0,28=0,2
Total 50 Total 50 50/50=1

2.1 La moyenne
La moyenne constitue l’un des paramètres fondamentaux de tendance centrale mais
non suffisant pour caractériser une distribution. Complémentaire du mode et surtout
de la médiane, la moyenne constitue à n’en point douter, la mesure la plus calculée et
la plus utilisée lors de la description de séries statistiques. Il existe plusieurs types de
moyennes, chacun adapté à des situations précises :

Désignation Notation courante


Moyenne arithmétique X̄
Moyenne géométrique Ḡ ou X̄G
Moyenne harmonique H̄ ou X̄H
Moyenne quadratique Q̄ ou X̄Q

NB : On ne peut pas calculer la moyenne sur des données qualitatives.

Moussa KONE Licence


6 1 : AGRO, BIO, FMQA, GAM/U-AN
2.1. LA MOYENNE Chapitre 2

2.1.1 La moyenne arithmétique


C’est la plus simple et la communément utilisée et ce, pas toujours à bon escient.
Elle se note la plupart du temps par X̄. Elle peut être simple ou pondérée.

La moyenne arithmétique simple


Si x1 , x2 , · · · , xn sont les valeurs de n observation, la moyenne simple correspond à
une somme de résultats divisée par le nombre total de résultats et s’écrit :

x1 + x2 + · · · + xn 1X n
X̄ = = xi
n n i=1

2.1.2 La moyenne arithmétique pondérée


Dans la distribution suivante, qui schématise une série à variable discrète (disconti-
nue)

Variabe (ou Modalité) xi x1 x2 · · · xi · · · xm


Effectif ni n1 n2 · · · ni · · · nm

La moyenne arithmétique pondéré est définie par l’expression suivante :


m
X
ni xi m
n1 x1 + n2 x2 + · · · + nm xm i=1 1X
X̄ = = m = ni xi
n1 + n2 + · · · + nm X n i=1
ni
i=1

Exemple 2.1.1. 1. Calculer la moyenne des valeurs suivantes : 20, 14, 30, 29.
2. Calculer la moyenne de : 8, 9,3,5,5,4,6,4,7,9

2.1.3 Moyenne arithmétique d’une variable continue

Classe (ou Modalité) [xi , xi+1 [ [x1 , x2 [ [x2 , x3 [ · · · [xi , xi+1 [ · · · [xm−1 , xm
Effectif ni n1 n2 ··· ni ··· nm

1 Xm
X̄ = ci × ni
n k=1
xi + xi+1
où ci = est le centre de la classe et ni l’effectif associé à la classe [xi ; xi+1 [.
2
Exemple 2.1.2. Calculer la moyenne de la série statistique suivante :

Moussa KONE Licence


7 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 2 2.1. LA MOYENNE

Classes Effectifs
[0,5[ 10
[5,10[ 15
[10,15[ 12
[15,25[ 25
[25,30[ 10

2.1.4 La moyenne géométrique


Sa définition purement mathématique est un peu rébarbative mais son utilité est
grande comme nous allons le démontrer. La moyenne géométrique de n valeurs positives
xi est la racine nième du produit de ces valeurs. Elle est notée Ḡ et s’écrit :
v
u n
uY
Ḡ = n
t xi
i=1

La moyenne géométrique est un instrument permettant de calculer des taux moyens


notamment des taux moyens annuels. Son utilisation n’a un sens que si les valeurs ont
un caractère multiplicatif

Exemple 2.1.3. 1. Les prix de l’immobilier ancien ont augmenté ces trois dernières
année de la façon suivante : 2,4,8. Calculer la moyenne arithmétique du prix du
loyer de ces trois dernière année.
2. Calculer le taux de moyen géométrique.

2.1.5 La moyenne harmonique


On utilise la moyenne harmonique lorsqu’on veut déterminer un rapport moyen dans
des domaines où il existe des liens de proportionnalité inverse.

Exemple 2.1.4. Pour une distance donnée, le temps de trajet est d’autant plus court que
la vitesse est élevée.
Un loyer dans le parc privé est d’autant plus élevé que la taille ou la surface du
logement est petite. Cette moyenne s’écrit de la manière suivante :
n
H̄ = n
X 1
i=1 xi

2.1.6 La moyenne quadratique


Une moyenne qui trouve des applications lorsque l’on a affaire à des phénomènes
présentant un caractère sinusoı̈dal avec alternance de valeurs positives et de valeurs

Moussa KONE Licence


8 1 : AGRO, BIO, FMQA, GAM/U-AN
2.2. MODE - CLASSE MODALE Chapitre 2

négatives. Elle est, de ce fait, très utilisée en électricité. Elle permet notamment de
calculer la grandeur d’un ensemble de nombre. A titre d’information, elle s’écrit :
v
n
u1 X
u
Q̄ = t (x )2i
n i=1

2.2 Mode - Classe modale

2.2.1 Mode
Le mode, M0 , d’une série statistique est la valeur du caractère la plus fréquente ou
dominante dans l’échantillon. Autrement dit, c’est la valeur qui a la fréquence (absolue
ou relative) la plus élevée. Lorsque la distribution a plus d’un mode, on parle d’une
distribution multimodale (bimodale, trimodale , etc).

2.2.2 Classe modale


Si l’on est en présence de données groupées en classes, le mode se rapportera à la
classe comportant le plus grand nombre d’individus : on parlera alors de classe modale.
Cependant, il peut y arriver que l’on s’intéresse à avoir la valeur approchée ou exacte
de ce mode. Par conséquent, il est recommandé d’appliquer la démarche suivante :
- Pour avoir une valeur approximative du mode, on calcule la moyenne de la classe
qui a la fréquence la plus élevée ;
- Pour avoir une valeur exacte, le mode se calcule de la manière suivante

∆i
M0 = xi + ai ×
∆s + ∆i
Avec
— xi : limite inférieure de la classe modale ;
— ai : amplitude de la classe modale ;
— ∆i : écart d’effectif ou de fréquence entre la classe modale et la classe inférieure la
plus proche
∆i = n0 − ni ou bien ∆i = f0 − fi
— n0 et f0 sont l’effectif et la fréquence associés à la classe modale.
— ni et fi sont l’effectif et la fréquence de la classe inférieure la plus proche de la
classe modale
— ∆s : écart d’effectif ou de fréquence entre la classe modale et la classe supérieure
la plus proche.
∆s = n0 − ns ou bien ∆s = f0 − fs .

Moussa KONE Licence


9 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 2 2.2. MODE - CLASSE MODALE

— ns et fs sont l’effectif et la fréquence de la classe supérieure la plus proche qui suit


la classe modale.

Représentation ou détermination graphique de mode (cas de variable continue)

Remarque 2.2.1. Si les classes es sont d’amplitudes inégales, il s’agira de la classe de


la plus grande densité di la plus élevé. Cela correspond à classe dont la densité di est la
plus grande

2.2.3 Densités
ni
La densité di = où ni est l’effectif de la classe ci = [xi ; xi+1 [ et ai = xi+1 − xi
ai
l’amplitude de la classe.

Exemple 2.2.1. 1. Donner le mode des série des données suivantes :


S1 = {9, 10, 9, 9, 11, 10, 11, 11, 9, 11} S2 = {2, 3, 5, 5, 6, 7, 7, 8, 8, 9, 2, 2, 1, 3, 3, 4, 2, 1, 1, 1}
2. Donner le mode des données se trouvant dans le tableau suivant :

Classes Effectifs
[0,5[ 10
[5,10[ 15
[10,15[ 12
[15,25[ 25
[25,30[ 10

3. Déterminer le mode des données se trouvant dans le tableau suivant :

Moussa KONE 10
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
2.3. MÉDIANE-CLASSE MÉDIANE Chapitre 2

âge xi Effectif ni Densité di


[16,26[ 280
[26,40[ 310
[40,50[ 240
[50,60[ 420
[60,65] 70
Total 1320

2.3 Médiane-Classe médiane


Définition 2.3.1. Soit une série statistique numérique ordonnée par valeurs croissantes.
La médiane est la valeur de l’observation qui partage la série en deux effectifs égaux,
c’est-à-dire la valeur numérique telle qu’il y ait 50 % des observations qui lui soient
inférieures et 50 % qui lui soient supérieures. Elle est souvent notée : Me

2.3.1 Médiane d’une variable discrète


On désigne par n le nombre d’observations.
1. Si l’effectif n est pair (n = 2p) : la médiane est alors égale à la moyenne des valeurs
encadrant le milieu de la série. C’est-à-dire tout nombre compris entre la pième et
la (p + 1)ième valeur peut être médiane. On choisira la demi-somme.

n  
n 
ième valeur de la série + + 1 ième valeur de la série
Me = 2 2
2
Exemple 2.3.1. {5, 7, 8, 8, 9, 11, 13, 14, 14, 16}
1
La médiane est M e = (9 + 11)
2
Remarque 2.3.1. Dans la distribution suivante : {9, 9, 9, 9, 11, 12, 13} le nombre 9
à la quatrième place occupe la position de la médiane. Mais aucune valeur n’est
plus petite que 9, trois notes lui sont supérieures. Il n’y a donc pas de médiane
dans cette série.

2. Si n est impair (n = 2p + 1) : il est possible d’identifier simplement la valeur


qui partage la population en deux effectifs égaux. Le rang central étant égal à
[(n + 1)/2].

n+1
Me = ième valeur de la série
2
Exemple 2.3.2. Les notes obtenues par un élève, au cours d’un mois, sont :
{4, 7, 7, 11, 13, 15, 17}.

Moussa KONE 11
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 2 2.3. MÉDIANE-CLASSE MÉDIANE

7+1
Il y a 7 notes dont la médiane se trouve à la position = 4. La médiane de
2
cette distribution est 11, car trois notes sont inférieure et supérieure.

2.3.2 Médiane d’une variable continue ( groupée en classe)


On cherche la classe contenant le n2 individu de l’échantillon. Cette classe est appelée
la classe médiane. En supposant que tous les individus de cette classe sont uniformément
répartis à l’intérieur, la médiane se calcule de la façon suivante par interpolation linéaire :
1. Avec les effectifs
n 
− Ni 

Me = xi + ai  2 

ni 

xi : limite inférieure de la classe médiane ;


ai : amplitude de la classe médiane ;
Ni : effectif cumulé inférieure à xi ;
n : la taille de l’échantillon.
2. Avec les fréquences cumulées croissantes :

50% − Fi 0, 5 − Fi
M e = xi + ai = xi + ai ×
Fs − Fi Fs − Fi

— xi : limiteinf érieuredelaclassemédiane;
— ai : amplitude de la classe médiane ;
— Fi : la valeur de la fréquence cumulée croissante inférieure la plus proche de
la classe médiane.
— Fs : la valeur de la fréquence cumulée croissante de la classe médiane.

Exemple 2.3.3. Le tableau suivant donne la répartition les étudiants de la premère année
de l’UFR-ST selon leur taille.
Taille (cm) xi Effectifs ni
[155 ;160[ 25
[160 ;165[ 50
[165,170[ 100
[170,175[ 175
[175,180[ 60
[180,185[ 40
[185,190[ 30
[190,195[ 20

Moussa KONE 12
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
2.3. MÉDIANE-CLASSE MÉDIANE Chapitre 2

Déterminer la médiane de cette série statistique par calcul et graphiquement. Pour faire
le calcul, dressons le tableau des effectifs cumulés croissants et décroissants.

Taille (cm ) xi Effectifs ni ECC ECD


[155,160[ 30 30 500
[160,165[ 50 80 470
[165,170[ 100 180 420
[170,175[ 170 350 320
[175,180[ 60 410 150
[180,185[ 40 450 90
[185,190[ 30 480 50
[190,195[ 20 500 20
500
Nous cherchons la taille de la = 250e personne. Le tableau nous montre que 180
2
étudiants ont une taille inférieure à 170 cm. La taille médiane se situe dans la classe
[170,175[. On admet que la taille des étudiants 170 qui se trouvent dans cette classe est
régulièrement repartie. La valeur de la médiane est donnée par :
250 − 180 70
M e = 170 + (175 − 170) × = 170 + 5 × = 172, 05 cm
350 − 180 170
M e = 172, 05 cm

Exemple 2.3.4. 1. Calculer la médiane des séries suivantes :


S1 = {9, 10, 9, 9, 11, 10, 11, 11, 11, 9}
S2 = {2, 3, 5, 5, 6, 7, 7, 8, 8, 9, 2, 2, 1, 3, 3, 4, 2, 1, 1}
2. Calculer la médiane des données se trouvant dans le tableau suivant :

Modalités xi Effectifs ni Ni (ECC) Fréquences fi FCC


0-10 48 48 0,24 0,24
10-15 40 88 0,2 0,44
15-20 56 144 0,28 0,72
20-30 32 176 0,26 0,88
30-50 24 200 0,12 1
Total 200 1

Moussa KONE 13
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 2 2.3. MÉDIANE-CLASSE MÉDIANE

Moussa KONE 14
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre
3
Chapitre 3 : Indices de dispersion

Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Étendue d’une série ou intervalle de variation . . . . . . . . . . . . . . . . . . 15
3.3 Les quartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4 Écart absolu moyen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.5 Fluctuation ou variance - Écart-type ou écart quadratique moyen . . . . . . . 19
3.5.1 Fluctuation ou variance . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.5.2 Écart-type ou écart quadratique moyen . . . . . . . . . . . . . . . . . 20
3.5.3 Intérêt de l’écart-type. . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.5.4 Coefficient de variation . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.6 EXERCICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.1 Introduction
Les valeurs types d’une série statistiques (mode, médiane, moyenne) donnent une
id]’ee sommaire de la distribution des observation mais elle ne suffisent pas à la carac-
tériser.
Considérons, par exemple, deux groupes de sept élèves d’une même classe qui ob-
tiennent à un devoir les notes suivantes :
Groupe A : 9 10 10 11 12 12 13
Groupe B : 5 7 9 11 13 15 17.
Ces deux séries ont la même médiane et la même moyenne arithmétique 11. Dans la
première, les valeurs sont groupées autour de la valeur typique 11 ; dans la deuxième, elles
sont plus étalées, plus dispersées de la valeur centrale. Nous disons que la distribution
A a une faible dispersion, tandis que B a une forte dispersion.

3.2 Étendue d’une série ou intervalle de variation


Définition 3.2.1. L’étendue d’une série est la différence entre ses deux valeurs extrêmes.
e = xmax − xmin

15
Chapitre 3 3.3. LES QUARTILES

Exemple 3.2.1. Groupe A étendue e = 13 − 9 = 4points


Groupe B étendue e = 17 − 5 = 12points

3.3 Les quartiles


La médiane sépare la série des observations en deux groupes d’effectifs égaux. Déter-
minons la médiane de chacune des deux moitiés. On obtient :
1. le premier quartile Q1 qui défini la valeur Q1 du caractère tel que le quart des
observations soit inférieur à Q1 , les trois quarts supérieurs à Q1 .
2. le second quartile ou la médiane de la série. Q2 = M e
3. le troisième quartile Q3 qui défini la valeur Q3 du caractère tel que les trois quarts
des observations soit inférieur à Q3 et le quart supérieurs à Q3 .

De cette définition on en déduit alors les propriétés suivantes :

quartiles pour des séries discrètes


n 3n
Q1 = et Q3 =
4 4

quartiles pour des séries continues


1. Le calcul des quartiles avec les effectifs cumulés croissants
(a) Premier quartile Q1
n 
− Ni 
Q1 = xi + ai  4



ni 

xi : limite inférieure de la classe contenant Q1 ;


ai : amplitude de la classe de Q1 ;
Ni : effectif cumulé inférieure à xi ;
n : la taille de l’échantillon.

Moussa KONE 16
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
3.3. LES QUARTILES Chapitre 3

(b) Troisième quartile Q3

3n
 
− Ni 
 4

Q3 = xi + ai  

 ni 

xi : limite inférieure de la classe contenant Q3 ;


ai : amplitude de la classe de Q3 ;
Ni : effectif cumulé inférieure à xi ;
2. Le calcul des quartiles avec les fréquences cumulées croissantes
(a) Premier quartile Q1

25% − Fi 0, 25 − Fi
Q1 = xi + ai × = xi + ai ×
Fs − Fi Fs − Fi

— xi :limite inférieure de la classe de Q1 ;


— ai : amplitude de la classe de Q1 ;
— Fi : la valeur de la fréquence cumulée croissante inférieure la plus proche
de la classe de Q1 .
— Fs : la valeur de la fréquence cumulée croissante de la classe de Q1 .
(b) Troisième quartile Q3 .

75% − Fi 0, 75 − Fi
Q3 = xi + ai × = xi + ai ×
Fs − Fi Fs − Fi

— xi :limite inférieure de la classe de Q3 ;


— ai : amplitude de la classe de Q3 ;
— Fi : la valeur de la fréquence cumulée croissante inférieure la plus proche
de la classe de Q3 .
— Fs : la valeur de la fréquence cumulée croissante de la classe de Q3 .

Intervalle inter-quartile
L’intervalle inter-quartile est la différence Q3 − Q1 . Il caractérise la dispersion car il
contient la moitié (50%) des effectifs.

Exemple 3.3.1. Détermination des quartiles et de l’intervalle inter-quartile. Le calcul des


quartiles est analogue au calcul de la médiane, et s’obtient au moyen des séries cumulées
croissantes. Reprenons le tableau contenant la taille des étudiantes et étudiantes de la
première année de l’UFR-ST.

Moussa KONE 17
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 3 3.4. ÉCART ABSOLU MOYEN.

Taille (cm ) xi Effectifs ni ECC


[155,160[ 30 30
[160,165[ 50 80
[165,170[ 100 180
[170,175[ 170 350
[175,180[ 60 410
[180,185[ 40 450
[185,190[ 30 480
[190,195[ 20 500
500
Le premier Q1 quartile est la taille qui correspond à la = 125e observation, donc
4
Q1 appartient à la classe [165, 170[
125 − 80
Q1 = 165 + (170 − 165) × = 167, 25 cm
180 − 80
500 × 3
Le troisième quartile Q3 est la taille qui correspond à la = 375e observation,
4
donc Q3 appartient à la classe [175, 180[.
375 − 350
Q3 = 175 + (180 − 175) × = 177, 08 cm
410 − 350
L’intervalle inter-quartile est :

177,08-167,25=9,83 cm.

50% des observations se trouvent dans un intervalle d’amplitude 9,83 cm.

3.4 Écart absolu moyen.


1. On appelle écart d’une variable xi par rapport au nombre a, la valeur de leur
différence, c’est-à-dire |xi − a|.
2. On appelle écart absolu moyen d’un ensemble de données, la moyenne arithmétique
des écarts de ces données par rapport à leur moyenne arithmétique. Si x̄ est la
moyenne arithmétique des n données x1 , x2 , · · · , xn , l’écart moyen est :

1X n
e= |xi − x̄|
n i=1

Exemple 3.4.1. Calculer l’écart moyen. 8, 10, 11, 11, 12, 13, 14, 16.

3. Dans le cas d’observation groupées en classes, l’écart absolu moyen est définit par

1X m
e= ni |xi − x̄|
n i=1

Moussa KONE 18
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
3.5. FLUCTUATION OU VARIANCE - ÉCART-TYPE OU ÉCART QUADRATIQUE
MOYEN Chapitre 3

dans laquelle xi est la valeur centrale de la classe d’effectif ni et m le nombre de


classes.

Exemple 3.4.2. Calculer l’écart moyen de la série

Taille (cm ) xi Effectifs ni Centre de classes |xi − x̄| ni |xi − x̄|


[155,160[ 30
[160,165[ 50
[165,170[ 100
[170,175[ 170
[175,180[ 60
[180,185[ 40
[185,190[ 30
[190,195[ 20

Remarque 3.4.1. Dans cette étude, nous avons définit l’écart moyen d’une série par
rapport à la moyenne arithmétique. On pourrait le définir par rapport à une autre valeur
typique, la médiane par exemple. D’ailleurs, dans les distributions courantes, la médiane
et la moyenne arithmétique ont des valeurs très voisines.

3.5 Fluctuation ou variance - Écart-type ou écart quadratique


moyen

3.5.1 Fluctuation ou variance

Définition 3.5.1. La fluctuation ou la variance d’un ensemble de données est la moyenne


arithmétique des carrés des écarts de ces données par rapport à leur moyenne arithmé-
tique. Désigné par σ 2 . Soit la série statistique défie dans le tableau suivant :

Modalité x1 x2 · · · xm
Effectif n1 n2 · · · nm
Fréquence f1 f2 · · · fm

ni
n = n1 + n2 + · · · + nm et fi = et x̄ la moyenne de cette série. elle s’exprime par :
n
1X m 1X m m
σ2 = ni (xi − x̄)2 = ni x2i − x̄2 = fi x2i − x̄2
X
n i=1 n i=1 i=1

Moussa KONE 19
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 3 3.6. EXERCICES

3.5.2 Écart-type ou écart quadratique moyen


Définition 3.5.2. L’écart-type d’un ensemble de données est la racine carrée de leur
variance.
v
m
u1 X
u
σ= t n i (xi − x̄)2
n i=1

3.5.3 Intérêt de l’écart-type.


— L’écart-type est utile quand on compare la dispersion de deux ensembles de données
de taille semblable qui ont approximativement la même moyenne. L’étalement des
valeurs autours de la moyenne est moins import dans le cas d’un ensemble de
données dont l’écart-type est plus petit.
— Une faible valeur de l’écart-type indique une accumulation des effectifs au voisinage
de la moyenne, tandis qu’une grande valeur de σ est l’indice d’un étalement des
observation.
— D’une façon générale, on démontre que l’intervalle [x̄ − 2σ, x̄ + 2σ] contient, quelle
que soit la série, les 75% des observations.

3.5.4 Coefficient de variation


Dans la comparaison de de plusieurs séries statistiques, on utilise le coefficient de va-
riation ou coefficient de dispersion qui représente le rapport de l’écart-type à la moyenne
arithmétique :
σ
CV =

— C’est une valeur est sans dimension (sans unité). Il est généralement en pourcentage
(%).
— Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la
moyenne est grande.
— Plus la valeur du coefficient de variation est faible, plus l’estimation est précise.

3.6 EXERCICES
Exercice 1.

On considère le tableau suivant contenant la répartition du personnel d’une entreprise


suivant les salaire journaliers :

Moussa KONE 20
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
3.6. EXERCICES Chapitre 3

Salaire (en Dollars) xi [30,40[ [40,50[ [50,60[ [60,70 [ [70,80[ [80,90[ [90,100[
Effectif ni 11 26 63 81 35 21 13
1. Quelle est l’étendu de cette grille salariale ?
2. Quelle est le salaire moyen du personnel de cette entreprise ?
3. Quelle est la classe modale de cette série ?
4. Construire l’histogramme des effectifs et détermine graphiquement le mode.
5. Confirmer cette valeur par le calcul de M0
6. Donner le tableau cumulatif des effectifs cumulés croissants et décroissants.
7. Construire la courbe cumulative croissante et décroissante des effectifs et déduire
graphique une valeur approximative de la médiane, le premier et le troisième quar-
tile (Q1 et Q3 ).
8. Confirmer ces valeur par calcul de la valeur de la médiane M e, du premier et l
troisième quartile.
9. Calculer écart absolu moyen e.
10. Calculer la variance, l’écart-type et le coefficient de variation.
11. En déduire si on a une bonne estimation du salaire moyen du personnel.

Exercice 2

Le classement de certaine catégories des personnels de deux entreprises A et B, effectué


d’après le montant des salaires horaires, est indiqué dans le tableau ci-dessous.
Salaire [3,30 ; 3,60[ [3,30 ; 3,60[ [3,60 ; 3,90[ [3,90 ; 4,20 [ [4,20 ; 4,50[
Entreprise A 95 184 265 235 182
Entreprise B 54 126 214 387 476

[4,50 ; 4,80[ [4,80 ; 5,10[ [5,10 ; 5,40[ [5,40 ; 5,70[ [5,70 ; 6]


166 84 73 47 18
624 581 419 154 66

1. Calculer pour chacun de ces groupes :


(a) La médiane et donner sa signification ;
(b) La moyenne et donner sa signification ;
(c) L’écart-type σ.
2. Quelle réflexions vous inspire la comparaison des résultats obtenus :
(a) pour les valeurs centrales (valeurs typiques) ;
(b) pour la dispersion ?

Moussa KONE 21
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre 3 3.6. EXERCICES

Moussa KONE 22
Licence 1 : AGRO, BIO, FMQA, GAM/U-AN
Chapitre
4
Statistiques à deux variables

4.1 Généralités

23

Vous aimerez peut-être aussi