Vous êtes sur la page 1sur 90

2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

PARTIE I : STATISTIQUE
-------------
Chapitre LES SOMMATIONS
1 INDICEES

Sommaire
Introduction
1- Sommations sur un indices
1-1 Définition
1-2 Notation
1-3 Propriétés
1-4 Exemples
2- Sommations sur deux indices
2-1 Définition
2-2 Notation
2-3 Propriétés
2-4 Exemples

Introduction
Pour définir tout être mathématique, il est primordial de choisir un moyen de définition et
d'expression commode. L'écriture indicielle semble le mieux adapté à cet effet. Cette écriture
utilise, selon les besoins, les signes Σ (sigma) et/ou π (pie).

Le signe Σ permet de désigner la somme de plusieurs termes. Ce symbole est généralement


accompagné d'un indice que l'on fait varier de façon à englober tous les termes qui doivent
être considérés dans la somme.

Le symbole π date du temps de Gauss. Il a été introduit pour désigner le produit de plusieurs
termes ; mais ne sera pas l’objet de notre étude.

1- SOMMATION SUR UN INDICE (SOMMATION SIMPLE)

1-1 Définition
Le symbole Σ (sigma) s’utilise pour désigner de manière générale la somme de plusieurs
terme. Ce symbole est accompagné généralement d’un indice que l’on fait varier de façon à
englober tous les termes qui doivent être considérés dans la somme. L’indice est représenté
par une ou plusieurs lettres minuscules. Si dans une somme le symbole Σ (sigma) porte un
seul indice on dit qu’on a une sommation simple indice.

1-2 Notation
Considérons le tableau suivant, relatif au salaire horaire perçu par 10 ouvriers.

Rang des ouvriers Salaire horaire (en milliers de Francs)


i xi
1er ouvrier 8
2ème ouvrier 8.5
3ème ouvrier 8.6
4ème ouvrier 9
5ème ouvrier 10

1|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

ème
6 ouvrier 10.7
ème
7 ouvrier 11
ème
8 ouvrier 11.2
ème
9 ouvrier 11.5
ème
10 ouvrier 12
Tableau1.a

En examinant le tableau1.a on peut dire :

- La première colonne, de titre « rang des ouvriers » est désignée par la variable i (variant
de 1 à 10) : cette variable permet de distinguer les ouvriers.

- La deuxième colonne, de titre « salaire horaire » est désignée par le symbole x. Pour
faire correspondre le salaire à l’ouvrier concerné, on va munir le symbole x da la lettre i et
se note comme suit : on porte en bas et à droite la lettre i. La lettre i ainsi portée,
représente un indice. D’où xi permet de repérer sans ambigüité le salaire de l’ouvrier de
rang i.

Exemple

x3 = salaire du 3ème ouvrier = 8.6 milliers de F ; x8 = salaire du 8ème ouvrier = 11.2 milliers de F.

L’utilisation de l’opérateur Σ (sommation) est une façon compacte d’écrire une somme
lorsque les termes successifs peuvent s’écrire sous la forme d’une expression générale qui
varie en fonction d’un indice.
n

D’où d’une façon générale, x 1  x 2    x n  x


i 1
i
et se lit la somme des xi pour i allant de

1 à n.

L’indice numérique peut figurer en haut (indice supérieur) ou en bas (indice inférieur) soit par
exemple : x i ou x i xi ou xi.

Les indices supérieur et inférieur et peuvent être multiples et se présenter de diverses


manières, soit par exemple : x ij ou x i j ou x ij .

L’indice sur lequel se fait la sommation est appelé « indice muet » c’est à dire qu’une fois la
somme calculée, le résultat ne dépend plus de cet indice. On peut donc lui donner le nom
qu’on veut : i, j, k etc. à exception des bornes de la somme, ici p et n

n n n


ip
xi   x j   xk
jp kp

Exemple

Considérons le tableau 1.a, si nous désirons calculer le total des salaires horaires, cela

2|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

revient à effectuer la sommation des dix salaires donnés. Nous pouvons l’écrire :
 8
  8 .5

- soit verticalement  
  12

100 . 5 Frs

- soit horizontalement

8  8 . 5    12  100 . 5 Frs ; ceci peut s’écrire comme suit :

10

x
i 1
i
 100 . 5 ... milliers .. de .. francs

10

x
i 1
i
est la forme contractée de x1 + x2 + … + x10 et se lit : « la somme des xi, pour i

allant de 1 à 10 (ou pour i variant de 1 à 10).

Remarques
- La somme des n premiers entiers peut être représentée de la façon suivante:
n

i  1  2  3  n
i 1

- L’expression suivante nous donne :  k ( k  1) 1(1  1)  2 ( 2  1)  3 ( 3  1)    n ( n  1)


i 1

- L’indice de sommation permet de définir d’une façon compacte l’expression d’un


polynôme de degré n :
n

P ( x)  a 0  a1 x 1  a 2 x 2    a n x n  P ( x )   a i x i forme contractée
i 0

- Les sommes infinies peuvent s’écrire avec le symbole ∞ :


Exemple : x 1  x 2    x
k 1
k

1-3 Propriétés
Les règles de base de l’opérateur sont les suivantes :

 Propriété 1
Une constante multiplicative ne dépendant pas de l’indice i, elle peut donc être sortie du
n n

symbole sommation d’où l’égalité:  ax


i 1
i
 a x i
i 1

 Propriété 2

3|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Considérons la somme suivante de 1er terme u a et de dernier terme raison u n :


n

ua  u a 1    u k 1    u n : cette somme se note S   u k  u a  u a 1    u k 1    u n


k a

n
ua un
S   u k  ( n  a  1)
k a 2

Avec (n – a +1) le nombre de terme, et où n est l’indice du dernier terme, a l’indice du 1er
terme

 Propriété 3
n

La sommation d’une constante donne : S   a  ( n  k  1) a


i k

 Propriété 4 : Relation de Chasles


n m n

S   xi   xi   xi
ip ip m 1

Exemple :
7 4 7


i 1
x i
  xi   xi
i 1 i 5

 Propriété 5 : Linéarité
n n n


i k
(ax i
 bx i )  a  x i  b  x i
i k i k

n m m

Exemple i 0
(3
i
 5i )   3 i  5  i
i 0 i 0

 Propriétés 6
Il est parfois utile dans certains développements mathématiques de changer les bornes de
l’indice (limites inférieures et supérieures) à condition de changer l’indice de manière
appropriée ; l’expression à l’aide su symbole Σ n’est donc pas unique. Le changement
d’indice peut se faire soit par translation soit par symétrie :

n n p np


i k
xi  
i k  p
xi  p  x
i k  p
ip

Exemple :

4|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

5

x k
 x 0  x1  x 2  x 3  x 4  x 5 
k 0

7
 5 7 3

 x k 2
 x 0
 x 1
 x 2
 x 3
 x 4
 x 5 
  k 
x  x k 2
  x k 2
k 2  k 0 k 2 k  2

3 

k  2
x k 2  x 0  x1  x 2  x 3  x 4  x 5 

Exercice
n

En posant que x k  ka k . Que devient la sommation  x k si k = 2, k = 0


k 1

2- SOMMATION SUR DEUX INDICES (DOUBLE SOMMATION)


2-1 Définition
Voir définition de la sommation sur un indice, sauf qu’ici le symbole Σ (sigma) porte deux
indices ; on dit qu’on a une double sommation.

2-2 Notation
Pour représenter les données d’un tableau ou d’une matrice, on utilise souvent une notation à
double indice, du genre x ij où le premier indice (i) correspond au numéro de la ligne où se
situe la donnée et le deuxième indice (j) à celui de la colonne.

Par exemple, le terme x 24 représente la donnée qui si situe à l’intersection de la 2ème ligne et
de la 4ème colonne du tableau ou de la matrice. Les données du tableau correspondent
généralement à des effectifs, on peut donc les noter n ij

j 1 ... p Total marginal


i

jp
1 x11 ... x1p
x
j 1
1j
 x1 

. . ... . .
. . ... . .
. . ... . .
jp
n xn1 ... xnp
x
j 1
nj
 xn 
i n i n

Total
marginal
i 1
xi1  x 1 ... x
i 1
ip
 x p N
(total général)

5|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Les doubles sommations permettent de faire des calculs sur les données d’un tableau.
p

- La somme des éléments de la ligne i se note : x


j 1
ij
 x i 1  x i 2    x ip
n

- La somme des éléments de la colonne j se note : x


i 1
ij
 x 1 j  x 2 j    x nj

- La somme des valeurs contenues dans les marges colonnes est égale à la somme des
valeurs contenues dans les marges lignes qui est, elle même égale à la taille N de la
population :
n p p n

 x
i 1 j 1
ij
 N  x ij
N
j 1 i 1
ou
Addition en colonne (l’indice i varie de 1 à n) Addition en ligne (l’indice j varie de 1 à p)
puis addition en ligne (l’indice j variant de 1 puis addition en ligne (l’indice i variant de 1
à p) à n)
D’où l’addition des termes d’un tableau constitué de n lignes (indice i) et de p colonnes
(indice j) se note :

n
 p  p
 n 
N     n ij
i 1  0 j 1

    n ij 
j 1  0  i 1 

Remarque
Plutôt que d'utiliser l'opérateur Σ, on peut utiliser une écriture plus condensée :
i 4

Par exemple n 11  n 21  n 31  n 41  n
i 1
i1
 n 1

L'opérateur  est remplacé par un ; ce point indique que l'on doit effectuer une somme :
n

- s'il se situe sur l'emplacement du 1er indice on effectue la somme sur i : x j   x ij


i 1
p

- s'il se situe sur l'emplacement du 2ème indice on effectue la somme sur j : xi   x ij
j 1

La ligne total et la colonne total du tableau ci-dessus sont appelées marges du tableau
croisé.
n 1 +....+ n i  +....+ n n  = n 1 +....+ n  j +....+ n  p = N

n p

En utilisant l’opérateur Σ et le point  on a : N   n


i 1
i
  n
j 1
j   n 

Exemple1
Une entreprise comportant 3 départements : vente, marketing et RH. Pour ces trois
départements, les coûts de fonctionnement trimestriels ont été résumés dans le tableau ci-
après :

*CF 1er trimestre 2ème trimestre 3ème trimestre 4ème trimestre Total
Département marginal
1 Vente 3.2 3 2.5 4 12.7
2 Marketing 0.3 0.2 0.4 1.2

6|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

3 RH 0.1 0.1 0.2 0.3


Total 3.6 3.3 3.1 5.5
marginal
*CF : coûts de fonctionnement en millions de francs ;

Ce tableau est constitué de 3 lignes et 4 colonnes, les valeurs qui se trouvent à l’intérieur
peuvent alors facilement être repérées par x ij (en partant du principe que l’indice i représente
la ligne i et l’indice j, la colonne j). On peut réécrire ce tableau sous une forme plus
exploitable :
j
i 1 2 3 4
1 3.2 3 2.5 4
2 0.3 0.2 0.4 1.2
3 0.1 0.1 0.2 0.3

De cette manière, on pourra répondre aisément à certaines préoccupations telles que :

 Le coût de fonctionnement du département Marketing (i = 2) pour le 3ème trimestre


sera représenté par x23 = 0.4.
 Les coûts annuels du premier département (Vente) s’écriront : Coûts annuels du
département vente = x11 + x12 + x13 + x14 = 3.2 + 3 + 2.5 + 4 = 12.7 (somme de la
4

première ligne) => x 11  x 12  x 13  x 14   x 1j


i 1

 etc

2-3 Propriétés
On peut généraliser les relations précédentes en énonçant les règles de base des doubles
sommations :

 On peut intervertir l’ordre de la sommation :


n
 p
 p  n  n p p n

   x ij

     x ij 
 ou  x ij   x ij
i 1  j 1  j 1  i 1  i 1 j 1 j 1 i 1

n p

 x j   x ij et xi    x ij
i 1 j 1

 x1  +....+ x i  +....+ x n  = x 1 +....+ x  j +....+ x  p


n p

 
i 1
xi    x j
j 1

2-4 Exercice
On s'intéresse au nombre d'étudiants par UFR dans une université pour chacun des trois cycles en
2018 :
er ième ième
Y="Cycles" 1 Cycle 2 Cycle 3 Cycle
X="UFR"
Mathématiques 924 409 50

7|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Sciences Economiques 1168 772 257


Géographie 102 386 227
Droit 3518 1596 625
1) Reprendre le tableau de manière à le rendre exploitable

Si on donne un numéro d’ordre aux UFR repéré par la lettre i (avec i = 1, 2, 3, 4) et un numéro d’ordre
aux cycles de formation repéré par lettre j (avec j = 1, 2, 3) et en reprenant le tableau précédent on
obtient :

j 1 2 3 Total marginal
i
1
2
3
4
Total
marginal

2) Déterminer :
2-1) La population totale N = …………. ;
2-2) n11 = …………… ; Que représente-t-il ?.
2-3) n23= ……... .
j 3

2-4) :  n 1j  n 1   Que représente-t-il ?.


j 1

2-5) Le nombre d’étudiants au 1er cycle (toutes disciplines confondues)

STATISTIQUE DESCRIPTIVE
-----------
Chapitre GENERALITES SUR
2 LA STATISTIQUE

Sommaire
Introduction
1- Définition générale et but de la statistique

8|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

2-1 Définition générale de la statistique


2-2 But de la statistique
2- Vocabulaire de la statistique
2-1 Population ou ensemble statistique
2-2 Population ou ensemble statistique
2-3 Echantillon (ou lot)
2-4 Taille de l’échantillon
2-5 Fréquence
2-6 Enquête (statistique)
2-7 Recensement
2-8 Sondage
2-9 Caractères
2-10 Modalités
2-11 Données
3- Méthode statistique
3-1 Observation des faits – Questionnaire
3-2 Dépouillement des observations
Introduction
La statistique est l’étude de la collecte de données, leur analyse, leur traitement,
l’interprétation des résultats et leur présentation afin de rendre les données compréhensibles
par tous. C’est à la fois une science, une méthode et un ensemble de techniques.
L’analyse des données utilisée pour décrire les phénomènes étudiés, nous permet de faire
des prévisions et de prendre des décisions à leur sujet.
Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous
les champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières des
universités et grandes écoles. La statistique consiste à :
 Recueillir des données.
 Présenter et résumer ces données.
 Tirer des conclusions sur la population étudiée et d’aider à la prise de décision.
 En présence de données dépendant du temps, nous essayons de faire de la prévision.
Pour mieux aborder ce cours nous allons commencer par faire un bref historique de l’usage
de la statistique ensuite donner une définition très générale de la statistique tout en
précisant la différence entre statistique descriptive (objet de ce document) et statistique
inférentielle (non traitée dans cette partie du cours) puis donner quelques définitions de
termes indispensables à la bonne compréhension de la suite de ce cours, et enfin terminer
par le la méthode statistique.

1- DEFINITION GENERALE ET BUT DE LA STATISTIQUE

1-1 Définition générale de la statistique

1-1-1 Statistiques
Le mot ’’statistiques’’ au pluriel désigne des collections de chiffres, présentées souvent
sous forme de tableaux, parfois sous forme de graphiques, et qui regroupent toutes les
observations effectuées sur des faits nombreux, relatifs à un même phénomène.

1-1-2 Statistique

Le mot ’’statistique’’ au singulier est l’ensemble des procédés ou méthodes qui ont pour but,
l’étude mathématique des statistiques.

En d’autres termes la statistique est une technique mathématique qui a pour objet l’étude
numérique des ensembles finis d’éléments (les statistiques).

9|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

D’une façon plus générale, la statistique est l’art et la science de collecter, analyser, présenter
et interpréter des données.

1-1-3 Statistique descriptive – statistique inférentielle

Il est possible de classer les méthodes statistiques en deux groupes : celui des méthodes
descriptives et celui des méthodes inférentielles.

 La statistique descriptive

C’est l’ensemble des méthodes dont l'objectif principal est la description des données
étudiées. Cette description des données se fait à travers leur présentation (tableau
synthétique), leur représentation graphique et le calcul de résumés numériques (ou
caractéristiques numériques).

NB : les termes, statistique descriptive, statistique exploratoire et analyse des données sont
quasiment synonymes.

 La statistique inférentielle ou statistique mathématique


C’est l’ensemble des méthodes dont l'objectif principal est de préciser un phénomène sur
une population globale, à partir de son observation sur une partie restreinte de cette
population (échantillon). Il s'agit d'induire (d'inférer) du particulier au général. Le plus souvent,
ce passage se fait grâce aux hypothèses de type probabiliste.

NB :
- Les termes de statistique inférentielle, statistique mathématique et statistique inductive
sont quasiment synonymes (non traitée dans cette partie du cours)
- D'un point de vue méthodologique, la statistique descriptive précède en général la
statistique inférentielle. Les deux aspects de la statistique se complètent cependant.

1-2 But de la statistique


En économie et dans le monde des affaires, l’information fournie par la collecte, l’analyse, la
présentation et l’interprétation des données, offre aux dirigeants une meilleure
compréhension de l’environnement économique et commercial ; leur permettant ainsi de
prendre de bonnes décisions (c'est-à-dire en toute connaissance de cause).
Le travail statistique comprend :

- La description simple et aussi complète que possible d’un ensemble étudié sous l’angle
d’un caractère donné (statistique descriptive)
- L’analyse et l’interprétation des résultats en vue
o D’établir une loi statistique de l’ensemble
o De rechercher une liaison existante entre deux ensembles
o Ou d’induire des propriétés d’un ensemble (analyse statistique)

2- VOCABULAIRE DE LA STATISTIQUE
2-1 Population ou ensemble statistique
C’est l’ensemble concerné par une étude statistique. On parle aussi de champ de l'étude ou
d’ensemble statistique.

Exemple :
Les étudiants en L2 de l’U-P ISPA : {Baucoum, Mikael, Emmanuel, Muriel, …}. Ce groupe
constitue une population sur laquelle ont peut faire une ou plusieurs études.
10 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

2-2 Individu ou unité statistique


Chaque élément de la population considérée est appelé individu ou unité statistique.

Exemple :
Si l’on considère le groupe d’étudiants précédent, Muriel est un individu ou une unité
statistique.

2-3 Caractère
Le caractère étudié est la propriété observée dans la population ou l’échantillon considéré.

NB : sur une même population observée, on peut étudier plusieurs caractères

Exemple 1

Si l'on s'intéresse aux notes obtenues en mathématique par chaque étudiant du groupe
précédent, le caractère étudié est « les notes obtenu en mathématique ».
Exemple2 :

Population Ouvriers d’une entreprise


Caractères Salaires horaire

2-4 Modalités

Une modalité est la valeur prise le caractère pour un individu de la population considérée.
Chaque modalité s’appelle une variable statistique.
Les variables statistiques peuvent être quantitatives ou qualitatives.
Lorsque les variables statistiques prennent leurs valeurs dans l’ensemble des nombres réels,
elles sont dite variables quantitatives (âge, salaires, tailles …) ; elles sont dites qualitatives
(sexe, couleur, catégorie socio-professionnelle, …) si elles prennent des valeurs non
numériques.
Cependant si on procède à un codage tel que : on code 1 les hommes et 2 les femmes, la
variable ‘’sexe" demeure toujours qualitative.

Exemple :

Considérons l’ensemble des étudiants en TC ADA2 comportant les filières : GEC, Log, FCG, …

- La population étudiée est : les étudiants du TC ADA2 (ensemble comportant toutes les
filières tertiaires) ;
- Le caractère étudié : les filières (étant donné que les filières ne sont pas mesurables, ce
caractère est dit qualitatif) noté X
- Ce caractère peut prendre divers valeur ou nom appelé modalité et l’on écrira : X = GEC,
ou X = Log, X = FCGE, … On lit dans ce cas : X prend la valeur GEC, etc.

Une variable statistique quantitative peut être discrète ou continue

 Une variable statistique quantitative est dite discrète (ou discontinue) lorsque les
valeurs qu’elle peut prendre sont des nombres entiers par exemples le nombre d’enfants
à charge par une famille ;

11 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

 Une variable statistique quantitative est dite continue lorsque les observations qui lui
sont associées ne sont pas des valeurs précises, mais des intervalles. Cela signifie que,
l'ensemble des valeurs possibles de la variable étudiée a été divisé en intervalles
contigus appelés classes. En général, les deux raisons principales qui peuvent amener à
considérer comme continue une variable quantitative sont le grand nombre
d'observations distinctes (un traitement en discret serait, dans ce cas, peu commode) et
le caractère ’’sensible" d'une variable (lors d'une enquête, il est moins gênant de
demander à des individus leur classe de salaire que leur salaire précis ; même chose
pour l'âge).
Quelques exemples de variables quantitatives fréquemment considérés comme
continues sont ainsi le revenu, l'âge (pour un groupe d'individus), la taille (groupe
d’individu mesurée à l’occasion d’une visite médicale)

Le nombre de valeurs possible de la variable continue est donc infini et dépend de


l’instrument de mesure ; on divise alors son intervalle de variation en classe successives.

2-5 Echantillon (ou lot)


Un échantillon ou lot est une partie restreinte (ou sous-ensemble) de la population considéré.

On étudie un échantillon de la population notamment lorsque celle-ci est impossible à étudier


dans son ensemble ; c’est le cas pour les sondages d’opinion.

2-6 Taille de l’échantillon


C'est le cardinal de l'échantillon, autrement dit c'est le nombre d'individus qu'il contient
(échantillon de taille 800, de taille 1000...). En général, on note n ou N la taille de l'échantillon
considéré.

2-7 Fréquence
La fréquence d’une valeur ou d’une classe dans une population observé, est le quotient de
n
l’effectif n (ou N) de cette valeur ou de cette classe par l’effectif total N. On note : f 
N
2-8 Enquête (statistique)
C'est l'opération consistant à observer (ou mesurer, ou questionner. . .) l'ensemble des
individus d'un échantillon (ou éventuellement de la population complète).

2-9 Recensement
C’est une enquête dans laquelle l'échantillon observé est la population tout entière (on parle
aussi d'enquête exhaustive).
En Côte d’Ivoire, on organise, de façon plus ou moins régulière, le recensement général de la
population...

2-10 Sondage
C'est, au contraire, une enquête dans laquelle l'échantillon observé est un sous-ensemble
strict de la population (on parle, dans ce cas, d'enquête non exhaustive).

3- METHODE STATISTIQUE
Les principales phases de la méthode statistiques sont :

- L’observation des faits et leur notation


- Le dépouillement des observations
- La présentation des résultats
- L’interprétation des résultats

12 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

3-1 Observation des faits – Questionnaire


3-1-1 Dénombrement instantané – dénombrement continu
Le dénombrement peut être instantané ou au contraire continu.

Exemple la population d’un pays à une date donnée peut être connue à l’aide d’un
recensement effectué à cette même date ; on parle de dénombrement instantané.

Le dénombrement est dit continu lorsqu’à partir d’un recensement antérieur, l’on fait l’adition
ou la soustraction, suivant le cas, des nombres de naissances, des décès, des émigrés et des
immigrés.

3-1-2 Relevé partiel ou sondage


L’étude complète d’une population (recensement), c'est-à-dire l’examen de toutes les unités
qui la composent, n’est pas toujours possible ; cette étude quand elle est possible peut
demander du temps et des moyens financiers élevés. Il peut aussi arriver que les unités
statistiques observées soient détruites à l’occasion de leur examen.

C’est pour ces diverses raisons, qu’on a recours au sondage. Les unités étudiées à l’occasion
du sondage constituent un échantillon.

L’étude de cet échantillon fournira des informations et conduira à des conclusions qui
pourront être étendues à la population complète (population mère).

3-1-3 Le questionnaire : moyen de collecte des informations


Lorsque les unités statistiques sur lesquelles porte l’observation sont des personnes, elles
peuvent être soumises à un questionnaire. C’est le moyen le mieux adapté pour observer les
unités statistiques à étudier.

Par exemple une entreprise peut questionner :

- Soit les consommateurs afin d’améliorer un produit,

- Soit ses employés pour apporter des modifications ou des aménagements à son
fonctionnement,.

Le support approprié pour de telles consultations est un imprimé établit par l’entreprise et
distribué soit au personnel, soit aux consommateurs selon le cas. Cet imprimé est appelé
questionnaire.
Le questionnaire doit comporter les informations suivantes :

- L’origine du questionnaire (entête simplifiée)


- Le service concerné
- La note introductive qui indique le but du questionnaire
- La date de retour et le lieu de dépôt du questionnaire
- Les directives d’utilisation (expliquer comment remplir le document)
- La note de remerciement à l’enquêté qui à bien voulu répondre aux questions (facultatif).

3-1-4 Elaboration pratique du questionnaire


La qualité d’une enquête statistique dépend du soin apporté à l’élaboration du questionnaire
et à la méthode choisie.
Un bon questionnaire doit être :

- Adapté au niveau de culture des personnes à interroger ; il faut pour cela tenir compte
13 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

des différentes mentalités afin de faciliter la communication ainsi que la compréhension.


- Clair et précis : les questions posées doivent être simples et appeler des réponses
précises et courte ‘’oui’’ ou ‘’non’’ par exemple.
- Complet : trop de questions raréfient les réponses
- Discret
- Présentation matérielle impeccable.
Pour élaborer un questionnaire, il faut :

- Déterminer l’objet de l’enquête (à quoi va servir le questionnaire, pourquoi le conçoit-on)


- Déterminer la ‘’population cible’’ (ensemble concerné par l’enquête)
- Déterminer l’échantillonnage ou choix de l’échantillon (proportion de population cible
sur laquelle portera l’enquête).
- Elaboration des questionnaires
Les différentes formes de questions à poser sont :

 Les questions ouvertes ou questions à réponse libre :


A ces questions ouvertes, le sujet donne son opinion en utilisant son propre vocabulaire.

Exemple : ‘’que pensez-vous du rôle de la femme dans la société’’

 Les questions fermées :


Les réponses sont fixées d’avance et sont simples.

Exemple : ‘’approuvez-vous l’existence du cahier de présence dans les classes ?

Oui ; Non .

 Question fermée à choix multiple :


Elle comporte une partie de réponse fixée à l’avance mais laisse une partie de réponse libre.

Exemple : ‘’qu’avez-vous fait hier soir ?’’

Travail ; Promenade ; Cuisine ; Autres (à préciser)

 Question avec classement


Les réponses proposées doivent être classées par la personne.

Exemple : ‘’classé par ordre de préférence de 1 à 3 les mets que vous affectionnez :

Riz tchèp ; Foutou banane ; Frite de pomme de terre .

14 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

NB : les questions posées doivent être telles qu’elles permettent au statisticien de contrôler
la valeur des réponses recueillies.

3-1-5 Présentation du questionnaire


- Le questionnaire doit être clair, agréable et facile à lire.
- Pour faciliter le dépouillement, il faut limiter le plus possible les questions ouvertes ;
chaque question doit faire l’objet d’un paragraphe.
- Mettre en valeur les questions, et ne pas hésiter à les numéroter si possible.
- En face de chaque réponse prévoir une case à cocher. Ces cases doivent être alignées et
ne pas oublier d’indiquer l’utilisation. Exemple : ‘’cochez la case correspondante’’
- Indiquer les N° de toutes les réponses possibles. La personne coche ou entoure le code
correspondant à la question choisit. Indiquer sur le questionnaire les codes à utiliser : le
codage est effectué par l’enquêteur.

3-2 Dépouillement des observations


Dépouiller les observations, c’est les grouper et les compter. Avant tout comptage ou
dépouillement, il faut au préalable écarter ou corriger les réponses erronées ou aberrantes et
tenir compte de la modalité du caractère étudié : qualitatif ou quantitatif.

Exemple de réponse aberrante : Dans un extrait d’un questionnaire on trouve :

- Age : 10 ans
- Etat matrimoniale : divorcé
- Nombre d’enfants : 3
3-2-1 Dépouillement dans le cas d’un caractère qualitatif
Dressons une statistique portant sur la situation matrimoniale de 20 personnes de sexe
masculin. Les modalités retenues sont : célibataire, marié, veuf, divorcé.

Pour faciliter le dépouillement on établi les codes ou correspondances suivantes :

Célibataire : 1 ; marié : 2 ; veuf : 3 ; divorcé : 4.

Les 20 personnes interrogées ont fourni les réponses suivantes :

2 1 1 4 1 4 3 2 2 2 3 2 1 1 4 2 2 1 2 3

Le dépouillement va consister à compter combien, parmi les 20 unités statistiques


observées, répondent à la modalité 1, à la modalité 2, …

Le dépouillement manuel peut se présenter de la façon suivante :

Situation matrimoniale Nombre d’unité Effectifs


Célibataire
marié
veuf
divorcé
Total 20

15 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

3-2-2 Dépouillement dans le cas d’un caractère quantitatif


A l’occasion d’un contrôle médical, 20 sportifs ont été pesés. Les résultats obtenus en Kg
sont les suivants :
77.450 62.200 67.820 71.280 74.370

81.290 78.540 63.220 59.470 61.330

56.410 63.230 63.280 71.660 68.720

54.930 71.440 74.310 77.820 67.410

Pour pouvoir dresser une statistique, il faut diviser le domaine de variation de la variable
(allant de 54.930 Kg à 81.290 Kg) en intervalle ou classe, de préférence d’amplitude
constante.

Pour cet exemple on peut avoir le dépouillement suivant :

Classes Nombre d’unité Effectifs


(amplitude de 5 Kg)
Moins de 55
De 55 à 60
De 60 à 65
De 65 à 70
De 70 à 75
De 75 à 80
Plus de 80
Total 20

STATISTIQUE DESCRIPTIVE
-----------
Chapitre LES DISTRIBUTIONS 16 | 7
Prof Alain Mustapha Nassirou
3 STATISTIQUES
Master AesUN
Télécoms & Réseaux / Maitrise CARACTERES
Science : Physique
(SERIES STATISTIQUES A UNE VARIABLES)
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Sommaire
Introduction
1- Description des séries statistiques à une variable
1-1 Tableau statistique
1-2 Notion de classe
1-3 Détermination des fréquences
1-4 Détermination des effectifs cumulés
1-5 Les représentations graphiques
2- Caractéristiques des séries statistiques à une variable
2-1 Caractéristiques de tendance centrale (Mode, Médiane, Moyenne, quantiles …)
2-2 Caractéristiques de dispersion (Etendue, variance, écart-type, coefficient de variation...)

Introduction
Le statisticien pour élaborer des statistiques, observe d’abord des faits, puis collecte des
informations concernant un phénomène, procède à un ou plusieurs tris (dépouillement) et
tire une conclusion c'est-à-dire un enseignement.
Les données collectées étant souvent nombreuses, il est commode de les présenter sous
forme de tableau synthétique ou sous forme de graphique. L’ensemble des données ou
renseignements forme une distribution statistique ou une série chronologique (appelée aussi
chronique) ; cette dernière exprime une évolution dans le temps, contrairement à la
distribution statistique.

1- DESCRIPTION DES SERIES STATISTIQUES A UNE VARIABLE

1-1 Tableau statistique


Le tableau statistique est une façon synthétique de présenter les données résultant du
dépouillement des observations après une enquête (sondage). Les données y sont rangées
par ordre croissant et s’appelle une série statistique.
Les séries statistiques à une variable (série statistique simples) donnent les effectifs pour
chaque modalité d’un caractère de l’ensemble étudié. C’est un tableau généralement disposé
verticalement, possédant deux colonnes :
 La 1ère colonne, est réservée à l’inscription des modalités prises par le caractère, ou des
valeurs prises par la variable, désignée par xi
 La 2nde colonne est réservée à l’inscription des effectifs correspondants, désignés par ni

Nombre Effectifs
d’enfants à charge : xi (Nombre de famille) : ni
0 3
1 9
2 6
3 3
4 2
5 1
6 1
Total 25

17 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Exemple1 : Nombre de familles en fonction du nombre d’enfants à charge.

Dans cet exemple la variable est discrète : x1 = 0, x2 = 1, x3 = 2, ..., x7 = 6 ;


A chacune de ces valeurs correspond son effectif : n1= 3, n2 = 9, n3= 6, … n7= 1.
La série statistique (ou distribution statistique) ici est l’ensemble des 7 couples (xi, ni) avec i
= 1, 2, …, 7 ; soit {(0, 3), (1, 9), …, (6, 1)}.
7

La somme des effectifs ni est l’effectif total N de la population étudiée : N   n i


i 1

N.B : Dans le cas d’une variable continue, il est commode d’utiliser des intervalles (classes).

Exemple2 : répartition d’un groupe (distribution statistique) d’élèves d’après leur taille

Taille Effectifs
(en cm) (Nombre d’élèves) :
ni
[150 ; 155[ 3
[155 ; 160[ 9
[160 ; 165[ 16
[165 ; 170[ 28
[170 ; 175[ 14
[175 ; 180[ 10
Total

Interprétation :

Dans cette distribution, 3 élèves ont une taille égale ou supérieure à 150 cm, mais inférieure
à 155 cm ; 9 élèves ont une taille égale ou supérieure à 155 cm, mais inférieure à 160 ; etc.

1-2 Notion de classe et amplitude


Une classe est un intervalle partiel intervenant dans la partition de l’intervalle des valeurs, en
intervalle adjacents de même largeur ou non.

Soit la classe [a, b[ ou [a, b] :

- La largeur ou amplitude de [a, b[ (ou [a, b]) est égale à   b  a


a b
- Le centre de [a, b[ (ou [a, b]) est égale à c 
2

1-3 Détermination des fréquences


ni
Les effectifs ni sont souvent remplacés par les quantités f i  : il s’agit des fréquences.
N
La fréquence est le rapport de l’effectif d’une modalité du caractère étudié, à l’effectif total de
l’ensemble : N  n
i
i

Exemple : Nombre de familles en fonction du nombre d’enfants à charge

Nombre d’enfants à charge : xi 0 1 2 3 4 5 6 Total


7
Effectifs (Nombre de familles) : 3 9 6 3 2 1 1 N   n i  25
ni
i 1
ni
fi  0.12 0.36 0.24 0.12 0.08 0.04 0.04
Fréquences N 7

18 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

ni
 100 12 36 24 12 8 4 4
N (%)
Remarque
1
- f
i
i

N
n
i
i
1

ni
- En multipliant une fréquence fi  par 100, on obtient le taux du pourcentage de la
N
population totale que représente ni.
3
On a ainsi :  100  12 indique que 12% des familles n’ont pas d’enfants à charge.
25

1-4 Détermination des effectifs cumulés (séries cumulées)


A partir des effectifs ou des fréquences, on peut calculer des effectifs cumulés (croissants
ou décroissants) ou des fréquences cumulées (croissantes ou décroissantes).

Exemple : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.

Salaire
horaire [8 – 8.4[ [8.4 – 8.8[ [8.8 – 9.0[ [9.0 – 9.2[ [9.2 – 9.6[ [9.6 – 10.8[ [10.2 –
(en 10.9[
millier de
Frs)
Effectifs : 10 30 60 72 40 24 14
ni

n i
i
 250

Une fois les tableaux des effectifs cumulés dressés, l’on peut prétendre répondre à une
certaine série de questions telles que pour notre exemple :
- Quel est le nombre d’ouvriers percevant au moins 9.2 millier de Frs ou plus ?
- Quel est le nombre d’ouvriers dont le salaire horaire est inférieur à 9.2 millier de Frs ?
- etc.

1-4-1 Séries à effectifs cumulés croissants ou fréquences cumulées croissantes


Exemple : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.
Salaire horaire Effectifs : Fréquence Effectifs Fréquences
(en millier de ni fi cumulés cumulées
Frs) croissants croissantes
[8 – 8.4[ 10 0.040 10 0.040
[8.4 – 8.8[ 30 0.120 40 0.160
[8.8 – 9.0[ 60 0.240 100 0.400
[9.0 – 9.2[ 72 0.288 172 0.688
[9.2 – 9.6[ 40 0.160 212 0.848
[9.6 – 10.8[ 24 0.096 236 0.944
[10.2 – 10.9[ 14 0.056 250 1.00
250 1

 Méthode de calcul :
- 1er cumul : 1er effectif de la colonne des effectifs : 10 (ou 1ère fréquence 0.040) ;
- 2ème cumul : somme des deux premiers effectifs de la colonne des effectifs : 10 + 30 = 40 (ou
somme des 2 premières fréquences : 0.040 + 0.120 = 0.160);
- 3ème cumul : somme des trois 1er effectifs de la colonne des effectifs : 40 + 60 = 100 (ou somme
des trois 1ères fréquences : 0.160 + 0.240 = 0.400) ;

19 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

- Etc. Le dernier cumul de la colonne est égal à l’effectif total de la population : 250 (ou est égal la
fréquence total : 1).

 Interprétation :
- 1er cumul : 10 salariés gagnent moins de 8.4 millier de Frs à l’heure (ou en terme de fréquence :
0.04x100 = 4% des salariés gagnent moins de 8.4 millier de Frs à l’heure)
- 2ème cumul : 40 salariés gagnent moins de 8.8 millier de Frs à l’heure (ou en terme de fréquence
0.160x100 = 16% des salariés gagnent moins de 8.8 millier de Frs à l’heure)

- 3ème cumul : 172 salariés……………………………………………………………………………………


.soit 0.688x100 = 68.8% ……………………………………………………………………………….….)

- Le dernier cumul : 250 salariés gagnent moins de 10.9 millier de Frs à l’heure (ou 100% des salariés
gagnent moins de 10.9 millier de Frs à l’heure)

1-4-2 Séries à effectifs cumulés décroissants ou fréquences cumulées décroissantes


Exemple : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.

Salaire Effectifs : Fréquence Effectifs Fréquences


horaire ni fi cumulés cumulées
(en euro) décroissants décroissantes
[8 – 8.4[ 10 0.040 250 1.00
[8.4 – 8.8[ 30 0.120 240 0.960
[8.8 – 9.0[ 60 0.240 210 0.840
[9.0 – 9.2[ 72 0.288 150 0.600
[9.2 – 9.6[ 40 0.160 78 0.312
[9.6 – 10.2[ 24 0.096 38 0.152
[10.2 – 14 0.056 14 0.056
10.9[
250 1

 Méthode de calcul :
- 1er cumul : effectif total de la population 250 (en terme de fréquence : fréquence total : 1) ;
- 2ème cumul : l’effectif total moins le 1er effectif de la colonne des effectifs : 250 - 10 = 240 (en terme
de fréq : la fréquence totale moins la 1ère fréquence de la colonne des fréq: 1 – 0.040 = 0.960);
- 3ème cumul : le 2ème cumul de la colonne des effectifs cumulés moins le 2ème effectif de la colonne
des effectifs : 240 – 30 = 210 (ou 2ème cumul de la colonne des fréquences cumulés moins la 2ème
fréquence de la colonne des fréquences : 0.96 – 0.120 = 0.840);
- Etc. Le dernier cumul de la colonne de effectif cumulés décroissant est égal au dernier effectif de
la colonne des effectif : 14 (ou est égal la dernière fréquence de la colonne des fréquences :
0.056) ;

 Interprétation :
- 250 salariés gagnent au moins 8 millier de Frs (gagnent 8 millier de Frs ou plus) à l’heure (En terme
des fréquences : soit 100% des salariés gagnent au moins 8 millier de Frs (c'est-à-dire gagnent 8
millier de Frs ou plus) à l’heure)

- 240 salariés gagnent au moins 8.4 millier de Frs (c'est-à-dire gagnent 8.4 millier de Frs ou plus) à
l’heure (soit 0.960x100 = 96.0% des salariés gagnent au moins 8.4 millier de Frs (c'est-à-dire
gagnent 8.4 millier de Frs ou plus) à l’heure)

- 210 salariés ……………………………………………………….

Remarque
- Les effectifs cumulés croissants et les fréquences cumulées croissantes sont mis en
20 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

correspondance pour leur interprétation avec les extrémités supérieures des classes
- Les effectifs cumulés décroissants et les fréquences cumulées décroissantes sont mis
en correspondance pour leur interprétation avec les extrémités inférieures des classes.
- Si l’on additionne l’effectif inscrit sur la ligne i des effectifs cumulés croissants et l’effectif
inscrit sur la ligne i + 1 de la colonne des effectifs cumulés décroissant, on obtient
toujours l’effectif total de la population.

1-5 Les représentations graphiques :


Un graphique permet de visualiser et de saisir rapidement un ensemble d’observations, il met
en évidence certains faits essentiels, mais néglige les détails. Il est moins précis que le
tableau, mais a l’avantage d’être plus expressif, plus évocateur du phénomène.

1-5-1 Cas des caractères qualitatifs


Exemple :
Considérons le tableau ci-dessous : répartition du chiffre d’affaires de la société VENTOUT
au 31/12/2019
Régions Montant
(en milliers de francs)
Nord 2000
Est 1200
Centre 1400
Sud 600
Ouest 1200

Le caractère étudié ici est qualitatif ; il peut prend 5 valeurs ou modalité : Nord, Est ….
On a trois graphiques possibles pour représenter cette série statistique : diagramme en
bâtons, diagramme en colonnes (ou à barres), diagramme à secteurs circulaire

 Diagramme en bâtons

La longueur d’un bâton est proportionnelle au chiffre d’affaire correspondant.

 Diagramme en colonne

21 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Une barre doit être interprété comme une surface et non comme une longueur (voir
construction d’un histogramme).

 Diagramme à secteurs circulaires


Les graphiques en secteurs font partie de la famille des graphiques fermés, c'est-à-dire des
graphiques associés à un ensemble fini dont les sous ensembles sont représenté par des
zones proportionnelles à l’effectif correspondant.

Un secteur est sous-ensemble centré sur le milieu d’un cercle (graphique circulaire) ou d’un
demi-cercle (graphique semi-circulaire), dont la profondeur (rayon du cercle ou du demi-
cercle) et dont la largeur de l’arc est proportionnelle à à un angle et à une surface définissant
un sous-ensemble.

Méthode : On partage un disque (ou un demi disque) en secteurs.


Chaque modalité correspond à un secteur circulaire dont l’angle (ou la surface) est
proportionnel à la fréquence correspondante :
ni ni
i  A  fi A avec f i  , A = 180° pour un demi-disque ; A = 360° pour un disque
N N

Ainsi pour l’exemple précédent on a :


o Pour la région Nord, l’angle correspondant est : θ1 = (2000/6400)x360° = 112.5° pour
un disque et θ1 = (2000/6400)x180° = 56.25° pour un demi disque.
o Pour la région Est, l’angle correspondant est θ1 = (1200/6400)x360° = 67.5° pour un
disque et θ1 = (1200/6400)x180° = 33.75° pour un demi disque.
o On procède de même pour les autres régions.
Remarque :
La somme des angles correspondants aux différentes régions doit être égale à 180° pour un
demi-disque et 360° dans le cas d’un disque.
Cette représentation met en évidence les valeurs relatives de chaque observation.
22 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

1-5-2 Cas des caractères quantitatifs


Un caractère quantitatif est soit discret soit continu.

1-5-2-1 Cas des caractères quantitatifs discrets (ou discontinus)


Les représentations graphiques relatives aux caractères discrets sont : le diagramme en
bâton, le diagramme en escalier, les polygones cumulatifs, le polygone des effectifs
Exemple : la distribution du personnel d’une entreprise d’après le nombre d’enfants à charge

Nbre d’enfants à charge Effectifs Fréquences


xi ni fi
0 4 0.05
1 15 0.1875
2 29 0.3625
3 18 0.225
4 10 0.125
5 3 0.0375
6 1 0.0125
80 1.0000
 Diagramme en bâton : diagramme des effectifs (fréquences)
En chacun des points xi, on trace parallèlement à l’axe des ordonnées un bâton de longueur
proportionnelle à l’effectif (fréquence) correspondant par le choix d’une échelle raisonnable.

Fréquences
Effectifs

0.375 - 30 -

0.250 - 20 -

0.125 - 10 -

0 -
0 1 2 3 4 5 6 Nombre d’enfants à
h
Les bâtons sont proportionnels à l’effectif (ou à la fréquence) correspondant(e).

 Polygone des effectifs (ou des fréquences)


Le polygone des effectifs (ou des fréquences) est, pour le caractère discrets, la ligne brisée
obtenue en joignant les extrémités supérieures des bâtons du diagramme.

Fréquences
Effectifs

0.375 - 30 -

0.250 - 20 -

0.125 - 10 -

-
0 1 2 3 4 5 6 Nombre d’enfants

23 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

 Diagramme en escalier (courbe cumulative)


La fonction cumulative croissante ou fonction de répartition est une fonction définie par
intervalle et dont la représention graphique est un diagramme en escalier :
o Pour x < 0, P(X < 0) = 0 ;
o Pour 0 ≤ X < 1, P(0 ≤ X < 1) = f0 = 4/80 = 0.05
o Pour 1 ≤ X < 2, P(1 ≤ X < 2) = f0 + f1 = 4/80 + 15/80 = 19/80 = 0.2375
o Pour 2 ≤ X < 3, P(2 ≤ X < 3) = f0 + f1 + f2 = 19/80 + 29/80 = 48/80 = 0.6
o Pour 3 ≤ X < 4, P(3 ≤ X < 4) = f0 + f1 + f2 + f3 = 48/80 + 18/80 = 66/80 = 0.825
o Pour 4 ≤ X < 5, P(3 ≤ X < 4) = f0 + f1 + f2 + f3 + f4 = 66/80 + 10/80 = 76/80 = 0.95
o Pour 5 ≤ X < 6, P(3 ≤ X < 4) = f0+f1+f2+f3+f4+ f5 = 76/80 + 3/80 = 79/80 = 0.9875
o Pour x ≥ 6, P(x ≥ 6) = f0+f1+f2+f3+f4+ f5+f6 = 79/80 + 1/80 = 80/80 = 1

X=k 0 1 2 3 4 5 6

Effectif : nk 4 15 29 18 10 3 1
Effectifs
cumulés 0 4 19 48 66 76 79 80
croissants

Ce tableau nous permet de lire directement par exemple que : 19 = 4+19 familles qui ont
moins de 2 enfants

k 0 1 2 3 4 5 6

Fréquence : 4/80 15/80 29/80 18/80 10/80 3/80 1/80


Fréquences
cumulées 0 19/80 = 48/80 = 66/80 = 76/80 = 79/80 = 80/80 =
0.05
croissantes 0.2375 0.6 0.825 0.95 0.9875 1
Ce tableau nous permet de lire directement par exemple que : 0.2375 soit 23.75% des
familles ont moins de 2 enfants

Fréquences
Effectifs

1 - 80 -

0.750 - 60 -

0.500 - 40 -

0.250 - 20 -

-
0 0 1 2 3 4 5 6 Nombre d’enfants à
charges

24 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

1-5-2-2 Cas des caractères quantitatifs continus


Les représentations graphiques relatives au caractère discret sont : l’histogramme, le
polygone des effectifs, les polygones cumulatifs.

Exemple1 : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.

Salaire Effectifs Fréquences Effectifs Effectifs Amplitude Hauteur des


horaire : ni fi = ni /n cumulés cumulés des classes rectangles :
(en euro) croissants décroissant (base des effectif
H 
rectangles) amplitude
[8 – 8.4[ 10 0.040 10 250 0.40 25
[8.4 – 8.8[ 30 0.120 40 240 0.40 75
[8.8 – 9.0[ 60 0.240 100 210 0.20 300
[9.0 – 9.2[ 72 0.288 172 150 0.20 360
[9.2 – 9.6[ 40 0.160 212 78 0.40 100
[9.6 – 10.8[ 24 0.096 236 38 0.60 40
[10.2 – 10.9[ 14 0.056 250 14 0.70 20
250 1.000

 Histogramme
Un histogramme est constitué d’une suite de rectangles, dont les bases coïncident avec les
classes ; deux cas se présentent :

- 1er cas : les intervalles des classes ont tous la même amplitude

- 2ème cas : les intervalles des classes n’ont pas tous la même amplitude.

o Cas où les intervalles des classes ont tous la même amplitude


Exemple 2 : « Taille des étudiants enregistrée lors d’une visite médicale »

161.5 16 167 181 17 18 17 18 17 178.5


6 1 4 7 2 1
171 17 178.5 169.5 17 17 16 17 17 167
8 9 1 4 2 9
174 17 162 172 16
3 9

25 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Remarques :
- L’histogramme se compose de rectangles adjacents. La base d’un rectangle représente
l’amplitude de la classe statistique correspondante.
- Sur le graphique et dans le tableau précédent, les classes ont toutes la même amplitude.

Interprétation
L’histogramme ne doit surtout pas être interprété comme un diagramme en bâton, c'est-à-
dire à partir des hauteurs. Les rectangles sont tracés de telle façon que leurs surfaces soient
proportionnelles aux effectifs correspondants. En conséquence, l’effectif total est représenté
par la somme des surfaces des rectangles.

o Cas où les intervalles des classes n’ont pas tous la même amplitude
Exemple3 : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.

Salaire Effectifs Amplitude Hauteur des


horaire : ni des rectangles :
(en euro) classes
(base des H 
effectif
rectangles) amplitude

[8 – 8.4[ 10 0.40 25
[8.4 – 8.8[ 30 0.40 75
[8.8 – 9.0[ 60 0.20 300
[9.0 – 9.2[ 72 0.20 360
[9.2 – 9.6[ 40 0.40 100
[9.6 ; 10.2[ 24 0.60 40
[10.2 ; 10.9[ 14 0.70 20
250

Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire

Exemple4
Considérons la distribution statistique suivante : « taille de 25 étudiants »
Tailles Nombre Amplitude Hauteur des classes
(en cm) D’étudiants Des classes
S effectif
(effectif) b h  
S b b
[161 ; 165[ 3 165 – 161 = 4 S effectif 3
h   
b b 4
[165 ; 177[ 13
[177 ; 185[ 9
Total 25
- Dans le 1er rectangle, S = 3 (effectif de la 1ère classe) et la base b = 165 – 161 = 4 =>
S effectif 3
h    ;
b b 4
- On procède de même pour les autres lignes de la distribution
 Polygone des effectifs
o Cas où les intervalles des classes ont tous la même amplitude :
Le polygone des effectifs d’un histogramme où les intervalles ont tous la même amplitude se
trace en reliant les centres des sommets des rectangles.

26 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Le total des surfaces hachurées (au dessus du polygone) est égal au total des surfaces
colorées en gris (en dessous du polygone). La surface totale entre le polygone et l’axe des
abscisses est égale à celle de l’histogramme, c'est-à-dire à l’effectif total.

o Cas où les intervalles des classes n’ont pas tous la même amplitude :
Dans ce cas le polygone est obtenu en revenant d’abord artificiellement à une série dont tous
les intervalles ont la même amplitude, de telle sorte que la surface enveloppé par le polygone
soit égale à la surface enveloppée par l’histogramme puis procéder comme précédemment.

 Polygone cumulé croissant


On utilise un repère cartésien orthogonal dans lequel on place les points dont les abscisses
sont égales aux bornes supérieures des classes et comme ordonnées les effectifs cumulés
croissants correspondants, sauf pour le 1er point qui aura pour abscisse la borne inférieure
de la 1ère classe et pour ordonné 0.

En joignant ces points par des segments de droites on obtient le polygone cumulatif
croissant ou polygone des effectifs cumulés croissants (dans le cas des fréquences, le
polygone des fréquences cumulées croissantes) ou encore la courbe cumulative croissante.

Pour notre exemple1 «Distribution statistique des ouvriers d’une entreprise d’après leur
salaire horaire. » : le 1er point aura pour abscisse la borne inférieure de la 1ère classe et pour
ordonné 0 soit (8 ; 0). On aura donc comme points : (8 ; 0) ; (8.4 ; 10) ; (8.8 ; 40) ; ……. ; (10.9 ;
250)

27 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Interprétation : sur le graphique, on peut lire que, 172 salarié (ou une fréquence égale à 0.688
soit 68.8% des 250 salariers) perçoivent un salaire horaire inférieur à 9.2 milliers Frs.

 Polygone cumulé décroissant


On utilise également un repère cartésien orthogonal dans lequel on place les points dont les
abscisses sont égales aux bornes inférieures des classes et comme ordonnées les effectifs
cumulés décroissants correspondants, sauf pour le dernier point qui aura pour abscisse la
borne supérieure de la dernière classe et pour ordonnée 0.
En joignant ces points par des segments de droites on obtient le polygone cumulatif
décroissant ou polygone des effectifs cumulés décroissants ou encore la courbe
cumulative décroissante.
Pour notre exemple1 «Distribution statistique des ouvriers d’une entreprise d’après leur
salaire horaire. » : le 1er point aura pour abscisse la borne inférieure de la 1ère classe et pour
ordonné 250 soit (8 ; 250) et le dernier point aura pour abscisse la borne supérieure de la
dernière classe et pour ordonnée 0 soit (10.9 ; 0) ; On aura donc comme points : (8 ; 250) ;
(8.4 ; 240) ; (8.8 ; 210) ; … ; (10.9 ; 0)

Interprétation : sur le graphique, on peut lire que, 78 salariés (ou une fréquence égale à 0.312
soit 31.2 % des 250 salarier) perçoivent un salaire horaire au moins égal à 9.2 euros.

Remarque
On peut construire sur un même repère le polygone cumulé croissant et le polygone cumulé
décroissant. Les deux courbes se coupent en un point d’abscisse la médiane et d’ordonné la
moitié de l’effectif total.

28 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

2- CARACTERISTIQUES DES SERIES STATISTIQUES A UNE VARIABLE

2-1 Caractéristiques de tendance centrale ou caractéristiques de position


Les indicateurs statistiques de tendance centrale (dits aussi de position) considérés
fréquemment sont la moyenne, la médiane et le mode.

2-1-1 Moyenne
2-1-1-1Définition
 Cas des caractères quantitatifs discrets
- Moyenne arithmétique non pondérée :
Considérons la série de N nombres suivantes : x1, x2, …, xn (variables non pondérées). La
x1  x 2  ...  x n 1
n

moyenne arithmétique des n nombres x1, x2, …, xn est : x 


n

n
x i 1
i

- Moyenne arithmétique pondérée :


Considérons la série de nombres suivants :

xi Effectifs : ni ni xi

x1. n1 n1 x1

.xn nn nn xn
n1 x1  n 2 x 2  ...  n n x n 1
n

n n  x   n x
n n x
i i

i
 N i i
N N i 1
Total i 1 i 1

 Cas des caractères quantitatifs continus


Soit la série de p classes : [x1, x2[, [x2, x3[, …, [xp, xp+1[ et d’effectif respectif n1, n2 … np

Classes Centre des classes Effectifs


ci ni
[x1, x2[ c1 n1
… … .

[xp, xp+1[ cp np
p

total p classes n
i 1
i
 N

On affecte à ces effectifs, les centres des classes (milieu des classes) ; avec pour un
xi  x i 1
intervalle [xi, xi+1[ le centre de la classe est c i 
2
29 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

n1 c1  n 2 c 2  ...  n p c np 1
p

x 
N

N
n c
i 1
i i

2-1-1-2 Propriété
Soit a et b des constantes réelles et soient x1, x2, …, xn, des variables.

Posons y i  ax i  b , alors on a : y  a x  b .

2-1-2 Mode
 Cas des caractères discrets (isolés)

Le mode noté Mo est la valeur (ou les valeurs) de xi qui correspond au plus grand effectif.

Exemple : Distribution « ventes de vêtements de pluie »

Pour cet exemple, l’effectif le plus élevé est 23, d’où le mode Mo = 1000

 Cas des caractères continus (classés)


On parle ici de classe modale ; c’est la classe qui possède le plus grand effectif (ou
fréquence).

Exemple : répartition du nombre d’établissements du bâtiment et de génie civil

Nombre Nombre Fréquence


de salariés d’établissements des classes :
ni fi = ni/N
[0, 10[ 929 0.792
[10, 20[ 132 0.113
[20, 40[ 67 0.057
[40, 60[ 45 0.038

30 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Somme 1173

L’effectif le plus élevé est …….., d’où la classe modale est :……….

N.B : Une population n’a pas toujours un mode ou une classe modale unique.

Remarque :

L’utilisation pratique du mode reste assez limitée car des causes accidentelles peuvent faire
apparaître un mode peu significatif. Si l'on doit donner un indicateur de tendance centrale
unique pour caractériser le centre d'une série d'observations, et si l’on est amené à choisir
entre la moyenne et la médiane on retiendra la moyenne.

2-1-3 Médiane
 Cas des caractères discrets (isolés)
Les xi étant rangés dans l’ordre croissant, la médiane Me est la valeur de la variable pour
laquelle l’effectif total est divisé en deux.

La médiane se détermine soit par calcul, soit graphiquement.

o Méthode de détermination de la médiane par calcul :

Deux cas se présentent :

- 1er cas : l’effectif N de la série est impair : N = 2q + 1 (avec q entier naturel)


La médiane est la variable de rang q+1 soit Me = xq +1

Exemple : Nombre de familles en fonction du nombre d’enfants à charge

Nombre d’enfants 0 1 2 3 4 5 6 Total


à charge : xi
Effectifs (Nbre de famille) : ni 3 9 6 3 2 1 1 Σni = 25

Pour cet exemple, le nombre de familles en fonction du nombre d’enfants à charge est N =
25 et la série peut être rangée de la façon suivante :

0 00111111111 2 222223334456

N = 2q + 1 = 25 => 2q = 24 => q = 12 ; d’où la médiane est la valeur de la variable de rang 12

+1 = 13. Pour cet exemple, Me = x13 = 2 enfants.

- 2ème cas : l’effectif N de la série est pair : N = 2q (avec q entier naturel)


Dans ce cas, la médiane peut être xq ou xq+1 ou toute valeur comprise entre xq et xq+1. En
xq  x q 1
pratique on considère que :  e  x N  x q ou M e

2
2

Exemple :
31 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Distribution des salaires mensuels de départ d’un échantillon de 12 diplômés d’une école de
commerce.
Pour calculer le salaire initial médian des 12 jeunes diplômés, il faut ordonner les 12
observations du tableau par ordre croissant :
3310 ; 3355 ; 3450 ; 3480 ; 3480 ; 3490 ; 3520 ; 3540 ; 3550 ; 3650 ; 3730 ; 3925
N = 12 (est paire), d’où N = 2q et q = 6. Les deux valeurs centrales sont : x6 = 3490 et x7 =
3520. La médiane correspond à la moyenne de ces deux valeurs.

3490  3520
La médiane est : M e   3505 .
2

o Méthode graphique

Sur le graphe représentant les courbes cumulatives (croissante ou décroissante), on repère


sur l’axe des ordonnés N/2 (moitié de l’effectif total), on le projette sur la courbe cumulative
(croissante ou décroissante). L’abscisse correspondante est la médiane.

La médiane est aussi l’abscisse du point d’intersection des deux courbes cumulatives
(croissante ou décroissante)

Pour l’exemple 2 : «Taille des étudiants de 2BTS-RHCOM » on a :

N
2

 Cas des caractères continus (classes) :


La médiane correspond à 50% des effectifs cumulé (croissants ou décroissants) ou des
fréquences cumulées (croissantes ou décroissantes).

o Méthode de calcul

32 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

La médiane se calcule ici par interpolation linéaire en supposant que les effectifs sont
uniformément repartis dans la classe : on détermine la classe qui correspond à 50% des
effectifs cumulés croissants ; soit [a ; b[ cette classe (avec Me ϵ [a, b[). On repère F(a) :
effectif cumulé croissant au point a et F(b) effectif cumulé croissant au point b.

Me – a 50%N – F(a)
=
xi a Me b  b–a F(b) – F(a)
ni cumulés F(a) 50%N F(b)
croissants

Exemple :

Classes [0, 10[ [10, 50[ [50, 80[ [80, 100[ [100, 110[
ni 7 38 42 18 5
Effectifs cumulés 7 45 87 105 110
croissants

N = 110 => N/2 = 55

xi 50 Me 80
ni cumulés 45 55 87 Me – 50 55 – 45
=  Me = 57.14
croissants 80 – 50 87 – 45

o Méthode graphique

La méthode graphique reste inchangée

Remarques :

La moyenne est la mesure de tendance centrale la plus souvent utilisée, cependant dans
certaine situation on lui préfère la médiane. La moyenne est en effet influencée par les
valeurs extrêmement petites et extrêmement grandes. Par exemple, supposez que l’un des
diplômés ait un salaire initial 10 000 $ par mois. Si l’on modifie le salaire initial le plus élevé
du tableau (3925 $), par 10 000 $. La moyenne passe de 35540 à 4046 $. Par contre, la
médiane égale à 3505 $, demeure inchangée. La médiane ici fournie ici une meilleure mesure
de tendance centrale que la moyenne.

D’une façon générale, lorsqu’un ensemble de donnée contient des valeurs extrêmes, la
médiane est souvent une mesure préférable de la tendance centrale.

2-2 Caractéristiques de dispersion


2-2-1 Nécessité de l’utilisation des caractéristiques de dispersion : Analyse de 2 séries
Considérons les salaires horaires accordés à leurs ouvriers par les entreprises A et B. les
salaires exprimés en centaines de francs, sont rangés en ordre croissant :

8  8 . 10  8 . 40  8 . 60  9
Entreprise A : X : 8 ; 8.10 ; 8.40 ; 8.60 ; 9 => x   8 . 42 ; Me = 8.40
5

33 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

7  7 . 80  8 . 40  9 . 20  9 . 70
Entreprise B : Y : 7 ; 7.80 ; 8.40 ; 9.20 ; 9.70 => y   8 . 42 ; Me = 8.40
5

Constats

Les deux séries ont la même moyenne 8.42 centaine de Frs et la même médiane 8.40
centaine de Frs, donc ont les mêmes caractéristiques centrales. Il faut cependant noter que
les salaires n’ont pas la même homogénéité ; les salaires de l’entreprise B s’éloignent plus de
la moyenne que ceux de l’entreprise B.
Cet exemple montre que, les paramètres de tendance centrale sont insuffisantes pour
caractériser une série statistique, il est donc nécessaire de les compléter par des paramètres
de dispersion qui permettrons de mesurer les dispersions et de comparer les distributions.
Les principales caractéristiques de dispersion étudiées sont : l’étendue (intervalle de
variation ou range), les quartiles (moyennes de position conduisant à l’intervalle interquartile),
l’écart moyen et l’écart-type.

2-2-2 Etendue
 Cas des caractères discrets (isolés)
L’étendue est la différence entre la plus grande et la plus petite valeur du phénomène
observé : E  max( x i )  min( x i )

Exemple :

Considérons l’exemple précédent :

- L’étendue de l’entreprise A : EA = 9 – 8 = 1

- L’étendue de l’entreprise B : EB = 9.7 – 7 = 2.7

On constate que les salaires horaires accordés par l’entreprise B sont beaucoup plus étalés,
dispersés que les salaires accordés par l’entreprise A.

 Cas des caractères continus (classes)


L’étendue peut aussi se calculer à partir des classes statistiques :

Soit b1, 1 = la borne inférieure de la 1ère classe statistique (celle contenant les plus faibles
valeurs observée) et b2, k = la borne supérieure de la dernière classe statistique (celle
contenant les plus fortes valeurs observées) :

E  b 2 , k  b1 , 1

Ce calcul peut également se faire à partir des amplitudes des classes statistiques (ai)
formant une partition dans la distribution statistique
k

E   a i (k = nombre de classes).
i 1

34 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

NB

Pour un intervalle b1, k ; b 2 k 

- 1er indice : l’indice 1 indique la borne inférieure et l’indice 2, la borne supérieure de


l’intervalle (de la classe)

- 2ème indice : k le rang de l’intervalle (de la classe).

Exemple :

Répartition de clientèle d’après deux chiffres d’affaires annuels consécutifs : CA et CA’ (en
milliers de francs)
CA’ [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20[ Total
CA
[0 ; 5[ - 1 2 1 4
[5 ; 10[ 1 3 3 2 9
[10 ; 15[ 2 4 5 - 11
[15 ; 20[ - - - 1 1
Total 3 8 10 4 20

 Pour CA : b1,1 = 0 ; b2,4 = 20 => E= 20 – 0 = 20 milliers Frs


 Pour CA’ : a1+ a2+ a3+ a4 = 5 (amplitude des classes) => E = 5 + 5 + 5 + 5 = 20 (milliers
de Frs)

Remarque :

L’étendue ou range ne donne qu’une notion insuffisante de la dispersion, de plus elle ne


dépend uniquement que de valeurs extrêmes observées qui elles même peuvent avoir été
obtenues accidentellement.

2-2-3 Les Quantiles


 Définition : quantiles
D’une manière générale, en statistique et en théorie des probabilités, les quantiles sont les
valeurs qui divisent un jeu de données en intervalles contenant le même nombre de données.
Ainsi les quartiles sont trois quantiles qui divisent un ensemble de données en quatre groupe
de taille identique.

On appelle quantile d’ordre α%, noté Q  la valeur xi du caractère telle que α% des valeurs
observées soient inférieures strictement à xi. Si F désigne la fonction fréquence cumulée
croissante, alors : F Q     .
100

 Les Quartiles
Définition

Les quartiles sont des paramètres partageant une distribution statistique en quatre parties
égale, du point de vue des effectifs classés : chacune des parties contient donc 1/4 soit 25%
de l’effectif total (ou somme des fréquences absolues).

Nous distinguons 3 quartiles : Q1, Q2 = Me, Q3.

35 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Calcul

Pour partager un ensemble borné en 4 parts, il faut procéder comme suit : soit N, l’effectif
total :

Les quartiles se calculent comme la médiane :

- Q1 : 1re quartile (quantile d’ordre 25%) : est la variable qui correspond à 25% des valeurs observées
et signifie que 25% des effectifs cumulés croissants (ou des observations) sont inférieurs à Q1 ;
- Q2 est le 2ème quartile (quantile d’ordre 50%) : est la variable qui correspond à 50% des valeurs
observées et signifie que 50% des effectifs cumulés croissants (ou des observations) sont
inférieurs à Q2. Q2 = Me (médiane)
- Q3 est le 3ème quartile (quantile d’ordre 75%) : est la variable qui correspond à 75% des valeurs
observées et signifie que 75% des effectifs cumulés croissants (ou des observations) sont
inférieurs à Q3.

Graphique

Les quartiles se déterminent graphiquement comme la médiane.


Graphiquement, on se sert du polygone des effectifs des effectifs cumulés croissants ou
décroissant qu’on divise en quatre parts égales.

75
100 N

50
100 N

25
100 N

Intervalle (écart) interquartile

A partir des valeurs des quartiles Q1 et Q3 on peut calculer :

- L’écart interquartile absolu : Ia  Q 3 Q1 ;


A partir de Q1, Q2, Q3 l’écart interquartile absolu (Ia) ne permet pas des comparaisons avec
d’autres distributions statistiques exprimées à partir d’unités de mesure différentes. Les
comparaisons peuvent être réalisées grâce à l’écart interquartile relatif.

Q3 Q1 Q3 Q1 Ia
- L’écart interquartile relatif : Ir   
Q2 Me Me

36 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Remarque
Lorsque I r diminue, cela peut provenir d’une diminution de I a ou /et d’une augmentation de
la médiane Me (et vice-versa pour une augmentation de I r ).

 Les déciles
Les déciles sont des séparateurs d’une distribution statistique en dixièmes. Ils sont au
nombre 9 déciles : D1, D2, …, D9 et correspondent respectivement à 10%, 20%, …, 90% des
ième
1 
effectifs cumulés croissants. Entre deux décile successifs figurent   de l’effectif N
 10 
N
des observations statistiques : .
10

Les déciles se déterminent comme la médiane.


Les écarts interdéciles se calculent à partir de deux déciles symétriques par rapport à D 5
(soit D i et D 10 i ).
90 10 80
L’écart le plus significatif est le 1er I 1, 9  D 9  D 1 , représentant    80 %
100 100 100

I 1, 9  80 %
I 2,8  60 %
I 3, 7  40 %
I 4, 6  20 %

Lorsque I 1, 9 a une valeur élevée, cela signifie que les informations sont très dispersées.

Remarque :

Il existe en plus des quartiles et des déciles, des centiles.

2-2-4 L’écart absolu moyen


L’écart e i représente la différence entre la valeur d’une observation x i et la moyenne
arithmétique x des valeurs des observations : e i  x i  x
L’écart absolu moyen d’une série est la moyenne des valeurs absolues des écarts à la
n
1
moyenne : em 
N
n i 1
i
xi x

2-2-5 Variance
2-2-5-1Définition

37 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Trois cas de calcul possible :

- Cas de variables non pondérées


Considérons la série de nombres suivants : x1, x2, …, xp de p variables non pondérées.

p p
1 1
v( x)   x2 
N
( x
i 1
i
 x )2 
N
x i 1
2
i
 x2

- Cas de variables pondérées


Considérons la série de nombres suivants : x1, x2, …, xp et d’effectifs respectifs n1, n2, …, np
(variables pondérées)

p p p
1 1
v( x)   x2 
N
n ( x
i 1
i i
 x )2 
N
n x
i 1
i
2
i
 x 2 ; avec N   ni
i 1

- Cas de séries classifiées et pondérées


Classes Centre des classes Effectifs
ci ni
[x1, x2[ c1 n1
… ... …
[xp, xp+1[ cp np
total p classes n

On affecte à ces effectifs, les centres des classes (milieu des classes) ; avec pour un
xi  x i 1
intervalle [xi, xi+1[ le centre de la classe est c i 
2
p p p
1 1
v( x) x 2

N
n (c
i 1
i i
 x)  2

N
n c
i 1
i i
2
 x ; avec
2
N   ni
i 1

2-2-5-2Propriétés
Etant donné des nombres réels a et b, n nombres xi, on déduit pour tout i, les nombres yi par
yi  ax i  b  V ( ax  b )  a 2V ( x ) et  ( ax  b )  V ( ax  b)  a  ( x)

2-2-6 Ecart-type
La racine carrée de la variance est par définition l’écart type ; on le note σ(X) ou σx ou σ.
 ( x)  V ( x)

38 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

STATISTIQUE DESCRIPTIVE
-----------
Chapitre LES DISTRIBUTIONS
4 STATISTIQUES A DEUX CARACTERES
(SERIES STATISTIQUES A DEUX VARIABLES)

Sommaire
Introduction
1- Généralités
1-1 Les tableaux de distributions
1-2 Les représentations graphiques d’une série double non pondérée
2- Calcul des valeurs caractéristiques
2-1 Cas d’une série double simple
2-2 Cas d’une série double pondérée : tableau de contingence
2-3 Les distributions conditionnelles
3 Corrélation et Ajustement
3-1 Ajustement
3-2 Corrélation

Introduction
Dans les chapitres précédents, les distributions statistiques étudiées portaient sur un seul
caractère, que l’on observait sur chacune des unités statistiques composant la population. Il
arrive cependant que dans certains cas, l’on est amené à étudier sur une même population,
plusieurs caractères différents ; c’est le cas lors de l’étude des phénomènes économiques, il
est courant d’avoir affaire à plus d’une variable statistique (on parle alors d’analyse
statistique multivariée) : pour chaque observation, on recueille plusieurs informations. Ceci
complique énormément la construction des tableaux statistiques et la production de
graphiques résumant ces études.
Nous nous contenterons, dans ce chapitre, d’étudier les séries à deux variables (analyse
statistique bivariée).

Exemple :
Unité statistique Variable 1 désigné par Variable 2 désigné par
X y
Enfant d’une école Taille Poids
On étudie ensuite les variations simultanées des deux caractères x et y.

1- GENERALITES
1-1 Les tableaux de distributions (tableaux croisés ou tableaux de contingence)
Lorsque l'on étudie simultanément deux séries statistiques sur une population, on présente
les résultats sous la forme d'un tableau à double entrée appelé tableau croisé ou tableau de
contingence. Les deux variables étudiées peuvent être qualitatives ou quantitatives.

Soient X et Y, deux variables quantitatives ou qualitatives, ayant comme modalités


respectives xi (avec i {1...n}) et yj (avec j {1...p}), étudiées sur une population P. Les
39 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

n ij n ij
nij (fréquences absolues) nombre d'individus (ou f ij  n p
 : fréquences relatives),
N
 n
i 1 j 1
ij

trouvés après comptage et ayant simultanément la modalité xi et la modalité yj ; tous ces


éléments peuvent être regroupés dans un tableau croisé (tableau de contingence) de la
forme :
j y1 ... yp Total marginal
i
p

x1 n11 ... n1p n


j 1
1j
 n 1

. . ... . .
. . ... . .
. . ... . .
p

xn nn1 ... nnp n


j 1
nj
 n n
i n i n

Total
marginal
i 1
n i1  n 1 ... n
i 1
ip
 np N
(total général)

Les tableaux croisés sont les résultats de comptages dans une population P, de taille N,
étudiée suivant deux variables X et Y. On dit que l'on étudie la distribution statistique du
couple (X, Y).

Exemples :

o Cas des caractères qualitatifs


On s'intéresse au nombre d'étudiants par UFR dans une université pour chacun des
trois cycles en 2018 :
er ième ième
Y="Cycles" 1 Cycle 2 Cycle 3 Cycle Total
X="UFR" marginal
Mathématiques 924 409 50 1383
Sciences Economiques 1168 772 257 2197
Géographie 102 386 227 715
Droit 3518 1596 625 5739
Total marginal 5712 3163 1159 10034
Si on donne un numéro d’ordre aux UFR repéré par la lettre i (avec i = 1, 2, 3, 4) et un numéro d’ordre
aux cycles de formation repéré par lettre j (avec j = 1, 2, 3) et en reprenant le tableau précédent on
obtient :
j 1 2 3 Total
i marginal
1 j 3

n11 = 924 n12 = 409 n13 = 50 n


j 1
1j
 n 1   1383

2 n21 = 1168 772 257 j 3

n
j 1
2j
 n 2   2197

3 n31 = 102 386 227 715


4 n41 = 3518 1596 625 5739

40 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Total i 4 i 4

marginal n i 1
i1
 n 1 n
i 1
i2
 n 2 10034

n.1 = 5712 n.2 = 3163 n = 1159

A l’intersection d’une ligne i et d’une colonne j se trouve le nombre d’étudiants nij (fréquences
n ij n ij
absolues) ou f ij  n p
 (fréquences relatives)
N
 n
i 1 j 1
ij

Dans le tableau ci-dessus :


n p

 la population totale est N   n ij  10034 ;


i 1 j 1

 le chiffre n11= 924 correspond au nombre d'étudiants en Mathématiques et au premier


cycle ; n23= 257,... .
 On peut par exemple, calculer les sommations :
j 3

924  409  50  n 11  n 12  n 13   n 1j  n 1  1383


j 1

Le nombre d’étudiants en UFR de Mathématique (tous les cycles confondus) :

(la somme porte sur le 2nd indice de nij, le 1er indice restant égal à 1).

 Les étudiants au 1er cycle (toutes disciplines confondues) :


i 4

924 + 1168 + 102 + 3518 = n 11  n 21  n 31  n 41   n i1  n 1  5712


i 1

(la somme porte sur le premier indice de nij, le deuxième indice restant égal à 1).

o Cas des caractères quantitatifs (continus)


Répartition du groupe d’élèves d’après leur âge et leur taille

Ages

(en années) [14 – 15[ [15 – 16[ [16 – 17[ [17 – 18[ Totaux marginaux

Tailles (cm)

[150 – 155[ 2 1 - - 3

[155 – 160[ 3 4 1 1 9

[160 – 165[ 4 5 5 2

[165 – 170[ 4 8 13 3

41 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

[170 – 175[ 1 4 5 4

[175 – 180[ - 1 3 6

[180 – 185[ - - - 2

Totaux marginaux 18

Interprétation :

- 2 élèves, âgés de 14 ans à moins de 15 ans, mesurent au moins 150 cm et moins de 155
cm.
- 16 élèves mesurent au moins 160 cm et moins de 165 cm (l’âge des enfants n’est pas
pris en considération ici)
- 18 élèves ont moins de 17 ans et moins de 18 ans (ici leur taille n’est pas prise en
considération)

Remarque

La série statistique double peut être lue sous la forme de deux groupes de séries statistiques
simples (chacune portant sur une seule variable). Pour notre exemple :

- Les colonnes du tableau donnent la répartition des élèves selon le caractère ‘’taille’’, les
âges étant connus ;
- Les lignes du tableau donnent la répartition des élèves selon le caractère ‘’âge’’, la taille
étant connue.

- Il existe des de croisés où les couples de modalités (xi, yi) ont des effectifs égaux à 1, on
les appelle tableau statistique croisé simple et se présente sous cette forme :

Caractère : X x1 x2 x3 . . . . . . xn

Caractère : Y y1 y2 y3 . . . . . . yn

1-2 Les représentations graphiques d’une série statistique double


1-2-1 Cas des caractères qualitatif
 bandes comparées
Les graphiques à bandes comparées permettent des comparaisons dans le temps ou dans
l’espace)

 Application
Sondage auprès de 1000 ménagères sur leur préférence pour une poudre à lessive (5 régions
x 200 ménagères)

42 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

1-2-2 Cas des caractères quantitatifs


 Définition : nuage de points
Il s'agit d'un graphique qui représente les observations simultanées de deux variables
quantitatives. On considère deux axes perpendiculaires, l'axe horizontal représente la
variable X et l'axe vertical la variable Y, puis on représente chaque individu observé i par le
point d'abscisse xi et d'ordonnée yi. L'ensemble de ces points donne en général une idée
assez bonne de la variation conjointe des deux variables et est appelé nuage de points (ou
diagramme de dispersion).

 Application1 : Nuages de points non pondérés


Dans un repère orthogonal, on associe le couple (xi, yi) de la série statistique double au point
Mi de coordonnées xi et yi.

Exemple1: Société COREL – 1er semestre 2020

Exemple2

Au cours de l’examen du BTS dernier, pendant la composition de l’épreuve d’étude de cas


censé durée 4 heures, on a relevé la durée de composition (c’est-à-dire au bout de combien
de temps chacun a rendu sa copie) et la note (sur 20) des 12 étudiants qui se sont présentés.

43 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Le nuage de points correspondant figure sur le schéma ci-dessous.

Le point moyen du nuage est le point (noté habituellement G) dont les coordonnées sont les
moyennes marginales de la série : G ( x , y )

 Application2 : Nuages de points pondérés


Les points du nuage d’observations sont pondérés par des fréquences absolues. Le nuage
est représenté dans un système de coordonnées (Ox, Oy). Les points sont représentés par
des cercles de surface proportionnelle à la fréquence d’observation correspondante,
cependant l’unité de mesure du rayon d’un cercle peut être différente de celle des axes Oy et
Ox. Les coordonnées des points du nuage sont égales à celles des centres des cercles
tracés.

Exemple1

Considérons la série statistique ci-dessous

yj [90 ; 110[ [110 ; 130[ [130 ; 150[

xi

[0 ; 10[ 4 1 1

[10 ; 20[ 2 6 2

44 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Exemple2

On interroge 40 foyers sur leurs équipements automobile et audiovisuel (nombre de voitures


et d’écrans de télévision et d’ordinateur) en leur possession. Les résultats obtenus sont
donnés dans le tableau de contingence ci-après.

Le nuage de point de cette série précédente

2- CALCULS DE VALEURS CARACTERISTIQUES D’UNE SERIE STATISTIQUE


DOUBLE : Moyenne, variance et écart-type

2-1 Cas d’une série double non pondérée (tableau simple)


Dans cette partie les couples de modalités (xi, yi) ont des effectifs égaux à 1. Le tableau
statistique est de la forme :

X Y

x1 y1

x2 y2

. .

45 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

. .

. .

. .

xn yn

Remarque :

Dans le cas de variables continues, on remplace les xi et yi par le centre des classes

2-1-1 Moyenne
1
n
x1  x 2  ...  x n 1
n
y1  y 2  ...  y n
X 
n
x i 1
i

n
et Y 
n
yi 1
i

n

X Y

(en m2) (en milliers de dollars)

20 250

60 400

90 600

140 1000

160 1300

5 5

. i 1
xi  . y
i 1
i

5 5
1 1
X 
5
xi 1
i
 Y 
5
y i 1
i

2-1-2 Variance

1
n
( x1 X )
2
 ( x2  X )
2
 ...  ( x n  X )
2

X   x
2
V (X )
2
i
X  
n i 1 n

1
n
( y1 Y )
2
 ( y2 Y )
2
 ...  ( y n  Y )
2

 Y  y
2
V (Y )
2
i
Y  
n i 1 n

X Y
( xi X ) ( xi X )
2
yi Y  yi Y 
2

x1 y1

x2 y2
46 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

. .

. .

xn yn

n n

 y
2 2
x i X  i
Y 
i 1 i 1

n n
1 1
ou bien   X2  x X et   Y2  y Y
2 2 2 2
V (X ) i
V (Y ) i
n i 1 n i 1

X Y 2 2
xi yi

x1 y1

x2 y2

. .

. .

xn yn

n n

 y
2 2
xi i
i 1 i 1

2-1-3 Ecart-type

( x1 X )
2
 ( x2  X )
2
 ...  ( x n  X )
2

X  V (X )  et
n

( y1 Y )
2
 ( y2 Y )
2
 ...  ( y n  Y )
2

Y  V (Y ) 
n

n n
1 1
X   X X  y Y
2 2
ou bien xi
2
et i
2

n i 1 n i 1

2-1-4 Covariance
n
1
Cov ( X , Y )   XY 
n
 x
i 1
i
X  y i Y 

xi yi xi X yi  ( xi  )( y i   )

47 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

x1 y1

xn yn

(x
i 1
i
 )( y i   )

n
1
ou bien Cov ( X , Y ) 
n
xi 1
i
yi  X .Y

X  xi Y  yi xi
2
yi
2
xi y i

2 2
x1 y1 x1 y1 x1 y 1

. . . . .

. . . .

2 2
xn yn xn yn xn yn

n n n n n

    x
2 2
xi yi xi yi n
yn
i 1 i 1 i 1 i 1 i 1

2-1-5 Application
On souhaite étudier la relation superficie-prix de 5 appartements dans une grande ville ;

La variable quantitative X désigne la surface en m2, et la variable quantitative Y le prix de


vente en milliers de dollars. Le tableau suivant donne les valeurs de ces deux variables, pour
les 5 appartements:

Calculons :

1) Les moyennes de X et de Y ;
2) Les variances de X et de Y (de deux manières) ;
3) La covariance du couple (X, Y) (de deux manières).

Résolution

1) Calcul des moyennes :


xi yi

20 250

60 400

48 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

90 600

140 1000

160 1300

n n

x
i 1
i
 470 y
i 1
i
 3550

5 5
1 1 1 1
X 
5
 i 1
xi 
5
( 470 )  94 ; Y 
5
yi 1
i

5
( 3550 )  710 .

2) Calcul des variances

xi xi X ( xi X )
2
yi yi  ( yi  ) 2

20 -74 5476 250 -460 211600

60 -34 1156 400 -310 96100

90 -4 16 600 -110 12100

140 46 2116 100 290 84100


0

160 66 4356 130 590 348100


0

5 5

(x i
 ) 2  13120 ( y
i 1
i
  ) 2  752000
i 1

5
1 1
 V (X )  X   x
2
2
i
X   (13120 )  2624
5 i 1 5

5
1 1
   2   y
2
V (Y ) i
Y   ( 752000 )  150400
5 i 1 5

3) Calcul des écart-types

xi yi xi X yi  ( xi  )( y i   )

20 250 -74 -460 34040

60 400 -34 -310 10540

90 600 -4 -110 440

140 1000 46 290 13340

160 1300 66 590 38940


49 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

(x
i 1
i
 )( y i   )  97300

5
1 97300
Cov ( X , Y ) 
5
 x
i 1
i
X  y i Y  
5
 19460

2-2 Cas d’une série double pondérée (tableau de contingence)


2-2-1 Définitions : tableau de contingence – distributions marginales

Y = yj

y1 y2 ... yp Total marginal

X= xi

x1 n11 n12 ... n1p n


j 1
1j
 n 1

. . . ... . .

. . . ... . .

. . ... . .
.

xn nn1 nn2 ... nnp n


j 1
nj
 n n

i n i n

Total n
i 1
i1
 n 1 ... n
i 1
ip
 np N

marginal (total général)

De ce tableau on peut établir les distributions marginales suivantes :

Les distributions marginales d'un couple de variables (X, Y) sont les distributions statistiques

50 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

à une variable telle que : (xi, ni) et (yj, nj) avec i {1...n} et j {1...p}. Il existe deux distributions
marginales pour le couple (X, Y). Les distributions marginales peuvent aussi être exprimées
en fonction des fréquences relatives marginales : (xi, fi) et (yj, fj)

Modalités de X x1 ... ... xn Total

Effectifs ou n 1 ... ... n n n

n
i 1
i
 N
fréquences absolues

Effectifs relatifs ou fréquences f1 ... ... fn n

f
i 1
i
1

Distribution marginale de la variable X

Modalités de Y y1 ... ... yp Total

Effectifs ou n 1 ... ... np p

nj 1
j  N
fréquences absolues

Effectifs relatifs ou fréquences r f1 ... ... fp p

fj 1
j 1

Distribution marginale de la variable Y

La somme des fréquences relatives des deux distributions marginales X et Y est égale à 1.

Considérons les distributions marginales précédentes :

 la variable X : (xi, pi.)


n n n n n
ni 1
Les fréquences relatives : i 1
fi 
i 1 N

N
i 1
n i  or 
i 1
ni  N => f
i 1
i
1

n i  est l’effectif marginal de X (effectif total en ligne) et f i  la fréquence marginal de X

(Fréquence totale en ligne)

51 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

 la variable Y : (yi, fj.)


p p
n j 1
p p p

Les fréquences relatives : 


j 1
f j 
j 1 N

N

j 1
n  j Or 
j 1
n j  N => 
j 1
f j 1

n  j est l’effectif marginal de Y (effectif total en colonne) et f  j la fréquence marginale de X

(Fréquence total en ligne).

2-2-2 Calcul des caractéristiques des séries marginales


 Moyenne :
n n
1
X 
N

i 1
ni xi 
i 1
fi xi (Moyenne de X)

p p
1
Y 
N
n j 1
j y j

j 1
f j y j
(Moyenne de Y)

 Variance
n n
1
  X2   
2 2
V (X ) n i  x i X  f i  x i X  ou
N i 1 i 1

n n
1
V (X ) 
N
 i 1
ni xi
2
X 2

i 1
fi xi
2
X 2

p p j s j s
1
 
1
  Y2   
2 2
V (Y ) n j y j
Y  f j y j
Y  ou V ( Y )  n j y
2
j
Y 2
f j y
2
j
Y 2

N j 1 j 1 N j 1 j 1

 Covariance
n p
1 n


1
Cov ( X , Y )   XY 
N i 1
n ij  x i X  y j
 Y  ou Cov ( X , Y )   XY 
N
 n
i 1 j 1
ij
xi y j  XY

Remarque :

Dans le cas de variables continues, xi et yj correspondent respectivement au centre des


classes de X et Y.

2-2-3 Application
Exemple1

Considérons le tableau de contingence (tableau des fréquences relatives ou loi conjointe)

suivant :

52 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

ème
Y="Cycles" 1er Cycle 2 Cycle 3i ème Cycle Total

X="disciplines"

Mathématiques 0,092 0,041 0,005 0,138

Sciences Economiques 0,116 0,077 0,026 0,219

Géographie 0,010 0,038 0,023 0,071

Droit 0,351 0,159 0,062 0,572

Total 0,569 0,315 0,116 1

1) Interpréter : la 1ère ligne ; la 1ère colonne ; le croisement de la 3ème ligne et de la 1ère


colonne.
2) Etablir la loi marginale de X, la loi marginale de Y.
NB : Le de variable est ici est qualitative.

Résolution

1) Interprétations
 13,8% des étudiants fréquentent l'UFR de Mathématiques (marge X = disciplines),
 56,9% des inscrits le sont en 1er Cycle (marge Y = cycles),
 35,1% des inscrits le sont en 1er Cycle et en Droit.
1) Les lois marginales de X et de Y
 Loi marginal de X
L’ensemble des couples {(Mathématiques, 1383), (Sciences Economiques, 2197),
(Géographie, 715), (Droit, 5739)} forme la distribution marginale de la variable qualitative X
"UFR")

Modalités de Effectifs ou Effectifs relatifs ou

X fréquences fréquences relatives

absolues

Mathématiques n1. = 1383 f1. = 0.138

Sciences Economn2. = 2197 f 2. =

Géographie n3. = 715

Droit n4. = 5739

Total N = 10034 f.. = 1

53 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Distribution marginale de la variable qualitative X "UFR’’

 Loi marginal de Y
L'ensemble des couples {(1erCycle, 5712), (2ième Cycle, 3163) (3ièmeCycle, 1159)} forme la
distribution marginale de la variable qualitative Y "cycles d'études" ,

Modalités de Effectifs ou Effectifs relatifs ou

Y fréquences fréquences relatives

absolues

Total

Distribution marginale de la variable qualitative Y "cycles d'études"

Exemple 2

Considérons les distributions de fréquences des couples (X, Y) où les variables X = "note en
statistique" et Y = "note en mathématique" :

modalité 1 modalité 2 modalité 3 modalité 4

Y classe 1 classe 2 classe 3 classe 4

[0,5[ [5,10[ [10,15[ [15,20]

centres Total

X de y1=2,5 y2=7,5 y3=12,5 y4=17,5 ou Marge

classes

modalité 1 j 4

n 1   n1 j =14
classe 1 x1=2,5 n11= 7 n12= 6 n13= 1 n14= 0 j 1

[0,5[
54 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

modalité 2 j 4

n2   n 2 j =12
classe 2 x2=7,5 n21= 4 n22= 3 n23= 2 n24= 3 j 1

[5,10[

modalité 3 j 4

n 3   n 3 j =11
classe 3 x3=12,5 n31= 0 n32= 7 n33= 3 n34= 1 j 1

[10,15[

modalité 4 j 4

n4   n 4 j =13
classe 4 x4=17,5 n41= 0 n42= 1 n43= 5 n44= 7 j 1

[15,20]

Total i 4 i 4 i 4 i 4

n 1   ni 1 n 2   n i 2 = n 3   n i 3 n 4   n i 4 =
ou i 1 i 1 i 1 i 1 N=50

Marge

n p

 n
i 1 j 1
ij
xi y j
 ni1xiy1+ ni2xiy2+ ni3xiy3+ ni4xiy4 = n1jx1yj + n2jx2yj + n3jx3yj + n4jx4yj

n p

  ni 1 j 1
ij
xi y j
 (n11x1y1 + n21x2y1 + n31x3y1 + n41x4y1) + (n12x1y2 + n22x2y2 + n32x3y2 + n42x4y2)+

(n13x1y3 + n23x2y3 + n33x3y3 + n43x4y3) + (n14x1y4 + n24x2y4 + n34x3y4 + n44x4y4)


n p

 n
i 1 j 1
ij
xi y j
 [(n11x1 + n21x2 + n31x3 + n41x4)y1 + (n12x1 + n22x2 + n32x3 + n42x4)y2 + (n13x1 +

n23x2 + n33x3 + n43x4)y3 + (n14x1 + n24x2 + n34x3 + n44x4)y4]

Ou bien :

n p

  ni 1 j 1
ij
xi y j
 [(n11y1 + n12y2 + n13y3 + n14y4)x1 + (n21y1 + n22y2 + n23y3 + n24y4)x2 + (n31y1 +

n32y2 + n33y3 + n34y4)x3 + (n41y1 + n42y2 + n43y3 + n44y4)x4]

Loi marginale de X et loi marginale de Y

Modalités Effectifs ou Effectifs relatifs


de
Fréquences ou
X
absolues Fréquences

relatives

x1  2 .5 n 1  14 f 1 

55 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

x2  7 .5 n 2  12 Modalités de Effectifs ou Effectifs relatifs

Y Fréquences ou
x3  12 . 5 n 3  11
absolues Fréquences

x4  17 . 5 n 4  13 relatives

Total 4
y1  2 .5 n 1  f 1 
n
i 1
i
 N  50

y2  7 .5 n 2 

y3  12 . 5 n 3 

y4  17 . 5 n 4 

Total 4

n
j 1
j  N  50

Distribution marginale de la variable quantitative X Distribution marginale de la variable quantitative Y

Calculer pour cet exemple :

1)  ; 
2) La covariance du couple (X, Y)

2-3 Les distributions conditionnelles


La notion de série conditionnelle est essentielle pour comprendre l’analyse de la régression.

Un tableau de contingence se compose en autant de séries conditionnelles suivant chaque


ligne et chaque colonne.

Y = yj

y1 y2 ... yp

X= xi

x1 n11 n12 ... n1p

. . . ... .

. . . ... .

. . . ... .

xn nn1 nn2 ... nnp

2-3-1 Définition
Une distribution conditionnelle est une distribution statistique obtenue en restreignant la
population à un évènement particulier ; par exemple pour une distribution qui possède :

56 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

- n nombre de modalités de X : il y a n distributions conditionnelles de X par rapport à Y et


- p nombre de modalités de Y : il y a p distributions conditionnelles de Y par rapport à X.
le tableaux de contingence précédent nous donne les tableaux marginaux conditionnels
suivant :

Modalités de x1 .. xi .. xn Total

fréquences n1 j n ij n nj n j

absolues .. ..

fréquences n
1j
n
ij
n
nj
f  f  f 
1/ j n i / j n n/ j n
j  j  j
relatives 
.. .. 1

Distributions conditionnelles de la variable X lorsque Y = yj

Modalités de y1 ….. yj …. yp Total

fréquences n i1 ….. n ij ….. n ip ni


absolues

fréquences n n n
i1 ij ip
f  f  f 
1/i n j /i p /i
relatives i …… n
i ….. n
i 1

Distributions conditionnelles de la variable Y lorsque X = xi

Exemple: ‘’Etude d’une entreprise de 200 salariers’’ (tableau de contingence)

Dans une entreprise de 200 salariés, on étudie les variables X=âge et Y=salaires.

Y = Salaire

[800 ; 1000[ [1000 ; 1200[ Total marginal

X = Age

[20 ; 22[ 14 6 20

[22 ; 24[ 28 46 74

[24 ; 26[ 20 86 106


57 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Total marginal 62 138 200

 n = 2 : il y a deux distributions conditionnelles de X par rapport à Y :


- la distribution de X sachant Y ϵ [800; 1000[.
- la distribution de X sachant Y ϵ [1000; 1200[.
 p = 3 : il y a trois distributions conditionnelles de Y par rapport à X
- la distribution de Y sachant X ϵ [20; 22[.
- la distribution de Y sachant X ϵ [22; 24[.
- la distribution de Y sachant X 2 [24; 26[.

2-3-1 Série conditionnelle par rapport à X : X sachant Y (X/Y)


La fréquence conditionnelle de la modalité xi (du caractère X) par rapport à la modalité yj (du
caractère Y), notée X/yj (ou Xj) est la série conditionnelle de X sachant que Y = yj .

Nous calculons dans ce cas la fréquence conditionnelle f x i


(f xi sachant yj), pour i = 1, ...n,
y j

n ij f ij
par : f x  fi / j  f y  xi   
i
y j
j
n j f j

Il donne la proportion d’individus présentant la modalité xi parmi ceux qui présentent la


modalité yj ; on la qualifie d’ailleurs parfois de fréquence de xi sachant yj et on la note aussi
f(xi|yj ).

Exemple

Répartition des salaires des employés d’une grande entreprise, répartis par tranche d’âge :

58 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Déterminons la fréquence (proportion) d’employé sont l’âge est compris entre 45 et 55 ans
sachant qu’ils ont un salaire compris entre 900 et 1000 euro :

C’est la fréquence conditionnelle de [45 ; 55[ par rapport à la modalité 2([900 ; 1000[)

n 2, D 24
f2 (D )    0 . 064  6 . 4 %
n 2 377

2-3-2 Série conditionnelle par rapport à Y : Y sachant X (Y/X)


La fréquence conditionnelle de la modalité yj (du caractère y) par rapport à la modalité xi (du
caractère X) notée Y/xj (ou Yj), est la série conditionnelle de Y sachant que X = xi.

Nous calculons aussi dans ce cas la fréquence conditionnelle f y j


(fréquence de yj sachant
xi

n ij f ij
xi), pour j = 1, ... p, par : f y  f j /i  fx y j   
j
xi
i
ni fi

Il indique la proportion des individus présentant la modalité yj au sein du groupe de ceux qui
présentent la modalité xi. On le note aussi f (yj|xi ).

Exemple

En considérant le tableau précédent, la proportion d’employés dont le salaire est compris


entre 900 et 1000 euros parmi ceux de la tranche 45 – 55 ans est la fréquence conditionnelle
de 2 par rapport à C :

n 2, D 24
f D ( 2)    0 . 106  10 . 6 %
n , D 226

2-3-3 Valeurs caractéristiques des distributions conditionnelles


Pour chacune de ces distributions conditionnelles, lorsque les variables statistiques X et Y
sont quantitatifs, il est possible de calculer, les moyennes conditionnelles et les variances
conditionnelles.

59 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

2-3-5-1 La distribution (xi, nij) ou  x i , f i / j  à comme moyenne conditionnelle :


n n
1
 Moyenne : X j

n j
 i 1
n ij x i   fi / j xi
i 1
(j ϵ {1, …, p} : il y a p moyennes conditionnelles)

n n
1
 
2 2
 Variance : 2
sj X
 n ij  x i X j
 f i / j x i X j

n j i 1 i 1

2-3-5-2 La distribution (yj, nij) ou  y j , f j / i  à comme moyenne conditionnelle :


p p
1
 Moyenne : Y i 
ni
 j 1
n ij y j
  f j /i y j
j 1
(i ϵ {1, …, n} : il y a n moyennes conditionnelles)

p p
1
n  Yi    f j /i  y j  Yi 
2 2
 Variance : si2Y  ij
y j
ni j 1 j 1

Remarque :

n ij
-
N
 f ij avec  ni j
ij
 N

n ij n ij ni n ij ni
- f ij       f j /i  fi
N N ni ni N
n ij n ij n j n ij n j
- f ij       fi / j  f j
N N n j n j N
Nous avons de manière générale la relation : f ij  f j /i  fi  fi / j  f j

2-3-4 Application
Un sondage est effectué dans une société comprenant 40% de cadres et 60% d’employés. On
sait que 20% des cadres et 10% des employés de cette société parlent l’anglais.

1) On considère un groupe de 100 salariés. Compléter après l’avoir reproduit le tableau


suivant :

Nombre de salariés Nombre de salariés Total

parlant anglais ne parlant pas anglais

Nombre de cadres

Nombre d’employés

Total 100

2) On choisit un salarié au hasard parmi les 100. On a une situation d’équiprobabilité.


Calculer la fréquence (en %) de chacun des événements suivants :

2-1 E1 : « le salarié est un cadre sachant parler l’anglais » ;


2-2 E2 : « le salarier est un employé sachant parler l’anglais »
2-3 E3 : « le salarier sait parler l’anglais »

60 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

3- AJUSTEMENT AFFINE ET CORRELATION


3-1 Les ajustements
3-1-1 Généralités sur les nuages de points

Interprétation : Interprétation

Absence de liaison entre les deux variables. Le Il existe une liaison linéaire entre les deux
nuage de points forme une sorte de boule variables. Le nuage de points à la forme d'une
droite.

Interprétation : Interprétation :

Absence de liaison linéaire entre les deux Absence de liaison linéaire entre les deux
variables. Le nuage de points à la forme d'une variables. Le nuage de points à la forme d'une
parabole, la liaison est non linéaire. branche hyperbolique, la liaison est non linéaire.

3-1-2 Principe
Soit (xi, yi) une série statistique double, avec un nuage de points Mi (xi, yi) associé.

Lorsque les points du nuage paraissent presque alignés, on peut chercher une relation de la
forme y = ax + b qui exprime de façon approchée les valeurs de la série (yi) en fonction des
valeurs de la série (xi), autrement dit, une fonction affine f telle que l’égalité y = f(x) s’ajuste
au mieux avec les données.

Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près de tous les
points du nuage. Une telle relation permettrait notamment de faire des prévisions. Il existe
plusieurs méthodes pour obtenir un ajustement affine satisfaisant.

3-1-3 Méthode « au jugé »


Un des moyens de faire des prévisions est de tracer « au jugé » une droite (D) passant au
plus près possible des points d’un nuage et d’admettre que les xi et yi sont liés par l’équation :
y = ax + b de (D).

61 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Procédé : on utilise une règle transparente qu’on dispose suivant la direction constatée, de
façon à équilibrer les points de part et d’autre de la droite (D).

3-1-4 Ajustement affine par la méthode de Mayer


Etape 1: On commence par « découper » la série statistique double en deux sous-séries bien
distinctes, c’est-à-dire que l’on découpe le nuage de points Mi (xi, yi) en deux sous-nuages
distincts et de même effectif (ou presque : si l’effectif total est impair, on peut mettre le point
surnuméraire dans n’importe lequel des deux sous-nuages)

Etape 2 : On calcule les coordonnées des deux points moyens G1 et G2 associés à ces deux
sous nuages, et on place ces deux points sur le graphique.

Etape 3 : On trace la droite (G1 G2), appelée droite de Mayer du nuage de points Mi (xi, yi), qui
doit passer par le point moyen G du nuage de points Mi (xi, yi) .C’est cette droite qui
constitue un ajustement affine tout à fait acceptable pour la série double (xi, yi)

Exemple

Les derniers recensements de la population d’une ville ont abouti aux données suivantes :

Année 2013 2014 2015 2016 2017 2018 2019

Nbre d’années xi
1 3 7 10 12 14 17
Depuis 2012

Population yi
4.4 4.7 4.8 4.9 5.5 5.5 5.7
(en milliers d’habitant)

62 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

 Exercices
Exemple1

On étudie la liaison entre la consommation X (en millions de francs) et le revenu après


impôts Y des ménages d’un pays (en millions de francs), sur la période de 2009 à 2018 :

Années 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018

63 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

indice i 1 2 3 4 5 6 7 8 9 10 Total

Consommation yi 199 208 221 237 254 268 280 293 307 323 2590

Revenu xi 238 257 270 290 303 319 333 351 369 387 3117

Déterminer :

1) Tracer le nuage de points


2) La consommation moyenne sur la période
3) Le revenu moyen imposable sur la période
4) En déduire le point moyen G.
5) la droite de Mayer.

Exercice2

Les chiffres d’affaires de douze trimestres d’une entreprise ont donné après lissage le
tableau suivant rangé :

Rang du trimestre : xi Chiffre d’affaires

(en millions de francs) :yi

4 270

5 265

6 255

7 273

8 285

9 295

10 318

11 320

12 320

9 9

x i
 y
i 1
i

i 1

Déterminer la droite de Mayer (G1G2) :

On partage le nuage en deux nuage, l’un de cinq points, (1 ≤ xi ≤ 6) et l’autre de quatre points
(7 ≤ xi ≤ 12) ; les points moyens respectifs sont G 1 ( x1 , y 1 ) et G 2 ( x 2 , y 2 )

Remarque : en supposant que la tendance observée pendant les douze trimestres se


poursuive, on peut alors en déduire le chiffre d’affaires prévisionnel pour le trimestre suivant
64 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

(de rang 10)

3-1-4.1 Ajustement affine par la méthode des


moindres carrés
 Définition
On considère une série statistique à deux variables représentée par un nuage de points
(ensemble des points Mi) justifiant un ajustement affine :

Les points Pi sont les projections parallèlement à l’axe (Oy), des points Mi sur la droite (D)
d’équation y = ax + b (même abscisse que Mi). Les points Qi sont les projections
parallèlement à l’axe des abscisses des points Mi sur la droite (D’) d’équation x = a’y + b’
(même ordonnées que Mi).

On appelle méthode des moindres carrés la méthode qui consiste à rechercher les
coefficients a et b tels que la somme S  M   y i  ( ax i  b )  soit minimale
2 2
i
Pi
i i

ou a’ et b’ tels que S   M   x i  ( a y i  b )  soit minimale.


2 2
i
Qi
i i

Remarquons que S est une fonction des deux variables a et b.

 Les droites de régression


Les droites (D) et (D’) sont appelés les droites de régressions :

 xy
- (D) d’équation y = ax + b est appelée droite de régression de y en x où a 
x 2

et b vérifie : y  a x  b .

NB : la droite (D) passe par le point moyen G ( x , y ) du nuage.

 xy
- (D’) d’équation x’ = a’y + b’ est appelée droite de régression de x en y où a  
y 2

Et b’ vérifie : x  a y  b 

NB : la droite (D’) passe par le point moyen G ( x , y ) du nuage.

 Application
Les chiffres d’affaires de douze trimestres d’une entreprise ont donné après lissage le
65 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

tableau suivant rangé :

Rang du Chiffre
trimestre : d’affaires
xi2 yi2 xi yi
xi (en millions de
francs) :

yi

4 270

5 265

6 255

7 273

8 285

9 295

10 318

11 320

12 320

9 9 9 9 9

x
i 1
i
 y
i 1
i
 x
i 1
2
i
 y
i 1
2
i
 x y
i 1
i i

Déterminer les droites de régression (D) de y en x et (D’) de x en y

Remarque : en supposant que la tendance observée pendant les trimestres de rang 1 à 9 se


poursuive, on peut alors en déduire le chiffre d’affaires prévisionnel pour le trimestre suivant
(de rang 10).

3-2 Corrélation :
3-2-1 Notion de corrélation
Lorsque l'on désire étudier l'intensité de la liaison entre deux variables quantitatives on
adopte une approche qui permet de chiffrer l'ordre de grandeur de l'intensité de cette liaison.
On calcul pour cela le coefficient de corrélation linéaire.

Ce coefficient est un nombre sous dimension, il permet de mesurer l’intensité de la liaison


linéaire entre les deux variables X et Y. Son expression est donnée par :

66 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

 XY
 n ij
( xi X )( y j
Y )
 r XY  
i j
r
 X Y n i
( xi X )² n j (y j
Y )²
i j

Lorsque les nij = 1 ni. = 1 et n.j = 1, on aura :


 ( x i
X )( y j Y )  ( y j
 Y )( x i  X )
r  r XY  i j
 j i
 r XY  rYX
(x
i
i
X )² ( y
j
j
 Y )² ( y
j
j
 Y )² (x
i
i
X )²

Propriétés

 Le coefficient de corrélation rxy ϵ IR,


 rxy est du même signe que  
 xy  xy
 puisque a  et a      , a et a’ sont de même signe.
x 2
y 2

  1  r xy  1

3-2-2 Mesure de la corrélation


L'emploi du coefficient de corrélation linéaire n'est valable que si la relation entre X et Y est
linéaire. On peut donc dire que la signification de la valeur du coefficient de corrélation
linéaire dépend étroitement de la liaison linéaire entre X et Y :

On dit qu’il existe une bonne ou forte corrélation entre x et y lorsque |r| est suffisamment
voisin de 1.

o r 1 : signifie qu’il y a une forte corrélation linéaire entre X et Y ; il existe une liaison linéaire
indirecte entre les deux variables (c'est-à-dire quand la série X augmente la série Y
diminue et réciproquement),
o r 0 : signifie qu’il y a une faible corrélation linéaire entre X et Y ; il existe peut-être une
liaison non linéaire entre X et Y,
o r 1 : signifie qu’il y a une forte corrélation linéaire entre X et Y, il existe une liaison linéaire
directe entre les deux variables (c'est-à-dire que les séries X et Y augmentent ou
diminuent en même temps).

3-2-3 Interprétation graphique


Le coefficient de corrélation r est lié aux coefficients directeurs a de (D), droite de régression
de y en x, et 1/a’ de (D’), droite de régression de x en y.

Les deux droite (D) et (D’) passent par le point moyen G. Le coefficient de corrélation r donne
des indications sur l’angle des deux droites.
67 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

1
Si r = 1, alors aa’ = 1, donc a  
2

a
Les droites (D) et (D’) sont confondues, on dit que l’ajustement affine est « parfait »

D Droite de
régression de X en Y
Variable Y
Variable Y
D Droite de
régression de X en Y

Y
G point moyen G point moyen
Y

D Droite de
régression de Y en X
D Droite de régression
de Y en X

0 X Variable X 0 X Variable X

r=1 r = -1

(a > 0 et a’ > 0) (a < 0 et a’ < 0)

 Si |r| est proche de 1


Les deux droites (D) et (D’) sont « proches » l’une de l’autre ; on dit qu’il y a une « bonne
corrélation » entre les deux caractères.

D Droite de
régression de X en Y

Variable Y
D Droite de
D Droite de régression de Y en X
régression de Y en X
Variable Y

Y
G point moyen
G point moyen
Y
D Droite de
régression de X en Y

0 X Variable X 0 X Variable X

0  r 1 (r proche de 1) 1 r 0 (r proche de -1)

(a > 0 et a’ > 0) (a < 0 et a’< 0)

 Si r = 0
Les deux droite (D) et (D’) sont perpendiculaires ; on dit qu’il n’y a pas de corrélation linéaire
entre X et Y (ou il existe peut-être une liaison non linéaire entre X et Y)

68 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

D Droite de
régression de X en Y

Variable Y

G point moyen
Y
D Droite de
régression de Y en X

0 X Variable X

Remarque

Dans chaque secteur technologique ou économique, on choisit la valeur de r jugé suffisante pour
effectuer un ajustement affine par la méthode des moindres carrés. Ainsi d’un secteur technologique
à un autre les exigences peuvent varier 0.5 ≤ |r| ≤ 1 à 0.999 ≤ |r| ≤ 1…

4- AUTRES AJUSTEMEMENTS
On a recours à une forme d’ajustement lorsque le nuage de point ne semblent pas être
répartis le long d’une ligne droite; il en existe de nombreux, reposant sur différentes familles
de fonctions : les fonctions logarithmes, exponentielles, puissances, logistiques, etc.

4-1 Ajustement exponentiel


Pour les phénomènes à croissance forte ou à décroissance rapide, il peut être pertinent
d’approcher la forme générale du nuage par une fonction exponentielle de la forme
x  e ax  b ou x  e x   . Pour déterminer les valeurs de a et b, ou de α et β, on effectue
un ajustement affine (par exemple, par la méthode des moindres carrés) sur la série
( x i ; ln y i ) ou la série ( e x ; y i ) .
i

Exemple

Le tableau ci-dessous indique le salaire brut annuel, en milliers de francs, perçu par un haut
cadre.

Année 2005 2006 2007 2008 2009

Rang xi 1 2 3 4 5

De l’année

Salaire yi 42 900 54 200 64 100 81 600 102 000

(en milliers de Frs)

69 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

L’allure de cette courbe nous fait penser à une fonction exponentielle de la forme : x  e ax  b
ou x  e x   .

On peut donc procéder à un ajustement affine : ( x i ; ln y i ) ; voir paragraphe suivant.

4-2 Ajustement logarithmique


4-2-1 Représentation graphique en repère semi–logarithmique
Un repère semi-logarithmique est un repère dans lequel l’abscisse est mesurée
arithmétiquement, mais l’ordonnée est mesurée sur une échelle logarithmique décimale ou
népérienne.

Le repère semi-logarithmique permet de représenter des phénomènes qui croissent ou


décroissent de façon exponentiels. Ces graphiques facilitent certains ajustements non
linéaires : la fonction y  ka x (coordonnées arithmétiques) correspond à la fonction :

z  (log a)x  log k (Coordonnées semi-logarithmiques) est une droite :

70 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

4-2-2 Application
Exemple1

Reprenons le tableau précédent qui indique le salaire brut annuel, en milliers de francs, perçu
par un haut cadre et ajoutons y une quatrième ligne : z i  ln y i

Année 2005 2006 2007 2008 2009

Rang xi 1 2 3 4 5

De l’année

Salaire yi 42 900 54 200 64 100 81 600 102 000

(en
milliers de
Frs)

zi  ln yi 10.666 10.900 11.068 11.310 11.533

La représentation graphique de la série ( x i ; z i  ln y i ) est un ajustement affine de la série


( xi ; y i )

71 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Exemple2

La consommation d’une voiture, z, est donnée en fonction de sa vitesse, x, par le tableau


suivant :

X (en km/h) 80 90 100 110 120

Z (en litres/100 km) 4 5 6.5 8 10

1) La consommation est-elle proportionnelle à la vitesse ? Justifier.


2) Compléter le tableau ci-dessus par une ligne z  ln y , dont on donnera les valeurs
approchée à 6 décimales (les meilleurs possibles).
Dans un repère d’origine O(x0 = 70 ; y0 = 1.30), en prenant comme unité 1 cm pour 10 km/h en
abscisse et 1 cm pour 0.10 en ordonnée, représenter le nuage de 5 points ( x ; z  ln y ) . Que
remarque-t-on ?

EXERCICES & CAS : SERIE N°4

EXERCICE I

Nous considérons 10 salariés qui sont observés à l’aide de deux variables "âge" et "salaire".

Les informations brutes (pas encore traitées ou façonnées) sont données dans le tableau

Suivant :

Salaire 60 000 74 000 75 000 82 000 82 070 89 000 91 000 99 000 99 500 107 500

Age 15 26 20 43 47 37 52 34 50 44

1- Déterminer le tableau de contingence (X : âge, Y : salaire). Pour l’âge et pour le salaire, former
respectivement des classes de pas de 10 ans et de 10 000 Frs.
2- Calculer f21, f12, f45 et f33.
3- Déterminer les effectifs marginaux de X et de Y. Tracer le nuage de points.
4- Déterminer le tableau statistique des deux séries marginales X et Y .
72 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

EXERCICE II

Le tableau suivant donne la répartition des salariés d’une entreprise en fonction de leur quotité de
travail :

1- Calculer les fréquences marginales.


2- Calculer la fréquence conditionnelle des salariés à mi-temps par rapport aux cadres.
3- Calculer la fréquence conditionnelle des cadres par rapport aux salariés à mi-temps.

EXERCICE III

Considérons le tableau de contingence suivant : le salaire mensuel X, l’ancienneté Y des ouvriers d’une
entreprise.

1- Etudier les séries marginales.


2- Etudier les séries conditionnelles X/y3 et Y/x2 et présenter les résultats pour chaque
groupe de séries conditionnelles.

EXERCICE IV

Voici un sondage concernant l’opinion des populations d’un pays sur l’interdiction de la vente du tabac
aux moins de 16 ans (sondage réalisé sur un échantillon représentatif de 500 personnes majeures).

1- Recopier et compléter le tableau suivant à l’aide des informations données par les diagrammes en
secteurs circulaires. (Arrondir à l’unité la plus proche.)

73 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

2- a) Calculer la fréquence conditionnelle des personnes favorables par rapport aux fumeurs.
b) Calculer la fréquence conditionnelle des personnes favorables par rapport aux non-fumeurs.

EXERCICE V

Une société a mis au point un nouveau logiciel de gestion destiné aux PME et mène une
enquête auprès de cinq entreprises déjà équipées de micro-ordinateurs aptes à recevoir ce
logiciel, pour déterminer à quel prix chacune de ces entreprises accepterait d’acquérir ce
nouveau logiciel. Les résultats sont consignés dans le tableau ci-après :

Prix proposé Nombre d’entreprises disposées

(en Frs) : A acheter le logiciel à ce prix :

xi yi

40 000 60

36 000 70

32 000 130

28 000 210

24 000 240

20 000 340

16 000 390

12 000 420

10 000 440

8 000 500

1- On demande de :
1-1 Représenter le nuage de points Mi (xi, yi).
1-2 Utiliser la méthode de Mayer pour déterminer une équation d’une droite d’ajustement D1
de la forme y = mx + p. Les coefficients m et p seront donnés à 10-1 près. Tracer D1 sur
le graphique.
2- Déterminer une valeur approchée à 10-3 près du coefficient de corrélation linéaire.
3- Déterminer une équation de la forme y = ax + b de la droite de régression D2 de y par
rapport à x par la méthode des moindres carrées. Les coefficients a et b seront donnés
par leur valeur approchée respectivement à 10-4 près et à 10-1 près. Tracer D2 sur le
graphique.
4- Les frais de conception du logiciel se sont élevés à 500 000 Frs, les frais variables par
logiciel vendu sont supposés négligeables.
4-1 Déduire de l’ajustement par la méthode des moindres carrées l’expression du bénéfice
théorique réalisé en fonction du prix choisi x et calculer la valeur de x permettant
d’obtenir le bénéfice théorique maximal. Quel est ce bénéfice ?
4-2 A partir des résultats de l’enquête et sans utiliser la droite d’ajustement, déterminer,
parmi la gamme des prix proposés, celui qui permettra de réaliser le bénéfice maximal.

74 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

EXERCICE VI

Les chiffres d’affaires trimestriels, pour les douze derniers trimestres, d’une entreprise
fabriquant du matériel électronique sont donnés dans le tableau suivant :

Rang du trimestre : Chiffre d’affaires

xi (en Million de Frs

1 300

2 450

3 130

4 200

5 280

6 410

7 200

8 250

9 320

10 500

11 210

12 250

1- Représenter graphiquement le nuage de points Mi (xi, yi) dans le plan muni d’un repère orthogonal.
On prendra pour unités 1 cm sur l’axe des abscisses et 2 cm pour 100 Million de Frs sur l’axe des
ordonnées.
2-
2-1 Le nuage obtenu au 1° présente des écarts à peu près réguliers de part et d’autre d’une droite
d’ajustement tracée au jugé. On effectue souvent dans ce cas un lissage du nuage en remplaçant
les points par des points moyens. On peut utiliser la méthode des moyennes mobiles en
remplaçant la série statistique précédente par la série des moyennes mobiles des ventes en
calculant les moyennes sur quatre trimestres consécutifs et en les attribuant au quatrième
trimestre.
Etablir la série des moyennes mobiles de l’entreprise de matériel électronique en complétant
après avoir reproduit le tableau suivant :

75 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

2-2 Représenter sur la figure du 1° le nuage de points Ni (xi, zi). Les irrégularités du nuage des points
Mi ont été atténuées.

3- On considère la série des chiffres d’affaires obtenus après lissage à la question 2-1.
3-1 Déterminer la valeur approchée à 10-2 près du coefficient de corrélation linaire de la série
statistique double de variables x et z.

3-2 Déterminer par la méthode des moindres carrées une équation de la droite de régression D de z
en x. On donnera une équation de la forme z = ax + b dans laquelle a est une valeur approchée à
10-2 près et b une valeur approchée à une unité près.

3-3 On admet que la Rang du trimestre : xi 4 5


… tendance
observée pendant les trimestres de
rang 4 et 12 se poursuit. Chiffre d’affaires (en MFrs) : zi 270 265
… Donner le
chiffre d’affaires prévisionnel
pour les trimestres de rangs 13 et 14.

STATISTIQUE

Chapitre -------------

5 LES INDICES
STATISTIQUES

76 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Sommaire

Introduction

1- Indices simples
1-1 Définition
1-2 Exemple et règles de Calcul
1-3 Propriétés
2- Indices synthétiques(ou composés)
2-1 Activité
2-2 Définition
3- Principaux Indices de la vie économique
3-1 Etude des indices des prix
3-2 Etude des indices de quantité (ou indices de consommation)
3-3 Relation entre indices de prix et de quantité

Introduction
Les indices statistiques sont des instruments de mesure synthétiques d’évolution(s)
exprimée(s) en valeurs relatives. Les indices permettent des comparaisons de grandeurs
mesurables d’après un étalon commun. De nombreuses données sont actuellement
indicées ; les exemples les plus connus sont : les indices de prix, de coût de la construction,
de coût de la vie ou du pouvoir d’achat, les indices boursier, etc.

Deux catégories d’indices sont couramment distinguées : les indices simples (ou
élémentaires) et les indices composites (ou synthétiques).

1- INDICES SIMPLES
1-1 Définition
Un indice simple exprime le rapport entre deux valeurs (ou mesure) d’un même phénomène.
Très souvent, ces valeurs s’exprime à travers le temps (mais parfois aussi, dans les espaces
géographique, institutionnel, etc.). Le rapport calculé est sans unité et est pratiquement
toujours multiplié par 100.

D’une façon générale :

Si nous désignons par : V0, la valeur (ou la mesure), à la date t0, d’une grandeur étudiée (prix,
quantité, volume…), la date t0 étant appelée date de base, et par V1, la valeur (la mesure) à la
date t1, de la même grandeur, l’indice simple de la grandeur, à la date t1, calculé sur la base
V1
100, noté I1/0 est : I 1 / 0   100
V0

Cet indice est dit simple ou élémentaire, car il porte que sur une seule grandeur.

D’une manière générale, l’indice simple d’une grandeur à la date tn calculé sur la base 100 à la
date t0 est :

77 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Vn
I n /0   100
V0

A chaque indice est associée une variation de grandeur qui s’exprime de façon générale en
pourcentage :

Vn V0
n /0   100  I n/0  (1   n / 0 )  100
V0

5 Si Δn/0 = α% > 0 : signifie qu’il y a augmentation de la grandeur (prix, quantité, volume…)


de α% par rapport à la grandeur mesuré à la date t0.
6 Si Δn/0 = α% < 0 : signifie qu’il y a diminution de la grandeur (prix, quantité, volume…) de
α% par rapport à la grandeur mesuré à la date t0.

Remarque

7 Un indice est un nombre sans dimension, indépendant du choix des unités.

8 Avant d’effectuer tout calcul, il faut s’assurer que les grandeurs (prix, quantité,…) sont
comparables : par exemple dans l’exemple suivant (paragraphe 1-2), les prix sont
associés à la même quantité de nourriture (1 kg).

9 Par convention, la première période est de rang 0, la suivante de rang 1, etc ; ainsi on aura :
I1/0 et Δ1/0, I2/0 et Δ2/0 etc.

1-2 Exemple et règles de calcul


Le prix d’une nourriture s’élevait à 3 milliers de frs par kg au 1er mars 20(N) et 3.3 milliers
de frs par kg au 1er mars 20(N+1).
 L’indice simple au 1er mars 20(N+1) calculé sur la base 100 au 1er mars 20(N)
s’obtient en procédant au calcul suivant :
3 . 30
 01 / 03 / 20 ( N 1 )  1 / 0  100  110
01 / 03 / 20 ( N ) 3

Ce résultat signifie 1 kg de nourriture qui coûtait 100 milliers de frs le 1er mars 20(N), coûte
110 milliers de frs le 1er mars 20(N+1).

Cependant en calculant uniquement le rapport (sans multiplication par 100) :

3 . 30
 1 . 10
3

Signifie que 1 kg de nourriture qui coûtait 1milliers de frs le 1er mars 20(N), coûte 1.10
milliers de frs le 1er mars 20(N+1).

La variation entre 01/03/20(N) et le 01/03/20(N+1) est ce :

3 . 30  3 . 00 0 . 10
 01 / 03 / 20 ( N 1 )  1 / 0  100   100  10 %
01 / 03 / 20 ( N ) 3 . 00 1

78 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Calcul de l’indice simple pour une période futur : au 1er mars 20(N+1= calculé sur la
base 100 au 1er mars 20(N)
En supposant que le 01/03/20(N+2), le prix du kg de cette nourriture animale passe à 3.96
milliers de frs.

L’indice correspondant à cette date sera noté I2/0 :

3 . 96
 01 / 03 / 20 ( N  2 )  2 /0  100  132
01 / 03 / 20 ( N ) 3

La variation entre 01/03/20(N) et le 01/03/20(N+2) est ce :

3 . 96  3 . 00
 01 / 03 / 20 ( N  2 )  2 /0  100  32 %
01 / 03 / 20 ( N ) 3 . 00

1-3 Propriétés
1-3-1 Réversibilité
1-3-1-1 Définition
L’indice simple I d’une grandeur, à la date t, calculé sur la base 100 à la date t0 est :

Vt 1
t /0  100  t /0  100 (1)
V0 V0
Vt

Et l’indice simple d’une grandeur, à la date t0, calculé sur la base 100 à la date t est :

V0 0 /t V0
0 /t  100   ( 2)
Vt 100 Vt

2
1 1 100
(1) et ( 2 )  t /0  100   100 
V0 0 /t 0 /t
Vt 100

De même on a :

2
1 1 100
0 /t  100  100 
Vt t /0 t /0
V0 100

Un indice I est réversible si

2 2
100 100
t /0  et 0 /t  car
0 /t t /0

79 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

t /0 Vt 0 /t V0 t /0 0 /t Vt V0
 et      1
100 V0 100 Vt 100 100 V0 Vt

1-3-1-2 Application1
En reprenant l’exemple précédant (paragraphe 1-2),

1- Quelle serait au 01/03/20(N) la valeur de l’indice du prix du kg de nourriture en base 100


au 01/03/20(N + 1) ?
3000
 01 / 03 / 20 ( N )   100  90 . 9090909
01 / 03 / 20 ( N 1 ) 3300

2- L’indice est-il réversible ?


2
100
 110   01 / 03 / 20 ( N 1 )  réversibil té
90 . 90909 01 / 03 / 20 ( N )

1-3-2 Transférabilité
1-3-2-1 Définition
Considérons les mesures V0, V1, V2, d’une grandeur aux dates respectives t0, t1, t2 ; les indices
simples correspondants sont : I1/0, I1/0, I2/0.

Un indice I est transférable si :

2 /0 1 / 0  2 /1 1 / 0   2 / 1 V2 V1 V2
   2 /0  car  
100 100 100 100 V0 V0 V1

1-3-2-2 Application2
En reprenant l’exemple du paragraphe 1-2 :

L’indice du prix du kg de nourriture est-il transférable ?

 2 /1  120

1 / 0   2 / 1 110  120
 2 / 0  132    132   2 / 0  transférab ilité
100 100

1 / 0  110

1-3-2-3 Avantage de la transférabilité


Les changements de période de base sont possibles et ne posent aucune difficulté de calcul
des indices en nouvelle base.

Exemple : en reprenant l’exemple du paragraphe 1-2 :

Si, au 01/03/20(N + 3), l’indice I s’élève à 412.5 (base 100 au 01/03/20(N) : 

80 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

 01 / 03 / 20 ( N 3 )   3 / 0  412 . 5 ), et si la nouvelle base devient 100 au 01/03/20(N + 1),


01 / 03 / 20 ( N )

l’indice nouveau se calcul ainsi :

3 /0 412 . 5
 01 / 03 / 20 ( N 3 )   3 /1   100   100  375
01 / 03 / 20 ( N 1 ) 1 / 0 110

Dans la nouvelle base 100 (au 01/03/20(N + 1)), montrer que les indices ultérieurs sont
respectivement :

- Au 01/03/20(N + 2) : 120 (= Indice I2/0 en base 100 au 01/03/20(N)


- Au 01/03/20(N + 3) : I2/0 = 375

2- INDICES SYNTHETIQUES (ou indices composés)


2-1 Activité
Les mesures des prix unitaires de trois denrées A, B, C, à deux dates t0 et t1 sont données
dans le tableau suivant, avec les coefficients de pondération (les quantités respectifs)
accordés à chacune des denrées.

Denrées Prix unitaires Pondérations

(en milliers de frs)

Date t0 Date t1

A 2 3 5

B 3 4 3

C 5 8 2

10

On désire calculer un indice synthétique des prix à la date t1 (base 100 à la date t0).

Lorsqu’on observe ce tableau nous constatons qu’il y une grandeur (prix) composée des prix
des denrées A, B, C et qui évoluent chacun dans le temps (de t0 à t1).

Pour effectuer ce calcul deux méthodes s’offre à nous : calcul de l’indice des moyennes
arithmétiques pondérées ou la moyenne arithmétique pondéré des indices simples.

1) 1ère méthode : Indice des moyennes arithmétiques pondérées


Moyenne arithmétique pondérée des prix à la date t1
I1/0 = x100
M ith éti dé é d i àl d t t

81 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

(3  5)  ( 4  3)  (8  2 )
10 (3  5)  ( 4  3)  (8  2 ) 43
1 / 0   100   100   100  148 . 27
( 2  5)  ( 3  3)  ( 5  2 ) ( 2  5)  ( 3  3)  ( 5  2 ) 29
10

Ainsi on dépense 148.27 milliers de frs à la date t1 pour se procurer la disposition de ce


qui coûtait 100 milliers de frs à la date t0.

43  29
Ou encore les prix ont augmentés de 1 / 0   100  48 . 27 % de la date t0 à la date
29
t1.

En généralisant cette formule on obtient pour k denrée :


k

 P12 Q 2  ...  P1 k Q k
P11 Q 1
P 1i
Q i
1 / 0  100  i 1
100
P01 Q 1  P02 Q 2  ...  P0 k Q k
k

P
i 1
0i
Q i

Avec P0i les prix respectifs des k denrées à la date t0 ; P1i les prix de ces mêmes denrées à
la date t1 et Qi les coefficients de pondération.

Remarque :
k k

En posant que : 
i 1
P0 k Q k   P0 Q et que P
i 1
1k
Qk   P1 Q , on peut alléger l’expression

de l’indice I1/0 :

 P Q 1

1 / 0 
 P  Q 100   Q
1
100
 P Q 0  P Q 0

Q

2) 2ème méthode : Moyenne arithmétique pondéré des indices simples


Principe : on calcule d’abord l’indice simple propre à chaque denrée, puis on fait la
moyenne arithmétique pondérée des indices simples obtenus :

k
 P1i 
  P
P1
100 Q i   P Q
  0 ik 
i 1
1 / 0 100
0

Q i
Q
i 1

82 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

3 300
 Denrée A : I 1 / 0  100 
2 2
4 400
 Denrée B : I 1 / 0   100 
3 3
8 800
 Denrée C : I 1 / 0   100 
5 5
P11
100 Q 1 
P12
100 Q 2 
P13
100 Q 3  300   400   800 
 5    3   2
   3   5   147
P01 P02 P03 2
1 / 0 
5 3 2
k

Q
i 1
i

2-2 Définition
L’indice synthétique encore appelé indice composé, est un nombre sans unité, qui traduit
l’évolution dans le temps de plusieurs valeurs d’une même grandeur.

En pratique deux formules de pondération sont retenues principalement :

 Cas des indices de prix :


- Pondération des prix par les quantités d’origine ou pondération de LASPEYRES ;
- Pondération des prix par les quantités actuelles ou pondération de PAASCHE.
 Cas des indices de quantité :
- Pondération de quantité par les prix d’origine ou pondération de LASPEYRES ;
- Pondération des prix par les prix actuels ou pondération de PAASCHE.

Remarque :

Les éléments d’un indice doivent former un ensemble homogène représentatif du


phénomène d’ensemble dont l’évolution est suivie. La période de base doit être
soigneusement choisie ; retenir une époque de base en période de dépression économique
implique des indices futurs à valeurs surélevées (et réciproquement, valeurs sous-estimées)

3- PRINCIPAUX INDICES DE LA VIE ECONOMIQUE


3-1 Etude des indices de prix
3-1-1 Indice de prix de LASPEYRES
L’indice de prix de Laspeyres à la date t1 calculé sur la base 100 à la date t0 est calculé à
l’aide la formule :
k

P Q i1 i0
PQ
 i 1
 100   100
1 0
£1/0 k

P i0
Q i0 P Q
0 0

i 1

Avec :

 Pin : le prix de l’article i à l’époque n (ou bien à la date tn) ;


 Qin : la quantité de l’article i à l’époque n(ou bien à la date tn)
 Pi0 : le prix de l’article i à l’époque 0 (ou bien à la date t0) ;
83 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

 Qi0 : la quantité de l’article i à l’époque 0 (ou bien à la date t0)


 k : le nombre de produits (ou nombre d’articles) différents

De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k

P1 n Q 10  P2 n Q 20  ...  Pkn Q k 0 P in
Q i0
P Q
 100  i 1
100  100
n 0
£ n /0
P10 Q 10  P20 Q 20  ...  Pk 0 Q k 0 k

P i0
Q i0 P Q0 0

i 1

Remarque :

La valeur du dénominateur, correspondant à l’époque de base, ne change pas lors des


calculs successifs de Laspeyres c'est-à-dire lorsqu’on change de date (époque) de calcul.

Application1 :

Considérons le tableau suivant :

Articles Juin 2017 Juin 2018 2019

Q P Q P Q P

X 10 kg 50 F 12 kg 55 F 15 kg 66 F

Y 1 m3 100 F 1.1 m3 105 F 1.3 m3 140 F

Z 2 m3 200 F 2.3 m3 212 F 2.5 m3 240 F

P : prix en franc ; Q : quantité en kg ou en m3.

Calculons l’Indice de prix de LASPEYRES en base 100 en juin 2017 :


- Au mois de juin 2018 :
3

P Q i1 i0
P11 Q 10  P21 Q 20  P31 Q 30
£ 01 - 06 - 2018  £1/0  i 1
100  100
3
P10 Q 10  P20 Q 20  P30 Q 30
P
01 - 06 - 2017

i0
Q i0
i 1

P11 Q 10  P21 Q 20  P31 Q 30 ( 55  10 )  (105  1)  ( 212  2 )


£ 01 - 06 - 2018   100   100
01 - 06 - 2017 P10 Q 10  P20 Q 20  P30 Q 30 ( 50  10 )  (100  1)  ( 200  2 )

1079
£ 01 - 06 - 2018  £1/0   100  107 . 9
01 - 06 - 2017 1000

84 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

- Au mois de juin 2019 :


3

P i2
Q i0
£ 01/06/2019  £ 2 /0  i 1
3
 100 
P
01/06/2017

i0
Q i0
i 1

3-1-2 Indices de prix de PAASCHE


Le calcul de l’indice se fait comme précédemment sauf qu’ici les prix sont à présent
pondérés par les quantités actuelles c'est-à-dire celles de l’époque n (à la date tn).

En conservant les mêmes abréviations que celles qui concernent l’indice de prix de
Laspeyres, l’indice de prix de PAASCHE à la date t1 calculé sur la base 100 à la date t0 est
calculé à l’aide la formule :
k

P Q i1 i1
P Q
 i 1
100  100
1 1
I 1/0

P
k

i0
Q i1 P Q 0 1

i 1

De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k

P1 n Q 1 n  P2 n Q 2 n  ...  Pkn Q kn P in
Q in
P Q
  100  i 1
 100   100
n n
I n /0
P10 Q 11  P20 Q 21  ...  Pk 0 Q k 1 k

P i0
Q i1 P Q0 1

i 1

Application2

Reprenons les données de l’application1 du paragraphe 3-1-1) :

Articles Juin 2017 Juin 2018 2019

Q P Q P Q P

X 10 kg 50 F 12 kg 55 F 15 kg 66 F

85 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Y 1 m3 100 F 1.1 m3 105 F 1.3 m3 140 F

Z 2 m3 200 F 2.3 m3 212 F 2.5 m3 240 F

Calculons les Indices de prix de PAASCHE en base 100 en juin 2017 :

- L’indice de prix de PAASCHE au mois de juin 2018 en base 100 en juin 2017 :
3

P Q i1 i1
P11 Q 11  P21 Q 21  P31 Q 31
I 1/0  i 1
100  100
3
P10 Q 11  P20 Q 21  P30 Q 31
P
i 1
i0
Q i1

( 55  12 )  (105  1 . 1)  ( 212  2 . 3 ) 1263 . 10


I 01/06//201  I 1/0   100   107 . 96
( 50  12 )  (100  1 . 1)  ( 200  2 . 3 )
8
01/06/2017 1170

On peut également utiliser le tableau suivant pour calculer cet indice :

Articles Juin 2018 Juin 2017 Calcul de l’indice

(époque 1) (époque 0) I1/0

Prix Qtité Dépenses P Qtité Dépenses


1263 . 1
(Pi1) (Qi1) (Pi0) (Qi1) I 1/0   100
1170

X 55 12 55x12 = 660 50 12 50 x12 = 600


I 1/0  107 . 96
Y 105 1.1 105x1.1 = 115.5 100 1.1 100x1.1 = 110

Z 212 2.3 212x2.3 = 487.6 200 2.3 200x2.3 = 460

1263.1 1170

- L’indice de prix de PAASCHE au mois de juin 2019 en base 100 en juin 2017 :

Articles Juin 2019 Juin 2017 Calcul de l’indice

(époque 1) (époque 0) I2/0

Prix Qtité Dépenses Prix Qtité Dépenses


.........
(Pi2) (Qi2) I 2 /0   100
.........

X
I 2 /0 
Y

86 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

3-2 Etude des indices de quantité (indices de consommation)


A présent, ce sont les quantités qui sont indicées, les prix servant à définir les coefficients de
structure.

3-2-1 Indice de quantité de LASPEYRES


Les quantités sont pondérées par les prix d’origine. Au niveau des formules, il suffit de
permuter prix et quantité, ce donne, l’indice composite de quantité de Laspeyres : *£

L’indice de quantité de Laspeyres à la date t1 calculé sur la base 100 à la date t0 est calculé à
l’aide la formule :
k

Q i1
Pi 0
Q P0
 i 1
100  100
1
* £1/0 k

Q i0
Pi 0 Q 0
P0
i 1

Avec :

 Pin : le prix de l’article i à l’époque n (ou bien à la date tn) ;


 Qin : la quantité de l’article i à l’époque n(ou bien à la date tn)
 Pi0 : le prix de l’article i à l’époque 0 (ou bien à la date t0) ;
 Qi0 : la quantité de l’article i à l’époque 0 (ou bien à la date t0)
 k : le nombre de produits (ou nombre d’articles) différents

De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k

Q 1 n P10  Q 2 n P20  ...  Q kn Pk 0 Q in


Pi 0
Q P0
  100  i 1
 100   100
n
* £ n /0
Q 10 P10  Q 20 P20  ...  Q k 0 Pk 0 k

Q i0
Pi 0 Q 0
P0
i 1

Remarque

Le dénominateur est constant, de période en période, et il est égal à celui de l’indice de prix
de Laspeyres. Seul le numérateur évolue.

Application 3

Reprenons les données de l’application1 du paragraphe 3-1-1) :

Calculons l’indice de quantité de Laspeyres en juin 2018 calculé sur la base 100 en juin
2017 :

87 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Q 11 P10  Q 21 P20  Q 31 P30


* £ 01/06/2018  *£ 1 / 0   100
01/06/2017 Q 10 P10  Q 20 P20  Q 30 P30

(12  50 )  (1 . 1 100 )  ( 2 . 3  200 ) 1170


* £ 01/06/2018  *£ 1 / 0  100   117
01/06/2017 (10  50 )  (1  100 )  ( 2  200 ) 1000

Ou bien à l’aide du tableau :

Articles Juin 2017 Juin 2018 Calcul de l’indice

(époque 0) (époque 1) *£1/0

Qtité Prix Dépenses Qtité Prix Dépenses


1170
I 1/0   100  117
(Qi1) (Pi0) (Qi0) (Pi0) 1000

X 10 50 10x50 = 500 12 50 50 x12 = 600


I 1/0  117
Y 1 100 1x100 = 100 1.1 100 100x1.1 = 110

Z 2 200 2x200 = 400 2.3 200 200x2.3 = 460

Total : 1000 Total : 1170

3-2-2 Indices des quantités de PAASCHE


Les quantités sont à présent pondérées par les prix.

En permutant prix et quantités, et en conservant les mêmes abréviations que celles qui
concernent l’indice de quantité de Laspeyres, l’indice de prix de PAASCHE à la date t1 calculé
sur la base 100 à la date t0 est calculé à l’aide la formule :
k

Q i1
Pi 1
Q P1
 i 1
100  100
1
* I 1/0 k

Q i0
P
i1
Q 0
P1
i 1

De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k

Q 1 n P1 n  Q 2 n P2 n  ...  Q kn Pkn  Q in Pin


Q Pn
 100  i k 1 100  100
n
* I n /0
Q 10 P11  Q 20 P21  ...  Q k 0 Pk 1
Q i0
Pi 1 Q 0
P1
i 1

Remarque

Le numérateur est identique à celui de l’indice de prix de Paasche, le dénominateur évolue, de


période en période.

88 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION

Application4

Reprenons les données de l’application1 du paragraphe 3-1-1) :

Articles Juin 2017 Juin 2018 2019

Q P Q P Q P

X 10 kg 50 F 12 kg 55 F 15 kg 66 F

Y 1 m3 100 F 1.1 m3 105 F 1.3 m3 140 F

Z 2 m3 200 F 2.3 m3 212 F 2.5 m3 240 F

Calculons les Indices de quantité de PAASCHE en base 100 en juin 2017 :

- L’indice de quantité de PAASCHE au mois de juin 2018 en base 100 en juin 2017 :
3

Q i1
Pi 1
Q 11 P11  Q 21 P21  Q 31 P31
I 1/0  i 1
 100   100
3
Q 10 P11  Q 20 P21  Q 30 P31
Q
i 1
i0
P
i1

(12 55 )  (1 . 1 105 )  ( 2 . 3  212 ) 1263 . 10


I 01/06//201  I 1/0  100   107 . 06
(10  55 )  (1  105 )  ( 2  2212 )
8
01/06/2017 1079

On peut également utiliser le tableau suivant pour calculer cet indice :

Articles Juin 2018 Juin 2017 Calcul de l’indice

(époque 1) (époque 0) I1/0

Qtité Prix Dépenses Qtité Prix Dépenses


1263 . 1
(Qi1) (Pi1) (Qi0) (Pi1) I 1/0   100
1079

X 12 55 12x55 = 660 50 12 50 x12 = 600


I 1/0  107 . 06
Y 1.1 105 1.1x105 = 115.5 100 1.1 100x1.1 = 110

Z 2.3 212 2.3x212 = 487.6 200 2.3 200x2.3 = 460

1263.1 1079

3-3 Relation entre les indices de prix et de quantité (indices de LASPEYRES, de PAASCHE)
Soient IL (ou £) et Ip les indices de prix respectivement de Laspeyres et de Paasche, et

Soient *IL (ou *£) et *Ip les indices de quantité respectivement de Laspeyres et de Paasche.

89 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA

COURS DE STATISTIQUES / OUTILS D’AIDE A LA DECISION


L 
On a :   L   L     P   L
P P

90 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique

Vous aimerez peut-être aussi