Académique Documents
Professionnel Documents
Culture Documents
PARTIE I : STATISTIQUE
-------------
Chapitre LES SOMMATIONS
1 INDICEES
Sommaire
Introduction
1- Sommations sur un indices
1-1 Définition
1-2 Notation
1-3 Propriétés
1-4 Exemples
2- Sommations sur deux indices
2-1 Définition
2-2 Notation
2-3 Propriétés
2-4 Exemples
Introduction
Pour définir tout être mathématique, il est primordial de choisir un moyen de définition et
d'expression commode. L'écriture indicielle semble le mieux adapté à cet effet. Cette écriture
utilise, selon les besoins, les signes Σ (sigma) et/ou π (pie).
Le symbole π date du temps de Gauss. Il a été introduit pour désigner le produit de plusieurs
termes ; mais ne sera pas l’objet de notre étude.
1-1 Définition
Le symbole Σ (sigma) s’utilise pour désigner de manière générale la somme de plusieurs
terme. Ce symbole est accompagné généralement d’un indice que l’on fait varier de façon à
englober tous les termes qui doivent être considérés dans la somme. L’indice est représenté
par une ou plusieurs lettres minuscules. Si dans une somme le symbole Σ (sigma) porte un
seul indice on dit qu’on a une sommation simple indice.
1-2 Notation
Considérons le tableau suivant, relatif au salaire horaire perçu par 10 ouvriers.
1|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
ème
6 ouvrier 10.7
ème
7 ouvrier 11
ème
8 ouvrier 11.2
ème
9 ouvrier 11.5
ème
10 ouvrier 12
Tableau1.a
- La première colonne, de titre « rang des ouvriers » est désignée par la variable i (variant
de 1 à 10) : cette variable permet de distinguer les ouvriers.
- La deuxième colonne, de titre « salaire horaire » est désignée par le symbole x. Pour
faire correspondre le salaire à l’ouvrier concerné, on va munir le symbole x da la lettre i et
se note comme suit : on porte en bas et à droite la lettre i. La lettre i ainsi portée,
représente un indice. D’où xi permet de repérer sans ambigüité le salaire de l’ouvrier de
rang i.
Exemple
x3 = salaire du 3ème ouvrier = 8.6 milliers de F ; x8 = salaire du 8ème ouvrier = 11.2 milliers de F.
L’utilisation de l’opérateur Σ (sommation) est une façon compacte d’écrire une somme
lorsque les termes successifs peuvent s’écrire sous la forme d’une expression générale qui
varie en fonction d’un indice.
n
1 à n.
L’indice numérique peut figurer en haut (indice supérieur) ou en bas (indice inférieur) soit par
exemple : x i ou x i xi ou xi.
L’indice sur lequel se fait la sommation est appelé « indice muet » c’est à dire qu’une fois la
somme calculée, le résultat ne dépend plus de cet indice. On peut donc lui donner le nom
qu’on veut : i, j, k etc. à exception des bornes de la somme, ici p et n
n n n
ip
xi x j xk
jp kp
Exemple
Considérons le tableau 1.a, si nous désirons calculer le total des salaires horaires, cela
2|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
revient à effectuer la sommation des dix salaires donnés. Nous pouvons l’écrire :
8
8 .5
- soit verticalement
12
100 . 5 Frs
- soit horizontalement
10
x
i 1
i
100 . 5 ... milliers .. de .. francs
10
x
i 1
i
est la forme contractée de x1 + x2 + … + x10 et se lit : « la somme des xi, pour i
Remarques
- La somme des n premiers entiers peut être représentée de la façon suivante:
n
i 1 2 3 n
i 1
P ( x) a 0 a1 x 1 a 2 x 2 a n x n P ( x ) a i x i forme contractée
i 0
Exemple : x 1 x 2 x
k 1
k
1-3 Propriétés
Les règles de base de l’opérateur sont les suivantes :
Propriété 1
Une constante multiplicative ne dépendant pas de l’indice i, elle peut donc être sortie du
n n
Propriété 2
3|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
n
ua un
S u k ( n a 1)
k a 2
Avec (n – a +1) le nombre de terme, et où n est l’indice du dernier terme, a l’indice du 1er
terme
Propriété 3
n
S xi xi xi
ip ip m 1
Exemple :
7 4 7
i 1
x i
xi xi
i 1 i 5
Propriété 5 : Linéarité
n n n
i k
(ax i
bx i ) a x i b x i
i k i k
n m m
Exemple i 0
(3
i
5i ) 3 i 5 i
i 0 i 0
Propriétés 6
Il est parfois utile dans certains développements mathématiques de changer les bornes de
l’indice (limites inférieures et supérieures) à condition de changer l’indice de manière
appropriée ; l’expression à l’aide su symbole Σ n’est donc pas unique. Le changement
d’indice peut se faire soit par translation soit par symétrie :
n n p np
i k
xi
i k p
xi p x
i k p
ip
Exemple :
4|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
5
x k
x 0 x1 x 2 x 3 x 4 x 5
k 0
7
5 7 3
x k 2
x 0
x 1
x 2
x 3
x 4
x 5
k
x x k 2
x k 2
k 2 k 0 k 2 k 2
3
k 2
x k 2 x 0 x1 x 2 x 3 x 4 x 5
Exercice
n
2-2 Notation
Pour représenter les données d’un tableau ou d’une matrice, on utilise souvent une notation à
double indice, du genre x ij où le premier indice (i) correspond au numéro de la ligne où se
situe la donnée et le deuxième indice (j) à celui de la colonne.
Par exemple, le terme x 24 représente la donnée qui si situe à l’intersection de la 2ème ligne et
de la 4ème colonne du tableau ou de la matrice. Les données du tableau correspondent
généralement à des effectifs, on peut donc les noter n ij
jp
1 x11 ... x1p
x
j 1
1j
x1
. . ... . .
. . ... . .
. . ... . .
jp
n xn1 ... xnp
x
j 1
nj
xn
i n i n
Total
marginal
i 1
xi1 x 1 ... x
i 1
ip
x p N
(total général)
5|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Les doubles sommations permettent de faire des calculs sur les données d’un tableau.
p
- La somme des valeurs contenues dans les marges colonnes est égale à la somme des
valeurs contenues dans les marges lignes qui est, elle même égale à la taille N de la
population :
n p p n
x
i 1 j 1
ij
N x ij
N
j 1 i 1
ou
Addition en colonne (l’indice i varie de 1 à n) Addition en ligne (l’indice j varie de 1 à p)
puis addition en ligne (l’indice j variant de 1 puis addition en ligne (l’indice i variant de 1
à p) à n)
D’où l’addition des termes d’un tableau constitué de n lignes (indice i) et de p colonnes
(indice j) se note :
n
p p
n
N n ij
i 1 0 j 1
n ij
j 1 0 i 1
Remarque
Plutôt que d'utiliser l'opérateur Σ, on peut utiliser une écriture plus condensée :
i 4
Par exemple n 11 n 21 n 31 n 41 n
i 1
i1
n 1
L'opérateur est remplacé par un ; ce point indique que l'on doit effectuer une somme :
n
- s'il se situe sur l'emplacement du 2ème indice on effectue la somme sur j : xi x ij
j 1
La ligne total et la colonne total du tableau ci-dessus sont appelées marges du tableau
croisé.
n 1 +....+ n i +....+ n n = n 1 +....+ n j +....+ n p = N
n p
Exemple1
Une entreprise comportant 3 départements : vente, marketing et RH. Pour ces trois
départements, les coûts de fonctionnement trimestriels ont été résumés dans le tableau ci-
après :
*CF 1er trimestre 2ème trimestre 3ème trimestre 4ème trimestre Total
Département marginal
1 Vente 3.2 3 2.5 4 12.7
2 Marketing 0.3 0.2 0.4 1.2
6|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Ce tableau est constitué de 3 lignes et 4 colonnes, les valeurs qui se trouvent à l’intérieur
peuvent alors facilement être repérées par x ij (en partant du principe que l’indice i représente
la ligne i et l’indice j, la colonne j). On peut réécrire ce tableau sous une forme plus
exploitable :
j
i 1 2 3 4
1 3.2 3 2.5 4
2 0.3 0.2 0.4 1.2
3 0.1 0.1 0.2 0.3
etc
2-3 Propriétés
On peut généraliser les relations précédentes en énonçant les règles de base des doubles
sommations :
x ij
x ij
ou x ij x ij
i 1 j 1 j 1 i 1 i 1 j 1 j 1 i 1
n p
x j x ij et xi x ij
i 1 j 1
i 1
xi x j
j 1
2-4 Exercice
On s'intéresse au nombre d'étudiants par UFR dans une université pour chacun des trois cycles en
2018 :
er ième ième
Y="Cycles" 1 Cycle 2 Cycle 3 Cycle
X="UFR"
Mathématiques 924 409 50
7|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Si on donne un numéro d’ordre aux UFR repéré par la lettre i (avec i = 1, 2, 3, 4) et un numéro d’ordre
aux cycles de formation repéré par lettre j (avec j = 1, 2, 3) et en reprenant le tableau précédent on
obtient :
j 1 2 3 Total marginal
i
1
2
3
4
Total
marginal
2) Déterminer :
2-1) La population totale N = …………. ;
2-2) n11 = …………… ; Que représente-t-il ?.
2-3) n23= ……... .
j 3
STATISTIQUE DESCRIPTIVE
-----------
Chapitre GENERALITES SUR
2 LA STATISTIQUE
Sommaire
Introduction
1- Définition générale et but de la statistique
8|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
1-1-1 Statistiques
Le mot ’’statistiques’’ au pluriel désigne des collections de chiffres, présentées souvent
sous forme de tableaux, parfois sous forme de graphiques, et qui regroupent toutes les
observations effectuées sur des faits nombreux, relatifs à un même phénomène.
1-1-2 Statistique
Le mot ’’statistique’’ au singulier est l’ensemble des procédés ou méthodes qui ont pour but,
l’étude mathématique des statistiques.
En d’autres termes la statistique est une technique mathématique qui a pour objet l’étude
numérique des ensembles finis d’éléments (les statistiques).
9|7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
D’une façon plus générale, la statistique est l’art et la science de collecter, analyser, présenter
et interpréter des données.
Il est possible de classer les méthodes statistiques en deux groupes : celui des méthodes
descriptives et celui des méthodes inférentielles.
La statistique descriptive
C’est l’ensemble des méthodes dont l'objectif principal est la description des données
étudiées. Cette description des données se fait à travers leur présentation (tableau
synthétique), leur représentation graphique et le calcul de résumés numériques (ou
caractéristiques numériques).
NB : les termes, statistique descriptive, statistique exploratoire et analyse des données sont
quasiment synonymes.
NB :
- Les termes de statistique inférentielle, statistique mathématique et statistique inductive
sont quasiment synonymes (non traitée dans cette partie du cours)
- D'un point de vue méthodologique, la statistique descriptive précède en général la
statistique inférentielle. Les deux aspects de la statistique se complètent cependant.
- La description simple et aussi complète que possible d’un ensemble étudié sous l’angle
d’un caractère donné (statistique descriptive)
- L’analyse et l’interprétation des résultats en vue
o D’établir une loi statistique de l’ensemble
o De rechercher une liaison existante entre deux ensembles
o Ou d’induire des propriétés d’un ensemble (analyse statistique)
2- VOCABULAIRE DE LA STATISTIQUE
2-1 Population ou ensemble statistique
C’est l’ensemble concerné par une étude statistique. On parle aussi de champ de l'étude ou
d’ensemble statistique.
Exemple :
Les étudiants en L2 de l’U-P ISPA : {Baucoum, Mikael, Emmanuel, Muriel, …}. Ce groupe
constitue une population sur laquelle ont peut faire une ou plusieurs études.
10 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Exemple :
Si l’on considère le groupe d’étudiants précédent, Muriel est un individu ou une unité
statistique.
2-3 Caractère
Le caractère étudié est la propriété observée dans la population ou l’échantillon considéré.
Exemple 1
Si l'on s'intéresse aux notes obtenues en mathématique par chaque étudiant du groupe
précédent, le caractère étudié est « les notes obtenu en mathématique ».
Exemple2 :
2-4 Modalités
Une modalité est la valeur prise le caractère pour un individu de la population considérée.
Chaque modalité s’appelle une variable statistique.
Les variables statistiques peuvent être quantitatives ou qualitatives.
Lorsque les variables statistiques prennent leurs valeurs dans l’ensemble des nombres réels,
elles sont dite variables quantitatives (âge, salaires, tailles …) ; elles sont dites qualitatives
(sexe, couleur, catégorie socio-professionnelle, …) si elles prennent des valeurs non
numériques.
Cependant si on procède à un codage tel que : on code 1 les hommes et 2 les femmes, la
variable ‘’sexe" demeure toujours qualitative.
Exemple :
Considérons l’ensemble des étudiants en TC ADA2 comportant les filières : GEC, Log, FCG, …
- La population étudiée est : les étudiants du TC ADA2 (ensemble comportant toutes les
filières tertiaires) ;
- Le caractère étudié : les filières (étant donné que les filières ne sont pas mesurables, ce
caractère est dit qualitatif) noté X
- Ce caractère peut prendre divers valeur ou nom appelé modalité et l’on écrira : X = GEC,
ou X = Log, X = FCGE, … On lit dans ce cas : X prend la valeur GEC, etc.
Une variable statistique quantitative est dite discrète (ou discontinue) lorsque les
valeurs qu’elle peut prendre sont des nombres entiers par exemples le nombre d’enfants
à charge par une famille ;
11 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Une variable statistique quantitative est dite continue lorsque les observations qui lui
sont associées ne sont pas des valeurs précises, mais des intervalles. Cela signifie que,
l'ensemble des valeurs possibles de la variable étudiée a été divisé en intervalles
contigus appelés classes. En général, les deux raisons principales qui peuvent amener à
considérer comme continue une variable quantitative sont le grand nombre
d'observations distinctes (un traitement en discret serait, dans ce cas, peu commode) et
le caractère ’’sensible" d'une variable (lors d'une enquête, il est moins gênant de
demander à des individus leur classe de salaire que leur salaire précis ; même chose
pour l'âge).
Quelques exemples de variables quantitatives fréquemment considérés comme
continues sont ainsi le revenu, l'âge (pour un groupe d'individus), la taille (groupe
d’individu mesurée à l’occasion d’une visite médicale)
2-7 Fréquence
La fréquence d’une valeur ou d’une classe dans une population observé, est le quotient de
n
l’effectif n (ou N) de cette valeur ou de cette classe par l’effectif total N. On note : f
N
2-8 Enquête (statistique)
C'est l'opération consistant à observer (ou mesurer, ou questionner. . .) l'ensemble des
individus d'un échantillon (ou éventuellement de la population complète).
2-9 Recensement
C’est une enquête dans laquelle l'échantillon observé est la population tout entière (on parle
aussi d'enquête exhaustive).
En Côte d’Ivoire, on organise, de façon plus ou moins régulière, le recensement général de la
population...
2-10 Sondage
C'est, au contraire, une enquête dans laquelle l'échantillon observé est un sous-ensemble
strict de la population (on parle, dans ce cas, d'enquête non exhaustive).
3- METHODE STATISTIQUE
Les principales phases de la méthode statistiques sont :
12 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Exemple la population d’un pays à une date donnée peut être connue à l’aide d’un
recensement effectué à cette même date ; on parle de dénombrement instantané.
Le dénombrement est dit continu lorsqu’à partir d’un recensement antérieur, l’on fait l’adition
ou la soustraction, suivant le cas, des nombres de naissances, des décès, des émigrés et des
immigrés.
C’est pour ces diverses raisons, qu’on a recours au sondage. Les unités étudiées à l’occasion
du sondage constituent un échantillon.
L’étude de cet échantillon fournira des informations et conduira à des conclusions qui
pourront être étendues à la population complète (population mère).
- Soit ses employés pour apporter des modifications ou des aménagements à son
fonctionnement,.
Le support approprié pour de telles consultations est un imprimé établit par l’entreprise et
distribué soit au personnel, soit aux consommateurs selon le cas. Cet imprimé est appelé
questionnaire.
Le questionnaire doit comporter les informations suivantes :
- Adapté au niveau de culture des personnes à interroger ; il faut pour cela tenir compte
13 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Oui ; Non .
Exemple : ‘’classé par ordre de préférence de 1 à 3 les mets que vous affectionnez :
14 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
NB : les questions posées doivent être telles qu’elles permettent au statisticien de contrôler
la valeur des réponses recueillies.
- Age : 10 ans
- Etat matrimoniale : divorcé
- Nombre d’enfants : 3
3-2-1 Dépouillement dans le cas d’un caractère qualitatif
Dressons une statistique portant sur la situation matrimoniale de 20 personnes de sexe
masculin. Les modalités retenues sont : célibataire, marié, veuf, divorcé.
2 1 1 4 1 4 3 2 2 2 3 2 1 1 4 2 2 1 2 3
15 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Pour pouvoir dresser une statistique, il faut diviser le domaine de variation de la variable
(allant de 54.930 Kg à 81.290 Kg) en intervalle ou classe, de préférence d’amplitude
constante.
STATISTIQUE DESCRIPTIVE
-----------
Chapitre LES DISTRIBUTIONS 16 | 7
Prof Alain Mustapha Nassirou
3 STATISTIQUES
Master AesUN
Télécoms & Réseaux / Maitrise CARACTERES
Science : Physique
(SERIES STATISTIQUES A UNE VARIABLES)
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Sommaire
Introduction
1- Description des séries statistiques à une variable
1-1 Tableau statistique
1-2 Notion de classe
1-3 Détermination des fréquences
1-4 Détermination des effectifs cumulés
1-5 Les représentations graphiques
2- Caractéristiques des séries statistiques à une variable
2-1 Caractéristiques de tendance centrale (Mode, Médiane, Moyenne, quantiles …)
2-2 Caractéristiques de dispersion (Etendue, variance, écart-type, coefficient de variation...)
Introduction
Le statisticien pour élaborer des statistiques, observe d’abord des faits, puis collecte des
informations concernant un phénomène, procède à un ou plusieurs tris (dépouillement) et
tire une conclusion c'est-à-dire un enseignement.
Les données collectées étant souvent nombreuses, il est commode de les présenter sous
forme de tableau synthétique ou sous forme de graphique. L’ensemble des données ou
renseignements forme une distribution statistique ou une série chronologique (appelée aussi
chronique) ; cette dernière exprime une évolution dans le temps, contrairement à la
distribution statistique.
Nombre Effectifs
d’enfants à charge : xi (Nombre de famille) : ni
0 3
1 9
2 6
3 3
4 2
5 1
6 1
Total 25
17 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
N.B : Dans le cas d’une variable continue, il est commode d’utiliser des intervalles (classes).
Exemple2 : répartition d’un groupe (distribution statistique) d’élèves d’après leur taille
Taille Effectifs
(en cm) (Nombre d’élèves) :
ni
[150 ; 155[ 3
[155 ; 160[ 9
[160 ; 165[ 16
[165 ; 170[ 28
[170 ; 175[ 14
[175 ; 180[ 10
Total
Interprétation :
Dans cette distribution, 3 élèves ont une taille égale ou supérieure à 150 cm, mais inférieure
à 155 cm ; 9 élèves ont une taille égale ou supérieure à 155 cm, mais inférieure à 160 ; etc.
18 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
ni
100 12 36 24 12 8 4 4
N (%)
Remarque
1
- f
i
i
N
n
i
i
1
ni
- En multipliant une fréquence fi par 100, on obtient le taux du pourcentage de la
N
population totale que représente ni.
3
On a ainsi : 100 12 indique que 12% des familles n’ont pas d’enfants à charge.
25
Exemple : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.
Salaire
horaire [8 – 8.4[ [8.4 – 8.8[ [8.8 – 9.0[ [9.0 – 9.2[ [9.2 – 9.6[ [9.6 – 10.8[ [10.2 –
(en 10.9[
millier de
Frs)
Effectifs : 10 30 60 72 40 24 14
ni
n i
i
250
Une fois les tableaux des effectifs cumulés dressés, l’on peut prétendre répondre à une
certaine série de questions telles que pour notre exemple :
- Quel est le nombre d’ouvriers percevant au moins 9.2 millier de Frs ou plus ?
- Quel est le nombre d’ouvriers dont le salaire horaire est inférieur à 9.2 millier de Frs ?
- etc.
Méthode de calcul :
- 1er cumul : 1er effectif de la colonne des effectifs : 10 (ou 1ère fréquence 0.040) ;
- 2ème cumul : somme des deux premiers effectifs de la colonne des effectifs : 10 + 30 = 40 (ou
somme des 2 premières fréquences : 0.040 + 0.120 = 0.160);
- 3ème cumul : somme des trois 1er effectifs de la colonne des effectifs : 40 + 60 = 100 (ou somme
des trois 1ères fréquences : 0.160 + 0.240 = 0.400) ;
19 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
- Etc. Le dernier cumul de la colonne est égal à l’effectif total de la population : 250 (ou est égal la
fréquence total : 1).
Interprétation :
- 1er cumul : 10 salariés gagnent moins de 8.4 millier de Frs à l’heure (ou en terme de fréquence :
0.04x100 = 4% des salariés gagnent moins de 8.4 millier de Frs à l’heure)
- 2ème cumul : 40 salariés gagnent moins de 8.8 millier de Frs à l’heure (ou en terme de fréquence
0.160x100 = 16% des salariés gagnent moins de 8.8 millier de Frs à l’heure)
- Le dernier cumul : 250 salariés gagnent moins de 10.9 millier de Frs à l’heure (ou 100% des salariés
gagnent moins de 10.9 millier de Frs à l’heure)
Méthode de calcul :
- 1er cumul : effectif total de la population 250 (en terme de fréquence : fréquence total : 1) ;
- 2ème cumul : l’effectif total moins le 1er effectif de la colonne des effectifs : 250 - 10 = 240 (en terme
de fréq : la fréquence totale moins la 1ère fréquence de la colonne des fréq: 1 – 0.040 = 0.960);
- 3ème cumul : le 2ème cumul de la colonne des effectifs cumulés moins le 2ème effectif de la colonne
des effectifs : 240 – 30 = 210 (ou 2ème cumul de la colonne des fréquences cumulés moins la 2ème
fréquence de la colonne des fréquences : 0.96 – 0.120 = 0.840);
- Etc. Le dernier cumul de la colonne de effectif cumulés décroissant est égal au dernier effectif de
la colonne des effectif : 14 (ou est égal la dernière fréquence de la colonne des fréquences :
0.056) ;
Interprétation :
- 250 salariés gagnent au moins 8 millier de Frs (gagnent 8 millier de Frs ou plus) à l’heure (En terme
des fréquences : soit 100% des salariés gagnent au moins 8 millier de Frs (c'est-à-dire gagnent 8
millier de Frs ou plus) à l’heure)
- 240 salariés gagnent au moins 8.4 millier de Frs (c'est-à-dire gagnent 8.4 millier de Frs ou plus) à
l’heure (soit 0.960x100 = 96.0% des salariés gagnent au moins 8.4 millier de Frs (c'est-à-dire
gagnent 8.4 millier de Frs ou plus) à l’heure)
Remarque
- Les effectifs cumulés croissants et les fréquences cumulées croissantes sont mis en
20 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
correspondance pour leur interprétation avec les extrémités supérieures des classes
- Les effectifs cumulés décroissants et les fréquences cumulées décroissantes sont mis
en correspondance pour leur interprétation avec les extrémités inférieures des classes.
- Si l’on additionne l’effectif inscrit sur la ligne i des effectifs cumulés croissants et l’effectif
inscrit sur la ligne i + 1 de la colonne des effectifs cumulés décroissant, on obtient
toujours l’effectif total de la population.
Le caractère étudié ici est qualitatif ; il peut prend 5 valeurs ou modalité : Nord, Est ….
On a trois graphiques possibles pour représenter cette série statistique : diagramme en
bâtons, diagramme en colonnes (ou à barres), diagramme à secteurs circulaire
Diagramme en bâtons
Diagramme en colonne
21 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Une barre doit être interprété comme une surface et non comme une longueur (voir
construction d’un histogramme).
Un secteur est sous-ensemble centré sur le milieu d’un cercle (graphique circulaire) ou d’un
demi-cercle (graphique semi-circulaire), dont la profondeur (rayon du cercle ou du demi-
cercle) et dont la largeur de l’arc est proportionnelle à à un angle et à une surface définissant
un sous-ensemble.
Fréquences
Effectifs
0.375 - 30 -
0.250 - 20 -
0.125 - 10 -
0 -
0 1 2 3 4 5 6 Nombre d’enfants à
h
Les bâtons sont proportionnels à l’effectif (ou à la fréquence) correspondant(e).
Fréquences
Effectifs
0.375 - 30 -
0.250 - 20 -
0.125 - 10 -
-
0 1 2 3 4 5 6 Nombre d’enfants
23 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
X=k 0 1 2 3 4 5 6
Effectif : nk 4 15 29 18 10 3 1
Effectifs
cumulés 0 4 19 48 66 76 79 80
croissants
Ce tableau nous permet de lire directement par exemple que : 19 = 4+19 familles qui ont
moins de 2 enfants
k 0 1 2 3 4 5 6
Fréquences
Effectifs
1 - 80 -
0.750 - 60 -
0.500 - 40 -
0.250 - 20 -
-
0 0 1 2 3 4 5 6 Nombre d’enfants à
charges
24 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Exemple1 : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.
Histogramme
Un histogramme est constitué d’une suite de rectangles, dont les bases coïncident avec les
classes ; deux cas se présentent :
- 1er cas : les intervalles des classes ont tous la même amplitude
- 2ème cas : les intervalles des classes n’ont pas tous la même amplitude.
25 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Remarques :
- L’histogramme se compose de rectangles adjacents. La base d’un rectangle représente
l’amplitude de la classe statistique correspondante.
- Sur le graphique et dans le tableau précédent, les classes ont toutes la même amplitude.
Interprétation
L’histogramme ne doit surtout pas être interprété comme un diagramme en bâton, c'est-à-
dire à partir des hauteurs. Les rectangles sont tracés de telle façon que leurs surfaces soient
proportionnelles aux effectifs correspondants. En conséquence, l’effectif total est représenté
par la somme des surfaces des rectangles.
o Cas où les intervalles des classes n’ont pas tous la même amplitude
Exemple3 : Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire.
[8 – 8.4[ 10 0.40 25
[8.4 – 8.8[ 30 0.40 75
[8.8 – 9.0[ 60 0.20 300
[9.0 – 9.2[ 72 0.20 360
[9.2 – 9.6[ 40 0.40 100
[9.6 ; 10.2[ 24 0.60 40
[10.2 ; 10.9[ 14 0.70 20
250
Distribution statistique des ouvriers d’une entreprise d’après leur salaire horaire
Exemple4
Considérons la distribution statistique suivante : « taille de 25 étudiants »
Tailles Nombre Amplitude Hauteur des classes
(en cm) D’étudiants Des classes
S effectif
(effectif) b h
S b b
[161 ; 165[ 3 165 – 161 = 4 S effectif 3
h
b b 4
[165 ; 177[ 13
[177 ; 185[ 9
Total 25
- Dans le 1er rectangle, S = 3 (effectif de la 1ère classe) et la base b = 165 – 161 = 4 =>
S effectif 3
h ;
b b 4
- On procède de même pour les autres lignes de la distribution
Polygone des effectifs
o Cas où les intervalles des classes ont tous la même amplitude :
Le polygone des effectifs d’un histogramme où les intervalles ont tous la même amplitude se
trace en reliant les centres des sommets des rectangles.
26 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Le total des surfaces hachurées (au dessus du polygone) est égal au total des surfaces
colorées en gris (en dessous du polygone). La surface totale entre le polygone et l’axe des
abscisses est égale à celle de l’histogramme, c'est-à-dire à l’effectif total.
o Cas où les intervalles des classes n’ont pas tous la même amplitude :
Dans ce cas le polygone est obtenu en revenant d’abord artificiellement à une série dont tous
les intervalles ont la même amplitude, de telle sorte que la surface enveloppé par le polygone
soit égale à la surface enveloppée par l’histogramme puis procéder comme précédemment.
En joignant ces points par des segments de droites on obtient le polygone cumulatif
croissant ou polygone des effectifs cumulés croissants (dans le cas des fréquences, le
polygone des fréquences cumulées croissantes) ou encore la courbe cumulative croissante.
Pour notre exemple1 «Distribution statistique des ouvriers d’une entreprise d’après leur
salaire horaire. » : le 1er point aura pour abscisse la borne inférieure de la 1ère classe et pour
ordonné 0 soit (8 ; 0). On aura donc comme points : (8 ; 0) ; (8.4 ; 10) ; (8.8 ; 40) ; ……. ; (10.9 ;
250)
27 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Interprétation : sur le graphique, on peut lire que, 172 salarié (ou une fréquence égale à 0.688
soit 68.8% des 250 salariers) perçoivent un salaire horaire inférieur à 9.2 milliers Frs.
Interprétation : sur le graphique, on peut lire que, 78 salariés (ou une fréquence égale à 0.312
soit 31.2 % des 250 salarier) perçoivent un salaire horaire au moins égal à 9.2 euros.
Remarque
On peut construire sur un même repère le polygone cumulé croissant et le polygone cumulé
décroissant. Les deux courbes se coupent en un point d’abscisse la médiane et d’ordonné la
moitié de l’effectif total.
28 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
2-1-1 Moyenne
2-1-1-1Définition
Cas des caractères quantitatifs discrets
- Moyenne arithmétique non pondérée :
Considérons la série de N nombres suivantes : x1, x2, …, xn (variables non pondérées). La
x1 x 2 ... x n 1
n
xi Effectifs : ni ni xi
x1. n1 n1 x1
.xn nn nn xn
n1 x1 n 2 x 2 ... n n x n 1
n
n n x n x
n n x
i i
i
N i i
N N i 1
Total i 1 i 1
[xp, xp+1[ cp np
p
total p classes n
i 1
i
N
On affecte à ces effectifs, les centres des classes (milieu des classes) ; avec pour un
xi x i 1
intervalle [xi, xi+1[ le centre de la classe est c i
2
29 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
n1 c1 n 2 c 2 ... n p c np 1
p
x
N
N
n c
i 1
i i
2-1-1-2 Propriété
Soit a et b des constantes réelles et soient x1, x2, …, xn, des variables.
Posons y i ax i b , alors on a : y a x b .
2-1-2 Mode
Cas des caractères discrets (isolés)
Le mode noté Mo est la valeur (ou les valeurs) de xi qui correspond au plus grand effectif.
Pour cet exemple, l’effectif le plus élevé est 23, d’où le mode Mo = 1000
30 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Somme 1173
L’effectif le plus élevé est …….., d’où la classe modale est :……….
N.B : Une population n’a pas toujours un mode ou une classe modale unique.
Remarque :
L’utilisation pratique du mode reste assez limitée car des causes accidentelles peuvent faire
apparaître un mode peu significatif. Si l'on doit donner un indicateur de tendance centrale
unique pour caractériser le centre d'une série d'observations, et si l’on est amené à choisir
entre la moyenne et la médiane on retiendra la moyenne.
2-1-3 Médiane
Cas des caractères discrets (isolés)
Les xi étant rangés dans l’ordre croissant, la médiane Me est la valeur de la variable pour
laquelle l’effectif total est divisé en deux.
Pour cet exemple, le nombre de familles en fonction du nombre d’enfants à charge est N =
25 et la série peut être rangée de la façon suivante :
0 00111111111 2 222223334456
Exemple :
31 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Distribution des salaires mensuels de départ d’un échantillon de 12 diplômés d’une école de
commerce.
Pour calculer le salaire initial médian des 12 jeunes diplômés, il faut ordonner les 12
observations du tableau par ordre croissant :
3310 ; 3355 ; 3450 ; 3480 ; 3480 ; 3490 ; 3520 ; 3540 ; 3550 ; 3650 ; 3730 ; 3925
N = 12 (est paire), d’où N = 2q et q = 6. Les deux valeurs centrales sont : x6 = 3490 et x7 =
3520. La médiane correspond à la moyenne de ces deux valeurs.
3490 3520
La médiane est : M e 3505 .
2
o Méthode graphique
La médiane est aussi l’abscisse du point d’intersection des deux courbes cumulatives
(croissante ou décroissante)
N
2
o Méthode de calcul
32 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
La médiane se calcule ici par interpolation linéaire en supposant que les effectifs sont
uniformément repartis dans la classe : on détermine la classe qui correspond à 50% des
effectifs cumulés croissants ; soit [a ; b[ cette classe (avec Me ϵ [a, b[). On repère F(a) :
effectif cumulé croissant au point a et F(b) effectif cumulé croissant au point b.
Me – a 50%N – F(a)
=
xi a Me b b–a F(b) – F(a)
ni cumulés F(a) 50%N F(b)
croissants
Exemple :
Classes [0, 10[ [10, 50[ [50, 80[ [80, 100[ [100, 110[
ni 7 38 42 18 5
Effectifs cumulés 7 45 87 105 110
croissants
xi 50 Me 80
ni cumulés 45 55 87 Me – 50 55 – 45
= Me = 57.14
croissants 80 – 50 87 – 45
o Méthode graphique
Remarques :
La moyenne est la mesure de tendance centrale la plus souvent utilisée, cependant dans
certaine situation on lui préfère la médiane. La moyenne est en effet influencée par les
valeurs extrêmement petites et extrêmement grandes. Par exemple, supposez que l’un des
diplômés ait un salaire initial 10 000 $ par mois. Si l’on modifie le salaire initial le plus élevé
du tableau (3925 $), par 10 000 $. La moyenne passe de 35540 à 4046 $. Par contre, la
médiane égale à 3505 $, demeure inchangée. La médiane ici fournie ici une meilleure mesure
de tendance centrale que la moyenne.
D’une façon générale, lorsqu’un ensemble de donnée contient des valeurs extrêmes, la
médiane est souvent une mesure préférable de la tendance centrale.
8 8 . 10 8 . 40 8 . 60 9
Entreprise A : X : 8 ; 8.10 ; 8.40 ; 8.60 ; 9 => x 8 . 42 ; Me = 8.40
5
33 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
7 7 . 80 8 . 40 9 . 20 9 . 70
Entreprise B : Y : 7 ; 7.80 ; 8.40 ; 9.20 ; 9.70 => y 8 . 42 ; Me = 8.40
5
Constats
Les deux séries ont la même moyenne 8.42 centaine de Frs et la même médiane 8.40
centaine de Frs, donc ont les mêmes caractéristiques centrales. Il faut cependant noter que
les salaires n’ont pas la même homogénéité ; les salaires de l’entreprise B s’éloignent plus de
la moyenne que ceux de l’entreprise B.
Cet exemple montre que, les paramètres de tendance centrale sont insuffisantes pour
caractériser une série statistique, il est donc nécessaire de les compléter par des paramètres
de dispersion qui permettrons de mesurer les dispersions et de comparer les distributions.
Les principales caractéristiques de dispersion étudiées sont : l’étendue (intervalle de
variation ou range), les quartiles (moyennes de position conduisant à l’intervalle interquartile),
l’écart moyen et l’écart-type.
2-2-2 Etendue
Cas des caractères discrets (isolés)
L’étendue est la différence entre la plus grande et la plus petite valeur du phénomène
observé : E max( x i ) min( x i )
Exemple :
- L’étendue de l’entreprise A : EA = 9 – 8 = 1
On constate que les salaires horaires accordés par l’entreprise B sont beaucoup plus étalés,
dispersés que les salaires accordés par l’entreprise A.
Soit b1, 1 = la borne inférieure de la 1ère classe statistique (celle contenant les plus faibles
valeurs observée) et b2, k = la borne supérieure de la dernière classe statistique (celle
contenant les plus fortes valeurs observées) :
E b 2 , k b1 , 1
Ce calcul peut également se faire à partir des amplitudes des classes statistiques (ai)
formant une partition dans la distribution statistique
k
E a i (k = nombre de classes).
i 1
34 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
NB
Exemple :
Répartition de clientèle d’après deux chiffres d’affaires annuels consécutifs : CA et CA’ (en
milliers de francs)
CA’ [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20[ Total
CA
[0 ; 5[ - 1 2 1 4
[5 ; 10[ 1 3 3 2 9
[10 ; 15[ 2 4 5 - 11
[15 ; 20[ - - - 1 1
Total 3 8 10 4 20
Remarque :
On appelle quantile d’ordre α%, noté Q la valeur xi du caractère telle que α% des valeurs
observées soient inférieures strictement à xi. Si F désigne la fonction fréquence cumulée
croissante, alors : F Q .
100
Les Quartiles
Définition
Les quartiles sont des paramètres partageant une distribution statistique en quatre parties
égale, du point de vue des effectifs classés : chacune des parties contient donc 1/4 soit 25%
de l’effectif total (ou somme des fréquences absolues).
35 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Calcul
Pour partager un ensemble borné en 4 parts, il faut procéder comme suit : soit N, l’effectif
total :
- Q1 : 1re quartile (quantile d’ordre 25%) : est la variable qui correspond à 25% des valeurs observées
et signifie que 25% des effectifs cumulés croissants (ou des observations) sont inférieurs à Q1 ;
- Q2 est le 2ème quartile (quantile d’ordre 50%) : est la variable qui correspond à 50% des valeurs
observées et signifie que 50% des effectifs cumulés croissants (ou des observations) sont
inférieurs à Q2. Q2 = Me (médiane)
- Q3 est le 3ème quartile (quantile d’ordre 75%) : est la variable qui correspond à 75% des valeurs
observées et signifie que 75% des effectifs cumulés croissants (ou des observations) sont
inférieurs à Q3.
Graphique
75
100 N
50
100 N
25
100 N
Q3 Q1 Q3 Q1 Ia
- L’écart interquartile relatif : Ir
Q2 Me Me
36 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Remarque
Lorsque I r diminue, cela peut provenir d’une diminution de I a ou /et d’une augmentation de
la médiane Me (et vice-versa pour une augmentation de I r ).
Les déciles
Les déciles sont des séparateurs d’une distribution statistique en dixièmes. Ils sont au
nombre 9 déciles : D1, D2, …, D9 et correspondent respectivement à 10%, 20%, …, 90% des
ième
1
effectifs cumulés croissants. Entre deux décile successifs figurent de l’effectif N
10
N
des observations statistiques : .
10
I 1, 9 80 %
I 2,8 60 %
I 3, 7 40 %
I 4, 6 20 %
Lorsque I 1, 9 a une valeur élevée, cela signifie que les informations sont très dispersées.
Remarque :
2-2-5 Variance
2-2-5-1Définition
37 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
p p
1 1
v( x) x2
N
( x
i 1
i
x )2
N
x i 1
2
i
x2
p p p
1 1
v( x) x2
N
n ( x
i 1
i i
x )2
N
n x
i 1
i
2
i
x 2 ; avec N ni
i 1
On affecte à ces effectifs, les centres des classes (milieu des classes) ; avec pour un
xi x i 1
intervalle [xi, xi+1[ le centre de la classe est c i
2
p p p
1 1
v( x) x 2
N
n (c
i 1
i i
x) 2
N
n c
i 1
i i
2
x ; avec
2
N ni
i 1
2-2-5-2Propriétés
Etant donné des nombres réels a et b, n nombres xi, on déduit pour tout i, les nombres yi par
yi ax i b V ( ax b ) a 2V ( x ) et ( ax b ) V ( ax b) a ( x)
2-2-6 Ecart-type
La racine carrée de la variance est par définition l’écart type ; on le note σ(X) ou σx ou σ.
( x) V ( x)
38 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
STATISTIQUE DESCRIPTIVE
-----------
Chapitre LES DISTRIBUTIONS
4 STATISTIQUES A DEUX CARACTERES
(SERIES STATISTIQUES A DEUX VARIABLES)
Sommaire
Introduction
1- Généralités
1-1 Les tableaux de distributions
1-2 Les représentations graphiques d’une série double non pondérée
2- Calcul des valeurs caractéristiques
2-1 Cas d’une série double simple
2-2 Cas d’une série double pondérée : tableau de contingence
2-3 Les distributions conditionnelles
3 Corrélation et Ajustement
3-1 Ajustement
3-2 Corrélation
Introduction
Dans les chapitres précédents, les distributions statistiques étudiées portaient sur un seul
caractère, que l’on observait sur chacune des unités statistiques composant la population. Il
arrive cependant que dans certains cas, l’on est amené à étudier sur une même population,
plusieurs caractères différents ; c’est le cas lors de l’étude des phénomènes économiques, il
est courant d’avoir affaire à plus d’une variable statistique (on parle alors d’analyse
statistique multivariée) : pour chaque observation, on recueille plusieurs informations. Ceci
complique énormément la construction des tableaux statistiques et la production de
graphiques résumant ces études.
Nous nous contenterons, dans ce chapitre, d’étudier les séries à deux variables (analyse
statistique bivariée).
Exemple :
Unité statistique Variable 1 désigné par Variable 2 désigné par
X y
Enfant d’une école Taille Poids
On étudie ensuite les variations simultanées des deux caractères x et y.
1- GENERALITES
1-1 Les tableaux de distributions (tableaux croisés ou tableaux de contingence)
Lorsque l'on étudie simultanément deux séries statistiques sur une population, on présente
les résultats sous la forme d'un tableau à double entrée appelé tableau croisé ou tableau de
contingence. Les deux variables étudiées peuvent être qualitatives ou quantitatives.
n ij n ij
nij (fréquences absolues) nombre d'individus (ou f ij n p
: fréquences relatives),
N
n
i 1 j 1
ij
. . ... . .
. . ... . .
. . ... . .
p
Total
marginal
i 1
n i1 n 1 ... n
i 1
ip
np N
(total général)
Les tableaux croisés sont les résultats de comptages dans une population P, de taille N,
étudiée suivant deux variables X et Y. On dit que l'on étudie la distribution statistique du
couple (X, Y).
Exemples :
n
j 1
2j
n 2 2197
40 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Total i 4 i 4
marginal n i 1
i1
n 1 n
i 1
i2
n 2 10034
A l’intersection d’une ligne i et d’une colonne j se trouve le nombre d’étudiants nij (fréquences
n ij n ij
absolues) ou f ij n p
(fréquences relatives)
N
n
i 1 j 1
ij
(la somme porte sur le 2nd indice de nij, le 1er indice restant égal à 1).
(la somme porte sur le premier indice de nij, le deuxième indice restant égal à 1).
Ages
(en années) [14 – 15[ [15 – 16[ [16 – 17[ [17 – 18[ Totaux marginaux
Tailles (cm)
[150 – 155[ 2 1 - - 3
[155 – 160[ 3 4 1 1 9
[160 – 165[ 4 5 5 2
[165 – 170[ 4 8 13 3
41 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
[170 – 175[ 1 4 5 4
[175 – 180[ - 1 3 6
[180 – 185[ - - - 2
Totaux marginaux 18
Interprétation :
- 2 élèves, âgés de 14 ans à moins de 15 ans, mesurent au moins 150 cm et moins de 155
cm.
- 16 élèves mesurent au moins 160 cm et moins de 165 cm (l’âge des enfants n’est pas
pris en considération ici)
- 18 élèves ont moins de 17 ans et moins de 18 ans (ici leur taille n’est pas prise en
considération)
Remarque
La série statistique double peut être lue sous la forme de deux groupes de séries statistiques
simples (chacune portant sur une seule variable). Pour notre exemple :
- Les colonnes du tableau donnent la répartition des élèves selon le caractère ‘’taille’’, les
âges étant connus ;
- Les lignes du tableau donnent la répartition des élèves selon le caractère ‘’âge’’, la taille
étant connue.
- Il existe des de croisés où les couples de modalités (xi, yi) ont des effectifs égaux à 1, on
les appelle tableau statistique croisé simple et se présente sous cette forme :
Caractère : X x1 x2 x3 . . . . . . xn
Caractère : Y y1 y2 y3 . . . . . . yn
Application
Sondage auprès de 1000 ménagères sur leur préférence pour une poudre à lessive (5 régions
x 200 ménagères)
42 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Exemple2
43 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Le point moyen du nuage est le point (noté habituellement G) dont les coordonnées sont les
moyennes marginales de la série : G ( x , y )
Exemple1
xi
[0 ; 10[ 4 1 1
[10 ; 20[ 2 6 2
44 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Exemple2
X Y
x1 y1
x2 y2
. .
45 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
. .
. .
. .
xn yn
Remarque :
Dans le cas de variables continues, on remplace les xi et yi par le centre des classes
2-1-1 Moyenne
1
n
x1 x 2 ... x n 1
n
y1 y 2 ... y n
X
n
x i 1
i
n
et Y
n
yi 1
i
n
X Y
20 250
60 400
90 600
140 1000
160 1300
5 5
. i 1
xi . y
i 1
i
5 5
1 1
X
5
xi 1
i
Y
5
y i 1
i
2-1-2 Variance
1
n
( x1 X )
2
( x2 X )
2
... ( x n X )
2
X x
2
V (X )
2
i
X
n i 1 n
1
n
( y1 Y )
2
( y2 Y )
2
... ( y n Y )
2
Y y
2
V (Y )
2
i
Y
n i 1 n
X Y
( xi X ) ( xi X )
2
yi Y yi Y
2
x1 y1
x2 y2
46 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
. .
. .
xn yn
n n
y
2 2
x i X i
Y
i 1 i 1
n n
1 1
ou bien X2 x X et Y2 y Y
2 2 2 2
V (X ) i
V (Y ) i
n i 1 n i 1
X Y 2 2
xi yi
x1 y1
x2 y2
. .
. .
xn yn
n n
y
2 2
xi i
i 1 i 1
2-1-3 Ecart-type
( x1 X )
2
( x2 X )
2
... ( x n X )
2
X V (X ) et
n
( y1 Y )
2
( y2 Y )
2
... ( y n Y )
2
Y V (Y )
n
n n
1 1
X X X y Y
2 2
ou bien xi
2
et i
2
n i 1 n i 1
2-1-4 Covariance
n
1
Cov ( X , Y ) XY
n
x
i 1
i
X y i Y
xi yi xi X yi ( xi )( y i )
47 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
x1 y1
xn yn
(x
i 1
i
)( y i )
n
1
ou bien Cov ( X , Y )
n
xi 1
i
yi X .Y
X xi Y yi xi
2
yi
2
xi y i
2 2
x1 y1 x1 y1 x1 y 1
. . . . .
. . . .
2 2
xn yn xn yn xn yn
n n n n n
x
2 2
xi yi xi yi n
yn
i 1 i 1 i 1 i 1 i 1
2-1-5 Application
On souhaite étudier la relation superficie-prix de 5 appartements dans une grande ville ;
Calculons :
1) Les moyennes de X et de Y ;
2) Les variances de X et de Y (de deux manières) ;
3) La covariance du couple (X, Y) (de deux manières).
Résolution
20 250
60 400
48 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
90 600
140 1000
160 1300
n n
x
i 1
i
470 y
i 1
i
3550
5 5
1 1 1 1
X
5
i 1
xi
5
( 470 ) 94 ; Y
5
yi 1
i
5
( 3550 ) 710 .
xi xi X ( xi X )
2
yi yi ( yi ) 2
5 5
(x i
) 2 13120 ( y
i 1
i
) 2 752000
i 1
5
1 1
V (X ) X x
2
2
i
X (13120 ) 2624
5 i 1 5
5
1 1
2 y
2
V (Y ) i
Y ( 752000 ) 150400
5 i 1 5
xi yi xi X yi ( xi )( y i )
(x
i 1
i
)( y i ) 97300
5
1 97300
Cov ( X , Y )
5
x
i 1
i
X y i Y
5
19460
Y = yj
X= xi
. . . ... . .
. . . ... . .
. . ... . .
.
i n i n
Total n
i 1
i1
n 1 ... n
i 1
ip
np N
Les distributions marginales d'un couple de variables (X, Y) sont les distributions statistiques
50 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
à une variable telle que : (xi, ni) et (yj, nj) avec i {1...n} et j {1...p}. Il existe deux distributions
marginales pour le couple (X, Y). Les distributions marginales peuvent aussi être exprimées
en fonction des fréquences relatives marginales : (xi, fi) et (yj, fj)
n
i 1
i
N
fréquences absolues
f
i 1
i
1
nj 1
j N
fréquences absolues
fj 1
j 1
La somme des fréquences relatives des deux distributions marginales X et Y est égale à 1.
51 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
p p
1
Y
N
n j 1
j y j
j 1
f j y j
(Moyenne de Y)
Variance
n n
1
X2
2 2
V (X ) n i x i X f i x i X ou
N i 1 i 1
n n
1
V (X )
N
i 1
ni xi
2
X 2
i 1
fi xi
2
X 2
p p j s j s
1
1
Y2
2 2
V (Y ) n j y j
Y f j y j
Y ou V ( Y ) n j y
2
j
Y 2
f j y
2
j
Y 2
N j 1 j 1 N j 1 j 1
Covariance
n p
1 n
1
Cov ( X , Y ) XY
N i 1
n ij x i X y j
Y ou Cov ( X , Y ) XY
N
n
i 1 j 1
ij
xi y j XY
Remarque :
2-2-3 Application
Exemple1
suivant :
52 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
ème
Y="Cycles" 1er Cycle 2 Cycle 3i ème Cycle Total
X="disciplines"
Résolution
1) Interprétations
13,8% des étudiants fréquentent l'UFR de Mathématiques (marge X = disciplines),
56,9% des inscrits le sont en 1er Cycle (marge Y = cycles),
35,1% des inscrits le sont en 1er Cycle et en Droit.
1) Les lois marginales de X et de Y
Loi marginal de X
L’ensemble des couples {(Mathématiques, 1383), (Sciences Economiques, 2197),
(Géographie, 715), (Droit, 5739)} forme la distribution marginale de la variable qualitative X
"UFR")
absolues
53 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Loi marginal de Y
L'ensemble des couples {(1erCycle, 5712), (2ième Cycle, 3163) (3ièmeCycle, 1159)} forme la
distribution marginale de la variable qualitative Y "cycles d'études" ,
absolues
Total
Exemple 2
Considérons les distributions de fréquences des couples (X, Y) où les variables X = "note en
statistique" et Y = "note en mathématique" :
centres Total
classes
modalité 1 j 4
n 1 n1 j =14
classe 1 x1=2,5 n11= 7 n12= 6 n13= 1 n14= 0 j 1
[0,5[
54 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
modalité 2 j 4
n2 n 2 j =12
classe 2 x2=7,5 n21= 4 n22= 3 n23= 2 n24= 3 j 1
[5,10[
modalité 3 j 4
n 3 n 3 j =11
classe 3 x3=12,5 n31= 0 n32= 7 n33= 3 n34= 1 j 1
[10,15[
modalité 4 j 4
n4 n 4 j =13
classe 4 x4=17,5 n41= 0 n42= 1 n43= 5 n44= 7 j 1
[15,20]
Total i 4 i 4 i 4 i 4
n 1 ni 1 n 2 n i 2 = n 3 n i 3 n 4 n i 4 =
ou i 1 i 1 i 1 i 1 N=50
Marge
n p
n
i 1 j 1
ij
xi y j
ni1xiy1+ ni2xiy2+ ni3xiy3+ ni4xiy4 = n1jx1yj + n2jx2yj + n3jx3yj + n4jx4yj
n p
ni 1 j 1
ij
xi y j
(n11x1y1 + n21x2y1 + n31x3y1 + n41x4y1) + (n12x1y2 + n22x2y2 + n32x3y2 + n42x4y2)+
n
i 1 j 1
ij
xi y j
[(n11x1 + n21x2 + n31x3 + n41x4)y1 + (n12x1 + n22x2 + n32x3 + n42x4)y2 + (n13x1 +
Ou bien :
n p
ni 1 j 1
ij
xi y j
[(n11y1 + n12y2 + n13y3 + n14y4)x1 + (n21y1 + n22y2 + n23y3 + n24y4)x2 + (n31y1 +
relatives
x1 2 .5 n 1 14 f 1
55 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Y Fréquences ou
x3 12 . 5 n 3 11
absolues Fréquences
x4 17 . 5 n 4 13 relatives
Total 4
y1 2 .5 n 1 f 1
n
i 1
i
N 50
y2 7 .5 n 2
y3 12 . 5 n 3
y4 17 . 5 n 4
Total 4
n
j 1
j N 50
1) ;
2) La covariance du couple (X, Y)
Y = yj
y1 y2 ... yp
X= xi
. . . ... .
. . . ... .
. . . ... .
2-3-1 Définition
Une distribution conditionnelle est une distribution statistique obtenue en restreignant la
population à un évènement particulier ; par exemple pour une distribution qui possède :
56 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Modalités de x1 .. xi .. xn Total
fréquences n1 j n ij n nj n j
absolues .. ..
fréquences n
1j
n
ij
n
nj
f f f
1/ j n i / j n n/ j n
j j j
relatives
.. .. 1
fréquences n n n
i1 ij ip
f f f
1/i n j /i p /i
relatives i …… n
i ….. n
i 1
Dans une entreprise de 200 salariés, on étudie les variables X=âge et Y=salaires.
Y = Salaire
X = Age
[20 ; 22[ 14 6 20
[22 ; 24[ 28 46 74
n ij f ij
par : f x fi / j f y xi
i
y j
j
n j f j
Exemple
Répartition des salaires des employés d’une grande entreprise, répartis par tranche d’âge :
58 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Déterminons la fréquence (proportion) d’employé sont l’âge est compris entre 45 et 55 ans
sachant qu’ils ont un salaire compris entre 900 et 1000 euro :
C’est la fréquence conditionnelle de [45 ; 55[ par rapport à la modalité 2([900 ; 1000[)
n 2, D 24
f2 (D ) 0 . 064 6 . 4 %
n 2 377
n ij f ij
xi), pour j = 1, ... p, par : f y f j /i fx y j
j
xi
i
ni fi
Il indique la proportion des individus présentant la modalité yj au sein du groupe de ceux qui
présentent la modalité xi. On le note aussi f (yj|xi ).
Exemple
n 2, D 24
f D ( 2) 0 . 106 10 . 6 %
n , D 226
59 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
n n
1
2 2
Variance : 2
sj X
n ij x i X j
f i / j x i X j
n j i 1 i 1
p p
1
n Yi f j /i y j Yi
2 2
Variance : si2Y ij
y j
ni j 1 j 1
Remarque :
n ij
-
N
f ij avec ni j
ij
N
n ij n ij ni n ij ni
- f ij f j /i fi
N N ni ni N
n ij n ij n j n ij n j
- f ij fi / j f j
N N n j n j N
Nous avons de manière générale la relation : f ij f j /i fi fi / j f j
2-3-4 Application
Un sondage est effectué dans une société comprenant 40% de cadres et 60% d’employés. On
sait que 20% des cadres et 10% des employés de cette société parlent l’anglais.
Nombre de cadres
Nombre d’employés
Total 100
60 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Interprétation : Interprétation
Absence de liaison entre les deux variables. Le Il existe une liaison linéaire entre les deux
nuage de points forme une sorte de boule variables. Le nuage de points à la forme d'une
droite.
Interprétation : Interprétation :
Absence de liaison linéaire entre les deux Absence de liaison linéaire entre les deux
variables. Le nuage de points à la forme d'une variables. Le nuage de points à la forme d'une
parabole, la liaison est non linéaire. branche hyperbolique, la liaison est non linéaire.
3-1-2 Principe
Soit (xi, yi) une série statistique double, avec un nuage de points Mi (xi, yi) associé.
Lorsque les points du nuage paraissent presque alignés, on peut chercher une relation de la
forme y = ax + b qui exprime de façon approchée les valeurs de la série (yi) en fonction des
valeurs de la série (xi), autrement dit, une fonction affine f telle que l’égalité y = f(x) s’ajuste
au mieux avec les données.
Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près de tous les
points du nuage. Une telle relation permettrait notamment de faire des prévisions. Il existe
plusieurs méthodes pour obtenir un ajustement affine satisfaisant.
61 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Procédé : on utilise une règle transparente qu’on dispose suivant la direction constatée, de
façon à équilibrer les points de part et d’autre de la droite (D).
Etape 2 : On calcule les coordonnées des deux points moyens G1 et G2 associés à ces deux
sous nuages, et on place ces deux points sur le graphique.
Etape 3 : On trace la droite (G1 G2), appelée droite de Mayer du nuage de points Mi (xi, yi), qui
doit passer par le point moyen G du nuage de points Mi (xi, yi) .C’est cette droite qui
constitue un ajustement affine tout à fait acceptable pour la série double (xi, yi)
Exemple
Les derniers recensements de la population d’une ville ont abouti aux données suivantes :
Nbre d’années xi
1 3 7 10 12 14 17
Depuis 2012
Population yi
4.4 4.7 4.8 4.9 5.5 5.5 5.7
(en milliers d’habitant)
62 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Exercices
Exemple1
Années 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
63 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
indice i 1 2 3 4 5 6 7 8 9 10 Total
Consommation yi 199 208 221 237 254 268 280 293 307 323 2590
Revenu xi 238 257 270 290 303 319 333 351 369 387 3117
Déterminer :
Exercice2
Les chiffres d’affaires de douze trimestres d’une entreprise ont donné après lissage le
tableau suivant rangé :
4 270
5 265
6 255
7 273
8 285
9 295
10 318
11 320
12 320
9 9
x i
y
i 1
i
i 1
On partage le nuage en deux nuage, l’un de cinq points, (1 ≤ xi ≤ 6) et l’autre de quatre points
(7 ≤ xi ≤ 12) ; les points moyens respectifs sont G 1 ( x1 , y 1 ) et G 2 ( x 2 , y 2 )
Les points Pi sont les projections parallèlement à l’axe (Oy), des points Mi sur la droite (D)
d’équation y = ax + b (même abscisse que Mi). Les points Qi sont les projections
parallèlement à l’axe des abscisses des points Mi sur la droite (D’) d’équation x = a’y + b’
(même ordonnées que Mi).
On appelle méthode des moindres carrés la méthode qui consiste à rechercher les
coefficients a et b tels que la somme S M y i ( ax i b ) soit minimale
2 2
i
Pi
i i
xy
- (D) d’équation y = ax + b est appelée droite de régression de y en x où a
x 2
et b vérifie : y a x b .
xy
- (D’) d’équation x’ = a’y + b’ est appelée droite de régression de x en y où a
y 2
Et b’ vérifie : x a y b
Application
Les chiffres d’affaires de douze trimestres d’une entreprise ont donné après lissage le
65 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Rang du Chiffre
trimestre : d’affaires
xi2 yi2 xi yi
xi (en millions de
francs) :
yi
4 270
5 265
6 255
7 273
8 285
9 295
10 318
11 320
12 320
9 9 9 9 9
x
i 1
i
y
i 1
i
x
i 1
2
i
y
i 1
2
i
x y
i 1
i i
3-2 Corrélation :
3-2-1 Notion de corrélation
Lorsque l'on désire étudier l'intensité de la liaison entre deux variables quantitatives on
adopte une approche qui permet de chiffrer l'ordre de grandeur de l'intensité de cette liaison.
On calcul pour cela le coefficient de corrélation linéaire.
66 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
XY
n ij
( xi X )( y j
Y )
r XY
i j
r
X Y n i
( xi X )² n j (y j
Y )²
i j
Propriétés
1 r xy 1
On dit qu’il existe une bonne ou forte corrélation entre x et y lorsque |r| est suffisamment
voisin de 1.
o r 1 : signifie qu’il y a une forte corrélation linéaire entre X et Y ; il existe une liaison linéaire
indirecte entre les deux variables (c'est-à-dire quand la série X augmente la série Y
diminue et réciproquement),
o r 0 : signifie qu’il y a une faible corrélation linéaire entre X et Y ; il existe peut-être une
liaison non linéaire entre X et Y,
o r 1 : signifie qu’il y a une forte corrélation linéaire entre X et Y, il existe une liaison linéaire
directe entre les deux variables (c'est-à-dire que les séries X et Y augmentent ou
diminuent en même temps).
Les deux droite (D) et (D’) passent par le point moyen G. Le coefficient de corrélation r donne
des indications sur l’angle des deux droites.
67 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
1
Si r = 1, alors aa’ = 1, donc a
2
a
Les droites (D) et (D’) sont confondues, on dit que l’ajustement affine est « parfait »
D Droite de
régression de X en Y
Variable Y
Variable Y
D Droite de
régression de X en Y
Y
G point moyen G point moyen
Y
D Droite de
régression de Y en X
D Droite de régression
de Y en X
0 X Variable X 0 X Variable X
r=1 r = -1
D Droite de
régression de X en Y
Variable Y
D Droite de
D Droite de régression de Y en X
régression de Y en X
Variable Y
Y
G point moyen
G point moyen
Y
D Droite de
régression de X en Y
0 X Variable X 0 X Variable X
Si r = 0
Les deux droite (D) et (D’) sont perpendiculaires ; on dit qu’il n’y a pas de corrélation linéaire
entre X et Y (ou il existe peut-être une liaison non linéaire entre X et Y)
68 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
D Droite de
régression de X en Y
Variable Y
G point moyen
Y
D Droite de
régression de Y en X
0 X Variable X
Remarque
Dans chaque secteur technologique ou économique, on choisit la valeur de r jugé suffisante pour
effectuer un ajustement affine par la méthode des moindres carrés. Ainsi d’un secteur technologique
à un autre les exigences peuvent varier 0.5 ≤ |r| ≤ 1 à 0.999 ≤ |r| ≤ 1…
4- AUTRES AJUSTEMEMENTS
On a recours à une forme d’ajustement lorsque le nuage de point ne semblent pas être
répartis le long d’une ligne droite; il en existe de nombreux, reposant sur différentes familles
de fonctions : les fonctions logarithmes, exponentielles, puissances, logistiques, etc.
Exemple
Le tableau ci-dessous indique le salaire brut annuel, en milliers de francs, perçu par un haut
cadre.
Rang xi 1 2 3 4 5
De l’année
69 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
L’allure de cette courbe nous fait penser à une fonction exponentielle de la forme : x e ax b
ou x e x .
70 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
4-2-2 Application
Exemple1
Reprenons le tableau précédent qui indique le salaire brut annuel, en milliers de francs, perçu
par un haut cadre et ajoutons y une quatrième ligne : z i ln y i
Rang xi 1 2 3 4 5
De l’année
(en
milliers de
Frs)
71 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Exemple2
EXERCICE I
Nous considérons 10 salariés qui sont observés à l’aide de deux variables "âge" et "salaire".
Les informations brutes (pas encore traitées ou façonnées) sont données dans le tableau
Suivant :
Salaire 60 000 74 000 75 000 82 000 82 070 89 000 91 000 99 000 99 500 107 500
Age 15 26 20 43 47 37 52 34 50 44
1- Déterminer le tableau de contingence (X : âge, Y : salaire). Pour l’âge et pour le salaire, former
respectivement des classes de pas de 10 ans et de 10 000 Frs.
2- Calculer f21, f12, f45 et f33.
3- Déterminer les effectifs marginaux de X et de Y. Tracer le nuage de points.
4- Déterminer le tableau statistique des deux séries marginales X et Y .
72 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
EXERCICE II
Le tableau suivant donne la répartition des salariés d’une entreprise en fonction de leur quotité de
travail :
EXERCICE III
Considérons le tableau de contingence suivant : le salaire mensuel X, l’ancienneté Y des ouvriers d’une
entreprise.
EXERCICE IV
Voici un sondage concernant l’opinion des populations d’un pays sur l’interdiction de la vente du tabac
aux moins de 16 ans (sondage réalisé sur un échantillon représentatif de 500 personnes majeures).
1- Recopier et compléter le tableau suivant à l’aide des informations données par les diagrammes en
secteurs circulaires. (Arrondir à l’unité la plus proche.)
73 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
2- a) Calculer la fréquence conditionnelle des personnes favorables par rapport aux fumeurs.
b) Calculer la fréquence conditionnelle des personnes favorables par rapport aux non-fumeurs.
EXERCICE V
Une société a mis au point un nouveau logiciel de gestion destiné aux PME et mène une
enquête auprès de cinq entreprises déjà équipées de micro-ordinateurs aptes à recevoir ce
logiciel, pour déterminer à quel prix chacune de ces entreprises accepterait d’acquérir ce
nouveau logiciel. Les résultats sont consignés dans le tableau ci-après :
xi yi
40 000 60
36 000 70
32 000 130
28 000 210
24 000 240
20 000 340
16 000 390
12 000 420
10 000 440
8 000 500
1- On demande de :
1-1 Représenter le nuage de points Mi (xi, yi).
1-2 Utiliser la méthode de Mayer pour déterminer une équation d’une droite d’ajustement D1
de la forme y = mx + p. Les coefficients m et p seront donnés à 10-1 près. Tracer D1 sur
le graphique.
2- Déterminer une valeur approchée à 10-3 près du coefficient de corrélation linéaire.
3- Déterminer une équation de la forme y = ax + b de la droite de régression D2 de y par
rapport à x par la méthode des moindres carrées. Les coefficients a et b seront donnés
par leur valeur approchée respectivement à 10-4 près et à 10-1 près. Tracer D2 sur le
graphique.
4- Les frais de conception du logiciel se sont élevés à 500 000 Frs, les frais variables par
logiciel vendu sont supposés négligeables.
4-1 Déduire de l’ajustement par la méthode des moindres carrées l’expression du bénéfice
théorique réalisé en fonction du prix choisi x et calculer la valeur de x permettant
d’obtenir le bénéfice théorique maximal. Quel est ce bénéfice ?
4-2 A partir des résultats de l’enquête et sans utiliser la droite d’ajustement, déterminer,
parmi la gamme des prix proposés, celui qui permettra de réaliser le bénéfice maximal.
74 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
EXERCICE VI
Les chiffres d’affaires trimestriels, pour les douze derniers trimestres, d’une entreprise
fabriquant du matériel électronique sont donnés dans le tableau suivant :
1 300
2 450
3 130
4 200
5 280
6 410
7 200
8 250
9 320
10 500
11 210
12 250
1- Représenter graphiquement le nuage de points Mi (xi, yi) dans le plan muni d’un repère orthogonal.
On prendra pour unités 1 cm sur l’axe des abscisses et 2 cm pour 100 Million de Frs sur l’axe des
ordonnées.
2-
2-1 Le nuage obtenu au 1° présente des écarts à peu près réguliers de part et d’autre d’une droite
d’ajustement tracée au jugé. On effectue souvent dans ce cas un lissage du nuage en remplaçant
les points par des points moyens. On peut utiliser la méthode des moyennes mobiles en
remplaçant la série statistique précédente par la série des moyennes mobiles des ventes en
calculant les moyennes sur quatre trimestres consécutifs et en les attribuant au quatrième
trimestre.
Etablir la série des moyennes mobiles de l’entreprise de matériel électronique en complétant
après avoir reproduit le tableau suivant :
75 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
2-2 Représenter sur la figure du 1° le nuage de points Ni (xi, zi). Les irrégularités du nuage des points
Mi ont été atténuées.
3- On considère la série des chiffres d’affaires obtenus après lissage à la question 2-1.
3-1 Déterminer la valeur approchée à 10-2 près du coefficient de corrélation linaire de la série
statistique double de variables x et z.
3-2 Déterminer par la méthode des moindres carrées une équation de la droite de régression D de z
en x. On donnera une équation de la forme z = ax + b dans laquelle a est une valeur approchée à
10-2 près et b une valeur approchée à une unité près.
STATISTIQUE
Chapitre -------------
5 LES INDICES
STATISTIQUES
76 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Sommaire
Introduction
1- Indices simples
1-1 Définition
1-2 Exemple et règles de Calcul
1-3 Propriétés
2- Indices synthétiques(ou composés)
2-1 Activité
2-2 Définition
3- Principaux Indices de la vie économique
3-1 Etude des indices des prix
3-2 Etude des indices de quantité (ou indices de consommation)
3-3 Relation entre indices de prix et de quantité
Introduction
Les indices statistiques sont des instruments de mesure synthétiques d’évolution(s)
exprimée(s) en valeurs relatives. Les indices permettent des comparaisons de grandeurs
mesurables d’après un étalon commun. De nombreuses données sont actuellement
indicées ; les exemples les plus connus sont : les indices de prix, de coût de la construction,
de coût de la vie ou du pouvoir d’achat, les indices boursier, etc.
Deux catégories d’indices sont couramment distinguées : les indices simples (ou
élémentaires) et les indices composites (ou synthétiques).
1- INDICES SIMPLES
1-1 Définition
Un indice simple exprime le rapport entre deux valeurs (ou mesure) d’un même phénomène.
Très souvent, ces valeurs s’exprime à travers le temps (mais parfois aussi, dans les espaces
géographique, institutionnel, etc.). Le rapport calculé est sans unité et est pratiquement
toujours multiplié par 100.
Si nous désignons par : V0, la valeur (ou la mesure), à la date t0, d’une grandeur étudiée (prix,
quantité, volume…), la date t0 étant appelée date de base, et par V1, la valeur (la mesure) à la
date t1, de la même grandeur, l’indice simple de la grandeur, à la date t1, calculé sur la base
V1
100, noté I1/0 est : I 1 / 0 100
V0
Cet indice est dit simple ou élémentaire, car il porte que sur une seule grandeur.
D’une manière générale, l’indice simple d’une grandeur à la date tn calculé sur la base 100 à la
date t0 est :
77 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Vn
I n /0 100
V0
A chaque indice est associée une variation de grandeur qui s’exprime de façon générale en
pourcentage :
Vn V0
n /0 100 I n/0 (1 n / 0 ) 100
V0
Remarque
8 Avant d’effectuer tout calcul, il faut s’assurer que les grandeurs (prix, quantité,…) sont
comparables : par exemple dans l’exemple suivant (paragraphe 1-2), les prix sont
associés à la même quantité de nourriture (1 kg).
9 Par convention, la première période est de rang 0, la suivante de rang 1, etc ; ainsi on aura :
I1/0 et Δ1/0, I2/0 et Δ2/0 etc.
Ce résultat signifie 1 kg de nourriture qui coûtait 100 milliers de frs le 1er mars 20(N), coûte
110 milliers de frs le 1er mars 20(N+1).
3 . 30
1 . 10
3
Signifie que 1 kg de nourriture qui coûtait 1milliers de frs le 1er mars 20(N), coûte 1.10
milliers de frs le 1er mars 20(N+1).
3 . 30 3 . 00 0 . 10
01 / 03 / 20 ( N 1 ) 1 / 0 100 100 10 %
01 / 03 / 20 ( N ) 3 . 00 1
78 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Calcul de l’indice simple pour une période futur : au 1er mars 20(N+1= calculé sur la
base 100 au 1er mars 20(N)
En supposant que le 01/03/20(N+2), le prix du kg de cette nourriture animale passe à 3.96
milliers de frs.
3 . 96
01 / 03 / 20 ( N 2 ) 2 /0 100 132
01 / 03 / 20 ( N ) 3
3 . 96 3 . 00
01 / 03 / 20 ( N 2 ) 2 /0 100 32 %
01 / 03 / 20 ( N ) 3 . 00
1-3 Propriétés
1-3-1 Réversibilité
1-3-1-1 Définition
L’indice simple I d’une grandeur, à la date t, calculé sur la base 100 à la date t0 est :
Vt 1
t /0 100 t /0 100 (1)
V0 V0
Vt
Et l’indice simple d’une grandeur, à la date t0, calculé sur la base 100 à la date t est :
V0 0 /t V0
0 /t 100 ( 2)
Vt 100 Vt
2
1 1 100
(1) et ( 2 ) t /0 100 100
V0 0 /t 0 /t
Vt 100
De même on a :
2
1 1 100
0 /t 100 100
Vt t /0 t /0
V0 100
2 2
100 100
t /0 et 0 /t car
0 /t t /0
79 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
t /0 Vt 0 /t V0 t /0 0 /t Vt V0
et 1
100 V0 100 Vt 100 100 V0 Vt
1-3-1-2 Application1
En reprenant l’exemple précédant (paragraphe 1-2),
1-3-2 Transférabilité
1-3-2-1 Définition
Considérons les mesures V0, V1, V2, d’une grandeur aux dates respectives t0, t1, t2 ; les indices
simples correspondants sont : I1/0, I1/0, I2/0.
2 /0 1 / 0 2 /1 1 / 0 2 / 1 V2 V1 V2
2 /0 car
100 100 100 100 V0 V0 V1
1-3-2-2 Application2
En reprenant l’exemple du paragraphe 1-2 :
2 /1 120
1 / 0 2 / 1 110 120
2 / 0 132 132 2 / 0 transférab ilité
100 100
1 / 0 110
80 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
3 /0 412 . 5
01 / 03 / 20 ( N 3 ) 3 /1 100 100 375
01 / 03 / 20 ( N 1 ) 1 / 0 110
Dans la nouvelle base 100 (au 01/03/20(N + 1)), montrer que les indices ultérieurs sont
respectivement :
Date t0 Date t1
A 2 3 5
B 3 4 3
C 5 8 2
10
On désire calculer un indice synthétique des prix à la date t1 (base 100 à la date t0).
Lorsqu’on observe ce tableau nous constatons qu’il y une grandeur (prix) composée des prix
des denrées A, B, C et qui évoluent chacun dans le temps (de t0 à t1).
Pour effectuer ce calcul deux méthodes s’offre à nous : calcul de l’indice des moyennes
arithmétiques pondérées ou la moyenne arithmétique pondéré des indices simples.
81 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
(3 5) ( 4 3) (8 2 )
10 (3 5) ( 4 3) (8 2 ) 43
1 / 0 100 100 100 148 . 27
( 2 5) ( 3 3) ( 5 2 ) ( 2 5) ( 3 3) ( 5 2 ) 29
10
43 29
Ou encore les prix ont augmentés de 1 / 0 100 48 . 27 % de la date t0 à la date
29
t1.
P12 Q 2 ... P1 k Q k
P11 Q 1
P 1i
Q i
1 / 0 100 i 1
100
P01 Q 1 P02 Q 2 ... P0 k Q k
k
P
i 1
0i
Q i
Avec P0i les prix respectifs des k denrées à la date t0 ; P1i les prix de ces mêmes denrées à
la date t1 et Qi les coefficients de pondération.
Remarque :
k k
En posant que :
i 1
P0 k Q k P0 Q et que P
i 1
1k
Qk P1 Q , on peut alléger l’expression
de l’indice I1/0 :
P Q 1
1 / 0
P Q 100 Q
1
100
P Q 0 P Q 0
Q
k
P1i
P
P1
100 Q i P Q
0 ik
i 1
1 / 0 100
0
Q i
Q
i 1
82 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
3 300
Denrée A : I 1 / 0 100
2 2
4 400
Denrée B : I 1 / 0 100
3 3
8 800
Denrée C : I 1 / 0 100
5 5
P11
100 Q 1
P12
100 Q 2
P13
100 Q 3 300 400 800
5 3 2
3 5 147
P01 P02 P03 2
1 / 0
5 3 2
k
Q
i 1
i
2-2 Définition
L’indice synthétique encore appelé indice composé, est un nombre sans unité, qui traduit
l’évolution dans le temps de plusieurs valeurs d’une même grandeur.
Remarque :
P Q i1 i0
PQ
i 1
100 100
1 0
£1/0 k
P i0
Q i0 P Q
0 0
i 1
Avec :
De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k
P1 n Q 10 P2 n Q 20 ... Pkn Q k 0 P in
Q i0
P Q
100 i 1
100 100
n 0
£ n /0
P10 Q 10 P20 Q 20 ... Pk 0 Q k 0 k
P i0
Q i0 P Q0 0
i 1
Remarque :
Application1 :
Q P Q P Q P
X 10 kg 50 F 12 kg 55 F 15 kg 66 F
P Q i1 i0
P11 Q 10 P21 Q 20 P31 Q 30
£ 01 - 06 - 2018 £1/0 i 1
100 100
3
P10 Q 10 P20 Q 20 P30 Q 30
P
01 - 06 - 2017
i0
Q i0
i 1
1079
£ 01 - 06 - 2018 £1/0 100 107 . 9
01 - 06 - 2017 1000
84 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
P i2
Q i0
£ 01/06/2019 £ 2 /0 i 1
3
100
P
01/06/2017
i0
Q i0
i 1
En conservant les mêmes abréviations que celles qui concernent l’indice de prix de
Laspeyres, l’indice de prix de PAASCHE à la date t1 calculé sur la base 100 à la date t0 est
calculé à l’aide la formule :
k
P Q i1 i1
P Q
i 1
100 100
1 1
I 1/0
P
k
i0
Q i1 P Q 0 1
i 1
De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k
P1 n Q 1 n P2 n Q 2 n ... Pkn Q kn P in
Q in
P Q
100 i 1
100 100
n n
I n /0
P10 Q 11 P20 Q 21 ... Pk 0 Q k 1 k
P i0
Q i1 P Q0 1
i 1
Application2
Q P Q P Q P
X 10 kg 50 F 12 kg 55 F 15 kg 66 F
85 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
- L’indice de prix de PAASCHE au mois de juin 2018 en base 100 en juin 2017 :
3
P Q i1 i1
P11 Q 11 P21 Q 21 P31 Q 31
I 1/0 i 1
100 100
3
P10 Q 11 P20 Q 21 P30 Q 31
P
i 1
i0
Q i1
1263.1 1170
- L’indice de prix de PAASCHE au mois de juin 2019 en base 100 en juin 2017 :
X
I 2 /0
Y
86 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
L’indice de quantité de Laspeyres à la date t1 calculé sur la base 100 à la date t0 est calculé à
l’aide la formule :
k
Q i1
Pi 0
Q P0
i 1
100 100
1
* £1/0 k
Q i0
Pi 0 Q 0
P0
i 1
Avec :
De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k
Q i0
Pi 0 Q 0
P0
i 1
Remarque
Le dénominateur est constant, de période en période, et il est égal à celui de l’indice de prix
de Laspeyres. Seul le numérateur évolue.
Application 3
Calculons l’indice de quantité de Laspeyres en juin 2018 calculé sur la base 100 en juin
2017 :
87 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
En permutant prix et quantités, et en conservant les mêmes abréviations que celles qui
concernent l’indice de quantité de Laspeyres, l’indice de prix de PAASCHE à la date t1 calculé
sur la base 100 à la date t0 est calculé à l’aide la formule :
k
Q i1
Pi 1
Q P1
i 1
100 100
1
* I 1/0 k
Q i0
P
i1
Q 0
P1
i 1
De façon plus générale cet indice à la date tn calculé sur la base 100 à la date t0 est :
k
Remarque
88 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
Application4
Q P Q P Q P
X 10 kg 50 F 12 kg 55 F 15 kg 66 F
- L’indice de quantité de PAASCHE au mois de juin 2018 en base 100 en juin 2017 :
3
Q i1
Pi 1
Q 11 P11 Q 21 P21 Q 31 P31
I 1/0 i 1
100 100
3
Q 10 P11 Q 20 P21 Q 30 P31
Q
i 1
i0
P
i1
1263.1 1079
3-3 Relation entre les indices de prix et de quantité (indices de LASPEYRES, de PAASCHE)
Soient IL (ou £) et Ip les indices de prix respectivement de Laspeyres et de Paasche, et
Soient *IL (ou *£) et *Ip les indices de quantité respectivement de Laspeyres et de Paasche.
89 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique
2 BTS / L2 – LOGISTIQUE – FCGE – IDA
L
On a : L L P L
P P
90 | 7
Prof Alain Mustapha Nassirou
Master Télécoms & Réseaux / Maitrise es Science : Physique