Cours STATISTIQUES L1-S1 2019-2020

Université Norbert ZONGO
STATISTIQUE
L1/S1
Professeur : Bernard ZONGO

01/01/2018
PLAN
CHAPITRE I : DEFINITION DE CONCEPTS STATISTIQUES
CHAPITRE II : LES POURCENTAGES ET LEURS APPLICATIONS
CHAPITRE III : LA PRESENTATION DES DONNEES STATISTIQUES
CHAPITRE IV : LES PARAMETRES DE POSITION ET DE DISPERSION
CHAPITRE V : LES PARAMETRES DE CONCENTRATION ET DE FORMES
CHAPITRE VI : LES DISTRIBUTIONS A DEUX CARACTERES
CHAPITRE VII : MODELES LINEAIRES SIMPLES
CHAPITRE VIII : LES INDICES STATISTIQUES
Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

CHAPITRE I : DEFINITION DE CONCEPTS STATISTIQUES
SECTION 1 : DEFFINITION DE LA STATISTIQUE

La statistique est un ensemble de méthodes permettant de décrire, d’analyser et de résumer
quantitativement des phénomènes repérés par des données nombreuses.
Ensemble de méthodes: car la statistique n’est pas une théorie en soi, mais un outil rigoureux
pour décrire des phénomènes. Dans ce sens, la statistique se met au service de son utilisateur
pour lui permettre de comprendre des faits en les comparant aux théories.
Quantitativement: car la statistique se doit d’être rigoureuse en expliquant les phénomènes

autrement que par des mots, ou autrement qu’en émettant des avis d’un ordre qualitatif.
Données nombreuses: car la statistique ne s’intéresse qu’aux données de grande dimension.
SECTION 2 : LA COLLECTE DE L’INFORMATION STATISTIQUE

La collecte ou l’élaboration de données statistiques porte le nom d’enquête. Il existe Plusieurs
méthodes d’enquêtes.
2.1 LE RECENSEMENT
C’est une enquête exhaustive auprès de toutes les unités de la population statistique que l’on
étudie. L’enquête reporte des données sur les caractéristiques de ces unités étudiées.
Exemple: Recensement Général de la Population (INSD) auprès des ménages burkinabè.
2.2 LES SONDAGES

C’est une enquête partielle menée sur un échantillon représentatif d’une population exhaustive.
Souvent les sondages sont préférés aux recensements car leur coût est inférieur. La qualité de
l’enquête dépendra du choix de l’échantillon.
Un échantillon est une sous population sélectionnée pour représenter toute la population.
L’échantillon est déterminer aléatoirement, quand tous les individus sont identiques, ou par
construction d’un échantillon représentatif, quand la population est structurée.
SECTION 3 : CONCEPTS DE BASE

Une bonne maîtrise de la statistique commence par une assimilation de quelques notions de
base, appropriées, pour déterminer des paramètres significatifs et de procéder à des
commentaires ou analyses pertinents.
3.1 POPULATION SATISTIQUE

Une population est un ensemble fini d’éléments possédant une propriété commune dans une
étude donnée. Exemple : « L’ensemble des étudiants de L1/S1 de l’ufr-seg en 2016 » La
population est composée d’individus ou d’unités statistiques : un étudiant de S1 de l’ufr-seg est
un individu. L’effectif total de la population est le nombre total d’individus noté « n ».
3.2 CARACTERE OU VARIABLE STATISTIQUE

Un caractère est une propriété caractéristique d’un individu. Un individu peut posséder un ou
plusieurs caractères. Le caractère peut être de nature qualitative ou quantitative.
3.3 LA VARIABLE QUALITATIVE

C’est une caractéristique qui ne peut pas faire l’objet d’une mesure. La variable est dite
qualitative quand les modalités sont des catégories. On distingue :
– la variable qualitative nominale : La variable est dite qualitative nominale quand les
modalités ne peuvent pas être ordonnées. Exemple : sexe, nationalité, couleur, religion, etc.
– la variable qualitative ordinale : La variable est dite qualitative ordinale quand les modalités
peuvent être ordonnées. Le fait de pouvoir ou non ordonner les modalités est parfois discutable.
Par exemple : dans les catégories socioprofessionnelles, on admet d’ordonner les modalités :
‘ouvriers’, ‘employés’, ‘cadres’. Si on ajoute les modalités ‘sans profession’, ‘enseignant’,
‘artisan’, l’ordre devient beaucoup plus discutable.
3.4 LA VARIABLE QUANTITATIVE

C’est une caractéristique qui peut faire l’objet d’une mesure. Ses éléments sont des valeurs. La
variable quantitative peut se présenter sous deux formes : La variable discrète et la variable
continue.
- Variables discrètes
La variable sera dite discrète lorsque ses valeurs possibles sont des nombres isolés, notamment
des nombres entiers.
Exemple : Le nombre d’enfants par famille, le nombre de chômeurs par pays et le nombre
d’étudiants par filière.
- Variables continues
Une variable est dite continue quand les observations qui la définissent prennent des valeurs
infinies sur un intervalle bien défini. L’intervalle peut être fermé, ouvert ou semi-ouvert.
Exemple : l’âge d’une personne et la moyenne de passage d’un étudiant.
3.5 LES MODALITES D’UNE VARIABLE

Les valeurs que peuvent prendre la variable quantitative ou les catégories (ou états) de la
variable qualitative sont appelés modalités.
Exemple :
Les modalités de la variable sexe sont : Féminin noté F et Masculin noté M.
Les modalités de la variable nombre d’enfants par famille sont 0,1,2,3,4,5,…C’est une variable
quantitative discrète.
Remarque : Ces définitions sont à relativiser, l’âge est théoriquement une variable quantitative
continue, mais en pratique, l’âge est mesuré dans le meilleur des cas au jour près. Toute mesure
est limitée en précision !
CHAPITRE II : LES POURCENTAGES ET LEURS APPLICATIONS
Les pourcentages qui sont une division par cent de valeurs observées, ne veulent rien dire en
soi. Par contre se sont des outils très pratiques pour comprendre certains chiffres. En particulier,
les pourcentages sont utiles pour:
- Rendre les proportions plus compréhensibles (plus esthétiques).
- Décrire des évolutions dans le temps.
SECTION 1 : TAUX DE CROISSANCE ET MULTIPLICATEUR

Soit V0 la valeur observée à la date de départ et, Vt la valeur observée à la date d’arrivée t .

On appelle croissance absolue entre la date zéro et la date t la valeur Vt V0 . La croissance
V  V0 Vt Val.d ' Arrivée
relative quant à elle, est égale à la valeur g = t  1=  1 . La
V0 V0 Val.Départ
croissance relative est généralement appelée taux de croissance. Ainsi, si g >0, il y a donc
accroissement de la valeur initiale V0 et, une baisse de la valeur initiale V0 si g<0.
A la date t, la valeur V0 aura augmenté ou diminué d’une valeur  égale à la croissance absolue.
La croissance absolue peut être négative ou positive. Mais  peut être aussi définie comme une
fraction d’une valeur plus large. C’est à dire   gV0 . Donc Vt V0  g.V0 (1 g)V0 .
Donc de manière équivalente, on peut dire qu’à la date t, la nouvelle valeur Vt a une valeur plus
grande ou plus petite que V0 d’une proportion égale à 1 g . Autrement Vt 1 g et le taux de
V0
V
croissance est g  1 .
t
V0
Ainsi, quand la valeur de V n’est pas connue à la date t, mais qu’on observe la valeur initiale
V0 et le taux de croissance g entre les deux dates alors on peut trouver Vt par la formule:
Vt (1 g)V0 . (1+g) est alors appelé le multiplicateur: grandeur par laquelle on multiplie la
valeur initiale pour trouver la valeur finale.
Exemple : le mois de février 2017, la fédération des patrons de boulangerie du Burkina
annonçaient que le prix de la miche de pain connaîtra une hausse de 125F à 150F tandis que le
poids de la miche passera de 180g à 200g, en mars 2017.
1) Calculer le taux de croissance du prix du pain et celui du poids.
2) Quel est le multiplicateur du prix et du poids entre février et mars 2017?
SECTION 2 : LES EVOLUTIONS SUCCESSIVES

Soit une valeur V0 à la date zéro. A la date 1, elle augmente de 50%. A la date 2, elle augmente
de 20%. D’où :
À la date 1 on a : V1(10.5)V0 (a)
À la date 2 on a : V2(10.2)V1 (b)
En remplaçant (a) dans (b) on a : V2(10.2)(10.5)V0
On peut alors trouver la valeur de V2 à la date 2, en multipliant la valeur à la date zéro ( V0 ), par
le nouveau multiplicateur composite: (1+0.2)(1+0.5), sans connaître la valeur à la date 1.
Plus généralement, Soit une valeur Vi à la date i. Si on connaît tous les taux de croissance
annuelles entre la date i et la date i+n, on peut savoir ce qu’est devenue cette valeur à la date
(i+n) avec la formule : Vin(1 gi1)(1 gi2)...(1 gin).Vi .
Démonstration :
Vin(1 gin)Vi(n1)
Vi(n1)(1 gi(n1))Vi(n2)
…
Vi2(1 gi2)Vi1
Vi1(1 gi1)Vi
En remplaçant en cascade les valeurs de V par leurs expressions, on peut trouver :
Vin(1 gi1)(1 gi2)...(1 gin).Vi (c.q.f.d)

SECTION 3 : MULTIPLICATEURS APPLIQUEES AUX GRANDEURS LIEES
3.1 La multiplication entre deux grandeurs

Soit deux grandeurs à la date t:
1/ Vt (1 gv)V0 et
2/ Ut (1 gu)U0
La grandeur qui représente leur produit sera alors égale à :
Wt Vt.Ut (1 gv)(1 gu)W0 et son taux de croissance gw(1 gv)(1 gu)1
3.2 La division entre deux grandeurs

Soit deux grandeurs à la date t:
1/ Vt (1 gv)V0 et
2/ Ut (1 gu)U0
La grandeur qui représente leur division sera alors égale à :
(1 gv) (1 gv)
Wt  Vt  W0 et son taux de croissance gw 1
Ut (1 gu) (1 gu)
SECTION 4 : TAUX DE CROISSANCE ANNUEL MOYEN ET TAUX DE

CROISSANCE GLOBALE
Si on observe deux valeurs d’une grandeur à deux dates différentes (et espacées de plusieurs
années) alors, on peut trouver le taux de croissance globale (entre ces deux dates) et le taux
de croissance annuel moyen au cours des années entre ces deux dates.
On sait que : entre une date zéro et une date t le taux de croissance est :
g Vt 1
V0
c’est ce qu’on peut appeler aussi taux de croissance global entre ces deux dates.
Le taux de croissance annuel moyen est un taux annuel de croissance constant sur la période
entre la date zéro et la date t. Il est calculé par:
1/ T
V 
g   t   1 avec T = nombre d’années sur la période entre date zéro et date t.
 V0 
Démonstration : Un taux moyen annuel est un taux constant sur la période considérée
( g1g2...gt g ).
V1(1 g )V0
V2(1 g )V1
…
Vt (1 g )Vt1 (a)
Ainsi en remplaçant dans (a) nous obtenons : Vt (1 g )TV0 et donc g  Vt
V0
 1/ T
1 .
CHAPITRE III : LA PRESENTATION DES DONNEES STATISTIQUES
Les étapes suivantes doivent être distinguées dans toute étude statistique : la collecte de
données, l’organisation, la présentation, l’analyse, l’interprétation. Les données statistiques
sont organisées suivants trois étapes :

- Examiner : qui permet de corriger les erreurs de la collecte
- Classer : dont la méthode se détermine en fonction du sujet et des variables étudiés. Les
données classées doivent être exhaustives et incompatibles
- Construire : qui consiste à dénombrer et à enregistrer les données selon le classement retenu.
Cette étape constitue la préparation de la présentation finale des données sous forme de tableaux
ou de graphiques qui conduisent directement à l’analyse et l’interprétation statistiques.
SECTION 1 : LES DISTRIBUTIONS DE FREQUENCE

Une distribution de fréquence est une répartition de l'effectif d'une population selon les
modalités ou les valeurs de la variable étudiée. Elle se présente différemment selon la nature de
la variable étudiée.
Les distributions de fréquences prennent la forme de tableaux statistique. Ces tableaux doivent
avoir un numéro qui permet de les référencer ou de les citer facilement, un titre qui décrit
brièvement le contenu du tableau. Au bas du tableau, la source ou l'origine des données
présentées doit également être mentionnée.
Tableau 1 Distribution de fréquences par sexe des étudiants de SEG S1, en 2016 (variable
qualitative)
Sexe (xi) Effectif (ni) Fréquence (fi) en %
Féminin 332 23,50
Masculin 1081 76,50
Total 1413 100
Source: construit à partir des données du service informatique (scolarité ufr-seg), 2016.
Tableau 2 Distribution de fréquences des âges des étudiants de SEG S1, en 2016
(variable discrète)
Age(xi) Effectif (ni) Fréquence (fi) en % Fréquence (fi) arrondi
17 1 0,07077141 0,07
18 2 0,14154282 0,14
19 18 1,27388535 1,27
20 87 6,15711253 6,16
21 166 11,7480538 11,75
22 231 16,3481953 16,35
23 253 17,9051663 17,91
24 273 19,3205945 19,32
25 193 13,6588818 13,66
26 91 6,44019816 6,44
27 45 3,18471338 3,18
28 32 2,26468507 2,26
29 21 1,48619958 1,49
Total 1413 100 100
Tableau 3 Distribution de fréquences des notes de statistique des étudiants de SEG S1,
session de juin 2016. (variable continue)
Note (ei) Effectif (ni) Fréquence (fi) en % Fréquence (fi) arrondi
[0-5[ 399 27,1428571 27,14
[5-8[ 345 23,4693878 23,47
[8-10[ 234 15,9183673 15,92
6

[10-12[ 249 16,9387755 16,94
[12-14[ 163 11,0884354 11,09
[14-20[ 80 5,44217687 5,44
Total 1470 100 100
Pour la suite du cours, nous adapterons les notations suivantes :

- n : pour l'effectif total de la population étudiée.
- xi : pour les différentes modalités ou valeurs (k au total) de la variable: i varie de 1 à k.
- ei : pour l’extrémité inférieure de la classe.
- ei+1 : pour l’extrémité supérieure d’intervalle.
- ni: pour les effectifs ou fréquences absolues, correspondant aux nombre d’individus présentant
k
la même observation: d'où : n= n i
i 1
- La fréquence relative, est la proportion d’individus présentant la même observation dans la
population totale. C’est aussi le rapport entre le nombre d’individus présentant la même
k
observation par rapport au nombre total d’individu. fi  ni ou fi  ni x100 , d’où  fi 1 ou
n n i 1
100%
- ai =ei+1-ei : pour les amplitudes des classes de valeurs de la variable.
- ci = e i  e i  1 : pour les centres de classes de valeurs de la variable
2
SECTION 2 : LES DISTRIBUTIONS DE FREQUENCE CUMULÉES
Les distributions de fréquence cumulée donne le pourcentage d’individus ayant une valeur inférieure
(ou supérieure) à un certain seuil. Il en existe deux types: les distributions de fréquences cumulées
croissantes et les distributions de fréquences cumulées décroissantes. Elles ne peuvent se calculer
que pour les variables quantitatives.
Les fréquences cumulées sont symbolisées par N(xi) pour les effectifs ou F(xi) pour les Fréquences.
N et F sont appelés fonction cumulative ou fonction de répartition.
N(xi) est donc l'effectif des individus dont la valeur du caractère est inférieure à x i (pour les
distributions de fréquences cumulées croissantes) ou supérieure à xi (pour les distributions de
fréquences cumulées décroissantes).
i 1 i 1
Formellement : N(xi) = n
i 1
i et F(xi) = f . D'où pour les fréquences cumulées croissantes:
i 1
i
N(-)=F(-)=0; N(+)= n et F(+)=1. Et pour les fréquences cumulées décroissantes:

N(-)=n; F(-)=1 et N(+)=F(+)=0.

Tableau 4 Distribution de fréquences cumulées croissantes et décroissantes des ages des
étudiants de seg S1, en 2016
Age(xi) Effectif (ni) Effectif cum crois Effectif cum décrois F(xi) F(xi)
N(xi) N(xi)
17 1 0 1413 0 100
18 2 1 1412 0,07 99,93
19 18 3 1410 0,21 99,79
20 87 21 1392 1,48 98,52
21 166 108 1305 7,64 92,36
22 231 274 1139 19,39 80,61
23 253 505 908 35,74 64,26
24 273 758 655 53,65 46,35
25 193 1031 382 72,97 27,03
26 91 1224 189 86,63 13,37
27 45 1315 98 93,07 6,93
28 32 1360 53 96,25 3,75
29 21 1392 21 98,51 1,49
Total 1413 1413 0 100 0
Tableau 5 Distribution de fréquences cumulées croissantes et décroissantes des notes en

statistique des étudiants de seg S1, session normale de 2016
Note (ei) Effectif (xi) Fréquence (fi) en % F(ei) % F(ei)  % ai fic
[0-5[ 399 27,14 0 100 5 10,856
[5-8[ 345 23,47 27,14 72,86 3 15,646
[8-10[ 234 15,92 50,61 49,39 2 15,92
[10-12[ 249 16,94 66,53 33,47 2 16,94
[12-14[ 163 11,09 83,47 16,53 2 11,09
[14-20[ 80 5,44 94,56 5,44 6 1,813
Total 1470 100 100 0 ///////// /////////////////////
SECTION 3 : LES REPRESENTATIONS GRAPHIQUES
Les tableaux synthétisent les données mais ne permettent pas d’avoir une vue d’ensemble des
distributions. Au contraire, les graphiques viennent compléter le travail d’analyse en apportant
une synthèse visuelle d’ensemble.
Suivant la variable observée, de nombreuses représentations peuvent être utilisées:
- Pour les variables qualitatives, les représentations possibles sont des tuyaux d'orgue ou des secteurs
circulaires ou camembert;
- Pour les variables quantitatives, on peut représenter soient:
 les diagrammes différentiels qui prennent le nom de diagramme en bâton pour les variables
discrètes et d’histogramme pour les variables continues. Ils mettent en évidence les différences
d'effectifs(ou de fréquences) entre les différentes modalités ou classes.
 les diagrammes intégraux qui prennent le nom de fonction en escaliers pour les variables
discrètes et de courbe cumulative pour les variables continues. Ils permettent de répondre aux
questions du type "combien d'individus ont pris une valeur inférieure (ou supérieure) à x i ?"
 les box-plot ou boite à moustaches.

Graphique 1 : Tuyaux d'orgue de la répartition des étudiants de Seg S1 par sexe, en
2016 (variable qualitative)
Les tuyaux d'orgue sont des rectangles isolés, de base constante, correspondant à chaque
modalité et proportionnelles en taille aux effectifs ou fréquences.
Tuyaux d'orgue
100
80
Fréquence %
60
40
20
0
Féminin Masculin
Sexe
Graphique 2 : Secteurs circulaires de la répartition des étudiants de la Seg S1 par

sexe, en 2016 (variable qualitative)
Les secteurs circulaires, permettent de visualiser des parts relatives, correspondant à une
modalité dont l'angle au centre i est proportionnel à l'effectif correspondant :
i= 360° x fi. Donc ici 1=360x0,235=84,6° et 2 =360x0,765=275,4°.
Secteurs circulaires
Féminin Masculin
Graphique 3 : Diagramme en bâtons de la répartition des âges des étudiants de Seg

S1, en 2016 (variable discrète)
Les valeurs discrètes xi, prises par la variable, sont représentées par des bâtons de hauteur
proportionnelle aux effectifs (ou fréquences). L'axe des abscisses recevant les xi, et l’axe
des ordonnées les effectifs(ou fréquences).

Diagramme en bâtons
300
250
200
Effectif (ni)
150
100
50
0
17 18 19 20 21 22 23 24 25 26 27 28 29
âge de l'étudiant (xi)
Graphique 4 : Histogramme de fréquence de la répartition des étudiants de la seg S1,

selon la note en statistique, à la session de juin 2016 (variable continue)
L'histogramme associé à chaque classe est un rectangle ayant une surface proportionnelle à l'effectif
(fréquence) de la classe. Lorsque les classes ont la même amplitude, la hauteur d'un rectangle est
k
proportionnelle à la fréquence ou l'effectif de la classe (placée en ordonnée). D’où S ai fi 100%
i 1
Lorsque les classes ont des amplitudes différentes, les fréquences où les effectifs corrigés ou encore
k
densité, remplacent les fréquences ou les effectifs. D’où S ai fic 100% .
i 1
fi
Les fréquences corrigées sont données par: fic  aic où aic est l'amplitude commune (l'amplitude
ai
fi
dominante) ou la plus petite amplitude. Les densités de fréquences par : di  .
ai
Les effectifs corrigés sont données par : nic  ni aic . Les densités des effectifs par: di  ni
ai ai
Graphique 5 : Fonction en escalier de la répartition des âges des étudiants de Seg

S1, en 2016
Pour chaque valeur xi, une barre horizontale est tracée entre elle et la valeur qui lui est
inférieure, au niveau de la fréquence cumulée (ou l'effectif cumulé) qui lui correspond. Les
valeurs prises sont portées en abscisses et les fréquences cumulées (ou effectifs cumulés) en
ordonnée.
Graphique 6 : Courbe cumulatives de la répartition des étudiants de la seg S1, selon la

note en statistique, à la session de juin 2016 (variable continue)
Une courbe cumulative est une courbe régulière passant par les points (ei, F(ei)) où les ei sont les
extrémités de classes en abscisses et les F(ei), les fréquences cumulées en ordonnées.
Graphique 7 : Box plot de la répartition des étudiants de la seg1, selon la note en

statistique, à la session de juin 2016 (variable continue)
10

Le box plot permet d'apprécier la répartition de l'effectif total autour d'une valeur centrale. Il
est représenté par une boite comprenant un axe, gradué de la valeur minimale à la valeur
maximale de la variable. L'extrémité de la boite se situe au niveau du premier quartile,
l'extrémité droite au niveau du troisième quartile, tandis qu'au niveau du second, on trouve un
trait. Deux traits, l'un partant du premier quartile à la valeur minimale et l'autre partant du
troisième quartile à la valeur maximale sont supposés représenter les moustaches.
Dans notre exemple:Q1 =4,6057; Q2=7,9220 et Q3 =11
CHAPITRE IV : LES PARAMETRES DE POSITION ET DE DISPERSION
Représenter les séries par des tableaux et des Graphiques permettent une vue d’ensemble mais
ne peuvent résumer des tendances moyennes ou encore des dispersions dans les séries.
La façon la plus commode de résumer une série se fait à partir de la tendance centrale (ou sa
valeur la plus représentative comme la moyenne) et de la dispersion de la série.
SECTION 1 : LES PARAMÈTRES DE TENDANCE CENTRALE

Lorsque l'on veut déterminer une valeur synthétique d'une population étudiée, l'on calcule un
paramètre de position car il met en évidence l’observation qui apparaît le plus souvent ou celle
qui est le plus proche de toutes les observations. Les plus usités sont le mode, la médiane, et la
moyenne arithmétique.
1.1 LE MODE
Le mode (Mo) est la valeur de la variable associée au plus grand nombre d’effectif (ou encore
à la plus grande fréquence). C'est le seul que l'on puisse déterminer lorsque la variable est
qualitative. Il est aussi le plus représentatif dans le cas où les individus sont très différents les
uns des autres du point de vue du caractère étudié. Pour les variables continues, le mode ou
classe modale peut changer suivant les découpages en classes.
Tableau 1 1 Distribution de fréquences par sexe des étudiants de la seg1, en 2016 (variable
qualitative)
Sexe (xi) Effectif (ni) Fréquence (fi) en %
Féminin 332 23,50
Masculin 1081 76,50
Total 1413 100
Dans le tableau 1 du chapitre III, chaque modalité étant bien définie, le mode va être facilement
repéré. Le sexe masculin est la modalité ayant le plus grand effectif ou la plus grande fréquence,
c’est donc cette modalité qui est le mode (Mo = Masculin).
Tableau 2 Distribution de fréquences des âges des étudiants de la seg S1, en 2016
(variable discrète)
Age(xi) Effectif (ni) Fréquence (fi) en %
17 1 0,07
18 2 0,14
19 18 1,27
20 87 6,16
11

21 166 11,75
22 231 16,35
23 253 17,91
24 273 19,32
25 193 13,66
26 91 6,44
27 45 3,18
28 32 2,26
29 21 1,49
Total 1413 100
Dans le tableau 2 du chapitre III, l’âge 24 ans correspondant à la valeur de la variable possédant
le plus grand effectif ou la plus grande fréquence. Le mode Mo est bien donc la valeur 24 ans.
Tableau 6 Tableau de calculs des densités et des fréquences corrigées des notes de
statistique des étudiants de seg1, session de juin 2004. (variable continue)
Note (ei) Effectif (ni) Fréquence (fi) en % ai di  ni nic  ni *aic fi fi
ai ai di  fic  *aic
ai ai
[0-5[ 399 27,14 5 79,5 159 5,42 10,84
[5-8[ 345 23,47 3 115 230 7,82 15,64
[8-10[ 234 15,92 2 117 234 7,96 15,92
[10-12[ 249 16,94 2 124,5 249 8,47 16,94
[12-14[ 163 11,09 2 81,5 163 5,54 11,08
[14-20[ 80 5,44 6 13,33 26,66 0,90 1,81
Total 1470 100 // ////////// ////////////// /////////////////// ///////////////////
Le mode correspond à la classe [10-12[ car, c’est à elle que correspond la densité la plus élevée.
1.2 LA MEDIANE
La médiane Me se définie comme la valeur de la variable qui divise en deux groupes d'effectifs
égaux les valeurs observées rangées par ordre croissant ou décroissant. Elle est ainsi définie de
sorte que 50% des valeurs lui soient inférieures et 50% lui soient supérieures.
Me est telle que F(Me) 50% ou N(Me) = n .
2
La médiane se détermine à partir des distributions de fréquences cumulées. Dans le cas où la
variable étudiée est discrète:
Me =xi tel que F(xi) <50% < F(xi+1) ou N(xi) < n <N(xi+1), si un tel cas existe. Sinon, la médiane
2
est un intervalle appelé intervalle médian; Me = [xi, xi+1 [ tel que F(xi+1) =50% ou N(Me) = n .
2
Dans le cas où la variable étudiée est continue, Me appartient à une classe appelée classe
médiane et est déterminer par interpolation linéaire:
Me [ei, ei+1 [ tel que F(ei) <50%< F(ei+1) ou N(ei) < n <N(ei+1)
2
n  N(ei)
F(M e) F(M e)
M e ei (ei 1 ei) ou M e ei (ei 1 ei) 2
F(ei 1) F(ei) N(ei 1) N(ei)
Tableau 4 Distribution de fréquences cumulées croissantes et décroissantes des ages des

étudiants de seg1, en 2004
12

Age(xi) Effectif (ni) Effectif cumulés croissants N(xi) Effectif cumulés décroissants N(xi)
17 1 0 1413
18 2 1 1412
19 18 3 1410
20 87 21 1392
21 166 108 1305
22 231 274 1139
23 253 505 908
24 273 758 655
25 193 1031 382
26 91 1224 189
27 45 1315 98
28 32 1360 53
29 21 1392 21
Total 1413 1413 0
En considérant la distribution des fréquences cumulées pour l’âge des étudiants de la seg S1 en
2016 (tableau 4), nous voyons que n 706,5 est compris entre N(23)=505 et N(24)=758. Par
2
conséquent, Me =23 ans.
Tableau 5 :Distribution de fréquences cumulées croissantes et décroissantes des notes en

statistique des étudiants de seg S1, session normale 2016
Note (ei) Effectif (xi) Fréquence (fi) en % N(ei) F(ei)%
[0-5[ 399 27,14 0 0
[5-8[ 345 23,47 399 27,14
[8-10[ 234 15,92 744 50,61
[10-12[ 249 16,94 978 66,53
[12-14[ 163 11,09 1227 83,47
[14-20[ 80 5,44 1390 94,56
Total 1470 100 1470 100
En considérant la distribution des fréquences cumulées de la note de statistique à la session de

juin 2004, des étudiants de la seg1 (tableau 5), nous voyons que Me  [5, 8[, ce qui implique
que :
735  399
M e  5  (8  5)  7,92 points.
744  399
La médiane peut aussi être déterminée de façon graphique. Sur une courbe cumulative, il suffit
de projeter l'ordonnée 50% sur l'axe des abscisses pour connaître sa valeur. Elle est aussi
l'abscisse du point d'intersection des courbes cumulative croissante et décroissante.
1.3 LA MEDIALE
Contrairement à la médiane qui divise en les effectifs en deux groupes égaux, la médiale quant
à elle, divise des quantités ou valeurs globales en deux groupes égaux. La détermination de la
13

médiale nécessite le calcul de fréquences f' kni xi (cas des variables discrètes) ou f' knici
ni xii 1
nici i 1
i 1
(cas des variables continues), et des fréquences cumulées F'(x i) où F'(ei)=  f '.
i 1
i
50 F'(ei)
Ml est tel que F'(Ml) =50%, d'où M l ei (ei 1ei)
F'(ei 1) F'(ei)
Tableau 7 : Tableau de calculs de la médiale d’une série de ventes (en millions de FCFA) d’un
échantillon de 500 entreprises.
Ventes ei centre ci ni fi % Fci  % n.i ci fi ' % Fi ' ci %  
[0-4[ 2 165 33 33 330 13,15 0
[4-6[ 5 250 50 83 1250 49,80 13,15
[6-9[ 7,5 50 10 93 375 14,94 62,95
[9-11[ 10 25 5 98 250 9,96 77,89
[11-50[ 30.5 10 2 100 305 12,15 87,85
500 2510 100
5013,15
M l[46[ . Donc M l 4(64) 5,479919679 millions de FCFA
62,9513,15
La médiale étant de 5 479 919,679 F cela signifie que, le cumul des ventes des entreprises dont
les ventes sont inférieures à 5 479 919,679 F est égale au cumul des ventes des entreprises dont
les ventes sont supérieures à 5 479 919,679 F.
1.4 LES QUANTILES

Un quantile, que nous noterons x , est une valeur en dessous de laquelle un pourcentage
 d'observations sont situées. F( x ) mesure donc la proportion  des individus qui possèdent
la valeur xi inférieure à x .
F(x ) F(ei)
x est tel que F( x ) = ou N( x ) =n et x = ei (ei 1ei)
F(ei 1) F(ei)
Le quantile d'ordre 0,5 ie x0,5 est la médiane.
Les quantiles d'ordre 0,25, x0,25 ; d'ordre 0,5, x0,5 ; et d'ordre 0,75, x0,75 ; sont appelés des
quartiles et divisent la population en quatre parties égales. Ils sont aussi notés Q1, Q2, et Q3.
D'où F(Q1)=25%, F(Q2)=50% et F(Q3)=75%.
Les quantiles d'ordre 0,1, x0,1 ; d'ordre 0,2, x0,2 ; …; et d'ordre 0,9, x0,9 ; sont appelés des déciles
et divisent la population en dix parties égales. Ils sont aussi notés D 1 D2, D3, …, et D9.D'où
F(D1)=10%, F(D2)=20%,… F(D9)=90%.
Les quantiles d'ordre 0,01, x0,01 ; d'ordre 0,02, x0,02 ; …; et d'ordre 0,09, x0,99 ; sont appelés des
centiles et divisent la population en cent parties égales. Ils sont aussi notés C 1, C2, C3, …, et
C99.D'où F(C1)=1%, F(C2)=2%,… F(C99)=99%.
On remarque que F( x0,5 )=F(Me)=F(Q2)=F(D5)=F(C50)=50%, alors x0,5 = Q2= D5= C50.

1.5 LA MOYENNE
Représentative de toutes les valeurs, elle fournit un très bon résumé des caractéristiques d'une
population étudiée, lorsque ses valeurs ne sont pas très différentes les unes des autres. La plus
14

couramment utilisée est la moyenne arithmétique. Dans le cas où elle n'est pas appropriée, on
fait recours soit à la moyenne géométrique, soit harmonique, soit quadratique.
1.5.1 LA MOYENNE ARITHMÉTIQUE

La moyenne arithmétique se calcule pour des phénomènes ou l'addition des valeurs a une
k
n x i i k
signification concrète: x  i 1
ou encore x   fi xi
n i 1
On peut distinguer la moyenne arithmétique simple et pondérée. Dans la moyenne arithmétique
simple toutes les valeurs de la variable ont le même poids tandis que, dans la moyenne
arithmétique pondérée chacune des valeurs de la variable est affectée d’un poids différent.
Calculons la note moyenne de statistique des étudiants de seg1, session de juin 2004 (tableau
3).
Pour cela établissons le tableau de calculs suivants
Note (ei) Effectif (xi) Fréquence (fi) en % ci fici nici
[0-5[ 399 27,14 2,5 67,85 997,5
[5-8[ 345 23,47 6,5 152,555 2242,5
[8-10[ 234 15,92 9 143,28 2106
[10-12[ 249 16,94 11 186,34 2739
[12-14[ 163 11,09 13 144,17 2119
[14-20[ 80 5,44 17 92,48 1360
Total 1470 100 786,675 11564
En appliquant la formule de la moyenne arithmétique, nous trouvons x 11564 7,866666667
1470
1.5.2 LA MOYENNE GEOMETRIQUE

Si xi sont les observation d'une variables quantitative et ni les effectifs correspondants, la
k k
moyenne géométrique est égale: G  n
x
i 1
ni
i  n x1n1  x2n2  ...  xnnk avec  ni  n
i 1
Le coefficient multiplicateur moyen est égal à la moyenne géométrique des coefficients

multiplicateurs. La moyenne géométrique est donc utilisée pour calculer des moyennes de taux
de croissance.
1.5.3 LA MOYENNE HARMONIQUE

Si xi sont les observations d'une variable quantitative, la moyenne harmonique est égale à:
n 1
H= k ou H  k
ni fi
i 1 xi
i 1 xi
La moyenne Harmonique est utilisée souvent pour calculer des performances moyennes par
unité de temps. Elle intervient lorsqu'on demande une moyenne de valeurs se présentant sous
forme de quotient de deux variables x/y (km/h, km/litre,…).
1.5.4 LA MOYENNE QUADRATIQUE

La moyenne quadratique Q se calcule dans les cas où l'on désire que la valeur moyenne soit
positive, et les cas où l'on souhaite donner plus de poids aux grandes valeurs. Sa formule est:
15

k
ni xi2 k
Q 
i 1 n
ou encore Q  fx
i 1
2
i i
1.5.5 LES PROPRIETES DE LA MOYENNE

Propriété 1: la moyenne arithmétique est linéaire. Pour deux série statistique
( xi , ni ) et ( yi , ni ), si xi  ayi  b où a et b sont des réels, alors x  ay  b
Démonstration
Propriété 2: La moyenne arithmétique peut se calculer par changement de variable

Pour cela, transformons la variables de départ X: X=aY+b en choisissant a comme l'amplitude
commune (ou la plus petite) et b comme le mode ou la médiane. Nous tirons alors une nouvelle
X b
variable Y en fonction de X: Y  . Puis nous calculons la moyenne de Y de laquelle nous
a
déduisons celle de X par application de la propriété de la linéarité. Cette opération a pour but
généralement de simplifier les calculs.
Propriété 3: La moyenne des différences à la moyenne est nulle.
k
 n (x  x )
i i
Pour toute série statistique ( xi , ni ), i 1
0
n
Preuve
Propriété 4: La moyenne est la valeur la plus proche de toutes les observations en raison
de la propriété 3, et parce qu'elle est la valeur qui minimise la moyenne des écarts à tout réel
non nul a.
Propriété 5: Pour tout série statistique (xi, ni), l'inégalité suivante est vérifiée: H<G<x<Q et
que x.hG 2
SECTION 2 : LES PARAMETRES DE DISPERSION

Ils résument le plus ou moins grand étalement des observations de part et d'autre de la tendance
centrale. C'est aussi les différences ou les écarts existant entre les individus d'une population.
Leur mesure se font avec l'étendue et les intervalles interquartile, inter décile ou inter centile
d'une part; de la variance, de l'écart type ou du coefficient de variation d'autre part.
La dispersion sera forte quand les écarts entre les valeurs sont grands. En cas de forte dispersion,
nous pourrons déduire que la moyenne de la population étudiée n'est pas significative ou
représentative de la dite population. Une moyenne est représentative de la population étudiée
lorsque sa dispersion est faible.
2.1 L'ETENDUE
L'étendue (w) d'une série statistique est la différence entre la plus grande et la plus petite valeur
de la série: w= xk-x1.
2.2 AUTRES INTERVALLES

Ils présentent une mesure alternative qui a l’intérêt de ne pas tenir compte des valeurs max. ou
min pouvant être aberrantes.
L'intervalle interquartile est la différence entre le troisième et le premier quartiles:
16

IQ=Q3-Q1
L'intervalle interquartile relatif est le rapport entre l'intervalle interquartile et la médiane, et

mesure la proportion dans laquelle la médiane est expliquée par l'intervalle interquartile:
IQR=(Q3-Q1)/Q2.
L'intervalle inter décile est la différence entre le neuvième et le premier déciles:

ID=D9-D1.
L'intervalle inter centile est la différence entre le quatre-vingt-dix neuvième et le premier

centiles:
IC=C99-C1.
Ces intervalles mesurent l'écart entre les 25% plus petites valeurs et les 25% plus grandes pour
IQ, entre les 10% plus petites valeurs et les 10% plus grandes pour ID, et entre les 1% plus
petite valeurs et les 1% plus grandes pour IC.
Dans tous les cas ils mesurent la dispersion autour de la médiane. Ils contiennent donc les 50%
de la population étudiée pour IQ, 80% pour ID et 98% pour IC.
2.3 LA VARIANCE
La variance est notée 2 ou V(X) et est la moyenne arithmétique du carré des écarts à la
moyenne:
k
 n (x  x )
i i
2
k
2  i 1
ou encore  2   fi ( xi  x )2
n i 1
Nous déduisons de cette première formule de la variance une formule plus pratique pour les
calculs:
k
n x 2
i i k
2  i 1
 x 2 ou encore  2   fi xi2  x 2
n i 1
Démonstration
k
Nous avons par conséquent aussi  2  Q 2  x 2 puisque Q = f x
i=1
2
i i
Cette proposition connue sous le nom de relation ou théorème de Koenig-Huyghens permet

d'éviter de propager tout le long du calcul de la variance les erreurs d'arrondi éventuelles qui
découleraient du calcul de la moyenne.
Etudions la dispersion des notes de statistique des étudiants de seg S1, en juin 2016. Etablissons
pour cela le tableau de calculs suivant qui nous permettra de calculer la variance.
Note (ei) Effectif (xi) Fréquence (fi) en % ci nici nici2 fici2

[0-5[ 399 27,14 2,5 997,5 2493,75 169,625
[5-8[ 345 23,47 6,5 2242,5 14576,25 991,6075
[8-10[ 234 15,92 9 2106 18954 1289,52
[10-12[ 249 16,94 11 2739 30129 2049,74
[12-14[ 163 11,09 13 2119 27547 1874,21
[14-20[ 80 5,44 17 1360 23120 1572,16
Total 1470 100 11564 116820 7946,8625
17

Appliquons ensuite la formule de la variance  2 116820 7,872 17,53248776
1470
2.4 ECART TYPE
L'écart type est la racine carré de la variance. Il s'écrit donc  et prend l'unité de la variable
étudiée. On l'appelle aussi écart quadratique moyen. L’écart type estime la dispersion autour de
la moyenne.
L’écart type de la répartition des notes de statistique des étudiants de seg S1, en juin 2016 est :
  17,53248776 4,187181362
2.5 LE COEFFICIENT DE VARIATION
Le coefficient de variation est une mesure de la dispersion relative d’une série. C’est aussi une
expression de l’écart type par rapport à la moyenne. Parfois, nous avons besoin de comparer
des dispersions de différentes séries. Or, des dispersions autour de la moyenne ne sont
comparables que pour des niveaux de moyennes comparables. Aussi, ces dispersions doivent

être exprimées dans la même unité. D’où le coefficient de variation CV 
x
Il est sans unité et nous l'exprimerons de préférence en pourcentage pour une appréciation plus
immédiate de la dispersion.
Coefficient de variation des notes de statistiques des étudiants de la seg1, en juin 2004 :
4,187181362
CV  0,5322
7,86666667
2.6 PROPRIETE DE L’ECART TYPE

Contrairement à l’étendue et aux quartiles, l’écart type permet de combiner toutes les valeurs à
l’intérieur d’un ensemble de données afin d’obtenir la mesure de dispersion. L’écart type est
sensible aux valeurs aberrantes. Une seule valeur aberrante peut accroître l’écart type et, par le
fait même, déformer le portrait de la dispersion. Il peut être donc un bon indicateur aussi de
valeurs aberrantes. Il s’exprime dans la même unité que la moyenne.
2.7 CHANGEMENT DE VARIABLE

Comme la moyenne arithmétique, la variance peut se calculer par changement de variable. En
effet, si deux variable statistiques X et Y, sont liées par la relation X=aY+b, alors nous avons
les relations suivantes:  X2  a 2 Y2 où  X2 et  Y2 sont les variances respectives de X et Y:
 X  a  Y ou  X et  Y sont les écarts types respectifs de X et de Y
-X a Y

x ay  b
Démonstration
18

CHAPITRE V : LES PARAMETRES DE CONCENTRATION ET DE FORMES
SECTION 1 : LES PARAMETRES DE CONCENTRATION
La concentration d’une distribution mesure sa répartition par rapport à une distribution idéale
où les écarts entre les observations sont parfaitement égalitaires. Donc il s’agit de comparer
deux séries de fréquences cumulées. Mais ces fréquences cumulées (distributions) doivent avoir
un lien économique rationnel entre elles.
Par exemple, 10% des entreprises occupent 90% du total du marché (ou encore 90% de part de
marché) dans une économie, c’est que la structure de marché est fortement concentrée
également (10% des entreprises détiennent un quasi monopole du marché).
Elle est souvent utilisée dans l’analyse de la distribution des salaires, de la fortune, des ventes
des entreprises, etc…
Les paramètres de concentration s’interprètent comment les paramètres de dispersion. Car à
une grande dispersion correspond obligatoirement une forte concentration.
1.1 ECART ENTRE MEDIAL ET MEDIANE
Une idée de la concentration d’une distribution peut être donnée par une différence entre sa
médiale et sa médiane : M l  M e .
On peut aussi calculer le rapport M l M e qui permet de relativiser cette différence.
w
Mais la concentration d’une distribution s’apprécie difficilement bien à partir de ces
différences. C’est pourquoi en pratique on utilise souvent les courbe et indice de concentration.
1.2 LA COURBE DE CONCENTRATION OU COURBE DE LORENZ
La courbe de concentration ou courbe de Lorenz est la courbe régulière passant par les points
de coordonnées F '(ei),F(ei) . Ici nous poserons que F(ei) pi et F ' (ei)qi
Traçons la courbe de concentration de la série de ventes (en millions d’euros) d’un échantillon
de 500 entreprises (tableau 7).
Ventes centre ni fi % Fci  pi % n.i ci  
fi ' % Fi ' ci qi % qi qi 1 % fiqi qi 1 .10 4
ei ci
[0-4[ 2 165 33 33 330 13,15 13,15 13,15 433,95
[4-6[ 5 250 50 83 1250 49,80 62,95 76,1 3805
[6-9[ 7,5 50 10 93 375 14,94 77,89 140,84 1408,4
[9-11[ 10 25 5 98 250 9,96 87,85 165,74 828,7
[11-50[ 30.5 10 2 100 305 12,15 100 187,85 375,7
500 2510 6851,75
Graphique 8 Courbe de Lorenz des ventes d’un échantillon de 500 entreprises
Pour une concentration nulle, la courbe de Lorenz et la première bissectrice sont confondues.
1.3 L’INDICE DE CONCENTRATION OU INDICE DE GINI
19

k
L’indice de GINI se calcule selon la formule suivante : i 1 fi(qi qi 1) avec 0i1
i 1
Pour l’exemple traité, i=1-0,685175=0,314825 soit 31,48%. Ce faible pourcentage relatif
confirme une faible concentration des parts de marchés.
SECTION 2 : LES PARAMETRES DE FORME
L’allure d’une courbe de fréquences peut se connaître sans être obligé de la tracer. Pour cela il
suffit de connaître ses caractéristiques de forme, c’est à dire son degré d’asymétrie ou
d’aplatissement, qui sont calculés à partir de paramètre de tendance centrale et de dispersion
ou des moments.
2.1 LES MOMENTS
Un moment est une moyenne des écarts par rapport à un réel non nul « a » élevés à une puissance
« r » ; r étant un entier naturel positif ;
Le moment d’ordre r par rapport à a est le nombre mr a  :
k
n  x  a 
r
i i k
mr a  i 1 ou encore mr a  fixi a 
r
n i 1
En posant a=0, nous définissons le moment non centré d’ordre r noté mr :

k
n x i ir k
mr  i 1 ou encore mr  fi xir
n i 1
Nous obtenons le moment centré d’ordre r, r , en posant a= x

k
n  x  x 
r
i i k
r  i 1 ou encore r  fixi  x 
r
n i 1
Remarques : m0 1;m1  x ;m2 Q2;0 1;1 0;2  2 m2 m1

Il existe des relations entre les moments centrés et les moments non centrés que l’on pourra
démontrer en utilisant le binôme de Newton.
r 2 r 2
- r 1 Cr m1 mr  1 r 1m1r et mr Cr r  m1 m1r
 r 1
 0  0
En appliquant la première formule, nous trouvons :

3 m3 3m1m2 2m13 et 4 m4 4m3m1 6m2m12 3m14 .
Les quatre étapes suivantes sont nécessaires dans le calcul des moments centrés d’une variable X.
a) Effectuer u changement de variable : Y  X b
a
b) Calculer les moments non centrés de la variable Y notés mr Y 
c) Calculer les moments centrés de la variables Y notés r Y 
d) Déduire les moments centrés de la variable X notés r  X  à partir de la relation
r  X ar r Y 
2.2 L’ASYMETRIE
20

L’asymétrie mesure la régularité ou non de la répartition des observations autour d’une valeur
centrale. Elle peut se repérer par comparaison des paramètres de tendances centrales ou par
calcul des coefficients d’asymétrie.
2.2.1 COMPARAISON DES PARAMETRES DE TENDANCES CENTRALES
L’allure d’une série peut se deviner en comparant le mode, la médiane et la moyenne.

Si Mo=Mé=Moyenne alors la série est symétrique
Si Mo>Mé et Mo>Moyenne alors la distribution est étalée vers la gauche (ou oblique à droite)
Si Mo<Mé et Mo<Moyenne alors la distribution est étalée vers la droite (ou oblique à gauche)
2.2.2 LE COEFFICIENT D’ASYMETRIE DE YULE
Le coefficient d’asymétrie de Yule est basé sur les écarts de quartiles. Il s’écrie :
(Q3  M e )  ( M e  Q1 ) Q1  Q3  2 M e
AY  
(Q3  M e )  ( M e  Q1 ) Q3  Q1
Si AY = 0 la distribution est dite symétrique. Sinon elle est asymétrique à droite (étalement des
observations vers la droite) : cas où 0  AY  1 , ou asymétrique à gauche (étalement des
observations vers la gauche) : cas où  1  AY  0 .
2.2.3 LES COEFFICIENTS D’ASYMETRIE DE PEARSON
Pearson établit une statistique basée sur les écarts entre moyennes et Modes. Ainsi, Pour une
distribution unimodale, le premier coefficient d’asymétrie de Pearson est :
x  MO
AP1  avec  1  AP1  1 . AP1 s’interprète comme AY 1 .

 32  32
Le second coefficient d’asymétrie de Pearson est : AY 2  3 ou encore AY 2  6 avec AY 2  0 .
2 
La distribution est dite symétrique pour AY 2  0 , faiblement asymétrique pour AY 2 petit et
fortement asymétrique pour AY 2 grand.
2.2.4 COFFICIENT D’ASYMETRIE DE FISHER

 
Il est noté AF : AF  3 ouAF  33 ou encore AF   AY 2 .
 23 
En pratique, si AF ]  0,5;0,5[ , la distribution est dite symétrique. Sinon elle est dite
asymétrique à droite pou r AF  0 , ou asymétrique à gauche pour AF  0 .
2.3 LES COEFFICIENTS D’APLATISSEMENT DE PEARSON ET DE FISHER
21

L’aplatissement se défini par la variation de la fréquence en fonction de la variation de la valeur
de la variable.
2.3.1 LE COFFICIENT D'APLATISSEMENT DE PEARSON
Il s’écrit :
 
B P  42  44
2 
Si B P =3 alors la distribution est mesocutique (moyennement aplatie) ou est normale
Si B P >3 alors distribution est leptocurtique (faiblement aplatie) ou moins aplatie que la
distribution normale.
Si B P <3 alors distribution est platicurtique (fortement aplatie) ou plus aplatie que la
distribution normale
La quantité 3  BP est appelée excès d’aplatissement.
2.3.2 LE COFFICIENT D’APLATISSEMENT DE FISHER
Il s’agit d’un coefficient de Pearson centré sur 0. Il s’exprime en écart à la valeur correspondant
à la loi normale (i.e. en déviation par rapport 3).

BF  44  3  BP  3

Dans la mesure où BF est exprimé en fonction de BP , son interprétation est immédiate à partir
de celle de BP .
CHAPITRE VI : LES DISTRIBUTIONS A DEUX CARACTERES
L'étude simultanée de plusieurs caractères, sur une population donnée est possible. Cette
étude sera l'objet de ce chapitre. Il ne prendra en compte que le cas de deux caractères en
insistant sur les concepts qui ne sont pas communs aux distributions à un caractère comme le
tableau de contingence, les distributions marginales et conditionnelles, la relation entre
caractères et la covariance..
SECTION 1 : TABLEAU DE CONTINGENCE
Tableau 9 Tableau de contingence

X Y y1 y2 ……. yj ……. yp ni.
x1 n1.
x2 n11 n12 n1j n1p n2.
. . . . . . . .
.
xi ni1 ni2 nij nip ni.
. .
.
xk nk1 nk2 nki nkp nk.
n.j n.1 n.2 n.j n.p n
22

Tout tableau à double entrée comprenant une variable en ligne et une en colonne sera appelé
tableau de contingence.
Tableau 10 Répartition des étudiants de seg1 selon la note en MATH et en STAT à la

session de juin 2004.
[0-5[ [5-8[ [8-10[ [10-12[ [12-14[ [14-20[ ni.

[0-5[ 372 250 136 101 47 9 915
[5-8[ 23 79 72 103 60 25 362
[8-10[ 2 11 21 26 31 18 109
[10-12[ 2 5 5 14 17 15 58
[12-14[ 0 0 0 3 6 9 18
[14-20[ 0 0 0 2 2 4 8
n.j 399 345 234 249 163 80 1470
Appelons X,la variable en ligne, et Y la variable en colonne et notons leurs modalités
respectives par xi et yj avec i= 1,…,k et j= 1,…,p. Elles correspondent aux centres de classe
lorsque les variables sont continues comme dans notre exemple où X représente la note en
MATH et Y la note en STAT.
k p
L'effectif total est alors n   nij .
i 1 j 1
nij
fij  Fréquence du couple de modalité (xi, yj) ou fréquence totale ou encore la proportion
n
d'individus qui présentent simultanément les modalités x i et yj.
k p
k p
n k p  n ij
Par ailleurs, nous avons

i 1 j 1
 fij  1 puisque  fij 
i 1 j 1 n n
1 i 1 j 1

Considérons les variables séparément afin de définir les distributions marginales.
SECTION 2 : LES DISTRIBUTIONS MARGINALES
Dans le cas d'une distribution à deux caractères, nous pouvons définir deux distributions
marginales: la distribution marginale selon le caractère X et la distribution marginale selon le
caractère Y.
2.1 LES DISTRIBUTIONS MARGINALE SELON X

C'est l'étude de la variable X, en calculant ses caractéristiques comme une distribution à une
variable. Les effectifs considérés sont les ni..
- ni.: nombre d'individus présentant la modalités xi (indépendant de yi)
p k
Donc ni.   nij et n   ni. .
j 1 i 1
n
- f i.  i. : fréquence des individus présentant la modalité xi (indépendamment de y j ) .
n
k
p k
n n i.
Nous avons aussi fi.   fij et  fi. 
 1. i 1

j 1 i 1 n n
La moyenne et variance ainsi obtenues, seront appelées moyenne marginale de X et variance
marginale de X.
23

La moyenne marginale de X
La moyenne de la variable X est appelée moyenne marginale de X. Sa formule est:
k
n x i. i k
x i 1
  fi. xi .
n i 1
Pour la distribution donnée en exemple, x  4,50986395 sera concrètement la note moyenne

en math des 1470 étudiants.
La variance marginale X
La variance de la variable X est appelée variance marginale de X et est notée V(X). Sa
formule est:
k
 n (x  x )
i. i
2
k
V (X )  i 1
  fi. ( xi  x ) 2
n i 1
La relation de Koenig est évidemment applicable aussi.

Pour notre exemple, V(X)= 8,378304 sera la variance des notes en math.
2.2 LA DISTRIBUTION MARGINALE SELON Y
C'est l'étude de la variable Y, en calculant ses caractéristiques comme une distribution à une
variable. Les effectifs considères sont les n.j.
- n.j.:nombre d'individus présentant la modalités yj (indépendant de xi)
k p
Donc n. j   nij et n   n. j .
i 1 j 1
n. j
- f. j  : fréquence des individus présentant la modalité yi (indépendamment de x j ) .
n
p
k
n p n .j
Nous avons aussi f. j   fij et  j 1

 1. f. j  
i 1 j 1 n n
La moyenne et variance ainsi obtenues, seront appelées moyenne marginale de Y et variance
marginale de Y.
La moyenne marginale de Y
La moyenne de la variable Y est appelée moyenne marginale de Y. Sa formule est:
p
n .j yj P
  f. j y j .
j 1
y
n j 1
Pour la distribution donnée en exemple, y 7,86666667 sera concrètement la note moyenne en

statistique des 1470 étudiants.
La variance marginale Y
La variance de la variable Y est appelée variance marginale de Y et est notée V(Y). sa
formule est:
24

p
n .j ( y j  y )2 p
V (Y )  j 1
  f. j ( y j  y ) 2
n j 1
La relation de Koenig est évidemment applicable aussi.

Pour notre exemple, V(Y) =17,58494 sera la variance des notes en statistique des 1470
étudiants.
SECTION 3 : LES DISTRIBUTIONS CONDITIONNELLES
Une distribution à deux caractères présente deux types de distributions conditionnelles: Les
distributions conditionnelles de X liées par Y que nous notons par X/yj et les distributions
conditionnelles de Y liées par X que notons Y/xi.
3.1 LES DISTRIBUTIONS CONDITIONNELLES DE X LIEES PAR Y
Elle sont au nombre des p modalités de la variables Y. Pour chaque distribution, une colonne
comprendra les modalités xi et l'autre les effectifs nij(j étant fixé).
n
- f i j  ij , se lit : "f i si j ": fréquence conditionnelle de la modalité xi liée par yj. C'est la
n. j
fréquence des individus qui présentent la modalité xi parmi les individus présentant la
modalité yj.
k
k n ij
n. j
Nous avons par ailleurs l'égalité
n. j n. j
 1. 
i 1
fi j i 1

Comme pour les distributions marginales, nous présentons les moyennes et variances des
distributions conditionnelles.
La moyenne conditionnelle de X/yj

La moyenne de la variable X/yj est appelée moyenne conditionnelle de X/yj. Sa formule est:
k
n x ij i k
xj  i 1
  f i j xi .
n. j i 1
Ainsi, x3 4,495726 est la moyenne en math des étudiants qui ont une note de statistique
comprise en 8 et 10.
La variance conditionnelle de X/yj

La variance de la variable X/yj est appelée variance conditionnelle de X/yj et est notée Vj(X).
k
 n (x  x )
ij i j
2
k
Sa formule est: V j ( X )  i 1
  f i j ( xi  x j ) 2 .
n. j i 1
Ces formules peuvent également être développées selon la relation de Koenig.

Par exemple, la variance des notes en math des étudiants ayant une note en statistique
comprise en 8 et 10, est V3(X)6,275623 .
3.2 LES DISTRIBUTIONS CONDITIONNELLES DE Y LIEES PAR X

25

Elle sont au nombre des k modalités de la variables X. Pour chaque distribution, une colonne
comprendra les modalités yJ et l'autre les effectifs nij(i étant fixé).
n
- f ji  ij , se lit : "f j si i": fréquence conditionnelle de la modalité yj liée par xi. C'est la
ni.
fréquence des individus qui présentent la modalité yj parmi les individus présentant la
modalité xi.
p
ni. k n ij
Nous avons par ailleurs l'égalité

i 1 ni. ni.
1. f j
i
 j 1

Comme pour les distributions marginales, nous présentons les moyennes et variances des
distributions conditionnelles.
La moyenne conditionnelle de Y/xi

La moyenne de la variable Y/xi est appelée moyenne conditionnelle de Y/xi. Sa formule est:
p
n ij yj k
yi  j 1
  f ji y j .
ni. i 1
Ainsi, y5 14,66666667 est la moyenne en statistique des étudiants qui ont une note de math
comprise entre 12 et 14.
La variance conditionnelle de Y/xi

La variance de la variable Y/xi est appelée variance conditionnelle de Y/xi et est notée Vi(Y).
p
n (y ij j  yi ) 2 k
Sa formule est: Vi (Y ) 
j 1
  f ji ( y j  yi ) 2 .
n. j i 1
Ces formules peuvent également être développées selon la relation de Koenig.

Par exemple, la variance des notes en statistique des étudiants ayant une note en math
comprise en 12 et 14, est V5(Y)5,88888889 .
SECTION 4 : RELATIONS ENTRE DISTRIBUTIONS MARGINALES ET

CONDITIONNELLES
Au niveau des effectifs, nous avons les égalités suivantes:

k p k p
n   nij   ni.   n. j
i 1 j 1 i 1 j 1
Pour les fréquences, nous aurons:

p k
* fi.   fij et f. j   fij
j 1 i 1
ni. nij n n
* f ij  f i. xf ji  f. j xf i j puisque f i. xf ji =
x et f. j xf i j = . j x ij .
n ni. n n. j
La relation entre les moyennes est donnée par:
26

p
n .j xj p
*x 
j 1
  f. j x j
n j 1
k
n y i. i k
*y i 1
  fi. yi
n i 1
C'est à dire que la moyenne marginale est égale à la moyenne des moyennes conditionnelles.
En effet:
k k p p k p
 n x  n x  n x  n
i. i
i 1 j 1
ij i
j 1 i 1
ij i
j 1
.j xj
x i 1
   et
n n n n
p p k k p k
 n. j y j
j 1
 nij y j
j 1 i 1
 nij y j
i 1 j 1
n y i. i
y    i 1
n n n n
Nous en déduisons la relation qui suit: inf( x j )  x  sup( x j );inf( yi )  y  sup( yi ) .

S'agissant des variances, nous obtenons:
p p
 n. jV j ( X ) n .j ( x j  x )2 p p
  f. jV j ( X )   f. j ( x j  x ) 2
j 1 j 1
* V (X )  
n n j 1 j 1
K K
 n V (Y )  n ( y  y )
i. i i. i
2
k k
* V (Y )  i 1
 i 1
  fi.Vi (Y )   fi. ( yi  y ) 2
n n i 1 i 1
C'est à dire que la variance marginale est égale à la moyenne des variances conditionnelles
augmentée de la variance des moyennes conditionnelles.
En effet:
k k p p k p k p
V ( X )   fi. ( xi  x ) 2   f ij ( xi  x ) 2   f. j  f i j ( xi  x ) 2  f. j  f i j ( xi  x j ) 2   f. j ( x j  x ) 2
i 1 i 1 j 1 j 1 i 1 j 1 i 1 j 1
P p k k p k p k
V (Y )   f. J ( y j  y ) 2   fij ( y j  y ) 2   fi.  f ji ( y j  y ) 2  fi.  f ji ( y j  yi ) 2  f i. ( yi  y ) 2
J 1 j 1 i 1 i 1 j 1 i 1 j 1 i 1
La dispersion de la distribution marginale résulte donc de deux facteurs :

- la dispersion de chacune des distributions conditionnelles autour de leur moyenne ;
- la dispersion des moyennes conditionnelles entre elles.
SECTION 4 : LA COVARIANCE
La covariance peut être considérée comme la variance d’une distribution à deux variables. Si
l’on posait X= Y, on retrouverait la formule de la variance. Autrement, la covariance de deux
variable statistique X et Y, notée COV(X, Y), est le moment centré d’ordre 1 et 1.
27

k p
nij(x  x)(y  y) i j
k p
COV(X, Y) = i j
ou encore COV(X,Y) =  fij (xi  x )(y j  y)
n i j
La covariance est nulle si les deux variables sont indépendantes. Cette grandeur interviendra
dans l’étude de la liaison entre deux variables et, notamment, dans celle de la corrélation.
Il est possible, pour obtenir une expression mieux adaptée au calcul numérique, de développer
la formule de définition.
k p
n x y ij i j
Ainsi, on obtient que : CCOV(X, Y) = i j

 xy
n
k p
ou encore COV(X, Y) =  f x y  xy
i j
ij i j
Preuve
k p k p
 fij(xi  x)(y j  y) =  fijxi y j  xi y  xy j  xy 

i j i j
k p k p k p
=  fij xi y j  y fij xi  x fij y j  xy fij
i j i j i j
k p k p k
 f x  x  f  f x  x
i j
ij i
i
i
j
ij
i
i. i
k p p k p
 fij y j  y j fij  f.j y j  y

i j j i j
d’où
k p
COV(X, Y) =  f x y  xy
i j
ij i j
Etablissons un tableau de calculs qui nous permettra de calculer COV(X, Y) de la répartition

des étudiants de la seg1-UO selon les notes de mathématique et statistique, à la session de juin
2004.
p p
nij y j
j 1 yi
xi nij y j
j 1
2,5 6,5 9 11 13 17 ni.
6,1792349
2,5 372 250 136 101 47 9 915 5654 7 14135
9,8259668
6,5 23 79 72 103 60 25 362 3557 5 23120,5
11,564220
9 2 11 21 26 31 18 109 1261 2 11344,5
12,284482
11 2 5 5 14 17 15 58 712,5 8 7837,5
14,666666
13 0 0 0 3 6 9 18 264 7 3432
17 0 0 0 2 2 4 8 116 14,5 1972
n.j 399 345 234 249 163 80 1470 61841,5
k
n x
i 1
ij i
1119,5 1292,5 1052 1383 1085,5 697
28

4,49 5,5542168
xj 2,8058 3,7464 573 7 6,65951 8,7125
k
y j nij xi
i 1 2798,8 8401,3 9468 15213 14111,5 11849 61841,5
En appliquant la formule, on obtient :
61841,5
COV(X,Y) 4,5x7,866,69904762
1470
Remarques
- COV(X, Y)>0  X et Y varient dans le même sens (corrélation ou dépendance positive).
- COV(X, Y)<0  X et Y varient en sens contraire (corrélation ou dépendance négative).
- COV(X, Y)=0  X et Y ne sont pas corrélées. Il y a donc une indépendance linéaire. A
l'inverse, si X et Y sont totalement indépendantes, la covariance est nulle; la réciproque étant
fausse.
- COV(X, X) = V(X)
 et   , COV ( X ,  Y )   COV ( X , Y )
- Si on a X =aX'+b et Y= a' Y'+b', alors COV(X, Y) =aa'COV(X', Y') (changement de variable).
CHAPITRE VII : MODELES LINEAIRES SIMPLES
Il est fréquent, dans une étude élémentaire, de chercher à préciser une liaison éventuelle entre
deux grandeurs pour lesquelles on dispose d'une série d'observations jointes. Ainsi :
- la taille et le poids des membres d'un groupe d'étudiants
- le salaire et le solde bancaire moyen des clients d'une banque
- le revenu annuel et le nombre moyen de voiture par habitant
- le revenu par habitant et le taux d'analphabétisme
- le taux de criminalité et le nombre de policier par habitant
Cette étude commence généralement par la représentation du nuage de points. Du nuage de

points, on déduit la courbe de régression. La courbe de régressions, est un moyen graphique de
synthétiser l’allure de la distribution formé par deux variables. La régression, quant à elle, vient
fournir l’expression mathématique, de l’existence éventuelle d’une liaison entre deux variables.
Dans un problème de régression, les variables se distinguent de deux façons .L'une d’elle est la
variable indépendante(ou explicative) généralement notée X, et l’autres est la variable
dépendante(ou expliquée) notée généralement Y.
SECTION 1 : LE NUAGE DE POINTS ET COURBE DE REGRESSION

Un nuage de points est la représentation des couples de points (xi, yj) dans les cas où, nij =1 quand
i=j et nij=0 quand i  j. Dans le cas contraire il faire correspondre à chaque xi la moyenne
conditionnelle y j et, à chaque yj, la moyenne conditionnelle x j . Cette représentation, à travers les
courbes de régression, décrit l’évolution de la valeur moyenne d’une variable en fonction de chaque
modalité de l’autre variable. Les courbes de régression résument le lien qui existent en tendance
entre une variable et une autre et, présente trois: La liaison nulle (courbes de régressions sont des
droites perpendiculaires), La liaison fonctionnelle ou totale (courbes de régressions sont
confondues) et la liaison relative (les caractères sont dépendants l’un de l’autre) est le cas le plus
général.
Représentons le nuage de points et la courbe de régression de la double série des notes en

mathématiques et en statistique du tableau suivant ci-dessous.
29

Tableau 12 notes de mathématique en fonction de la note moyenne en statistique des étudiants
de la seg1-UO, en juin 2004
xi 2,5 6,5 9 11 13 17
yi 6,17923497 9,82596685 11,5642202 12,2844828 14,6666667 14,5
Graphique 9 Nuage de points et courbe de régression des notes de mathématique en fonction

de la note moyenne en statistique des étudiants de la seg1-UO, en juin 2004
La courbe de régression montre que plus la note en mathématiques augmente, plus celle en
statistique augmente également de façon un peu prononcée.
SECTION 2 : AJUSTEMENT D’UNE COURBE DE REGRESSION A UNE

FONCTION MATHEMATIQUE
Le nuage de points associés à des séries statistiques à deux caractères peuvent présenter différentes
formes. Le nuage peut présenter des points qui sont presque alignés ou laisser simplement apparaître
une direction d'allongement privilégiée. Dans ce cas, la courbe de régression associée va présenter
un caractère linéaire. Le nuage peut ne pas manifester de structure particulière. Dans ce cas, sa
courbe de régression, peut par exemple, présenter un caractère exponentielle, puissance, ou encore
polynomial, qui peuvent se ramener à un cas linéaire par changement de variable.
2.1 AJUSTEMENT LINEAIRE
L'ajustement linéaire est la recherche de la "meilleure" droite résumant la structure du nuage.
2.1.1 PAR LA DROITE DE MAYER

L'ensemble des points (xi, yi) sera divisé en deux sous ensembles E1 et E2 ayant le même nombre de
points si possible. Puis on tracer une droite appelée droite de Mayer qui passera par le centre de
gravité G1 de E1 et le centre de gravité G2 de E2.
G1 aura pour coordonnées la moyenne des abscisses de E1 ( x1 ) et la moyenne des ordonnées de E1 (
y1 ) : G1 ( x1 , y1 ). G2 aura pour coordonnées la moyenne des abscisse E2 ( x2 ) et la moyenne des
ordonnées de E2 ( y2 ) : G2 ( x2 , y2 ).
Illustrons la droite de Mayer par notre double série de note en math et en statistique(données du
tableau 12).
xi 2,5 6,5 9 11 13 17
yi 6,17923497 9,82596685 11,5642202 12,2844828 14,6666667 14,5
A partir du obtient : G1(6 ;9,18) ; G2(13,67 ;13,81)
Graphique 10 Nuage de point et droite de Mayer de la double série de notes
La construction de la droite de Mayer est rapide, simple et fournit une droite convenable lorsque les
points du nuage sont presque alignés comme ici. Mais elle ne donne pas une mesure de sa fiabilité,
due à sa simplicité.
2.1.2 PAR LA METHODE DES MOINDRES CARRES

La méthode des moindres carrés résume une courbe de régression par une droite tel que, les
distances prises entre chaque point du nuage et la droite soient minimale. la courbe de regression
30

conditionnelle est remplacée ici par une droite. Cette droite appelée droite de régression ou
droite d’ajustement ou droite des moindres carrés.
Notons  la moyenne du carré des écarts entre les yj observés et les yj donnés par l'équation de la
droite D.
k p
   fij ( y j  axi  b) 2
i 1 j 1
La droite de régression de Y en X, encore appelée droite des moindres carrés, est la droite qui
minimise . C'est la droite qui passe le plus près possible des points yj observés.
L a méthode des moindres carrés permet de déterminer cette droite, c'est à dire de trouver les
valeurs de a et b qui minimisent .
 k p
Posons  0 Cela est équivalent à  2 fij ( y j  axi  b)  0
b i 1 j 1
Nous en déduisons par développement de l'équation que la valeur de b qui minimise  est:
b  y  ax .
Remplaçons b par sont expression dans :
k p k p
   fij ( y j  axi  y  ax ) 2   fij ( y j  y  a ( xi  x )) 2
i 1 j 1 i 1 j 1

Posons que 0
a
Nous aurons par équivalence:
k p
2 fij ( xi  x )( y j  y  a ( xi  x ))  0
i 1 j 1
k p
 fi 1 j 1
ij ( xi  x )( y j  y )
puis a  k p
qui est la valeur qui minimise 
 f
i 1 j 1
ij ( xi  x ) 2
k p
L'expression  f
i 1 j 1
ij ( xi  x )( y j  y ) numérateur de a est appelée covariance de X et de Y et notée
COV(X,Y) ou  XY
En pratique on peut utiliser également la formule suivante de la covariance par développement de la
k p
première: COV ( X , Y )   fij xi y j  xy
i 1 j 1
k p
L'expression  f
i 1 j 1
ij ( xi  x ) 2 (dénominateur de a) est en fait la variance marginale de X, V(X)
k
puisqu'elle est égale à  f (x  x )
i 1
i. i
2
Finalement, l'équation de la droite de régression de Y en X écrite sous la forme de Y=aX+b et

déterminée par la méthode des moindres carrés est définie par:
31

 COV ( X , Y )
a 
 V ( X ,Y )
b  y  ax

a et b sont appelés coefficients de régression. a , pente de la droite, mesure la variation de Y qui
accompagne la variation d'une unité de X. b , ordonnée à l'origine , correspond à la valeur de Y
lorsque X=0
NB
L'équation de la droite de régression de X en Y écrite sous la forme X=a'Y+b' et déterminée par la
méthode des moindres carrés est définie par:
 COV ( X ; Y )
a ' 
 V (Y )
b '  x  a ' y

Pour illustration, déterminons les équations des droites de régression, de Y en X et de X en Y,
pour le nuage de points relatif aux séries de notes en math et en statistique. Nous appliquons
ensuite les différentes formules :
61841,5
4,50x7,86
a 1470 = 0,80 ; b=7,86-(0,80x4,50)=4,26 (les moyennes et les variances ayant
8,37
été précédemment calculées).
L’équation de la droite de régression de Y en X sera donc :Y=0,80X+4,26.
Elle permet de connaître la note de statistique lorsqu’on connaît la note en mathématique. Et
puisque a= 0,80, c’est dire que lorsque la note en mathématique augmente d’un point, celle en
statistique augmente de 0,80 points. b= 4,26 implique une note de 4,26 en statistique pour une
note de zéro en mathématique.
61841,5
4,50x7,86
a'  1470 0,38 ; b’=4,50-(0,38x7,86)=1,5
17,58
L’équation de la droite de régression de X en Y sera donc : X=0,38Y+1,51
Elle permet de connaître la note en mathématique lorsqu’on connaît la note en statistique. Et
puisque a’= 0,38, c’est dire que lorsque la note en statistique augmente d’un point, celle en
mathématique augmente de 0,38 points. b’=1,51 implique une note de 1,51 en mathématique
pour une note de zéro en statistique.
Remarque 1
Si aa’ = 1, c’est à dire a 1 les droites de régression seront identique et auront la même pente.
a'
Cette situation correspond précisément au cas où les points du nuages sont alignés.
2.2 AJUSTEMENT PAR UNE FONCTION EXPONENETIELLE
Si l’allure du nuage de points laisse pressentir une relation globale de type exponentiel, liant
deux variables X et Y, il convient alors d’ajuster ce nuage de points par une courbe dont
l’équation prend la forme : Y  AX.
Le raisonnement consiste à dire que si les points xi, yi  sont proches de la courbe Y  AX, alors
les points ( (xi,ln yi) seront proches de la droite d’équation ln yi ln  xi ln A .
Posons y lnY , aln A et bln , nous voyons que cette équation prend la forme de l’équation
d’une droite y = aX+b.
32

Cette droite est déterminer par la méthode des moindres carrés par laquelle nous obtenons les
expressions de a et b :
et b y aX lnY (ln A)X
a COV(X, y) a COV(X,lnY)

 V(X) V(X)
Comme A=ea et  =eb , nous déterminons finalement à partir de ces formules l’équation de la
courbe exponentielle.
Appliquons un ajustement exponentiel au nuage de points xi, yi  de la double série des notes en
mathématiques et en statistique.
Les résultats suivant sont obtenus : a=0,154 ; b=0,61 ; A=1,1664 ;  =1,840. On obtient ainsi
la courbe d’équation : Y=1,840(1,1664)X.
2.3 AJUSTEMENT PAR UNE FONCTION PUISSANCE
Si l’allure du nuage de points laisse pressentir une relation globale de type puissance, liant deux
variables X et Y, il convient alors d’ajuster ce nuage de points par une courbe dont l’équation
prend la forme : Y  XA.
Le raisonnement consiste à dire que si les points xi, yi  sont proches de la courbe Y  XA, alors
les points ( (ln xi,ln yi) seront proches de la droite d’équation ln yi ln  Aln xi .
Posons y lnY , xln X et bln , nous voyons que cette équation prend la forme de l’équation
d’une droite y = Ax+b.
Cette droite est déterminer par la méthode des moindres carrés par laquelle nous obtenons les
expressions de A et b :
et b y  Ax lnY  Aln X
 A COV(X, y)  A COV(ln X,lnY)

 V(X) V(ln X)
Comme  =eb , nous déterminons finalement à partir de ces formules l’équation de la courbe
puissance.
Appliquons un ajustement puissance au nuage de points xi, yi  de la double série des notes en
mathématiques et en statistique.
Les résultats suivant sont obtenus : A=1,3487 ; b=-0,7468 ;  =0,4738. On obtient ainsi la
courbe d’équation : Y=0,4738X1,3487.
2.4 AJUSTEMENT PAR UNE FONCTION POLYNOMIAL

L'allure du nuage peut suggérer que la relation globale liant Y à X est de type polynomial c'est
à dire de la forme:
Y ak X k  ak 1 X k 1  ak  2 X k  2 ... a1 X  a0
On pourra déterminer dans ce cas la courbe de régression de Y en X par la méthode des
moindres carrés.
Cherchons donc les valeurs de a0 , a1 ,..., ak qui minimisent
k p
   fij ( y j  ak xik  ak 1 xik 1  ...  a1 xi  a0 )2
i 1 j 1
En calculant les dérivées partielles de  par rapport à a0 , a1 ,..., ak , et en égalisant à zéro, nous
obtenons le système à (k+1) équations à (k+1) inconnues suivant:
33

 k p
ak  fi. xi  ak 1  fi. xi  ...  a1 xi  a0  y

k k 1
 i 1 i 1
 k p k k p
 k  i. i k 1  i . i 1  i. i 
k 1
a f x  a f x k
 ...  a f x 2
 a 0 x  f ij xi y j
 i  1 i 1 i  1 i  1 j  1
.............

 k p k k k p
 k  i. i k 1  i . i 1  i. i 0  i. i  
2 k 1 k 1
a f x 2k
 a f x  ...  a f x  a f x k
 f ij xik y j
 i 1 i 1 i 1 i 1 i 1 j 1
En résolvant, nous trouvons les valeurs des inconnues a0 , a1 ,..., ak .

Ajustons par la méthodes des moindres carrés le nuage de points de la double série des notes à
l'aide d'un polynôme du second degré.
Ecrivons l'équation de la courbe sous la forme suivante:
Y  a2 X 2  a1 X  a0
k p
Nous aurons    fij ( y j  a2 xi2  a1 xi  a0 ) 2
i 1 j 1
   k
0 a2  f i. xi  a1 x  a0  y
2

 a0  i 1
   k k k p
Posons que   0  a2  f i. xi3  a1  f i. x 2  a0 x   f ij xi y j
 a1  i 1 i 1 i 1 j 1
   k k k k p
  0 a2  f i. xi  a1  f i. x  a0  f i. xi   fij xi2 y j
4 3 2
 a2  i 1 i 1 i 1 i 1 j 1
A cette étape, nous construisons un tableau de calculs pour déterminer les différentes valeurs
du système d'équations.
Tableau de calculs
p p p
nij y j
j 1 ni. xi2 ni. xi3 n i . x i4 j 1
xi nij y j xi2nij y j
j 1 n.j y j
xi ni. ni. xi
35742,187
2,5 915 5654 2287,5 5718,75 14296,875 5 14135 35337,5 997,5
646192,62
6,5 362 3557 2353 15294,5 99414,25 5 23120,5 150283,25 2242,5
9 109 1260,5 981 8829 79461 715149 11344,5 102100,5 2106
11 58 712,5 638 7018 77198 849178 7837,5 86212,5 2739
13 18 264 234 3042 39546 514098 3432 44616 2119
17 8 116 136 2312 39304 668168 1972 33524 1360
 3428527,8
1470 11564 6629,5 42214,3 349220,125 1 61841,5 452073,75 11564
34

/1470 4,5098639 237,564710 2332,3318 307,53316 7,866666
7,86667 5 28,7172 9 5 42,069 37
Le système devient alors équivalent à:

28,7172a2 + 4,5098a1 + a0 =7,8666
237,5647a2 + 28,7172a1 + 4,5098a0 = 42,069
2332,3318a2 + 237,5647a1 + 28,7172a0 = 307,5331
La résolution de ce système donne les valeurs pour a0 , a1 et a2

a0 =3,4446; a1 =1,16953 ; a2 =-0,0296807
La courbe de régression est donc l'équation:Y= -0,02968X2 + 1,16953X + 3,4446.
SECTION 3 : MESURE DE L'INTENSITE DE LA RELATION ENTRE DEUX

VARIABLES
3.1 TYPES DE LIAISONS
La dépendance entre deux variables se traduit par des paramètres, sans dimension, qui
mesure l'intensité de la liaison entre ces deux variables.
Deux variables sont totalement indépendantes si les variations de l’une n’entraîne pas la
variation de l’autre. Cette indépendance, ce traduit d’une manière plus formalisée par :
fi j  fi / j  nij ou f ji  f j / i  nij . C’est à dire que les fréquences conditionnelles ne dépendant plus
n.j ni.
de j ou de i. La conséquence se traduit par l’égalité entre fréquences conditionnelles et
fréquences marginales : fi j  fi. ou f ji  f . j .
Graphiquement, les courbes de régressions ne dépendent plus ni de i ni de j respectivement.
La liaison entre deux variables est fonctionnelle réciproque (dépendance totale) si à chaque
valeur de x correspond une valeur unique de y et rigoureusement déterminée, et
réciproquement. Cela se traduit dans le tableau de contingence, par une seule observation par
ligne et par colonne. Et les moyennes conditionnelles seront toutes égales aux valeurs des
variables, x j  xi et yi  y j . Graphiquement, les courbes de régression conditionnelles sont
confondues. Mais parfois, la liaison fonctionnelle peut n’ai pas être réciproque. C’est à dire
qu’une valeur x fournie une seule valeur de y mais, une valeur de y ne fournie pas une valeur
unique de x.
La liaison relative, se traduit par un tableau de contingence quelconque. Son graphe laisse
apparaître un nuage de points plus ou moins allongé. Et on en déduire deux courbes de
régression.
3.2 COEFFICIENT DE DETERMINATION
Il évalue le degré d’association entre deux variables. C’est à dire, juger de la qualité de
l’ajustement des points par la droite de régression.
35

(COV ( X , Y )) 2
Il mesure la qualité de l'ajustement linéaire entre X et Y et est noté par: r 2 
V ( X )V (Y )
2
- Si r =1: la corrélation linéaire entre X et Y est parfaite (relation fonctionnelle totale ou
réciproque linéaire).
- Si r2=0: pas de relation linéaire entre X et Y (il indique seulement une indépendance linéaire).
- Si 0< r2 <1 : 1 il y a une relation linéaire relative d’autant plus forte que r2 est grand.
3.3 COEFFICIENT DE CORRELATION LINEAIRE

Le coefficient de corrélation linéaire est la racine carrée du coefficient de détermination. Son
signe donne le sens de la relation entre deux variables.
COV ( X , Y )
r avec r1
 XY
- Si R est proche de 1: il y a une liaison linéaire marquée, et les deux variables varient dans le
même sens.
- Si R est proche de 0: il n'y a pas de liaison linéaire
- Si R est proche de -1: il y a une liaison linéaire marquée, et les deux variables varient en
sens contraire.
3.4 RAPPORT DE CORRELATION
L'existence d'une liaison non linéaire, entre deux variable X et Y, ne peut se définir par le calcul
du coefficient de détermination. Le paramètre approprié est le rapport de corrélation. Il définit,
l'existence d'une liaison linéaire ou non linéaire entre deux variables. Il est fondé sur la propriété
de décomposition de la variance marginale.
Le rapport de corrélation de Y en X
C'est la proportion de la variance marginale de Y représentée par la variance des moyennes
conditionnelles de Y.
k k
 fi. ( yi  y ) 2  f V (Y )
i. i
Y , X  i 1
 1 i 1
V (Y ) V (Y )
Le rapport de corrélation de X en Y
C'est la proportion de la variance marginale de X représentée par la variance des moyennes
conditionnelles de X.
p p

j 1
f. j ( x j  x ) 2  f V (X )
j 1
.j j
 X ,Y   1
V (X ) V (X )
ces deux rapports sont situés entre 0 et 1 en cas de corrélation et, en général, sont différents l'un
de l'autre.
- Si YX =0, donc V(x j )0 , et la régression de y en x n’explique par la liaison. La courbe de
régression de y en x est une droite parallèle à l’axe Ox.
- Si YX =1, donc V(x j) 1, et la régression de y en x explique en totalité la liaison entre y et x.
Il y a une donc une liaison fonctionnelle de y en x. Si  XY =1 également, il y a une double liaison
fonctionnelle, ou liaison fonctionnelle réciproque.
36

- Si 0<YX <1, il y a une liaison relative entre y et x d’autant plus fort que YX tend vers 1.
La régression telle qu'elle vient d'être présentée reste une méthode descriptive; il importe en
particulier de ne pas croire que l'observation d'une corrélation implique nécessairement une
liaison de causalité.
ERREURS FRÉQUENTES
Utiliser, à tort, l'analyse de corrélation pour établir une relation de cause à effet
Interpréter le coefficient de corrélation comme un pourcentage
Mal interpréter le coefficient de détermination, i.e. comme un «% de cause»
Faire des estimations, via la droite de régression, au-delà des valeurs observées
Ne pas respecter le postulat d'indépendance des observations
37

CHAPITRE VIII : LES INDICES STATISTIQUES
Les indices statistiques, sont des indicateurs qui, synthétisent l’évolution d’une grandeur
économique dans l’espace et dans le temps. On peut distinguer les indices élémentaires, qui
mesure l’évolution d’une seule grandeur, des indices synthétiques, qui mesure l’évolution
simultanée de plusieurs grandeurs.
SECTION 1 : LES INDICES SIMPLES OU INDICES ELEMENTAIRES
Soit G, une grandeur économique notée Gt à la date t où t varie de o à n.
1.1 DEFINITION
L’indice élémentaire de G est un rapport entre deux de ses valeurs mesurées à des dates
différentes. Une des dates étant choisi comme date de référence. It / 0(G) Gt où t est appelée
G0
date courante, et 0 date de base ou date de référence.
On convient de multiplier le résultat de ce rapport par 100. Ce qui signifie que la grandeur G
est à l’indice It / 0(G) à la date t, base 100 à la date 0.
En fait l’indice simple, lorsqu’il n’est pas multiplié par 100, est le coefficient multiplicateur.
Nous déduisons de l’indice simple, le taux de variation de G noté Tt / 0(G) :
Tt / 0(G) Gt G0  Gt  G0 Tt / 0(G) It / 0(G)1
G0 G0 G0
Le taux de variation est donc égal à la différence entre l’indice simple et l’unité. Par
équivalence nous aurons aussi : It / 0(G)1Tt / 0(G) .
Ainsi, un indice simple supérieur à 1 (ou 100) indique une augmentation de la grandeur G entre
les deux dates, et un indice simple inférieur à 1 (ou 100) en indique une diminution.
1.2 PROPRIETES DES INDICES SIMPLES
Les indices simples possèdent la propriété de circularité ou de transférabilité, qui permet

d’effectuer des changement de base, de raccorder des séries d’indices, de connaître les
variations de G entre deux dates quelconques, et d’établir les relations de réversibilité et
d’enchaînement.
Circularité ou tranférabilité
Un indice à la date t exprimé par rapport à une année de référence 0, peut être décomposé en
plusieurs indices élémentaires à des dates successives ou à des dates intermédiaires.
It / 0(G) It /1(G)xI1/ 0
Enchaînement
La généralisation de la propriété de circularité, nous donne la relation d’enchaînement suivante :
It / 0(G) It / t 1(G)xIt 1/ t 2(G)x...xI1/ 0(G)
Réversibilité
38

A partir de la propriété de circularité, nous pouvons écrire que It / t (G) It / 0(G)xI0/ t . Comme
It /t(G)1 , nous en déduisons que : It / 0(G) 1 . Ce qui signifie que l’indice simple est
I 0 / t (G)
réversible.
Changement de base et raccordement

Ils permettent d’obtenir la valeur d’un indice simple à une nouvelle base connaissant sa valeur
It / 0(G)
à une ancienne base. Formellement, It / 0(G) It /1(G)xI1/ 0  It /1(G) où 0 est la base de
I1/ 0(G)
l’ancien indice, et 1, la base du nouvel indice. La valeur I1/ 0(G) est appelée coefficient de
raccordement.
Multiplication
Si G = ExF, alors It / 0(G) It / 0(E)xIt / 0(F)
La variation de G dépend ainsi de la variation de E et de celle de F.
Comme exemple, l’évolution du chiffre d’affaires qui dépend de l’évolution des prix et de celle
de la quantité.
Division
It / 0(E)
Si G E , alors It / 0(G)
F It / 0(F)
SECTION 2 : LES INDICES SYNTHETIQUES
Un indice synthétique est une grandeur composite qui résume un ensemble d’indices simples
basés sur des grandeurs hétérogènes. C’est donc une moyenne d’indices simples.
Les plus courant sont l’indice de Laspeyres, de Paasche et de Fisher.
2.1 L’INDICE DE LASPEYRES

C’est une moyenne arithmétique d’indices simple pondérée par des coefficients calculés à la
date de base. Ces coefficients sont des coefficients de pondération.
Pour des indices simples de prix de plusieurs produits i( i=1,…,n), l’indice de Laspeyres des
n
prix l’année t, base 100 l’année 0 est : Lt / 0(P) 0i It / 0(Pi ) . Avec  0i  n 0 0 . C’est la part du
P iQ i
i 1
 P0iQ0i
i 1
n
produit i en valeur sur la valeur totale à la date de base. Par conséquent  1 . Le coefficient
i 1
i
0
de pondération, est aussi appelé coefficient budgétaire dans certains cas de dépenses de
consommation de ménages.
Une deuxième formule de Laspeyres des prix peut être déduite de la première :
n
P Q t
i i
0
Lt / 0(P) i 01
P Q
i 1
0
i i
0
39

En considérant les indices simples de quantités, nous définissons de la même manière l’indice
n
n P Q 0
i
t
i
de Laspeyres des quantités : Lt / 0(Q) I (Qi ) ou Lt / 0(Q) i

0 t /0
i 1
0
i 1
P Q
i 1
0
i i
0
L’indice de Laspeyres des quantités mesure la variation de la valeur d’un panier de biens à des
prix constant, donc en fait des variation des quantités.
2.2 L’INDICE DE PAASCHE

l’indice de Paasche se présente comme une moyenne harmonique d’indices simples pondérée
par des coefficients calculés à la date courante.
n
P Q t
i
t
i
L’indice de Paasche des prix est : Pt / 0(P) n 1 i ou Pt / 0(P) i n1

t
i 1 I t / 0 (P i) i 1
P0iQti
Pt iQti
Avec  ti  n
.C’est la part du produit i en valeur sur la valeur totale à la date courante.
P Q
i 1
t
i
t
i
 1
i 1
i
t
L’indice de Paasche des quantités

n
1
P Q t
i
t
i
Pt / 0(Q) ou Pt / 0(Q) i n1

n
ti

i 1 I t / 0(Q )
i i 1
Pt iQ0i
L’indice de Paasche des prix compare la valeur courante d’un panier de biens à la valeur qu’il
aurait eu à la période de base, tandis que l’indice de Paasche des quantités compare cette même
valeur courante à la valeur courante du panier de biens à la période de base.
2.3 L’INDICE DE FISHER

C’est la moyenne géométrique des indices de Laspeyres et de Paasche.
L’indice de Fisher des prix

Ft / 0(P) Lt / 0(P)xPt / 0(P)
L’indice de Fisher des quantités

Ft / 0(Q) Lt / 0(Q)xPt / 0(Q)
L’indice de Fisher est compris entre l’indice de Laspeyres et l’indice de Paasche.
2.4 L’INDICE DE VALEUR

Il mesure la variation de la valeur d’un produit ou d’un ensemble de produits entre la date 0 et
n
PtQt  Pt iQti
la date t. It / 0(V) pour un seul produit, ou It / 0(V) i n1 pour plusieurs produits.
P0Q0
P Q
i 1
0
i i
0
40

En multipliant un indice de prix par un indice de quantité, on obtient un de valeur.
Ainsi on peut établir les relations suivantes :

 It / 0(V) It / 0(P)xIt / 0(Q)
 It / 0(V) Lt / 0(P)xPt / 0(Q)
 It / 0(V) Pt / 0(P)xLt / 0(Q)
 It / 0(V) Ft / 0(P)xFt / 0(Q)
2.5 PROPRIETES DES INDICES SYNTHETIQUES
Les indices de Laspeyres et de Paasche ne possèdent la propriété de circularité.
Lt / 0(G) Lt /1(G)xL1/ 0(G)

Pt / 0(G) Pt /1(G)xP1/ 0(G)
Relations entre indices de Laspeyres et de Paasche
- Lt / 0(P) 1 ; Lt / 0(Q) 1
P0 / t (P) P0 / t (Q)
- Pt / 0(P) 1 ; Pt / 0(Q) 1
L0 / t (P) L0 / t (Q)
L’indice de Fischer est réversible
Ft / 0(G) 1
F0 / t (G)
41

Cours STATISTIQUES L1-S1 2019-2020

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours STATISTIQUES L1-S1 2019-2020

Transféré par

Droits d'auteur :

Formats disponibles

Université Norbert ZONGO

Professeur : Bernard ZONGO

CHAPITRE I : DEFINITION DE CONCEPTS STATISTIQUES

CHAPITRE II : LES POURCENTAGES ET LEURS APPLICATIONS

CHAPITRE III : LA PRESENTATION DES DONNEES STATISTIQUES

CHAPITRE IV : LES PARAMETRES DE POSITION ET DE DISPERSION

CHAPITRE V : LES PARAMETRES DE CONCENTRATION ET DE FORMES

CHAPITRE VI : LES DISTRIBUTIONS A DEUX CARACTERES

CHAPITRE VII : MODELES LINEAIRES SIMPLES

CHAPITRE VIII : LES INDICES STATISTIQUES

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

SECTION 1 : DEFFINITION DE LA STATISTIQUE

Quantitativement: car la statistique se doit d’être rigoureuse en expliquant les phénomènes

Données nombreuses: car la statistique ne s’intéresse qu’aux données de grande dimension.

SECTION 2 : LA COLLECTE DE L’INFORMATION STATISTIQUE

2.2 LES SONDAGES

SECTION 3 : CONCEPTS DE BASE

3.1 POPULATION SATISTIQUE

3.2 CARACTERE OU VARIABLE STATISTIQUE

3.3 LA VARIABLE QUALITATIVE

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

3.4 LA VARIABLE QUANTITATIVE

3.5 LES MODALITES D’UNE VARIABLE

CHAPITRE II : LES POURCENTAGES ET LEURS APPLICATIONS

SECTION 1 : TAUX DE CROISSANCE ET MULTIPLICATEUR

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

SECTION 2 : LES EVOLUTIONS SUCCESSIVES

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

3.1 La multiplication entre deux grandeurs

3.2 La division entre deux grandeurs

SECTION 4 : TAUX DE CROISSANCE ANNUEL MOYEN ET TAUX DE

CHAPITRE III : LA PRESENTATION DES DONNEES STATISTIQUES

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

SECTION 1 : LES DISTRIBUTIONS DE FREQUENCE

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

Pour la suite du cours, nous adapterons les notations suivantes :

SECTION 2 : LES DISTRIBUTIONS DE FREQUENCE CUMULÉES

N(-)=F(-)=0; N(+)= n et F(+)=1. Et pour les fréquences cumulées décroissantes:

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

Tableau 5 Distribution de fréquences cumulées croissantes et décroissantes des notes en

SECTION 3 : LES REPRESENTATIONS GRAPHIQUES

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

Graphique 2 : Secteurs circulaires de la répartition des étudiants de la Seg S1 par

Graphique 3 : Diagramme en bâtons de la répartition des âges des étudiants de Seg

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

Graphique 4 : Histogramme de fréquence de la répartition des étudiants de la seg S1,

Graphique 5 : Fonction en escalier de la répartition des âges des étudiants de Seg

Graphique 6 : Courbe cumulatives de la répartition des étudiants de la seg S1, selon la

Graphique 7 : Box plot de la répartition des étudiants de la seg1, selon la note en

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

CHAPITRE IV : LES PARAMETRES DE POSITION ET DE DISPERSION

SECTION 1 : LES PARAMÈTRES DE TENDANCE CENTRALE

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

Tableau 4 Distribution de fréquences cumulées croissantes et décroissantes des ages des

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

Tableau 5 :Distribution de fréquences cumulées croissantes et décroissantes des notes en

En considérant la distribution des fréquences cumulées de la note de statistique à la session de

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

1.4 LES QUANTILES

On remarque que F( x0,5 )=F(Me)=F(Q2)=F(D5)=F(C50)=50%, alors x0,5 = Q2= D5= C50.

Cours de Statistique descriptive L1/S1 Prof : B. ZONGO

1.5.1 LA MOYENNE ARITHMÉTIQUE

1.5.2 LA MOYENNE GEOMETRIQUE

Le coefficient multiplicateur moyen est égal à la moyenne géométrique des coefficients