Vous êtes sur la page 1sur 40

UNIVERSITE CHEIKH ANTA DIOP FACULTE DES SCIENCES ECONOMIQUES ET DE

GESTION (F.A.S.E.G)
DE DAKAR

ANNEE UNIVERSITAIRE 2010 / 2011

Cours de Statistique descriptive (version provisoire)


Licence (L1) de Sciences économiques et de Gestion

Seydi Ababacar DIENG

Site web :

http://dieng.canalblog.com

BP 5683 Dakar- Fann – Tèl (00221) 889 00 01 Fax (00221) 824 60 31 Dakar SENEGAL

1
INTRODUCTION GENERALE

Ce chapitre introductive expose une présentation générale de la statistique,


l’objectif du cours, le plan du cours et les éléments bibliographiques utilisés pour
élaborer ce document (support du cours).
I. Présentation générale

La présentation générale s’articule autour de trois points essentiels : la définition


de la statistique, les branches de la statistique et, la pertinence et la faisabilité
d’une analyse statistique.
1. Definition de la statistique

D’une manière générale, l’analyse statistique consiste à décrire et


éventuellement à expliquer des phénomènes nombreux, ou des phénomènes
soumis à l’aléa (au hasard).
La technique statistique est une méthode de description quantitative des faits.
L’efficacité technique de la statistique est donc conditionnée par l’abondance
d’informations (i.e. de données). Le traitement des données débouche sur une
interprétation statistique qui permet de mettre en exergue un parallélisme, une
diminution/augmentation de la moyenne, un ralentissement, une accélération, etc.
L’interprétation statistique, qui demeure la vraie finalité du recours à la
(méthode) statistique, nécessite d’une part une connaissance parfaite des outils
statistiques et d’autre part une compréhension exacte des hypothèses de nature
logique ou théorique relatives au champ disciplinaire exploré (économie, gestion,
sociologique, etc.). Ainsi, la statistique n’est, par conséquent, jamais indépendante
des choix de l’observateur ou de l’analyste.
 Remarques
La statistique est un domaine des mathématiques, à l’instar de l’algèbre et de la
géométrie.
Une statistique est une quantité calculée à partir d’un certain nombre
d’observations. D’une manière générale, c’est un résultat de l’application d’une
méthode statistique à un ensemble de données.
Les statistiques sont le produit des analyses reposant sur l’usage de la statistique
Exemples : Les statistiques du chômage, les résultats du Bac.
2. Les deux branches de la statistique

Il existe deux branches de la statistique : la statistique descriptive et la statistique


probabiliste.
La statistique descriptive désigne un ensemble de méthodes de description et de
synthèse numérique et graphique de faits nombreux.
La statistique probabiliste désigne un ensemble de propriétés théoriques issues
d’axiomes sur la notion d’alea, sur des faits soumis au hasard.

2
3. Pertinence et faisabilité d’une analyse statistique

Lorsqu’une personne physique ou morale souhaite obtenir de l’information


quantifiée sur une population donnée, elle doit d’abord comprendre la nature de
l’information recherchée, juger de la pertinence de recourir à la méthode
statistique, de sa faisabilité et des limites d’exploitation.
 Pertinence d’une analyse statistique
Il importe d’abord de rappeler que la démarche statistique n’est qu’un des modes
de connaissance empirique. Il se peut qu’un entretien collectif avec débats
contradictoires ait une plus grande utilité qu’une enquête anonyme. Il est
également probable qu’une ou des enquêtes sur le même sujet aient déjà été
réalisées dans le passé, dans des contrées voisines, et que les résultats soient
suffisamment robustes pour se passer d’une nouvelle enquête. Aussi, il faut savoir
qu’une enquête statistique ne peut pas être un substitut à la réflexion générale ou
théorique sur le thème étudié. Cette réflexion est nécessaire et préalable à la
formulation des hypothèses qui, ensuite, seront confirmées ou infirmées par les
observations d’enquêtes.
 Faisabilité d’une analyse statistique
Avant de se lancer dans une enquête, il demeure impératif de s’assurer qu’elle
est matériellement faisable à un coût économique raisonnable. Il faut également
s’assurer qu’elle fournira des informations statistiques fiables, de bonne qualité.
Les enquêtes dont les refus de répondre risquent d’être très élèves doivent être
évitées. C’est le cas lorsque les enquêtés assimilent le questionnaire à un contrôle
social ou un contrôle fiscal. Les enquêtes doivent permettre une description, une
révélation correcte des préférences, des gouts, des opinions, …
II. Objectif du cours

L’objectif de ce cours est de présenter aux étudiants un ensemble de méthodes


de statistiques descriptives qui leur permet d’exploiter et d’analyser des fichiers de
données quantitatives et qualitatives. A cet effet, les exercices, proposés dans le
cadre des travaux dirigés (TD), devraient faciliter la réalisation de cet objectif.
III. Plan du cours

Ce cours comprend cinq chapitres :


Chapitre 1 : Définitions et généralités
Chapitre 2 : Analyse dune variable quantitative
Chapitre 3 : Analyse d’une variable qualitative
Chapitre 4 : Relations entre deux variables statistiques
Chapitre 5 : Les indices
IV. Eléments bibliographiques

 Bouget, D et Vienot, A [1995]. Traitement de l’information : statistiques


et probabilités, Paris, Vuibert.
 Lecoutre , J.-P. [2000]. Statistiques et probabilités, Paris, Dunod.

3
CHAPITRE 1 : DEFINITIONS ET GENERALITES

Ce chapitre propose d’expliciter des éléments importants de la statistique. Dans


la première section seront définies les notions de population et de variables. La
deuxième section aborde les échelles qualitatives, la troisième les échelles
quantitatives et la quatrième les tableaux statistiques.
I. Population et caractères

Après avoir défini la population, on s’intéressera à la notion de caractères – sa


définition et ses différentes formes.
1. Population

La population désigne l’ensemble des unités statistiques concernées par l’étude


quantitative. Il importe toutefois de relever trois aspects majeurs concernant la
population :
 Les unités statistiques sont les éléments sur lesquels s’effectue le
dénombrement. Aussi, elles peuvent faire l’objet d’une observation
de certaines caractéristiques.
 On doit s’intéresser à l’ensemble des unités concernées. A cet égard,
il importe de distinguer les unités observées des unités concernées.
Les unités observées désignent ce qu’on appelle l’échantillon tandis
que les unités concernées constituent la population (exhaustivité).
 La couverture du champ d’étude est très importante. Il est nécessaire
de s’assurer que tout le champ de l’étude est couvert. Cela revient à
distinguer la population concernée par l’investigation statistique de la
population concernée par l’étude que l’on réalise.
Exemple : les étudiants (1er cycle).
2. Caractères

Un caractère est un aspect particulier de l’individu (au sens statistique du terme,


un individu pouvant être une entreprise, un étudiant, etc.) auquel le statisticien
s’intéresse. Chaque caractère possède des modalités. Les modalités désignent
donc les différents états – ou valeurs – possibles d’un caractère.
Il existe deux types de caractères (ou variables) : les caractères qualitatifs et les
caractères quantitatifs. La plupart des statisticiens utilisent indifféremment le
terme « caractère » ou le terme « variable ». Cependant, certains préfèrent
employer le terme « variables » pour désigner uniquement les caractères
quantitatifs.
 Caractères qualitatifs
On est en présence de caractères qualitatifs lorsque la caractéristique observée
sur l’individu n’est pas mesurable à l’aide de nombre.
Exemple : Caractère = Etat matrimonial ; Modalités = Célibataire, Marié(e) et
Divorcé (e).

4
Les caractères qualitatifs sont de deux sortes : les caractères nominaux et les
caractères ordinaux.
Les caractères nominaux
On parle de caractères nominaux lorsque les modalités sont des mots – décrivant
les différents « états possibles » du caractère qualitatif – qui ne peuvent faire
l’objet d’une hiérarchie, d’un rangement ou au moins aucun rangement unique
(des modalités).
Exemples : Sexe, unité de valeur (UV), nationalité, région d’origine, type
d’activité, catégories socioprofessionnelle (CSP), etc.
Le caractère qualitatif CSP est plutôt dans le cas « aucun rangement unique » car
même s’il existe une certaine hiérarchie (cadre > employé), il demeure impossible
d’ordonner l’ensemble du fait de la complexité de la notion de « hiérarchie
sociale ». Prenons l’exemple des patrons et des cadres : les patrons ont des
revenus supérieurs à ceux des cadres mais ces derniers sont beaucoup plus
disciplinés que les premiers !!!
Les caractères ordinaux
On parle de caractère ordinal lorsque les modalités sont des mots repérables et
pouvant être hiérarchisées entre elles, mais ne pouvant être additionnées ou
multipliées entre elles (sondage d’opinion).
Exemple : Degré de satisfaction des étudiants concernant le cours de statistique.
 Caractères quantitatifs ou variables
Une variable est dite quantitative lorsque la caractéristique observée sur
l’individu statistique peut s’exprimer sous forme numérique. Comme évoqué ci-
dessus, on utilise souvent le terme de variables quantitatives, voire tout
simplement de variables.
Exemples : Nombre d’enfants, salaire, nombre d’étudiants, poids, taille, chiffre
d’affaires, revenu, nombre de pauvres, etc.
Il existe deux types de variables : les variables discrètes et les variables
continues.
Une variable est considérée comme continue lorsqu’elle peut prendre toutes les
valeurs d’un intervalle.
Exemples : Revenu, chiffre d’affaires, âge, taille, poids, etc.
Une variable est dite discrète lorsqu’elle ne peut prendre que des valeurs entières
au sein d’un intervalle.
Exemples : Nombre d’enfants, nombre de pauvres, nombre de voitures, etc.
II. Echelles qualitatives

Pour chaque type de caractère, on va lui associer une échelle de mesure


spécifique, laquelle conditionne la nature et la puissance des traitements
statistiques qui seront réalisés. Chaque caractère qualitatif est décrit par une liste
finie de modalités. Cette liste de modalités est appelée nomenclature (ou
classification) et doit répondre impérativement à deux critères précis :

5
 Elle doit couvrir l’ensemble des cas possibles, c’est-à-dire que chaque
individu statistique se voit affecter une modalité. La difficulté dune telle
opération nécessite parfois la création d’une modalité « Autre (cas) » en
fin de liste.
 Les modalités sont exclusives, c’est-à-dire que chaque individu
statistique doit appartenir à une seule classe.
Ainsi, une nomenclature réalise une partition (au sens mathématique) de la
population de sorte que chaque individu statistique appartienne à une modalité et
une seule.
Par ailleurs, on distingue deux types d’échelles qualitatives : une échelle
nominale et une échelle ordinale.
1. Echelle nominale

Pour une échelle nominale, il n’existe pas d’ordre de rangement. Cependant,


pour les besoins du codage et du traitement statistique, chaque modalité possède
un équivalent numérique.
Exemple : Concernant le caractère sexe, on peut établir, par exemple,
l’équivalence suivante : homme = 1, femme = 2. Mais le choix de cet équivalent
est purement arbitraire et sans conséquence sur le traitement statistique.
Autrement dit, on peut également choisir : femme = 1, homme = 2.
Au sein d’une échelle nominale, l’unique propriété mathématique est celle de
l’équivalence (=) et son opposé la différence (≠).
Il y a aussi une autre propriété importante : tous les individus statistiques ayant
la même modalité sont considérés comme strictement identiques au regard de
cette modalité. On parle alors d’homogénéité. Cependant, cette homogénéité
dépend du degré de désagrégation de la nomenclature. Ce qui aura naturellement
une conséquence sur l’interprétation.
2. Echelle Ordinale

On considère que cette échelle est plus puissante car elle ajoute un opérateur qui
est la relation d’ordre (> ; <). Ici, le code numérique prend alors une certaine
importance. La caractéristique principale d’une échelle ordinale est qu’il existe
une règle unique qui permet de retrouver à tout instant le rangement des individus
statistiques, même si l’ensemble des nombres choisis et le sens de lecture sont
différents.
Exemple : Qualité d’un produit : on définit trois types de qualités : moyenne,
bonne, excellente. Peu importe le code choisi, c’est la classification qui nous
intéresse. Ainsi, les trois formes de codage ci-dessous sont également
envisageables. Chacun de ces trois classements est donc cohérent.
code 1 code 2 code 3
Qualité moyenne 1 3 13
Qualité bonne 2 2 18
Qualité excellente 3 1 19

6
Il est possible d’avoir une échelle de mesure non-métrique, c’est-à-dire qu’on est
dans l’impossibilité de faire des opérations arithmétiques élémentaires – addition,
soustraction, etc. Le code 3 en est un exemple illustratif. Ici, l’écart entre les
niveaux de qualité est inconnu.
III. Les échelles quantitatives

Chaque individu statistique est caractérisé par une valeur. Ici, il est possible de
faire des opérations arithmétiques même si leur signification n’est pas toujours
évidente.
Exemple : Taille moyenne (contrairement au poids).
On différencie les échelles quantitatives disposant d’un zéro absolu, c’est-à-dire
que le zéro traduit le fait que l’individu statistique n’a pas la caractéristique
recherchée.
Exemples : Pas d’enfant, pas de maison, etc.
Le zéro ayant une signification, la multiplication et la division sont possibles, on
parle alors d’échelle de rapport.
D’autres échelles n’ont pas cette propriété, à savoir que le zéro n’est qu’une
valeur conventionnelle. Cependant, l’échelle doit avoir la propriété de conserver
les intervalles.
Exemple : Pour la variable temps, de 1 à n ≡ t à t + (n-1).
L’importance du zéro absolu peut être illustrée par l’exemple de la comparaison
des taux de mortalité au niveau international. Doit-on utiliser les rapports (échelle
absolue) ou les écarts relatifs (échelle relative) ?
Supposons que l’on ait pour trois pays les valeurs suivantes : 1 pour mille ; 1,5
pour mille et 2 pour mille. On a un écart absolu identique de 0,5 alors qu’on a des
écarts relatifs de 50 % et de 33 %. Pourquoi cette différence ?
La valeur de la moyenne étant proche de zéro, il existe une forte dissymétrie
entre les écarts au-dessus et en dessous de la moyenne, qui semble difficile à
justifier. Cependant, du point de vue du sens, l’écart absolu est plus approprié.
En définitive, ce qu’il faut retenir, c’est que tout caractère est associé à une
échelle et une seule. Cependant, les variables quantitatives possédant les
propriétés les plus nombreuses, peuvent être codées et traitées dans une catégorie
« inférieure ».
Exemple : Le revenu est une variable quantitative continue ; on peut élaborer
une procédure de regroupement par tranches de revenu croissant (variable
ordinale : [10-12[ ; [12-16[ ; [16-20]) ou selon une typologie (haut revenu, moyen
revenu, bas revenu).
VI. Tableaux statistiques : valeurs, effectifs et fréquences

Les données collectées lors d’une investigation statistique – c’est-à-dire les


résultats d’une enquête statistique – sont présentées sous forme de tableau
individus/variables bien que ce dernier contienne des caractères qualitatifs.

7
Exemple :
Secteur d’activité Taux
Nom Nombre de produits CA (NAS) d’investissement
PAKO 6890 10000 26 0.57
SAVC 9457 20000 32 0.45
…..... .. …… … …
…..... .. …… … …
…..... .. …… … …
GRAP 7245 6000 45 0.26
NAS : Nomenclature d’activité sénégalaise
L’unité statistique est une entreprise. Le nombre de produits est un effectif. Le
chiffre d’affaires (CA) est une valeur monétaire. Le secteur d’activité est un
caractère qualitatif nominal. Le taux d’investissement est une variable quantitative
continue, exprimé en pourcentage (attention : on ne peut pas faire une addition
des pourcentages).
Le traitement élémentaire du fichier de données, le seul dans le cas des
caractères nominaux, consiste à construire un tableau où apparaîtront les effectifs
de chaque classe. Ce tableau d’effectifs est transformable en un tableau de
fréquences en calculant la proportion de chaque classe dans la population totale.
Exemple :
NAS Effectif Fréquence
28 25000 0.25
36 37000 0.37
.. ….. …
.. ….. …
.. ….. …
Ensemble 100000 1
Le nombre de produits est une variable quantitative discrète avec un zéro absolu.
Deux traitements sont alors possibles :
 Le décompte des entreprises selon le nombre de produits (0, 25, …..)
qu’elles commercialisent et les fréquences correspondantes.
 Le calcul direct d’indicateurs synthétiques tels que la moyenne ou la
médiane, par exemple, le nombre moyen ou médian de produits.
Le chiffre d’affaires a également un zéro absolu. Deux cas sont également
envisageables :
 Le calcul d’un indicateur synthétique comme dans le cas précédent
 Le regroupement en classes selon la taille du chiffre d’affaires permettant
d’établir un tableau de fréquences. Il importe de rappeler, comme indiqué
ci-dessus, que les taux d’investissement ne sont pas directement additifs
même si, par ailleurs, leur moyenne est calculable.

8
CHAPITRE 2 : ANALYSE D’UNE VARIABLE QUANTITATIVE

Contrairement aux caractères qualitatifs où la représentation graphique demeure


le seul moyen d’étude de leur distribution, les caractères quantitatifs se prêtent à
plusieurs autres moyens d’étude de leur distribution. Ainsi, l’analyse d’une
variable quantitative peut se faire à partir des caractéristiques dites de tendance
centrale (ou caractéristiques de position) telles que la moyenne, le mode et la
médiane (section 1). L’analyse peut également s’effectuer à partir de
caractéristiques de dispersion telles que l’étendue, la variance et les intervalles
interquantiles (section 2), voire aussi à partir de caractéristiques de forme telles
que le coefficient d’asymétrie, le coefficient de dissymétrie et le coefficient
d’aplatissement (section 3).
I. les caractéristiques de tendance centrale

Les caractéristiques de tendance centrale (ou caractéristiques de position)


constituent une synthèse et donc une approximation puisqu’il s’agit de résumer un
ensemble de valeurs par un seul indicateur numérique. Cette approximation est
plus ou moins plausible selon la manière dont se répartissent les valeurs. Par
exemple, deux distributions différentes – l’une « pointue » et l’autre « étalée » –
peuvent avoir une même caractéristique centrale. Il existe trois types de
caractéristiques de tendance centrale : la moyenne, la médiane et le mode.
1. Le mode

Le mode désigne la valeur de la variable qui correspond à la fréquence maximale


observée sur la distribution. Selon la nature de la variable quantitative, la manière
de le déterminer n’est pas la même.
 Dans le cas discret, on peut déterminer la valeur du mode en regardant la
fréquence – absolue ou relative – la plus élevée. Le mode étant la valeur
de la variable qui a cette fréquence.
nombre d'enfant Fréquence
1 20
2 45
3 35
total 100
On peut retrouver ce même résultat à partir du diagramme dit en bâton.
 En revanche, dans le cas continu, on parle de classe modale à partir de
laquelle on peut estimer une valeur modale. Par convention, on prend le
centre de classe comme valeur modale.
Remarque : On suppose généralement que la distribution est uniforme à l’intérieur de
chaque classe.
2. La médiane

La médiane d’une variable est la valeur qui partage la distribution des valeurs
rangées par ordre croissant ou décroissant en deux parties d’effectifs égaux. D’une
manière plus précise, c’est la valeur pour laquelle l’ordonnée de la courbe de
fréquence cumulative F(x) est 0,5. On va distinguer la détermination de la

9
médiane pour les variables discrètes (2.1) de celle concernant les variables
continues (2.2). Les propriétés de la médiane seront explicitées dans un dernier
temps (2.3).
2.1. Détermination pratique de la médiane pour les variables discrètes
Exemple : Nombre de stylos par étudiant :
xi
1
2
4
6
7
Me = 4
La médiane est 4 stylos : cela signifie que sur les 5 étudiants de l’échantillon, il y
a autant d’étudiants à avoir un nombre de stylos inférieur à 4 que d’étudiants
possédant un nombre de stylos supérieur à 4.
La détermination de la médiane d’une distribution discrète est parfois délicate,
car d’une part la fonction de répartition F(x) n’est pas continue (continue à gauche
mais pas à droite), et par conséquent F(x) = 0,5 n’admet toujours pas de solution.
D’autre part, il faudrait distinguer le cas où le nombre total d’observations est pair
de celui où le nombre d’observations est impair. Toutes ces limites conduisent à
adopter des conventions à l’intérieur des deux cas possibles :
 Cas 1 : Aucune valeur x n’est solution de l’équation F(x) = 0,5. Il se
trouve que c’est la situation la plus fréquemment rencontrée dans la
pratique.
Exemple : Nombre de stylos par étudiant (n = 100). Calculons d’abord
n
les fréquences relatives ( f i  i ) et ensuite les fréquences cumulées
n
croissantes (Fi = f1 +f2 + …+ fi) :
xi ni fi Fi
1 10 10 10
2 20 20 30
4 15 15 45
6 30 30 75
7 25 25 100
Total 20 100 100
Par convention, la médiane Me = xk+1 est telle que :
F(xk) < 0,5 < F(xk+1)
45 < 50 < 75
F(4) < F(Me) < F(6) Me = 6

 Cas 2 : Au moins une valeur x est solution de l’équation F(x) = 0,5. C’est
le cas lorsqu’on est en présence d’un intervalle médian.

10
2.2. Détermination pratique de la médiane pour les variables discrètes
Exemple : Bourse des étudiants de la première à la cinquième année des
étudiants de l’IFACE (en milliers de francs CFA) :
Classe ni fi = ni/n Fi
[17 ; 22[ 450 45 45
[22 ; 27[ 225 22,5 67,5
[27 ; 32[ 160 16 83,5
[32 ; 37[ 90 9 92,5
[37 ; 42[ 75 7,5 100
Total 1000 100
Méthode de l’interpolation linéaire :
45 < 50 < 67,5
22 < Me < 27
(Me–22) / (27–52) = (50–45) / (67,5–45)
Me–22 = 0,22* 5
Me- 22 = 1,11
Me = 23,11
Les Fi désignent les fréquences cumulés croissantes.
Remarque : fi (comme Fi) est toujours compris entre 0 et 1 ou entre 0 et 100
(lorsque l’on utilise les pourcentages).
2.3. Les propriétés de la médiane

Le fait que la médiane ne dépende que du rang des valeurs et non des valeurs
elles-mêmes est à la fois un avantage et un inconvénient.
 Avantage : La médiane est robuste c’est-a-dire qu’elle est presque
insensible aux valeurs aberrantes d’une distribution. La médiane reste
relativement stable lorsque les séries de valeurs sont très déséquilibrées
ou lorsqu’il y a des erreurs de mesure ou d’estimation.
 Inconvénients : La modification même importante d’une ou de plusieurs
valeurs situées au-dessus ou au-dessous de la médiane ne change pas sa
valeur. Dans le cas d’une distribution de variable discrète dont le nombre
de valeurs possibles est faible, le recours à la médiane n’est pas
judicieux.
3. La moyenne

La moyenne est un indicateur de tendance centrale fondé sur les valeurs. Plus
précisément, la moyenne est la valeur unique que devraient avoir tou tes les unités
statistiques – considérées comme identiques – d'une population (ou d'un
échantillon) pour que leur total demeure inchangé. On distingue plusieurs types de
moyennes, en particulier la moyenne arithmétique, la moyenne géométrique, la
moyenne quadratique et la moyenne harmonique.

11
 La moyenne arithmétique
On a deux types de moyennes arithmétiques : une moyenne arithmétique simple
et une moyenne arithmétique pondérée.
La moyenne arithmétique simple
La moyenne arithmétique simple est utilisée lorsque chaque unité statistique a la
même part dans la valeur totale (on parle alors d’equi-répartition).
1 n
x  xi
n i 1

Exemple : Calcul de la note moyenne de statistique d’une classe de 5 étudiants :


1
x= (12+11+13+14+15) =13
5
La moyenne arithmétique pondérée
La moyenne arithmétique pondérée prend en compte les effectifs ni de valeur xi
de la variable. Les différentes valeurs xi n’ont pas la même importance (ou
poids) ; le calcul de la moyenne doit donc prendre en compte ces différences de
poids d’où la pondération :
1 k
x  ni xi
n i 1
k
x   f i xi
i 1

Avec k = nombre de classes (ou nombre de valeurs discrètes).


ni
ni = effectif ou fréquence absolue et fi = est appelé fréquence relative ou plus
n
simplement fréquence.
Exemple : Calcul de la note moyenne de statistique d’une classe de 5 étudiants :

xi 11 12 16

ni 1 2 2

1
x = [(2*12) + (1*11) + (2*16)]
5
x =13,4
Les propriétés de la moyenne arithmétique
Le grand intérêt de la moyenne arithmétique est de s’adapter très facilement aux
calculs algébriques. En revanche, elle est plus sensible que la médiane aux valeurs
aberrantes. De ce fait, elle est moins robuste.
 Si les valeurs de xi sont toutes égales à une valeur constante k, alors x = k
 L’addition d’un scalaire b ( x  b) = x +b

12
 La multiplication par un scalaire a (ax ) = a x
 La somme des écarts à la moyenne arithmétique est nulle, c’est-à-dire :
n k

 ( xi  x)  0
i 1
Ou bien  f (x
i 1
i i  x)  0

Vérifier cette propriété fondamentale de la moyenne à partir des deux exemples


précédents concernant les notes de statistique d’une classe de 5 étudiants. Faire
cette vérification pour les deux types de moyenne (moyenne arithmétique simple
et moyenne arithmétique pondérée).
Dans l’étude de la note de statistique des étudiants de notre échantillon (n = 5),
cette propriété signifie que la somme des différences entre la note d’un étudiant et
la note moyenne est la même pour les valeurs au-dessous de la note moyenne et
au-dessus de la note moyenne.
Remarque importante : Concernant les données regroupées (en classes), le calcul
de la moyenne arithmétique se fait avec les centres de classes. Le centre de classe
étant la demi-somme des deux bornes de l’intervalle.
 La moyenne géométrique
La moyenne géométrique, notée G, est très utilisée dans l’analyse de l’évolution
d’une variable dans le temps. Elle est donc utilisée pour tout ce qui concerne le
calcul des taux de croissance. On peut prendre l’exemple du taux de croissance du
chiffre d’affaires d’une entreprise commerciale. Tout comme la moyenne
arithmétique, on distingue la moyenne géométrique simple et la moyenne
géométrique pondérée. Elles s’écrivent respectivement :
n 1 n k k
G   xin  n x G   xifi  n x
ni
i Ou bien i
i 1 i 1 i 1 i 1

 La moyenne quadratique
La moyenne quadratique – simple ou pondérée –, notée Q, est très couramment
utilisée en physique (tout comme la moyenne harmonique que nous allons définir
ci-dessous). Ses formules sont les suivantes :

1 n 2 1 k
Q  xi
n i 1
Ou bien Q 
n i 1
ni xi2

 La moyenne harmonique
La moyenne harmonique – simple ou pondérée – est utilisée dans le cadre de
l’étude des rapports telle la vitesse, qui est exprimée en nombre de kilomètres
parcourus par heure. Elle est égale à l’effectif total divisé par la moyenne de
l’inverse des xi.
n n
H n
Ou bien H k
1 1
x
i 1
n
i 1
i
xi
i

13
 Comparaison des mesures de tendance centrale
Qu’elle que soit la forme de la distribution de la variable statistique étudiée, il
est admis que les inégalités suivantes sont toujours vérifiées :
H≤G≤ x ≤Q
II. Les caractéristiques de dispersion

Contrairement aux indicateurs de tendance centrale qui réalisent une synthèse


d’un ensemble important de données, les indicateurs de dispersion permettent de
répondre objectivement à la question de la signification de l’indicateur de
tendance centrale.
On distingue quatre principaux indicateurs de dispersion : l’étendue, les
intervalles interquantiles, la variance et les écarts absolus. Toutefois, ces
indicateurs de dispersions sont complémentaires.
1. L’étendue

L’étendue désigne la différence entre les valeurs extrêmes d’une distribution


statistique, c’est-à-dire l’écart entre la valeur la plus élevée de la distribution et la
valeur la plus petite de la distribution.
W = xmax - xmin
Exemple : Calcul de l’étendue pour une distribution individuelle :
12, 11, 15, 14, 17 W = 17-11 = 6
Exemple : Calcul de l’étendue pour une distribution classée :
[17 ; 22[, [22 ; 37[, [37 ; 42[ W = 42-17 = 25
2. Les intervalles interquantiles

La présentation des intervalles interquantiles exige auparavant de définir les


quantiles.
 Quantiles ou fractiles
Les quantiles ou fractiles sont une généralisation de la médiane, et sont de ce fait
des caractéristiques de position. Les deux termes sont équivalents c'est-à-dire
qu’ils ont la même signification. Certains auteurs utilisent le terme « quantile »
lorsqu’il s’agit de distributions observées. D’autres préfèrent le terme « fractiles »,
mais ce dernier terme est souvent réservé aux lois de probabilité. Nous utiliserons
le premier terme « quantile ».
Définition
Le quantile d’ordre a, (0 < a < 1) noté xa, est la solution de l’équation F(x) = a
xa = {x / F(x) = a}, avec 0 < a < 1
Cela signifie qu’une proportion a des unités statistiques est caractérisée par des
valeurs inférieures à xa.
Exemple : Dans l’échantillon d’étudiants (n = 100), 45 % des étudiants ont
moins de 4 stylos ; 4 stylos est donc le quantile d’ordre 0,45 de la distribution du
nombre de stylos par étudiant dans l’échantillon.

14
Dans une distribution statistique d’une variable X, la médiane est le quantile
d’ordre 0,5. Toutes les propriétés de la médiane s’appliquent aux quantiles. En
particulier, les réserves formulées à partir du calcul de la médiane sur une
distribution de variable discrète dont le nombre de valeurs possibles est faible,
sont tout à fait justifiées sur les quantiles.
Les quartiles
Les quartiles Q1, Q2 et Q3 sont des quantiles respectivement d’ordre a 1 = 0,25 ;
a2 = 0,5 ; a3 = 0,75.
F(Q1) = 0,25 Q1 est le premier quartile.
F(Q2) = 0,5 Q2 est le deuxième quartile.
F(Q3) = 0,75 Q3 est le troisième quartile.
Les quartiles sont des valeurs de la variable statistique telles que, les valeurs
étant classées par ordre croissant, un quart (25 %) des unités statistiques ont des
valeurs inférieures à Q1, un quart (25 %) des observations ont des valeurs
comprises entre Q1 et Q2, un quart (25 %) des observations ont des valeurs
supérieures à Q3. La médiane d’une distribution statistique est égale à Q2.
Pour la détermination pratique des quartiles, on peut se référer à celle de la
médiane – ce sont les mêmes procédés.
Les déciles
Les déciles D1, D2, D3 …………., D9 sont les quantiles respectivement d’ordre
a1 = 0,1 ; a2 = 0,2 ; a3 = 0,3 ………., a9 = 0,9.
F(D1) = 0,1 D1 est le premier décile.
F(D2) = 0,2 D2 est le deuxième décile.


F(D5) = 0,5 D5 est le cinquième décile.



F(D9) = 0,9 D9 est le neuvième et le dernier décile.
Le premier décile D1 est tel que 10 % des observations sont caractérisées par des
valeurs inférieures à D1 ; etc.
Dans les études empiriques, la médiane est une caractéristique que de nombreux
chercheurs préfèrent à la moyenne arithmétique. En effet, la médiane a une
signification très concrète et elle est peu sensible aux valeurs aberrantes.
Cependant, dans l’étude d’une variable discrète dont le nombre de valeurs
possibles (distinctes) est faible, l’utilisation de la médiane est peu recommandée.
Il en est de même pour les quantiles.
 Les intervalles et les écarts interquantiles
Nous aborderons successivement les écarts et intervalles interquartiles, et les
écarts et intervalles interdéciles.

15
Ecarts et intervalles interquartiles
L’intervalle interquartile [Q1 ; Q3[ signifie que 50 % des unités statistiques ont
des valeurs comprises entre Q1 et Q3.
Quant à l’écart interquartile, on doit impérativement distinguer l’écart
interquartile absolu (Q3-Q1) de l’écart interquartile relatif [(Q3-Q1)/Q2].
Si la distribution est strictement égalitaire, c’est-à-dire que les valeurs de X sont
égales entre elles, l’intervalle interquartile et l’écart interquartile sont nuls. En
revanche, lorsque la dispersion des valeurs de X augmente autour de la médiane,
la valeur des écarts et des intervalles interquartiles est non seulement positive,
mais elle augmente aussi.
Ecarts et intervalles interdéciles
On distingue par [D1 ; D9[ l’intervalle interdécile où 80 % des unités statistiques
ont des valeurs comprises entre D1 et D9.
L’écart interdécile se définit par la différence (D9-D1). Il s’agit d’un écart absolu,
l’écart interdécile relatif [(D9-D1)/D5]= [(D9-D1)/Me]
D’autres statisticiens utiliseront D9/D1 comme écart interdécile relatif. Ce
dernier est plus sensible que le premier aux variations des valeurs extrêmes de la
distribution.
Portée et limites des écarts et intervalles interquantiles
Par rapport à l’étendue – qui peut être considérée comme l’écart interquantile
maximal –, les écarts interquantiles atténuent très sensiblement les effets des
valeurs extrêmes, parfois erronées, sur la mesure de la dispersion de la variable
statistique.
Toutefois, il existe un inconvénient quant au calcul de ces écarts pour une
variable discrète. En particulier, l’utilisation des déciles n’est judicieuse que
lorsque la variable est susceptible de prendre un grand nombre de valeurs
différentes.
Toutefois, il existe un inconvénient quant au calcul des intervalles interquantiles
pour une variable discrète. Plus particulièrement, l’utilisation de l’écart interdécile
n’est pertinente que lorsque la variable statistique est susceptible de prendre un
grand nombre de valeurs différentes. Dans la pratique, l’écart et l’intervalle
interdéciles ne sont utilisés que sur une variable continue (ou assimilée comme
telle).
Les intervalles et les écarts interquantiles ne sont sensibles qu’au classement par
ordre croissant de la variable statistique. Ainsi, toute redistribution des valeurs de
la distribution statistique à l’intérieur des intervalles n’a aucune influence sur la
valeur de l’écart interquantile relatif qui demeure inchangée. La mesure de l’écart
interquantile relatif n’est sensible qu’aux modifications de la variable à cheval sur
au moins un des quantiles. Par exemple, concernant les intervalles interquartiles –
]xmin ; Q1[, ]Q1 ; Q2[, ]Q2 ; Q3[, ]Q3 ; xmax[ –, toute redistribution des valeurs à
l’intérieur de ces quatre intervalles ne modifie en rien la valeur de l’écart
interquartile relatif.

16
3. Ecart absolu moyen, écart moyen relatif

On peut aussi mesurer la dispersion d’une distribution statistique en comparant


toutes les valeurs xi à la valeur de la moyenne x .
Comme la somme des écarts entre les valeurs xi et la moyenne est nulle
(propriété de la moyenne), la démarche consiste à rendre positives toutes les
différences (xi- x ) négatives, soit en prenant les valeurs absolues de chacun des
écarts (écart absolu moyen), soit en les élevant au carré (variance).
 L’écart absolu moyen
L’écart absolu moyen d’une distribution statistique est égal à la moyenne
arithmétique des valeurs absolues des écarts xi à la moyenne x de la distribution :

ex  xi  x , soit

1 n
ex   xi  x
n i 1
pour les données individuelles.

k
e x   f i xi  x pour les données regroupées.
i 1

Pour les variables continues, en l’absence d’information sur la distribution de la


variable considérée à l’intérieur de chaque classe, on calcule l’écart absolu moyen
à l’aide des centres de classes. Ainsi, dans la formule concernant les données
regroupées, xi désigne le centre de classe et x , la moyenne calculée à partir des
centres de classe xi.
 L’écart moyen relatif
L’écart moyen relatif est défini par le rapport de l’écart absolu moyen et le
double de la moyenne arithmétique :
ex
er 
2x
Lorsque la distribution statistique est strictement égalitaire, l’écart absolu moyen
est nul. Si xi = a pour tout i, alors x = a, et, xi - x = 0, d’où ex = 0.

Plus les valeurs de xi s’écartent de la moyenne arithmétique x , plus l’écart


absolu moyen ex augmente.
Par ailleurs, on ne peut comparer l’écart absolu moyen de deux distributions
statistiques d’une même variable X que si ces deux distributions ont la même
valeur de leur moyenne. Ainsi, la comparaison des écarts absolus moyens de
plusieurs (au moins deux) distributions statistiques n’est pertinente que si elles ont
la même moyenne.
Si les moyennes sont différentes, on doit calculer l’écart moyen relatif er. Cet
écart moyen relatif varie entre 0 et 1. Lorsque la valeur de l’écart moyen relatif er
est nulle, on dit que l’on dispose d’une distribution égalitaire (égalité parfaite de la
distribution). En revanche, lorsque la valeur de l’écart moyen relatif e r est égale à
l’unité, on dit que l’on dispose d’une distribution très inégalitaire (situation

17
d’inégalité totale). On reviendra sur les situations d’égalité et d’inégalité d’une
distribution plus loin (avec la courbe de Lorenz).
 Les propriétés
L’intérêt de l’utilisation de l’écart absolu moyen et de l’écart moyen relatif en
économie réside dans leur interprétation en termes de redistribution.
Ecart absolu moyen et redistribution
ex
Dans une distribution statistique, la valeur représente le montant moyen des
2
valeurs de la variable X qu’il faut retirer aux individus statistiques qui possèdent
des valeurs xi supérieures à la moyenne x et l’attribuer aux individus statistiques
qui possèdent des valeurs xi inférieures à la moyenne x pour que la distribution
soit strictement égalitaire.
Exemple : Dans l’échantillon d’étudiants, si l’on désire que chaque étudiant ait
le même nombre de stylos – égalité totale ou parfaite –, il faut que les étudiants
qui ont un nombre de stylos supérieur à la moyenne cèdent « l’excès de stylos »
par étudiant, aux étudiants qui ont un nombre de stylos inférieur à la moyenne. A
l’issue de cette redistribution du nombre de stylos, l’égalité du nombre de stylos
serait totale et ex serait nul. Encore faudrait-il que la variable discrète possède un
grand nombre de valeurs xi différentes (i élevé) afin que cette opération soit
possible, ce qui n’est pas le cas dans notre exemple, ou que la moyenne soit une
valeur entière.
Ecart moyen relatif et redistribution
En termes relatifs, er représente la proportion de la masse des valeurs qu’il faut
redistribuer pour obtenir une distribution strictement égalitaire.
Exemple : Il faut redistribuer 20 % des stylos dans l’échantillon pour obtenir une
égalité parfaite du nombre de stylos par étudiant.
En économie, l’écart moyen relatif er peut être considéré comme une mesure de
l’intensité de la redistribution nécessaire pour obtenir l’égalité totale à l’intérieur
d’une distribution statistique. C’est dans cette optique qu’il est utilisé en matière
de redistribution de revenu (qui est une variable continue).
En définitive, l’interprétation de l’écart absolu moyen n’est pas toujours possible
ou pertinente sur une variable discrète. Qui plus est, l’interprétation n’a de sens
que si la variable peut être l’objet d’une redistribution.
4. Variance, écart type et coefficient de variation

La variance et la moyenne, à la différence des autres caractéristiques de position,


sont des outils fondamentaux dans les études de la distribution d’une variable
statistique.
 Définitions
Nous présenterons successivement la variance, l’écart type et le coefficient de
variation.

18
La variance
La variance d’une variable statistique – discrète ou continue – observée X, est
égale à la moyenne arithmétique du carré des écarts de X à sa moyenne x , c’est-à-
dire : V ( X )  ( x  x ) 2
La variance peut être définie à partir de plusieurs expressions algébriques.
1 n
V(X )  
n i 1
( xi  x ) 2 pour les données sont individuelles.

k
V ( X )   f i ( xi  x ) 2 pour les données regroupées.
i 1

L’écart type
L’écart type, σ(X), souvent noté σX, est égal à la racine carrée de la variance. Il
est également la moyenne quadratique des écarts (xi- x ). C’est ainsi qu’il est
parfois nommé écart quadratique moyen.
(X )  V(X )
Le coefficient de variation
Le coefficient de variation est défini par le rapport entre l’écart type et la
moyenne arithmétique :
X
CV 
x
Dans la pratique, l’interprétation du coefficient de variation s’effectue à partir
d’une valeur seuil, souvent fixée à 0,3. Si le CV est inférieur à ce seuil, la
distribution est qualifiée d’homogène et si le CV est supérieur à ce seuil, la
distribution est considérée comme étant hétérogène.
NB : Lorsque la distribution est égalitaire, les écarts à la moyenne, la variance,
l’écart type et le coefficient de variation sont nuls.
A moyenne arithmétique constante, plus la dispersion des valeurs est forte, plus
la variance, l’écart type et le coefficient de variation augmentent.
 Propriétés
Il s’agit des propriétés concernant essentiellement la variance, en particulier le
théorème de Koenig.
Le théorème de Koenig
La variance est égale à la différence entre le moment non centré d’ordre 2 et le
moment non centré d’ordre 1 élevé au carré :
V ( X )  m2  m12
Remarque n° 1 : Le moment non centré d’ordre k de X, noté mk(X), est égal à :
n
mk ( X )  mk  x   f i xik
k

i 1

19
n
Exemples : m0  x   f i xi0  1
0

i 1

n
m1  x   f i xi1  x
1

i 1

n
m2  x   f i xi2  Q 2
2

i 1

Remarque n° 2 : Le moment centré d’ordre r de X, noté μr(X), est égal à :


n
 r ( X )   r   f i ( xi  x ) r
i 1

n
Exemples : 0   f i ( xi  x ) 0  1
i 1

n
1   f i ( xi  x )1  0
i 1

n
 2   f i ( xi  x ) 2  V ( X )
i 1

Exercice : Démontrer le théorème de Koenig.


La variance est aussi égale à la moyenne du produit moins le produit des
moyennes, c’est-à-dire :
2
1 n
V ( X )   xi2  x
n i 1
Exercice : Démontrer la formule de la variance ci-dessous, appelée aussi formule
décomposée de la variance, en partant de la définition de la variance :
1 n
V ( X )   ( xi  x ) 2 .
n i 1
Remarque n° 3 : La variance d’un nombre certain a est nulle : V(a) = 0.
Soit une variable certaine X = a

xa V(X) 
1
a  a 2  0
n
Remarque n° 4 : Variance de aX : V (aX) = a2 V(X).
Si toutes les valeurs xi sont multipliées (ou divisées) par un scalaire a, la
variance est multipliée (ou divisée) par a 2.

V (aX ) 
1 n
 i
n i 1

ax  a x
2

1 n
n i 1

 a xi  x  
2
 a2
1 n
 
n i 1
2
xi  x  a 2V ( X )

L’écart type est multiplié par la valeur absolue de a :


 (aX )  a  ( X )

Ou bien  aX  a  X

20
Remarque n° 5 : Variance de X+b : V(X+b) = V(X).
Si on augmente (ou on diminue) toutes les valeurs xi d’une même quantité b, la
variance demeure inchangée. En effet,

V ( X  b) 
1 n
 
n i 1
1 n

X b xb   X  x
2

n i 1
 
2

5. Notion de concentration

Les mesures relatives à la notion de concentration mettent en relation des


fréquences cumulées (Fi) d’unités statistiques et des proportions cumulées de
valeurs globales (Qi). Elles se fondent, non pas sur la comparaison entre les
valeurs de X et la moyenne, mais sur le partage de la masse totale des valeurs de
la variable X entre les unités statistiques.
Le graphique de concentration, appelé courbe de Lorenz, met en relation les
fréquences cumulés (Fi) des unités statistiques et les proportions cumulées
correspondantes de la variable considérée.
Nous avons déjà vu que la répartition des unités statistiques d’une variable se
fait à travers les fréquences simples fi ou les fréquences cumulées Fi. Ainsi, de
façon analogue, nous pouvons définir les proportions simples qi et cumulées Qi de
la masse des valeurs xi qui caractérisent les ni unités statistiques concernées.
ni x i
qi  k

n x
i 1
i i

Donc, qi = Masse totale des valeurs xi dans les ni unités statistiques/Masse totale
des valeurs dans l’ensemble des n unités statistiques.
Partant de qi, on définit ensuite les proportions cumulées Qi, selon les mêmes
principes que les fréquences cumulées Fi d’unités statistiques.
Qi = q1 + q2 +…. + qi
 La courbe de Lorenz
Cette courbe représente l’ensemble des points de coordonnées (Fi ; Qi).
Qi B
B

O Fi
La principale propriété de la courbe de Lorenz est sa convexité par rapport à
l’origine.

21
 Concentration et inégalité
Nous allons définir respectivement la ligne d’égalité et la concentration totale.
Ligne d’égalité
La concentration est nulle lorsque tous les points d’une courbe de Lorenz sont
alignés sur la diagonale principale (OB). Le cas échéant, l’égalité est alors
parfaite en ce sens que α % des unités statistiques possèdent α % de la masse
totale des valeurs.
Exemple : 10 % des habitants d’un pays possèdent 10 % de la richesse nationale,
20 % des habitants possèdent 20 % de la richesse nationale.
Concentration totale
A l’autre extrême, la concentration totale de la variable X signifie qu’une unité
statistique possède la totalité de la masse globale des valeurs de X, les autres
unités statistiques ayant toutes une valeur nulle, c’est-à-dire :
x1 > 0 et x2 = x3 = x4 ………. …….= xn = 0.
Graphiquement, la concentration est totale lorsque le graphique de concentration
prend la forme du triangle OAB.
Qi B
1

A
O 1 Fi
Entre les deux extrêmes, plus la courbe de Lorenz est incurvée vers la droite,
plus la concentration est forte. La courbe de concentration représente alors une
distribution de plus en plus inégalitaire.
Exemple : L’inégalité de la distribution C2 est plus forte que l’inégalité de la
distribution C1.
Qi B
C1 C2
1

A
O 1 Fi

22
Indice de concentration
La concentration est généralement mesurée à partir du coefficient de Gini ou
indice de Gini :

G   F j Q j 1  F j 1Q j 
k

j 1

Qi B S
1

A
O 1 Fi
Dans la pratique :
G = Aire de concentration S / Aire du triangle = S / OAB
La concentration est d’autant plus forte que G est élevé. Cependant, G est
compris entre 0 et 1.
0 = égalité parfaite.
1 = concentration totale ou encore inégalité stricte.
Ecart de concentration
On peut aussi apprécier l’intensité de la concentration d’une distribution
statistique d’une variable X en s’appuyant sur l’écart de concentration. Cet écart
de concentration est défini par le rapport suivant :

E
W
Où Δ désigne la différence entre la médiale et la médiane et W l’étendue :
  M le  Me
W  X max  X min
Le procédé de calcul de la médiale est identique à celui de la médiane.
Seulement, la médiale est calculée à partir des proportions cumulées Q i.
III. Les caractéristiques de forme

A coté des caractéristiques de position et de dispersion, qui sont les plus utilisées
dans la pratique (et dans la théorie aussi), il existe des caractéristiques dites de
forme qui permettent d’affiner l’analyse d’une distribution statistique. Dans la
pratique, ces caractéristiques d’asymétrie et d’aplatissement sont rarement
utilisées. Il demeure tout de même utile de les connaître.

23
1. Le coefficient d’asymétrie

Le coefficient d’asymétrie de Fisher est égal à :


3
 
3

Où μ3 est le moment centré d’ordre 3 et σ, l’écart type.


Ce coefficient est sans dimension et est invariant à tout changement d’origine.
 Si la distribution est symétrique, μ3 = 0, et donc  = 0.
 Si la distribution est asymétrique à droite (étalée à droite), alors  > 0.
 Si la distribution est asymétrique à gauche (étalée à gauche), alors  < 0.
2. Le coefficient d’aplatissement

L’aplatissement de Pearson s’exprime par la kurtosis de la dispersion. Le


coefficient d’aplatissement ou la kurtosis est égal à :
4 
  3  44  3
2
2

 Si β = 0, alors la distribution est normale ou mésokurtique.


 Si β > 0, alors la distribution est plus pointue que la distribution normale,
on dit qu’elle est leptokurtique.
 Si β < 0, alors la distribution est plus aplatie que la distribution normale,
elle est alors platykurtique.
3. Le coefficient de dissymétrie de Yule

Le coefficient de dissymétrie de Yule, noté CD, nous permet d’apprécier la


symétrie ou la dissymétrie du polygone des fréquences d’une distribution
statistique.
[(Q 3 - Q 2 ) - (Q 2 - Q1 )]
CD 
Q 3 - Q1

Selon la valeur du coefficient de


dissymétrie CD, trois cas sont
envisageables :
 CD = 0 la distribution statistique est symétrique.
 CD > 0 la distribution statistique est étalée vers la droite.
 CD < 0 la distribution statistique est étalée vers la gauche.

24
CHAPITRE 3 : ANALYSE D’UNE VARIABLE QUALITATIVE

Une variable (ou caractère) est dite qualitative lorsque les différents états
possibles ne sont pas quantifiables. On avait distingué deux types de variables
qualitatives : variable qualitative ordinale (possibilité de rangement, de
hiérarchisation) et variable qualitative nominale (absence d’ordre, de hiérarchie).
Ce chapitre comporte deux sections. La première présente les effectifs et les
fréquences tandis que la seconde section s’intéresse aux représentations
graphiques d’une distribution statistique de variable qualitative.
I. Effectifs, fréquences

La seule opération statistique possible concernant une variable qualitative est le


tri à plat. Celui-ci permet d’établir les effectifs (ou fréquences absolues) et les
fréquences (ou fréquences relatives).
1. Répartition des unités statistiques

Le comptage du nombre d’unités statistiques, puis leur regroupement par


modalité afin d’avoir un tableau des effectifs demeurent la première opération sur
une variable qualitative. Cette opération constitue un tri à plat des unités
statistiques par modalité. De manière formelle, nous devons retenir 3 choses
fondamentales :
 Un fichier de données statistiques contient n unités statistiques (n lignes
du fichier).
 ni est le nombre d’unités statistiques présentant la modalité xi de la
variable X.
 D’après la propriété fondamentale d’exhaustivité, la somme des effectifs
par modalité est égale à l’effectif total des unités statistiques : ∑ni = n.
Le tri à plat sur une variable qualitative regroupe les unités statistiques par
modalités, sans perte d’information. La présentation d’une distribution statistique
se fait à l’aide d’un tableau.

25
Exemple : Considérons le tableau suivant :

Modalités de Nombre d’unités


la variable X statistiques (effectif) Fréquence

xi ni fi

x1 n1 f1

xi ni fi

.. .. ..
.. .. ..
xk nk fk

Total n 1

 Hypothèse importante
L’analyse suppose que vis-à-vis de la variable X, les ni unités statistiques qui
présentent chacune la modalité xi, sont équivalentes ; elles peuvent ainsi être
permutées sans modification de l’information. Les unités statistiques d’une même
modalité sont donc considérés comme identiques.
2. Fréquences

Le raisonnement le plus couramment utilisé est celui qui se fonde sur les
pourcentages ou les fréquences pour gommer l’effet de taille n de la population.
 Définition des fréquences
La fréquence fi ou f(xi), d’une modalité xi de la variable X est égale au rapport
entre l’effectif ni des unités statistiques possédant la modalité x i et l’effectif total
n:
ni
f i  f ( xi ) 
n
n
D’où f
i 1
i 1

L’association d’un caractère X et des fréquences correspondantes à chacune de


ses modalités s’appelle la distribution statistique de X : l’ensemble des couples
(xi,fi) se présente généralement sous forme de tableau.
Remarque : Le tri à plat, opération statistique la plus élémentaire est applicable à
toute variable qualitative mais aussi quantitative.
 Présentation générale d’un tableau statistique
La construction et l’écriture d’un tableau statistique doivent à la fois être
précises et intelligibles. Ainsi un tableau doit comprendre :
 Un titre, souvent accompagné d’une numérotation de tableaux lorsque
ceux-ci sont nombreux.

26
 Une première colonne indiquant clairement les modalités de la variable
étudiée.
 Des colonnes indiquant les effectifs, les fréquences (généralement en %).
 Des sommes de fréquences égales à 1ou 100 %.
 Sous le tableau, la source de l’information doit être indiquée.
II. Les représentations graphiques d’une distribution de caractère qualitatif

Dans les études empiriques, les représentations graphiques permettent de mieux


visualiser les résultats numériques. Les tris à plat comptent les unités statistiques
tandis que les graphiques les montrent. Les graphiques sont donc essentiels dans
la présentation des résultats d’une investigation statistique.
1. Caractéristiques des graphiques

Un graphique doit être exact, propre, sans rature, sans surcharge. Sa construction
relève à la fois de l’activité scientifique et … de l’art. Un graphique doit séduire le
lecteur à la fois par sa pertinence et par son élégance.
En définitive, il faut aboutir à une vision et à une compréhension claires du
graphique, en accordant une attention toute particulière au choix des échelles en
abscisse et en ordonnée. Le choix des échelles est important et surtout délicat car
il entraîne des perceptions très différentes des phénomènes étudiés.
Plus particulièrement, un graphique doit avoir :
 Un titre.
 Une indication des sources de l’information.
 Des axes sur lesquels l’échelle doit être claire, la signification des axes
doit être bien indiquée et compréhensible.
 Des couleurs, des grisés, etc.…, dont la signification doit être claire, et
éventuellement indiquée dans une légende.
Aussi, l’origine O du graphique n’est pas obligatoirement de coordonnées (0,0).
On peut recourir à une échelle brisée si nécessaire, mais il faut éviter de relier les
données de chaque côté de la césure. Il faut choisir une échelle de telle sorte que
les données remplissent correctement la région des données, et ne soient pas
toutes regroupées dans un coin du graphique.
Enfin, la comparaison de deux graphiques requiert de conserver la même échelle
dans les deux graphiques. Les représentations graphiques des variables
qualitatives les plus utilisées sont les graphiques en tuyaux d’orgue et les disques.
2. Les tuyaux d’orgue et les disques

Il importe de signaler tout d’abord que ces représentations graphiques


s’appliquent aussi bien aux effectifs ni qu’aux fréquences fi.
 Les tuyaux d’orgue
La représentation graphique des effectifs ou des fréquences se fait par bandes
verticales, de base constante quelle que soit la modalité xi et de hauteur
proportionnelle aux effectifs ni ou aux fréquences fi.

27
Les bandes sont placées les unes à coté des autres. Afin de différencier les
tuyaux d’orgue des histogrammes – qui représentent la distribution d’une variable
continue –, il est préférable ici de séparer les bandes les unes des autres.
L’ordonnée du graphique mesure des effectifs ou des fréquences, tandis que
« l’abscisse » n’est qu’une convention pour positionner les modalités, sans mesure
entre elles. Parfois, la représentation graphique se fait sous forme de barres
horizontales ; les effectifs ou les fréquences se lisent alors sur l’axe horizontal.
Exemple : La variable X désigne l’état matrimonial des étudiants de Master
finance inscrits à l’IFACE. Le tableau suivant donne les fréquences concernant les
différentes modalités :

xi fi (en %)

Célibataire 10

Marié 8

Divorcé 2

Situation matrimoniale des étudiants de


Master Finance inscrits à l'IFACE
Modalité (xi)

Divorcé

Marié fi (en %)

Célibataire

0 20 40 60 80
Fréquences (fi)

Source : Enquête réalisée par Mohamed et Bertrand (2009).


La représentation graphique de la distribution d’une variable qualitative est
souple et possède de nombreuses variantes. Il faut aussi retenir que les modalités
et les tuyaux qui leur sont associés peuvent être permutés. Il est possible, par
exemple, de placer les modalités par ordre décroissant ou croissant des effectifs ou
des fréquences.
 Les disques
On peut également représenter les effectifs ou les fréquences sur un disque : on
parle aussi de camembert ou encore de secteur. Cette représentation graphique
repose sur 2 exigences :
 Chaque effectif ni ou fréquence fi est représenté(e) par un secteur dont
l’angle est proportionnel à la fréquence absolue ou relative.
 La surface du disque doit être proportionnelle à l’effectif total n, si
plusieurs graphiques, concernant des populations de tailles différentes,
sont établis.

28
Exemple : Reprenons le même exemple de la situation matrimoniale des
étudiants de Master Finance inscrits à l’IFACE.

Situation matrimoniale des étudaints de


Master Finance inscrits à l'IFACE

Célibataire
Marié
Divorcé

Source : Enquête réalisée par Mohamed et Bertrand (2009).

29
CHAPITRE 4 : RELATIONS ENTRE DEUX VARIABLES
STATISTIQUES

Introduction

L’objectif de ce chapitre est d’examiner les relations statistiques possibles qui


existent entre deux variables statistiques. Pour y parvenir, nous exposerons, dans
un premier temps, les procédures statistiques qui permettent d’établir la
dépendance ou l’indépendance statistique entre deux variables différentes (section
1). Dans un second temps, nous nous focaliserons sur le cas d’une liaison
fonctionnelle entre deux variables statistiques quantitatives (section 2).
I. Indépendance ou liaison statistique

Nous allons d’abord présenter une distribution empirique de deux variables


statistiques. Ensuite, il sera question d’expliciter une des méthodes de détection
d’une relation statistique entre deux variables statistiques.
1. Distribution empirique de deux variables statistiques

Un tri croisé concernant deux variables statistiques peut permettre d’ordonner


toutes les informations individuelles dans un tableau plus synthétique, appelé
tableau à double entrée, ou tableau croisé ou encore tableau de contingence. Le
résultat de ce tri croisé nous fournit des effectifs d’unités statistiques qui sont
ensuite transformés en fréquences conjointes, marginales ou conditionnelles.
Cette procédure permet non seulement de réaliser une synthèse de l’information
mais elle constitue également un moyen commode de mettre en exergue les liens
de dépendance ou d’indépendance statistique entre les variables.
 Le tableau de contingence
Le tri croisé de deux variables X et Y permet de construire un tableau de
contingence des effectifs ou des fréquences. Pour tout ce qui suit, nous
travaillerons sur un tableau à double entrée des effectifs. Dans ce tableau :
 nij désigne le nombre d’unités statistiques possédant à la fois la modalité
xi et la modalité yj. Toutes les unités statistiques présentant
simultanément ces deux modalités sont considérées comme équivalentes
et seul leur nombre demeure important. On parle également d’effectif
conjoint.
 ni. désigne le nombre d’unités statistiques caractérisées par la modalité xi
 n.j désigne le nombre d’unités statistiques caractérisées par la modalité yj

30
Y
X y1 y2 … … yj … … yl Total
x1 n11 n12 … … n1j … … n1l n1.
x2 n21 n22 … … n2j … … n2l n2.


xi ni1 ni2 … … nij … … nil ni.


xk nk1 nk2 nkj nkl nk.
Total n.1 n.2 n.j n.l n..
Exemple : Tableau de contingence des effectifs
 Les différents types de fréquences d’un tableau de contingence
On distingue plusieurs types de fréquences dans un tableau de contingence :
Fréquences conjointes
La fréquence conjointe fij désigne la proportion des unités statistiques (ou
observations) qui sont caractérisées simultanément par les modalités xi et yj. La
fréquence conjointe fij des modalités xi et yj est donc égale au rapport des effectifs
conjoints nij et de l’effectif total n des unités statistiques :
nij
f ij 
n
Fréquences marginales
On distingue deux types de fréquences marginales : les fréquences marginales fi.
et les fréquences marginales f.j :
 La fréquence marginale fi. de la modalité xi de la variable X est égale à :
l l nij ni .
f i.   f ij  
j 1 j 1 n n
La distribution marginale de la variable X est composée des modalités xi
auxquelles sont associées les fréquences fi., c’est-à-dire (xi, fi.).
 La fréquence marginale f.j de la modalité yj de la variable Y est égale à :
k k nij n. j
f . j   f ij  
i 1 i 1 n n
La distribution marginale de la variable Y est composée des modalités yj
auxquelles sont associées les fréquences f.j, c’est-à-dire (yj, f.j).
Remarque : Il est évident que la distribution marginale d’une variable obtenue
sur un tri croisé est strictement identique au résultat d’un tri à plat concernant
cette même variable.

31
Fréquences conditionnelles
On distingue ici aussi deux types de fréquences conditionnelles fi/j et fj/i :
 La fréquence conditionnelle de la modalité xi, liée par la modalité yj (ou
sachant yj certaine), est notée fi/j ou f(xi/yj) :
f ij nij
f i / j  f ( xi / y j )  
f. j n. j
La distribution conditionnelle de X liée par yj est composée de l’ensemble des
modalités xi auxquelles sont associées les fréquences fi/j. Par conséquent, il existe
donc autant de distributions conditionnelles X/yj que de modalités yj, soit l
distributions conditionnelles.
 La fréquence conditionnelle de la modalité yj, liée par la modalité xi (ou
sachant xi certaine), est notée fj/i ou f(xi/yj) :
f ij nij
f j / i  f ( y j / xi )  
f i. ni.
La distribution conditionnelle de Y liée par xi est composée de l’ensemble des
modalités yj auxquelles sont associées les fréquences f j/i. Par conséquent, il existe
donc autant de distributions conditionnelles Y/xi que de modalités xi, soit k
distributions conditionnelles.
2. Existence ou absence de lien entre deux variables statistiques

On spécifie deux cas possibles – la liaison fonctionnelle et l’indépendance


statistique entre deux variables – que nous allons présenter ci-dessous.
 L’absence de lien ou indépendance statistique entre deux variables
Deux variables statistiques sont indépendantes si et seulement si les fréquences
conditionnelles sont égales aux fréquences marginales, pour toutes les modalités
des variables X et Y. Ainsi, les fréquences conjointes sont égales au produit des
fréquences marginales. :
f i / j  f i.
f j / i  f. j
f ij  f i . * f . j

A partir de ces trois expressions – qui sont strictement équivalentes en elles –, on


en déduit les effectifs théoriques qui sont le rapport du produit des effectifs
marginaux et du nombre total des observations. Ainsi, à partir de la troisième
formule, on peut définir les données (ou effectifs) théoriques nij' en fonction des
données (ou effectifs) observées nij :
ni . n. j
nij'   tij
n

Sous l’hypothèse d’indépendance, ces différentes (4) formules permettent


d’établir les tableaux d’effectifs conjoints, de fréquences conjointes et de
fréquences conditionnelles.

32
Remarque : Plus les écarts entre les données observées n ij et les données
théoriques nij' sont importants, plus il est probable que les variables soient dépen-
dantes entre elles.
Pour déterminer l’existence ou non d’une liaison ou (dépendance) entre deux
variables statistiques X et Y, on recourt, dans la pratique, au χ2 de contingence, le
Ф2 de Cramer et le T de Tschuprow.
2
 ni . n. j 
l 
 n  
n 
ij

k
  
2

i 1 j 1
ni . n. j
n
 k l n 2

 2  n  ij
 1
 i 1 j 1 ni . n. j 
2
2 
n
2
T
k  1l  1
 Si T < 0,15 alors X et Y sont indépendantes.
 Si T > 0,15 alors X et Y sont dépendantes.
 La relation fonctionnelle entre deux variables
La situation inverse à l’indépendance statistique de deux variables statistiques
est leur liaison fonctionnelle. La variable Y est fonctionnellement liée à la variable
X si, à chaque modalité xi de la variable X correspond une et une seule modalité
yj de la variable Y.
La relation fonctionnelle signifie que le fait de connaître xi de X permet de
connaître avec certitude yj de Y. Contrairement à l’indépendance statistique, la
relation fonctionnelle n’est pas toujours une relation symétrique, c’est-à-dire si X
est fonctionnellement liée à Y, il n’est pas sur que Y soit fonctionnellement liée à
X, d’où la distinction entre la relation fonctionnelle réciproque et la relation
fonctionnelle non réciproque.
Relation (ou liaison) fonctionnelle réciproque
Une relation fonctionnelle entre deux variables statistiques est réciproque (strict
perfect association) si et seulement si les 2 conditions suivantes sont vérifiées :
 Le tableau de contingence est carré, c’est-à-dire le nombre de lignes est
égal au nombre de colonnes (k = l).
 Chaque ligne et chaque colonne du tableau de contingence ne contient
qu’un seul effectif (ou fréquence) non nul.
Exemple : Tableau de contingence d’une relation fonctionnelle réciproque entre
les deux variables X et Y.

33
Y
X y1 y2 y3 y4 Total
x1 6 0 0 0 6
x2 0 0 7 0 7
x3 0 0 0 3 3
x4 0 19 0 0 19
Total 6 19 7 3 35
Relation fonctionnelle non réciproque
Une relation fonctionnelle entre deux variables statistiques est non réciproque
lorsque l’une des deux conditions énoncées ci-dessus n’est pas remplie. En
particulier, on est en présence d’une relation fonctionnelle non réciproque entre
deux variables statistiques lorsque le nombre de lignes d’un tableau de
contingence n’est pas égal au nombre de colonnes. Le cas échéant, seule une des
deux variables détermine l’autre (implicit perfect association). Il s’agit le plus
souvent d’une situation hypothétique.
Exemple : Ce tableau est tiré de Viénot et Bouget (1995). La variable X
représente le sexe et la variable Y le statut matrimonial.

X Y Marié Divorcé veuf célibataire Total


Masculin 101 0 0 21 122
Féminin 0 14 22 0 36
Total 101 14 22 21 158

II. La régression

L’objectif de la régression consiste à trouver une fonction mathématique f qui


permet d’ajuster le mieux les données observées (xi,yi). La régression de Y en X
consiste à calculer les valeurs des paramètres de la fonction y = f (x). Pour qu’une
régression soit possible, il faut d’abord disposer de deux variables quantitatives. Il
va s’agir ensuite de déterminer le sens de la relation entre les deux variables, puis
se donner une forme générale de la fonction f (x). A priori, on peut avoir plusieurs
types d’ajustement selon la configuration du nuage de points – par exemple, un
ajustement parabolique ou hyperbolique.
Cependant, nous nous limiterons à l’ajustement de notre nuage de points par une
droite – fonction affine, y = ax + b. Ainsi, nous devons trouver les valeurs de a et
b par la méthode dite des moindres carrées ordinaires (MCO).
1. Ajustement affine sur un nuage de points

L’équation de la fonction affine est f (x) = y = ax + b. La détermination des


valeurs des coefficients a et b de la régression demeure le seul objectif.
Exemple : La distribution de deux variables X et Y est représentée par le nuage
de points du graphique suivant :

34
Graphique : Ajustement affine sur un nuage de points.

y . D 1

. . ..
. . . . Nuage de points
. .
D2

x
La forme allongée du nuage de points suggère une relation croissante entre les
variables X et Y. Si l’on souhaite résumer l’information par la seule équation
d’une droite, il faut que les coefficients a et b soient pertinents. On peut avoir
plusieurs droites dont D1 et D2 qui traversent le nuage de points, mais seule D1 est
pertinente car elle traverse « correctement » le nuage de points et résume bien la
relation croissante entre X et Y.
La régression de Y en X est représentée par un ajustement affine tel que la
distance entre les points du nuage et la droite soit la plus faible possible. D 1 est la
droite la plus représentative de la distribution conjointe (X,Y) observée.
La méthode des moindres carrés est souvent utilisée pour minimiser la distance
entre les points du nuage et la droite.
2. La méthode des moindres carrés ordinaires (MCO)

La méthode des MCO permet de déterminer les valeurs des coefficients de


régression a et b de la fonction affine y = ax + b à partir des valeurs observées sur
un nuage de points. En effet, comme le montre le graphique ci-dessous, pour
chaque xi correspond une valeur yi observée et une autre valeur f (xi) estimée à
partir de l’équation de la droite de régression f (xi) = axi + b.
On considère ei = yi – f (xi), l’écart entre ces deux valeurs. L’ajustement est
d’autant plus plausible que la droite d’ajustement passe par le plus grand nombre
de points possibles. On a ainsi les cas suivants :
 ei = 0 si le point (xi,yi) est sur la droite, c’est-à-dire yi = f (xi) ;
 ei > 0 si le point (xi,yi) est au-dessus de la droite, c’est-à-dire yi > f (xi) ;
 ei < 0 si le point (xi,yi) est au-dessous de la droite, c’est-à-dire yi < f (xi).

35
Graphique : Représentation des écarts à la droite d’ajustement.
y

yi . f (x) = ax + b

ei f(xi) ei . .

.. .
. . ..
.

xi x
Il existe une pluralité de droites qui peuvent traverser le nuage de points. La
droite qui nous donne le meilleur ajustement est celle qui permet de minimiser la
somme des écarts ei. La méthode des MCO consiste précisément à calculer les
coefficients a et b de telle sorte que la somme des écarts entre les valeurs
observées de yi et les valeurs estimées de y soit minimum.
Soit S, la somme des carrés des écarts (SCE) à la droite.
n
S   ei2
i 1
n 2 n 2

S    y i  f xi     y i axi  b 
i 1 i 1

Conditions du premier ordre :


Pour que la SCE soit minimale, il faut que les dérivées par rapport à a et b soient
nulles :
S n
 2  y i axi  b   0
b i 1
n n n n

y
i 1
i  a  xi   b  0   b  n y  na x
i 1 i 1 i 1

b  y  ax
Cette relation signifie que la droite d’ajustement par les MCO passe par le point
moyen de coordonnées ( x , y ). Si on remplace b par sa valeur dans S, on obtient :

     y  y  ax 
n 2 n 2

S   y i axi  y  a x i i x
i 1 i 1

36
Si on dérive par rapport à a, on obtient :
S
 
n
 2 y i  y  a ( xi  x * ( xi  x )  0
a i 1

S
 
n
 2 ( xi  x )( y i  y )  a ( xi  x ) 2  0
a i 1
n

(x i  x )( y i  y )
a i 1
n

(x
i 1
i  x)2

Si on divise par n, on a le résultat suivant :


Cov( X , Y )
a
V(X )
Conditions du premier ordre :
Les dérivées du second ordre doivent être positives :
S
 2n  0
b 2
S n

a 2
 2 
i 1
( xi  x ) 2  0

Donc, on a bien un minimum pour la SCE.


En définitive, la régression de Y en X est définie par une droite f (x) = ax + b
telle que :
Cov( X , Y )
a et b  y  ax
V(X )

De la même façon, la régression de X en Y est par conséquent définie par la droite


g(y) = a’y + b’ telle que :
Cov( X , Y )
a'  et b'  x  a' y
V (Y )
Les deux droites de régression passent par le centre de gravité G du nuage de
points, de coordonnées x et y (point d’intersection entre les deux droites).

37
Graphique : Droites de régression de X en Y et de Y en X.
y x = a’y + b’
y = ax + b

y G

0 x x
Remarque : Détermination pratique des coefficients de régression a et b ou a’ et
b’. On a trois étapes, qui sont les suivantes :
n n n n n
 Etape 1 : Calcul des sommes :  xi ;  yi ;  xi2 ;  yi2 ;  xi yi
i 1 i 1 i 1 i 1 i 1

 Etape 2 : Calcul des moyennes, variances et covariance.


 Etape 3 : Calcul des coefficients de régression a et b, et éventuellement
a’ et b’.
III. La corrélation

Le calcul de la valeur des coefficients de la régression ne donne aucune


indication précise sur la qualité de l’ajustement effectué. Ainsi, deux nuages de
points différents peuvent être représentés par une droite de régression ayant les
mêmes coefficients directeurs (a) et la même ordonnée à l’origine (b).
Sur les graphiques ci-dessous, les droites D et D’ ont les mêmes coefficients a et
b mais l’ajustement sur le second graphique est meilleur que sur le premier (plus
précis). En effet, sur le second graphique, les points sont, d’une manière générale,
plus proches de la droite D’ que les points du premier graphique par rapport à la
droite D.
D : y = ax + b
D’ : y = ax + b
Premier graphique

y D

0 x

38
Second graphique
y D’

0 x
La corrélation permet d’établir une mesure de la proximité des points par rapport
à la droite de régression.
1. Définition

Le coefficient de corrélation linéaire, noté r, entre deux variables quantitatives X


et Y, est égal au rapport de la covariance des deux variables et du produit de leur
écart type.
Cov( X , Y )
r
 x y
Le coefficient de corrélation linéaire r mesure la qualité de l’ajustement de la
droite f (x) = ax + b sur le nuage des points de coordonnées (xi,yi).
Lorsque les écarts types  x et  y sont donnés et constants, plus les points du
nuage sont éloignés les uns des autres et proches de la droite de régression, plus la
valeur absolue de la covariance est élevée, et plus la valeur absolue du coefficient
de corrélation linéaire est aussi élevée.
2. Propriétés du coefficient de corrélation

On a trois propriétés fondamentales relatives au coefficient de corrélation


linéaire. Il s’agit de la relation entre les coefficients de régression et le coefficient
de corrélation, de la propriété d’invariance à un changement d’origine et de la
relation entre le coefficient de corrélation et le rapport de corrélation (ou
coefficient de détermination).
 Relation entre les coefficients de régression et le coefficient de
corrélation linéaire
Cette relation est la suivante :
x
ra
y
y
r  a'
x
r 2  aa '  r  aa '
Le signe de r dépend de celui de la covariance des variables X et Y (Cov(X,Y)).

39
 Invariance à un changement d’origine ou d’échelle
Le coefficient de corrélation étant un nombre sans dimension, il est invariant à
un changement d’origine et d’échelle.
L’invariance du coefficient de corrélation r par rapport à l’origine signifie que :
r (X + b,Y + a) = r (X,Y) où a et b sont des scalaires.
L’invariance de r par rapport à un changement d’échelle signifie que :
r (αX,βY) = r (X,Y) où α et β sont des scalaires.
 Relation entre le coefficient de corrélation linéaire et le rapport de
corrélation (ou coefficient de détermination)
Il existe une relation entre le coefficient de corrélation linéaire et le rapport de
corrélation (ou coefficient de détermination). Le carré du coefficient de
corrélation linéaire, r2, est égal à la part de variance de Y expliquée par X, noté
VE, sous l’hypothèse d’un ajustement affine. Ainsi, le carré du coefficient de
corrélation linéaire est donc égal au rapport de corrélation (ou coefficient de
détermination) RY2 / X :
VE
r2   RY2 / X
V (Y )
V(Y) = Variance résiduelle + Variance expliquée par la droite de régression.
1 n 1 n
V (Y )   ( yi  axi  b)   (axi  b  y ) 2
2

n i 1 n i 1
V(Y) = VR + VE

VR = Variance résiduelle

VE = Variance expliquée par la droite de régression.

40