Vous êtes sur la page 1sur 21

Chapitre I : Les méthodes statistiques

d’analyse de données

 Trois grandes classes de méthodes


statistiques sont utilisées :
 (i) Les méthodes explicatives ;
 (ii) Les méthodes descriptives ;
 (iii) Les méthodes de prévision.

TOUFIK-Saïd_2018-2019 1
I. Les méthodes explicatives
 Dans les méthodes explicatives, on
cherche à relier une variable à expliquer Y
à un ensemble de variables explicatives
X1, …, Xk.
 Pour cela, on dispose d’un tableau
individus×variables, tableau dont les lignes
représentent les valeurs des variables Y, X1,
…, Xk sur les différents individus étudiés.

TOUFIK-Saïd_2018-2019 2
« suite » I. Les méthodes
explicatives
 Il s’agit d’ajuster sur les données disponibles
le modèle :
 Y = f(X1, …, Xk) + Résidu
 où f est le plus souvent, mais pas
toujours, une fonction linéaire, et de
quantifier la fiabilité de la prévision de Y à
partir des X1, …, Xk.
 Les méthodes statistiques à utiliser
dépendent de la nature quantitative ou
qualitative des variables.

TOUFIK-Saïd_2018-2019 3
« suite » I. Les méthodes
explicatives
Tableau 1
Les méthodes explicatives
Variable Variables explicatives
à expliquer X1, …, Xk
Y Quantitatives Qualitatives Mélange

Régression simple (k=1)


Analyse de la
Analyse de la variance
Quantitative covariance
Régression multiple (k>1)

Analyse discriminante
Qualitative Modèle linéaire généralisé
Régression logistique

TOUFIK-Saïd_2018-2019 4
II. Les méthodes descriptives
 Les méthodes descriptives s’appliquent
aux tableaux individus×variables où
toutes les variables jouent le même rôle.
 Il n’y a pas de variable à expliquer Y.
 Il s’agit donc de résumer, de « voir », de
comprendre le tableau de données
[X1,…,Xk].
 Ainsi, l’objectif des méthodes descriptives
est de visualiser et classer les données.

TOUFIK-Saïd_2018-2019 5
« suite » II. Les méthodes
descriptives

Figure 1 Méthodes descriptives


Axe 2

X1 X2 X3 X4
.4
X3
2
1
Tableau 1
X1
2
individus .3

Axe 1

3 × X2
5
4 variables
X4
5

TOUFIK-Saïd_2018-2019 6
« suite » II. Les méthodes
descriptives

 La visualisation des données consiste à


associer au tableau Individus×Variables
une carte des individus (les points de la
figure 1), et des variables (les flèches de
la figure 1) de telle sorte :

TOUFIK-Saïd_2018-2019 7
« suite » II. Les méthodes
descriptives
 La position des individus sur la carte
traduit des ressemblances entre les
individus. Par exemple les individus 1 et
2 se ressemblent, mais sont très
différents de l’individu 3.

TOUFIK-Saïd_2018-2019 8
« suite » II. Les méthodes
descriptives
 La position des variables sur la carte
reflète les corrélations entre les variables
: les variables X1 et X2 sont fortement
corrélées positivement, les variables X3
et X4 sont corrélées négativement, et les
variables X1, X2 sont faiblement
corrélées aux variables X3, X4.

TOUFIK-Saïd_2018-2019 9
« suite » II. Les méthodes
descriptives
 Les projections des individus sur les axes
variables reflètent les valeurs des
variables sur les individus :
 Les individus 1 et 2 sont forts sur X1, X2,
alors que l’individu 3 est faible sur ces
mêmes variables ; l’individu 4 est moyen
sur X3, mais faible sur X4 et c’est le
contraire pour l’individu 5.

TOUFIK-Saïd_2018-2019 10
« suite » II. Les méthodes
descriptives
 Les méthodes de visualisation dépendent
de la nature des variables et sont
présentées dans le tableau 2 :

TOUFIK-Saïd_2018-2019 11
« suite » II. Les méthodes
descriptives
Tableau 2
Méthodes descriptives : Méthodes de visualisation

Nature des variables X1, …, Xk

Qualitatives
Quantitatives
k=2 k>2

Analyse en Analyse Analyse factorielle


composantes factorielle des
principales (ACP) des correspondances
correspondances (AFC) multiples (AFCM)

TOUFIK-Saïd_2018-2019 12
« suite » II. Les méthodes
descriptives
 Par ailleurs, les méthodes de classification
ont pour objectif de former des classes
d’individus et de variables de telle sorte
que :

TOUFIK-Saïd_2018-2019 13
« suite » II. Les méthodes
descriptives
 des individus appartenant à une même
classe sont proches et des individus
appartenant à des classes distinctes sont
éloignées ;
 des variables appartenant à une même
classe sont corrélées entre elles, et des
variables appartenant à des classes
distinctes sont faiblement corrélées entre
elles.
TOUFIK-Saïd_2018-2019 14
« suite » II. Les méthodes
descriptives
 Sur la figure 1, nous avons formé une
typologie des individus en deux classes
{1,2,5} et {3,4}, et il apparaît une
typologie des variables en deux classes
{X1,X2} et {X3,X4}.

TOUFIK-Saïd_2018-2019 15
« suite » II. Les méthodes
descriptives
 Les méthodes de classification les plus
utilisées en gestion sont :
 La classification ascendante
hiérarchique ;
 Les nuées dynamiques (nombre d’individus
élevé).

TOUFIK-Saïd_2018-2019 16
« suite » II. Les méthodes
descriptives
 Les méthodes descriptives (méthodes de
visualisation et méthodes de
classification) correspondent à ce qu’on
appelle en France l’analyse de données.

TOUFIK-Saïd_2018-2019 17
III. Les méthodes de prévision

 Cette troisième classe de méthodes


concerne l’analyse et la prévision
d’une série chronologique.
 La description d’une série
chronologique consiste à rechercher
une tendance, éventuellement une
composante saisonnière, et à
identifier les valeurs extrêmes.
TOUFIK-Saïd_2018-2019 18
« suite » III. Les méthodes de
prévision

 La tendance est une courbe lisse


passant au milieu des données. Elle
est le plus souvent déterminée par
des méthodes de moyenne mobile,
mais on peut aussi utiliser un lissage
polynomial ou un lissage robuste
basé sur la médiane mobile.

TOUFIK-Saïd_2018-2019 19
« suite » III. Les méthodes de
prévision

 Une série chronologique peut être


décomposée en une tendance Tt,
une composante saisonnière St, et
des résidus Rt à l’aide d’un modèle
multiplicatif Xt=TtStRt .

TOUFIK-Saïd_2018-2019 20
« suite » III. Les méthodes de
prévision

 La prévision repose sur la


construction d’un modèle reliant la
présent au passé :
 Xt=f(Xt-1,Xt-2, ...)+Bruit.

TOUFIK-Saïd_2018-2019 21