d’analyse de données
TOUFIK-Saïd_2018-2019 1
I. Les méthodes explicatives
Dans les méthodes explicatives, on
cherche à relier une variable à expliquer Y
à un ensemble de variables explicatives
X1, …, Xk.
Pour cela, on dispose d’un tableau
individus×variables, tableau dont les lignes
représentent les valeurs des variables Y, X1,
…, Xk sur les différents individus étudiés.
TOUFIK-Saïd_2018-2019 2
« suite » I. Les méthodes
explicatives
Il s’agit d’ajuster sur les données disponibles
le modèle :
Y = f(X1, …, Xk) + Résidu
où f est le plus souvent, mais pas
toujours, une fonction linéaire, et de
quantifier la fiabilité de la prévision de Y à
partir des X1, …, Xk.
Les méthodes statistiques à utiliser
dépendent de la nature quantitative ou
qualitative des variables.
TOUFIK-Saïd_2018-2019 3
« suite » I. Les méthodes
explicatives
Tableau 1
Les méthodes explicatives
Variable Variables explicatives
à expliquer X1, …, Xk
Y Quantitatives Qualitatives Mélange
Analyse discriminante
Qualitative Modèle linéaire généralisé
Régression logistique
TOUFIK-Saïd_2018-2019 4
II. Les méthodes descriptives
Les méthodes descriptives s’appliquent
aux tableaux individus×variables où
toutes les variables jouent le même rôle.
Il n’y a pas de variable à expliquer Y.
Il s’agit donc de résumer, de « voir », de
comprendre le tableau de données
[X1,…,Xk].
Ainsi, l’objectif des méthodes descriptives
est de visualiser et classer les données.
TOUFIK-Saïd_2018-2019 5
« suite » II. Les méthodes
descriptives
X1 X2 X3 X4
.4
X3
2
1
Tableau 1
X1
2
individus .3
Axe 1
3 × X2
5
4 variables
X4
5
TOUFIK-Saïd_2018-2019 6
« suite » II. Les méthodes
descriptives
TOUFIK-Saïd_2018-2019 7
« suite » II. Les méthodes
descriptives
La position des individus sur la carte
traduit des ressemblances entre les
individus. Par exemple les individus 1 et
2 se ressemblent, mais sont très
différents de l’individu 3.
TOUFIK-Saïd_2018-2019 8
« suite » II. Les méthodes
descriptives
La position des variables sur la carte
reflète les corrélations entre les variables
: les variables X1 et X2 sont fortement
corrélées positivement, les variables X3
et X4 sont corrélées négativement, et les
variables X1, X2 sont faiblement
corrélées aux variables X3, X4.
TOUFIK-Saïd_2018-2019 9
« suite » II. Les méthodes
descriptives
Les projections des individus sur les axes
variables reflètent les valeurs des
variables sur les individus :
Les individus 1 et 2 sont forts sur X1, X2,
alors que l’individu 3 est faible sur ces
mêmes variables ; l’individu 4 est moyen
sur X3, mais faible sur X4 et c’est le
contraire pour l’individu 5.
TOUFIK-Saïd_2018-2019 10
« suite » II. Les méthodes
descriptives
Les méthodes de visualisation dépendent
de la nature des variables et sont
présentées dans le tableau 2 :
TOUFIK-Saïd_2018-2019 11
« suite » II. Les méthodes
descriptives
Tableau 2
Méthodes descriptives : Méthodes de visualisation
Qualitatives
Quantitatives
k=2 k>2
TOUFIK-Saïd_2018-2019 12
« suite » II. Les méthodes
descriptives
Par ailleurs, les méthodes de classification
ont pour objectif de former des classes
d’individus et de variables de telle sorte
que :
TOUFIK-Saïd_2018-2019 13
« suite » II. Les méthodes
descriptives
des individus appartenant à une même
classe sont proches et des individus
appartenant à des classes distinctes sont
éloignées ;
des variables appartenant à une même
classe sont corrélées entre elles, et des
variables appartenant à des classes
distinctes sont faiblement corrélées entre
elles.
TOUFIK-Saïd_2018-2019 14
« suite » II. Les méthodes
descriptives
Sur la figure 1, nous avons formé une
typologie des individus en deux classes
{1,2,5} et {3,4}, et il apparaît une
typologie des variables en deux classes
{X1,X2} et {X3,X4}.
TOUFIK-Saïd_2018-2019 15
« suite » II. Les méthodes
descriptives
Les méthodes de classification les plus
utilisées en gestion sont :
La classification ascendante
hiérarchique ;
Les nuées dynamiques (nombre d’individus
élevé).
TOUFIK-Saïd_2018-2019 16
« suite » II. Les méthodes
descriptives
Les méthodes descriptives (méthodes de
visualisation et méthodes de
classification) correspondent à ce qu’on
appelle en France l’analyse de données.
TOUFIK-Saïd_2018-2019 17
III. Les méthodes de prévision
TOUFIK-Saïd_2018-2019 19
« suite » III. Les méthodes de
prévision
TOUFIK-Saïd_2018-2019 20
« suite » III. Les méthodes de
prévision
TOUFIK-Saïd_2018-2019 21