Vous êtes sur la page 1sur 19

Statistiques multivariées

Séance 3: Statistiques multivariées:


Qu’est-ce que c’est?

Balázs KOTOSZ
Programme pour la séance 3
(2 heures)
• QCM

• Analyse de corrélation/régression –
pratique en Excel

• Introduction aux analyses multivariés

• Discussion de vos plans de projet


QCM
• RDV sur
– Moodle
• 6 QCM
• 10 minutes
• Navigation séquentielle (pas de retour!)
• Documents sont autorisés
• Communication n’est pas autorisée
Exploratoires, Statistiques élémentaires
descriptives, non Analyse en composantes principales
supervisées Méthodes de classification
Analyse de correspondance

Fondées sur Variable dépendante Régression linéaire multiple


un modèle quantitative Régression en composantes principales
linéaire Partial Least Squares
Prédictives,
supervisées

Méthodes
d’analyse Régression Logistique
Variable dépendante
de données Analyse discriminante
qualitative

Non linéaires Non supervisées Réseau


neuromimétique de
Kohonen

Réseau
neuromimétique
Prédictives Variable dépendante
multicouche
Supervisées quantitative ou qualitative
4
Analyse en composantes principales

• Analyse factorielle classique


• Hotelling 1933
– Dans les sciences humaines à partir de 1960
• S’applique à un ensemble de variables quantitatives
• Basé sur les corrélations (matrice de corrélations)
• Permet d’extraire le maximum d’information sous une
forme simple et cohérente à partir d’un ensemble très
important de données
• Sert à mettre en évidence les interrelations entre les
variables et les ressemblances et oppositions entre les
unités géographiques analysés
A partir de ce tableau
Un espace de deux variables
Un espace de deux variables
Pour les variables
Analyse factorielle des correspondances

• Développée en France, par J-P Benzécri


(1973)
• S’applique aux tableaux de contingence,
variables qualitatives
• A la base de données qualitatives, mesurer et
interpréter les proximités entre les individus
ou les variables
– Avec la mesure Khi-deux
• Initialement pour deux variables, extensions
pour multiples plus tard
A partir de ce tableau
Vers les trois axes factoriels
…et une représentation des villes et nations
Classification ascendante hiérarchique
• Une partition de l’ensemble des individus auxquels
l’on s’intéresse:
– Chaque classe est non vide
– L’intersection de deux classes est vide
• Permet d’effectuer des typologies régionales
– Voir la classification des climats par Köppen (1911)
• Utile pour cartographier de manière synthétique
une information multidimensionnelle
• La classification hiérarchique descendante : du
haut vers le bas (de l’ensemble vers les individus)
• La classification hiérarchique ascendante : du bas
vers le haut (des individus vers l’ensemble)
Le résultat d’une classification hiérarchique:
un arbre
Le résultat d’une classification hiérarchique
ascendante
Dendrogramme
Le résultat se varie selon les paramètres
Trois notions fondamentales dans l’approche multivariée des
différences individuelles : niveau, dispersion, corrélation

Niveau : moyenne
Dispersion : variance, écart type, somme des carrés
Corrélation : coefficient de corrélation

Proximité = similarité vs distance = différence

19

Vous aimerez peut-être aussi