Vous êtes sur la page 1sur 2

Analyse

des donnes

S6, Option : Gestion

Prof. Mohamed El Merouani

Analyse des donnes


Introduction
Lanalyse des donnes est une des branches les plus vivantes de la statistique. Ses principales
mthodes se sparent en deux groupes:
Les mthodes de classification,

Les mthodes factorielles.

lM

Les mthodes de classification visant rduire la taille de lensemble des individus en


formant des groupes homognes.
Les mthodes factorielles cherchent rduire le nombre de variables en les rsumant par un

ua
ero

petit nombre de composantes synthtiques en utilisant essentiellement des outils de lalgbre


linaire et donnant lieu des reprsentations graphiques dans lesquelles les objets dcrire se
transforment en des points sur des axes et des plans.
Les principales techniques factorielles sont :

ni

Lanalyse en composantes principales (Hotelling, 1933) qui analyse un ensemble de


donnes (observations) faites sur un ensemble de variables quantitatives (numriques).

FP

Lanalyse des correspondances (Benzekri, 1964) qui est une technique de base pour
analyser des tables de contingence qui peut tre utilis pour des variables qualitatives ou

to
Te

quantitatives positives de nature trs divers.

Lanalyse canonique.(Hotelling) qui contient la Rgression multiple et lanalyse


discriminante comme des cas particulier.

ua

Les techniques factorielles de lanalyse des donnes ont une partie de fondement gnrale
commune toutes : cest celle qui sappelle l Analyse gnrale, qui est base sur les ides

dveloppes jadis par Eckart et Young (1936), quaujourdhui elles sont dveloppes encore
plus thoriquement, surtout de point du vue informatique dans les dernires annes et elles
construisent ce quon appelle Approximation dune matrice par dautres de rang infrieur ,
qui est base sur la thorie gnrale de dcomposition singulires dune matrice (Singular
Value Descomposition (SVD)).

-1-

http://elmerouani.jimdo.com

Analyse des donnes

S6, Option : Gestion

Prof. Mohamed El Merouani

Plan du cours :

Analyse en composantes principales (ACP)


Analyse factorielle des correspondances (AFC)
Analyse canonique
Analyse des correspondances
Analyse discriminante.

Bibliographie:

El Marhoum, A.(2005): Analyse des donnes . Toubkal.

Labrousse, C. (1976): Introduction lconmtrie . Dunod.

Saporta, G. (1990): Probabilits, Analyse des donnes et Statistique . TECHNIP.

ua
ero

lM

ANALYSE EN COMPOSANTES PRINCIPALES (ACP)


Introduction :

Lanalyse en composantes principales (Hotelling, 1933) est une mthode de lanalyse des

ni

donnes qui a pour objectif de rduire le nombre de donnes, souvent trs lev, dun tableau
de donnes reprsent, algbriquement, comme une matrice et, gomtriquement comme un

FP

nuage de points.

Lanalyse en composantes principales consiste en ltude des projections des points de ce


nuage sur un axe (axe factoriel ou principal), un plan ou un hyperplan judicieusement

to
Te

dtermin. Mathmatiquement, on obtiendrait le meilleur ajustement du nuage par des sousespaces vectoriels. Algbriquement, il sagit de chercher les valeurs propres maximales de la
matrice des donnes et par consquent ses vecteurs propres associs qui reprsenteront ces

ua

sous-espaces vectoriels (axes factoriels ou principales).

Lors de la projection, le nuage peut tre dform est donc serait diffrent de rel, alors les

mthodes dajustement consistent en minimiser cette possible dformation et ce en


maximisant les distances projetes.

-2-

http://elmerouani.jimdo.com