Vous êtes sur la page 1sur 3

Avant d’aborder le sujet il est indispensable de faire la distinction entre analyse des données et

traitement des données dans la mesure où l’analyse des données appelée aussi analyse exploratoire
des données (AED) est une famille de méthodes statistiques dont les principales caractéristiques sont
d’être multidimensionnelles et descriptives, l’analyse des données utilisé dans l’acception française
qui désigne un sous ensemble de ce qui est appelé plus généralement la statistique multivariée, alors
que le traitement des données fait référence à toute opération (automatisé ou non) effectuée sur
ces données, il regroupe les opérations effectuées sur des données afin de les mettre sous une forme
utilisable pour une application donnée, donc afin d’intégrer telles informations dans un tel logiciel il
faut pour le faire un traitement des données, donc le traitement des données consiste
principalement à utiliser des logiciels informatiques afin de traiter l’information,

On cherche par l’analyse des données à donner les liens pouvant exister entre les différentes
données ainsi qu’à en tirer une information statistique qui sert à décrire de façon plus succincte les
principales informations contenues dans ces données, seulement dans l’acception française la
terminologie analyse des données sert à désigner un sous ensemble de ce qui est nommé d’une
façon plus générale la statistique multivariée, elle comprend essentiellement ;

 L’ACP (l’analyse en composantes principales)


 L’AFD (l’analyse factorielle discriminante ou analyse discriminante)
 L’AFC (l’analyse factorielle des correspondances)
 La classification automatique
 L’ACI (l’analyse en composantes indépendantes)

Ces méthodes permettent surtout de manipuler et de synthétiser l’information provenant de


tableaux de données de grande taille,

Les méthodes exploratoires cherchent à priori à traiter les données càd d’identifier comment et
pourquoi les variables sont liées les unes aux autres, que le chercheur en fera appel surtout pour
envisager ou aborder un ensemble de variables, des relations de causalité, (une ou plusieurs
variables explicatives, et une ou plus variables à expliquées), ce qui veut dire qu’elles sont utilisables
pour mettre en évidence l’existence de structures préexistantes dans les données,

Les principales méthodes d'analyse exploratoire qui peuvent être employées. Certaines de ces
méthodes conviennent soit à des données qualitatives (analyse par les correspondances), soit à des
données quantitatives (analyse en composantes principales), soit aux deux types de données
(analyse des similarités et des préférences, typologie).

Les inconvénients des méthodes factorielles notamment l’ACF certes elles sont particulièrement bien
adaptés à l’exploration de grands tableaux de données individuelles tels que ceux produits par les
enquêtes mais elles ne suffisent pas toujours à fournir une vue satisfaisante de l’ensemble des
données, en plus de ça elles sont non seulement capables d’accorder une vue satisfaisante de
l’ensemble des données mais elles sont parfois elles-mêmes trop complexes pour être interprétés,

L’ACP (L'analyse factorielle en composantes principales) est une technique exploratoire dont l’objet
est de chercher à partir d’un ensemble de k variables mesurées sur des échelles d'intervalle ou de
rapport, une logique, une structure sous-jacente aux données collectées et de l’identifier afin de
simplifier l’information brute contenue dans la base de données en substituant aux k variables
initiales un nombre plus petit de m facteurs qui sont formés par des combinaisons linéaires des
variables initiales, sauf que le passage de k variables à un m facteurs présente des avantages et des
inconvénients pour le chercheur.
Les k variables initiales ou de base est plus détaillé et exhaustive, et le fait de simplifier l’information
que contient ces k variables à m facteurs cela va entrainer une perte d’information au niveau des k
variables ainsi qu’une représentation nécessairement moins précise de l'état des observations,
L'objectif du chercheur est de trouver le meilleur compromis entre les bénéfices de la simplification
et les inconvénients de la perte d'information dus au passage de k variables à m facteurs (F).

Elle a donc pour objet de réduire une base de données. Les facteurs peuvent, par exemple, être
substitués aux variables initiales dans la suite des analyses (régression, etc.). Une autre utilisation
courante de l'analyse factorielle en composantes principales est la construction d'échelles. Là encore,
un ensemble de mesures brutes est remplacé par un score factoriel plus général, unique,
correspondant à chaque dimension du concept mesuré.

Alors que L’AFC s’intéresse à deux variables qualitatives, Elle a pour objet d’étudier simultanément
les lignes et les colonnes d’un tableau de chiffres et de mettre en évidence les correspondances. Son
objectif c’est de réduire la complexité des données tout en donnant le maximum d’information
possible et accessible.

L’analyse typologique a pour principal objectif de rassembler les éléments qui se ressemblent et de
séparer ceux qui diffèrent. L’intérêt de regrouper les individus est de les classer en conservant leur
caractère multidimensionnel, et non pas seulement à partir d’une seule variable. Si les variables sont
nombreuses il peut être intéressant de les regrouper afin de réduire leur nombre pour une
interprétation plus facile.

La première étape consiste à regrouper les variables ou les individus en prenant en compte leur
proximité à travers deux méthodes soit hiérarchique ou non hiérarchique. Méthode hiérarchique
(Classification ascendante hiérarchique) ça veut dire que la construction des classes se fait par des
agglomérations successives des éléments deux à deux, et les méthodes non hiérarchiques ( k
means) , on fixe un nombre de classes et le logiciel regroupe les individus en fonction de leur
proximité . la deuxième étape consiste à réaliser une analyse factorielle exploratoire puis à utiliser les
scores factoriels qui en résultent afin de déterminer les groupes d’individus pour se reposer sur des
hypothèses probabilistes …

A côté de l’approche exploratoire qui consiste surtout à :


- Décrire, explorer les données en utilisant, notamment, des moyens graphiques, visuels,
intuitifs,
- Rechercher des indices numériques qui résument le mieux possible l'allure générale des
données,
- Étudier les regroupements éventuels des données,
- Détecter des valeurs aberrantes.
L'approche confirmatoire (dite aussi inférentielle) consiste à tester des hypothèses et à estimer des
paramètres...
On ne doit pas opposer ces deux approches. Car loin de s'exclure, elles se compétent. L'approche
exploratoire est en effet susceptible de soulever des hypothèses qu'il sera possible de tester dans
une phase confirmatoire de l'analyse.

La meilleure façon de concrétiser la distinction entre ces deux approches consiste à en faire
l'analogie avec une procédure judiciaire. L'analyse exploratoire est similaire à une enquête policière,
au travail du détective qui explore, recherche des indices, soulève des hypothèses. L'analyse
confirmatoire est analogue à un procès où les avocats tentent de prouver l'innocence ou la
culpabilité d'un suspect, en faisant les présomptions que les membres du jury sont normaux, sans
biais et homogènes, c'est-à-dire qu'ils ont la même importance aux fins du procès .

Vous aimerez peut-être aussi