Vous êtes sur la page 1sur 44

Introduction à l’analyse de données

Analyse de données

Abdallah Abarda
FSJES Settat,
Année universitaire 2019-2020.

Séance 1 : Le 02-10-2019

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

Types d’analyse

FAbdallah
IGURE – TypesModule:
Abarda d’analyse
Analyse de données
Introduction à l’analyse de données

Types d’analyse

Objet du cours
L’objet de ce cours est de donner quelques outils couramment
employés en statistique pour traiter des données
multidimensionnelles. Ces données correspondent souvent à
l’observation de nombreuses variables aléatoires sur plusieurs
individus.

Objectif
Le but est d’extraire le maximum d’informations d’un tableau
de données.

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

Types d’analyse

Objet du cours
L’objet de ce cours est de donner quelques outils couramment
employés en statistique pour traiter des données
multidimensionnelles. Ces données correspondent souvent à
l’observation de nombreuses variables aléatoires sur plusieurs
individus.

Objectif
Le but est d’extraire le maximum d’informations d’un tableau
de données.

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

Types d’analyse

Objet du cours
L’objet de ce cours est de donner quelques outils couramment
employés en statistique pour traiter des données
multidimensionnelles. Ces données correspondent souvent à
l’observation de nombreuses variables aléatoires sur plusieurs
individus.

Objectif
Le but est d’extraire le maximum d’informations d’un tableau
de données.

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

1 Introduction à l’analyse de données


2 Analyse Factorielle
3 Analyse en Composantes Principales (ACP)
4 Analyse Factorielle des Correspondances (AFC)
5 Analyse des Correspondances Multiples (ACM)
6 Analyse Factorielle Discriminante (AFD)
7 Classification

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

1 Introduction à l’analyse de données


2 Analyse Factorielle
3 Analyse en Composantes Principales (ACP)
4 Analyse Factorielle des Correspondances (AFC)
5 Analyse des Correspondances Multiples (ACM)
6 Analyse Factorielle Discriminante (AFD)
7 Classification

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

1 Introduction à l’analyse de données


2 Analyse Factorielle
3 Analyse en Composantes Principales (ACP)
4 Analyse Factorielle des Correspondances (AFC)
5 Analyse des Correspondances Multiples (ACM)
6 Analyse Factorielle Discriminante (AFD)
7 Classification

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

1 Introduction à l’analyse de données


2 Analyse Factorielle
3 Analyse en Composantes Principales (ACP)
4 Analyse Factorielle des Correspondances (AFC)
5 Analyse des Correspondances Multiples (ACM)
6 Analyse Factorielle Discriminante (AFD)
7 Classification

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

1 Introduction à l’analyse de données


2 Analyse Factorielle
3 Analyse en Composantes Principales (ACP)
4 Analyse Factorielle des Correspondances (AFC)
5 Analyse des Correspondances Multiples (ACM)
6 Analyse Factorielle Discriminante (AFD)
7 Classification

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

1 Introduction à l’analyse de données


2 Analyse Factorielle
3 Analyse en Composantes Principales (ACP)
4 Analyse Factorielle des Correspondances (AFC)
5 Analyse des Correspondances Multiples (ACM)
6 Analyse Factorielle Discriminante (AFD)
7 Classification

Abdallah Abarda Module: Analyse de données


Introduction à l’analyse de données

1 Introduction à l’analyse de données


2 Analyse Factorielle
3 Analyse en Composantes Principales (ACP)
4 Analyse Factorielle des Correspondances (AFC)
5 Analyse des Correspondances Multiples (ACM)
6 Analyse Factorielle Discriminante (AFD)
7 Classification

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

1 Introduction à l’analyse de données


Introduction
Domaines d’application
Types de tableaux analysables
Logiciels
Rappels mathématiques et statistiques

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition

Analyse de données
l’analyse des données est un ensemble de techniques pour :
découvrir la structure, éventuellement compliquée, d’un
tableau de nombres à plusieurs dimensions
traduire les données par une structure plus simple
(graphique) et qui les résume au mieux

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition

Analyse de données
l’analyse des données est un ensemble de techniques pour :
découvrir la structure, éventuellement compliquée, d’un
tableau de nombres à plusieurs dimensions
traduire les données par une structure plus simple
(graphique) et qui les résume au mieux

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Introduction

Objectifs des méthodes d’AD


Les objectifs sont souvent présentés en fonction du type de
méthodes, ainsi deux objectifs ressortent :
la visualisation des données dans le meilleur espace réduit.
le regroupement dans tout l’espace (le traitement
simultané de toute l’information).

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Introduction

Objectifs des méthodes d’AD


Les objectifs sont souvent présentés en fonction du type de
méthodes, ainsi deux objectifs ressortent :
la visualisation des données dans le meilleur espace réduit.
le regroupement dans tout l’espace (le traitement
simultané de toute l’information).

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Introduction

Objectifs des méthodes d’AD


Les objectifs sont souvent présentés en fonction du type de
méthodes, ainsi deux objectifs ressortent :
la visualisation des données dans le meilleur espace réduit.
le regroupement dans tout l’espace (le traitement
simultané de toute l’information).

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Introduction

Objectifs des méthodes d’AD


Les objectifs sont souvent présentés en fonction du type de
méthodes, ainsi deux objectifs ressortent :
la visualisation des données dans le meilleur espace réduit.
le regroupement dans tout l’espace (le traitement
simultané de toute l’information).

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition
Analyse de données
Les méthodes d’analyse fournissent souvent une
représentation graphique.
Comme il est difficile de visualiser des points dans des
espaces de dimensions supérieures à deux, nous
chercherons à représenter ces points dans des plans.
Ces méthodes cherchent les ressemblances entre les
individus et les liaisons entre les variables.
Les proximités entre individus et variables vont permettre
de déterminer une typologie des individus et des variables.
Cette représentation fournit une synthèse des résultats des
analyses.
Abdallah Abarda Module: Analyse de données
Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition
Analyse de données
Les méthodes d’analyse fournissent souvent une
représentation graphique.
Comme il est difficile de visualiser des points dans des
espaces de dimensions supérieures à deux, nous
chercherons à représenter ces points dans des plans.
Ces méthodes cherchent les ressemblances entre les
individus et les liaisons entre les variables.
Les proximités entre individus et variables vont permettre
de déterminer une typologie des individus et des variables.
Cette représentation fournit une synthèse des résultats des
analyses.
Abdallah Abarda Module: Analyse de données
Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition
Analyse de données
Les méthodes d’analyse fournissent souvent une
représentation graphique.
Comme il est difficile de visualiser des points dans des
espaces de dimensions supérieures à deux, nous
chercherons à représenter ces points dans des plans.
Ces méthodes cherchent les ressemblances entre les
individus et les liaisons entre les variables.
Les proximités entre individus et variables vont permettre
de déterminer une typologie des individus et des variables.
Cette représentation fournit une synthèse des résultats des
analyses.
Abdallah Abarda Module: Analyse de données
Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition
Analyse de données
Les méthodes d’analyse fournissent souvent une
représentation graphique.
Comme il est difficile de visualiser des points dans des
espaces de dimensions supérieures à deux, nous
chercherons à représenter ces points dans des plans.
Ces méthodes cherchent les ressemblances entre les
individus et les liaisons entre les variables.
Les proximités entre individus et variables vont permettre
de déterminer une typologie des individus et des variables.
Cette représentation fournit une synthèse des résultats des
analyses.
Abdallah Abarda Module: Analyse de données
Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition
Analyse de données
Les méthodes d’analyse fournissent souvent une
représentation graphique.
Comme il est difficile de visualiser des points dans des
espaces de dimensions supérieures à deux, nous
chercherons à représenter ces points dans des plans.
Ces méthodes cherchent les ressemblances entre les
individus et les liaisons entre les variables.
Les proximités entre individus et variables vont permettre
de déterminer une typologie des individus et des variables.
Cette représentation fournit une synthèse des résultats des
analyses.
Abdallah Abarda Module: Analyse de données
Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition

Analyse de données
L’analyse de données regroupe deux familles de méthodes
Une famille de méthodes cherche à représenter de grands
ensembles de données par peu de variables i.e. (réduction
de dimension)
Une famille de méthodes cherche à classer les données de
manière automatique. Ces méthodes sont complémentaires
avec les précédentes pour synthétiser et analyser les
données et caractériser les proximités entre individus et
celles entre variables.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition

Analyse de données
La première catégorie de méthode relève de la géométrie
euclidienne et conduisent à l’extraction de valeurs et de
vecteurs propres, sont appelées "analyses factorielles".
La deuxième dite de "classification automatique", elle est
caractérisée par le choix d’un indice de proximité et d’un
algorithme d’agrégation ou de désagrégation qui
permettent d’obtenir une partition ou arbre de
classification.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Définition

Analyse de données
La première catégorie de méthode relève de la géométrie
euclidienne et conduisent à l’extraction de valeurs et de
vecteurs propres, sont appelées "analyses factorielles".
La deuxième dite de "classification automatique", elle est
caractérisée par le choix d’un indice de proximité et d’un
algorithme d’agrégation ou de désagrégation qui
permettent d’obtenir une partition ou arbre de
classification.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Domaines d’application

les méthodes d’analyse de données sont employées dans


un grand nombre de domaines qu’il est impossible
d’énumérer.
ces méthodes sont beaucoup utilisées en marketing par
exemple pour la gestion de la clientèle.
Analyse d’enquêtes et interprétation de sondage.
écologie, linguistique, économie, assurance, banque,
traitement de signal et d’image, analyse de réseaux
sociaux, biologie et médecine ...

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Domaines d’application

les méthodes d’analyse de données sont employées dans


un grand nombre de domaines qu’il est impossible
d’énumérer.
ces méthodes sont beaucoup utilisées en marketing par
exemple pour la gestion de la clientèle.
Analyse d’enquêtes et interprétation de sondage.
écologie, linguistique, économie, assurance, banque,
traitement de signal et d’image, analyse de réseaux
sociaux, biologie et médecine ...

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Domaines d’application

les méthodes d’analyse de données sont employées dans


un grand nombre de domaines qu’il est impossible
d’énumérer.
ces méthodes sont beaucoup utilisées en marketing par
exemple pour la gestion de la clientèle.
Analyse d’enquêtes et interprétation de sondage.
écologie, linguistique, économie, assurance, banque,
traitement de signal et d’image, analyse de réseaux
sociaux, biologie et médecine ...

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Domaines d’application

les méthodes d’analyse de données sont employées dans


un grand nombre de domaines qu’il est impossible
d’énumérer.
ces méthodes sont beaucoup utilisées en marketing par
exemple pour la gestion de la clientèle.
Analyse d’enquêtes et interprétation de sondage.
écologie, linguistique, économie, assurance, banque,
traitement de signal et d’image, analyse de réseaux
sociaux, biologie et médecine ...

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Données

Données
Les données se présentent généralement sous la forme d’un
tableau rectangulaire, dont les lignes correspondent à des
individus ou unités statistiques et les colonnes à des variables
appelées caractères ou caractéristiques.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Données

Données
Les données se présentent généralement sous la forme d’un
tableau rectangulaire, dont les lignes correspondent à des
individus ou unités statistiques et les colonnes à des variables
appelées caractères ou caractéristiques.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Données

Données
Les données se présentent généralement sous la forme d’un
tableau rectangulaire, dont les lignes correspondent à des
individus ou unités statistiques et les colonnes à des variables
appelées caractères ou caractéristiques.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Données

la population peut être décrite par des données de deux types


de caractères : qualitatif ou quantitatif
Les caractères qualitatifs peuvent être :
Purs (variables nominales) i.e. que les modalités ne
possèdent pas de structure d’ordre ;
Ordonnés (variables ordinales ) i.e. que les modalités
qualitatives sont ordonnées ;

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Données

la population peut être décrite par des données de deux types


de caractères : qualitatif ou quantitatif
Les caractères qualitatifs peuvent être :
Purs (variables nominales) i.e. que les modalités ne
possèdent pas de structure d’ordre ;
Ordonnés (variables ordinales ) i.e. que les modalités
qualitatives sont ordonnées ;

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Données

la population peut être décrite par des données de deux types


de caractères : qualitatif ou quantitatif
Les caractères qualitatifs peuvent être :
Purs (variables nominales) i.e. que les modalités ne
possèdent pas de structure d’ordre ;
Ordonnés (variables ordinales ) i.e. que les modalités
qualitatives sont ordonnées ;

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Données

la population peut être décrite par des données de deux types


de caractères : qualitatif ou quantitatif
Les caractères qualitatifs peuvent être :
Purs (variables nominales) i.e. que les modalités ne
possèdent pas de structure d’ordre ;
Ordonnés (variables ordinales ) i.e. que les modalités
qualitatives sont ordonnées ;

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Types d’analyse

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Types d’analyse

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Logiciels d’analyse de données

1 SAS : Un logiciel de statistique très complet et très


performant. Il est très bien adapté à tous traitements
statistiques sur des données très volumineuses.
2 Splus : Splus est à la fois un langage statistique et
graphique interactif interprété et orienté objet. C’est donc à
la fois un logiciel statistique et un langage de
programmation.
3 R : Ce logiciel est la version gratuite de Splus. Il semble très
peu employé en industrie. En revanche, il est de plus en
plus employé pour la réalisation de recherches statistiques.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Logiciels d’analyse de données

1 SAS : Un logiciel de statistique très complet et très


performant. Il est très bien adapté à tous traitements
statistiques sur des données très volumineuses.
2 Splus : Splus est à la fois un langage statistique et
graphique interactif interprété et orienté objet. C’est donc à
la fois un logiciel statistique et un langage de
programmation.
3 R : Ce logiciel est la version gratuite de Splus. Il semble très
peu employé en industrie. En revanche, il est de plus en
plus employé pour la réalisation de recherches statistiques.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Logiciels d’analyse de données

1 SAS : Un logiciel de statistique très complet et très


performant. Il est très bien adapté à tous traitements
statistiques sur des données très volumineuses.
2 Splus : Splus est à la fois un langage statistique et
graphique interactif interprété et orienté objet. C’est donc à
la fois un logiciel statistique et un langage de
programmation.
3 R : Ce logiciel est la version gratuite de Splus. Il semble très
peu employé en industrie. En revanche, il est de plus en
plus employé pour la réalisation de recherches statistiques.

Abdallah Abarda Module: Analyse de données


Introduction
Introduction
Domaines d’application
Introduction à l’analyse de données
Types de tableaux analysables (données)
Logiciels
Rappels Mathématiques et statistiques

Logiciels d’analyse de données

XlStat : Excel propose une macro payante permettant


d’effectuer quelques méthodes d’analyse de données. Elle
est cependant très limitée, utilisable qu’avec Excel sous
Windows et de plus payante.
Autres : UniWin Plus, Stalab, SPAD, Tanagra, python...

Abdallah Abarda Module: Analyse de données

Vous aimerez peut-être aussi