Vous êtes sur la page 1sur 90

Introduction

Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée


Les Méthodes d’AMD

Analyse Des Données


Chapitre I : Introduction, rappels mathématiques et de statistique
descriptive

Brice DONGMEZO, PhD


Ingénieur Statistitien Economiste
brice.dongmezo@issea-cemac.org

Institut Sous-régional de Statistiques et d’Economie Appliquée (ISSEA) - Yaoundé


ISE Math-Eco & ISE L3 - S2

7th February 2024

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 1 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Outline

Introduction

Rappels Généraux
Opérations algébriques
Décompositions matricielle
Concepts fondamentaux de la statistique
Analyse statistique univariée et bivariée

Les Méthodes d’AMD


Définitions AMD
Domaines d’application
Les objectifs, données et les méthodes
Les logiciels

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 2 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Objectifs du cours

Objectif
• Objectif principal :
Renforcer les acquis des cours de statistique descriptive, le logiciel
statistique et dans une certaine mesure de statistique inférentielle
• Objectif spécifique
• Comprendre les techniques factorielles d’analyse des données pour la
description de données numériques multidimensionnelles ou pour
l’analyse des liaisons entre plusieurs variables de même type ou de
type différent.
• Identifier des problématiques statistiques, économiques et sociales
nécessitant l’utilisation des techniques d’ADD.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 3 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Organisation pratique du cours

• 30 heures de cours reparties en 08 semaines (plus ou moins suivant


la disponibilité de l’enseignant)
• 12 heures de cours magistral (CM)
• 6 heures de travaux dirigés (TD)
• 12 heures de travaux pratiques (TP)

• Evaluation du module
• Projet sur les méthodes étudiées + présentation vous pouvez
commencer maintenant.
• Examen final à la fin du semestre sur table.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 4 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Propos introductifs

• Les statistiques descriptives permettent une première exploration


de données.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 5 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Propos introductifs

• Les statistiques descriptives permettent une première exploration


de données.
• Elles sont basées sur des calculs simples, des tableaux
statistiques et des graphiques

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 5 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Propos introductifs

• Les statistiques descriptives permettent une première exploration


de données.
• Elles sont basées sur des calculs simples, des tableaux
statistiques et des graphiques
• Elles donnent un premier aperçu des données qui peut montrer des
tendances

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 5 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Propos introductifs

• Les statistiques descriptives permettent une première exploration


de données.
• Elles sont basées sur des calculs simples, des tableaux
statistiques et des graphiques
• Elles donnent un premier aperçu des données qui peut montrer des
tendances
• Elles permettent aussi de caractériser les données, ce qui
nécessaire pour choisir ensuite la manière de les analyser

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 5 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Propos introductifs

• Les statistiques descriptives permettent une première exploration


de données.
• Elles sont basées sur des calculs simples, des tableaux
statistiques et des graphiques
• Elles donnent un premier aperçu des données qui peut montrer des
tendances
• Elles permettent aussi de caractériser les données, ce qui
nécessaire pour choisir ensuite la manière de les analyser
• Dans ce cours nous allons nous concentrer essentiellement sur les
statistiques descriptives multivariées. On fait un rappel rapide dans
ce chapitre de l’algèbre matricielle nécessaire à l’analyse factorielle,
des statistiques descriptives univariées puis statistiques
descriptives bivariées.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 5 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Opérations sur les matrices

• Notation matricielle : une matrice A de n lignes et p colonne se


note A = (aij )i=1,...,m;j=1,...,n et B = (bij )i=1,...,n;j=1,...,p , les aij et les
bij appartenant à un corps K.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 6 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Opérations sur les matrices

• Notation matricielle : une matrice A de n lignes et p colonne se


note A = (aij )i=1,...,m;j=1,...,n et B = (bij )i=1,...,n;j=1,...,p , les aij et les
bij appartenant à un corps K.
• Somme matricielle : A + B = aij + bij = (aij + bij )ij ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 6 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Opérations sur les matrices

• Notation matricielle : une matrice A de n lignes et p colonne se


note A = (aij )i=1,...,m;j=1,...,n et B = (bij )i=1,...,n;j=1,...,p , les aij et les
bij appartenant à un corps K.
• Somme matricielle : A + B = aij + bij = (aij + bij )ij ;

• Soustraction matricielle : A − B = aij − bij = (aij − bij )ij ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 6 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Opérations sur les matrices

• Notation matricielle : une matrice A de n lignes et p colonne se


note A = (aij )i=1,...,m;j=1,...,n et B = (bij )i=1,...,n;j=1,...,p , les aij et les
bij appartenant à un corps K.
• Somme matricielle : A + B = aij + bij = (aij + bij )ij ;

• Soustraction matricielle : A − B = aij − bij = (aij − bij )ij ;

• Produit : A × B = (cij = nk=1 aik bkj );


P

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 6 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Opérations sur les matrices

• Notation matricielle : une matrice A de n lignes et p colonne se


note A = (aij )i=1,...,m;j=1,...,n et B = (bij )i=1,...,n;j=1,...,p , les aij et les
bij appartenant à un corps K.
• Somme matricielle : A + B = aij + bij = (aij + bij )ij ;

• Soustraction matricielle : A − B = aij − bij = (aij − bij )ij ;

• Produit : A × B = (cij = nk=1 aik bkj );


P

• Produit par un scalaire : µB = (µbij ); Associé à la somme confère


à Mij (K) ensemble des matrices de m lignes et n colonnes que le
corps K la structure d’espace vectoriel de dimension mn.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 6 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Opérations sur les matrices

• Notation matricielle : une matrice A de n lignes et p colonne se


note A = (aij )i=1,...,m;j=1,...,n et B = (bij )i=1,...,n;j=1,...,p , les aij et les
bij appartenant à un corps K.
• Somme matricielle : A + B = aij + bij = (aij + bij )ij ;

• Soustraction matricielle : A − B = aij − bij = (aij − bij )ij ;

• Produit : A × B = (cij = nk=1 aik bkj );


P

• Produit par un scalaire : µB = (µbij ); Associé à la somme confère


à Mij (K) ensemble des matrices de m lignes et n colonnes que le
corps K la structure d’espace vectoriel de dimension mn.
• Inverse d’une Matrice : Si A est une matrice carré d’ordre n,
l’inverse de A est la matrice B telle que AB = I où I est la matrice
identité constituée de 1 à la diagonale et 0 partout ailleurs.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 6 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Diagonalisation
• Trace d’une matrice : Somme des éléments diagonaux (matrice
Pn
carré d’ordre n) tr (A) = i=1 aii (Rappelez quelques propriétés de
la Trace: tr (λA) =?, tr (AB) =?, tr (λ) =?);

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 7 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Diagonalisation
• Trace d’une matrice : Somme des éléments diagonaux (matrice
Pn
carré d’ordre n) tr (A) = i=1 aii (Rappelez quelques propriétés de
la Trace: tr (λA) =?, tr (AB) =?, tr (λ) =?);
• Déterminant d’une matrice : pour j fixé,
Pn
det(A) = i=1 (−1)i+j aij det(Aij ) avec Aij matrice dans laquelle on
a supprimé simultanément la ligne i et la colonne j (Rappelez
quelques propriétés du déterminant);

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 7 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Diagonalisation
• Trace d’une matrice : Somme des éléments diagonaux (matrice
Pn
carré d’ordre n) tr (A) = i=1 aii (Rappelez quelques propriétés de
la Trace: tr (λA) =?, tr (AB) =?, tr (λ) =?);
• Déterminant d’une matrice : pour j fixé,
Pn
det(A) = i=1 (−1)i+j aij det(Aij ) avec Aij matrice dans laquelle on
a supprimé simultanément la ligne i et la colonne j (Rappelez
quelques propriétés du déterminant);
• Valeurs propres : Quantités λ solution de l’équation
det(A − λI) = 0;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 7 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Diagonalisation
• Trace d’une matrice : Somme des éléments diagonaux (matrice
Pn
carré d’ordre n) tr (A) = i=1 aii (Rappelez quelques propriétés de
la Trace: tr (λA) =?, tr (AB) =?, tr (λ) =?);
• Déterminant d’une matrice : pour j fixé,
Pn
det(A) = i=1 (−1)i+j aij det(Aij ) avec Aij matrice dans laquelle on
a supprimé simultanément la ligne i et la colonne j (Rappelez
quelques propriétés du déterminant);
• Valeurs propres : Quantités λ solution de l’équation
det(A − λI) = 0;
• Vecteurs propres : Solution de l’équation Au = λu une fois les λ
obtenus.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 7 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Diagonalisation
• Trace d’une matrice : Somme des éléments diagonaux (matrice
Pn
carré d’ordre n) tr (A) = i=1 aii (Rappelez quelques propriétés de
la Trace: tr (λA) =?, tr (AB) =?, tr (λ) =?);
• Déterminant d’une matrice : pour j fixé,
Pn
det(A) = i=1 (−1)i+j aij det(Aij ) avec Aij matrice dans laquelle on
a supprimé simultanément la ligne i et la colonne j (Rappelez
quelques propriétés du déterminant);
• Valeurs propres : Quantités λ solution de l’équation
det(A − λI) = 0;
• Vecteurs propres : Solution de l’équation Au = λu une fois les λ
obtenus.
• Matrice Diagonale : elle est donnée par A = UDλ U −1 , où U est la
matrice dont les colonnes sont les vecteurs propres de A et Dλ est
celle dont les éléments diagonaux sont les valeurs propres de A.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 7 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Population - Individus - Echantillon

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 8 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Types de variables

Une variable est une caractéristique commune aux individus d’une


population. Exemple : Sexe, Age etc.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 9 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;
• Les enquêtes (programmée et précises, se concentrent sur une
population cible dit échantillon) ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;
• Les enquêtes (programmée et précises, se concentrent sur une
population cible dit échantillon) ;
• Les sondages (rapide et très ciblé, généralement utilisé en politique) ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;
• Les enquêtes (programmée et précises, se concentrent sur une
population cible dit échantillon) ;
• Les sondages (rapide et très ciblé, généralement utilisé en politique) ;
• Les entretiens (ou focus group, utilisés par les sociologues) ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;
• Les enquêtes (programmée et précises, se concentrent sur une
population cible dit échantillon) ;
• Les sondages (rapide et très ciblé, généralement utilisé en politique) ;
• Les entretiens (ou focus group, utilisés par les sociologues) ;
• L’enregistrement (systématique et parfois obligatoire : registres,
licences) ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;
• Les enquêtes (programmée et précises, se concentrent sur une
population cible dit échantillon) ;
• Les sondages (rapide et très ciblé, généralement utilisé en politique) ;
• Les entretiens (ou focus group, utilisés par les sociologues) ;
• L’enregistrement (systématique et parfois obligatoire : registres,
licences) ;
• Les consultations de bases de données (issue d’une collecte
automatique) ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;
• Les enquêtes (programmée et précises, se concentrent sur une
population cible dit échantillon) ;
• Les sondages (rapide et très ciblé, généralement utilisé en politique) ;
• Les entretiens (ou focus group, utilisés par les sociologues) ;
• L’enregistrement (systématique et parfois obligatoire : registres,
licences) ;
• Les consultations de bases de données (issue d’une collecte
automatique) ;
• Les déclarations (qui sont issue de la loi, devoir etc. : Naissances,
décès etc.) ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Concepts fondamentaux de la statistique


Quelques sources/origine des données

En général, les bases de données qui sont une collection de variables


peuvent être obtenues de diverses façons. Il s’agit par exemple :
• Les recensements (de population, agricole, bétail... important pour
les bases de sondages.) ;
• Les enquêtes (programmée et précises, se concentrent sur une
population cible dit échantillon) ;
• Les sondages (rapide et très ciblé, généralement utilisé en politique) ;
• Les entretiens (ou focus group, utilisés par les sociologues) ;
• L’enregistrement (systématique et parfois obligatoire : registres,
licences) ;
• Les consultations de bases de données (issue d’une collecte
automatique) ;
• Les déclarations (qui sont issue de la loi, devoir etc. : Naissances,
décès etc.) ;
• Les méthodes liées aux big data (obtenues généralement à travers
internet), etc.
Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 10 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Traitement préliminaire sur les données

Une fois les données à notre disposition, on essaie d’identifier les sources
de problèmes habituels tel que :
• Valeurs manquantes, erronées (aberrantes) ou atypiques ;
• Modalités trop rares ;
• Distributions "anormales" (dissymétrie, multimodalité, épaisseur des
queues) ;
• Incohérences, liaisons non linéaires. . .
On appliquera éventuellement des corrections telles que :
• Transformation : logarithme, puissance, réduction, rangs. . . des
variables,
• Codage en classe ou recodage de classes,
• Imputation ou non des données manquantes,
• Lissage, décompositions de courbes,
• Réduction de dimension, classification et premier choix de variables
etc.
Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 11 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable qualitative

• Pour analyser une variable qualitative, on dresse un tableau qui


donne les effectifs et les pourcentages des différentes modalités de la
variable (tri à plat).

Table: Exemple sur la mendicité des almoudos (enfant de la rue en


hassanya) à Nouakchott

Mendicité Effectif Fréquence (%)


Almoudo non mendiant 36 16,25%
Almoudo mendiant 134 83,75%
Total 160 100%

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 12 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable qualitative

• Pour analyser une variable qualitative, on dresse un tableau qui


donne les effectifs et les pourcentages des différentes modalités de la
variable (tri à plat).

Table: Exemple sur la mendicité des almoudos (enfant de la rue en


hassanya) à Nouakchott

Mendicité Effectif Fréquence (%)


Almoudo non mendiant 36 16,25%
Almoudo mendiant 134 83,75%
Total 160 100%

• Commenter et interpreter en insistant sur les fréquences particulières


ou sur l’objet de l’étude.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 12 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable qualitative

Exemple de résumé graphique

Figure: Repartition des almoudos mendiants et non mendiants

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 13 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :
• Etendue

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :
• Etendue
• Variance

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :
• Etendue
• Variance
• Ecart type

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :
• Etendue
• Variance
• Ecart type
• Les caractéristiques de forme :

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :
• Etendue
• Variance
• Ecart type
• Les caractéristiques de forme :
• L’asymétrie

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :
• Etendue
• Variance
• Ecart type
• Les caractéristiques de forme :
• L’asymétrie
• L’aplatissement

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Pour apprécier la distribution d’une variable quantitative, différents


indicateurs peuvent être calculés, dont des indicateurs de tendance
centrale, de dispersion, de forme etc.
• On peut caractériser en particulier :
• Les caractéristiques de position :
• Mode
• Médiane
• Quantiles
• Moyennes
• Les caractéristiques de dispersion :
• Etendue
• Variance
• Ecart type
• Les caractéristiques de forme :
• L’asymétrie
• L’aplatissement
• Ici aussi il faut faire des commentaires et interprétations en insistant
sur les indicateurs particuliers ou qui aident à mieux comprendre
l’objet de l’étude.
Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 14 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Nous allons rappeler ici quelques indicateurs clés :


• La moyenne : x̄ : c’est la valeur qu’aurait pris chaque individu si la
variable était répartie de façon égalitaire. La moyenne est un
indicateur de tendance centrale qui a l’inconvénient de cacher les
inégalités au sein de la population.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 15 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Nous allons rappeler ici quelques indicateurs clés :


• La moyenne : x̄ : c’est la valeur qu’aurait pris chaque individu si la
variable était répartie de façon égalitaire. La moyenne est un
indicateur de tendance centrale qui a l’inconvénient de cacher les
inégalités au sein de la population.
• Les quantiles :

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 15 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

• La variance σ 2 : C’est un indicateur de dispersion qui permet de


mesurer le degré d’homogénéité d’une population grâce notamment
à l’écart-type σ qui est sa racine carrée.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 16 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

• La variance σ 2 : C’est un indicateur de dispersion qui permet de


mesurer le degré d’homogénéité d’une population grâce notamment
à l’écart-type σ qui est sa racine carrée.
• σ faible signifie une dispersion (des individus autour de la moyenne).
Ce qui veut dire que la population est homogène. Dans ce cas, la
moyenne est représentative et son calcul a de sens.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 16 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

• La variance σ 2 : C’est un indicateur de dispersion qui permet de


mesurer le degré d’homogénéité d’une population grâce notamment
à l’écart-type σ qui est sa racine carrée.
• σ faible signifie une dispersion (des individus autour de la moyenne).
Ce qui veut dire que la population est homogène. Dans ce cas, la
moyenne est représentative et son calcul a de sens.
• σ élevé signifie une forte hétérogénéité de la population. Dans ce cas
x̄ n’a pas de sens.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 16 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

Exemple de tableau de statistiques descriptive sur variables


quantitative

Table: Statistiques descriptives pour variables quantitatives

VARIABLES N mean sd min max


Montant versé par jour au maitre 161 108.1 128.6 0 500
Nbre d’heures d’apprentissage 161 8.360 1.132 2 10
Age de l’almoudo 161 11.91 3.162 3 17
Taille de la famille de l’almoudo 161 5.093 2.554 0 13
La charge de l’almoudo 161 2.373 2.859 0 16
Enfant en charge 161 1.062 1.368 0 6
Nbre d’années d’etude 161 4.137 2.538 1 14
Nbre d’h de travail par semaine 158 0.203 0.573 0 3

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 17 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

• Comme représentation graphique, on peut synthétiser l’information


contenue dans une variable quantitative grâce à un diagramme en
bâtons (cas d’une variable quantitative discrète) ou à l’aide d’un
histogramme ou d’une boîte à moustache (cas d’une variable
quantitative continue).

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 18 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique univariée


Analyse d’une variable quantitative

• Comme représentation graphique, on peut synthétiser l’information


contenue dans une variable quantitative grâce à un diagramme en
bâtons (cas d’une variable quantitative discrète) ou à l’aide d’un
histogramme ou d’une boîte à moustache (cas d’une variable
quantitative continue).

• Diagramme en bâtons à gauche et boite à moustache à droite!

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 18 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique bivariée


Analyse de la relation entre deux variables quantitatives

• L’analyse univariée ne permet pas de faire ressortir (de dégager) les


relations qui existent entre les variables. L’analyse bivariée
s’intéresse aux relations entre les variables prises deux à deux.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 19 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique bivariée


Analyse de la relation entre deux variables quantitatives

• L’analyse univariée ne permet pas de faire ressortir (de dégager) les


relations qui existent entre les variables. L’analyse bivariée
s’intéresse aux relations entre les variables prises deux à deux.
• L’analyse graphique de l’évolution d’ensemble de deux variables X et
Y est une bonne manière de se faire une première idée de l’existence
ou non de liaison entre ces variables.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 19 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique bivariée


Analyse de la relation entre deux variables quantitatives

• L’analyse univariée ne permet pas de faire ressortir (de dégager) les


relations qui existent entre les variables. L’analyse bivariée
s’intéresse aux relations entre les variables prises deux à deux.
• L’analyse graphique de l’évolution d’ensemble de deux variables X et
Y est une bonne manière de se faire une première idée de l’existence
ou non de liaison entre ces variables.
• Le graphique représenté pour ce fait est appelé « nuage de points ».

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 19 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique bivariée


Analyse de la relation entre deux variables quantitatives

• L’analyse univariée ne permet pas de faire ressortir (de dégager) les


relations qui existent entre les variables. L’analyse bivariée
s’intéresse aux relations entre les variables prises deux à deux.
• L’analyse graphique de l’évolution d’ensemble de deux variables X et
Y est une bonne manière de se faire une première idée de l’existence
ou non de liaison entre ces variables.
• Le graphique représenté pour ce fait est appelé « nuage de points ».
• Ce graphique sert non seulement à déterminer s’il existe une relation
entre les 2 variables, mais aussi à caractériser la forme de la liaison
entre elles (positive ou négative, linéaire ou non linéaire, monotone
ou non monotone)

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 19 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

• Les nuages
de points ci-après illustrent
quelques types de liaisons
qui peuvent exister entre deux
variables quantitatives X et Y :
• Après l’analyse graphique,
pour valider l’existence de liaison
linéaire (corrélation linéaire) entre
deux variable X et Y on calcule
le coefficient de corrélation
de Pearson notée ρ(X , Y )

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 20 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique bivariée


Liaison entre deux variables qualitatives

• Pour analyser la relation entre deux variables qualitatives on a


recourt au test de Khi- deux que nous verrons plus loin.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 21 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique bivariée


Liaison entre deux variables qualitatives

• Pour analyser la relation entre deux variables qualitatives on a


recourt au test de Khi- deux que nous verrons plus loin.
• Nous pouvons aussi faire un tableau de contingence (tableau croisé)

Table: Exemple sur la mendicité des almoudos dans les quartiers de


Nouakchott
Elmina Ryad Sebkha Total
Almoudo non mendiant 15 9 2 26
Almoudo mendiant 40 59 35 134
Total 55 68 37 160

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 21 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Analyse statistique bivariée


Liaison entre deux variables qualitatives

Figure: Repartition des almoudos mendiants et non mendiants par quartier

A gauche Diagramme en barres juxtaposés et A droite diagramme en


secteurs par quartiers.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 22 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

C’est quoi l’AMD

• L’Analyse Multidimensionnelle des Données (AMD) est un type


d’analyse statistique qui permet d’évaluer les grands tableaux de
données sous différents points de vue en croisant plusieurs
dimensions entre elles ou encore en effectuant des projections sur
des espaces de dimension réduite. Cela permet de repérer des
tendances, les associations, les liaisons ou des anomalies dans les
données. C’est un processus d’analyse des données qui regroupe les
données en deux catégories : les dimensions et les mesures.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 23 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

C’est quoi l’AMD

• L’Analyse Multidimensionnelle des Données (AMD) est un type


d’analyse statistique qui permet d’évaluer les grands tableaux de
données sous différents points de vue en croisant plusieurs
dimensions entre elles ou encore en effectuant des projections sur
des espaces de dimension réduite. Cela permet de repérer des
tendances, les associations, les liaisons ou des anomalies dans les
données. C’est un processus d’analyse des données qui regroupe les
données en deux catégories : les dimensions et les mesures.
• Un grand tableau de données est une base de données à plusieurs
variables (généralement 3 au moins) et à plusieurs individus.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 23 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

C’est quoi l’AMD

• L’Analyse Multidimensionnelle des Données (AMD) est un type


d’analyse statistique qui permet d’évaluer les grands tableaux de
données sous différents points de vue en croisant plusieurs
dimensions entre elles ou encore en effectuant des projections sur
des espaces de dimension réduite. Cela permet de repérer des
tendances, les associations, les liaisons ou des anomalies dans les
données. C’est un processus d’analyse des données qui regroupe les
données en deux catégories : les dimensions et les mesures.
• Un grand tableau de données est une base de données à plusieurs
variables (généralement 3 au moins) et à plusieurs individus.
• L’AMD regroupe un ensemble de méthodes qui différent par la
problématique qu’elles essaient de résoudre et le type de variables
qui sont mises à contribution.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 23 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Nécessité de l’analyse multidimensionnelle (AMD)

• L’analyse univariée ou bivariée est certes une étape importante de


l’analyse des données, mais insuffisante lorsqu’il s’agit de grands tableaux
de données contenant un nombre important de variables.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 24 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Nécessité de l’analyse multidimensionnelle (AMD)

• L’analyse univariée ou bivariée est certes une étape importante de


l’analyse des données, mais insuffisante lorsqu’il s’agit de grands tableaux
de données contenant un nombre important de variables.
• Par exemple pour un tableau avec p=5 variables, on doit faire 10 analyses
bivariées pour faire ressortir l’ensemble des liens qui existent entre les
variables.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 24 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Nécessité de l’analyse multidimensionnelle (AMD)

• L’analyse univariée ou bivariée est certes une étape importante de


l’analyse des données, mais insuffisante lorsqu’il s’agit de grands tableaux
de données contenant un nombre important de variables.
• Par exemple pour un tableau avec p=5 variables, on doit faire 10 analyses
bivariées pour faire ressortir l’ensemble des liens qui existent entre les
variables.
• En outre faire plusieurs analyses bivariées sur un tableau de données est
une approche inappropriée car elle laisse de côté les liaisons
multidimensionnelles qui peuvent exister entre les variables.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 24 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Nécessité de l’analyse multidimensionnelle (AMD)

• L’analyse univariée ou bivariée est certes une étape importante de


l’analyse des données, mais insuffisante lorsqu’il s’agit de grands tableaux
de données contenant un nombre important de variables.
• Par exemple pour un tableau avec p=5 variables, on doit faire 10 analyses
bivariées pour faire ressortir l’ensemble des liens qui existent entre les
variables.
• En outre faire plusieurs analyses bivariées sur un tableau de données est
une approche inappropriée car elle laisse de côté les liaisons
multidimensionnelles qui peuvent exister entre les variables.
• Ces liaisons ne sont en effet visibles que grâce à la confrontation de
nombreuses informations issues des variables du tableau croisées entre
elles.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 24 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Nécessité de l’analyse multidimensionnelle (AMD)

• L’analyse univariée ou bivariée est certes une étape importante de


l’analyse des données, mais insuffisante lorsqu’il s’agit de grands tableaux
de données contenant un nombre important de variables.
• Par exemple pour un tableau avec p=5 variables, on doit faire 10 analyses
bivariées pour faire ressortir l’ensemble des liens qui existent entre les
variables.
• En outre faire plusieurs analyses bivariées sur un tableau de données est
une approche inappropriée car elle laisse de côté les liaisons
multidimensionnelles qui peuvent exister entre les variables.
• Ces liaisons ne sont en effet visibles que grâce à la confrontation de
nombreuses informations issues des variables du tableau croisées entre
elles.
• Aussi, pouvoir analyser rapidement, et simultanément, les relations entre
plusieurs variables, est infiniment plus riche que l’analyse séparée des
variables prises deux à deux.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 24 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Domaines d’application

• Tout domaine scientifique qui doit gérer de grandes quantités de


données de type varié a recourt aux méthodes d’analyse de données
multidimensionnelles.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 25 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Domaines d’application

• Tout domaine scientifique qui doit gérer de grandes quantités de


données de type varié a recourt aux méthodes d’analyse de données
multidimensionnelles.
• Le champ d’application des méthodes d’ADD est donc très vaste.
On les retrouve:

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 25 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Domaines d’application

• Tout domaine scientifique qui doit gérer de grandes quantités de


données de type varié a recourt aux méthodes d’analyse de données
multidimensionnelles.
• Le champ d’application des méthodes d’ADD est donc très vaste.
On les retrouve:
• En marketing elles permettent de proposer de nouvelles offres
ciblées à la clientèle ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 25 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Domaines d’application

• Tout domaine scientifique qui doit gérer de grandes quantités de


données de type varié a recourt aux méthodes d’analyse de données
multidimensionnelles.
• Le champ d’application des méthodes d’ADD est donc très vaste.
On les retrouve:
• En marketing elles permettent de proposer de nouvelles offres
ciblées à la clientèle ;
• En économie, à partir de ces méthodes appliquées sur les bilans
d’entreprises, on peut décrire la structure et la taille des entreprises
et opérer une classification des entreprises;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 25 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Domaines d’application

• Tout domaine scientifique qui doit gérer de grandes quantités de


données de type varié a recourt aux méthodes d’analyse de données
multidimensionnelles.
• Le champ d’application des méthodes d’ADD est donc très vaste.
On les retrouve:
• En marketing elles permettent de proposer de nouvelles offres
ciblées à la clientèle ;
• En économie, à partir de ces méthodes appliquées sur les bilans
d’entreprises, on peut décrire la structure et la taille des entreprises
et opérer une classification des entreprises;
• En finance, elles sont utilisées pour développer des méthodes de
détection de fraudes dans les banques;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 25 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Domaines d’application

• Tout domaine scientifique qui doit gérer de grandes quantités de


données de type varié a recourt aux méthodes d’analyse de données
multidimensionnelles.
• Le champ d’application des méthodes d’ADD est donc très vaste.
On les retrouve:
• En marketing elles permettent de proposer de nouvelles offres
ciblées à la clientèle ;
• En économie, à partir de ces méthodes appliquées sur les bilans
d’entreprises, on peut décrire la structure et la taille des entreprises
et opérer une classification des entreprises;
• En finance, elles sont utilisées pour développer des méthodes de
détection de fraudes dans les banques;
• Elles sont également utilisées pour le traitement du signal et des
images.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 25 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Les méthodes d’ADD ou de statistique exploratoire


multidimensionnelles ont pour but de synthétiser, de résumer et de
structurer l’information contenue dans les données.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 26 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Les méthodes d’ADD ou de statistique exploratoire


multidimensionnelles ont pour but de synthétiser, de résumer et de
structurer l’information contenue dans les données.
• Elles utilisent pour cela une représentation des données sous forme
de graphiques ou d’indicateurs numériques.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 26 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Les méthodes d’ADD ou de statistique exploratoire


multidimensionnelles ont pour but de synthétiser, de résumer et de
structurer l’information contenue dans les données.
• Elles utilisent pour cela une représentation des données sous forme
de graphiques ou d’indicateurs numériques.
• Ces représentations graphiques constituent le meilleur résumé
possible de l’information contenu dans de gros tableaux de données.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 26 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Les méthodes d’ADD ou de statistique exploratoire


multidimensionnelles ont pour but de synthétiser, de résumer et de
structurer l’information contenue dans les données.
• Elles utilisent pour cela une représentation des données sous forme
de graphiques ou d’indicateurs numériques.
• Ces représentations graphiques constituent le meilleur résumé
possible de l’information contenu dans de gros tableaux de données.
• Les méthodes d’ADD extraient les tendances les plus marquantes qui
structurent les données, les hiérarchisent et éliminent les effets
marginaux (bruits) qui perturbent la perception globale des faits.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 26 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Il existe plusieurs méthodes d’analyse de données


multidimensionnelles :

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 27 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Il existe plusieurs méthodes d’analyse de données


multidimensionnelles :
• L’Analyse en Composantes Principales (ACP) qui s’applique à
l’analyse des tableaux dans lesquels des variables quantitatives
continues sont mesurées sur des individus (ou observations). On
parle de tableau Individus x variables quantitatives continues ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 27 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Il existe plusieurs méthodes d’analyse de données


multidimensionnelles :
• L’Analyse en Composantes Principales (ACP) qui s’applique à
l’analyse des tableaux dans lesquels des variables quantitatives
continues sont mesurées sur des individus (ou observations). On
parle de tableau Individus x variables quantitatives continues ;
• L’Analyse Factorielle des Correspondances (AFC) ou analyse des
correspondances binaires, appropriée pour l’étude des tableaux de
contingence obtenus par croisement de variables qualitatives ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 27 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• Il existe plusieurs méthodes d’analyse de données


multidimensionnelles :
• L’Analyse en Composantes Principales (ACP) qui s’applique à
l’analyse des tableaux dans lesquels des variables quantitatives
continues sont mesurées sur des individus (ou observations). On
parle de tableau Individus x variables quantitatives continues ;
• L’Analyse Factorielle des Correspondances (AFC) ou analyse des
correspondances binaires, appropriée pour l’étude des tableaux de
contingence obtenus par croisement de variables qualitatives ;
• L’Analyse des Correspondance Multiple (ACM) qui est une extension
de l’analyse factorielle des correspondances qui ne permet que le
croisement de deux variables qualitatives. Elle est adaptée à la
description de grands tableaux de variables qualitatives, par exemple
pour le traitement d’enquêtes ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 27 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• L’Analyse Factorielle Discriminante (AFD) qui est une méthode à la


fois descriptive et prédictive. Elle décrit les individus en classes et
ensuite propose la classe d’affectation de tout nouvel individu en
s’appuyant sur ses caractéristiques propres. On la qualifie de
méthode d’apprentissage supervisée parce qu’elle nécessite une base
de données d’apprentissage (celle à partir de laquelle les classes ont
été constituées) avant de pouvoir réaliser des prédictions.

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 28 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les objectifs, données et les méthodes

• L’Analyse Factorielle Discriminante (AFD) qui est une méthode à la


fois descriptive et prédictive. Elle décrit les individus en classes et
ensuite propose la classe d’affectation de tout nouvel individu en
s’appuyant sur ses caractéristiques propres. On la qualifie de
méthode d’apprentissage supervisée parce qu’elle nécessite une base
de données d’apprentissage (celle à partir de laquelle les classes ont
été constituées) avant de pouvoir réaliser des prédictions.
• Les méthodes de classification automatique (la méthode des
K-means, DBScan, la classification hiérarchique ascendante ou
descendante) qui permettent de construire des classes d’individus
homogènes à partir d’un ensemble d’individus ;

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 28 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les logiciels

• Parmi les logiciels utilisés pour mettre en œuvre les méthodes


d’analyse de données multidimensionnelles, nous nous intéresserons
dans le cadre de ce cours aux logiciels SPSS, Stata, Python et R.

End

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 29 / 29
Introduction
Rappels Généraux Institut Sous-régional de Statistiques et d’Economie Appliquée
Les Méthodes d’AMD

Les méthodes d’analyse multidimensionnelles


Les logiciels

• Parmi les logiciels utilisés pour mettre en œuvre les méthodes


d’analyse de données multidimensionnelles, nous nous intéresserons
dans le cadre de ce cours aux logiciels SPSS, Stata, Python et R.
• C’est avec ces logiciels que les travaux pratiques seront réalisés.

End

Brice DONGMEZO, PhD 7th February 2024 Analyse des Données (ADD) 29 / 29

Vous aimerez peut-être aussi