Vous êtes sur la page 1sur 17

Analyse des données

Pr : RAZZOUK REDOUANE

Gestion d’entreprise et Informatique


Semestre 4
Année universitaire 2011-2012
Plan
Introduction et champs d’application
Concepts de base
Objectifs de L’analyse de données
Méthodes utilisées
Conclusion
Introduction

• L’analyse des données s’inscrit dans le


cadre de la statistique exploratoire
multidimensionnelle.
Champs d’application
• Les méthodes statistiques ont été poussées
par le développement de l’informatique

• Les méthodes statistiques sont employées


dans un grand nombre des domaines
Problématiques posées
• Existence d’un grand nombre des variables
• La perception d’un phénomène appréhendée
par la combinaison d’un nombre de variables
• Comment pour tenir compte de l’ensemble
de l’information?
Concepts de base
• Individu est l’unité organisationnel de la
population
• Population groupe ou ensemble d’individus
que l’on analyse.
• Recensement étude de tous les individus
d’une population donnée.
• Sondage étude d’une partie seulement d’une
population appelée ´échantillon.
Variables
• Variables ensemble de caractéristiques d’une
population.
• – quantitatives : nombres sur lesquels les opérations
usuelles (somme, moyenne,...), elles peuvent être
discrètes (ex : nombre d’éléments dans un ensemble)
ou continues (ex : prix, taille) ;
• – qualitatives : appartenance `a une catégorie donnée
; elles peuvent être nominales (ex : sexe, bonheur) ou
ordinales quand les catégories sont ordonnées (ex :
très résistant, assez résistant, peu résistant).
Type de tests
 2 familles de tests : paramétriques ~ non paramétriques
Les tests paramétriques sont plus « puissants », mais nécessiten
diverses conditions d’application.

 Un test statistique oppose toujours 2 hypothèses :


H0 (hypothèse nulle) contre H1 (hypothèse alternative)

p-value : probabilité qu’a l’échantillon de suivre H0.


H1 validée si p-value < 0,05
(Par convention le seuil est généralement fixé à 5 %)
Objectifs de L’analyse des données

Objectifs :

 synthétiser, structurer l’information contenue dans des


données multidimensionnelles (n individus, p variables).

 Trouver des méthodes pour synthétiser les variables sans


les déformer.
Exemple des données explorées
Asie PECO MENA Amérique latine Afrique OCDE
China CHN Bulgaria BUL Algeria ALG Argentina ARG Cameroon CAM France FRA
Hong Kong HKO Czech Rep CZE Egypt EGY Brazil BRA Cote d'Ivoire COT Germany GER
India IND Hungary HUN Iran IRA Chile CHL Ghana GHA Japan JAP
Indonesia INO Lithuania LIT Israel ISR Colombia COL Nigeria NIG Norway NOR

Korea South KOR Poland POL Morocco MOR Mexico MEX South Africa SOA United State USA

Malaysia MAL Romania ROM Saudi Arabia SAR Peru PER Uganda UGA

Pakistan PAK Russia RUS Syria SYR Venezuela VEN Zimbabwe ZIM
Philippines PHI Turkey TUR Tunisia TUN Ireland IRE
Singapore SIN Ukraine UKR Greece GRE
Taïwan TAI Portugal POR
Thaïland THA

Vietnam VIE
Variables de Gouvernance
R0046 Transparence et ouverture du programme de privatisation
R0047 Distorsions introduites par l'Etat
IB4031 Subventions aux produits de base (B4031 inversée)
R0048 Liberté de fonctionnement des marchés des capitaux
D401 Rigidité du marché du travail formel (privé et public)
R0049 Respect du droit de travail et justice prud'homale
D700 Niveau des négociations salariales des non-cadres
R0037 Mobilité sociale
R0050 Pressions des marchés internationaux / marché des B&S
R0051 Pressions des marchés internationaux / marché des capitaux
A601 Sécurité des droits de propriété : droits de propriété formels
A603 Sécurité des contrats entre acteurs privés
A605 Règlement des différends économiques : justice en matière commerciale
R0038 Application du droit sur la faillite des entreprises
R0039 Information sur le marché des B&S
R0040 Protection de la propriété intellectuelle
R0041 informations sur le marché des capitaux
B702 Concurrence des entreprises : dispositifs de régulation de la concurrence
R0042 Dynamisme de la concurrence
C700 Concurrence au sein du système bancaire
R0043 Règles prudentielles et supervision du système bancaire
A307 Fonctionnement de la justice
Graphique ; Relations gouvernance publique-gouvernance privée 2009

Labaronne.D et Dharhri. N (2011), « Profiles et évolutions (2001-2009) des systèmes de gouvernance dans les pays arabes
Méthodes utilisées
• Méthodes de classification : réduire la taille
de l’ensemble des individus en formant des
groupes homogènes ;

• Méthodes factorielles : réduire le nombre de


variables en les résumant par un petit
nombre de composantes synthétiques.
Méthodes factorielles
• Analyse en composante principales (ACP),
variables quantitatives
• Analyse factorielle des correspondances
(AFC), analyse croisé de deux variables
qualitatives
• Analyse de correspondances multiples
(ACM)
Méthodes classification
• Classification ascendante hiérarchique

• Classification autour des centres mobile


Références de base
• Fenneteau H. et Biales C.(1993)« Analyse
statistique des données » Edition ellpses
• Giard V. (1992), Statistique appliquée à la
gestion, Editions Economica.
Kerr A. W., Hall H. K., Kozub S. A., (2002),
Doing Statistics with SPSS, Sage
Publications.
Lebart L., Morineau A., Piron M. (1997),
Statistique exploratoire multidimensionnelle,
Editions Dunod.
Merci pour votre aimable
attention

Vous aimerez peut-être aussi