Vous êtes sur la page 1sur 2

USMBA Année Universitaire 2015/16

Faculté des Sc.Juridiques, Economiques S3, Analyse des données


et Sociales Master : FCA
Département de Sciences Economiques
et de Gestion
- Fès- Prof : D.TOUIJAR

Epreuve d'Analyse des Données


(rattrapage durée : 3 H)

Problème :
Il s’agit ici d’une étude faite sur 7 variables pour 15 pays ouest africains (source : ONU, 2001). Elle
fournit, pour 15 pays d’Afrique de l’ouest, 5 variables démographiques (espvieH, Natalité , Mortalité , mort_infant,
Fecondité ), 1 variable sociale (PNB/h) et 1 variable sanitaire (VIH%).

Où les variables traitées sont comme suit :


espvieH : espérance de vie masculine à la naissance
Natalité : taux de natalité
Mortalité : taux de mortalité
mort_infant : taux de mortalité infantile
Fecondité : indice conjoncturel de fécondité
PNB/h : PNB/habitant
VIH% : proportion des 15-54 ans atteints pas le virus du SIDA

Les données recueillies lors de l’étude sont rassemblées dans un fichier Excel, nommée «pays.xlsx »
et se trouvant sur le bureau de votre poste.

Travail A Faire

I) Choix de la méthode et sa pertinence


1- En utilisant le logiciel R, importer les données à partir du fichier pays.xlsx, puis les mettre dans un objet
que vous appellerez : «data »
2- Qu’appelle-t-on le tableau des données présenté par « data » ?
3- Donner la matrice de corrélation entre les 7 variables.
4- En déduire 4 groupes homogènes en précisant le degré de la force de la corrélation (forte ; très forte) et
son signe(+ ; -) à l’intérieur de chaque groupe. Caractériser chaque groupe par l’une des quatre
caractéristiques suivantes :
 Faiblesse du système sanitaire.
 Normal.
 Structure d’âge jeune.
 Grande avancé ( ) vers une transition démographique.
5- Représenter, graphiquement, et par ordre décroissant les 15 pays selon leur distance au centre de
gravité du nuage réelle (c.-à-.d. dans leur espace d’origine).
6- Quel(s) type(s) de méthode(s) doit-on appliquer à « data » pour effectuer cette étude ? Justifier.
7- Effectuer une ACP normée sur « data ». Appelez le résultat : res.
8- Combien doit-on retenir de composantes ? Justifier.
9- Calculer l’inertie de chacun des axes retenus et l’inertie Totale  .

II) Description des axes et Interprétation


1- A l’aide d’une commande de R, donner les plus fortes corrélations (et les p-value correspondantes) entre
les composantes principales retenues et les variables de « data ».

2- Interprétez les 3 premiers axes factoriels : pour vous aider, je vous propose de répondre à ceci :
a) Citer les 6 pays qu’oppose F 1 selon 2 variables ; lesquelles ?
b) Citer les 2 pays qu’oppose F 2 selon 1 variable ; laquelle ?
c) Citer le(s) pays mal représenté(s) dans le plan F 1 , F2 mais très bien représenté(s) par F 3 .Justifier.
3- Pratiquer, par un code de R, une classification en 3 classes des pays sur le premier plan factoriel. Citer
les pays de chaque classe. Décrire chaque classe, en vous aidant d’un code de R.
4- « On présume un fort lien des régimes démographiques avec le revenu moyen dans ces pays : sur quelles
variables joue t-il le plus ? le moins ?». Qu’en pensez-vous (en bref).
--------------------------------------------------------------------------------------------------------------