Vous êtes sur la page 1sur 4

Analyse des Données

Travaux Pratiques 1

Introduction
La maison-page du logiciel se trouve à l’adresse www.r-project.org. Toutes les réponses
aux questions relatives à la bonne exécution de ce TP (commandes, manipulation d’objets,
...) peuvent être trouvées en utilisant l’aide en ligne de R. Une bonne base pour débuter est
de commencer par taper help.start() et de suivre le lien An Introduction to R.
Ce TP a pour but de vous familiariser avec les commandes de R dévolues aux analyses
en composantes principales.
On utilisera le fichier “PATRIMOI.TXT” reprenant le tableau ci-dessous (tableau 1) :

Table 1: Patrimoine selon la catégorie socioprofessionnelle

Livrets Épargne Placements Actions Pierre Terres


logement obligatoires
bons,. . . (assurances)
(LIV) (ELB) (POA) (ACT) (PIE) (TER)
Anciens indépendants
non agricoles (AI) 8,00 6,00 10,00 23,00 44,00 9,00
Professions libérales
(PL) 6,00 8,00 17,00 25,00 35,00 9,00
Industriels, artisans
commerçants (IAC) 5,00 6,00 13,00 36,00 34,00 6,00
Cadres supérieurs (CS) 9,00 9,00 14,00 40,00 23,00 5,00
Agriculteurs (AG) 11,00 13,00 16,00 7,00 19,00 34,00
Anciens agriculteurs
(AA) 14,00 13,00 13,00 6,00 27,00 27,00
Anciens salariés (AS) 16,00 14,00 13,00 25,00 26,00 6,00
Professions
intermédiaires (PI) 17,00 15,00 17,00 20,00 26,00 5,00
Employés (EM) 22,00 14,00 18,00 11,00 27,00 8,00
Ouvriers (OU) 24,00 18,00 25,00 8,00 20,00 5,00

1
1 A.C.P. avec les mains
Dans cette partie, nous allons manipuler les différentes notions relatives à l’A.C.P., et ce, de
façon matricielle.

1.1 Fichier de données


Charger le fichier “PATRIMOI.TXT” dans la variable ’patrimoine’.

Remarque : Pour ne pas avoir à recommencer plus tard, lisez bien la documentation de
“read.table()”, car un petit piège vous attend (le séparateur est une virgule, pas un point. . . ).

1.2 Moyennes et variances


En vue d’effectuer une A.C.P. sur nos données, il faut les centrer et les réduire.
Commencer par déterminer le centre de gravité du nuage et les variances des différents
attributs.

1.3 Centrer et réduire les données


Centrer et réduire vos données. Appeler ’X’ le résultat. Vérifier que ’X’ est bien centrée et
réduite.

Remarque : On pourra utiliser la fonction “scale”.

1.4 Calcul de la matrice de variance-covariance


Calculer la matrice de variance-covariance. N’utiliser pas la commande “var()” mais faites
le à la main (i.e. utiliser des matrices).
Vérifier que le résultat est (presque...) identique à celui de la commande “var()”. Con-
clusion ?

1.5 Inversion, valeurs et vecteurs propres


La nouvelle base est constituée des vecteurs propres de la matrice de variance-covariance
(que l’on appelle V).
Calculer les vecteurs propres et les valeurs propres de V. Comparer les résultats obtenus
en utilisant la matrice V calculée à la main et celle calculer avec “var()”.
Conclusion ?

2
1.6 Nombre d’axes nécessaires
Le nombre d’axes nécessaires pour l’analyse dépend de l’inertie véhiculée par iceux. Tracer
un graphique représentant les différents pourcentages d’inerties (en abcisse les axes et en
ordonnée le pourcentage d’inertie).

1.7 Calcul des composantes principales


Appeler C les différentes composantes principales et les calculer (ou l’inverse).

1.8 Tracé
Tracer les deux premières composantes principales. N’oubliez pas de nommer les différents
points.

1.9 vérifications
Vérifier que les composantes principales sont orthogonales entre elles, et que leur norme vaut
la racine carrée de l’inertie associée.

Remarque : Quelle est la distance entre 2 attributs ? Et pourquoi utilise-t-on cette


distance ?

2 A.C.P.
Ici, nous utilisons directement les différentes commandes que met R à notre disposition.

2.1 Et c’est parti


La commande effecuant l’A.C.P. s’appelle ’princomp()’. Lire l’aide.
Effecuer l’A.C.P de notre tableau, en n’oubliant pas que c’est la matrice de corrélation
que l’on diagonalise. Placer le résultat dans la variable ’acp’.

2.2 Analyse du résultat


Quels sont les attributs de la variable ’acp’ ? À quoi correspondent-ils ?
Retrouver vos petits par rapport à la partie précédente.

2.3 Petites fonctions utiles


Lire le fichier “fonctions acp.R”. À quoi correspondent les différentes fonctions ? Comprendre
leur fonctionnement.

3
2.4 Interprétation
En utilisant les différentes fonctions du fichier “fonctions acp.R” proposer une interprétation
(argumentée) des différents résultats de l’A.C.P.

Vous aimerez peut-être aussi