Vous êtes sur la page 1sur 3

1

UTA
Niveau : L2 IGL
Enseignant : Dr KOUAKOU

Année Académique
2022 / 2023

TRAVAUX DIRIGES D’ANALYSE DES DONNEES

Exercice 1. Soit la matrice des données suivantes


 

4 5
X = 6 7 
 
 
8 0
1. Soient C1 et C2 les vecteurs colonnes de X. Centrer et normer les variables C1 et C2 .
2. Déterminer la matrice V des variances-covariances et la matrice Γ des corrélations.
3. Diagonaliser la matrice V. On note λi ses valeurs propres.
4. Déterminer les vecteurs propres Fi associés aux valeurs propres λi .

Exercice 2. Soit le tableau de données


 
√2 √2 √3
 10 10 10 
 √3 √1 √2 

 10 10 10 

 √1 √3 
X=  0

 10 10 
 2
√ √1 √4 

 10 10 10 
√2 √1 √3
10 10 10

correspondant à des mesures effectuées sur 5 individus de poids statistiques égaux pour les trois
variables T 1 , T 2 et T 3 . On va effectuer une ACP centrée-réduite sur ce tableau.

1. Calculer l’individu moyen, le vecteur (σ1 , σ2 , σ3 ) des écarts types des variables et la matrice X
des données centrées-réduites.
2. Calculer la matrice des corrélations R.
3. Effectuer la décomposition aux valeurs propres de R.
4. Les deux premiers vecteurs de R sont

1 √  1
ε1 = 2, 1, −1 , ε2 = √ (0, 1, 1)
2 2

ils sont associés aux valeurs propres



2
λ1 = 1 + , λ2 = 1
2

calculer les composantes principales C1 et C2 dont on vérifiera les propriétés statistiques


2

Exercice 3. Soit la matrice X = [X 1 , X 2 , X 3 ] dont les variables ont pour matrice de corrélation
 

1 ρ −ρ
R= ρ 1 ρ 
 
 
−ρ ρ 1
avec −1 ⩽ ρ ⩽ 1. On va effectuer l’ACP centrée-réduite de X

1. Vérifier que R admet pour vecteur propre ξ1 = √1 (1, −1, 1)
3

2. Déterminer les autres vecteurs propres et valeurs propres de R


3. Quelles sont les valeurs possibles de ρ ? Justifier le fait que l’ACP a plus d’intérêt si −1 < ρ < 0.
On se placera ensuite dans ce cas
3. Calculer les pourcentages de variance expliquée
4. Comment s’interprète en fonction de X 1 , X 2 et X 3 l’unique composante à retenir ici ?

Exercice 4. On considère le tableau de contingence obtenu ventilant 592 femmes suivant la couleur
de leurs yeux et la couleur de leurs cheveux. Les modalités de l’attribut couleur des yeux (X1 ) sont :
marron, noisette, vert et bleu. Celles de l’attribut couleur des cheveux (X2 ) sont : brun, chatain, roux et
blond
HH
H H X2
brun chatain roux blond
X1 H
HH
H
marron 68 119 26 7
noisette 15 54 14 10
vert 5 29 14 16
bleu 20 84 17 94

Tous les résultats seront donnés sous forme de fraction irréductible.


1. Donner le tableau des profils-lignes.
2. Donner le tableau des profils-colonnes.
3. Calculer les distances entre les profils-lignes
4. Les variables X1 , X2 sont elles indépendantes ?

Exercice 5. Voici un exemple tiré de l’élection présidentielle de 1981 ; X désigne la variable “les dépar-
tements”, Y la variable “les candidats”, kij est le nombre de voix (en milliers) obtenues par le candidat
j dans le département i.
Le tableau de contingence des effectifs est :
HH
Y
HH
Mitterrand Giscard Chirac Total
X H
HH
H
Ain 51 64 36 151
Hautes-Alpes 14 17 9 40
Ariège 27 18 13 58
Bouche du Rhône 191 204 119 514
Charente-Maritime 71 76 47 194
Total 354 379 224 957
1. Donner le tableau de contingence des fréquences.
3

2. Construire le tableau des profils-lignes et profils-colonnes.


3. Quel est le point moyen du nuage des profils-ligne N(I) et du nuage des profils colonnes N(J) ?
4. Calculer la distance du χ2 entre les profils-ligne de l’Ariège et de la Charente-Maritime
5. Déterminer la matrice de travail W et la matrice à diagonaliser S.
6. Quelle est la valeur propre triviale de S et le vecteur propre associé.
7. Soit λ1 = 0.0035269, la première valeur propre non-triviale de S et

ũ1 = (0.750930, −0.653700, −0.093711),

le vecteur propre associé. Soit

ũ2 = (−0.25728, −0.42030, 0.87015),

le vecteur propre associé à la troisième valeur λ2 . En déduire λ2


8. Calculer les axes factoriels u1 et u2 ; puis les coordonnées des départements sur les axes princi-
paux a1 et a2 ,

Bon courage

Vous aimerez peut-être aussi