Vous êtes sur la page 1sur 3

UVCI Année 2022-2023

Master BDA

Examen Analyse des données

Vous utiliserez le logiciel R

N.B : Documents à soumettre : fichier pdf, word, scanné). Respecter les délais de soumission il n’y aura aucune prolongation

Exercice 1 :

1. On considère la matrice de données X de type (2,3) suivante :

(
X = −1 0 1
0 −1 1 )
Calculer le produit matriciel, V= X ' X et s’assurer que c’est une matrice symétrique.

2. Calculer les valeurs propres valeurs propres de la matrice V

3. On considère un jeu de données { x 1 , … , x n }tel que pour touti∈ { 1 ,… , n }, on a :

{}
x 1i
x i= ⋮
p
xi
Ecrire la matrice X contenant toutes ces données et servant de base à l’ACP.

Exercice 2
Un échantillon donne la répartition de 10'000 étudiants en termes de leur type d'études et de la catégorie
socioprofessionnelle du père:

1) Faire un test de Khi2 et interpréter les résultats au risque 5%


Faire une AFC
2) Donner l’inertie totale représenter le plan principal
3) Interpréter les résultats ?

Exercice 3

1
Le tableau suivant est extrait d'une étude de l'INSEE (Avril 1993) sur le comportement des français et
décrit, pour l'année 1988 dans les pays de la CEE la consommation des ménages pour certaines fonctions
(une unité équivaut à 88 écus). On se propose de visualiser graphiquement les dissemblances et les
rapprochements existant entre ces pays du point de vue de ces trois indicateurs de consommation en
effectuant une ACP (normée).

Données 
Alimentation Logement Santé
Luxembourg LUX 21,1 20,2 7,7
RFA 16,4 18,4 15
France FCE 19,6 18,8 9,2
Royaume Uni RU 17,1 19,3 1,3
Italie ITA 22,7 14,3 6,1
Belgique BEL 19,6 17 11
Pays Bas NL 18,6 18,6 12,6
Danemark DAN 22,3 26,2 2
Espagne ESP 22,4 12,8 3,5
Grèce GRE 38,2 11,7 3,6
Irlande IRL 39 10,8 3,5
Portugal PORT 37,1 5 4,5
1) Calculer la moyenne et l’écart type des variables
Faire une ACP normée
2) Donner les valeurs propres et l’inertie total. combien d’axes peut-on retenir ?
3) Représenter les individus et les variables
4) Interprétez le premier axe et le second axe.
5) Quels sont les pays qui sont mal représentés dans le plan principal ? Que peut-on en déduire pour
ces pays ?
6) a) Quels groupes de pays pouvez-vous distinguer suivant le premier axe ? Que représente cette
opposition ?
b) Second axe : Comment pouvez-vous expliquer la position du Royaume Uni et du Danemark en
bas du tableau ?

Exercice 4

Le tableau suivant résume les résultats d'une enquête d'une maison vendant des produits audio-visuels.
L'enquête comprenait des questions sur l'âge, la profession, le style de musique préférée et la somme
investie par mois dans l'achat de leurs produits.

2
Age Profession Musique Budget
1 20-30 ans Employé Rock Moins de 100 euros
2 20-30 ans Employé Rock Moins de 100 euros
3 20-30 ans Employé Jazz Moins de 100 euros
4 20-30 ans Employé Classique Moins de 100 euros
5 30-50 ans Employé Rock Moins de 100 euros
6 30-50 ans Employé Rock Moins de 100 euros
7 30-50 ans Employé Jazz Moins de 100 euros
8 30-50 ans Employé Classique Plus de 100 euros
9 30-50 ans Cadre sup Rock Plus de 100 euros
10 30-50 ans Cadre sup Jazz Moins de 100 euros
11 30-50 ans Cadre sup Classique Plus de 100 euros
12 Plus de 50 ans Employé Jazz Moins de 100 euros
13 Plus de 50 ans Cadre sup Classique Plus de 100 euros
14 Plus de 50 ans Cadre sup Classique Plus de 100 euros

4. Représenter les données sous forme de tableau disjonctif Z et calculer ses marges
5. Donner le tableau de Burt.

Exercice 5 (QCM) : une mauvaise réponse enlève 0.5 pt

1) Représentation des variables en ACP


a) Une variable proche du centre du cercle est bien représentée
b) Le graphe du cercle de corrélations permet de visualiser la matrice des corrélations entre variables
c) Le graphe du cercle de corrélations permet d'interpréter le graphe des individus
2) A partir de la représentation du cercle des corrélations suivante :

Indiquer les corrélations entre les différentes paires de variables :


a) Entre V1 et V5 b) Entre V5 et V6
c)Entre V1 et V7 d)Entre V2 et V3
Bon courage

Vous aimerez peut-être aussi