Vous êtes sur la page 1sur 4

Institut des Sciences Année 2022-2023

Appliquées Et Examen final


Economiques – ISAE Durée : 2hr
Coordonné par Nisrine Tannir
Pour le centre de Beyrouth
Analyse des données : méthodes descriptives –STA101
Documents autorisés
Calculatrice non programmable autorisée

Exercice 1 (10 points)


On considère le tableau X de données suivant :
X1 X2 X3
3 3 3
4 4 1
1 1 7
2 2 5
1 5 3
0 4 5
3 3 3
2 2 5

Où la i ème colonne désigne la variable xi et où la j ème ligne désigne l’individu x


j. On effectue l’ACP de X sur matrice variance (i. e. avec la métrique identité de R3),
1
chaque individu étant muni du poids
8

1) Calculer le vecteur moyen des variables x1 , x2 , x3


2) Calculer le tableau Y centré associé à X.
3) Déterminer la matrice des variances- covariances du tableau Y.
4) Déterminer la matrice des corrélations du tableau Y. On veut faire une ACP
centrée avec des poids uniformes.
5) Déterminer la Somme diagonale et Que représente cette somme ?
9
6) On donne λ1 = et λ3 = 0. Déterminer la 2ème Valeur propre λ2 . Et déduire
2
qu’il existe deux axes factoriels pour cette ACP.
7) Donner les pourcentages d’inertie expliqués par chacun des axes factoriels.
8) Soient les vecteurs propres

−0.408
1
𝑢 = (−0.408) et
0.816
−0.707
2
𝑢 = ( 0.707 )
0
Calculer les composantes principales C1 et compléter celles du deuxième
composante C2 (garder 3 décimales).
Individus Composante Composante
Principale Principale
C1 C2
1
2
3
4
5
6 2.121
7 -0.707
8 -0.707

9) Représenter les individus dans le plan principal (1, 2). Interpréter.


10) Calculer la corrélation entre les variables initiales et les composantes
principales en utilisant la formule de corrélation suivante :
𝐷𝑦 ′ 𝑐 𝑘
r(c, 𝑥 𝑗 ) =r(c, 𝑦 𝑗 ) =
𝑠𝑥𝑖 √𝜆𝑘
11) Représenter les variables sur le cercle des corrélations dans le plan factoriel
1 et 2.
Exercice 2 (10 points)
On observe deux variables sur n = 4 individus, X1 codée 0 ou 1 selon le sexe de
l’individu, et X2 codée 1, 2 ou 3 selon la classe d’âge de l’individu :
1 3
𝑇 = (2 2)
1 1
1 1
(Garder 3 décimales).
1) Déterminer le tableau de la fréquence de chaque modalité k
2) Déterminer le tableau disjonctif complet et le tableau disjonctif des patrons de
réponses
3) Déterminer le tableau de burt
4) Calculer le poids de chaque modalité
2
5) Calculer les distances pour tous ls patrons au profil moyen 𝑑𝛷 2 (𝑂, 𝑃𝑎𝑡𝑟𝑜𝑛 𝑖).
2
6) Calculer les distances pour toutes les modalités au profil moyen 𝑑𝛷 2 (0 , 𝑀𝑘)

7) Calculer les distances entre chaque deux modalités de réponse (Patron)


2
𝑑𝛷 2 (𝑀𝑘 , 𝑀𝑘′ )

8) Calculer l’inertie totale du nuage des individus 𝝓𝟐


9) Calculer l’inertie de chaque variable I(Xp) et l'inertie relative de chaque
variable Inr(Xp)
10) Calculer les contributions absolues de chaque modalité (l’inertie d’une
modalité) 𝐶𝑡𝑎(𝑀𝑘 ) à l'inertie du nuage de points et les contributions relatives
des modalités 𝐶𝑡𝑟(𝑀𝑘 )
Exercice 3 (Bonus : 2points)
En utilisant une agrégation selon la distance maximum. Nous obtenons les matrices
des distances entres les individus comme suit :
a b c d e a b cd e
a 0 23 35 43 50 a 0 23 35 50
b 23 0 21 32 45 b 23 0 21 45
c 35 21 0 11 25 cd 35 21 0 25
d 43 32 11 0 17 e 50 45 25 0
e 50 45 25 17 0
1) Déterminer la construction des matrices des distances et on regroupe les 2
éléments les plus proches.
2) Faire la Classification ascendante hiérarchique (dendrogramme)
correspondant aux résultats obtenus.
3) Déterminer la partition optimale et Décrire en extension chacune des classes.

Bonne chance

Vous aimerez peut-être aussi