Vous êtes sur la page 1sur 6

I.U.

T de Caen STID 2ème année


Département STID Année Universitaire 2005-2006
Responsable de cours : Alain LUCAS

11. Combien d’axe(s) factoriel(s) devrait-on conserver si l’on applique strictement le critère de la moyenne ? Combien
d’axe(s) factoriel(s) devrait-on conserver si l’on désire garder 80% de l’information apportée par l’échantillon ?
Analyse des Données 12. Localiser sur l’annexe les deux premières composantes principales Ψ1 et Ψ2 . Que représentent-elles ?
13. Rappeler la formule permettant de calculer la contribution d’un “individu” à la formation d’un axe α. Pourquoi
peut-on dire, sans regarder la table des contributions, que les oiseaux 25,29,30,36,37, et 40 contribuent fortement
Examen terminal - Durée 2h
(sous réserve d’une bonne qualité de représentation) à la formation du premier axe ?
14. Calculer la contribution à la formation du premier axe pour les oiseaux 25,29,30,36,37, et 40. Résumer l’infor-
– Seule la calculatrice type collège est autorisée. mation sous la forme d’un tableau.
– Seul le cours est autorisé.
– On rappelera les formules utilisées. 15. Identifier pour chacun des axes les oiseaux qui contribuent significativement à leur formation (selon un critère de
– On conservera quatre chiffres après la virgule. la moyenne). Classer ces derniers dans un tableau selon le signe de leur coordonnée (on indiquera entre parenthèse
– On pourra répondre directement sur le document. la contribution en %).
16. Commenter les résultats du tableau des contributions pour chacun des axes. Que pensez-vous du moineau 31 ?
Partie A Quelle solution pourrait-on proposer ?
Analyse en Composantes Principales 17. Est-il possible de visualiser sur un plan la qualité de représentation d’un moineau ? Justifier votre réponse.
18. Rappeler la formule permettant de calculer la qualité de représentation d’un moineau i sur un axe α. En déduire
la qualité de représentation de l’oiseau 12 sur les deux premiers axes factoriels. Quelle est alors sa qualité de
Suite à une très violente tempête, un biologiste - Bumpus - recueillit en 1898, au sein de son laboratoire, plusieurs représentation dans le plan principal ?
dizaines de moineaux blessés, dont 49 de sexe féminin. Parmi ces derniers, 28 moururent tandis que 21 survécurent. 19. Identifier les oiseaux présentant une qualité de représentation moyenne, médiocre ou très médiocre dans le plan
Le biologiste saisit alors l’opportunité qui se présenta à lui pour mener une étude dont l’objectif consistait à vérifier principal (qualité inférieure à 60%), puis les repérer sur le graphique en les surlignant.
la théorie de Charles Darwin sur la sélection naturelle.
20. Peut-on sur la représentation graphique des moineaux dans le plan factoriel principal mettre en évidence l’exis-
Dans le cas présent, on se propose de mener une étude descriptive sur ces 49 moineaux sur lesquels on a observé tence de groupes de moineaux ou de moineaux atypiques ? Vérifier vos commentaires sur les données initiales.
cinq variables quantitatives plus une variable binaire :
21. A quoi mesure-t-on rapidement la qualité de représentation des variables dans un plan factoriel ? Déterminer
– X1 : longueur totale en mm (de l’extrémité du bec à l’extrémité de la queue) ; alors les variables présentant une bonne qualité de représentation sur le plan factoriel principal.
– X2 : longueur en mm entre les deux extrémités des ailes lorsque ces dernières sont déployées ; 22. Rappeler la formule permettant de calculer la qualité de représentation d’une variable sur un axe factoriel, puis
– X3 : longueur en mm entre l’extrémité du bec et de l’occiput1 ; celle permettant de calculer la qualité de représentation sur un plan factoriel. Corroborer les résultats de la
– X4 : longueur de l’humérus en mm ; question précédente en calculant les qualités de représentation dans le plan factoriel principal.
– X5 : longueur du bréchet2 en mm ;
23. A quoi mesure-t-on rapidement la corrélation entre une variable et un facteur ? Quelle condition doit-être satisfaite
– X6 : code selon que le moineau est mort (0) ou vivant (1).
pour que cette mesure soit fiable ?
Dans ce but, le fichier sparrows, contenant l’ensemble des 49 moineaux sur lesquels on a observé les six variables 24. Identifier les variables qui sont corrélées avec chacun des facteurs du plan principal. Synthétiser cette information
dont cinq actives (cf. annexe 1), a été traité via le logiciel SPAD selon une Analyse en Composantes Principales dans un tableau en distinguant les corrélations positives des corrélations négatives, et en prenant comme seuil
Normées, dont les sorties numériques et graphiques sont fournies en annexe. On se propose, à l’aide des questions de corrélation 60%.
suivantes, d’étudier les résultats de cette analyse.
25. Proposer, en s’aidant de la question précédente, une interprétation contextuelle pour chacun des facteurs. En
1. Indiquer l’espace dans lequel seront représentées les variables. Justifier votre réponse. déduire une explication quant à la position du moineau 31.
2. Indiquer l’espace dans lequel seront représentés les individus. Justifier votre réponse. 26. A partir de l’interprétation des facteurs, caractériser les éventuels groupes de moineaux.
3. Quelle est la longueur moyenne entre l’extrémité du bec et de l’occiput pour ces moineaux ? Quelle est la 27. Que peut-on dire, selon la variable binaire “mort”-“vivant”, des moineaux qui présentent des données morpho-
dispersion pour cette même variable ? Commenter succinctement ce dernier résultat. logiques extrêmes ?
4. Indiquer les coordonnées du barycentre du nuage des moineaux.
5. Ecrire explicitement la matrice des écarts-types associés à ces données.
6. Quelles sont les deux étapes à effectuer pour réaliser une Analyse en Composantes Principales Normées (ACPN).
7. Dans le cadre de l’ACPN, quelle matrice doit-on diagonaliser afin d’obtenir les valeurs propres et les vecteurs
propres ? Ecrire explicitement cette matrice, puis commenter succinctement les valeurs. Quelle démarche faudrait-
il mener afin de produire des commentaires pertinents ?
8. Dans le cadre de l’ACPN, quelle relation intéressante existe-t-il entre les valeurs propres et le nombre de variables ?
9. Combien doit-on trouver de valeurs propres dans le cas présent ? Justifier votre réponse.
10. Identifier, et éventuellement compléter, les valeurs propres. En déduire les pourcentages d’inertie et les pourcen-
tages d’inertie cumulée, puis synthétiser ces informations dans un tableau.
1 occiput : partie inférieure et postérieure de la tête
2 bréchet : crête médiane du sternum de la plupart des oiseaux, sur laquelle s’insèrent les muscles des ailes

1 2
Partie B Après avoir rappelé l’expression qui lie les valeurs propres à l’inertie totale, et les expressions permettant de
Analyse Factorielle des Correspondances calculer respectivement le pourcentage d’inertie et le pourcentage d’inertie cumulée, compléter le tableau.
8. Calculer l’inertie moyenne. Selon le critère du même nom, combien d’axes devra-t-on conserver dans la suite de
l’analyse ? Justifier votre réponse.
Le tableau de contingence ci-dessous est issu d’une étude dans laquelle on a demandé à des individus de qualifier
les habitants d’un pays européen. On se propose d’en réaliser une Analyse Factorielle des Correspondances (AFC) afin 9. L’analyse de ce tableau de contingence a permis d’obtenir les résultats suivants pour les profils-colonnes :
d’étudier les interactions entre les différentes modalités.
Profils-colonnes Coordonnées Contributions Qualités de représentation
Pays c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 c13 Total 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
France 37 29 21 19 10 10 8 8 6 6 5 2 1 162 Elégant -0.86 0.31 0.15 0.23 -0.09 · 5.5 4.7 12.4 6.0 0.81 0.10 0.02 0.06 0.01
Arrogant 0.01 0.51 -0.28 -0.23 0.02 0.0 21.5 24.0 17.5 0.2 0.00 0.66 0.20 0.14 0.00
Espagne 7 14 8 9 27 7 3 7 3 23 12 1 3 124 Sexy -0.95 0.18 0.17 0.07 -0.01 19.7 1.2 3.8 0.7 0.0 0.93 0.03 0.03 0.01 0.00
Italie 30 12 19 10 20 7 12 6 5 13 10 1 2 147 Retors -0.27 -0.02 -0.34 0.04 0.12 2.1 0.0 20.4 0.3 8.6 0.32 0.00 0.53 0.01 0.07
Angleterre 9 14 4 6 27 12 2 13 26 16 29 6 25 189 Insouciant -0.04 -0.53 0.12 -0.05 0.07 0.1 · 4.7 0.8 5.1 0.01 0.92 0.05 0.01 0.02
Irelande 1 7 1 16 30 3 10 9 5 11 22 2 27 144 Cupide -0.14 0.11 0.00 -0.17 -0.25 0.4 0.4 0.0 3.4 23.1 0.16 0.09 0.00 0.23 0.52
Lâche -0.59 -0.26 -0.28 0.30 0.21 5.0 1.6 6.7 8.1 12.6 0.50 0.10 0.11 0.13 0.07
Hollande 5 4 2 2 15 2 0 13 24 1 28 4 6 106 Ennuyeux 0.23 -0.02 0.19 0.09 0.06 1.3 0.0 5.6 1.5 1.5 0.44 0.00 0.31 0.08 0.03
Allemagne 4 48 1 12 3 9 2 11 41 1 38 8 8 186 Efficace 0.65 0.42 0.17 0.04 -0.03 18.2 12.3 7.7 0.5 0.9 0.67 0.28 0.05 0.00 0.00
Total 93 128 56 74 132 50 37 67 110 71 144 24 72 1058 Fainéant -0.30 -0.56 0.12 -0.47 -0.05 2.5 14.2 2.3 39.7 1.5 0.14 0.49 0.02 0.35 0.00
Travailleur 0.50 0.03 0.10 0.05 0.11 14.0 0.1 3.3 0.9 12.0 0.91 0.00 0.04 0.01 0.04
Intelligent 0.53 0.30 0.04 0.02 -0.11 2.6 1.3 0.1 0.0 2.0 0.74 0.23 0.00 0.00 0.03
où l’on a le codage suivant : c1=Elégant, c2=Arrogant, c3=Sexy, c4=Retors, c5=Insouciant, c6=Cupide, Courageux 0.50 -0.63 -0.32 0.28 -0.22 7.0 18.1 16.7 14.2 26.5 0.28 0.45 0.11 0.09 0.06
c7=Lâche, c8=Ennuyeux, c9=Efficace, c10=Fainéant, c11=Travailleur, c12=Intelligent, c13=Courageux.

1. Que représentent les profils-lignes (resp. les profils-colonnes) dans une Analyse Factorielle des Correspondances ? (a) Rappeler la formule permettant de calculer la contribution d’un profil-colonne à la formation d’un axe
factoriel α.
2. Dans quel espace sera représenté le nuage des profils-lignes (resp. des profils-colonnes) ?
(b) En déduire les données manquantes du tableau dans la sous-table contributions.
3. Que représente le barycentre des profils-lignes (resp. des profils-colonnes) dans le cadre du tableau de contin-
gence ? Compléter les matrices colonnes suivantes : (c) Pour chacun des axes prépondérants, classer dans un tableau selon le signe de leur coordonnée les profils-
  colonnes qui contribuent significativement (par rapport à la contribution moyenne) à la formation de l’axe.
0.0879 (d) Rappeler la formule permettant de calculer la qualité de représentation d’un profil sur un plan factoriel

 · 
 principal.
 0.0529 

 0.0699 
 
0.1531
 (e) En déduire les profils-colonnes qui sont bien représentés (qualité supérieure à 60%) dans le plan principal.

 0.1248 

 0.1172  Préciser entre parenthèse la qualité de représentation. Repérer sur le graphique de l’annexe 6 ces profils.
   
 0.0473  · 10. De même, on obtient pour les profils-lignes les coefficients suivants :
 
   
Gℓ =  0.0350 
  et Gc =  0.1786 


 0.0633   0.1361 
   
 ·   ·  Profils-lignes Coordonnées Contributions Qualités de représentation

 0.0671 
 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
0.1758

 0.1361 
 France -0.69 0.36 -0.10 0.09 -0.05 30.4 13.4 3.7 3.5 2.6 0.75 0.20 0.02 0.01 0.00
  Espagne -0.25 -0.35 0.11 -0.45 0.07 3.0 9.7 3.3 64.0 4.8 0.15 0.30 0.03 0.51 0.01
 0.0227  Italie -0.67 -0.01 0.13 0.10 0.04 25.4 0.0 5.9 4.0 2.1 0.90 0.00 0.03 0.02 0.00
0.0681 Angleterre 0.30 -0.20 0.07 0.00 -0.22 6.8 4.7 2.4 0.0 67.6 0.50 0.21 0.03 0.00 0.26
Irelande 0.20 -0.62 -0.30 0.17 0.09 2.2 35.4 29.7 10.7 8.1 0.07 0.70 0.16 0.05 0.01
Hollande 0.57 0.09 0.42 0.21 0.13 13.5 0.6 42.6 11.7 12.5 0.57 0.01 0.30 0.08 0.03
4. Déterminer pour chacun des nuages de profils comment sera constituée la matrice des pondérations. Note : Allemagne 0.51 0.55 -0.17 -0.11 0.04 18.8 36.3 12.4 6.1 2.3 0.42 0.50 0.05 0.02 0.00
inutile d’écrire explicitement ces matrices.
5. Déterminer la métrique associée à l’espace dans lequel sera représenté le nuage des profils-lignes (resp. des (a) Pour chacun des axes prépondérants, classer dans un tableau selon le signe de leur coordonnée les profils-
profils-colonnes). Note : inutile d’écrire explicitement ces matrices. lignes qui contribuent significativement (par rapport à la contribution moyenne) à la formation de l’axe.
6. Combien d’axes factoriels trouvera-t-on lors de l’AFC de ce tableau de contingence ? Justifier votre réponse. (b) Déduire du tableau les profils-lignes qui sont bien représentés (qualité supérieure à 60%) dans le plan
principal. Préciser entre parenthèse la qualité de représentation. Repérer sur le graphique de l’annexe 6 ces
7. L’AFC de ce tableau permet d’obtenir les résultats suivants : profils.
α λα PI(α) PIC(α) 11. A partir du graphique de l’annexe 6, commenter la position des profils-lignes. Observe-t-on des sous-groupes ? si
1 0.2417 49.73 49.73 oui, lesquels ?
2 · · · 12. A partir du graphique de l’annexe 6, commenter la position des profils-colonnes. Observe-t-on des sous-groupes ?
3 0.0406 8.36 88.55 si oui, lesquels ?
4 0.0379 7.81 96.36 13. Réaliser l’interprétation simultanée des nuages de profils (on pourra s’aider des tableaux de profils présents dans
5 0.0126 2.59 98.95 l’annexe 7).
6 0.0051 1.05 100.00
Inertie 0.4859

3 4
Annexe 1 Annexe 2

Données brutes Résultats ACP

5 6
Annexe 3 Annexe 4

Résultats sur les observations Nuage des observations - Plan Factoriel 1×2

7 8
Annexe 5 Annexe 6

Nuage des variables - Plan Factoriel 1×2 Nuage des variables - Plan Factoriel 1×2

9 10
Annexe 7

Profils-lignes

Pays c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 c13


France 22.84 17.9 12.96 11.73 6.17 6.17 4.94 4.94 3.7 3.7 3.09 1.23 0.62
Espagne 5.65 11.29 6.45 7.26 21.77 5.65 2.42 5.65 2.42 18.55 9.68 0.81 2.42
Italie 20.41 8.16 12.93 6.8 13.61 4.76 8.16 4.08 3.4 8.84 6.8 0.68 1.36
Angleterre 4.76 7.41 2.12 3.17 14.29 6.35 1.06 6.88 13.76 8.47 15.34 3.17 13.23
Irelande 0.69 4.86 0.69 11.11 20.83 2.08 6.94 6.25 3.47 7.64 15.28 1.39 18.75
Hollande 4.72 3.77 1.89 1.89 14.15 1.89 0 12.26 22.64 0.94 26.42 3.77 5.66
Allemagne 2.15 25.81 0.54 6.45 1.61 4.84 1.08 5.91 22.04 0.54 20.43 4.3 4.3
Marginale 8.79 12.10 5.29 6.99 12.48 4.73 3.50 6.33 10.40 6.71 13.61 2.27 6.81

Profils-colonnes

Pays c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 c11 c12 c13 Marginale


France 39.78 22.66 37.5 25.68 7.58 20 21.62 11.94 5.45 8.45 3.47 8.33 1.39 15.31
Espagne 7.53 10.94 14.29 12.16 20.45 14 8.11 10.45 2.73 32.39 8.33 4.17 4.17 11.72
Italie 32.26 9.38 33.93 13.51 15.15 14 32.43 8.96 4.55 18.31 6.94 4.17 2.78 13.89
Angleterre 9.68 10.94 7.14 8.11 20.45 24 5.41 19.4 23.64 22.54 20.14 25 34.72 17.86
Irelande 1.08 5.47 1.79 21.62 22.73 6 27.03 13.43 4.55 15.49 15.28 8.33 37.5 13.61
Hollande 5.38 3.12 3.57 2.7 11.36 4 0 19.4 21.82 1.41 19.44 16.67 8.33 10.02
Allemagne 4.3 37.5 1.79 16.22 2.27 18 5.41 16.42 37.27 1.41 26.39 33.33 11.11 17.58

11

Vous aimerez peut-être aussi