Vous êtes sur la page 1sur 3

Corrigé type de l’examen Analyse et traitement de données

Exercice (1)

Discussion des résultats de l’ACP :


L’interprétation des résultats de l’Analyse en composante principale se fait séquentiellement
pour chaque composante et pour chaque nuage de point (tracé des composantes par variable et
par individu) en analysant leur contribution la formation des composantes.
Avant tout il faut indiquer que nous retenons les deux premières composantes car elles
expliquent (toutes les deux ensemble) plus de 81% de l’inertie totale (ou de la variance
totale). [voir tableau d’analyse de la variance] (01)

Composante (1) :
 Variable : on sait que les variables contribuant le plus la formation de la composante (1)
sont celles qui ont un coefficient d’extraction élevé dans cette composante.
Pour repérer les contributions les plus significatives on utilise le tableau n° 3 matrice des
composantes. (0.5)

Services Prix
(0.25)
Donc la composante (1) oppose le prix au service fourni par les fournisseurs du matériel (0.5)
informatique. Donc elle est la première composante principale mesurant la répartition des
fournisseurs entre ceux qui offrent de meilleurs service et ceux qui appliquent les bons prix.
(0.25)
On remarque que seules ces deux variables sont bien représentées sur cette composante
(service se situe à l’extrémité gauche et le prix sur l’extrémité droite du diagramme des
composantes par variables). (0.5)
La qualité n’est pas du tout représentée dans cette composante (se situant l’extrémité haute du
diagramme des composantes par variables). (0.5)
Donc uniquement le service fourni et le prix contribuent la formation de la première
composante principale. (0.25)
 Individus : De même les individus contribuant le plus la formation de la composante (1)
sont ceux, sur le diagramme des composantes par individus, se situant sur l’extrémité gauche
ou droite, ou ceux se rapprochant des deux extrémités. (0.5)
Donc à partir du diagramme des composantes par individus on retrouve les deux fournisseurs
(E1) et (E4). (0.5)
E1 E4
(0.25)
Cette première composante met en opposition les deux fournisseurs (E1) et (E4). Indiquant
que le fournisseur (E1) offre plus de services (probablement des services après vente) à prix
élevés. Par contre le fournisseur (E4) offre moins de services (probablement pas ou moins de
services après vente) avec de meilleur prix. (0.5)
Composante (2) :
 Variable : on cherche les variables qui ont un coefficient d’extraction le plus élevé dans
cette composante. la matrice des composantes nous indique que seule la variable « qualité »
est très bien représentée sur cette composante. (0.5)
Qualité
(0.25)

Cette variable se situe sur l’extrémité haute du diagramme des composantes par variables.
Indiquant que la deuxième composante est uniquement liée à la qualité du matériel fourni par
les fournisseurs. (0.5)
Les deux autres variables (service et prix) ne sont pas du tout représentées dans cette
composante. (0.5)
 Individus : De même les individus contribuant le plus la formation de la composante (2)
sont ceux, sur le diagramme des composantes par individus, se situant sur l’extrémité haute ou
basse, ou ceux se rapprochant des deux extrémités.(0.5)
Donc à partir du diagramme des composantes par individus, les deux fournisseurs E2 et E3
sont ceux qui contribuent le plus à la formation de la deuxième composante principale se
situant sur l’extrémité basse, suivis par les fournisseurs E1 et E4 qui se rapprochent de
l’extrémité haute. (0.5)

E1 ; E4 E2 ; E3
(0.25)
Ceux se situant sur l’extrémité basse indiquent que ces fournisseurs n’offrent pas des services
de meilleur qualité (ou leur services ou matériel fourni n’est pas de meilleur qualité).
Alors que E1 et E4 se penchent le plus à fournir du matériel à meilleur qualité. (0.5)
Conclusion :
On conclue au fait que :
 Le fournisseur E1 offre du matériel informatique de bonne qualité avec plus de
services (probablement après vente) à des prix élevés. (0.25)
 Le fournisseur E4 offre du matériel informatique de bonne qualité avec moins de
services (probablement après vente) à des prix raisonnables. (0.25)
 Le fournisseur E2 offre du matériel informatique de qualité moindre avec certains
services après vente et des prix plus ou moins élevés. (0.25)
 Le fournisseur E3 offre du matériel informatique de qualité moindre avec ou sans
services après vente à des prix plus ou moins raisonnables (0.25)
Exercice (2) :

1) Tableau de probabilité :

Secteur Classe d’âge


20-29 30-39 40-49 50-59 60-69 marge
colonne
SP 0,022 0,026 0,038 0,023 0,008 0,117
SPA 0,020 0,020 0,018 0,009 0,002 0,070
OP 0,017 0,099 0,072 0,030 0,007 0,225
IA 0,015 0,070 0,065 0,035 0,016 0,202
Exp 0,056 0,049 0,072 0,034 0,022 0,234
EP 0,010 0,020 0,010 0,005 0,002 0,047
PA 0,006 0,032 0,031 0,010 0,004 0,083
Div 0,015 0,004 0,001 0,001 0,0003 0,022
marge 0,161 0,320 0,308 0,147 0,064 1
ligne

b=1−0.22−0.083−0.047−0.234−0.202−0.225−0.070=0.117 (0.5)
a=b−0.008−0.038−0.026−0.022=0.023 (0.5)
c=0.225−0.007−0.030−0.072−0.099=0.017 (0.5)
e=0.022+0.020+ 0.017+0.015+0.056 +0.010+0.006+ 0.015=0.161 (0.5)
d=0.308−0.001−0.031−0.010−0.065−0.072−0.018−0.038=0.073 (0.5)
f =0.023+ 0.009+ 0.030+0.035+0.034 +0.005+0.010+0.0006=0.147 (0.5)
2) Le pourcentage des cadres de l’agriculture dans le secteur public est de 11.7% (01)
3) Le pourcentage des cadres de l’agriculture les plus jeunes est de 16.1% (01)
4) Discussion des résultats de l’AFC :
Les objectifs de l’analyse factorielle des correspondances sont l’étude de la relation ou de
l’association entre deux variables (lignes et colonnes d’un tableau de contingence).
Pour vérifier l’existence de dépendance entre la classe d’âge et le secteur d’activité des cadres
de l’agriculture on se base sur la statistique de Khi2. (01)
À partir du tableau n°2, la p-value ou Sig est très faible, inférieur à 0.05, ce qui signifie que
les lignes et les colonnes sont significativement liées. En d’autres termes, il existe une
dépendance significative entre la classe d’âge et le secteur d’activité des cadres de
l’agriculture interrogés. (1.5)
La qualité de l’analyse :
Pour vérifier la qualité de l’analyse, on doit vérifier si la variance totale expliquée des deux
premières dimensions est proche de la variance totale. Si c’est le cas, alors l’analyse est de
bonne qualité. (01)
La somme des variances expliquées par les deux premières dimensions représente 98% de
l’inertie totale, indiquant alors que l’analyse est de bonne qualité. (01,5)

Vous aimerez peut-être aussi