Vous êtes sur la page 1sur 8

Université Hassan 1er Settat LST-MA

Faculté des Sciences et Techniques Module Analyse des données


Année universitaire 20017-2018 TP No 3:
1 Données
Le tableau décrit la consommation annuelle en francs d’un ménage pour différentes denrées
alimentaires en 1972. MA, EM, CA indiquent la catégorie socio-professionnelle et 2,3,4,5 la taille
du foyer.
Importer la table contingence.

pain legu frui vian vola lait vin


MA2 332 428 354 1437 526 247 427
EM2 293 559 388 1527 567 239 258
CA2 372 767 562 1948 927 235 433
MA3 406 563 341 1507 544 324 407
EM3 386 608 396 1501 558 319 363
CA3 438 843 689 2345 1148 243 341
MA4 534 660 367 1620 638 414 407
EM4 460 699 484 1856 762 400 416
CA4 385 789 621 2366 1149 304 282
MA5 655 776 423 1848 759 495 486
EM5 584 995 548 2056 893 518 319
CA5 515 1097 887 2630 1167 561 284

Table 1: Contingence

L’analyse de l’AFC permet de répondre aux questions


— Y a-t-il des classes socio-professionnelle qui se ressemblent, c’est-à-dire dans lesquels les
résultats (en pourcentages) des différentes lignes sont voisins ? Y a-t-il au contraire des
classes qui s’opposent (résultats très différents) ?
— Y a-t-il des aliments alimentaires qui se ressemblent, c’est-à-dire dans lesquels les résultats
(en pourcentages) des différentes colonnes sont voisins ? Y a-t-il au contraire des aliments
qui s’opposent (résultats très différents) ?

1.1 Tables des fréquences


> table.Fr=table.cont/sum(csp)
> fi.=rowSums(table.Fr)
> f.j<-c(colSums(table.Fr),1)
> table.Fi=cbind(table.Fr,fi.)
> table.F.j=rbind(table.Fi,f.j)
> rownames(table.F.j)=c("MA2","EM2","CA2","MA3","EM3","CA3","MA4","EM4","CA4","MA5","EM5","C
> table1<-xtable(table.F.j,digits=5)
> align(table1) <- "|c|ccccccc|c|"
> hlines <- c(-1, 0, nrow(table1)-1,nrow(table1))

Table 2: des Fréquences

1.2 Tables des profils


> profil.col=table.Fr/colSums(table.Fr)
> profil.row=table.Fr/rowSums(table.Fr)

1
pain legu frui vian vola lait vin fi.
MA2 0.00542 0.00699 0.00578 0.02348 0.00859 0.00404 0.00698 0.06129
EM2 0.00479 0.00913 0.00634 0.02495 0.00926 0.00390 0.00422 0.06259
CA2 0.00608 0.01253 0.00918 0.03183 0.01515 0.00384 0.00707 0.08568
MA3 0.00663 0.00920 0.00557 0.02462 0.00889 0.00529 0.00665 0.06686
EM3 0.00631 0.00993 0.00647 0.02452 0.00912 0.00521 0.00593 0.06749
CA3 0.00716 0.01377 0.01126 0.03831 0.01876 0.00397 0.00557 0.09880
MA4 0.00872 0.01078 0.00600 0.02647 0.01042 0.00676 0.00665 0.07581
EM4 0.00752 0.01142 0.00791 0.03032 0.01245 0.00654 0.00680 0.08295
CA4 0.00629 0.01289 0.01015 0.03866 0.01877 0.00497 0.00461 0.09633
MA5 0.01070 0.01268 0.00691 0.03019 0.01240 0.00809 0.00794 0.08891
EM5 0.00954 0.01626 0.00895 0.03359 0.01459 0.00846 0.00521 0.09661
CA5 0.00841 0.01792 0.01449 0.04297 0.01907 0.00917 0.00464 0.11667
f.j 0.08757 0.14352 0.09901 0.36992 0.15747 0.07024 0.07227 1.00000

pain legu frui vian vola lait vin


MA2 0.08851 0.11410 0.09437 0.38310 0.14023 0.06585 0.11384
EM2 0.07648 0.14591 0.10128 0.39859 0.14800 0.06239 0.06735
CA2 0.07094 0.14626 0.10717 0.37147 0.17677 0.04481 0.08257
MA3 0.09922 0.13759 0.08333 0.36828 0.13294 0.07918 0.09946
EM3 0.09344 0.14718 0.09586 0.36335 0.13508 0.07722 0.08787
CA3 0.07243 0.13941 0.11394 0.38780 0.18985 0.04019 0.05639
MA4 0.11509 0.14224 0.07909 0.34914 0.13750 0.08922 0.08772
EM4 0.09060 0.13768 0.09533 0.36557 0.15009 0.07879 0.08194
CA4 0.06530 0.13382 0.10533 0.40129 0.19488 0.05156 0.04783
MA5 0.12036 0.14259 0.07773 0.33958 0.13947 0.09096 0.08931
EM5 0.09877 0.16827 0.09268 0.34771 0.15102 0.08760 0.05395
CA5 0.07212 0.15362 0.12421 0.36830 0.16342 0.07856 0.03977

Table 3: des profils-lignes

pain legu frui vian vola lait vin


MA2 0.06194 0.09956 0.01564 0.16359 0.11892 0.02563 0.07046
EM2 0.03336 0.12638 0.04026 0.25198 0.10578 0.05559 0.01140
CA2 0.06139 0.14310 0.13073 0.08604 0.10553 0.05313 0.04493
MA3 0.01793 0.06409 0.07710 0.15636 0.08977 0.06045 0.09467
EM3 0.04005 0.10033 0.07388 0.34915 0.02465 0.03632 0.08207
CA3 0.10188 0.03723 0.07844 0.53018 0.11911 0.04010 0.06362
MA4 0.12073 0.06848 0.06056 0.30224 0.14841 0.01829 0.04633
EM4 0.08582 0.16260 0.02138 0.21129 0.17228 0.04150 0.06865
CA4 0.04383 0.17839 0.06443 0.39043 0.21437 0.07071 0.01246
MA5 0.10809 0.14478 0.09839 0.08162 0.08641 0.11191 0.05043
EM5 0.02579 0.11327 0.12390 0.21332 0.14736 0.09664 0.07420
CA5 0.05343 0.18102 0.16549 0.61177 0.05154 0.06387 0.06421

Table 4: des profils-colonnes

2
2 AFC : Analyse des résultats
**Results of the Correspondence Analysis (CA)**
The row variable has 12 categories; the column variable has 7 categories
The chi square of independence between the two variables is equal to 1290.386 (p-value = 2.
*The results are available in the following objects:

name description
1 "$eig" "eigenvalues"
2 "$col" "results for the columns"
3 "$col$coord" "coord. for the columns"
4 "$col$cos2" "cos2 for the columns"
5 "$col$contrib" "contributions of the columns"
6 "$row" "results for the rows"
7 "$row$coord" "coord. for the rows"
8 "$row$cos2" "cos2 for the rows"
9 "$row$contrib" "contributions of the rows"
10 "$call" "summary called parameters"
11 "$call$marge.col" "weights of the columns"
12 "$call$marge.row" "weights of the rows"

L’AFC utilise l’ACP dont la matrice X = (xij ) est


!
fij
xij = p
fi. fj.

2.1 Table des valeurs propres et Inerties

Val.Prop Var en % Cum de Var en %


dim 1 0.0139 66.0607 66.0607
dim 2 0.0052 24.7817 90.8424
dim 3 0.0010 4.7302 95.5726
dim 4 0.0005 2.4712 98.0438
dim 5 0.0003 1.4128 99.4566
dim 6 0.0001 0.5434 100.0000

Table 5: des valeurs propres

Nbre de facteurs retenus


Le choix du nombre d’axes factoriels à conserver se fait comme dans le cas de l’ACP. Ici, on
observe une brusque décroissance des valeurs propres entre la 3ème et la 4ème valeur propre. On
retient donc les 3 premiers axes factoriels.

2.2 Résultats relatifs aux profils lignes


On résume les résultats relatifs aux profils lignes dans le tableau suivant

Table 6: AFC des profils-lignes

3
Scree plot

50

40
Percentage of explained variances

30

20

10




0

1 2 3 4 5 6
Dimensions

Figure 1

Coordonn’ees Qualit’e Contribution


Comp.1 Comp.2 Comp.3 Comp.1 Comp.2 Comp.3 Poids Comp.1 Comp.2 Comp.3
MA2 0.098 -0.144 0.042 0.291 0.635 0.053 0.061 4.202 24.434 10.725
EM2 -0.041 -0.016 0.032 0.312 0.045 0.185 0.063 0.770 0.299 6.378
CA2 -0.076 -0.091 -0.009 0.338 0.488 0.005 0.086 3.516 13.552 0.739
MA3 0.130 -0.046 0.015 0.864 0.109 0.012 0.067 8.082 2.717 1.526
EM3 0.080 -0.012 0.031 0.800 0.017 0.122 0.067 3.084 0.172 6.569
CA3 -0.158 -0.046 -0.034 0.866 0.075 0.039 0.099 17.722 4.079 11.211
MA4 0.153 0.024 -0.027 0.942 0.023 0.028 0.076 12.719 0.839 5.341
EM4 0.051 -0.008 0.014 0.807 0.020 0.064 0.083 1.543 0.100 1.697
CA4 -0.168 -0.017 -0.030 0.897 0.010 0.029 0.096 19.534 0.564 8.714
MA5 0.169 0.030 -0.040 0.911 0.028 0.052 0.089 18.333 1.510 14.540
EM5 0.028 0.122 -0.021 0.046 0.888 0.026 0.097 0.531 27.315 4.122
CA5 -0.109 0.105 0.049 0.463 0.426 0.095 0.117 9.964 24.420 28.437

Le tableau ci-dessus rassemble tous les résultats relatifs aux profils-lignes.


Poids
La colonne ”Poids” rappelle les fréquences marginales des lignes c’est-à-dire le centre de gravité du
nuage des colonnes (profil colonne moyen). Les catégories socio-professionnelles ont ici un ”poids”
dépendant de l’effectif total des aliments alimentaires.
Coordonnées
Les coordonnés des profils-lignes dans le repère des 3 composantes principales retenues sont don-
nées par les 3 premières colonnes. La coordonnée du ième profil-ligne selon la composante s est
notée Fs (i), par exemple F1 (M A2) = 0.098
Ces coordonnées ont les propriétés suivantes :
— Selon chaque axe, la moyenne des coordonnées des profils-lignes pondérées par les poids
est nulle.
— Selon chaque axe, la moyenne des carrés des coordonnées des profiles-lignes pondérées les
poids, est égale à la valeur propre correspondante.
— Les coordonnées selon deux axes différents, pondérées par les poids, forment deux séries
statistiques indépendantes (covariance nulle)

4
Qualité
La colonne ”Qualité” indique les qualités de représentation (cos2 ) des profils-lignes par chaque
axe factoriel. La qualité du ième profil-ligne par la composante s est :
F 2 (i)
QLTs (i) = P s 2
t Ft (i)

c’est le carré du cosinus de l’angle du vecteur représentant i dans l’espace à 7 dimensions de sa


projection sur le premier axe factoriel.
La qualité du ième profil-ligne par l’espace engendré par les 3 premières composantes est
F12 (i) + F22 (i) + F32 (i)
QLT123 (i) = QLT1 (i) + QLT2 (i) + QLT3 (i) = P 2
t Ft (i)

Contribution
On rappelle que la contribution du ième profil-ligne par la composante s est
fi .Fs (i)2
Contribs (i) =
λs

où fi est le poids associé au ième profil-ligne (la ième composante du vecteur ”Poids”).

2.3 Résultats relatifs aux profils colonnes


Les résultats relatifs aux profils-colonnes s’interprètent de la même façon que les résultats
relatifs aux profils-lignes.

Coordonn’ees Qualit’e Contribution


Comp.1 Comp.2 Comp.3 Comp.1 Comp.2 Comp.3 Poids Comp.1 Comp.2 Comp.3
pain 0.186 0.044 -0.054 0.866 0.048 0.072 0.088 21.790 3.202 25.249
legu -0.007 0.067 -0.005 0.008 0.660 0.003 0.144 0.057 12.509 0.325
frui -0.127 0.013 0.053 0.787 0.008 0.138 0.099 11.396 0.298 27.819
vian -0.037 -0.025 0.009 0.515 0.247 0.031 0.370 3.554 4.548 2.971
vola -0.122 -0.017 -0.045 0.845 0.016 0.113 0.157 16.944 0.834 31.734
lait 0.188 0.152 0.037 0.577 0.378 0.022 0.070 17.734 30.948 9.568
vin 0.234 -0.186 0.018 0.608 0.381 0.004 0.072 28.524 47.661 2.334

Table 7: AFC des profils-colonnes

2.4 Interprétation
On pourra faire l’interprétation axe par axe pour les lignes et pour les colonnes. On commence
par dresser des tables où on résume d’abord les lignes et ensuite les colonnes qui ont des contri-
butions supérieures à la moyenne de la formation de l’axe.
La ligne qui a une contribution considérable est celle de barre dépassant la ligne interrompue
rouge.
Les figures suivantes montrent les lignes qui ont des contributions considérables :
Les figures suivantes montrent les colonnes qui ont des contributions considérables :

2.4.1 Axe comp.1


On résume dans le tableau suivant les lignes qui contribuent à la formation de l’axe 1 (voir
figure 2) dont leurs qualités de représentation (cos2 (θ)) est proche de 1 en précisant le signe
donnant le sens de la contribution (voir les coordonnées des lignes table 6 ).

5
Contribution of rows to Dim−1 Contribution of rows to Dim−2 Contribution of rows to Dim−3
20

15
20
20
Contributions (%)

Contributions (%)

Contributions (%)
10

10
10

0 0 0
A4

A5

A3

A4

A5

A3

A2

A2

A2

A5

A2

A3

A3

A5

A4

A4

A5

A5

A3

A2

A4

A4

A3

A2
EM

EM

EM

EM

EM

EM

EM

EM

EM

EM

EM

EM
C

C
Figure 2 Figure 3 Figure 4
Contribution of columns to Dim−1 Contribution of columns to Dim−2 Contribution of columns to Dim−3
50

30

40

20

30 20
Contributions (%)

Contributions (%)

Contributions (%)
20

10
10

10

0 0 0
vin

in

it

la

gu

vin

it

gu

in

la

la

in

it

vin

gu
fru

fru

fru
la

la

la
via

via

via
pa

vo

pa

vo

vo

pa
le

le

le
Figure 5 Figure 6 Figure 7

- +
CA3 MA4
CA4 MA5
CA5

Table 8: contrib des lignes à l’axe 1

De même pour les colonnes, le tableau suivant résume les colonnes qui contribuent à la formation
de l’axe 1 (voir figure 5) dont leurs qualités de représentation (cos2 (θ) est proche de 1 ) en précisant
le signe donnant le sens de la contribution (voir les coordonnées des lignes table 7 ).

- +
Vola Pain
Vin
Lait

Table 9: contrib des cols à l’axe 1

la comp. 1 oppose le lignes ’CA3’, ’CA4’ et ’CA5’ aux lignes ’MA4’ et ’MA5’. Elle oppose aussi
les colonnes ’pain’, ’vin’ et ’lait’ à la colonne ’vola’
La synthèse entre l’analyse des lignes et des colonnes associe les produits alimentaires ’pain’, ’vin’
et ’lait’ aux catégories socio-professionnels ’MA4’ et ’MA5’ et le produit alimentaire ’vola’(volaille)
aux catégories socio-professionnels ’CA3’, ’CA4’ et ’CA5’

2.4.2 Axe comp.2


Le tableau suivant résume les lignes retenues selon l’axe 2 (voir figure 3 et table 6)

6
- +
MA2 MA5
CA2 CA5

Table 10: contrib des lignes à l’axe 2

Le tableau suivant résume les colonnes retenues selon l’axe 2 (voir figure 6 et table 7)

- +
vin lait

Table 11: contrib des col à l’axe 2

la comp.2 oppose les lignes ’CA2’ et ’MA2’ aux lignes CA5’ et ’MA5’. Elle oppose aussi les
colonnes ’vin’, à la colonne ’lait’.
La composante ’comp.2’ associe ’vin’ aux catégories socio-professionnels ’MA2’ et ’CA2’ et le
produit alimentaire ’lait’ aux catégories socio-professionnels ’MA5’ et ’CA5’

2.4.3 Axe comp.3


Le tableau suivant résume les lignes retenues selon l’axe 3 (voir figure 4 et table 6)

- +
MA5 CA5
CA4 MA2
CA3

Table 12: contrib des lignes à l’axe 3

Le tableau suivant résume les colonnes retenues selon l’axe 3 (voir figure 7 et table 7)

- +
vola lait
pain

Table 13: contrib des col à l’axe 3

la comp.3 oppose les lignes MA5, CA4 et CA3 aux lignes CA5’ et ’MA2’. Elle oppose aussi les
colonnes ’pain’ et vola à la colonne ’lait’.
La composante ’comp.3’ associe ’lait’ aux catégories socio-professionnels ’MA2’ et ’CA5’ et le
produit alimentaire ’lait’ aux catégories socio-professionnels ’MA5’,’CA4’ et CA3.

2.4.4 Résultats graphiques


On peut réaliser et essayer d’interpréter des graphiques :
— en dimension 2 : on place les lignes et les colonnes dans un plan défini à partir de deux
axes factoriels, (voir les figures 8, 9 et 10)
— en dimension 3 :on place les lignes et les colonnes dans une représentation en perspective
d’un espace à 3 dimensions (fig 11).

7
CA − Biplot CA − Biplot
frui
lait ●

EM5 CA5


CA5 MA2

0.1
lait
● ●
0.03 EM2
legu EM3

pain
MA5 ● vin
● ●

EM4 MA3
MA4
Dim2 (24.8%)

Dim3 (4.7%)
0.0 frui EM4 vian
vola EM2 ●

● ●
vian EM3 0.00
CA4
MA3 ●
legu
● ●
CA3 CA2


● EM5
−0.1 CA2 CA4 ●

−0.03 ● MA4

CA3
MA2 MA5
● ●
vola

vin pain
−0.2
−0.1 0.0 0.1 0.2 −0.1 0.0 0.1 0.2
Dim1 (66.1%) Dim1 (66.1%)

Figure 8: Vect(1,2) Figure 9: Vect(1,3)


CA − Biplot
frui
CA5

MA2

EM2 lait ●
●●
0.03
EM3

vin
0.06

MA3 EM4
● ● ● ●
vian
0.04


Dim3 (4.7%)



0.00 ●
0.02

legu
CA2
comp3


0.00


comp2


● ● 0.15
−0.06 −0.04 −0.02

● ● 0.10
EM5 0.05

CA4 MA4 0.00
−0.03 ●
CA3
● −0.05
−0.10

MA5 −0.15
vola −0.20−0.15−0.10−0.05 0.00 0.05 0.10 0.15 0.20

pain comp1
−0.2 −0.1 0.0 0.1
Dim2 (24.8%) ● lignes colonnes

Figure 10: Vect(2,3) Figure 11: Vect( 1,2,3)