Académique Documents
Professionnel Documents
Culture Documents
ACP Budget Temps Enonce R
ACP Budget Temps Enonce R
Enoncé du TD
Enquete-Budget-temps
Le CESP (Centre d’Étude des Supports de Publicité) a relevé, dans son Enquête Budget-temps Multimédia de
1991/1992 auprès de 17 665 personnes, des descripteurs de fréquentation de divers médias (radio, télévision, presse) et
des temps d’activités quotidiennes (cf. Boeswillwald, 1992). Ont été également relevées de nombreuses caractéristiques
socio-économiques, parmi lesquelles l’âge, le sexe, l’activité, le niveau d’éducation, et le lieu de résidence de ces
personnes, ce qui a conduit à créer 96 catégories en croisant ces divers critères. Nous nous intéressons seulement ici à
la sous-population des hommes actifs, soit 27 groupe qui seront, pour cet exemple, les individus. On cherche à
connaître les associations entre les temps consacrés à différentes activités par les individus observés.
Les 27 individus (qui sont en réalité dans le cadre de cet exemple des groupes d’individus) sont repérés par un
identificateur en 4 caractères:
+ le 1er caractère est l'âge du groupe (1=jeune, 2=moyen, 3=âgé)
+ le 2ème caractère est l'activité et est ici toujours égal à 1
(car il s'agit ici d'une sélection d' hommes actifs) .
+ le 3ème est le niveau d'éducation (1=primaire, 2=secondaire,3=supérieur)
+ le 4ème est le type d'agglomération (1=communes rurales; 2=villes moyennes;
3=villes importantes; 4=agglomération parisienne; 5,6,7 = groupes mixtes).
On lit par exemple sur la première ligne du tableau de données que le groupe ‘3124’ (âgé, actifs, niveau secondaire,
résidant à Paris) consacre en moyenne par jour 210.9 minutes aux activités à domicile, 107.3 minutes à des
activités regroupées sous la rubrique déplacement, 55.8 minutes pour les activités à l’extérieur, etc.
1
Résumé des variables
correlmatrix=round(cor(data),3)
correlmatrix
library(REdaS)
##
## Kaiser-Meyer-Olkin Statistics
##
## Call: KMOS(x = data)
##
## Measures of Sampling Adequacy (MSA):
## domicile deplacement exterieur repos loisirs travail
## 0.2977432 0.2700216 0.2559004 0.3229359 0.4248890 0.3028052
## FreqMedia
## 0.3601995
##
## KMO-Criterion: 0.3225787
bart_spher(correlmatrix)
2
2.4 Les valeurs propres
library(FactoMineR)
res.pca = PCA(data, scale.unit=TRUE, ncp=7, graph=F)
res.pca$eig
library(factoextra)
Scree plot
37.5%
30.5%
Percentage of explained variances
30
20
11.8%
10.4%
10
5.2%
4%
0.7%
0
1 2 3 4 5 6 7
Dimensions
3
Cercle de corrélation
Dim 2 (30.47%)
1.0
deplacement
exterieur
0.5
loisirs repos
FreqMedia
0.0
−0.5 domicile
travail
−1.0
1123
1124
1122
2 1133
1134 3137
2133 3122
2112
1115
1136 2122 3123
0
1121 2117
2134 2123 1111 3117
2131 3136
2121
2124
−2 2132 3121 2111
3116
−2 0 2 4
Dim 1 (37.47%)
4
2.8 Les individus et variables : cos2, contribution, et coordonnées
##
## Call:
## PCA(X = data, scale.unit = TRUE, ncp = 7, graph = F)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 2.62 2.13 0.83 0.73 0.36 0.28 0.05
## % of var. 37.47 30.47 11.85 10.38 5.15 3.97 0.69
## Cumulative % of var. 37.47 67.95 79.80 90.18 95.33 99.31 100.00
##
## Individuals
## Dist Dim.1 ctr cos2 Dim.2 ctr cos2
## 1111 | 2.12 | 0.34 0.16 0.03 | -0.91 1.43 0.18 |
## 1115 | 5.06 | 4.33 26.45 0.73 | 0.65 0.73 0.02 |
## 1121 | 1.60 | -0.82 0.96 0.26 | -0.09 0.01 0.00 |
## 1122 | 2.67 | -0.48 0.33 0.03 | 2.42 10.19 0.82 |
## 1123 | 3.02 | 0.51 0.36 0.03 | 2.92 14.76 0.93 |
## 1124 | 2.60 | -0.47 0.31 0.03 | 2.46 10.54 0.89 |
## 1136 | 2.17 | -1.61 3.67 0.55 | -0.04 0.00 0.00 |
## 1133 | 2.98 | -1.98 5.52 0.44 | 1.84 5.89 0.38 |
## 1134 | 3.30 | -2.47 8.64 0.56 | 1.54 4.10 0.22 |
## 2111 | 2.08 | 0.59 0.49 0.08 | -1.72 5.14 0.69 |
## 2112 | 2.69 | 1.61 3.64 0.36 | 0.61 0.65 0.05 |
## 2117 | 2.52 | 1.86 4.87 0.54 | 0.04 0.00 0.00 |
## 2121 | 1.76 | -0.19 0.05 0.01 | -1.63 4.60 0.86 |
## 2122 | 1.79 | 0.30 0.13 0.03 | 0.32 0.18 0.03 |
## 2123 | 1.64 | -0.14 0.03 0.01 | -0.48 0.41 0.09 |
## 2124 | 2.95 | -1.48 3.08 0.25 | -1.77 5.46 0.36 |
## 2131 | 1.40 | -0.62 0.55 0.20 | -0.98 1.68 0.50 |
## 2132 | 3.01 | -1.76 4.36 0.34 | -1.78 5.49 0.35 |
## 2133 | 1.19 | -0.31 0.13 0.07 | 1.11 2.13 0.87 |
## 2134 | 3.03 | -2.68 10.14 0.78 | -0.91 1.44 0.09 |
## 3116 | 2.90 | 0.48 0.32 0.03 | -2.27 8.93 0.61 |
## 3117 | 2.88 | 2.69 10.24 0.87 | -0.39 0.26 0.02 |
## 3121 | 2.68 | -0.04 0.00 0.00 | -2.12 7.83 0.63 |
## 3122 | 3.17 | 2.55 9.20 0.65 | 0.79 1.08 0.06 |
## 3123 | 1.57 | 0.87 1.07 0.30 | 0.33 0.19 0.04 |
## 3136 | 2.20 | 0.73 0.76 0.11 | -1.37 3.28 0.39 |
## 3137 | 3.21 | -1.79 4.55 0.31 | 1.44 3.60 0.20 |
##
## Variables
## Dim.1 ctr cos2 Dim.2 ctr cos2
## domicile | 0.60 13.91 0.36 | -0.44 8.98 0.19 |
## deplacement | -0.09 0.28 0.01 | 0.79 29.15 0.62 |
## exterieur | -0.21 1.76 0.05 | 0.68 21.63 0.46 |
## repos | 0.74 20.88 0.55 | 0.24 2.64 0.06 |
## loisirs | -0.81 24.95 0.65 | 0.38 6.64 0.14 |
## travail | -0.56 12.12 0.32 | -0.79 29.15 0.62 |
## FreqMedia | 0.83 26.09 0.68 | 0.20 1.81 0.04 |
5
3. Analysez les résultats ci-hauts et répondez aux questions suivantes :
3.1 Les données sont elles homogènes ? Fallait il diagonaliser la matrice de variance
P
covariance ou la matrice de corrélation Ω ? Quels risques aurions nous couru si nous
avons opté pour l’autre choix ?
3.2 Justifier, a posteriori et d’après le tableau des valeurs propres, le choix de la matrice
de variance covariance ou la matrice de corrélation Ω ?
3.3 Considérant le nuage de points à traiter, quelle est la coordonnée du groupe 1115
sur l’axe « travail »?
3.4 Quelle est la valeur numérique de l’inertie du nuage des points traité ?
3.9 Quel est le pourcentage de variance expliqué par la 1ère CP ? par la 2ème CP ? par
le plan dirigé par les deux premiers axes (O,U1,U2)?
3.10 Sur le plan (O,U1,U2), y a-t-il des variables mal représentées ? des individus mal
représentés ?
3.11 Selon le cercle de corrélation (O,U1,U2), que peut on dire de la corrélation entre :
a. deplacement et repos ?
b. travail et FreqMedia ?
c. loisirs et domicile ?
d. FreqMedia et loisirs ?
e. repos et exterieur ?
a. Que peut-on dire des groupes des jeunes à part le groupe 1115 qui est atypique ?
b. Citez 1 individu dont les activités sont dominées par les activités professionnelles ?
c. Citez 1 individu dont les activités sont dominées par les activités plus intérieures ?
d. Citez 1 individu dont les activités sont dominées par les activités de temps disponibles
ou libres ?
e. Citez 1 individu dont les activités sont dominées par les activités plus à l'extérieur
et divertissement ?