Académique Documents
Professionnel Documents
Culture Documents
Exercice 1
1) Déterminons tous d'abord le tableau de contingence avec les effectifs marginaux (somme
de chaque ligne et la somme de chaque colonne)
Pour déterminer le tableau des fréquences relatives, nous allons tout simplement diviser
n
chaque valeur de ce tableau par l'effectif total n=593 ( ij ¿
n
f 11=0.20 : 20% des personnes interrogés sont bruns aux yeux marrons
Pour avoir le tableau des profils ligne on divise chaque valeur du tableau des fréquences par la
f ij
somme de la ligne à laquelle il appartient (marge ligne) :
f i.
f 22 0.11804384
= =0.4729 : représente la probabilité d'être châtain sachant qu'on a les yeux
f 2. 0.2495784
noisettes (si on a le yeux noisettes nous avons 47.29% de chance d'avoir les cheveux
châtain,)
Pour avoir le tableau des profils ligne on divise chaque valeur du tableau des fréquence par la
f ij
somme de la colonne à laquelle il appartient (marge colonne) :
f.j
f 11 0.200674536
= =0.6329 : représente la probabilité d'avoir les yeux marrons sachant qu'on
f .1 0.31703240
a les cheveux bruns (si on a les cheveux brun nous avons 63.29% de chance d'avoir les yeux
marrons)
Statistique de test
2
p
( f ij −f i . × f . j )
χ =n ∑ ∑ q
2
Si H 0 est vraie
χ 2 χ 2( p−1 )(q−1)
χ 2 χ 29
Nous allons ainsi comparer les fréquences relatives observées f ij aux fréquences relatives
théoriques f i . × f . j (fréquences qu'on auraient obtenues si réellement les deux variables étaient
indépendantes). Nous allons ainsi comparer les cases de deux tableaux
Tableau des fréquences théoriques f i . × f . j
f ij f i.× f . j 2
( f ij −f i . × f . j )
f i.× f . j
0.200674536(f 11) f 1. × f .1=0.2799325 ×0.317032040=0.08875
( 0.200674536−0.08875 )2
=0.14415
0.08875
0.03372681(f 12 ) f 1. × f .2=0.2799325 ×0.32883642=0.092052
( 0.03372681−0.092052 )2
=0.036955
0.092052
⋮ ⋮ ⋮
0.18887015 44 )
(f f 4. × f .4 =0.3018550 ×0.24451939=0.073809
( 0.1887015−0.073809 )2
=0.17884
0.073809
Total 0.6094848
2
p
( f ij −f i . × f . j )
χ =n ∑ ∑ q
2
=593 ×0.6094848=361.4245
i=1 j=¿¿ f i.× f . j
2 2
χ χ 9 et α =5 %
sous R
> qchisq(0.95,9)
[1] 16.91898
existe une relation entre la couleur des yeux et la couleur des cheveux
n1. 166
f 1.= = =0.2799
n 593
n3. 100
f 3.= = =0.1686
n 593
La modalité yeux marrons à un poids plus important que la modalité yeux verts car il y'a plus
de personnes qui ont les yeux marrons que les yeux verts dans l'échantillon observé.
6) Centre de gravité
g j=f . j
G yeux =( g1 ,… . gq )
g j=f . j
Gcheveux =( g1 , …. g p )
gi=f . j
( )
4 2
1 f2j f3j
dχ ( noisette , vert )=dχ ( 2 , 3 )=∑
2 2
−
j=1 f . j f 2. f 3.
fij
Nous allons calculer cette distance à partir du tableau des profils lignes (car représentent
f i.
des profils lignes)
2 1 2 1
dχ ( noisette , vert )= (0.36486486−0.1) + …+ ( 0.0675657−0.16 )2
0.31703204 0.24451939
=0.3241009
( )
4 2
1 f 1j f2j 1 1
dχ 2 ( marron , noisette ) =dχ 2 (1 , 2 )=∑ − = ( 0.71686747−0.36486486 )2+ …+¿
j=1 f . j f 1. f 2 . 0.31703204 0.24451
La distance entre yeux marrons et yeux noisettes est plus grande que la distance entre yeux
noisettes et verts. Les personnes qui ont les yeux noisettes et verts ont a peu prés le même
profil concernant la couleur des cheveux (ils se ressemblent vis à vis de la couleur des
cheveux). Tandis que les personnes ayant les yeux marrons ont un profil différent par rapport
aux personnes ayant les yeux noisettes.
8) Inertie
2
χ
Inertie ( profils−lignes ) =Inertie ( profils−colonnes )= =0.609484
n
λ 1=0.4566
λ 2=0.15
En AFC, le nombre de valeurs propres =min ( q−1 , p−1 )=min ( 4−1,4−1 ) =min ( 3,3 )=3
Les valeurs en AFC ont une signification particulière. Plus les valeurs propre ont une valeur
proche de 1 plus la relation est importante entre les modalités des deux variables. Les valeurs
propres sont égale à 0.4566, 0.15 et 0.002884. La première valeur propre à une valeur
moyenne cela implique que le premier axe a capté une certaine relation relativement moyenne
(non négligeable) entre un groupe de modalités de la variable couleur des yeux avec un
groupe de modalités de la variable couleur des cheveux. Le deuxième axe capte le reste de
cette dépendance avec une valeur propre de 0.15 . Enfin le troisième axe ne capte presque rien
de cette dépendance entre les modalités des deux variable avec une valeur propre qui tend
vers 0
Le premier plan factoriel porte 99.53% de l'information initiale (le premier plan capte presque
la totalité des dépendances entre les modalités des deux variables)
11) En déduire la coordonnées de la modalité cheveux blond sur le premier axe (dim1)
1
p
f ij
G λ ( j)= ∑ F (i)
√ λ α i=1 f . j λ
coordonnées cheveux blond sur le premier axe =1/lambda 1 (somme profils colonnes fois les
coordonnées des modalités couleurs des yeux sur le premier axe)
profil-colonne
coordonnées lignes
1
4
f i4 1
G1 ( 4 )= ∑ F 1 (i ) = ( 0.04827586×−0.8236684+0.06896552 ×−0.2857163+0.11034483 ×0.19
√ λ 1 i=1 .4
f √ 0.4566
Exercice 3
La probabilité 0.1249 signifie : si nous sommes dans la tranche d'age 15-24 ans nous avons 12.49% de chance de
choisir la TV comme loisir. C'est la probabilité de choisir la TV sachant qu'on appartient à la tranche d'âge 15-24
ans
(0.25pt)
La probabilité 0.4965 signifie si on choisit internet comme loisir nous avons 49.65% de chance d'appartenir à la
tranche d'âge 15-24 ans. C'est la probabilité d'etre dans la tranche d'age 15-24 sachant qu'on a choisi internet
comme loisir
4) Les variables âge et loisir sont elles indépendantes ?
2
p
( f ij −f i . × f . j )
χ =n ∑ ∑ q
2
Si H 0 est vraie
D χ 2( p−1 )(q−1)
2
D χ 12
Résultat
2
∑ λα = χn =intertie totale des nuage .
α
∑ λα =0.5892+0.4217+ 0.0114=1,0223
α
χ =n ∑ λα =645 × 1.0223=659,3835
2
6) Les modalités de la variable âge qui contribuent le plus à la construction de l'axe 1 et l'axe2 :
Critère : ne prendre que les modalités dont la contribution est supérieure à 1/4=0.25
Axe 1 : Plus de 60 ans
11) Les modalités de la variable loisir qui contribuent le plus à la construction de l'axe 1 et l'axe2 :
Critère : ne prendre que les modalités dont la contribution est supérieure à 1/5=0.2(0.25pt)
Axe 2 : Restaurant(0.25pt)
Modalité : Cinéma car la somme des cos2 sur les deux axes est inférieure à 0.5(0.25pt)
L'axe 1 oppose principalement les jeunes répondants (coté positif de l'axe), au moins jeune c'est à dire les plus de
60 ans (coté négatif de l'axe). Les répondants âgés entre 15 et 39 ans ont comme loisir principal Internet ceci
s'explique par le fait que durant ces dernières années internet est devenu le loisir principal d'une grande partie de
la population surtout les jeunes. D'un autre coté, les plus de 60 ans aime le lecture et la TV avec une préférence
marquée pour la lecture.
L'axe 2 quant à lui oppose la tranche d'âge 40-60 ans aux autres catégories. Cette tranche d'âge à une nette
préférence pour le restaurant. Alors les plus de 60 ans aime la lecture et la TV et les 15-39 ans ont une préférence
pour l'internet.
Conclusion Les jeunes aime l'internet, les plus âgés aime la lecture et la TV alors que les personnes d'âge moyen
aime les restaurants
Exercice 3
1) Existe-il une relation entre le statut des salariés et leur préférences? Justifier votre réponse
α =5 % ¿
Pour savoir est ce qu'il existe une relation entre le statut(X) et la préférence(Y), nous allons
effectuer le test du khi-deux
Hypothèses
{ H 0 : X et Y sont indépendantes
H 1 : X et Y ne sont pas indépendantes
D'après l'annexe la p-value est presque nulle (¿ 0.05)donc on rejette H 0, il y'a une relation
entre le statut et la préférence
2) Calculer le centre de gravité du nuage des profils-lignes
p
fij p
g j=∑ f i . =∑ f ij =f . j
i=1 f i . i=1
χ 2 35.26124
Nous savons que λ 1+ λ2= = =0.7052→ λ 2=0.7052−0.479=0.2262
n 50
4)
Les valeurs en AFC ont une signification particulière. Plus les valeurs propre ont une valeur
proche de 1 plus la relation est importante entre les modalités des deux variables. Les valeurs
propres sont égale à 0.479, 0.2262. La première valeur propre à une valeur moyenne cela
implique que le premier axe a capté une certaine relation relativement moyenne mais qui est
quand même assez importante entre un groupe de modalités de la variable statut et un
groupe de modalités de la variable préférences. Le deuxième axe capte le reste de cette
dépendance avec une valeur propre de 0.2262 qui n'est pas très importante mais qui est non
négligeable.
5)Quelle est la part d'inertie portée par le premier axe factoriel en pourcentage
0.479
=0.6792
0.7052
7)Quelles sont les modalités qui contribuent le plus à la construction de l'axe 1 et de l'axe 2
(pour les deux variables et faites un tableau avec les contributions négatifs et positifs)
statut
axe 1
1
prendre les modalités qui ont une contribution supérieure à la contribution moyenne =0.33
3
Contribution+ Contribution-
employé ouvrier
axe2
Contribution+ Contribution-
cadre
Préférence
1
prendre les modalités qui ont une contribution supérieure à la contribution moyenne =0.25
4
axe 1
Contribution+ Contribution-
Midi_deux matin
axe 2
Contribution+ Contribution-
soir
On remarque que l'axe 1 oppose les employés aux ouvriers. Les ouvriers préfèrent travailler le
matin alors que les employés préfèrent travailler entre midi et deux heure et le samedi aussi.
Le travail des ouvriers est plus physique que celui des employés, donc les ouvriers préfèrent
travailler le matin, pour se reposer entre midi et deux heures. L'axe 2 quant à lui oppose les
cadres aux autres catégories. Les cadres préfèrent travailler le soir alors que les ouvriers et
employés préfèrent travailler en journée. Les cadres ont l'habitude de faire des heures
supplémentaires donc travailler le soir ne les dérangent pas.