Vous êtes sur la page 1sur 11

Série 4 AFC

Exercice 1

1) Déterminons tous d'abord le tableau de contingence avec les effectifs marginaux (somme
de chaque ligne et la somme de chaque colonne)

Pour déterminer le tableau des fréquences relatives, nous allons tout simplement diviser
n
chaque valeur de ce tableau par l'effectif total n=593 ( ij ¿
n

Marge en ligne = somme de chaque ligne

Marge en colonne =somme de chaque colonne

f 11=0.20 : 20% des personnes interrogés sont bruns aux yeux marrons

f .3=0.1096 : 10.96% des personnes interrogés ont les cheveux roux

f 2.=0.2495 : 24.95% des personnes interrogés ont les yeux noisettes

2) Tableau des profils-lignes

Pour avoir le tableau des profils ligne on divise chaque valeur du tableau des fréquences par la
f ij
somme de la ligne à laquelle il appartient (marge ligne) :
f i.
f 22 0.11804384
= =0.4729 : représente la probabilité d'être châtain sachant qu'on a les yeux
f 2. 0.2495784
noisettes (si on a le yeux noisettes nous avons 47.29% de chance d'avoir les cheveux
châtain,)

3) Tableau des profils-colonne

Pour avoir le tableau des profils ligne on divise chaque valeur du tableau des fréquence par la
f ij
somme de la colonne à laquelle il appartient (marge colonne) :
f.j

f 11 0.200674536
= =0.6329 : représente la probabilité d'avoir les yeux marrons sachant qu'on
f .1 0.31703240
a les cheveux bruns (si on a les cheveux brun nous avons 63.29% de chance d'avoir les yeux
marrons)

4) Test de khi-deux d'indépendance

{ H 0 :la couleur des yeux et lacouleur des cheveux sont indépendantes


H 1 :la couleur des yeux et la couleur des cheveux sont dépendantes

Statistique de test
2
p
( f ij −f i . × f . j )
χ =n ∑ ∑ q
2

i=1 j=¿¿ f i.× f . j

Si H 0 est vraie

χ 2 χ 2( p−1 )(q−1)

p= 4 modalités (4 couleurs des yeux)

q=4 modalités(4 couleurs de cheveux)

χ 2 χ 29

Nous allons ainsi comparer les fréquences relatives observées f ij aux fréquences relatives
théoriques f i . × f . j (fréquences qu'on auraient obtenues si réellement les deux variables étaient
indépendantes). Nous allons ainsi comparer les cases de deux tableaux
Tableau des fréquences théoriques f i . × f . j

f ij f i.× f . j 2
( f ij −f i . × f . j )
f i.× f . j
0.200674536(f 11) f 1. × f .1=0.2799325 ×0.317032040=0.08875
( 0.200674536−0.08875 )2
=0.14415
0.08875
0.03372681(f 12 ) f 1. × f .2=0.2799325 ×0.32883642=0.092052
( 0.03372681−0.092052 )2
=0.036955
0.092052
⋮ ⋮ ⋮
0.18887015 44 )
(f f 4. × f .4 =0.3018550 ×0.24451939=0.073809
( 0.1887015−0.073809 )2
=0.17884
0.073809
Total 0.6094848

2
p
( f ij −f i . × f . j )
χ =n ∑ ∑ q
2
=593 ×0.6094848=361.4245
i=1 j=¿¿ f i.× f . j

2 2
χ χ 9 et α =5 %

donc la valeur critique du test est d 0 =16.91898

sous R

> qchisq(0.95,9)

[1] 16.91898

χ =361.4245> d 0=12.6 donc on rejette l'hypothèse d'indépendance H 0 et on conclut qu'il


2

existe une relation entre la couleur des yeux et la couleur des cheveux

5) poids des modalités


poids modalité yeux marrons

n1. 166
f 1.= = =0.2799
n 593

poids modalité yeux verts

n3. 100
f 3.= = =0.1686
n 593

La modalité yeux marrons à un poids plus important que la modalité yeux verts car il y'a plus
de personnes qui ont les yeux marrons que les yeux verts dans l'échantillon observé.

6) Centre de gravité

centre de gravité du nuage des profils lignes

g j=f . j

G yeux =( g1 ,… . gq )

g j=f . j

G yeux =( 0.317032, 0.328836 , 0.109612 , 0.244519 )

centre de gravité du nuage des profils-colonnes

Gcheveux =( g1 , …. g p )

gi=f . j

Gcheveux =( 0.27993 , 0.24957 , 0.16863, 0.30185 )


7) Calculer la distance entre les modalités yeux noisettes et yeux verts, puis entre les
modalités yeux marron et yeux noisettes. Que remarquez-vous

( )
4 2
1 f2j f3j
dχ ( noisette , vert )=dχ ( 2 , 3 )=∑
2 2

j=1 f . j f 2. f 3.

fij
Nous allons calculer cette distance à partir du tableau des profils lignes (car représentent
f i.
des profils lignes)

2 1 2 1
dχ ( noisette , vert )= (0.36486486−0.1) + …+ ( 0.0675657−0.16 )2
0.31703204 0.24451939

=0.3241009

( )
4 2
1 f 1j f2j 1 1
dχ 2 ( marron , noisette ) =dχ 2 (1 , 2 )=∑ − = ( 0.71686747−0.36486486 )2+ …+¿
j=1 f . j f 1. f 2 . 0.31703204 0.24451

La distance entre yeux marrons et yeux noisettes est plus grande que la distance entre yeux
noisettes et verts. Les personnes qui ont les yeux noisettes et verts ont a peu prés le même
profil concernant la couleur des cheveux (ils se ressemblent vis à vis de la couleur des
cheveux). Tandis que les personnes ayant les yeux marrons ont un profil différent par rapport
aux personnes ayant les yeux noisettes.

8) Inertie
2
χ
Inertie ( profils−lignes ) =Inertie ( profils−colonnes )= =0.609484
n

9) Les deux premiers valeurs propres sont

λ 1=0.4566

λ 2=0.15

-Déterminer le nombre de valeur propre pour cet AFC

En AFC, le nombre de valeurs propres =min ( q−1 , p−1 )=min ( 4−1,4−1 ) =min ( 3,3 )=3

-En déduire la valeur des valeurs propres non données

La somme des valeurs propres est égale à l'inertie des nuages


2
∑ λα = χn =0.609484
α

λ 1+ λ2 + λ3 =0.609484 → λ3=0.609484−( 0.4566+ 0.15 )=0.002884

-Commenter la valeur de ces valeurs propres

Les valeurs en AFC ont une signification particulière. Plus les valeurs propre ont une valeur
proche de 1 plus la relation est importante entre les modalités des deux variables. Les valeurs
propres sont égale à 0.4566, 0.15 et 0.002884. La première valeur propre à une valeur
moyenne cela implique que le premier axe a capté une certaine relation relativement moyenne
(non négligeable) entre un groupe de modalités de la variable couleur des yeux avec un
groupe de modalités de la variable couleur des cheveux. Le deuxième axe capte le reste de
cette dépendance avec une valeur propre de 0.15 . Enfin le troisième axe ne capte presque rien
de cette dépendance entre les modalités des deux variable avec une valeur propre qui tend
vers 0

10) Quelle est l'inertie portée par le premier plan factoriel

Le premier plan (axe1+axe2) porte (0.4566+0.15)/0.609484=0.9953

Le premier plan factoriel porte 99.53% de l'information initiale (le premier plan capte presque
la totalité des dépendances entre les modalités des deux variables)

11) En déduire la coordonnées de la modalité cheveux blond sur le premier axe (dim1)

Pour calculer les coordonnées nous allons utiliser la formule de transition

1
p
f ij
G λ ( j)= ∑ F (i)
√ λ α i=1 f . j λ
coordonnées cheveux blond sur le premier axe =1/lambda 1 (somme profils colonnes fois les
coordonnées des modalités couleurs des yeux sur le premier axe)

profil-colonne

coordonnées lignes
1
4
f i4 1
G1 ( 4 )= ∑ F 1 (i ) = ( 0.04827586×−0.8236684+0.06896552 ×−0.2857163+0.11034483 ×0.19
√ λ 1 i=1 .4
f √ 0.4566
Exercice 3

1) Tableau des fréquences relatives

2) Tableau des fréquences colonnes

La probabilité 0.1249 signifie : si nous sommes dans la tranche d'age 15-24 ans nous avons 12.49% de chance de
choisir la TV comme loisir. C'est la probabilité de choisir la TV sachant qu'on appartient à la tranche d'âge 15-24
ans

3) Tableau des fréquences lignes

(0.25pt)

La probabilité 0.4965 signifie si on choisit internet comme loisir nous avons 49.65% de chance d'appartenir à la
tranche d'âge 15-24 ans. C'est la probabilité d'etre dans la tranche d'age 15-24 sachant qu'on a choisi internet
comme loisir
4) Les variables âge et loisir sont elles indépendantes ?

Pour le savoir, nous allons effectuer un test du khi-deux d'indépendance

{ H 0 : Les loisirs et l ' age sont indépendants


H 1 : Les loisirs et l ' age ne sont pas indépendants

2
p
( f ij −f i . × f . j )
χ =n ∑ ∑ q
2

i=1 j=¿¿ f i.× f . j

Si H 0 est vraie

D χ 2( p−1 )(q−1)
2
D χ 12

Résultat

2
∑ λα = χn =intertie totale des nuage .
α

∑ λα =0.5892+0.4217+ 0.0114=1,0223
α

χ =n ∑ λα =645 × 1.0223=659,3835
2

Calcul de la valeur critique : quantile d'ordre 0.95 d'une χ 212

On rejette H 0 et on conclut que l'âge et les loisirs sont dépendants

5) Le centre de gravité du nuage des profils-lignes est :

G X =( 0.2481, 0.2481 , 0.2481, 0.2558)

6)Inertie du nuage des profils-colonne = ∑ λα =¿1,0223


α

8) Part d'inertie portée par le premier plan factoriel : 98.8813

6) Les modalités de la variable âge qui contribuent le plus à la construction de l'axe 1 et l'axe2 :

Critère : ne prendre que les modalités dont la contribution est supérieure à 1/4=0.25
Axe 1 : Plus de 60 ans

Axe 2 : 40-60 ans

11) Les modalités de la variable loisir qui contribuent le plus à la construction de l'axe 1 et l'axe2 :

Critère : ne prendre que les modalités dont la contribution est supérieure à 1/5=0.2(0.25pt)

Axe 1 : Internet et Lecture(0.25pt)

Axe 2 : Restaurant(0.25pt)

12) Les modalités mal représentées sur le premier plan

Modalité : Cinéma car la somme des cos2 sur les deux axes est inférieure à 0.5(0.25pt)

13) Interprétation de la représentation simultanée

L'axe 1 oppose principalement les jeunes répondants (coté positif de l'axe), au moins jeune c'est à dire les plus de
60 ans (coté négatif de l'axe). Les répondants âgés entre 15 et 39 ans ont comme loisir principal Internet ceci
s'explique par le fait que durant ces dernières années internet est devenu le loisir principal d'une grande partie de
la population surtout les jeunes. D'un autre coté, les plus de 60 ans aime le lecture et la TV avec une préférence
marquée pour la lecture.

L'axe 2 quant à lui oppose la tranche d'âge 40-60 ans aux autres catégories. Cette tranche d'âge à une nette
préférence pour le restaurant. Alors les plus de 60 ans aime la lecture et la TV et les 15-39 ans ont une préférence
pour l'internet.

Conclusion Les jeunes aime l'internet, les plus âgés aime la lecture et la TV alors que les personnes d'âge moyen
aime les restaurants

Exercice 3

1) Existe-il une relation entre le statut des salariés et leur préférences? Justifier votre réponse
α =5 % ¿

Pour savoir est ce qu'il existe une relation entre le statut(X) et la préférence(Y), nous allons
effectuer le test du khi-deux

Hypothèses

{ H 0 : X et Y sont indépendantes
H 1 : X et Y ne sont pas indépendantes

D'après l'annexe la p-value est presque nulle (¿ 0.05)donc on rejette H 0, il y'a une relation
entre le statut et la préférence
2) Calculer le centre de gravité du nuage des profils-lignes
p
fij p
g j=∑ f i . =∑ f ij =f . j
i=1 f i . i=1

G X =( 0.32,0.32,0 .24,0 .12)

3) Calculer la valeur propre λ 2

χ 2 35.26124
Nous savons que λ 1+ λ2= = =0.7052→ λ 2=0.7052−0.479=0.2262
n 50

4)

Les valeurs en AFC ont une signification particulière. Plus les valeurs propre ont une valeur
proche de 1 plus la relation est importante entre les modalités des deux variables. Les valeurs
propres sont égale à 0.479, 0.2262. La première valeur propre à une valeur moyenne cela
implique que le premier axe a capté une certaine relation relativement moyenne mais qui est
quand même assez importante entre un groupe de modalités de la variable statut et un
groupe de modalités de la variable préférences. Le deuxième axe capte le reste de cette
dépendance avec une valeur propre de 0.2262 qui n'est pas très importante mais qui est non
négligeable.

5)Quelle est la part d'inertie portée par le premier axe factoriel en pourcentage

0.479
=0.6792
0.7052

7)Quelles sont les modalités qui contribuent le plus à la construction de l'axe 1 et de l'axe 2
(pour les deux variables et faites un tableau avec les contributions négatifs et positifs)

statut

axe 1

1
prendre les modalités qui ont une contribution supérieure à la contribution moyenne =0.33
3

Contribution+ Contribution-
employé ouvrier

axe2
Contribution+ Contribution-
cadre

Préférence

1
prendre les modalités qui ont une contribution supérieure à la contribution moyenne =0.25
4

axe 1

Contribution+ Contribution-
Midi_deux matin

axe 2

Contribution+ Contribution-
soir

8) Interpréter le nuage de la représentation simultanée

On remarque que l'axe 1 oppose les employés aux ouvriers. Les ouvriers préfèrent travailler le
matin alors que les employés préfèrent travailler entre midi et deux heure et le samedi aussi.
Le travail des ouvriers est plus physique que celui des employés, donc les ouvriers préfèrent
travailler le matin, pour se reposer entre midi et deux heures. L'axe 2 quant à lui oppose les
cadres aux autres catégories. Les cadres préfèrent travailler le soir alors que les ouvriers et
employés préfèrent travailler en journée. Les cadres ont l'habitude de faire des heures
supplémentaires donc travailler le soir ne les dérangent pas.

Vous aimerez peut-être aussi