Vous êtes sur la page 1sur 13

Royaume du Maroc

Kingdom of Morocco

Ministère de l’Agriculture, de la Pêche Maritime, Minister of Agriculture, Fisheries, Rural


du Développement Rural et des Eaux et Forêts Development, Water and Forests
Département de l’Agriculture Department of Agriculture

Ecole Nationale d’Agriculture de Meknès National School of Agriculture of Meknes

Filière : Production Animale et Pastoralisme

RAPPORT DU TRAVAIL
D’ANALYSE
MULTIDIMENTIONNELLE : ANALYSE
DE COMPOSANTE PRINCIPALE

Réalisé par : BOUJANAH HAJAR

Année académique : 2023-2024


Table des matières

INTRODUCTION..............................................................................................................................................................................3
I. Présentation de la base de données..............................................................................................................................................4
A. 4
II. OBJECTIFS.................................................................................................................................................................................4
III. METHODOLOGIE DE TRAVAIL.........................................................................................................................................5
IV. RESULTATS ET INTERPRETATIONS................................................................................................................................5
A. Statistiques descriptives...........................................................................................................................................................5
1. Données quantitatives...........................................................................................................................................................5
2. Matrice de corrélation..........................................................................................................................................................5
3. Données qualitatives.............................................................................................................................................................6
B. Analyse en Composantes Principales......................................................................................................................................6
1. Valeurs propres.....................................................................................................................................................................6
2. Vecteurs propres...................................................................................................................................................................7
3. Corrélations entre les variables et les facteurs.....................................................................................................................7
4. Cercle de corrélation des variables et des axes....................................................................................................................8
5. Contributions des variables (%)...........................................................................................................................................8
6. Cosinus carrés des variables.................................................................................................................................................8
7. Coordonnées des observations.............................................................................................................................................9
8. Représentation graphique des individus sur les deux axes.................................................................................................10
9. Répartition des groupes......................................................................................................................................................10
10. Contributions des observations (%)................................................................................................................................12
CONCLUSION.................................................................................................................................................................................13

2
INTRODUCTION

Le présent travail s'inscrit dans le cadre des activités pédagogiques du cours d'analyses multidimensionnelles,

visant à renforcer la consolidation des idées théoriques acquises pendant le cours. Ce travail présente un

exemple concret de l'analyse en composantes principales.

3
I. Présentation de la base de données
La base de données ci présente est constituée de 20 individus qui sont des veaux et velles issus de la sélection des taureaux. Elle
a été obtenue à l’aide de l’ICAR, organisme responsable et qui organise la sélection à l’échelle mondiale.

Les variables étudiées sont :

 La race
 Le poids à la naissance
 L’année de naissance
 Poids au sevrage
 Age au sevrage

Voici ci-dessous la base de données :

Idanimal race pona annais poisev agesev


H92006 H 2,1 1992 11,1 111
H92007 H 2,5 1992 13,3 111
H92008 H 1,2 1992 12 101
H92009 H 2,1 1992 14,4 111
H95135 H 2,9 1995 8,1 103
H95136 H 2,1 1995 14,9 103
H95137 H 2,6 1995 7,9 106
H95138 H 2,5 1995 11,4 103
H95139 H 2,1 1995 10,7 113
M92100 M 3,5 1992 13,8 105
M92101 M 2,2 1992 14,9 105
M92102 M 2,9 1992 10,6 105
M92103 M 3 1992 10,7 105
M92104 M 2,6 1992 7,7 105
M96226 M 2,6 1996 10,7 98
M96227 M 2 1996 9,5 98
M96228 M 2 1996 14,1 100
M96229 M 2 1996 13,5 99
M96230 M 3,4 1996 13,4 98
A.

II. OBJECTIFS

Les objectifs principaux de cette analyse sont :

 Déterminer l’évolution du poids au sevrage en fonction de la race, le poids à la naissance, âge au sevrage et l’année
de naissance.
 Observer la ressemblance ou la différence qui existe entre les agneaux.

4
III. METHODOLOGIE DE TRAVAIL
Pour faire cette étude, avec ces différentes variables, nous avons pensé à l’analyse multidimensionnelle des données.

La méthode utilisée est : l’analyse des composantes principales (ACP).

Pour bien traiter ces données, nous avons fait recours au logiciel XLSTAT (version 2019) dont les sorties seront présentées ci-
dessous.

IV. RESULTATS ET INTERPRETATIONS


A. Statistiques descriptives
1. Données quantitatives

Obs. avec Obs. sans


Variable Observations données données Minimum Maximum Moyenne Ecart-type
manquantes manquantes

pona 19 0 19 1,200 3,500 2,437 0,553

annais 19 0 19 1992,000 1996,000 1993,842 1,834

poisev 19 0 19 7,700 14,900 11,721 2,352

agesev 19 0 19 98,000 113,000 104,211 4,697

Ce tableau de la statistique descriptive montre les maximums, minimums, moyennes et écart-types des différentes variables
étudiées.

Son analyse laisse voir que les écart-types sont faible pour l’ensemble des variables, sauf pour la variable poids au sevrage qui
est un peu plus importante que les autres.

2. Matrice de corrélation

pona annais poisev agesev

pona 1 -0,038 -0,157 -0,035

annais -0,038 1 -0,083 -0,589**

poisev -0,157 -0,083 1 -0,007

agesev -0,035 -0,589 -0,007 1

5
Ce tableau montre que les variables ne sont pas corrélées entre elles, sauf pour année de naissance et l’âge au sevrage qui son
négativement corrélées.

3. Données qualitatives

Variable Modalités Comptages Effectifs %


race H 9 9 47,368

M 10 10 52,632

Ce tableau montre que 47% des effectifs sont de la races Holstein et 52% des effectifs sont de la race Montbéliard.
B. Analyse en Composantes Principales

1. Valeurs propres

F1 F2 F3

Valeur propre 1,164 1,031 0,805

Variabilité (%) 38,804 34,358 26,838

% cumulé 38,804 73,162 100,000

Scree plot
1,4 100

1,2
80

1
Variabilité cumulée (%)

60
0,8
Valeur

0,6
40

0,4

20
0,2

0 0
F1 F2 F3
axe

Figure 1: Scree plot


Le tableau des valeurs propres montre que F1 représente que 38,804% de toutes les informations ; et que F2 représente 34,358%
de ces informations alors que F3 ne représentent que des parts faibles des informations (26,8%).

6
Donc pour le choix des axes on retient F1 et F2 car les valeurs des valeurs propres 1 et 2 sont supérieures à 1 et aussi le cumul de
F1 et F2 présente environ 73%% de la réalité.

2. Vecteurs propres

F1 F2 F3

pona -0,647 -0,444 0,620

annais -0,220 0,887 0,406

poisev 0,730 -0,127 0,672

Ces vecteurs permettent de calculer les corrélations entre les variables de départ et les axes principaux ainsi que les coordonnées
des individus observés.

3. Corrélations entre les variables et les facteurs

F1 F2 F3

pona -0,698 -0,451 0,556

annais -0,237 0,901 0,364

poisev 0,788 -0,129 0,603

agesev 0,136 -0,499 -0,296

Le tableau de corrélation les variables et des axes montre que la variable qui contribuent le plus dans la formation de l’axe F1 est :

 Le poids au sevrage

Alors que la variable année de naissance contribue essentiellement à la formation de l'axe F2.

7
4. Cercle de corrélation des variables et des axes :

Variables (axes F1 et F2 : 73,16 %)


1 annais

0,75

F2 (34,36 %) 0,5

0,25
poisev

0
pona
agesev

-0,25

-0,5 -1 -0,75 -0,5 -0,25 0 0,25 0,5 0,75 1


F1 (38,80 %)

-0,75 Variables activesVariables supplémentaires

-1

Figure 2: Variables (axes F1 et F2 : 73,16 %)


Le cercle de corrélation entre les variables et les axes montre que :

 La variable poids de naissance est positivement corrélé à l’axe 1.


 La variable poids à la naissance est négativement corrélé à l’axe 1.
 Les variable année de naissance et âge au sevrage sont faiblement corrélés avec l’axe 1.
 La variable année de naissance et positivement corrélé à l’axe 2.
 La variable âge au sevrage est négativement corrélé avec l’axe 2.

5. Contributions des variables (%)

F1 F2 F3

pona 41,903 19,697 38,401

annais 4,825 78,700 16,475

poisev 53,272 1,603 45,124

Le tableau montre que l’axe 1 est essentiellement structuré par les variables poids à la naissance et poids au sevrage, ainsi la
variable année de naissance contribue en majeur partie à l’axe 2.

6. Cosinus carrés des variables

8
F1 F2 F3

pona 0,488 0,203 0,309

annais 0,056 0,811 0,133

poisev 0,620 0,017 0,363

agesev 0,019 0,249 0,088

Les résultats correspondant aux variables supplémentaires sont affichés dans la seconde partie du tableau

Les valeurs en gras correspondent pour chaque variable au facteur pour lequel le cosinus carré est le plus grand

A travers le tableau du cosinus carré des variables montre que les variables poids à la naissance et poids au sevrage sont bien
représentées sur l’axe F1 car elles ont de grandes valeurs et que aussi la variable année de naissance est bien représentée sur l’axe
F2 du fait de sa forte valeur.

7. Coordonnées des observations


F1 F2 F3
H92006 0,434 -0,604 -0,989
H92007 0,654 -1,055 0,117
H92008 1,803 0,089 -1,761
H92009 1,486 -0,786 -0,021
H95135 -1,854 0,394 -0,266
H95136 1,276 0,677 0,808
H95137 -1,557 0,652 -0,670
H95138 -0,321 0,541 0,242
H95139 -0,063 0,910 -0,424
M92100 -0,389 -1,907 1,415
M92101 1,525 -0,896 0,241
M92102 -0,688 -1,236 -0,215
M92103 -0,776 -1,323 -0,070
M92104 -1,251 -0,828 -1,411
M96226 -0,787 0,994 0,379
M96227 -0,448 1,556 -0,664
M96228 1,018 1,301 0,686
M96229 0,827 1,334 0,510
M96230 -0,889 0,186 2,092

race-H 0,207 0,091 -0,329


race-M -0,186 -0,082 0,296

Les résultats correspondant aux barycentres des modalités sont affichés dans la partie inférieure du tableau

9
8. Représentation graphique des individus sur les deux axes

Observations (axes F1 et F2 : 73,16 %)


2
M96227

1,5 M96229 M96228

M96226
H95139
1
H95137 H95136
H95138
H95135
0,5
M96230
H92008
F2 (34,36 %)

-0,5
H92006
M92104 H92009
-1 M92101
H92007
M92102
M92103
-1,5

-2 M92100

-2,5
-2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2
F1 (38,80 %)

H (Obs)M (Obs)

Figure 3:Observations (axes F1 et F2 : 73,16 %)

Selon le graphe on trouve que les individus sont très dispersés.

9. Répartition des groupes

Biplot (axes F1 et F2 : 73,16 %)


2 annais
M96227

1,5 M96229 M96228

M96226
H95139
1
H95137 H95136
H95138
H95135
0,5
M96230
H92008
F2 (34,36 %)

poisev
-0,5
H92006
M92104 H92009
-1 pona M92101
agesev H92007
M92102 M92103
-1,5

-2 M92100

-2,5
-2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2
F1 (38,80 %)

Variables activesHMVariables supplémentaires

Figure 4:Biplot (axes F1 et F2 : 73,16 %)

10
Selon le graphe on peut distinguer quatre groupes homogènes selon l’axe 1 :
Groupe 1 : Constitué des veaux qui ont un poids au sevrage important et un poids à la naissance faible et un âge au sevrage
moyen.
Groupe 2 : Constitué des veaux qui ont un poids au sevrage moyen et un poids à la naissance faible et un âge au sevrage
important.
Groupe 3 : Constitué des veaux qui ont un poids au sevrage moyennement faible et un poids à la naissance moyen et un âge au
sevrage très précoce.
Groupe 4 : Constitué des veaux qui ont un poids au sevrage faible et un poids à la naissance important et un âge au sevrage
moyen.
 Répartition des sous-groupes

Biplot (axes F1 et F2 : 73,16 %)


2 annais
M96227

1,5 M96229M96228

M96226
H95139
1
H95137 H95136
H95138
H95135
0,5
M96230
H92008
F2 (34,36 %)

poisev
-0,5
H92006
M92p1o0n4a H92009
-1
agesev 1 M9210
H92007
M9M92102
-1,5 2103

-2 M92100

-2,5
-2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2
F1 (38,80 %)

Variables activesHMVariables supplémentaires

Selon le graphe il appart qu’on peut plus décomposer les groupes principaux en 8 sous-groupes en divisant les 4 groupes
principales selon l’axe 1 en 2 sous-groupes selon l’axe 2 donc on va avoir :
Groupe 1 : Constitué des veaux qui ont un poids au sevrage important et un poids à la naissance faible et un âge au sevrage
moyen, avec l’année de naissance plus récente.
Groupe 2 : Constitué des veaux qui ont un poids au sevrage important et un poids à la naissance faible et un âge au sevrage
moyen, avec l’année de naissance plus ancienne.
Groupe 3 : Constitué des veaux qui ont un poids au sevrage moyen et un poids à la naissance faible et un âge au sevrage
important, avec l’année de naissance plus récente.
Groupe 4 : Constitué des veaux qui ont un poids au sevrage moyen et un poids à la naissance faible et un âge au sevrage
important, avec l’année de naissance plus ancienne.
Groupe 5 : Constitué des veaux qui ont un poids au sevrage moyennement faible et un poids à la naissance moyen et un âge au
sevrage très précoce, avec l’année de naissance plus récente.
Groupe 6 : Constitué des veaux qui ont un poids au sevrage moyennement faible et un poids à la naissance moyen et un âge au
sevrage très précoce, avec l’année de naissance plus ancienne.
Groupe 7 : Constitué des veaux qui ont un poids au sevrage faible et un poids à la naissance important et un âge au sevrage
moyen, avec l’année de naissance plus récente.
Groupe 8 : Constitué des veaux qui ont un poids au sevrage faible et un poids à la naissance important et un âge au sevrage
moyen, avec l’année de naissance plus ancienne.

11
10. Contributions des observations (%)

F1 F2 F3

H92006 0,851 1,860 6,393


H92007 1,934 5,683 0,090
H92008 14,700 0,040 20,274

H92009 9,981 3,155 0,003


H95135 15,537 0,792 0,462
H95136 7,361 2,344 4,269

H95137 10,957 2,173 2,933


H95138 0,465 1,496 0,382

H95139 0,018 4,226 1,175


M92100 0,685 18,574 13,089
M92101 10,513 4,100 0,380

M92102 2,138 7,795 0,301


M92103 2,723 8,944 0,032
M92104 7,079 3,499 13,010

M96226 2,802 5,050 0,939


M96227 0,908 12,356 2,881

M96228 4,687 8,646 3,074


M96229 3,091 9,092 1,698

M96230 3,571 0,176 28,615

Selon le tableau on observe que les individus H92008, H95135, H95137 et M92101 contribues à la formation de l’axe 1.
Ainsi les individus M92100 et M96227 contribues en majorité à l’axe 2.

12
CONCLUSION

En conclusion, ce travail réalisé dans le cadre du cours d'analyses multidimensionnelles a permis d'approfondir

nos connaissances théoriques en mettant en pratique les concepts abordés. Cet concret d'analyse en

composantes principales présenté illustre la pertinence de ces méthodes dans la compréhension et

l'interprétation de données complexes. Grâce à cette expérience, j’ai pu consolider mes compétences dans le

domaine et développer une perspective plus approfondie sur l'application des analyses multidimensionnelles.

13

Vous aimerez peut-être aussi