Vous êtes sur la page 1sur 10

Filière 

: productions animals et pastoralisme

Analyses Multidimensionnelle des


données
Méthode de classification

Réalisé par : Encadré par :


EL HARNOUNI DRISS Pr. FAGROUD
EL FAKIR AMINE
ZEGZOUTI ANISSE
GHAFRI BOUBKER
Année académique 2019 /2020

Sommaire
INTRODUCTION 4

I. OBJECTIF DE L’ETUDE 5

II. MÉTHODOLOGIE DE TRAVAIL 5

III. ANALYSE DES DONNÉES 6

1) STATISTIQUES DESCRIPTIVES 6
2) MATRICE DE PROXIMITÉ (DISTANCE EUCLIDIENNE) 7
3) STATISTIQUES DES NŒUDS : 7
4) DIAGRAMME DES NIVEAUX 8
5) DENDROGRAMME 8
6) DÉCOMPOSITION DE LA VARIANCE POUR LA CLASSIFICATION OPTIMALE 10
7) BARYCENTRES DES CLASSES : 10
8) OBJETS CENTRAUX DES CLASSES: 11
9) PROFIL DES CLASSES 12

CONCLUSION 13

ANNEXES 14
Remerciements

Je tiens tout d’abord avant d’introduire ce modeste


rapport à Remercier notre professeur Monsieur
FAGROUD Mustapha qui n’a jamais cesser d’efforts de
nous fournir les informations nécessaires pour une très
bonne maitrise des notions et principes de base de
l’Analyse Multidimensionnelle des Données.

Ainsi que pour ses recommandations et son aide le plus


remarquable tout au long du cours afin de réaliser notre
travail dans les meilleures conditions.
Introduction

Les méthodes d’analyses traitées dans le cadre de notre cours sont assez
nombreuses dont la classification ascendante hiérarchique qui a pour objet de
regrouper les points en classes de telle sorte que les données d’une même classe
soient les plus similaires possibles.
Cette méthode d’analyse procède par fusions successives de clusters déjà
existants, à chaque fois les deux clusters qui vont fusionner sont ceux dont la
distance est la plus faible.la question donc est de trouver une bonne définition de
la distance entre deux groupes de points moyennant des règles de calcul .ces
règles sont choisies de façon à avoir des inerties interclasses supérieurs à celles
d’intra-classes.
I- Objectif de l’Etude

A Partir des 60 enquêtes réalisées durant la période de l'étude, 56 ont


été retenues et ensuite analysées. En ce qui concerne les variables,
L’étude a porté sur plusieurs variables quantitatives mais uniquement 9
variables ont été choisies pour une meilleure représentativité. Les variables
retenues sont alors : Superficie totale (S. Totale), Superficie agricole utile (SAU),
Superficie agricole utile en Bour (SAU Bour). Superficie des Céréales (S.
Céréales), Superficie des Légumineuses, Superficie des Plantes aromatiques,
Superficie des Cultures fourragères, Effectif Bovin, et Effectif Ovin.

II- Présentation des résultats et interprétations

1- La matrice de corrélations

Le tableau suivant représente la matrice de corrélation entre les différents variables

s. SAU SAU. Sup. Sup. Sup. Sup. C. Eff. Eff.Ovi


total (ha) Bour céréal plantes Fourragèr Bovi n
Légumineus
e (ha) es aromatiqu es n
es (ha)
es

s. totale 1 0.99 0.98 0.940 0.769 0.415 0.386 0.39 0.237


5 0 9

SAU (ha) 0.99 1 0.98 0.956 0.747 0.378 0.332 0.36 0.188
5 7 6

SAU. Bour 0.98 0.98 1 0.961 0.755 0.375 0.327 0.36 0.170
(ha) 0 7 9

Sup. 0.94 0.95 0.96 1 0.681 0.170 0.178 0.22 0.114


céréales 0 6 1 2

Sup. 0.76 0.74 0.75 0.681 1 0.526 0.637 0.52 0.443


9 7 5 9
Légumineus
es (ha)

Sup. plantes 0.41 0.37 0.37 0.170 0.526 1 0.659 0.67 0.370
aromatique 5 8 5 0
s

Sup. C. 0.38 0.33 0.32 0.178 0.637 0.659 1 0.73 0.610


Fourragères 6 2 7 0
Eff. Bovin 0.39 0.36 0.36 0.222 0.529 0.670 0.730 1 0.330
9 6 9

Eff.Ovin 0.23 0.18 0.17 0.114 0.443 0.370 0.610 0.33 1


7 8 0 0

D’après ce tableau, on constate une corrélation positive entre toutes les variables.

On remarque que l’effectif des bovins et celui des ovins sont fortement corrélés à la superficie des
cultures fourragère, avec un coefficient de corrélation (r), soit respectivement r=0.730 ; 0.610.

La matrice de corrélation montre aussi qu’il y’a une forte corrélation entre les variables superficie
totale et superficie des céréales, entre variables SAU et SAU Bour, entre SAU et superficie des
céréales, et entre SAU Bour et Superficie des céréales. Et en générales, les autres corrélations sont
faibles ou moyennes.

2- Valeurs propres et variabilité des axes

Selon le tableau 12, on remarque que l’axe F1 constitue à lui seul 59.945% de la variance
totale. Quant à l’axe F2, il représente 22.604%, de la variance totalisant ainsi un pourcentage de
82.549% avec l’axe F1.

Uniquement l’axe F1 et F2 qui présentent des valeurs propres supérieurs à 1, pour cela on a
retenu ces deux axes pour l’interprétation.

F1 F2 F3 F4 F5 F6 F7 F8 F9

Valeur 5.395 2.034 0.750 0.357 0.256 0.163 0.029 0.014 0.003
propre

% 59.945 22.604 8.331 3.964 2.843 1.811 0.318 0.152 0.031


varianc
e

% 59.945 82.549 90.881 94.845 97.688 99.499 99.817 99.969 100.000


cumulé

3- Contribution des variables La contribution des variables dans la formation des différents
axes, est représentée dans le tableau suivant :
Tableau. La contribution des variables

F1 F2 F3 F4 F5 F6 F7 F8 F9

S.Totale (Ha) 16.351 4.822 0.001 0.477 1.536 2.314 30.062 4.428 40.009

SAU 15.717 6.757 0.026 0.431 1.733 1.550 14.519 0.725 58.542

SAU Bour 15.634 6.937 0.116 0.168 0.755 0.530 6.247 68.429 1.185
(Ha)

Sup. Céréales 12.814 13.809 0.637 0.859 1.272 0.003 45.132 25.248 0.191

Sup. 14.671 0.404 1.711 1.760 53.053 27.773 0.619 0.001 0.008
Légumineuse
s (Ha)

Sup. Plantes 6.906 14.788 15.015 59.615 0.072 0.151 2.475 0.977 0.000
aromatiques

Sup. C. 7.497 22.435 0.281 8.893 7.960 51.936 0.900 0.052 0.047
fourragères

Eff. Bovin 7.097 15.114 19.574 25.554 19.935 12.682 0.039 0.004 0.000

Eff. Ovin 3.313 14.934 62.602 2.243 13.684 3.061 0.007 0.137 0.019

Le tableau ci-dessus indique que l'axe F1 est très significativement lié aux variables de taille :
Superficie totale, la SAU, la SAU Bour et la Superficie des légumineuses, avec respectivement
16,351%; 15,717% ;15,634% et 14,671%. Alors que l'axe F2 est formé par la Superficie des céréales, la
Superficie des plantes aromatiques, la Superficie des Cultures fourragères, l'Effectif des Bovins, et
l'Effectif des Ovins, avec respectivement 13,809%, 14,788%, 22,435%, 15,114%, et 14,934%, et donc
on peut dire que F2 est plus lié au système de production animale.

4- Cercle des corrélations :

Le cercle de corrélation sert à visualiser la relation existante entre les variables et les deux
composantes principales retenues F1 et F2
Après avoir projeté les différentes exploitations sur le plan F1-F2 (figure 29) on rejoint nos
conclusions de terrain durant la phase des enquêtes. Nous avons distingué quatre types
d'exploitations distincts.
Vu la difficulté de distinction entre les groupes qui sont homogènes sur la figure 30, une Classification
Ascendante Hiérarchique a été réalisée pour mieux visualiser les groupes homogènes.

5- Classification Ascendante Hiérarchique (CAH):

En visant une meilleure interprétation la méthode de classification repose sur la notion de similarité
ou de dissimilarité (distance) entre les objets que l'on souhaite regrouper en classes homogènes. On
est donc souvent conduit à manipuler des tableaux de distance.

1.1 Statistiques des nœuds


a. Diagramme des niveaux

Ce diagramme des niveaux montre l'hétérogénéité des groupes construits. Dans ce diagramme on a
beaucoup de nœuds sont créés à des niveaux très bas et les derniers regroupements ont lieu à des
niveaux avancés.

b. Dendrogramme :

Le dendrogramme est utilisé pour illustrer l'arrangement des groupes générés par un regroupement
hiérarchique.

Le dendrogramme, ou arbre hiérarchique, montre non seulement les liaisons entre les classes, mais
aussi la hauteur des branches nous indique leur niveau de proximité.

Le dendrogramme nous donne la composition des différentes classes, ainsi que l'ordre dans lequel
elles ont été formées.
D'après le dendrogramme, On constate qu’on peut regrouper les individus en trois groupes
homogènes, Le tableau suivant présente l'effectif des individus formant chacun des groupes.

Tableau. Effectif des agriculteurs par classe (C)

Classe (groupe C1 C2 C3
homogènes)

Effectif des 82% 14% 4%


agriculteurs en %

Donc à partir de l’ACP et la CAH, on peut conclure que les agriculteurs de la région sont classés en
trois groupes homogènes :

Groupe 1 : Système de production à SAU réduite consacrée aux céréales, aux légumineuses et
fourrages.

Groupe 2: Système de production à base des cultures céréalière et élevage des bovins.

Groupe 3: Grandes exploitations céréalières.

Vous aimerez peut-être aussi