Vous êtes sur la page 1sur 5

5.

Analyse des résultats :

Traitement par R :

La prise en main des données ainsi que toutes les analyses réalisées dans ce rapport de recherche
furent effectuées à l’aide du langage de programmation et gratuiciel statistique R. Principalement
destiné aux statistiques et à la science des données, R est un langage et gratuiciel libre (dit «open-
source») refermant une riche quantité de librairie et de méthode statistique implémentées et
documentées. Pour les besoins du rapport, plusieurs librairies et fonctions ont été utilisées dont
principalement la librairie FactoMineR. En effet, la librairie FactoMineR porte sur l’analyse
exploratoire multidimensionnelle de données et permet entre autres d’effectuer des analyses en
composantes principales par sa fonction PCA et une classification ascendante hiérarchique HCPC. La
librairie factoextra) fut également utilisée apportant certains compléments graphiques à FactoMineR
ainsi que ggplot2 afin de réaliser les autres représentations graphiques. De plus, l’analyse
discriminante pas-à-pas a, quant à elle, été réalisée à l’aide de la fonction stepclass de la librairie
klaR. Plusieurs autres librairies comme caret et MASS ont été utilisées pour conduire différentes
analyses non retenues pour le rapport ou encore en complément de celles précédemment énoncées.

Présentation des résultats :

Dans cette partie, on voulait observer s’il existe une corrélation linéaire entre les variables
quantitatives dans notre base de données. C’est pour cela qu’on a utilisé une analyse de
composantes principales sur nos données quantitatives. Les variables quantitatives qu’on va utiliser
sont :

 Cellulose
 Hémicellulose
 Lignine
 Cendres
 Autres

culture ligno- nombre cellulose Hémicelluloses lignine cendres autres


cellulosique de (kg.100kg (kg.100kg-1MS) (kg.100kg- (kg.100kg
valeurs -1MS) 1MS) -1MS)
miscanthus 9 48,4 26,1 8,8 3,5 13,1
panic érigé 7 40,1 30,3 7,2 5,5 17
fétuque 26 34 25,2 4,3 9,6 27
sorgho fibre 16 29,7 25,1 3,2 9,5 32,5
mais fibre 21 26,3 23,8 3,4 5,4 41,1
dactyle-luzerne 9 27 12,9 4,3 9,4 46,4
chanvre 15 47,5 6,4 8 8,8 29,4
topinambour 14 36,5 1,2 10,1 10,9 41,3
consoude 4 22,4 9,6 6,9 14,2 46,9

Avant de procéder à une ACP, on a construit la matrice de corrélation qui représente les données sur
lesquelles on effectue l’ACP. La figure suivante représente les coefficients de corrélation entre les
variables analysées.
F1 F2 F3 F4 F5
nombre de valeurs -0,066 -0,604 -0,788 0,024 0,092
cellulose (kg.100kg-1MS) -0,807 0,475 -0,296 0,023 -0,189
hémicelluloses (kg.100kg- -0,626 -0,672 0,343 0,162 0,108
1MS)
lignine (kg.100kg-1MS) -0,247 0,934 -0,094 0,003 0,242
cendres (kg.100kg-1MS) 0,864 0,222 -0,084 0,443 -0,031
autres 0,961 -0,041 -0,027 -0,271 0,009

Dans la figure suivante, on a regroupé les valeurs propres et le pourcentage de la variance expliquée
cumulée associée à chacune des valeurs propres

F1 F2 F3 F4 F5 F6
Valeur 2,779 1,966 0,843 0,296 0,116 0,000
propre
Variabilité 46,311 32,774 14,048 4,941 1,926 0,000
(%)
% cumulé 46,311 79,085 93,133 98,074 100,000 100,000

Analyse des variables:

Représentation graphique des variables:

Contribution de chaque variable aux composantes:

La contribution d'une variable est en fait la contribution relative d'une variable à la variance
d'un axe. Les valeurs de cette statistique permettent de sélectionner les variables à interpréter
par rapport à leurs coordonnées factorielles, c'est-à-dire, leurs corrélations avec les axes
factoriels.

F1 F2 F3 F4 F5
nombre de valeurs 0,156 18,577 73,707 0,193 7,367
cellulose (kg.100kg-1MS) 23,410 11,490 10,363 0,176 30,903
hémicelluloses(kg.100kg- 14,109 22,997 13,962 8,868 10,175
1MS)
lignine (kg.100kg-1MS) 2,190 44,334 1,046 0,004 50,635
cendres (kg.100kg-1MS) 26,870 2,516 0,834 66,075 0,854
autres 33,265 0,086 0,089 24,684 0,066

On connait que Plus la contribution d'un individu sera importante et plus il aura de poids sur ce
facteur.

Qualité de la représentation d’une variable sur chaque composante :

F1 F2 F3 F4 F5
nombre de valeurs 0,004 0,365 0,621 0,001 0,009
cellulose (kg.100kg-1MS) 0,650 0,226 0,087 0,001 0,036
hémicelluloses(kg.100kg- 0,392 0,452 0,118 0,026 0,012
1MS)
lignine (kg.100kg-1MS) 0,061 0,872 0,009 0,000 0,059
cendres (kg.100kg-1MS) 0,747 0,049 0,007 0,196 0,001
autres 0,924 0,002 0,001 0,073 0,000

Analyse des observations (individus) :

Analyse des F1 F2 F3 F4 F5
observations
(individus)
miscanthus -3,035 0,924 0,476 -0,196 0,088
panic érigé -2,094 0,173 1,200 0,237 0,138
fétuque -0,305 -1,678 -1,258 0,827 0,168
sorgho fibre 0,321 -1,516 0,230 0,472 -0,287
mais fibre 0,253 -2,087 -0,252 -1,004 0,294
dactyle- 1,586 -0,300 0,692 -0,578 -0,436
luzerne
chanvre -0,511 1,470 -1,185 -0,057 -0,613
topinambou 1,117 2,031 -1,032 -0,224 0,468
r
consoude 2,669 0,985 1,128 0,522 0,180
Représentation graphique des observations :
Contribution de chaque observation aux composantes:

F1 F2 F3 F4 F5
miscanthus 36,839 4,825 2,985 1,434 0,739
panic érigé 17,539 0,168 18,975 2,099 1,831
fétuque 0,373 15,915 20,848 25,640 2,721
sorgho fibre 0,413 12,988 0,698 8,350 7,903
mais fibre 0,256 24,612 0,837 37,757 8,315
dactyle- 10,058 0,509 6,321 12,504 18,257
luzerne
chanvre 1,046 12,206 18,503 0,122 36,106
topinambou 4,990 23,300 14,048 1,877 21,023
r
consoude 28,486 5,477 16,786 10,216 3,104

Qualité de la représentation d’une variable sur chaque composante :

F1 F2 F3 F4 F5
miscanthus 0,891 0,083 0,022 0,004 0,001
panic érigé 0,740 0,005 0,243 0,009 0,003
fétuque 0,018 0,541 0,304 0,131 0,005
sorgho fibre 0,037 0,833 0,019 0,081 0,030
mais fibre 0,011 0,781 0,011 0,181 0,016
dactyle- 0,697 0,025 0,133 0,092 0,053
luzerne
chanvre 0,062 0,514 0,334 0,001 0,089
topinambou 0,186 0,615 0,159 0,007 0,033
r
consoude 0,737 0,100 0,132 0,028 0,003
Les résultats de l'analyse en composantes principales des teneurs des principaux constituants
chimiques des cultures lignocellulosiques sont illustrés par la représentation des individus et le
cercle des corrélations dans le plan formé par les première et deuxième composantes principales
des valeurs expérimentales. La représentation des individus montre que, d'après les teneurs des
principaux constituants chimiques, chaque espèce forme un groupe différencié, excepté dans le cas
du maïs fibre et du sorgho fibre. La dispersion importante des individus pour le groupe du chanvre
et du topinambour s'explique par une variabilité importante de la teneur en hémicelluloses due à la
faible teneur en hémicelluloses de ces cultures. L'analyse en composantes principales montre que
les espèces appartenant au groupe des dicotylédones sont séparées des monocotylédones
comméniloïdes de par leurs scores au niveau de la première composante principale.

D'après le cercle des corrélations dans le plan formé par la première et la deuxième composante
principale, la teneur en hémicelluloses, négativement corrélée avec cette première composante
principale, explique le clivage entre ces groupes. En effet, les dicotylédones ont des parois
cellulaires riches en pectines et pauvres en hémicelluloses par rapport aux monocotylédones
comméniloïdes, dont font partie les Poales, dont les parois cellulaires sont pauvres en pectines et
riches en hémicelluloses. Notons que le mélange « dactyle-luzerne » est un mélange de
monocotylédones comméniloïdes et de dicotylédone. D'après la représentation des échantillons
dans le plan formé par la première et la deuxième composante principale, cette culture est plus
proche des monocotylédones comméniloïdes que des dicotylédones, ce qui souligne la plus grande
richesse du mélange en dactyle qu'en luzerne.

Vous aimerez peut-être aussi