Académique Documents
Professionnel Documents
Culture Documents
ANALYSE
MULTIDIMENSIONNELLE
Gnralits
Statistiques classiques
Uni- ou bi-dimensionnelles
Statistiques multidimensionnelles = analyse
multivariable
Objets = lments
Longueur
Individu 1
Mesure 1,1
Individu 2
Mesure 2,1
Largeur
Masse
Longvit Fcondit
...
Variable p
Individu 3
...
Individu n
Mesure i,j
Mesure n,p
Analyse multivariable
O
O
Masse
it
nd
co
Masse
Lon
Longueur
r
u
e
g
r
a
L
Longueur
t
gvi
Types de mthodes
Analyse descriptive
Groupement (n variables) : recherche de discontinuits
(partitions) dans les ensembles de donnes
!
!
Buts
Matrices dassociation
Objets
Objets
Objets
Variables
Variables
Variables
Mode R :Variables X Variables
Dpendance
Bois
Peint
> 1 kg
Objet 1
Objet 2
Objet 3
Objet 4
S1 entre objets 1 et 2 :
S1 = 2/3 = 0,67
Matrice de similarit
Objet 1
Objet 2
Objet 3
Objet 4
Objet 1
Objet 2
Objet 3
Objet 4
0,67
0,33
0,67
0,33
1
Objet 2
Objet 1
1
S
=
(a
+
d)/(a
+
2b
+
2c
+
d)
2
S
=
(2a
+
2d)/(2a
+
b
+
c
+
2d)
3
S1 = (a + d)/(a + b + c + d)
S
=
a/(a
+
b
+
c)
7
Espce 1
Espce 2
Espce 3
Milieu 1
Milieu 2
Milieu 3
Milieu 4
Milieu 1
Milieu 2
Milieu 3
Milieu 4
Milieu 1
1
Milieu 2
0,5
Milieu 3
0,33
Milieu 4
1
0,5
0,33
1
Equivalent
asymtrique
de
S
3
S8 = 2a/(2a + b + c)
! sp 1
Milieu 1
sp 2
sp 3
sp 4
sp 5
sp 6
70
83
64
64
!
Milieu 2
Minima
!
!
!
82
S17
= W/((A + B)/2) = 2W/(A + B)
Ex : S17 = (2 X 76)/(83 + 82) = 0,921
76
Fcondit
Fcondit
Parasite 1
25
70
Parasite 2
12
30
P1
70
D1
30
Taille (mm)
P2
12
Taille
25
2
2
D1(P1,P2) = ((T1 - T2) + (F1 - F2) )
2
2
= ((25 - 12) + (70 - 30) )
= 42,1
D1
Y1
Y2
...
Yi
X1
Y11
Y21
Yi1
X2
Y12
Y22
Yi2
= ((yi1 - yi2) )
Problmes :
D
est
sensible
au
double-zro
1
D
est
sensible
lchelle
des
variables
1
D2 = (1/n)D1
D3 borne 2
Espce 2
Echantillon 1
D3
D4
Echantillon 2
Espce 1
Distance
de
Bray-Curtis
(D
)
=
1
S
14
17
Coefficients de dpendance
(Mode R)
Variables
Variables
Objets
Variables
S
1
S
S
S
S
S
Matrice de dispersion
ou de variance-covariance
Variables
Variables
r
1
1
1
Matrice de corrlation
3
1
1
de Spearman
de Kendall
2
Le
Tableau de contingence
Exemple
Htes
Parasites
Espce 1
Espce 1
x
Espce 3
x
Espce 2
Espce 3
Espce 2
x
x
x
x
2
Mesure dassociation :
Variable 1
Variable 2
x
x
Modalit 2
Modalit i
x
x
x
x
Groupements
1
Une partition est une division de l'ensemble en sousensembles, telle que chaque objet (ou descripteur)
appartienne une et une seule sous-collection
Grandes familles de
mthodes de groupement
1. Algorithmes squentiels ou simultans
2. Agglomration ou division
3. Mthodes monothtiques ou polythtiques
4. Mthodes hirarchiques ou non
5. Mthodes probabilistes ou non
Exemple
On
obtiendrait
exactement
la
mme
chose
avec
S
17
0.1
0.2
0.3
0.4
0.5
0,2
0,25
0,3
0,35
0,4
0,45
0,5
0,6
0,7
0,8
Paires formes
1-2
1-3
3-4
2-4
2-3
1-4
2-5
3-5
4-5
1-5
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0,2
0,25
0,3
0,35
0,4
0,45
0,5
0,6
0,7
0,8
Paires formes
1-2
1-3
3-4
2-4
2-3
1-4
2-5
3-5
4-5
1-5
0.1
0.2
0.3
0.4
0.5
0.0
0.1
0.2
0.3
0.4
0.5
1
2
3
4
5
1
2
3
4
5
0.6
0.7
0.8
Connexit = 0,5
0.0
1
2
3
4
5
0.1
0.2
0.3
0.4
0.5
Objets
0,2
0,25
0,45
0,8
0,4
0,35
0,5
0,3
0,6
0,7
2
1
3
4
5
1-2
0,325
0,65
0,3
0,6
0,7
0,3625 0,65
3-4
0,65
5
4
0.0
0,4
1-2
3
1-2-3-4
5
0,65
-
0.1
0.2
0.3
0.4
0.5
0.6
WPGMA
Idem UPGMA mais avec pondration selon le
nombre dlments dans le groupe
Groupement centrode
UPGMC et WPGMC
Comme UPGMA et WPGMA mais en utilisant une
moyenne gomtrique plutt quarithmtique :
centrode (= barycentre, point de coordonnes
moyennes)
Interprtation : polytomie
0.0
1
2
3
4
5
0.1
0.2
0.3
0.4
0.5
UPGMC
10
4
A
B
8
6,32
6
4
9,40
2
0
D
Mthode de Ward
Hirarchique
Sur donnes brutes ou matrices de distance
Minimise la somme des carrs des distances au centrode
de chaque groupe (variance l'intrieur de chaque
groupe) si applique aux donnes brutes, ou la somme
des carrs des distances entre paires si applique
une matrice de distance
K-means
Non hirarchique
Mthode divisive
Nombre de groupes dfini par l'utilisateur
Minimise la variance intragroupe des
donnes brutes
La matrice cophntique
1
1
r et le coefficient de
La corrlation cophntique
dtermination
2
r
Exemple
Corrlation cophntique r : 0,89
2
Coefficient de dtermination r : (0,89) = 0,79 donc
2
Exemples
Le nuage de points
r = -0,3
r=0
r=1
Axes principaux
Masse
Axe Principal 1
Axe Principal 2
Longueur
Ha
ut
eu
Axe Principal 1
1 = 50 %
u2
u1
Axe Principal 2
2 = 30 %
Nombre de composantes
interprtables
>
Bton bris
Diagramme de Shepard
moyen
35
30
Alatoire
Observ
25
20
15
10
5
0
1
Valeurs propres
10
Diagramme de Shepard
Axe 2
+++
+
Axe 1
Axe 1
+
++ +
+
Analyse en composantes
principales (ACP)
espace multidimensionnel complexe, dans un sousespace plus simple, pour observer graphiquement les
relations entre les objets
Reprsentation graphique
Objets
Cercle de rayon 1
Entre une variable i et un axe descripteur k, labscisse
V1
rV1,I
Rsum
Variables
Individus
II
u norms :
angles
=
corrlations
u norms 1 :
proximits
=
distances
Biplot
Variables
= descripteurs
Individus
= objets
II
Exemples
Analyse factorielle de
correspondances (AFC)
Stations
Trucus
S1
Frquence 1,1
S2
Frquence 2,1
Machinus
Bidulus
...
Exempla
S3
...
S4
Frquence i,j
Frquence n,p
Non affecte par le problme du double-zro
Suppose une relation unimodale avec les variables
2
Prserve la distance du entre les points
environnementales
Frquences absolues
= fi
= fi
=f
=1
Frquences relatives
Q
Frquences relatives centres
Inertie totale = I =
On peut effectuer un test dindpendance des
deux variables
2
= npI avec np = effectif total
H
:
quelle
que
soit
la
station,
la
distribution
des
0
2
Test du , avec (n-1)(p-1) degrs de libert
Frquence relative du
site 8 pour lespce 11 :
raret ce site
Espce 4
Frquence relative de
lespce 3 au site 5 :
occurrence forte
Espce 2
Site 5
Espce 11
Espce 9
Site 8
Espce 3
Site
12
Site 9
Site 2
Espce 19
Type I
Type II
Exemple
Descripteurs
= espces
II
Sites
Espces
Objets =
stations
Analyse discriminante
Analyse discriminante linaire, gnralement
But : trouver la meilleure combinaison de variables
Test de Mantel
Statistique Z de Mantel
A
A
x
.....
+X
+
Test
1. Permutation alatoire des objets (A-D)
2. Calcul dun nouveau Z : Zp
3. Rptition n fois (ex : 999) des tapes 1 et 2
4. Ajout de la valeur observe Z aux 999 valeurs de
Zp
5. Trac de la distribution : histogramme de
frquences
6. H0 est rejete si Z fait partie des valeurs
extrmes (ex : 5%)
r = [ 1/(n-1)]
[ (x
i
ij -
x)/s x] (y i j - y)/s y
Exemple
Deux
matrices
de
distances
entre
4
sites
(S
-S
)
1 4
Distances
en
terme
dabondances
despces
(D
)
14
Distances
environnementales
(D
),
sur
la
base
de
1
Matrice de distances D1
S
0,17 0,39
0,22 0,6
0,66
0,71
Calcul du Z de Mantel
Z = (0,25 x 0,43) + (0,43 x 0,41) + (0,55 x 0,47) +
Permutations (Z
Observ
Z
1,2823
<Z
95
Proba (z)
=Z
>Z
0,05
r
0,7982
Permutations
<r
95
=r
2
Proba (r)
>r
3
0,05