Vous êtes sur la page 1sur 46

Analyse discriminante

Michel Tenenhaus

Les objectifs de lanalyse discriminante


tude dun tableau IndividusVariables :

Les individus sont dcrits par p variables X1,, Xp.

Les individus sont rpartis en k classes selon les


modalits dune variable qualitative Y.
Rechercher des variables discriminantes Zh,
combinaisons linaires des Xj, non corrles entre
elles, et sparant au mieux les k classes (analyse
factorielle discriminante).
Affecter une nouvelle observation une des classes
en fonction de ses valeurs de X observes (analyse
discriminante bayesienne).
2

Exemple : Qualit des vins de Bordeaux


Variables observes sur 34 annes (1924 - 1957)
TEMPERATURE : Somme des tempratures
moyennes journalires
SOLEIL
: Dure dinsolation
CHALEUR : Nombre de jours de grande chaleur
PLUIE
: Hauteur des pluies
QUALITE DU VIN : Bon (1), Moyen (2), Mdiocre (3)

Les donnes

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

Temprature
3064
3000
3155
3085
3245
3267
3080
2974
3038
3318
3317
3182
2998
3221
3019
3022
3094
3009
3227
3308
3212
3361
3061
3478
3126
3458
3252
3052
3270
3198
2904
3247
3083
3043

Soleil
1201
1053
1133
970
1258
1386
966
1189
1103
1310
1362
1171
1102
1424
1230
1285
1329
1210
1331
1366
1289
1444
1175
1317
1248
1508
1361
1186
1399
1259
1164
1277
1195
1208

Chaleur
10
11
19
4
36
35
13
12
14
29
25
28
9
21
16
9
11
15
21
24
17
25
12
42
11
43
26
14
24
20
6
19
5
14

Pluie
361
338
393
467
294
225
417
488
677
427
326
326
349
382
275
303
339
536
414
282
302
253
261
259
315
286
346
443
306
367
311
375
441
371

Qualit
2
3
2
3
1
1
3
3
3
2
1
3
3
1
2
2
2
3
2
1
2
1
2
1
2
1
2
3
1
1
3
1
3
3

Analyse univarie
Temprature

3600
3500

Report

3400

Temprature
Mean
3306.36
3140.91
3037.33
3157.88

Std. Deviation
92.06
100.05
69.34
141.18

11
11
12
34

Measures of Association
Temprature * Qualit

Eta
.799

Eta Squared
.639

3300
3200
3100

Temprature

Qualit
1
2
3
Total

Between Groups
Within Groups
Total

2900
2800
N=

ANOVA Table

Temprature * Qualit

3000

(Combined)

Rapport de corrlation = 2

Sum of
Squares
420067.4
237722.1
657789.5

11

11

12

Bon

Moyen

Mdiocre

Qualit

df
2
31
33

Mean Square
210033.704
7668.456

F
27.389

Between Groups Sum of Squares


Total Sum of Squares

Sig.
.000

Analyse univarie
Soleil
1600

Report

1500

Soleil
Qualit
Bon
Moyen
Mdiocre
Total

Mean
1363.64
1262.91
1126.42
1247.32

N
11
11
12
34

1400

Std. Deviation
80.31
71.94
88.39
126.62

1300

1200

1100

Soleil

1000

Measures of Association

900
N=

Soleil * Qualit

Eta
.786

Eta Squared
.618

11

11

12

Bon

Moyen

Mdiocre

Qualit

ANOVA Table

Soleil * Qualit

Between Groups
Within Groups
Total

(Combined)

Sum of
Squares
326909.1
202192.4
529101.4

df
2
31
33

Mean Square
163454.535
6522.335

F
25.061

Sig.
.000

Analyse univarie
Chaleur
50

Report
40

Chaleur
Qualit
Bon
Moyen
Mdiocre
Total

Mean
28.55
16.45
12.08
18.82

Std. Deviation
8.80
6.73
6.30
10.02

11
11
12
34

30
12

20

Measures of Association

Chaleur

10

0
N=

Chaleur * Qualit

Eta
.705

Eta Squared
.497

11

11

12

Bon

Moyen

Mdiocre

Qualit

ANOVA Table

Chaleur * Qualit

Between Groups
Within Groups
Total

(Combined)

Sum of
Squares
1646.570
1664.371
3310.941

df
2
31
33

Mean Square
823.285
53.689

F
15.334

Sig.
.000

Analyse univarie
Pluie
800

Report

700

Pluie

600

Qualit
Bon
Moyen
Mdiocre
Total

Mean
305.00
339.64
430.33
360.44

N
11
11
12
34

Std. Deviation
52.29
54.99
104.85
91.40

500

400

300

Pluie

200

Measures of Association

100
N=

Pluie * Qualit

Eta
.594

Eta Squared
.353

11

11

12

Bon

Moyen

Mdiocre

Qualit

ANOVA Table

Pluie * Qualit

Between Groups
Within Groups
Total

(Combined)

Sum of
Squares
97191.170
178499.2
275690.4

df
2
31
33

Mean Square
48595.585
5758.039

F
8.440

Sig.
.001

Analyse factorielle discriminante


Recherche de la premire variable discriminante
On recherche une premire variable discriminante centre
p

Z1 a10 a1jX j
j1

sparant au mieux les k classes.


On recherche des a1j conduisant une variable Z1 ayant un F
ou, de manire quivalente, un 2 maximum dans lanalyse
de la variance de Z1 sur le facteur Y dfinissant les classes.
On choisit comme normalisation une variance intra-classes
de Z1 gale 1.

Calcul des variables discriminantes


sur les donnes dorigine
Canonical Discriminant Function Coefficients
Function
Temprature
Soleil
Chaleur
Pluie
(Constant)

.009
.007
-.027
-.006
-32.876

.000
-.005
.128
.006
2.165

Unstandardized coefficients

Z1 = .009*Temprature + .007*Soleil - .027*Chaleur


- .006*Pluie - 32.876
10

Normalisation
Chaque X est centre et normalise par lcarttype
commun aux classes (racine-carre du carr moyen
intra-classes) :
X1

Temprature 3157.88
7668.456

X2

Soleil 1247.32
6522.335

X3

Chaleur 18.82
53.689

X4

Pluie 360.44
5758.039

11

Calcul des variables discriminantes sur les


donnes normalises
Standardized Canonical
Discriminant Function Coefficients
Function
Temprature
Soleil
Chaleur
Pluie

.750
.547
-.198
-.445

-.004
-.430
.935
.469

Z1 = .750*X1 + .547*X2 - .198*X3 - .445*X4


12

Analyse de la variance de Z1 sur la qualit


Report

Qualit
Bon
Moyen
Mdiocre
Total

Mean
2.12
.15
-2.08
.00

N
11
11
12
34

Discriminant Scores from Function 1 for Analysis 1

Discriminant Scores from Function 1 for Analysis 1


Std. Deviation
1.19
.89
.90
2.00

Measures of Association
Eta
Discriminant Scores
from Function 1 for
Analysis 1 * Qualit

.875

Eta Squared
.766

-2

-4

-6
N=

11

11

12

Bon

Moyen

Mdiocre

Qualit

ANOVA Table

Discriminant Scores
from Function 1 for
Analysis 1 * Qualit

Between Groups
Within Groups
Total

(Combined)

Sum of
Squares
101.645
31.000
132.645

df
2
31
33

Mean Square
50.822
1.000

F
50.822

Sig.
.000

13

Analyse factorielle discriminante


Recherche de la deuxime variable discriminante
On recherche une deuxime variable discriminante centre
et non corrle Z1
p

Z2 a 20 a 2 jX j
j1

sparant au mieux les k classes.


On recherche des a2j conduisant une variable Z 2 ayant un
F ou, de manire quivalente, un 2 maximum dans
lanalyse de la variance de Z 2 sur le facteur Y dfinissant
les classes.
On choisit comme normalisation une variance intra-classes
de Z2 gale 1.
14

Analyse de la variance de Z2 sur la qualit


Discriminant Scores from Function 2 for Analysis 1

Report
Discriminant Scores from Function 2 for Analysis 1
Qualit
Bon
Moyen
Mdiocre
Total

Mean
.27
-.51
.22
.00

N
11
11
12
34

Std. Deviation
.96
1.02
1.02
1.03

Measures of Association
Eta
Discriminant Scores
from Function 2 for
Analysis 1 * Qualit

.349

Eta Squared
.122

-1

-2

-3
N=

11

11

12

Bon

Moyen

Mdiocre

Qualit

ANOVA Table

Discriminant Scores
from Function 2 for
Analysis 1 * Qualit

Between Groups
Within Groups
Total

(Combined)

Sum of
Squares
4.296
31.000
35.296

df
2
31
33

Mean Square
2.148
1.000

F
2.148

Sig.
.134

15

Les deux variables


discriminantes

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

Variable
discriminante
Z1
-.88
-2.33
-.99
-2.73
.74
2.23
-2.75
-2.53
-3.73
1.13
2.17
-.36
-2.02
1.55
-.73
-.31
.34
-2.45
.79
2.41
1.14
3.54
-.55
3.18
.21
4.12
1.47
-1.68
2.17
.35
-2.10
.87
-1.09
-1.18

Variable
discriminante
Z2
-.87
-.09
.83
.25
1.72
.48
1.11
.24
2.11
1.37
-.04
1.36
-.54
-.53
-.79
-1.80
-1.56
.80
.16
-.46
-.82
-.93
-1.10
1.95
-1.28
1.22
.22
.23
-.49
.13
-1.49
-.05
-.98
-.34

16

Le premier plan discriminant


3

24

5
12

10

26

Variable discriminante Z2

18

6
48

28

30 19
32

27

34

Qualit

14 2920

13
15
1
33
23

-1

11

21

Group Centroids
22

Mdiocre

25
31

17

Moyen

16

-2

Bon
-4

-2

Variable discriminante Z1

17

Carte des
qualits
Symbols used in territorial map
Symbol
-----1
2
3
*

Group
----1
2
3

Label
-------------------Bon
Moyen
Mdiocre
Indicates
a group centroid

Les droites frontires


sont les mdiatrices
des segments joignant
les centres de gravit
des groupes

Territorial Map
Canonical Discriminant
Function 2
-6.0
-4.0
-2.0
.0
2.0
4.0

6.0
31

31

31

31

31

31
4.0

31

31

31

31

31

31
2.0

3221

32 21

32 21

32
21

32
21

*
32
21
*
.0

32
21

32
21

32
*
21

32
21

32
21

32
21
-2.0

32

21

32
21

32
21

32
21

32
21

32
21
-4.0

32

21

32
21

32
21

32
21

32
21

32
21
-6.0
32
21

-6.0
-4.0
-2.0
.0
2.0
4.0

6.0

6.0

Canonical Discriminant Function 1

18

Premier plan discriminant et carte des qualits


3
9

10

12

Variable discriminante Z2

24

26

18

6
48

28

19

30
13

-1
31

27
11

32
14

34

115
23

Qualit

29 20

21

Group Centroids

22

Mdiocre

25
17

33

Moyen

16

-2

Bon
-4

-2

Variable discriminante Z1

Une nouvelle observation est classe dans le groupe pour lequel


la distance entre lobservation et le centre du groupe est la plus faible.

19

Prvision de la qualit pour


une nouvelle anne (obs. 35)
Pour le Bordeaux 1958 :
Temprature = 3 000
Soleil = 1 100
Chaleur = 20
Pluie = 300
Prvoir sa qualit.

20

Case Summariesa

Prvision de la
qualit pour
une nouvelle
anne (obs. 35)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
Total

Observation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
35

a. Limited to first 100 cases.

Z1
-.88255
-2.32546
-.99486
-2.72686
.74360
2.23089
-2.74699
-2.53383
-3.73088
1.13041
2.17473
-.35666
-2.02108
1.55211
-.72946
-.30606
.34347
-2.45448
.78584
2.40988
1.13802
3.53529
-.55191
3.18211
.20968
4.11917
1.46680
-1.67615
2.16713
.35244
-2.10225
.87424
-1.09442
-1.18190
-2.02768
35

Z2
-.87154
-.09422
.83296
.24724
1.72117
.48432
1.10879
.23602
2.11364
1.36843
-.04282
1.36423
-.54262
-.53357
-.78920
-1.80302
-1.56328
.80177
.15937
-.46304
-.81821
-.93260
-1.09502
1.94567
-1.28127
1.22305
.21664
.22582
-.48896
.12658
-1.48623
-.04986
-.98466
-.33558
.56940
35

21

Prvision de la qualit pour


une nouvelle anne (obs. 35)
Canonical Discriminant Functions
3

35

Qualit
Group Centroids

Function 2

Ungrouped Cases
Mdiocre

-1

Moyen
-2

Bon
-4

-2

Function 1

22

Rsultats de lanalyse factorielle discriminante


Functions at Group Centroids

Group Statistics

Qualit
Bon

Moyen

Mdiocre

Total

Temprature
Soleil
Chaleur
Pluie
Temprature
Soleil
Chaleur
Pluie
Temprature
Soleil
Chaleur
Pluie
Temprature
Soleil
Chaleur
Pluie

Mean
3306.36
1363.64
28.55
305.00
3140.91
1262.91
16.45
339.64
3037.33
1126.42
12.08
430.33
3157.88
1247.32
18.82
360.44

Std. Deviation
92.06
80.31
8.80
52.29
100.05
71.94
6.73
54.99
69.34
88.39
6.30
104.85
141.18
126.62
10.02
91.40

Valid N (listwise)
Unweighted
Weighted
11
11.000
11
11.000
11
11.000
11
11.000
11
11.000
11
11.000
11
11.000
11
11.000
12
12.000
12
12.000
12
12.000
12
12.000
34
34.000
34
34.000
34
34.000
34
34.000

Function
Qualit
Bon
Moyen
Mdiocre

1
2.122
.146
-2.079

2
.272
-.513
.221

Unstandardized canonical discriminant


functions evaluated at group means

Z1 = Score prdictif
de la qualit du vin
construit partir des
variables mto.

23

Rsultats de lanalyse factorielle discriminante


Tests of Equality of Group Means

Temprature
Soleil
Chaleur
Pluie

Wilks'
Lambda
.361
.382
.503
.647

F
27.389
25.061
15.334
8.440

df1

df2
2
2
2
2

31
31
31
31

Sig.
.000
.000
.000
.001

Somme des carrs intra-classes (X)


Wilks ' Lambda =
1 2
Somme des carrs totale (X)

24

Rsultats de lanalyse factorielle discriminante


s = Nombre maximum de variables discriminantes = k-1
Eigenvalues
Function
1
2

Eigenvalue % of Variance
3.279a
95.9
.139a
4.1

Cumulative %
95.9
100.0

Canonical
Correlation
.875
.349

= Eta

a. First 2 canonical discriminant functions were used in the


analysis.

Somme des carrs inter-classes (Z h )


2
Eigenvalue

Somme des carrs intra-classes (Zh ) 1 2

25

Test en analyse factorielle discriminante


(donnes multinormales)
Wilks' Lambda
Test of Function(s)
1 through 2
2

Wilks'
Lambda
.205
.878

Chi-square
46.712
3.828

df
8
3

Sig.
.000
.281

Test 1 through s (ici s=2)


Test :

H0 : 1 = = s = 0 (au niveau de la population)


H1 : au moins 1 > 0

Statistique : Wilks Lambda = (1-12)...(1-s2)


Dcision : On rejette H0 au risque si
s
1

n 1 (p k) ln (1 h2 ) 12 p(k 1)
2

h 1
2

26

Test m through s
Test : H0 : m = = s = 0 (au niveau de la population)
H1 : au moins m > 0
Statistique : Wilks Lambda = (1-m2)...(1-s2)
Dcision : On rejette H0 au risque si
s
1

n 1 (p k) ln (1 2h ) 12 (p m 1)(k m)
2

h m
2

27

Corrlation intra-classes entre les X et les Z


k

cor(X, Z | Qualit)

ni

(x
i 1 j1

ni

(x
i 1 j1

ij

ij

x i )(z ij zi )

xi )

ni

(z
i 1 j1

ij

zi ) 2

Structure Matrix
Function
Temprature
Soleil
Chaleur
Pluie

.724*
.701*
.525
-.398

.584
-.176
.780*
.421*

Pooled within-groups correlations between discriminating


variables and standardized canonical discriminant functions
Variables ordered by absolute size of correlation within function.
*. Largest absolute correlation between each variable and
any discriminant function

28

Visualisation dune corrlation intra-classes

Z
** *
* **

** *
* **
* ** *
* * **
* * **

*******
*** ***
* ****

Pluie
Corrlation
globale positive

Corrlation
intra-classes
ngative

Pluie

29

Analyse discriminante bayesienne


Hypothses de base :
1) Donnes multinormales
2) Dispersion des donnes identiques dans chaque classe
La probabilit quune observation provienne de la classe
Y = h sachant que X = x = (x1,, xp) peut scrire :
P(Y h | X x)

egh (x)
k

g h (x )

h 1

avec des fonctions de classification gh(x) de la forme :


gh(x) = bh0 + bh1X1+ + bhpXp
o les X sont les variables dorigine.

30

Les fonctions de classification gh(x)


Elles sont calcules ici en supposant les 3 qualits
a priori quiprobables :
Classification Function Coefficients

Temprature
Soleil
Chaleur
Pluie
(Constant)

Bon
.818
.154
-7.010
-.046
-1350.819

Qualit
Moyen
.801
.145
-7.056
-.040
-1285.420

Mdiocre
.782
.126
-6.903
-.022
-1212.706

Fisher's linear discriminant functions

31

Calcul des
probabilits de
chaque qualit
pour chaque
anne

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

Qualit
Moyen
Mdiocre
Moyen
Mdiocre
Bon
Bon
Mdiocre
Mdiocre
Mdiocre
Moyen
Bon
Mdiocre
Mdiocre
Bon
Moyen
Moyen
Moyen
Mdiocre
Moyen
Bon
Moyen
Bon
Moyen
Bon
Moyen
Bon
Moyen
Mdiocre
Bon
Bon
Mdiocre
Bon
Mdiocre
Mdiocre

Proba.
d'appartenance
au Groupe "Bon"
.007
.000
.010
.000
.643
.933
.000
.000
.000
.756
.892
.087
.000
.622
.011
.014
.062
.000
.379
.905
.367
.984
.014
.997
.059
.999
.714
.001
.852
.196
.000
.383
.004
.004

Proba.
d'appartenance au
Groupe "Moyen"
.668
.045
.311
.015
.328
.066
.008
.023
.000
.237
.107
.513
.113
.377
.723
.923
.920
.018
.606
.095
.630
.016
.823
.003
.912
.001
.284
.135
.148
.755
.176
.606
.580
.414

Proba.
d'appartenance au
Groupe "Mdiocre"
.325
.955
.679
.985
.029
.000
.992
.977
1.000
.007
.000
.400
.886
.001
.266
.063
.018
.982
.015
.000
.004
.000
.163
.000
.029
.000
.002
.864
.000
.049
.824
.011
.416
.582

Groupe prdit
Moyen
Mdiocre
Mdiocre
Mdiocre
Bon
Bon
Mdiocre
Mdiocre
Mdiocre
Bon
Bon
Moyen
Mdiocre
Bon
Moyen
Moyen
Moyen
Mdiocre
Moyen
Bon
Moyen
Bon
Moyen
Bon
Moyen
Bon
Bon
Mdiocre
Bon
Moyen
Mdiocre
Moyen
Moyen
Mdiocre

32

Qualit de la prvision
Qualit * Groupe prdit Crosstabulation
Count

Qualit

Total

Bon
Moyen
Mdiocre

Groupe prdit
Bon
Moyen
Mdiocre
9
2
2
8
1
2
10
11
12
11

Total
11
11
12
34

33

Validit de la qualit de la prvision


value par Jack-knife
Classification Resultsb,c

Original

Count

Cross-validated a

Count

Qualit
Bon
Moyen
Mdiocre
Bon
Moyen
Mdiocre

Predicted Group Membership


Bon
Moyen
Mdiocre
9
2
0
2
8
1
0
2
10
7
4
0
2
8
1
0
2
10

Total
11
11
12
11
11
12

a.
Cross validation is done only for those cases in the analysis. In cross validation,
each case is classified by the functions derived from all cases other than that case.
b. 79.4% of original grouped cases correctly classified.
c. 73.5% of cross-validated grouped cases correctly classified.

34

Prvision de la qualit pour


une nouvelle anne
Pour le Bordeaux 1958 :
Temprature = 3 000
Soleil = 1 100
Chaleur = 20
Pluie = 300
Prvoir sa qualit.

35

Analyse discriminante bayesienne sur les


variables discriminantes Z1, Z2
La prdiction de la qualit du vin laide des territoires
de qualit construits sur le plan discriminant (Z1, Z2)
est quivalente la prdiction de la qualit obtenue
par analyse discriminante bayesienne des variables
discriminantes (Z1, Z2).

36

Analyse discriminante
bayesienne sur les
variables discriminantes
Z1, Z2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

Qualit
observe
Moyen
Mdiocre
Moyen
Mdiocre
Bon
Bon
Mdiocre
Mdiocre
Mdiocre
Moyen
Bon
Mdiocre
Mdiocre
Bon
Moyen
Moyen
Moyen
Mdiocre
Moyen
Bon
Moyen
Bon
Moyen
Bon
Moyen
Bon
Moyen
Mdiocre
Bon
Bon
Mdiocre
Bon
Mdiocre
Mdiocre

Qualit
prdite
Moyen
Mdiocre
Mdiocre
Mdiocre
Bon
Bon
Mdiocre
Mdiocre
Mdiocre
Bon
Bon
Moyen
Mdiocre
Bon
Moyen
Moyen
Moyen
Mdiocre
Moyen
Bon
Moyen
Bon
Moyen
Bon
Moyen
Bon
Bon
Mdiocre
Bon
Moyen
Mdiocre
Moyen
Moyen
Mdiocre

Prob(BON)
.007
.000
.010
.000
.643
.933
.000
.000
.000
.756
.892
.087
.000
.622
.011
.014
.062
.000
.379
.905
.367
.984
.014
.997
.059
.999
.714
.001
.852
.196
.000
.383
.004
.004

Prob(MOYEN)
.668
.045
.311
.015
.328
.066
.008
.023
.000
.237
.107
.513
.113
.377
.723
.923
.920
.018
.606
.095
.630
.016
.823
.003
.912
.001
.284
.135
.148
.755
.176
.606
.580
.414

Prob(MEDIOCRE)
.325
.955
.679
.985
.029
.000
.992
.977
1.000
.007
.000
.400
.886
.001
.266
.063
.018
.982
.015
.000
.004
.000
.163
.000
.029
.000
.002
.864
.000
.049
.824
.011
.416
.582

37

Deuxime exemple : les races canines


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

Race

Taille

Poids Vitesse

Intell.

Affect.

Agress.

Fonction

Beauceron
Basset
Berger-Allemand
Boxer
Bull-Dog
Bull-Mastiff
Caniche
Chihuahua
Cocker
Colley
Dalmatien
Doberman
Dogue Allemand
Epagneul Breton
Epagneul Franais
Fox-Hound
Fox-Terrier
Grd Bleu de Gascogne
Labrador
Lvrier
Mastiff
Pkinois
Pointer
Saint-Bernard
Setter
Teckel
Terre-Neuve

TA++
TATA++
TA+
TATA++
TATATA+
TA++
TA+
TA++
TA++
TA+
TA++
TA++
TATA++
TA+
TA++
TA++
TATA++
TA++
TA++
TATA++

PO+
POPO+
PO+
POPO++
POPOPOPO+
PO+
PO+
PO++
PO+
PO+
PO+
POPO+
PO+
PO+
PO++
POPO+
PO++
PO+
POPO++

INT+
INTINT++
INT+
INT+
INT++
INT++
INTINT+
INT+
INT+
INT++
INTINT++
INT+
INTINT+
INTINT+
INTINTINTINT++
INT+
INT+
INT+
INT+

AF+
AFAF+
AF+
AF+
AFAF+
AF+
AF+
AF+
AF+
AFAFAF+
AFAFAF+
AFAF+
AFAFAF+
AFAFAFAF+
AF-

AG+
AG+
AG+
AG+
AGAG+
AGAGAG+
AGAGAG+
AG+
AGAGAG+
AG+
AG+
AGAGAG+
AGAGAG+
AGAGAG-

Utilit
Chasse
Utilit
Compagnie
Compagnie
Utilit
Compagnie
Compagnie
Compagnie
Compagnie
Compagnie
Utilit
Utilit
Chasse
Chasse
Chasse
Compagnie
Chasse
Chasse
Chasse
Utilit
Compagnie
Chasse
Utilit
Chasse
Compagnie
Utilit

V++
VV++
V+
VVV+
VVV++
V+
V++
V++
V+
V+
V++
V+
V+
V+
V++
VVV++
VV++
VV-

38

Le tableau disjonctif complet


Race
TT+
T++
PP+
P++
VV+
V++
II+
I++
AfAf+
AgAg+ Compagnie
Chasse Utilit
__________ _____ _____ ______ _____ _____ ______ _____ _____ _____ _____ ______ _____ ______ ______ ______ _____ _________ ________ ________
Beauceron
Basset
Berger all
Boxer
Bull-dog
Bull Mastiff
Caniche
Chihuahua
Cocker
Colley
Dalmatien
Doberman
Dogue all
Epagneul br
Epagneul fr
Fox-Hound
Fox-Terrier
Grd Bl de G
Labrador
Lvrier
Mastiff
Pkinois
Pointer
St-Bernard
Setter
Teckel
Terre neuve

0
1
0
0
1
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0

0
0
0
1
0
0
0
0
1
0
1
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0

1
0
1
0
0
1
0
0
0
1
0
1
1
0
1
1
0
1
0
1
1
0
1
1
1
0
1

0
1
0
0
1
0
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0

1
0
1
1
0
0
0
0
0
1
1
1
0
1
1
1
0
1
1
1
0
0
1
0
1
0
0

0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
1
0
0
1

0
1
0
0
1
1
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
0
1
1

0
0
0
1
0
0
1
0
0
0
1
0
0
1
1
0
1
1
1
0
0
0
0
0
0
0
0

1
0
1
0
0
0
0
0
0
1
0
1
1
0
0
1
0
0
0
1
0
0
1
0
1
0
0

0
1
0
0
0
0
0
1
0
0
0
0
1
0
0
1
0
1
0
1
1
1
0
0
0
0
0

1
0
0
1
1
0
0
0
1
1
1
0
0
0
1
0
1
0
1
0
0
0
0
1
1
1
1

0
0
1
0
0
1
1
0
0
0
0
1
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0

0
1
0
0
0
1
0
0
0
0
0
1
1
0
1
1
0
1
0
1
1
0
1
1
1
0
1

1
0
1
1
1
0
1
1
1
1
1
0
0
1
0
0
1
0
1
0
0
1
0
0
0
1
0

0
0
0
0
1
0
1
1
0
1
1
0
0
1
1
0
0
0
1
1
0
1
1
0
1
1
1

1
1
1
1
0
1
0
0
1
0
0
1
1
0
0
1
1
1
0
0
1
0
0
1
0
0
0

0
0
0
1
1
0
1
1
1
1
1
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0

xijl = 1 si lindividu i possde la modalit l de la variable j


= 0 sinon

0
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
1
1
1
0
0
1
0
1
0
0

39

1
0
1
0
0
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
1
0
0
1
0
0
1

Analyse factorielle discriminante


Y = Fonction
X = variables indicatrices des caractristiques physiques et
psychiques des chiens
Canonical Discriminant Functions

Functions at Group Centroids

Function
fonction
compagnie
chasse
utilit

chasse

1
1.295
1.637
-3.461

2
-1.706
1.769
.143

Unstandardized canonical discriminant


functions evaluated at group means

utilit
0

fonction

Function 2

-1

Group Centroids

compagnie

utilit

-2

chasse

-3
-6

compagnie
-4

Function 1

-2

40

Premier plan discriminant


3
dobermann

grand bleu de gascogne

pointer

levrier

fox-hound

epagneul franais
setter
basset

bull-mastiff

dogue allemand

epagneul breton

mastiff
terre-neuve

labrador (chasse)

boxer

saint-bernard

dalmatien (compagnie)

berger allemand

-1

colley
beauceron

utilit

caniche

-2

Z2

fonction

chihuahua
pkinois
teckel

cocker
bull-dog

chasse

fox-terrier

-3
-6

Z1

compagnie
-4

-2

41

Variables discriminantes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

CHIEN
beauceron
basset
berger allemand
boxer
bull-dog
bull-mastiff
caniche
chihuahua
cocker
colley
dalmatien
dobermann
dogue allemand
epagneul breton
epagneul franais
fox-hound
fox-terrier
grd bleu de gasc
labrador
levrier
mastiff
pkinois
pointer
saint-bernard
setter
teckel
terre-neuve

Z1

Z2
-2.45
2.08
-3.46
.55
1.23
-5.60
1.74
1.96
1.52
-.55
2.45
-1.43
-3.61
1.44
2.74
.30
.85
1.57
2.45
2.20
-3.86
1.96
.47
-4.59
1.48
1.23
-2.69

-1.41
1.12
-.80
-.27
-2.41
.49
-1.94
-1.80
-2.42
-1.19
-.05
2.34
.06
.55
2.24
2.34
-2.76
2.63
-.05
2.56
.49
-1.80
2.56
-.12
1.95
-2.41
.10

42

Prvision de la fonction par calcul de la distance carre entre chaque chien et les
centre de gravit des classes dans le plan discriminant (Z 1, Z2)
Case Summariesa
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

CHIEN
beauceron
basset
berger allemand
boxer
bull-dog
bull-mastiff
caniche
chihuahua
cocker
colley
dalmatien
dobermann
dogue allemand
epagneul breton
epagneul franais
fox-hound
fox-terrier
grd bleu de gasc
labrador
levrier
mastiff
pkinois
pointer
saint-bernard
setter
teckel
terre-neuve
a. Limited to first 100 cases.

fonction
utilit
chasse
utilit
compagnie
compagnie
utilit
compagnie
compagnie
compagnie
compagnie
compagnie
utilit
utilit
chasse
chasse
chasse
compagnie
chasse
chasse
chasse
utilit
compagnie
chasse
utilit
chasse
compagnie
utilit

DCOMP
14.12
8.61
23.41
2.61
.50
52.29
.25
.45
.56
3.66
4.07
23.84
27.19
5.13
17.70
17.37
1.32
18.89
4.07
19.04
31.38
.45
18.89
37.14
13.43
.50
19.10

DCHASSE
26.81
.62
32.57
5.35
17.63
53.96
13.74
12.87
17.55
13.53
3.98
9.76
30.44
1.51
1.44
2.11
21.17
.75
3.98
.95
31.87
12.87
1.99
42.34
.06
17.63
21.47

DUTILIT
3.43
31.68
.89
16.24
28.56
4.68
31.40
33.20
31.40
10.26
34.99
8.94
.03
24.23
42.88
18.98
26.99
31.47
34.99
37.95
.28
33.20
21.29
1.34
27.65
28.56
.60

MIN
3.43
.62
.89
2.61
.50
4.68
.25
.45
.56
3.66
3.98
8.94
.03
1.51
1.44
2.11
1.32
.75
3.98
.95
.28
.45
1.99
1.34
.06
.50
.60

PREDICT
Utilit
Chasse
Utilit
Compagnie
Compagnie
Utilit
Compagnie
Compagnie
Compagnie
Compagnie
Chasse
Utilit
Utilit
Chasse
Chasse
Chasse
Compagnie
Chasse
Chasse
Chasse
Utilit
Compagnie
Chasse
Utilit
Chasse
Compagnie
Utilit

43

Analyse discriminante bayesienne


(sur les donnes dorigine transformes en indicatrices)
Classification Function Coefficients

TT+
PP+
VV+
II+
AfAg(Constant)

compagnie
.347
15.197
55.660
44.598
7.616
13.215
15.018
10.845
24.126
14.457
-44.558

fonction
chasse
2.399
18.732
57.844
53.851
8.999
14.656
15.611
9.080
35.742
15.871
-58.390

utilit
3.709
8.520
25.214
30.212
9.587
7.734
6.764
4.935
20.319
5.810
-18.913

Fisher's linear discriminant functions

Problme : Appliquer une mthode supposant la normalit


sur des donnes binaires !!!!
44

Prvision de la fonction dun chien


Case Summariesa

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

Probabilities
of
Membership
in Group 1
.00474
.01807
.00001
.79642
.99981
.00000
.99882
.99799
.99980
.95774

Probabilities
of
Membership
in Group 2
.00001
.98193
.00000
.20270
.00019
.00000
.00118
.00201
.00020
.00692

Probabilities
of
Membership
in Group 3
.99526
.00000
.99999
.00088
.00000
1.00000
.00000
.00000
.00000
.03534

CHIEN
beauceron
basset
berger allemand
boxer
bull-dog
bull-mastiff
caniche
chihuahua
cocker
colley

fonction
utilit
chasse
utilit
compagnie
compagnie
utilit
compagnie
compagnie
compagnie
compagnie

dalmatien

compagnie

.48859

.51141

.00000

dobermann
dogue allemand
epagneul breton
epagneul franais
fox-hound
fox-terrier
grd bleu de gasc
labrador
levrier
mastiff
pkinois
pointer
saint-bernard
setter
teckel
terre-neuve

utilit
utilit
chasse
chasse
chasse
compagnie
chasse
chasse
chasse
utilit
compagnie
chasse
utilit
chasse
compagnie
utilit

.00035
.00000
.14058
.00030
.00049
.99995
.00011
.48859
.00012
.00000
.99799
.00021
.00000
.00125
.99981
.00010

.39788
.00000
.85941
.99970
.99930
.00005
.99988
.51141
.99988
.00000
.00201
.99972
.00000
.99875
.00019
.00003

.60177
1.00000
.00001
.00000
.00022
.00000
.00000
.00000
.00000
1.00000
.00000
.00006
1.00000
.00000
.00000
.99987

a. Limited to first 100 cases.

Predicted
Group
utilit
chasse
utilit
compagnie
compagnie
utilit
compagnie
compagnie
compagnie
compagnie
chasse
utilit
utilit
chasse
chasse
chasse
compagnie
chasse
chasse
chasse
utilit
compagnie
chasse
utilit
chasse
compagnie
utilit

45

Prvision de la fonction dun chien


Classification Resultsb,c

Original

Count

Cross-validated a

Count

fonction
compagnie
chasse
utilit
compagnie
chasse
utilit
compagnie
chasse
utilit
compagnie
chasse
utilit

Predicted Group Membership


compagnie
chasse
utilit
9
1
0
0
9
0
0
0
8
90.0
10.0
.0
.0
100.0
.0
.0
.0
100.0
7
2
1
3
6
0
1
1
6
70.0
20.0
10.0
33.3
66.7
.0
12.5
12.5
75.0

Total
10
9
8
100.0
100.0
100.0
10
9
8
100.0
100.0
100.0

a. Cross validation is done only for those cases in the analysis. In cross validation, each
case is classified by the functions derived from all cases other than that case.
b. 96.3% of original grouped cases correctly classified.
c. 70.4% of cross-validated grouped cases correctly classified.

46