Académique Documents
Professionnel Documents
Culture Documents
Vous aurez en gnral besoin des outils mathmatiques et statistiques toutes les tapes de ltude, en recherche applique, en tude de cas, dans lapplication. Dans tous ces domaines, les mathmatiques et les statistiques sont utiles voire indispensables. Ce cours na pas la prtention dtre un cours de math ou de stat, cest juste un rappel ou une illustration doutils et de connaissances de bases quil est utile de connatre dans le cadre de filires professionnelles ou recherche en gosciences et environnement. Ce petit bric--brac est trs disparate, incomplet, htrogne et mal fait, mais il essaye de faire le tri des outils les plus frquemment employs dans notre domaine et il volue rapidement. Les outils mathmatiques et statistiques sont utiles lors de : *) la conception du dispositif dacquisition de linformation: - loi des grands nombres (nombre suffisant pour effectuer des statistiques ou pour avoir des donnes reprsentatives) - chantillonnage : technique dchantillonnage, reprsentativit - tude de la structure de la variance (split-plot, disposition en blocs (i.e. 1 paramtre + axe spatial) ou en carr latin (i.e. deux paramtres)) - tude de la structure temporelle: frquence minimale de lchantillonnage (cas de suivi de la qualit de leau des rivires). - tude de la structure spatiale: densit minimale de lchantillonnage sur le terrain (cas de donnes destines ltablissement de cartes) - et bien dautres encore *) lInterprtation des donnes: - test dhypothses - tude de relations simples entre les paramtres - tude de relations complexes entre les paramtres - reprsentation simple dune information apparemment complexe du fait du nombre de paramtres par les tudes factorielles telles que ACP, AFC ou autres. - distinction ou ressemblance entre groupes (Analyse discriminante, classification automatique) *) la modlisation: - ajustement de paramtres pour le calage (moindres carrs, tude des rsidus, test de sensibilit,..) - comparaison de ladquation entre rsultats et ralit. En rsum, pour un travail srieux, il faudra utiliser tout un panel doutils mathmatiques et statistiques.
DIVERSITE DES APPROCHES STATISTIQUES - Statistiques univaries : moyenne, cart type, coefficient de variation, histogramme (minimum, maximum, mdiane, quartiles, dciles) , modalit, distance simple entre deux groupes, distance multiple entre deux groupes. Classification automatique (exemple de classification ascendante non supervise). Test de comparaisons de donnes (Xhi2,) et test dhypothses - Statistique descriptive classique : croisement des donnes, croisement de deux donnes quantitatives, croisement dune donne quantitative avec une indicatrice - Analyse de donnes : donnes multivaries. ACP : quels sont les groupes et quelles sont les sources de variabilit? AFC : que caractrise chaque groupe ? Analyse factorielle discriminante : o passe la frontire ? - Donnes spatiales ou temporelles: Gostatistiques et chrono- statistiques : Il sagit dautres branches des statistiques, trs importantes pour la conception des plans exprimentaux. Elles seront tudies en dtail en M2.
RAPPELS STATISTIQUES UNE VARIABLE: OU COMMENT VALORISER CE QUE VOUS SAVEZ POUR LA MODELISATION? I Rappel sur notions de base vus au lyce et lors de premires annes universitaires: - Comportement type (ou le plus reprsentatif ou le plus frquent) du groupe: Pour une srie de donnes, plusieurs descriptifs sont utiliss ; ils ont la mme nature mais ne sont pas identiques et pas quivalents. * la moyenne Pour n individus et une variable x Moyenne = mx = (somme xi)/n do somme(xi)=n*mx (qui sera utilis pour le calcul de V(x)) et donc (somme(xi)-mx)=0 Il est possible de centrer la variable x en la remplaant par la variable (x-mx) * la mdiane: la mdiane mdiane spare un histogramme en deux parties de mme surface. Il y autant de mesures prsentant des valeurs infrieures la mdiane, que de valeurs suprieures cette dernire. La mdiane est facilement dtermine partir de lhistogramme des frquences cumules. Elle correspond alors la valeur donnant une frquence cumule de 0.5 (ou 50% du cumul des individus) * la classe modale Cest la valeur la plus frquente. Remarque : Dans le cas de distribution symtriques, mdiane et moyenne sont identiques. Dans le cas de distribution dissymtriques, elles sont frquemment diffrentes (mais pas obligatoirement). - Ecart la moyenne ou dispersion: tendue, quantiles, variance, cart type: Comme pour le comportement type, plusieurs notions de mme nature mais diffrentes sont utilises. Etendue Quantiles : dciles et quartiles Elimination des valeurs extrmes (non reprsentativit, prsomption daberration, autre raison) : premier/dernier dcile ou premier/dernier quartile. Plus reprsentatif que ltendue. Variance et Ecart type Sigma carr x = Var(x) = cov(x,x) = E(x-mx) = E(x-mx)(x-mx) Il est possible de calculer plus facilement V(x) : V(X) = somme (xi-m)/n = (somme(xi) -2somme(m*xi) + somme (m))/n V(x)=(somme(xi)2m* somme(xi) + 2m*n*m -2m*n*m + somme (m) )/n
V(x)=(somme(xi)+2m(somme(xi)-n*m) -2m*n*m + n*m))/n V(x) = (somme (xi)-2*m*n+n*m)/n V(x) = (somme(xi)- nm)/n V(x) = somme(xi)/n m Enfin : V(x)= moyenne des (xi)- (moyenne des (x)) Remarques : Moyenne et cart type ont les mmes units que les variables: il est difficile de comparer lorsque lon a plusieurs types de paramtres avec des units diffrentes. coefficient de variation (normalisation des variables pour faciliter la comparaison) C.V.= sigmax/mx exprim en pourcent II Applications: En matrisant bien ces notions de base, il est dj possible de faire un grand nombre de choses intressantes. application 1: simulateur de climat o intrt en gosciences (fonctions dentre pour hydrologie et hydrogologie). Le comportement moyen ne permet pas dexpliquer lentre deau vers les nappes en situation de climat sec. o conception o comparaison avec la ralit application 2: classification automatique ascendante non supervise. notion de distance simple d (1 paramtre): normalisation notion de distance multiparamtres D= somme des di (plusieurs variables): de lintrt de la normalisation dmarche de classification ascendante non supervise. La dmarche, la reprsentation des rsultats, la lecture de graphique. A voir ultrieurement : application 3: dispositifs en blocs ou en carrs latins objectifs de ces dispositifs moyennes et carts types par lignes et par colonnes comparaison de lcart des moyennes partielles et de la variabilit totale
POUR DEUX VARIABLES: Pour n individus et deux variables: x et y. Au mme titre qu lon dfinit la variance pour une variable : V(x)=E(x-mx)*(x-mx), on peut dfinir la covariance pour deux variables x et y: Covariance: cov(x,y) = E((x-mx)*(y-my)) aussi not sigmaxy Signification de la covariance Remarques V(x)=Cov(x,x) Cov(x,y)=Cov(y,x) Cov(x,y)= sigmaxy = E((x-mx)*(y-my)) Finalement: Cov(x,y)=E(xy)-mx*my Avec E(xy)=(somme xi*yi)/N
Corrlation linaire simple (une seule variable explicatrice) On dispose de mesures avec deux variable x et y sur n points. Variable explique et variable explicatrice On tudie la rgression de y comme fonction de x. ATTENTION!!!! Ceci ne veut pas dire que y est provoque par x. Il est fortement possible que y et x dpendent dune mme variable, dun mme processus qui induit des variation simultanes de y et de x. Lorsque lon se familiarise avec la rgression linaire, lexprience montre que lon a toujours tendance oublier cet avertissement et on a tendance attribuer x le variations de y en terme de consquence de cause effet, c' est--dire en terme de mcanisme. Cest bien sur une erreur. La mthode des moindres carrs. Mthode : minimisation du carr des carts entre les valeurs y mesures et les valeurs y dune droite. On suppose que la relation qui lie y x est de type linaire. La valeur estime de y, y est. = a*x+b La valeur mesure y mes. n mesures (n individus) Notion de rsidu : Lcart entre la valeur estime et la valeur mesure est le rsidu. Pour viter que les carts positifs et ngatifs ne se compensent, on utilise le carr de lcart. Pour lensemble des points, Rsidu = somme des |y mesur y estim | Cest la variance non explique par lestimation. Cette notion de rsidu et assez gnrale et touche de nombreux domaines. Elle permet dtudier lorigine dun cart entre les rsultats dun modle (ou prdiction) et les donnes mesures. Les moindres carrs. La mthode des moindres carrs vise minimiser le rsidu. Dans la figure suivante, le schmas linaire de prdiction de la relation liant y x est reprsent par la droite n noir. Les mesures sont les points bleus. Les carts en y sont reprsents rouge. La mthode de minimisation du carr des carts vise dterminer lquation de la droite qui minimisera la somme des longueurs de carts (somme des carrs des longueurs des segments rouges).
coefficient de dtermination, Le coefficient de dtermination reprsente la part de variance explique dans la variance totale. En utilisant les carrs des carts, on dfinit: SCT (somme des carts totaux) SCT= somme (yi mesurs my) = somme | yi mesurs my| Somme des carts expliqus SCE= somme (yi estims- my) = somme |yi estims- my| Les rsidus sont reprsents par somme |yi mesurs- yi estims| R=SCE/SCT ; Ainsi, si on considre donc la corrlation de y fonction de x, not Ry/x, il vient: Rxy=sigmaxy/(sigmax*sigmay) Y = ay/x * X + by/x Remarque 1: les coefficients a et b de la droite y=ax+b La droite dajustement par les moindres carrs passe par le centre de gravit du nuage (mx,my).
Par ailleurs, on peut dterminer les coefficients a et b de la droite. Comme il sagit de la rgression de y fonction de x on les note : ay/x et by/x ay/x = ((sommme(x-mx)(y-my))/(somme(x-mx)) et donc by/x=my-(ay/x*mx) Remarque 2: comparaison entre les corrlation y/x et x/y corrlation linaire de X/Y : On minimise le carr des carts en x reprsents en rouge sur la figure suivante. x=ax/y * y + bx/y Rx/y=Ry/x Mais la droite de corrlation est diffrente. Donc la corrlation y/x et la corrlation x/y ne donnent pas les mmes rsultats, sauf en terme de coefficient de corrlation, c' est--dire la part de variance explique par un modle linaire.
Corrlation X/Y: y= 2x - 0.28
12 10 8 6 4 2 0 0 1 2 3 X 4 5 6
et donc b=mx-ax/y*my Remarque 3: Avec lhabitude, la corrlation linaire devient un rflexe. On lapplique avant mme de se proccuper si le modle linaire est le bon modle pour la corrlation liant y x (ou x y ce qui est quivalent). Il faut bien sur avant tout se poser la question de la pertinence du modle linaire. Si le modle le plus adapt nest pas linaire, on ne peut pas trouver de coefficient de corrlation proche 1 (en valeur absolue). La corrlation linaire peut malgr tout tre utilis aprs linarisation. On tudie par exemple log (y) / x ou bien log(y)/log(x) ou y/log(x).
Rgression multiple. Ici nous avons - une variable explique note y - et plusieurs variables explicatrices: x1, x2,. Mme remarque pour la corrlation linaire simple, il ny a pas forcment de lien de cause effet entre y et les x1, x2, Avec mx1, mx2, mx3 correspondent aux moyennes des variables x1, x2, x3, Le modle linaire peut scrire : yi estim = a1*(x1i mx1) + a2* (x2i-mx2) + a3 *(x3i-mx3) + . On cherche donc trouver les valeurs a1, a2, qui minimisent le rsidu Rsidu = somme |(yi mesurs yi estims)| c' est--dire Rsidu = somme |(yi mesurs (a1*(x1i-mx1) + a2*(x2i-mx2) +..)| Le principe est le mme que pour une corrlation simple avec une variable explique et une variable explicatrice. Par exemple pour deux variables explicatrices les donnes peuvent tre ranges dans un tableau du type : Y y1 y2 y3 X1 X2
a a1 a2 Y=Xa + e (cart) X= [1, x1, x2] On estime a par : A= [X.X]-1 Xy Avec XX= N Somme de x1 Somme des x2 et Xy= Somme des y Somme des x1y Somme des x2y Somme des x1 Somme des x1 Somme des x2.x1 Somme des x2 Somme des x1.x2 Somme des x2
ACP
12 10 8 6 4 2 0 0 1 2 3 X 4 5 6
ACP
12 10 8 6 4 2 0 0 2 4 6 X 8 10 12
1) Matrice des corrlations et matrice des covariances Lorsque lon dispose de la mesure de nombreux paramtres pour chaque individu, il est possible de calculer le coefficient de corrlation ou bien la covariance de chaque couple de paramtres. Les rsultats sont alors rangs en deux tableaux carrs de m lignes sur m colonne (pour m paramtres). En mathmatique ces objets sapplent des matrices. Ces matrices sont symtriques car cov(x,y) = cov(y,x) et Rx/y = Ry/x La matrice des corrlations prsente une diagonale principale constitue de 1 car toute variable est parfaite corrl elle-mme (Rxx=1). Intrt et limites de ltude de la matrice des corrlations. Lintrt principal de cette matrice est la visualisation de lensemble des corrlations (positives ou ngatives) ou de labsence de corrlation des paramtres entre eux. Lorsque lon dispose dune matrice de corrlation, il est important de dtecter les couples de paramtres fortement corrls (ou fortement anti-corrls entre eux). Il arrive que lon puisse mettre ainsi en vidence un groupe de paramtres pour lesquels chaque paramtre appartenant cet ensemble est relativement bien corrl tout autre paramtre de ce mme ensemble. Ce sont donc des groupes de paramtres dont les variations sont probablement lies une unique cause. Dans lexemple de matrice des corrlations prsent plus loin, les paramtres suivants: Alcalinit, K, Ca et CE( conductivit lectrique) et MES sont tous relativement bien corrls entre eux. La limite principale provient du manque de lisibilit lorsque le nombre de paramtres est lev, il est difficile davoir une vision synthtique de lensemble, ce que permet par exemple le recours lACP
CE CE temperature Alc pH K Na Ca Mg Cl SO4 F MES 1.000 -0.575 0.986 0.759 0.986 -0.427 0.994 0.675 -0.659 0.755 0.125 0.959
temperature Alc -0.575 1.000 -0.676 -0.854 -0.672 0.885 -0.639 0.139 0.866 0.025 0.325 -0.434
pH 0.986 -0.676 1.000 0.823 0.995 -0.551 0.998 0.563 -0.750 0.645 0.044 0.921 0.759 -0.854 0.823 1.000 0.809 -0.712 0.803 0.142 -0.832 0.276 -0.232 0.658
K 0.986 -0.672 0.995 0.809 1.000 -0.558 0.994 0.559 -0.751 0.648 0.051 0.918
Na -0.427 0.885 -0.551 -0.712 -0.558 1.000 -0.503 0.326 0.910 0.233 0.425 -0.273
Ca 0.994 -0.639 0.998 0.803 0.994 -0.503 1.000 0.604 -0.719 0.693 0.083 0.942
Mg 0.675 0.139 0.563 0.142 0.559 0.326 0.604 1.000 0.023 0.938 0.470 0.754
Cl -0.659 0.866 -0.750 -0.832 -0.751 0.910 -0.719 0.023 1.000 -0.091 0.247 -0.542
SO4 0.755 0.025 0.645 0.276 0.648 0.233 0.693 0.938 -0.091 1.000 0.472 0.847
F 0.125 0.325 0.044 -0.232 0.051 0.425 0.083 0.470 0.247 0.472 1.000 0.185
MES 0.959 -0.434 0.921 0.658 0.918 -0.273 0.942 0.754 -0.542 0.847 0.185 1.000
2) Analyse en Composantes Principales Soient : n individus caractriss par m paramtres (ou m variables) ACP ralise sur la matrice des corrlations (matrice carre dordre m) ACP centre : variables centres sur les moyennes Minimisation de linertie rsiduelle (diffrent de minimisation de la somme du carr des carts en x ou des carts en y). Pour lACP, minimisation de linertie rsiduelle (projection orthogonale). Recherche des valeurs propres et des vecteurs propres de la matrice des corrlations. - Les valeurs propres permettent de mesurer le pourcentage de variance explique par chaque factoriel. - Les vecteurs propres permettent de visualiser la contribution de chaque paramtre laxe factoriel. Les individus peuvent tre caractriss par leur position sur laxe factoriel. Ace titre, laxe factoriel peut tre utilis en gosciences comme un macro paramtre qui cumule linformation redondante plusieurs paramtres. La contribution des paramtres laxe factoriel facilite la comprhension de la source de variabilit exprime par cet axe. Pour cela, on apportera une attention importante aux paramtres ayant une forte contribution positive ou ngative. etc. Second axe factoriel est orthogonal au premier, le troisime aux deux premiers,
Le premier plan factoriel port le premier axe factoriel en abscisse et le second axe factoriel en ordonne. Il constitue une projection de lhyperespace sur le plan qui permet de visualiser la maximum de variabilit. Le pourcentage de variance reprsent sur ce premier plan factoriel est donc gal la somme des pourcentages de variance ports par les deux premiers axes. On reprsente donc le premier plan factoriel, le second, Lexprience montre que pour les gosciences, lorsquun axe ne porte quune faible partie de la variance totale, par exemple moins de 10 pourcents, linterprtation de la signification de la source de variabilit porte par laxe est difficile. ACP ralise sur la matrice des covariances Le principe est le mme que pour lACP ralise avec la matrice des corrlations, mais ici les variables ne sont pas normalises, ce qui rend les rsultats sensibles au choix des units retenues pour exprimer les rsultats. Les paramtres exprims avec de petits chiffres vont quasiment disparatre de lanalyse factorielle. Aussi, faut-il tre prudent pour recourir ce genre dACP. Il vaut mieux commencer par une ACP base sur la matrice des corrlations et utiliser lACP sur matrice des covariances pour attnuer ou liminer la contribution de certains paramtres, prcisment ceux qui sexpriment avec de petites valeurs. Intrt et Limites de lACP Intrt - visualisation dun maximum dinformation synthtique - sparation des diffrentes sources de variabilit
- hirarchisation des diffrentes sources de variabilit Les limites. Sur chaque plan factoriel on peut visualiser soit les individus soit les variables mais on ne peut pas superposer les deux figures. Il est difficile de caractriser les groupes dindividus dindividualisant dans les plan factoriels avec les paramtres qui les caractrisent. Cette limite est leve lorsque lon ralise une Analyse Factorielle des Correspondances.
Exemple de distribution de la variance selon les diffrents axes factoriels. Ici, deux axes factoriels portent lessentiel de la variance.
1.00 0.75 0.50 Axe factoriel n 2 0.25 0.00 -0.25 -0.50 -0.75 -1.00
-1.00
Cl
temperature Na F
-0.75
-0.50
-0.25
0.00
0.25
0.50
0.75
1.00
0.5 0.4 0.3 Axe factoriel n 2 0.2 0.1 0.0 -0.1 -0.2 -0.3
Cl
Axe factoriel n 1
MES CE K Ca Alc
pH
-0.2
-0.1
0.2
0.3
0.4
2 Axe factoriel n 2 1 -0 -1 -2 -3 -4
16 18 17 19 15
35 34 40 39 36 37 38 41 42 52 51 49 50 43 45
32 30 33
44 46 48 47
-3
-2
-1 0 1 Axe factoriel n 1
Position des individus dans le premier plan factoriel On distingue nettement plusieurs groupes de points. Groupe des individus119 auquel on rattache 53 Groupe des individus de 20 29 Groupe des individus de 31 42 Groupe des individus de 43 52
VP1
VP2
VP3
VP4
VP5
VP6
VP7
VP8
VP9
VP10
VP11
VP12
0.839 0.170 0.115 0.040 -1.041 -0.251 0.018 -0.225 -0.051 -0.097 -0.048 -0.291
-0.593 0.161 0.096 0.688 -0.612 0.504 -0.074 0.156 -0.678 0.310 0.033 -0.111
0.363 -0.410 -0.043 0.014 -0.052 0.182 -0.006 0.542 0.450 -0.115 0.347 0.438
0.032 -0.955 0.359 0.492 0.091 0.405 0.480 -0.885 0.762 -0.387 -0.046 -0.052
0.199 0.314 0.153 0.029 0.691 0.528 -0.903 -0.045 -0.258 -0.807 0.042 -0.062
0.267 -0.002 0.477 -0.065 0.191 0.662 0.808 0.522 -0.678 -0.965 -0.024 -0.180
-0.409 0.628 -1.500 -0.304 -0.172 0.237 0.643 -0.358 0.158 -0.434 -0.041 -0.557
-0.186 0.340 -0.012 -0.313 -0.365 0.151 0.102 0.340 -0.386 -0.022 0.481 0.629
-0.071 0.203 -0.246 0.555 0.070 -0.607 -0.218 -0.981 0.506 -0.543 -0.362 0.050
-0.356 -0.349 0.131 -0.691 -0.138 -0.581 -0.024 0.212 0.253 0.308 -0.135 0.420
-0.026 -0.518 -0.091 -0.073 0.211 -0.548 -0.173 -0.193 -0.309 -0.112 0.856 -0.782
-0.132 0.651 0.278 0.776 -0.025 -0.272 0.237 0.285 0.657 -0.576 0.495 0.694
2) Analyse Factorielle des Correspondances Il sagit dune analyse factorielle comme pour lACP, mais le mode de conditionnement des donnes est diffrent. Les calculs ne sont pas bass sur la matrice des corrlations ni sur celle de covariances, mais sur un tableau de contingence. Individu 1 Individu 2 Total Paramtre 1 X11 X12 X1. Paramtre 2 X21 X22 X2. .. Total X.1 X.2 X..
On effectue une normalisation par rapport aux lignes et par rapport aux colonnes, ce qui revient normaliser par rapport la somme des valeurs du tableau. Comme on normalise de la mme manire les individus et les variables, ces deux entres du tableau jouent le mme rle . ce qui permettra de reprsenter individus et paramtres qui les caractrisent sur la mme figure de plan factoriel. Individu 1 Individu 2 Total Paramtre 1 x11 = X11/X.. x12 = X12/X.. x1.= X1./X.. Paramtre 2 x21= X21/X.. x22=X22/X.. x2.=X2./X.. .. Total x.1=X.1/X.. x.2=X.2/X.. x..=X../X..=1
Ce type de normalisation donne beaucoup de poids aux variables qui sexpriment avec des chiffres importants, un peu comme pour lACP effectue sur la matrice des covariances. Ensuite, on effectue une recherche des valeurs propres et des vecteurs propres de la matrice. Les valeurs propres permettent daccder au pourcentage de variance reprsent par chaque axe factoriel, et les vecteurs propres indiquent la contribution de chaque variable laxe factoriel. Lorsquune des variables sexprime avec des valeurs trs grandes par rapport aux autres variables, le premier axe factoriel ne reprsente que cette variable et tous les points sont aligns sur cet axe lorsque lon cherche visualiser le premier plan factoriel. LAFC minimise linformation porte par les variables qui sexpriment avec de petites valeurs.
vecteur propre 1 2 3 4 5 6 7 8 9 10 11 12
variance explique pourcentage valeur propre (%) cumul 0.00015 0.5 0.5 0.00105 3.5 4.0 0.00005 0.2 4.1 0.00010 0.3 4.5 0.00001 0.0 4.5 0.00001 0.0 4.5 0.00001 0.0 4.6 0.00001 0.0 4.6 0.00000 0.0 4.6 0.00003 0.1 4.7 0.00000 0.0 4.7 0.02884 95.3 100.0
Exemple de rsultat AFC avec des variables htrognes quant aux units.
CE temperature Alc pH K Na Ca Mg Cl SO4 F MES V.Propre1 V.Propre2 V.Propre3 V.Propre4 V.Propre5 V.Propre6 V.Propre7 V.Propre8 V.Propre9 V.Propre10 V.Propre11 V.Propre12 0.99775224 2.30E-02 -4.63E-03 9.99E-03 0 1.51E-03 -0.00426463 2.41E-03 2.41E-03 0 0 7.44E-02 5.97E-02 0.54033761 5.69E-02 -0.43949702 0 -0.0652328 5.24E-02 -2.96E-02 -2.96E-02 0 0 -0.89770737 -1.32E-03 2.20E-02 0.99795219 9.54E-03 0 1.44E-03 -4.08E-03 2.30E-03 2.30E-03 0 0 7.12E-02 3.35E-02 -0.15910663 3.19E-02 0.88846059 0 -3.66E-02 2.94E-02 -1.66E-02 -1.66E-02 0 0 -0.51344987 0 0 0 0 1 0 0 0 0 0 0 0 5.29E-03 -2.51E-02 5.04E-03 -1.09E-02 0 0.9973221 4.65E-03 -2.62E-03 -2.62E-03 0 0 -8.11E-02 -1.22E-03 0.02030756 -1.16E-03 8.81E-03 0 1.33E-03 0.9982563 2.13E-03 2.12E-03 0 0 6.58E-02 6.88E-04 -1.15E-02 6.56E-04 -4.98E-03 0 -7.51E-04 6.05E-04 0.99944353 -1.20E-03 0 0 -3.72E-02 6.88E-04 -1.15E-02 6.56E-04 -4.98E-03 0 -7.51E-04 6.05E-04 -3.41E-04 0.99944394 0 0 -3.72E-02 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 -5.12E-02 1.01472411 -4.87E-02 0.38179094 0 5.60E-02 -4.49E-02 2.53E-02 2.53E-02 0 0 0.4268525
2) Fonction discriminante et Analyse Discriminante Le but est ici diffrent. Il sagit de trouver quelle est la combinaison de variables qui peut permet de sparer les individus qui appartiennent des groupes diffrents. On cherche dterminer une relation entre les paramtres dont la valeur permet de discriminer au mieux les individus des diffrents groupes. Les donnes ncessaires sont du mme type que pour lACP et lAFC, savoir un tableau de donnes croisant les individus et les paramtres qui caractrisent ces derniers, mais il faudra un second type de donnes, lui aussi sous forme de tableau, concernant laffectation un groupe. Individu1 Individu2 Individu3 Param1 0.123 0.234 0.214 Param2 12.2 51.6 50.2 Param3 0.0010 0.0025 0.0030 Groupe1 0 1 1 Groupe2 1 0 0