Académique Documents
Professionnel Documents
Culture Documents
1
Métrologie et chimiométrie
Système qualité
Validation
Test de
Qualification Traçabilité Fiabilité conformité
3
CHIMIOMETRIE GÉNÉRALITÉS
La chimiométrie est la science de l’utilisation des
méthodes mathématiques, statistiques et
informatiques qui visent à extraire l’information
utile présente dans des données de mesures
chimiques (Geladi, 1995). Le terme français de
chimiométrie est issu de
l’anglais "chemometrics". La paternité de ce mot
est attribuée au suédois Wold (1974) et à
l’américain Kowalski (1975).
Stockage Calibration
Dosage
Réduction
Validation
Détection Description
5
MÉTROLOGIE ET CHIMIOMÉTRIE
La métrologie jour plusieurs rôles dans cette
évolution
A la suite d’accord internationaux, une part
croissante des barrières douanières sont
remplacées par des normes tatillonnes qui
demandent un nombre de plus en plus important
de mesures ( physiques ou chimiques).
Ces normes permettent d’établir des frontières
entre les industriels indépendamment des états
A l’intérieur de celles-ci la métrologie est chargée
d’assurer la communication entre les acteurs
6
industriels.
MÉTROLOGIE ET CHIMIOMÉTRIE
La métrologie est codifiées par des organismes
internationaux
7
Métrologie et chimiométrie
8
VALIDATION DE MÉTHODES
9
Métrologie et chimiométrie
Production des normes
Normes
Consommateur homologuées
Commission de
Pouvoir public normalisation Enquête
Projet probatoire
administrative Fascicules
de Norme
Professionnels
Normes
10
expérimentales
MÉTROLOGIE ET CHIMIOMÉTRIE
11
MÉTROLOGIE ET CHIMIOMÉTRIE
13
MÉTROLOGIE ET CHIMIOMÉTRIE
14
MÉTROLOGIE ET CHIMIOMÉTRIE
15
MÉTROLOGIE ET CHIMIOMÉTRIE
Vocabulaire
Analyte
Objet de la méthode d'analyse
Blanc
Essai réalisé en l'absence de matrice (blanc réactif) ou sur une matrice
qui ne contient pas l'analyte (blanc matrice).
Biais
Différence entre l’espérance de résultats d’essai et une valeur acceptée
comme référence.
Incertitude
Liste des sources d’incertitude et de leurs incertitudes types associées,
établie en vue d’évaluer l’incertitude type composée associée à un
résultat de mesure.
16
MÉTROLOGIE ET CHIMIOMÉTRIE
17
MÉTROLOGIE ET CHIMIOMÉTRIE
Matrice
Ensemble des constituants du matériau d’essai autres que l'analyte.
Méthode d'analyse
Procédure écrite décrivant l'ensemble des moyens et modes opératoires nécessaires pour
effectuer l'analyse de l'analyte, c'est-à-dire : domaine d'application, principe et/ou réactions,
définitions, réactifs, appareillage, modes opératoires, expression des résultats, fidélité ,
rapport d'essai.
AVERTISSEMENT Les expressions "méthode de dosage" et "méthode de détermination" sont parfois
employées comme synonymes de l'expression "méthode d'analyse". Ces deux expressions ne doivent pas être
employées dans ce sens.
Mesurage
Ensemble d’opérations ayant pour but de déterminer une valeur d’une
grandeur.
NOTE Le déroulement des opérations peut être automatique.
Mesurande
Grandeur particulière soumise au mesurage.
Tolérance
Ecart par rapport à la valeur de référence, défini par la laboratoire pour un
niveau donné, dans lequel une valeur mesurée d’un matériau de référence
sera acceptée.
19
MÉTROLOGIE ET CHIMIOMÉTRIE
21
MÉTROLOGIE ET CHIMIOMÉTRIE
Estimation de la moyenne
x 19.80ppm
Pour l’échantillon considéré
s 0.434ppm
22
Métrologie et chimiométrie
Autres définitions
23
Métrologie et chimiométrie
Autres définitions
- erreur relative xt xr
E 100
xr
24
Métrologie et chimiométrie
25
Erreur absolue (xi-xr)% de N
Métrologie et chimiométrie
26
VALIDATION DE MÉTHODE
Il est clair que l’erreur sur les analyses chimiques peut avoir deux
causes:
-l’erreur aléatoire est la cause de la dispersion des résultats,
elle est plus faible dans les cas 1 et 3. En général l’erreur aléatoire
exprime la précision
-l’erreur systématique est la cause de la différence entre la
moyenne d’une série de données et la valeur présumée cas 3 et 4
27
Métrologie et chimiométrie
31
MÉTROLOGIE ET CHIMIOMÉTRIE
Les types d'erreurs classiques
32
MÉTROLOGIE ET CHIMIOMÉTRIE
précédente mesure.
L'erreur de mobilité
La caractéristique est en escalier. Cette erreur est souvent due à une n
numérisation du signal
33
Métrologie et chimiométrie
Autres définitions
- erreur relative xt xr
E 100
xr
34
Métrologie et chimiométrie
𝑁
𝑁
𝑖=1(𝑥𝑖 − µ)² 𝑖=1(𝑥𝑖
− 𝑥 )²
= 𝑠=
𝑁 𝑁−1
Écart type de la population Écart type de l’échantillon
37
MÉTROLOGIE ET CHIMIOMÉTRIE
Propriété de la courbe de gauss
38
MÉTROLOGIE ET CHIMIOMÉTRIE
39
MÉTROLOGIE ET CHIMIOMÉTRIE
https://celtinvest.com/ecart-type/ 40
MÉTROLOGIE ET CHIMIOMÉTRIE
La courbe d’erreurs normales ci-dessous montre que
68,2% de l’aire sous la courbe se situe entre -1 et + 1 .
95,4% de l’aire se situe entre -2 et + 2 , 99,7 % de l’aire
se situe entre -3 et + 3
Nombre de mesure z
dans la moyenne
2 0,71
3 0,58
4 0,50
5 0,45
6 0,41
42
10 0,32
MÉTROLOGIE ET CHIMIOMÉTRIE
Il arrive que l’on ne puisse pas estimer l’écart
type de la population correctement, Dans ce cas
la série de mesures disponible permet d’estimer
la moyenne et la précision qui lui est associée.
43
MÉTROLOGIE ET CHIMIOMÉTRIE
Valeur de t pour divers degrés de probabilites
44
MÉTROLOGIE ET CHIMIOMÉTRIE
Aide statistique à la vérification d’hypothèses
biais= µB-µr
46
MÉTROLOGIE ET CHIMIOMÉTRIE
49
MÉTROLOGIE ET CHIMIOMÉTRIE
Le test de Fisher-Snedecor est un test statistique qui
compare les variances de deux échantillons statistiques.
Hypothèse testée : "VarianceX=VarianceY", avec risque
d'erreur
Déroulement du test :
On calcule les moyennes observées mX et mY des deux
échantillons :
On calcule les variances observées non biaisées des deux
échantillons :
On calcule la variable de test t, après avoir permuté
éventuellement sX et sY de sorte que sX soit le plus grand des
deux :
On compare avec la valeur critique de la loi de Fisher-
Snedecor à p-1,q-1 degrés de liberté pour le risque a recherché,
Fp-1,q-1. Si t>Fp-1,q-1, on rejette l'hypothèse, sinon on l'accepte.
50
MÉTROLOGIE ET CHIMIOMÉTRIE
La détection des erreurs grossières
Lorsqu’une série de données contient un résultat qui diffère
sensiblement de la moyenne, on doit prendre la décision de la
garder ou de la rejeter.
X1 X2 X 3 X4 X5 X6
𝑋6 − 𝑋5
𝑄𝑒𝑥𝑝 =
𝑊
52
MÉTROLOGIE ET CHIMIOMÉTRIE
53
MÉTROLOGIE ET CHIMIOMÉTRIE
Recommandation pour le traitement des valeurs
excentriques
Lorsqu’une série de données contient une valeur suspecte, il est
recommandé de procéder comme suit:
1.Reéxaminer les données ayant conduits au résultat pour détecter
une erreur grossière
2. Estimer si possible la précision attendue de la méthode avant de
rejeter le résultat
3. Répéter l’analyse si on a assez d’échantillon et de temps. Un bon
accord avec les nouvelles données et les données initiales appuie la
décision de rejet.
4. Si on ne peut pas obtenir plus de données effectuer le test du Q²
54
MÉTROLOGIE ET CHIMIOMÉTRIE
Recommandation pour le traitement des valeurs
excentriques
5. Si le test du Q² conseille de garder le résultat, travailler avec la
médiane de la série plutôt qu’avec la moyenne. La médiane permet
de tenir compte de toutes les données d’une série sans être
influencée par une valeur excentrique.
55
MÉTROLOGIE ET CHIMIOMÉTRIE
Assurance qualité et cartes de contrôle
Lorsque les méthodes analytiques servent à
résoudre des problèmes concrets d ’intérêt général,
il est impératif d’évaluer constamment la qualité
des résultats fournis par l’appareillage et
l’efficacité de ce dernier. Dans tous les processus de
production, nous devons surveiller dans quelle
mesure les produits répondent aux spécifications.
En termes plus généraux, la qualité d'un produit a
deux "ennemis" : (1) les écarts aux spécifications
cibles, et (2) une dispersion excessive autour des
spécifications cibles.
56
MÉTROLOGIE ET CHIMIOMÉTRIE
59
MÉTROLOGIE ET CHIMIOMÉTRIE
60
MÉTROLOGIE ET CHIMIOMÉTRIE
63
CHIMIOMETRIE GÉNÉRALITÉS
A lire
Chemometrics and intelligent laboratory systems, an international journal sponsored by
the chemometrics society published since 1987 by Elsevier
H. Martens, T. Naes, Multivariate calibration, Wiley 1989
K.R. Beebe, R.J. Pell, M.B. Seasholtz, Chemometrics: a practical guide, Wiley 1998
D.L. Massart, B.G.M. Vandeginste, S.M. Deming, Y. Michotte, L. Kaufman, Chemometrics:
a textbook, Elsevier 1988
B.G.M. Vandeginste, D.L. Massart, L.M.C. Buydens, S. De Jong, P.J. Lewi, J. Smeyers-
Verbeke, Hand book of Chemometrics and Qualimetrics: Part A & Part B, Elsevier 1998
S.D. Brown, R. Tauler, B. Walczak (eds), Comprehensive Chemometrics: chemical and
biochemical data analysis (4 volume set), Elsevier, 2009
R.G. Brereton, Applied chemometrics for scientists, Wiley 2007
M. Otto, Chemometrics: statistics and computer application in analytical chemistry, 2nd
Edition, Wiley-VCH 2007
R. Kramer, Chemometric techniques for quantitative analysis, CRC Press, 1998
P.J. Gemperline (ed), Practical guide to chemometrics, 2nd Edition, CRC Press 2006
H. Mark, J. Workman, Chemometrics in spectroscopy, Academic Press-Elsevier, 2007
64
CHIMIOMETRIE GÉNÉRALITÉS
Résultat de la recherche dans le WOS 2009-2019
chemometric or discriminant analysis or PLS or
SIMCA dans le titre , Résultat: 5934 articles
65
CHIMIOMETRIE GÉNÉRALITÉS
Répartition (recherche effectuée en Juin 2019 )
66
CHIMIOMETRIE GÉNÉRALITÉS
La Chimiométrie
Quantitative permet de traiter le
Spectroscopy
Analysis résultat des
expériences et est
Chemometrics
ainsi essentielle à
tous les
scientifiques.
Separations Electro
chemistry
67
CHIMIOMETRIE
68
CHIMIOMETRIE
Objectifs de la chimiométrie
69
CHIMIOMETRIE
Analyse exploratoire ou analyse de la structure
des données: Analyse en composantes principales
(ACP).
70
CHIMIOMETRIE
Nombres d’onde
échantillons
X= S.P+E
Direction du deuxième
vecteur composante principale
La variation qui existe entre les individus peut être représentée par une droite
72
qui passe au milieu du nuage de points. Son orientation est telle que de plus
en plus d’individus sont rencontrés quand on suit la droite
CHIMIOMETRIE
Composante 1 Composante 2
74
CHIMIOMETRIE
Pour visualiser des données multivariées les distances projetées doivent
être proches des distances réelles dans le repère de départ.
75
CHIMIOMETRIE
Propriétés des composantes principales
-Nombre L’ACP peut construire autant de variables
principales que de variables originales, c’est
l’analyste qui détermine le nombre de composantes
à retenir
- Orthogonalité: Les composantes principales
définissent des directions de l’espace qui sont
orthogonales deux à deux. L’ACP procède à un
changement de repère orthogonal, les directions
originales sont remplacées par les composantes
principales.
76
CHIMIOMETRIE
Propriétés des composantes principales
-Décorrelation: Les composantes principales sont
des variables qui s’avèrent deux à deux
décorrélées.
-Ordre et sous espaces optimaux. La propriété des
composantes principales est de pouvoir être
classées par ordre décroissant d’importance. Le
meilleur sous espace à k dimensions dans lequel
projeter les observations est celui engendré par les
k premières composantes
77
CHIMIOMETRIE
Cercle de corrélation
A chaque point-variable, on associe un point dont la
coordonnée sur un axe factoriel est une mesure de
la corrélation entre cette variable et le facteur.
Dans l’espace de dimension p la distance des
points-variables à l’origine est égale à 1. Donc par
projection sur un plan factoriel les points-
variables s’inscrivent dans un cercle de rayon 1 -
le cercle des corrélations - et sont d’autant plus
proche du bord du cercle que le point variable est
bien représenté par le plan factoriel, c’est-à-dire
que la variable est bien corrélée avec les deux
facteurs constituant ce plan 78
CHIMIOMETRIE
L’angle entre 2 variables, mesuré par son cosinus,
est égal au coefficient de corrélation linéaire
entre les 2 variables: cos(angle) = r(X1,X2)
-si les points sont très proches (angle proche de
0) : cos(angle) = r(X1,X2) = 1 donc X1 et X2 sont
très fortement corrélés positivement
-si l’angle est égal à 90° , cos(angle) = r(X1,X2) =
0 alors pas de corrélation linéaire entre X1 et X2
-si les points sont opposés, a vaut 180°, cos(angle)
= r(X1,X2) = -1 : X1 et X2 sont très fortement
corrélés négativement
79
CHIMIOMETRIE
Utilisation:
L’ACP fourni des données décrites par des variables
quantitatives , des représentations planes. On projette
les données sur des plans factoriels, chaque plan étant
défini par deux composantes principales. L’examen de
ces représentations permet:
- de localiser des observations aberrantes
- de repérer des groupes « classes » ou « cluster » qui
suggèrent l’existence de sous-populations dans les
données
- d’interpréter les différences 80
APPLICATION
L’exemple porte sur une analyse d’un certain nombre de
critères sur des magasins situés dans plusieurs villes.
81
APPLICATION
Le fait que “compétence” soit proche de l’axe 1 indique qu’il est très bien représenté par cet
axe. Comme il est très éloigné de l’axe 2, on peut conclure qu’il est peu représenté par cet
axe.
En ce qui concerne l’axe 2, le point “choix” est très bien correlé avec l’axe. Le point “facilité”
l’est également mais dans une moindre mesure.
De ces observations, nous pouvons conclure que l’axe 1 correspond plutôt à l’appréciation des
vendeurs et notamment de leur compétence alors que l’axe 2 correspond plutôt à 82
l’appréciation du magasin et notamment du choix qu’il propose.
APPLICATION
Quelles autres conclusions tirer de l’analyse ? En
synthétisant les informations issues des 5 variables
analysées, on peut conclure qu’il y a beaucoup d’efforts à
faire en matière d’accueil et de renseignement des clients
dans les magasins de Nice, Marseille, Amiens et Toulon. Ce
dernier est également très peu apprécié en matière de
choix.
Les magasins de Paris, de Lyon et de Marseille sont
appréciés de la clientèle pour le choix qu’ils proposent et la
facilité pour trouver les produits recherchés.
Lyon se distingue aussi par l’amabilité du personnel et
peut être considéré comme le meilleur magasin parmi ceux
qui ont fait l’objet de l’analyse.
Ces conclusions sont confirmées par l’examen des tableaux
de corrélations et de coordonnées des individus, fournis par
le logiciel d’analyse. 83
CHIMIOMETRIE GÉNÉRALITÉS
85
CHIMIOMETRIE
86
CHIMIOMETRIE
i Tableau de données
J
Matrice de
J correlation
Diagonalisation
J J
Valeurs Matrice des
J propres en vecteurs J
diagonale propres
J
Les
Histogramme i composantes 89
Des valeurs principales
propres
CHIMIOMETRIE
Example1 354 spectres proches infrarouges de 5
composés : essences, gazoles, toluène, cyclohexane,
heptane enregistrés sur 4 appareils différents
Line P lot
0.10
0.05
-0.05
-0.10
-0.15
-0.20
-0.25
-0.30
90
Variables
604 649 691 735 810 844 893 932 962 1000 1037
C95S-07 C95S-13 C95S-15 C95S-15
CHIMIOMETRIE
PC2 Scores
0.20 C95
C95
C95
C95
C95
C95
C95
C95
essences
C95
C95
C95
C95
0.15 C95
C95
C95
C95
C95
C95C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
C95
0.10
0.05
Gazole et heptane
Hep
Hep
Hep
Hep
GO1Hep
GO1
GO1
GO1
GO1
GO1
GO1
GO1
GO1
0
GO1Hep
GO1
Toluène
GO1
GO1
GO1
GO1GO1
GO1
GO1
HepHep
Hep
Hep
GO1
GO1
GO1
GO1
Hep
GO1 Hep
Hep
Hep
Hep
GO1
GO1
GO1
GO1Hep
GO1Hep
Hep
Hep
GO1
GO1
GO1
GO1Hep
GO1
GO1
GO1Hep Cyc
Cyc
Cyc
Hep
Hep Cyc
Cyc
Cyc
-0.05 Tol Hep
Hep
Hep
Hep Cyc
Tol
Tol
Tol
Tol Hep
Hep Cyc
Cyc
Cyc
Cyc
Hep Cyc
Cyc
Cyc
Cyc
Cyc
Cyc
Cyc
Cyc
Cyc
Cyc
Cyc
Hep Cyc
Cyc
Cyc
Tol
TolTol
Tol Cyc
Cyc
Cyc
Cyc
TolTol
Tol
Tol
Tol
Tol
Tol Cyc Cyc
Cyc
Cyc
Cyc
-0.10 Tol
Tol
Tol
Tol
Tol
Cyc
-0.15
Cyclohexane
PC1
-0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3
RES ULT3, X-expl: 81% ,14%
-0.02
-0.04
Tol
Tol
Tol
Tol
Tol
Tol
Tol
Tol Tol
Tol
Tol
Tol
Tol
-0.06
-0.08
Spectro 2 Spectro 3
Tol
TolTol Tol
Tol
Tol
Tol
Tol Tol
Tol
Tol
Tol
Tol
Tol Tol
TolTol
Tol
Tol
Tol
Tol
Tol
Tol Tol
Tol
Tol
Tol
Spectro 1
-0.10 TolTol
Tol
Tol
Tol
Tol
Tol
Tol
Tol
Tol Tol
-0.12
Spectro 4
PC1
-0.41 -0.40 -0.39 -0.38 -0.37 -0.36 -0.35 -0.34 -0.33 -0.32 -0.31
RES ULT3, X-expl: 81% ,14%
92
CHIMIOMETRIE
Example2 40 spectres moyen infrarouges d’huiles
pétrolières de 2 origines géographiques
93
APPLICATION
94
APPLICATION
Résultats de l’ACP
95
APPLICATION
Interprétation
Les scores (valeurs propres) sont les coordonnées
des spectres dans l’espace des composantes
principales.
Les maxima et les minima des composantes
principales modélisent les longueurs d’ondes qui
participent à la différence.
96
APPLICATION
Interprétation.
Positifs: 728, 740 767, 797, 806, 835, 846, 873,
1448, 1496, 1608 cm-1
Négatifs: 719, 1465 cm-1
Positif : Aromatiques
Négatifs: Aliphatiques
97
APPLICATION
Interprétation.
Vapeur d’eau
98
APPLICATION
Interprétation.
Positif: 1081, 916 cm-1
99
CHIMIOMETRIE généralités
Systèmes monocapteurs
X Y
Systèmes multicapteurs
X1 Y1
X2 Y2
X3 Y3
Xn Yn
100
CHIMIOMETRIE généralités
Capteur
de gaz
Capteur
De gaz
101
CHIMIOMETRIE généralités
P0 P
102
CHIMIOMETRIE généralités
104
CHIMIOMETRIE généralités
Méthode générale:
On désire trouver Y=F(X) le "plus précisément possible". On aura
donc, pour les échantillons d'étalonnage:
Y=F(X)+E
où E est la matrice d'erreur sur les variables Y que l'on désire
minimiser
Le concept de minimisation d'une matrice nécessite d'introduire
une distance. On utilise généralement la distance Euclidienne:
107
CHIMIOMETRIE généralités
q,
On obtient donc p équations à p inconnues dont la résolution littérale est
impossible dans le cas général.
108
CHIMIOMETRIE généralités
Y
Régression de x sur y
x=Ay +B + x
X
110
CHIMIOMETRIE généralités
Régression de y sur x
y=Ax +B + y
x 111
CHIMIOMETRIE GÉNÉRALITÉS
113
CHIMIOMETRIE GÉNÉRALITÉS
114
CHIMIOMETRIE GÉNÉRALITÉS
On a alors:
115
CHIMIOMETRIE GÉNÉRALITÉS
116
CHIMIOMETRIE généralités
La matrice de covariance
La matrice X'X que l'on est amené à inverser s'écrit, si les
variables xik sont centrées
lissage
correction de la diffusion
119
METHODOLOGIE
Techniques d’échantillonnage
120
METHODOLOGIE
Caractéristiques de l’échantillon
échantillonnage
Spécificité des informations
Reproductibilité
Choix des traitements spectraux
dérivée
lissage
correction de la diffusion
121
METHODOLOGIE
Méthodes de traitement des données
Non supervisées
Statistiques
Neuronales
Supervisées
Statistiques
Neuronales
122
METHODOLOGIE
Méthodes de régressions multivariées.
On cherche à établir une corrélation entre
données spectrales et concentrations par exemple
123
METHODOLOGIE
124
METHODOLOGIE
Pour un mélange
1 A1= K1C1 + K2C2
125
METHODOLOGIE
Méthode d’analyse supervisée
126
METHODOLOGIE
127
METHODOLOGIE
Classical Least Square (CLS)
A partir de Beer-Lambert, on écrit:
A=C.B + EA
On défini C (m,l) matrice des concentrations et A (m,n) la
matrice des spectres. Les coefficients B sont les
coefficients d’extinction molaire.
On pose que toutes les erreurs sont dues aux données spectrales.
128
METHODOLOGIE
Calibration
B= (Ct. C)-1. Ct. A,
On minimise B et on calcule Emin.
Emin= A-C.B
129
METHODOLOGIE
Validation:
Cu=Au. Bt. (B.Bt)-1
Ep= Au-Cu.B
CtC: on doit donc avoir: nb composés
nb échantillons.
BBt: on doit donc avoir: nb composés
nb longueurs d'onde
130
METHODOLOGIE
Remarque:
On remarque que CtC est la matrice de covariance
des concentrations. Si 2 colonnes de C sont
colinéaires, CtC ne sera pas inversible, d'où des
précautions à prendre pour le choix des
concentrations des échantillons de calibrage. De
même, si 2 colonnes sont presque
colinéaires,(CtC)-1 comprendra de fortes valeurs
et on aura alors des instabilités pendant la
prédiction.
Si il n'y a qu'un seul composé, CtC est un scalaire
égal à la variance des concentrations et le 131
problème ne se pose pas.
METHODOLOGIE
Exemple graphique avec 3 échantillons, 2 longueurs d'onde et 1
composé:
Inconvénients de la méthode:
•Le calcul des paramètres de prédiction pour un composé
utilise les concentrations de tous les composés: Tous les
composés ou interférents susceptibles d'être présents en phase
de prédiction devront être introduits pendant le calibrage, et
leur concentration devra être connue.
133
METHODOLOGIE
134
METHODOLOGIE
Multiple Linear Regression (MLR) ou (ILS)
On écrit C= 1.b + Ai,w.Bw,j + Ai,w+1. Bw+1,j + eij
Les valeurs des concentrations sont normées ou normalisées.
Les erreurs sont présumées ne provenir que des
concentrations.
C=A.B + E
On défini Ci,jmatrice des concentrations, Ai,w la matrice des
spectres,Bw,j matrice des paramètres de régression et Eij
matrice des erreurs.
La meilleure façon d’estimer les concentrations consiste à
trouver la combinaison linéaire des variables A qui
minimise les erreurs en reproduisant C. Les valeurs de la
matrice B sont estimées par les moindres carrés. 135
B= (At. A)-1. At. C
METHODOLOGIE
Calibration
B= (At. A)-1. At. C,
On minimise B et on calcule Emin.
Emin= C-A.B
Validation:
Cu=Au. B
Ep= Cu- Au.B
Mais, ce n’est pas une méthode de spectre complet, il
faut choisir les fréquences à utiliser. La matrice A
doit être inversible, elle a une dimension égale au
nombre des fréquences étudiées. Ce nombre ne doit
pas dépasser le nombre de mélanges utilisés pour
l’analyse.
136
METHODOLOGIE
Exemple graphique avec 3 échantillons, 2 longueurs d'onde et
1 composé:
140
METHODOLOGIE
La surmodélisation
1.Erreur due à l’erreur
de mesure sur X:
Emes= où a
augmente avec la
complexité du modèle
2.Emod Erreur avec les
échantillons de
calibrage: forcément
décroissante.
3.Erreur totale de
prédiction: Etot = Emes +
Emod
4.Erreur de
modélisation (par
rapport au processus
réel)
141
METHODOLOGIE
L'analyse de facteurs:
Matrice B de
changement de base
S T
Dimension n Dimension b<n
Variables corrélées Variables indépendantes
142
METHODOLOGIE
L'analyse de facteurs:
Si h=n, il n'y a pas de réduction de données, le problème est
équivalent au précédent et la méthode a peu d'intérêt.
Il y a plusieurs méthodes pour déterminer la matrice de
changement de base B ("Loadings vecteurs") qui seront explicitées
plus loin.
Matrice B de
changement de base
S T
Dimension n Dimension b<n
Variables corrélées Variables indépendantes
143
METHODOLOGIE
144
METHODOLOGIE
Méthode PCR
Cette méthode utilise la matrice des covariances des
absorbances centrées, AtA. Elle part du principe que pour
choisir une nouvelle base de variables indépendantes, il
suffit, par définition, que les covariances de ces variables
entre elles soient nulles. La matrice de changement de
base est donc la matrice qui va rendre la matrice de
covariance diagonale. Elle est donc construite à partir des
vecteurs propres de AtA. Les valeurs propres représentent
alors la variance des scores, et donc leur contribution à la
modélisation: Pour effectuer la réduction de données, il
suffit alors de ne conserver que les h scores
correspondant aux plus fortes valeurs propres.
145
METHODOLOGIE
Régression sur les composantes principales
(PCR)
Cette méthode repose sur le calcul des valeurs propres des données
spectrales.
A=T.Pt + E
On calcule les vecteurs propres de At.A, on sélectionne les
vecteurs les plus pertinents pour construire Pt
Puis on calcule T= A.P cette matrice est la projection de A dans le
nouveau repère. C’est un estimateur de A. Ensuite PCR étant
inspirée de ILS, on écrit:
Calibration
C=T. B+E
B= (Tt. T)-1. Tt. C,
On minimise B et on calcule Emin. 146
Emin= C-T.B
METHODOLOGIE
Validation:
T= A.P
A= T.B
E= A-T.B
147
METHODOLOGIE
Méthode d’analyse supervisée
Régression selon les moindres carrés
partiels
L’algorithme PLS est inspiré de la méthode
d’orthogonalisation de Gram-Schmidt. La
condensation des données s’effectue en calculant
les directions où les variations soit des
concentrations soit des données spectrales sont
maximales. Ces directions sont les éléments d’un
espace latent et sont appelées facteurs latents.
A= Th. Bh + Ea
148
C= Vh. Th + Ec
Bh et Vh sont appelés loadings de A et c
METHODOLOGIE
Régression selon les moindres carrés partiels
Première étape:
Traitement mathématique des données, on centre les
matrices A et C, on soustrait le spectre de
calibration moyen à chaque spectre et les moyennes
des concentrations sont soustraites à chaque
concentration. Cela réduit la complexité du système.
Deuxième étape: A=C.Kht+ Ea
Kht=At.C(Ct.C)-1
On pose que seules les valeurs du premier constituant
sont connues. Le premier vecteur K1 représente une
première approximation par minimisation par les
moindres carrés du spectre du produit pur du
constituant analysé. 149
METHODOLOGIE
Régression selon les moindres carrés partiels
Troisième étape:
A=Th.Kht+ Ea
Th= A. Kh
Cette étape revient à calculer une approximation de C par
le vecteur Th
Quatrième étape: Pour éliminer les problèmes de colinéarité
les vecteurs Th doivent être orthogonaux. A=Th.Bh+ Ea
Bh=At.Th(Tht.Th)
Contrairement à PCR ces loadings ne représentent pas
seulement la maximum de la variance des spectres mais le
maximum de la variation ayant le meilleure corrélation
avec les vecteurs Th première approximation de C. Les
vecteurs loading ainsi calculés ne sont pas orthogonaux.
Les fréquences associées aux plus grandes valeurs
positives de Bh indiquent les fréquences ayant la
meilleure dépendance avec les variations de la 150
concentration pour un vecteur Bh particulier.
METHODOLOGIE
Régression selon les moindres carrés
partiels
Sxième étape:
Ea=A-Th.Bh
Ec= C-Vh. Th
Toutes les variations de la concentration
n’ont pas été prises en compte par le
premier vecteur loading , On recherche les
variations qui n’ont pas été prises en
compte dans la première itération.
On recommence jusqu’à ce que Ec soit très 151
voisin de Zéro.
METHODOLOGIE
152
METHODOLOGIE
153
METHODOLOGIE
Les échantillons Lot X + Y
Échantillons X Échantillons Y
Spectres X
+ Calibration PLS
Concentrations
Concentrations Y
Calibration PLS
Erreur
Erreur
M
(C i C i' ) 2
N
(C i C i' ) 2 SEP i 1
M 1
SEC i 1
N 1 p
154
METHODOLOGIE
Calcul des erreurs de calibration et de prédiction
M ' 2
i
N
i)
(C i C i' ) 2
(C C
SEP i 1
SEC i 1 M 1
N 1 P
155
METHODOLOGIE
Calibration
Modèle
Absorbances Concentration
Résidus
Prédiction
Modèle
Absorbances Concentration
156
Résidus
APPLICATION
157
APPLICATION
Sur les huiles pétrolières
1. On utilise en prédiction un spectre de chaque huile
2. Ici le résultat obtenu avec un facteur p=1
158
APPLICATION
159
APPLICATION
160
APPLICATION
Le vecteur de régression obtenu pour un facteur est une
bonne estimation des corrélations.
161
COUCHAGE DE PAPIERS
Interprétation des liens de plus hauts
poids
162
METHODOLOGIE
Réseaux de Kohonen apprentissage
non supervisé
neurone j
couche d'entrée
vecteur d'entrée
dim 5
wj1.........wjn
poids
dim 5
résultat scalaire
couche de sortie
SIMCA
164
Soft Independant Modeling of Class Analogy Classification
165
Different between sofwares
SIMPLISMA
SIMPLISMA
(SIMPLe-to-use Interactive Self-modeling Mixture
Analysis)
Principe
A B
Mélanges
167
SIMPLISMA
168
SIMPLISMA
Le spectre de pureté est obtenu en divisant
le spectre de déviation standard par la
moyenne pondéré par un offset
169
Couplage ATG-FTIR
Scores
Y -X
0.03
0.02
0.01
-0.01
-0.02
-0.03
0.6
0.4 -0.10
0.2 -0.05
0
0 0.05
0.10
-0.2 0.15
X-loadings X-loadings
0.1 0.2
D
C
D
0.1
-0.1 -0.1
X-variables X-variables
171
COUPLAGE ATG-FTIR
Scores
ACP sur les spectres 1500-2300
Y
-0.4
-0.2
0.2
0.06
0.04
0.02 0
-0.02
-0.05 0 0.05 0.10 0.4
0.15
0.02
0.04
0.01
0.02
0
0
-0.01
4000 3000 2000 1000 4000 3000 2000 1000
3 x 10
-3 4
0.2 4
0.1 2
0 0
1 2
1 3
2
0.5
1
0
0
200 400 600 800 200 400 600 800
3 4
0.08
0.06 1
0.04
0.5
0.02
0
0
200 400 600 800 200 400 600 800
174
COUPLAGE ATG-FTIR
CH4 +C2H6 CH3OH
5 x 10
-3 6
20
0.05
10
0
0
-0.05
4000 3000 2000 1000 4000 3000 2000 1000
7 8
0.04 0.03
0.02
0.02
0.01
0 0
-0.01
4000 3000 2000 1000 4000 3000 2000 1000
HCN COS
175
COUPLAGE ATG-FTIR
5 6
0.3
0.2 0.2
0.1 0.1
0
0
200 400 600 800 200 400 600 800
7 8
0.4
0.3 0.3
0.2 0.2
0.1
0.1
0
0
200 400 600 800 200 400 600 800
176
Couplage ATG-FTIR
CH3COOH CO
x 10
-3 9 10
10 0.02
5 0
0
-0.02
-5
4000 3000 2000 1000 4000 3000 2000 1000
9 10
1.5
1 0.2
0.5
0.1
0
0
200 400 600 800 200 400 600 800
177
METHODOLOGIE
MCR-ALS Multivariate Curve résolution-Alternative
Least Squares
R=CST + E (1)
C(n,N) est la matrice de concentration, elle
décrit l’évolution des constituants
chimiques,
ST(N,m) est une matrice de données
spectroscopiques qui décrit les spectres de
produits purs
E(n,m) est une matrice d’erreurs
On suppose que la relation entre les 178
179
APPLICATION
Essai sur les huiles pétrolières
On obtient une estimation des spectres des
fractions et une profil de concentration
estimé.
180
APPLICATION
x10 -3
15
10
1 5
x10 -3
15
2
10
3
x10 -3
1467.1
12
10
1387.8
8
6
730.1
1094.4
4
0
181
800 1000 1200 1400 1600
APPLICATION
x10 -3
1467.0
4
1386.0
10
736.0
3
750.0
777.0
2
817.8
1504.0
841.9
855.1
1
1616.0
5 10 15 20 25 30 35 40
x10 -3
1469.0
5
15
1386.0
4
10
730.0
3
1616.0
5 10 15 20 25 30 35 40 0
x10 -3
1469.0
12
1.2
10
1.0
1386.0
730.0
8
0.8
1093.0
1078.0
0.6 6
0.4
4
1309.0
182
0.2
0.0
5 10 15 20 25 30 35 40
0
600
603.6
617.1
632.5
659.5
682.7
725.1
771.4
800
804.2
825.4
864.0
912.2
939.2
970.0
1000
1010.5
1029.8
1080.0
1110.8
1149.4
1176.4
1201.5
1200
1224.6
1249.7
1259.3
Acenaphtylène
1276.7
1303.7
1334.5
1357.7
1386.6
1400
APPLICATION
1425.2
1456.0
1477.2
1600
1800
183