Vous êtes sur la page 1sur 5

Modlisation de bioprocds par une approche

linaire hybride et ensembliste


J.-M. Flaus, O. Adrot

Rsum Lobjectif est de remplacer les relations


mathmatiques complexes utilises pour dcrire la cintique dun
bioprocd par une famille de modles linaires commuts.
Lapproche ensembliste est utilise pour prendre en compte les
incertitudes de modle et limprcision sur les conditions
exprimentales afin de gnrer une enveloppe estimant la
trajectoire relle du bioprocd.
Mots cls Analyse par intervalle, bioprocd, estimation,
incertitude de modle.

I.

INTRODUCTION

Lindustrie biotechnologique est un secteur important en


raison de son potentiel conomique, social et environnemental.
Son dveloppement est li une demande croissante pour les
produits biologiques conus dans lagroalimentaire, la
pharmacologie, la chimie, avec des applications plus rcentes
dans lenvironnement durable, comme par exemple le
traitement deffluents. Ce dveloppement demande un pilotage
et une surveillance du systme biologique, ce qui ncessite la
conception de modles mathmatiques en dcrivant le
comportement. Ces modles permettent aussi de reconstruire
certaines variables physiques qui ne peuvent tre mesures
pour des questions de faisabilit technique et de cot [5], ou de
concevoir des simulateurs numriques dessais pour diffrentes
conditions exprimentales.
De manire classique, la modlisation dun bioprocd
ncessite de reprsenter le comportement complexe du vivant
et fait appel un certain nombre de lois dvolution des
espces gnralement non-linaires [12] plus ou moins
complexes en fonction du niveau de prcision donn, mais de
toute faon approches. De ce fait, on aboutit un modle de
structure complexe avec une certaine imprcision dans la
modlisation et des difficults lors de lidentification des
paramtres.
Lobjectif de ce travail est de montrer quil est possible de
remplacer un modle structure non-linaire habituellement
utilis pour reprsenter un bioprocd par une famille de
modles linaires commuts. Nous proposons par ailleurs
dutiliser une approche ensembliste pour reprsenter le modle
O. Adrot et J.-M. Flaus sont membres du Laboratoire des Sciences pour la
Conception, lOptimisation et la Production (G-SCOP), INPG, UJF, CNRS,
46 avenue Flix Viallet, 38031 Grenoble Cedex, (Olivier.Adrot@gscop.inpg.fr, Jean-Marie.Flaus@g-scop.inpg.fr).

e-STA copyright 2008 by see


Volume 5 (2008), N2 pp 35-39

du taux de croissance [11], ce qui permet de dcrire


explicitement les incertitudes gnres par lapproximation.
Dans la section 2, nous prsentons le modle gnrique du
bioprocd tudi. Dans la section 3, nous montrons que
lapproximation de la cintique par une fonction constante par
morceaux permet de raliser une modlisation satisfaisante du
bioprocd, en illustrant ceci sur un procd modlis par une
loi de Monod comme rfrence. Dans la section 4, nous
prsenterons les principes lmentaires des mthodes
ensemblistes en mettant en vidence leur intrt pour la prise
en compte des incertitudes de modle. Enfin, dans la section 5,
nous proposons un modle ensembliste hybride permettant de
dcrire compltement lincertitude sur le taux de croissance et
de gnrer les enveloppes de trajectoires des concentrations,
appeles tubes de trajectoires, en fonction de cette incertitude.
II. MODELE GENERIQUE DE BIOPROCEDE
Un bioprocd voluant dans un racteur suppos
parfaitement agit peut tre modlis en crivant les quations
de bilan pour chaque constituant, ce qui donne un modle de la
forme gnrale suivante [3] :

dz
= K r ( z ) + D ( zin z ) + q( z )
dt

(1)

o z est le vecteur dtat compos des concentrations des


constituants, K est la matrice des rendements, r est un vecteur
compos des taux de raction et dcrivant la cintique, D est le
taux de dilution (souvent variable daction) et q dcrit les
changes gazeux.
Un bioprocd peut oprer en mode batch sans ajout ni
soutirage (D = 0), en mode fed-batch avec ajout de substrat
sans soutirage ou bien en mode continu avec un ajout gal au
soutirage. Dans la suite, nous considrons un bioprocd
oprant en mode batch, dans lequel le substrat, dont la
concentration est note S, est transform par la biomasse de
concentration X. Le rendement de la transformation est not
Yxs et la cintique est dcrite par le taux de croissance ,
dpendant de S. Le modle peut alors scrire :

dX ( t )
= ( S (t )) X (t )

dt
dS ( t )
1

=
( S (t )) X (t )
Yxs
dt

(2)

Une difficult rencontre lors de la construction de ce


modle partir de donnes exprimentales est dtablir la loi
cintique permettant dexprimer le taux de croissance en
fonction de la concentration en substrat. Un certain nombre
dexpressions ont t proposes dans la littrature dont la plus
connue est la loi de Monod [6] :

( S ( t ) ) = max

S (t )

K + S (t )

(3)

III. APPROCHE LINEAIRE HYBRIDE


Lobjectif de cette partie est de montrer quil est possible de
modliser un bioprocd tel que dcrit plus haut par une
famille de modles linaires, le modle spcifique dcrivant le
procd un instant donn dpendant du domaine de lespace
dtat dans lequel se trouve le vecteur dtat. Un tel modle est
un modle hybride discret temps continu ou discret, puisque
le systme est dcrit dune part par la valeur du vecteur dtat
en fonction du temps (continu ou chantillonn) et dautre part
par le mode discret dans lequel il se trouve [4].
Le modle dans un mode donn not mi tant linaire,
lintrt de cette approche est de permettre une modlisation
plus facile, et une exploitation simplifie du modle pour
lestimation, la commande ou la surveillance. La forme
gnrale du modle utilis, obtenu partir de (2) par
discrtisation, est la suivante :

Volume 5 (2008), N2 pp 35-39

Si +1 > Si , Di = Si ,Si +1

Sur chaque domaine de validit Di, la valeur du taux de


croissance k est fixe une valeur constante prdfinie
comme suit (figure 1) :

Dans le cadre de notre tude, les valeurs nominales i de


chaque mode mi sont dtermines partir de la relation de
Monod, de faon pouvoir comparer cette approche au
modle non-linaire classique. Cependant, ces valeurs peuvent
aussi tre dtermines partir de donnes exprimentales, en
dterminant la courbe (S) partir des mesures de X et S.
On construit ainsi pour chaque mode mi, un modle dtat
linaire spcifique Mi (5). Le modle Mi valide est dtermin
en testant lappartenance de la valeur courante Sk aux
diffrents domaines de validit Di, i{1,,n}.

X
= X k 1 + Te i
k +1

Te i
Xk
Sk +1 = S k
Y
xs

si S k D i

(5)

Sur la figure 1, un partitionnement, effectu lorsque 4


modes ont t choisis, est reprsent, sachant que la valeur
nominale i dtermine a t ici fixe arbitrairement la valeur
moyenne de k sur chaque mode. Un 5me mode (m0)
correspondant un taux de croissance nul a t ajout pour
reprsenter correctement le procd en rgime stationnaire
lorsque quil ny a plus de substrat en prsence et que la
concentration en biomasse nvolue plus.
La figure 2 montre les trajectoires simules laide du
modle linaire commut et le modle non linaire. Malgr le
faible nombre de modes utiliss, et de faon assez inattendue,
les trajectoires sont pratiquement identiques. Ceci montre que
lutilisation dune structure complexe pour la cintique ne
simpose pas pour obtenir une bonne modlisation du systme.

0.1

(S)
0.05

(4)

o Te dsigne la priode dchantillonnage et lindice k le


temps discret.
Nous proposons de modliser le taux de croissance par une
fonction constante par morceaux du substrat. Le domaine de
variation de S est partitionn en n domaines de validit nots
e-STA copyright 2008 by see

[0, +[ = [0,S1[ [ S1 ,S2 [ Si ,Si +1 Sn1 ,+

S k Di k = i

o max et K sont deux paramtres, dfinissant


respectivement le taux de croissance maximal et la constante
de demi saturation. Dautres lois existent comme par exemple
la loi de Haldane [1] ou un produit de deux relations de
Michaelis-Menten.
Choisir une loi, partir de donnes exprimentales, souvent
trs bruites, est une relle difficult et lexprience montre
que la structure de la relation choisie ne simpose pas toujours
de faon nette. Par consquent, dans un objectif destimation,
de commande ou de surveillance, il est intressant de choisir la
structure la plus simple possible permettant de reprsenter
correctement les donnes. Dans ce travail, nous avons
poursuivi cette logique jusqu choisir une fonction constante
par morceaux pour le taux de croissance et tudi les
performances de cette approche. Lintrt est davoir un
modle linaire commut pour la description de la dynamique
du bioprocd.

X k +1 = X k (1 + Te k )

T
S
= Sk e k X k
k +1
Y
xs

Di :

Modes

m11

m2 2

m43

4
m
6

Mode valide
4
m
m
m
m
m

3
2
1
0

k
0

10

Fig. 1. Partitionnement de (S)

20

30

40

50

60

0.

Modle linaire commut

0.

0.

Modle non-linaire

0.
0.
0

k
0

4
2
0

k
0

Fig. 2. Simulation de X et S

IV. METHODES ENSEMBLISTES


De manire gnrale, les mthodes ensemblistes dsignent
toutes les approches permettant de manipuler des sousensembles de Rn, et de rsoudre des contraintes liant les
lments de ces ensembles (ces contraintes pouvant tre des
relations arithmtiques). Les sous-ensembles lmentaires
utiliss peuvent prendre des formes diverses et varies comme
des zonotopes, des polytopes, des ellipsodes, des pavs (ou
botes).
Les points forts de ces mthodes rsident dans leur capacit
calculer en une seule fois toutes les images par une fonction
dun ensemble de valeurs donnes et prendre en compte
limprcision sur la valeur des nombres (que ce soit les erreurs
darrondis lies aux calculs ou les incertitudes sur la valeur de
paramtres ou de grandeurs observes).
Lapproche utilise ici sappuie sur une reprsentation des
ensembles par des intervalles ou plus gnralement des unions
dintervalles, encore appeles botes et liste de botes dans la
littrature. Cette mthode permet naturellement de reprsenter
limprcision dun modle. En effet, au lieu de modliser un
paramtre ou une mesure connue avec imprcision par une
valeur relle nominale, lide consiste dcrire cette grandeur
par son support, en loccurrence un intervalle, cest--dire
lensemble des valeurs quelle est susceptible de prendre.
Par dfinition, un intervalle est un ensemble ferm et born
de nombres rels [8], [9]. Si x dsigne une variable relle
borne, alors lintervalle [x] auquel elle appartient est dfini
par:

[ x] = { x R / x x x } ,
o x et x sont des nombres rels reprsentant
respectivement les bornes infrieure et suprieure de x. De
manire gnrale, lintervalle [x] sera not comme suit :

[ x ] = [ x,x ] .
Dun point de vue modlisation, le fait de considrer la
variable borne x comme incertaine signifie que seul son
e-STA copyright 2008 by see
Volume 5 (2008), N2 pp 35-39

support [x] est connu (la valeur courante de x tant elle


inaccessible).
Le principe de base du calcul par intervalle est lvaluation
de limage dun intervalle [x] par une fonction f. Le rsultat de
cette valuation [f]([x]) est un intervalle englobant lensemble
image { f ( x ) / x [ x ]} de f. Cest cette proprit dinclusion
de lensemble image dans [f]([x]) qui permet de garantir en
fonction du problme trait que toutes les solutions seront bien
trouves. Cependant, le rsultat est un sur ensemble de la
solution exacte et on parle alors de pessimisme [8], [9].
Cette surestimation de lensemble image recherch devient
crucial dans le cadre dun modle rcursif o le rsultat obtenu
un instant donn est rutilis lors de la prochaine itration,
car rpter sans prcaution cette opration risque dintroduire
chaque itration un peu plus de pessimisme pour conduire
terme lexplosion de la taille des ensembles calculs,
phnomne appel effet denveloppement ou wrapping effect
[2], [7].
Afin de lviter et damliorer la prcision des rsultats,
diffrentes techniques existent [10]. Nous utiliserons ici la
structure particulire du systme, qui impose des contraintes
sur les bilans de masse globaux et propagerons ces contraintes
paralllement aux valuations par intervalle des relations du
modle.
V. MODELE COMMUTE ENSEMBLISTE
Comme nous avons pu le voir dans la partie 3, il est possible
de reprsenter de faon satisfaisante le taux de croissance par
une fonction constante par morceaux de faon obtenir un
modle linaire commut. Une question importante est de
savoir quelle est la prcision quil est possible dobtenir avec
un tel modle.
Pour y rpondre, nous nous proposons dans cette partie de
dvelopper un modle ensembliste du procd, c'est--dire de
reprsenter le taux de croissance par un intervalle et de
proposer une mthode pour calculer lenveloppe de toutes les
trajectoires possibles compte tenu de lincertitude sur . Avec
un tel outil, il sera possible de moduler le dcoupage du
domaine du substrat de faon avoir une reprsentation
suffisamment prcise de la cintique et gnrer une
enveloppe de largeur suffisamment petite.
Un tel modle, reprsentant le taux de croissance par un
intervalle permet dapprhender tous les comportements
possibles du bioprocd, au lieu de dcrire un comportement
moyen comme dans la section 3. Le principe consiste
prendre en compte lincertitude sur le paramtre k pour
chaque mode, information dterminante pour caractriser la
qualit du modle obtenu.
A partir du modle commut (5), lide est de reprsenter le
paramtre k pour chaque modle Mi non pas par une valeur
constante nominale i, mais par une variable borne, cest-dire une variable dont la valeur courante est inconnue, mais
dont le support intervalle []i est invariant et connu : k []i
et qui contient toutes les valeurs possibles de k pour ce mode
(figure 3). Remarquons que les domaines de validit Di sont

eux aussi des intervalles [S]i et que diffrents types de


partitionnement peuvent tre envisags.
Le partitionnement rgulier (figure 3) conduit des
intervalles []i de mme taille tandis que celui suivant une loi
exponentielle (figure 4) permet de gagner en prcision pour les
modes proches du rgime stationnaire (taux de croissance
faible).
0.14

(S )

0.12

m4

0.1

[]3

0.08

m3

0.06

0.02

m1
0

Toutes les solutions ne vrifiant pas cette contrainte aprs le


pas dintgration sont limines. De faon amliorer la
prcision, le domaine [X,S] est sub-divis en domaines plus
petits lors de cette opration, [X,S] est donc reprsent par une
union de botes.

0 [ X ]k X 0 + Yxs [ S ]k S0 .

D3

m2

0.04

De faon simuler le comportement du systme, nous


utilisons tous les modles Mi (6) valides, cest--dire pour
lesquels la valeur courante de lintervalle [S]k (domaine
possible du substrat linstant k), et le domaine de validit Di
associ (partition ralise pour dcrire le taux de croissance)
ont une intersection non nulle. Notons qu un instant donn,
plusieurs modles peuvent tre valides. Lintervalle [S]k est
alors divis en autant dintervalles que de modles valides.
Pour chacun deux, lvolution de ltat est calcule par le
modle dans le mode correspondant.
Le rsultat de lvolution est ensuite rduit en utilisant la
contrainte de conservation de la masse obtenue par (1) en
liminant les lments dpendant du temps. Plus de dtails
sont donns dans [3]. Dans notre cas, cette contrainte scrit :

Fig. 3. Partitionnement rgulier

0.14

Rsultats

(S)

0.12

Pour tester notre approche, nous avons tout dabord


construit un modle par intervalle pour le taux de croissance
partir de la loi de Monod, en prenant le maximum et le
minimum des valeurs pour chaque domaine Di. Le dcoupage
de lespace de variation de S a t ralis avec un
chantillonnage rgulier, ce qui conduit des largeurs
irrgulires pour []i, comme on peut le voir sur la figure 5.a.
Les valeurs numriques utilises pour les simulations sont
les suivantes :

m4

0.1

0.08

[]3

m3

0.06

0.04

m2

D3

0.02

m1
0

Fig. 4. Partitionnement exponentiel

En remplaant k par son support, un modle commut Mc


ensembliste est constitu dune famille de n modles dtat
ensemblistes Mi dfinis par :

i
X
[ ]k +1 = [ X ]k 1 + Te [ ]

Te
i
] [ X ]k
[
[ S ]k +1 = [ S ]k
Yxs

(6)

o [X]k et [S]k sont des intervalles dpendant du temps


conduisant lors de lvaluation de ce modle en simulation,
respectivement deux tubes de trajectoires en X et S. Dans le
cas o Yxs est mal connu, on pourrait aussi envisager de
modliser celui-ci par un intervalle [Yxs] puisque ce paramtre
est a priori constant.
Algorithme de simulation

e-STA copyright 2008 by see


Volume 5 (2008), N2 pp 35-39

Yxs = 0.5, max = 0.2, K = 10, Te = 0.1,


X0= 0.1 g/l, S0 = 10 g/l

Le rsultat de la simulation est prsent sur la figure 5.b.


Lenveloppe est de largeur relativement faible. Celle-ci est due
lincertitude sur le taux de croissance et non leffet
denveloppement. Elle est donc inhrente lincertitude de
reprsentation de .
Si cette largeur denveloppe est trop importante pour
lutilisation envisage, il est possible dutiliser une
modlisation plus fine pour le taux de croissance, soit en
ralisant une partition irrgulire pour S, soit en dcoupant en
intervalles plus troits (figure 6.a). Dans ce cas, on obtient une
meilleure prcision de la valeur finale de ltat (largeur rduite
de moiti). Ceci peut tre important pour certaines
applications, mais nest pas ncessaire par exemple si un
recalage est effectu en ligne via une estimation dtat [5].

Fig. 5.a : Modlisation par intervalles de (S) - cas I

A partir des rsultats, il est possible dimaginer une nouvelle


approche mthodologique pour la construction de modles de
bioprocds. Tout dabord, de faon classique, on trace,
partir des donnes exprimentales, les points (S,). A partir de
ces points, on dcoupe S en domaines et on identifie la
fonction par intervalles par morceaux donnant []i. Ensuite,
partir de ce modle, on simule lvolution du procd. Si les
tubes sont suffisamment prcis, on peut considrer que la
modlisation est termine, alors que dans le cas contraire, on
poursuit les exprimentations en privilgiant les prlvements
dans la zone de substrat pour laquelle la largeur sur []i est
importante.
Lintrt de cette approche est de ne pas ncessiter
dhypothses sur la forme de la loi cintique et mettre
clairement en vidence les effets dune incertitude sur .
VI. CONCLUSION

Fig. 5.b : Rsultats de simulation - cas I

Une approche de modlisation par modle hybride linaire


permet dobtenir des rsultats satisfaisants pour la
modlisation des bioprocds. Elle permet dutiliser un modle
structure linaire tout en modlisant les incertitudes sur les
paramtres et les conditions exprimentales. Cette linarit
permet une exploitation plus facile du modle, la fois dans le
cas dun modle classique ou dun modle ensembliste. En
particulier la propagation de la valeur de ltat peut tre
ralise de faon plus performante.
La prochaine tape consistera en une application sur un
procd exprimental de cette approche dans un objectif de
supervision et de pilotage.
VII. REFERENCES
[1]

Figure 6.a : Modlisation par intervalles de (S) - cas II

Figure 5.b : Rsultats de simulation - cas II

e-STA copyright 2008 by see


Volume 5 (2008), N2 pp 35-39

Andrews J., A mathematical model for the continuous culture of


microorganisms utilizing inhibitory substrate, Biotechnol & Bioeng.,
1968, vol 10, pp707-723.
[2] Anguelov R. Markov S, Wrapping effect and wrapping, Reliable
Computing, 1998, Volume 4, Number 4, pp. 311-330(20).
[3] Bastin G., Dochain D., On-line estimation and adaptive control of
bioreactors Amsterdam ; New York ; Oxford : Elsevier Publishing
Company, 1990.
[4] Flaus J-M, Modeling and Analysis of Hybrid Dynamical Systems: a
beginner's guide, Journal Europen des Systmes Automatiss, 1998,
32(7-8), p797-830.
[5] Flaus J-M., Adrot O., Estimation d'tat sre pour procds non linaires
par mthodes ensemblistes Application un procd
biotechnologique, Journal Europen des Systmes Automatiss, 2003,
Vol. 37 no 9, Edition Hermes Lavoisier.
[6] Monod J., Recherches sur la croissance des cultures bactriennes, Paris,
France Hermann, 1942.
[7] Moore R.E., Interval Analysis, Prentice Hall, 1966.
[8] Moore R.E., Methods and applications of interval analysis, SIAM,
Philadelphia, Pennsylvania, 1979.
[9] Neumaier A., Interval methods for systems of equations, Cambridge
University Press, Cambridge, 1990.
[10] Nedialkov S., Jackson K. R., Corliss G. F., Validated Solutions of Initial
Value Problems for Ordinary Differential Equations, Applied
Mathematics and Computation, 1999, 105, pp. 21-68.
[11] Romero G. Flaus JM., Chruy A., Semiqualitative modelling of
bioprocesses, Mathematical and Computer Modelling of Dynamical
Systems, 1997, Volume 3, Issue 3, pages 246 - 264
[12] Wang D. et al., Fermentation and enzyme technology, John Wiley and
Sons, 1979.