Vous êtes sur la page 1sur 13
DOSSIER TEChnIquES DE l’IngÉnIEuR l’expertise technique et scientifique de référence j1013 Modélisation

DOSSIER

TEChnIquES DE l’IngÉnIEuR

l’expertise technique et scientifique de référence

j1013

Modélisation moléculaire - Bases théoriques (partie 3)

Par :

Hervé TOULHOAT

Docteur-Ingénieur de l'ENSMP (École nationale supérieure des mines de Paris), Habilité à diriger des recherches (université Pierre-et-Marie-Curie, Paris 6), Ingénieur ENSCP (École nationale supérieure de chimie de Paris), Professeur à l'Institut français du pétrole, adjoint au Directeur scientifique

Ce dossier fait partie de la base documentaire Modélisation en génie des procédés dans le thème Opérations unitaires. Génie de la réaction chimique et dans l’univers Procédés chimie - bio - agro

Document délivré le 03/07/2012 Pour le compte

7200038556 - universite de la reunion sce commum documentation //

195.220.151.50

Pour toute question :

Service Relation Clientèle • Éditions Techniques de l’Ingénieur • 249, rue de Crimée 75019 Paris – France

par mail : infos.clients@teching.com ou au téléphone : 00 33 (0)1 53 35 20 20

ou au téléphone : 00 33 (0)1 53 35 20 20 Toute reproduction sans autorisation du

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © Editions T.I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Modélisation moléculaire

Bases théoriques (partie 3)

par Hervé TOULHOAT

Ingénieur ENSCP (École nationale supérieure de chimie de Paris) Docteur-Ingénieur de l’ENSMP (École nationale supérieure des mines de Paris) Habilité à diriger des recherches (université Pierre-et-Marie-Curie, Paris 6) Professeur à l’Institut français du pétrole, adjoint au Directeur scientifique

1.

Pr opriétés mécaniques

J 1 013 - 2

2.

Spectroscopies de vibration

3

3.

Propriétés thermodynamiques

4

3.1

Entropie

4

3.2

Enthalpie

4

3.3

Capacité thermique à pression constante

4

3.4

Précision de l’évaluation ab initio des grandeurs thermochimiques

4

4.

Spectroscopies de transitions électroniques

5

5.

Spectroscopie RMN

5

6.

Processus élémentaires diffusifs et réactifs

6

7.

Descripteurs moléculaires, relations structures-propriétés et formulation

— 7

8.

Raccordement d’échelles en temps et en espace

9

8.1

Raccordement en temps : le Monte Carlo cinétique (kMC)

9

8.2

Du microscopique au mésoscopique : la dynamique dissipative de particules (DPD)

10

Références bibliographiques

11

tiwekacontentpdf_j1013

Des propriétés microscopiques aux propriétés macroscopiques

C e dossier a pour but de montrer comment un lien peut être établi entre les résultats de calculs menés à l’échelle microscopique, c’est-à-dire sur un

échantillon représentatif d’atomes en interaction, et des propriétés mesurables à notre échelle macroscopique sur les systèmes matériels réels que l’ingénieur souhaite maîtriser. L’objectif est normalement double avec deux étapes en séquence :

— « valider » le modèle moléculaire atomistique, c’est-à-dire s’assurer que l’hypothèse chimique et structurale qu’il représente est en accord avec la réalité ; — prédire rapidement et avec précision des propriétés difficiles, coûteuses et longues à mesurer.

La première étape est en principe un processus rétroactif en boucle, le modèle moléculaire devant être modifié jusqu’à l’obtention d’une convergence entre propriétés calculées et propriétés simulées. Avec la seconde étape commence l’application technique pour l’ingénieur. La liste des méthodes de calcul de propriétés présentée dans cette section reflète avant tout un choix de l’auteur influencé notamment par son expérience et ses orientations personnelles en recherche. Cette liste n’est pas exhaustive des possibilités offertes par la modélisation moléculaire. Elle tente néanmoins de répertorier les méthodes les plus fréquemment sollicitées dans un contexte de recherche-développement à finalité industrielle.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © EditionsT.I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

J 1 013 1

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

Ce dossier complète les publications [J 1 011] et [J 1 012] sur les bases théoriques de la modélisation moléculaire. Le dossier [J 1 011], après quelques considérations générales, expose les notions élémentaires de physique statistique, de mécanique moléculaire et de méca- nique quantique à connaître pour situer l’assise scientifique des méthodes numériques contemporaines de modélisation et simulation moléculaire. Le dossier [J 1 012] présente plus en détail la gamme des méthodes de chimie quantique, qui comprend les méthodes de type « Hartree-Fock » et « post Hartree-Fock », d’une part, et les méthodes basées sur la théorie de la fonctionnelle de la densité électronique, d’autre part (DFT).

tiwekacontentpdf_j1013

1. Pr opriétés mécaniques

Le sujet est traité en détail dans la référence [1], avec une appli- cation au cas des polymères amorphes et cristallins. On se bornera ici à rappeler l’approche générale valable sous les hypothèses de la théorie de l’élasticité linéaire.

Dans ce cadre, le tenseur symétrique de rang 4 des constantes

élastiques

rang 2 des contraintes σ et des déformations

C est par définition relié aux tenseurs symétriques de

:

C ijkl = (σ ij /ε kl ) T, εkl

(1)

Le solide, supposé parfaitement élastique étant représenté par une maille élémentaire contenant N atomes, de vecteurs (a 0 , b 0 , c 0 ) et de volume V 0 en l’absence de contraintes extérieures, répond aux contraintes en se déformant pour adopter, à l’équilibre sous contraintes, une nouvelle maille élémentaire de vecteurs (a, b, c ). Si l’on désigne par [h 0 ] et [h] les matrices colonnes représentant ces vecteurs, [ ] 1 l’inverse et [ ] T la transposée d’une matrice, on a :

[h]

(2)

Le tenseur des contraintes instantané peut être obtenu, quant à lui, à partir de l’expression du viriel :

=

1

----

2

(

[

[h]

T

0

]

–1

T

⋅⋅

[h]

[

h

0

]

–1

1)

1

σ

= –

1/V

0

i

m

i

[v ]

i

[v ]

i

T

+

i < j

[r

ij

]

[f ij

]

T

(i

=

1

à N )

(3)

avec m i masse,

[v i ]

[r ij ]

vecteur vitesse de l’atome i,

vecteur reliant l’atome i à l’atome j,

force exercée par l’atome j sur l’atome i.

À l’équilibre, les vitesses s’annulent et le membre de droite de l’expression se réduit à la deuxième somme.

La loi de Hooke généralisée reliant linéairement contraintes et déformations à l’énergie libre du système conduit enfin à l’expres- sion suivante, valable pour le système à l’équilibre :

(4)

[f ij ]

C ijkl =

1/V 0 ( 2 E pot /ε ij ε kl ) T, ,

ε ij ε kl

avec

E pot

énergie potentielle, donnée par exemple par le champ de forces adopté.

La loi de Hooke généralisée s’écrit par ailleurs :

σ ij

=

∑ ∑

k

l

C ijkl ε kl

(k = 1 à 3, I = 1 à 3)

(5)

En notation simplifiée de Voigt, σ ii devient σ i pour i = 1 à 3,

σ 31 = σ 5

et

σ ij = σ ji

ε ii

par symétrie, et σ 32 = σ 4 ,

devient ε i pour i = 1 à 3, ε ij = ε ji par symétrie, et ε 32 = ε 4 /2, ε 31 = ε 5 /2

et ε 21 = ε 6 /2.

σ 21 = σ 6 . Similairement,

La loi de Hooke a alors pour expression :

avec

C ij

σ i

=

j

élément

contraintes (

de

C ij ε j

(j = 1 à 6)

 

(6)

matrice

(6 × 6)

symétrique

des

la

=

C

en notation matricielle).

Dans le cas d’un corps élastique isotrope, cette matrice des contraintes s’exprime avec les deux seuls coefficients de Lamé λ et µ :

C ii = λ + 2µ (i = 1 à 3) ; C 12 = C 13 = C 23 = λ ; C ij = µ (i = 4 à 6)

(7)

les autres coefficients étant tous nuls.

Les modules de traction (module de Young) E, de cisaillement G, de compression adiabatique K (bulk modulus) et le coefficient de Poisson ν s’expriment en fonction de λ et µ par :

E = µ [(3λ + 2µ)/(λ + µ)]

(8)

G = µ

(9)

K = λ + 2µ/3

(10)

ν = [λ/2 (λ + µ)]

(11)

Des considérations générales qui précèdent il ressort donc qu’une représentation atomistique d’un corps élastique, associée à un modèle de l’énergie d’interaction interatomique, permet en principe

de calculer directement les 21 composantes indépendantes du

tenseur des constantes élastiques, y compris pour un matériau ani- sotrope comme l’est en général un solide cristallin. Ce cas est du reste le plus simple dans la mesure où la configuration est fixée par l’ordre cristallin explicitement représenté. Il est possible d’utiliser les dérivées secondes de l’énergie potentielle par rapport aux défor- mations (équation (4)) ou encore de passer par l’évaluation des contraintes selon l’expression du viriel (équation (3)). On parlera alors de méthodes directes.

Dans le cas d’un solide amorphe, les constantes élastiques obte- nues sont relatives à la configuration particulière échantillonnée, et les valeurs macroscopiques ne peuvent résulter que d’une moyenne pondérée par la distribution de Boltzmann. À cet égard, l’échan- tillonnage de l’espace configurationnel du système à température finie procuré par des simulations de Monte Carlo ou de dynamique moléculaire peut être élégamment mis à profit via la méthode des corrélations de fluctuations introduite par Parinello et Rahman. Ces auteurs ont établi la relation fondamentale suivante entre fluctua- tions moyennes des déformations adiabatiques isentropiques de la cellule élémentaire périodique et constantes élastiques :

<

ε i ⋅ ∆ε j

> σ, H, N

=

(

kT/V

0

) C

–1

ij

(12)

avec

< >

valeur moyenne,

x

écart à la valeur moyenne (fluctuation),

H

enthalpie,

k

constante de Boltzmann.

J 1 013 2

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © EditionsT.I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

Gusev , Suter et Zehnder ont élaboré plus avant cette méthode, arrivant à une expression des constantes élastiques basée exclusi- vement sur les fluctuations des contraintes et déformations :

C ij

=

m

(

< σ

i

ε m >/< ε m

ε j

>)

(m = 1 à 6)

(13)

Ils démontrent en sus les identités sui vantes, qui fournissent un test de convergence de la prise de moyennes :

(14)

δ ij est le symbole de Kronec ker.

La valeur des prédictions obtenues avec ces méthodes de fluc- tuations reste elle aussi subordonnée, d’une part, à la qualité du champ de force mis en œuvre et, d’autre part, à la qualité de l’échantillonnage autorisé par les simulations.

Le cas des polymères est particulièrement difficile : d’une part, un matériau polymère réel est en général semi-cristallin, avec une connexion complexe et imparfaitement décrite des domaines amorphes et cristallins (sphérulites de nanoplaquettes cristallites interconnectées par des nanodomaines amorphes) ; d’autre part la dynamique des chaînes à l’état amorphe comporte des modes très lents à l’échelle des simulations de dynamique moléculaire, et de telles simulations ne garantissent jamais un échantillonnage confi- gurationnel exhaustif. Néanmoins, les travaux de validation conduits sur ce type de matériaux ont permis de conclure à une bonne fiabilité des méthodes directes pour le cas de polymères cristallins, alors qu’elles ne sont guère exploitables dans le cas des amorphes. Les méthodes de fluctuations donnent des résultats qualitativement corrects dans les deux cas, mais les convergences sont lentes, ce qui implique un effort de calcul important en termes de temps de simulation.

< σ i · ε j > = ( kT / V 0 ) δ ij

Il n’en reste pas moins vrai que, ces méthodes ayant un carac- tère général, elles peuvent s’appliquer en principe à tout type de matériau, tandis que rien ne s’oppose au recours au calcul ab initio pour les énergies et les géométries. Il existe déjà de nombreux exemples dans la littérature, notamment lorsqu’il s’agit de prévoir des propriétés mécaniques en conditions extrêmes, très difficile- ment accessibles à l’expérience (par exemple, les propriétés des phases constituant le noyau et le manteau des planètes).

2. Spectroscopies de vibration

Ce paragraphe présente le calcul des modes normaux de vibration autour de leur position d’équilibre des atomes inclus dans un modèle atomistique (molécule isolée ou modèle périodique). Les fréquences de ces modes correspondent au domaine spectral de l’infrarouge moyen à lointain allant grosso modo de 4 000 à quelques centaines de cm 1 . Une prédiction est en principe possible pour l’ensemble des modes de vibration accessibles, tandis que seuls les modes obéissant aux règles de sélection inhérentes à une technique spectroscopique expérimentale sont observables par cette technique.

Deux approches sont envisageables :

— le calcul de la matrice des constantes de force dans le cadre de l’approximation harmonique ; — le calcul de la transformée de Fourier de la fonction d’auto- corrélation des vitesses issue d’une simulation de dynamique moléculaire.

Cette deuxième approche est susceptible de fournir directement le spectre infrarouge du matériau simulé en s’affranchissant de l’approximation harmonique.

L’approximation harmonique revient à considérer chaque atome comme confiné autour de sa position d’équilibre dans un puits de potentiel de forme parabolique. En d’autres termes, l’énergie totale

instantanée du système en vibration est développée à l’ordre 2 en fonction des déplacements atomiques cartésiens pondérés en masse q i :

E = ----

1

2

∑ ∑

i

k

(

q

ik

/t) 2 +

∑ ∑ ∑ ∑

i

j

k

l

avec

N

nombre d’atomes.

q ik q jl

(i et

( ∂ 2 V /q ik q jl

) eq

j =

1

à

N , k

et

l

= 1 à 3)

(15)

Le déplacement q ik a pour expression :

(16)

M i est la masse et x ik est l’une des trois coordonnées cartésien-

nes de l’atome i, et l’indice

la suite, on contracte le double indice ik en l’indice i , variant de 1

à 3N ). Les dérivées secondes de l’énergie potentielle par rapport à ces déplacements pondérés en masse, évaluées à la configuration nucléaire d’équilibre sont appelées constantes de force quadratiques f ij , avec pour expression :

(17)

pour éléments

f ij = (2 V/q i q j ) eq

indique la position d’équilibre (par

q ik

=

M

1/2

i

eq

(

X ik

X ik , eq

)

La matrice carrée [f ] de dimension 3N ayant les

f ij

est appelée matrice hessienne pondérée en masse. Les équations du mouvement dans l’approximation harmonique peuvent s’écrire sous forme du système de 3N équations différentielles ordinaires du second degré :

2 q j /t 2

=

j

f ij

q

i

(i = 1 à 3 N )

(18)

Ce système peut être résolu sous forme d’une équation matricielle aux valeurs propres. La solution fait apparaître les 3N modes nor- maux de vibration comme les vecteurs propres de la matrice [f ] for- mant une base orthogonale dans l’espace des déplacements, et les 3N fréquences propres des modes normaux comme les racines car- rées de ses valeurs propres. Le calcul des fréquences propres exige ainsi, en général, une étape de diagonalisation de la matrice hes- sienne. Dans le cas d’un système non périodique, trois de ces modes normaux correspondent aux translations du centre de gravité, et trois autres aux rotations autour des axes principaux. À ces six modes non vibrationnels correspondent des valeurs propres nulles. Il existe plusieurs méthodes d’évaluation de la hessienne, par différences finies ou par double dérivation directe de l’énergie potentielle, si l’on dispose d’une expression analytique dérivable de cette dernière. Dans le cadre de la méthode de Kohn-Sham en DFT (cf. [J 1 012]), certaines fonctionnelles d’échange-corrélation autorisent le calcul direct des forces de Hellmann-Feynmann et, par là, un accès aisé à la hessienne. Les symétries présentes dans le système se reflètent naturelle- ment dans la structure de la matrice hessienne et réduisent le nombre de modes normaux indépendants. Dans le cas des systèmes périodiques, les modes et fréquences propres dépendent en outre de la direction d’un vecteur k appar- tenant à la première zone de Brillouin : c’est le phénomène de dispersion des phonons. Le calcul conduit à une structure de bandes. On se reportera par exemple à la référence [2] pour une discus- sion plus élaborée et critique des techniques de calcul ab initio des spectres vibrationnels, avec de nombreux exemples illustrant les performances de ces techniques. L’approximation harmonique conduit à prédire des fréquences de vibration qui peuvent être en erreur systématique de plusieurs dizaines de cm 1 , alors que l’on souhaite une erreur absolue infé- rieure à 10 cm 1 pour être en mesure d’attribuer sans ambiguïté certains pics expérimentaux. De tels niveaux de précision sont pos- sibles dans le cadre d’un calcul ab initio des fréquences de vibration, pour autant que l’on procède à des corrections d’anharmonicité

T oute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © Editions T .I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

J 1 0 1 3 3

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

systématiques. Il existe des corrélations empiriques par classes de molécules et types de liaison permettant de corriger les fréquences calculées ab initio. L’approche la plus satisfaisante consiste à résoudre l’équation du mouvement du noyau sur la surface d’éner- gie potentielle de Born-Oppenheimer « réelle » auquel il est soumis. Dans le cas des vibrations d’un atome léger comme H (ex : fré- quences d’élongation des groupes hydroxyles), il peut s’avérer nécessaire d’aller jusqu’à résoudre l’équation de Schrödinger du mouvement du noyau traité comme une particule quantique confinée à la surface d’énergie potentielle obtenue préalablement dans l’approximation de Born-Oppenheimer [3].

3. Propriétés thermodynamiques

La mécanique statistique permet en principe de calculer l’enthal- pie, l’entropie et les capacités thermiques de toute substance décrite par un modèle moléculaire. Ces propriétés sont évidemment primordiales en génie chimique, qu’il s’agisse de prévoir le sens d’une réaction, la quantité de chaleur dégagée ou absorbée par mole transformée, ou encore la pression totale optimale à laquelle doit opérer le procédé. L’évaluation de fonctions thermochimiques est, par conséquent, l’une des applications les plus récurrentes de la modélisation moléculaire. Réciproquement, les données thermo- chimiques très précises dont on dispose pour un grand nombre de corps purs fournissent des tests très exigeants pour les méthodes théoriques, et notamment pour les méthodes de chimie quantique.

Les formules exposées ci-après sont valables pour le gaz idéal de molécules polyatomiques : ce point de départ reste cepen- dant d’un champ d’application très large.

Des formules analogues permettent d’évaluer les fonctions thermodynamiques des solides et de leurs surfaces en prenant en compte l’énergie électronique totale, d’une part, et le spectre de phonons, d’autre part.

3.1 Entropie

L’entropie molaire S est la somme des contributions S tr , S rot et S vib imputables aux degrés de liberté découplés de translation, rotation et vibration, et d’une constante universelle.

L’entropie molaire de translation est déterminée par la masse molaire M et la pression P du gaz :

 

S tr = R {3/2 + ln [(2πMkT/2) 3/2 (RT /P )]}

(19)

avec

R

constante molaire des gaz (en cal · mol 1 · K 1 ),

k

constante de Boltzmann,

T

température absolue.

 

S rot = R {3/2 + ln [(πω A ω B ω C ) 1/2 /s]}

(20)

s est le nombre de symétrie de la molécule, et :

 

ω A = 8πkTI A /h 2

(21)

avec

h

constante de Planck,

I A

un des trois moments d’inertie principaux I A , I B et I C de la molécule.

S vib

=

R

{ (

hν

i

/kT )/ exp

[

ln

[

1

(

hν

i

/kT ) 1]

exp

(

hν

i

/kT )]}

(22)

où la somme est étendue à l’ensemble des modes normaux de vibration de fréquences ν i (cf. § 2).

3.2 Enthalpie

L’enthalpie molaire du gaz idéal H (T ) est la somme de son éner- gie interne U (T ) et du terme PV = RT. L’énergie interne molaire U (0) à température nulle est la somme de l’énergie de vibration « au point zéro » U vib (0) de l’oscillateur quantique que constitue la molécule et de l’énergie électronique E à l’état fondamental. On a :

(23)

U vib (0)

=

1/2(R/k )

hν

i

À T non nulle, les contributions des degrés de liberté de trans- lation, rotation et vibration à l’énergie interne sont (en cal · mol 1 ) :

U tr (T ) = 3/2 RT

(25)

U rot (T ) = 3/2 RT (RT pour les molécules linéaires)

(24)

U vib (T )

=

Il vient finalement :

(R /k )

hν i / exp

[

(

hν

i

/kT ) 1]

H (T ) = E + U vib (0) + U tr (T ) + U rot (T ) + U vib (T ) + RT

(26)

(27)

3.3 Capacité thermique à pression constante

(en cal · mol 1 · K 1 ) peut, elle

aussi, être décomposée en contributions de translation, rotation et vibration avec :

(28)

C p tra = 5/2 R

(29)

La capacité thermique isobare C

C p rot = 3/2 R

p

(R pour les molécules linéaires)

C p vib

=

R

(

hν

i

/kT ) 2 exp

(

hν

i

/kT )/

1

[

exp

C p = C p tra + C p rot + C p vib

(

hν

i

/kT )] 2

(30)

(31)

3.4 Précision de l’évaluation ab initio des grandeurs thermochimiques

Une précision absolue de l’ordre de la kcal · mol 1 sur l’énergie libre peut être espérée en général lorsque le calcul de l’énergie élec- tronique prend en compte l’énergie de corrélation (par exemple, niveau DFT/GGA). Cependant, les précisions accessibles sont moindres pour les systèmes où la corrélation électronique est la plus marquée, par exemple les molécules aromatiques. La figure 1 illustre ce problème. Par ailleurs, les formules (22) et (26) montrent que les fréquences des modes normaux de vibration doivent être calculées avec une bonne précision sur l’ensemble du spectre. Enfin, on est le plus souvent intéressé par les variations d’enthalpie libre et d’enthalpie occasionnées par une réaction chimique : l’erreur sur ces bilans cumule donc en principe les erreurs commises sur les enthalpies de chaque produit et chaque réactif. Fort heureusement, les erreurs induites par une méthode théorique donnée sont géné- ralement systématiques et, par conséquent, les différences d’une molécule à l’autre ont plus de sens que les valeurs absolues. Pour bénéficier de cette compensation d’erreurs dans un calcul thermo- chimique théorique, la règle d’or est donc de conserver rigoureuse- ment les mêmes options pour tous les partenaires de la réaction.

On trouvera une discussion approfondie des performances pré- dictives des méthodes ab initio (hors DFT) à l’égard des propriétés

thermochimiques moléculaires dans la référence [4]. La figure 2 illustre ce point par l’excellent accord entre théorie et expérience pour les équilibres entre le n hexane et ses isomères

J 1 0 1 3 4

T oute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © Editions T .I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

300 AnthracAnthracènene Anthracène 250 Phénanthrène PhPh énanthrnanthrènene Biphényle BiphBiph é nyl
300
AnthracAnthracènene
Anthracène
250
Phénanthrène
PhPh
énanthrnanthrènene
Biphényle
BiphBiph
é
nyl
200
NaphtalNaphtalènene Naphtalène
150
Benzène
BenzBenzènene
100
50
0
0
50
100
150
200
250
∆H
f expérimental (kJ · mol –1 )
°
y = 1,1435 x
r 2 = 0,9987
∆H ° f calculé (kJ · mol –1 )

Le calcul dans cette série où l'énergie de corrélation électronique est très significative conduit à une surestimation systématique de l'ordre de 14 % relatif. Le calcul au niveau DFT/GGA ne conduit pas à un résultat sensiblement amélioré en ce qui concerne les valeurs absolues.

Figure 1 – Comparaison entre enthalpies standards de formation de mono- di- et triaromatiques calculées au niveau quantique semi-empirique (AM1) et expérimentales

0,5 x 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 50 100 150
0,5
x
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
50
100
150
200
250
300
350
400
450
t (°C)
x
NC6
NC6 exp
x
x
M2C5
M2C5 Exp
x
x
M3C5
M3C5 Exp
x
x
DM22C4
DM22C4 Exp
x
x
DM23C4
DM23C4 Exp
x
NC6
hexane normal
M
groupement méthyle
DM
2 groupements méthyles

Les chiffres correspondent à la position des groupements méthyles dans les isomères de l’hexane.

Figure 2 – Comparaison entre fractions molaires à l’équilibre expérimentales (symboles) et calculées (traits continus) pour les isomères de l’hexane

branchés en fonction de la température. Ces isomérisations sont très légèrement exothermiques dans le sens des ramifications, tandis que les fractions molaires des constituants du mélange à l’équilibre dépendent exponentiellement des enthalpies libres des réactions. Le test est donc très sensible aux erreurs sur ces quan- tités. Les isomères en C6 ayant des indices d’octane très différents, l’évaluation précise des compositions à l’équilibre revêt une impor- tance toute particulière pour l’optimisation de certains procédés de production de carburants en raffinerie.

4. Spectroscopies de transitions électroniques

Le calcul des spectres d’absorption ou d’émission dans les

domaines énergétiques impliquant des transitions électroniques, c’est-à-dire à partir du visible vers les plus courtes longueurs d’onde, exige une bonne précision sur les niveaux d’énergie des états excités.

Dans l’approximation dipolaire, une transition d’absorption est décrite par l’élément de matrice :

A if = <Ψ i |E |Ψ f >

avec

E

vecteur champ électrique local,

Ψ i et Ψ f

fonctions d’ondes correspondant aux états ini- tiaux et finaux de la molécule.

La transition aura lieu à la longueur d’onde :

 

λ = hc /(E f

E i )

avec

h

constante de Planck,

c

vitesse de la lumière dans le vide,

E f et E i

énergies des états finaux et initiaux respecti- vement.

L’intensité de la transition est proportionnelle à |A if | 2 .

Pour des fonctions d’ondes représentées par des déterminants de Slater, les considérations de symétrie permettent de prévoir quels seront les éléments de matrice de transition différents de zéro (règles de sélection).

Une approximation courante consiste à identifier l’état initial à l’état fondamental, représenté par le déterminant de Slater formé des spinorbitales occupées, et à représenter un état final par un déterminant dans lequel une spinorbitale vacante est substituée à une spinorbitale initialement occupée, sans changement de l’état de spin. Cette stratégie peut être appliquée dans le cadre de la DFT aux orbitales de Kohn-Sham, donnant la possibilité, si les règles de symétrie sont préalablement invoquées, d’une évaluation relati- vement rapide des éléments non nuls de la matrice de transition. Les spectres d’absorption optique ainsi obtenus seront toutefois considérés au mieux comme semi-quantitatifs, tant en ce qui

concerne les intensités que les positions des raies. Ce dernier point,

notamment, est affecté par la sous-estimation systématique en DFT

des écarts entre niveaux occupés et niveaux vacants. Les approches

incorporant une part d’échange exact dans la fonctionnelle

d’échange corrélation seront préférables à cet égard (ex : B3LYP pré-

férable à PW91).

5. Spectroscopie RMN

Les « déplacements chimiques » des raies de résonance magné- tique nucléaire dans les matériaux isolants ont pour origine les champs magnétiques locaux induits dans le cortège électronique des noyaux par le champ magnétique appliqué. Le tenseur d’écran-

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © EditionsT.I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

J 1 013 5

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

tage σ (r ) relie le terme au premier ordre du champ induit locale-

ment

au champ magnétique externe appliqué B :

B

1

ind

B

1

ind

(r )

=

σ (r ) B

(32)

ab initio par une méthode per-

turbative et de prédire, à partir de là, le tenseur σ (r ). Des implémentations efficaces de cette méthode dans le cadre de la DFT existent aussi bien pour les molécules que pour les solides. Ces calculs donnent des résultats assez précis et fiables, suscep- tibles de s’avérer extrêmement utiles pour aider à l’interprétation de spectres RMN complexes.

Il est possible de calculer

B

1

ind

(r )

6. Processus élémentaires diffusifs et réactifs

Nous allons, dans ce paragraphe, appliquer les principes de la modélisation moléculaire au calcul des barrières de transition et des facteurs de fréquence. Une réaction chimique, ou la diffusion d’un atome sur une surface, ou encore la migration d’une lacune dans un réseau cristallin, cor- respondent à des changements de configurations des noyaux ato- miques depuis un état stable ou métastable vers un autre. Le point représentatif du système passe d’un minimum local à un autre sur l’hypersurface d’énergie libre (HSEL). Tous les chemins de modifica- tion des coordonnées nucléaires relatives (déformation de la configuration initiale) sont possibles, mais le principe de moindre action stipule que le chemin le plus probable est le chemin en tout point duquel l’énergie est minimale par rapport à toute direction sauf celle qui lui est colinéaire (chemin de réaction intrinsèque, ou Intrin- sic Reaction Path, IRC). Les maximums d’énergie potentielle le long de ce chemin sont des minimums dans toutes les autres directions :

ils constituent des points selles. La configuration nucléaire en un point selle est appelée un état de transition. Les points selles, où l’HSEL présente une courbure négative dans une seule direction, sont caractérisés par une matrice hessienne dont un seul élément est négatif. Le mode de déformation correspondant est dissociatif de l’état de transition, soit vers les réactifs, soit vers les produits. Le sys- tème d’équations (18) peut toujours être résolu en introduisant le concept de fréquence imaginaire : dans l’approximation harmo- nique, la fréquence correspondant au mode de déformation disso- ciatif de l’état de transition est un nombre imaginaire pur. Réciproquement, un état de transition vrai est caractérisé par une seule fréquence imaginaire. La théorie de l’état de transition développée dès 1936 par Eyring et Langmuir relie la probabilité de réaction r par unité de temps (en s 1 ) à la hauteur de barrière d’énergie libre G , avec :

(33)

(34)

la différence d’énergie libre du système entre la configuration de l’état de transition G TS et celle des réactifs G R aux conditions de température et de pression de l’expérience (k et h sont les constantes de Boltzmann et de Planck respectivement). L’évaluation des cinétiques d’étapes élémentaires requiert donc en principe la localisation très précise de l’état de transition sur l’HSEL. Une approche possible consiste à calculer point par point l’énergie libre de façon à réaliser un maillage de l’HSEL dans un voisinage supposé de l’état de transition, puis à localiser ce dernier le plus précisément possible par interpolation. Au besoin, une représentation paramétrique de l’HSEL calée sur les points de maille calculés permettra une application plus commodes d’algo- rithmes de recherche automatique du point selle. La figure 3 pré-

et

G = G TS G R = E TS

r = (kT/h) exp (– G /kT )

4 P ∆H f ° XXTS3TS3 TS3 3,5 290,096 283,941 277,786 271,631 265,476 XXTS4TS4 TS4
4
P
∆H f
°
XXTS3TS3 TS3
3,5
290,096
283,941
277,786
271,631
265,476
XXTS4TS4 TS4
3
259,321
253,166
247,01
240,855
XX RR
R
234,7
2,5
228,545
222,39
216,234
210,079
2
203,924
197,769
191,614
XXTTS2S2 TS2
TS1
185,459
XX R RR ’
179,303
1,5
XX R’’ RR’’
173,148
1,6
2
2,4
2,8
Distances C2-C3 (Å)
Les degrés de liberté choisis pour cette cartographie sont les distances
C2-C3 et C2-C4. Le chemin de réaction intrinsèque approché est figuré en
trait continu bleu, partant du minimum local R pour rejoindre le
minimum local P en passant par les états de transition TS1, TS2 et TS3,
et les intermédiaires R' et R" (minimums locaux).
Distances C2-C4 (Å)

Figure 3 – Topographie de l’hypersurface d’énergie potentielle (enthalpie standard de formation calculée au niveau AM1) pour le mécanisme de bêta-scission d’un carbocation, l’ion hexénium

sente un exemple relativement simple de « cartographie » de la HSE pour la scission d’un carbocation, ici en termes d’énergie stan- dard de formation calculée point par point au niveau quantique semi-empirique (méthode AM1). Cet exemple montre qu’il peut s’avérer très difficile de localiser l’IRC sur la seule base de l’intui- tion.

Le profil enthalpique prévalant le long du chemin déterminé sur cette figure 3 est illustré figure 4, avec les configurations obtenues pour les sommets du graphe de la figure 3.

On fait généralement l’hypothèse simplificatrice que la variation

d’entropie relativement aux réactifs varie très peu au voisinage de l’état de transition, de telle sorte que la HSEL et la HSEP sont paral- lèles dans ce voisinage. La première étape du calcul consistera donc à localiser le point selle sur la surface de Born-Oppenheimer par exemple, puis à évaluer les contributions entropiques pour cette configuration nucléaire. L’occurrence d’une seule fréquence imagi- naire dans le jeu des fréquences propres des modes normaux de vibration déduites du calcul de la matrice hessienne permet de confirmer a posteriori le caractère de point selle. Cette fréquence

« négative » est toutefois omise dans le calcul de

(pour une discussion en profondeur voir cf. référence [5]). Il convient de garder à l’esprit que cette hypothèse ne se justifie pas toujours : c’est le cas, par exemple, de la dissociation thermique des liaisons simples C—C dans les alcanes, pour lequel un état de transition est obtenu sur la HSEL à une distance C—C supérieure à la distance donnant une énergie potentielle maximale sur la surface de Born- Oppenheimer. La mise au point de méthodes générales de localisation d’un état de transition sur la HSEL est un domaine de recherche actif : une piste prometteuse fait usage de simulations de dynamique moléculaire ab initio sous contraintes.

Les méthodes de recherche d’états de transition sur la HSEP les plus courantes procèdent par interpolation entre les coordonnées nucléaires correspondant aux réactifs et celles correspondant aux produits : l’approche la plus simple, dite du transit synchrone

S

vib

et

H

vib

J 1 013 6

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © EditionsT.I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

230 220 + + + 210 TS3 TS1 TS2 200 190 R' 180 R'' +
230
220
+
+
+
210
TS3
TS1
TS2
200
190
R'
180
R''
+
170
+
R
P
160
+
+
150
140
130
∆H ° f AM1 (kcal · mol –1 )

L'état TS1 est un cyclopropénium. La double liaison entre C2 et C3 apparaît à partir de TS3, qui correspond à l'étape cinétiquement limitante sur ce chemin réactionnel.

Figure 4 – Bêta-scission de l’hexénium : profil enthalpique le long du chemin réactionnel de la figure 3, avec les conformations correspondant aux sommets du graphe

linéaire (Linear Synchronous Transit, LST) consiste à générer des configurations nucléaires par interpolation linéaire, puis à calculer l’énergie de chacune de ces configurations de façon à localiser un maximum, s’il existe, dans un intervalle. Dans cet intervalle, une nouvelle interpolation linéaire de pas réduit permettra une nouvelle évaluation plus précise de la position du maximum, jusqu’à obtenir une localisation dans un voisinage prescrit. La technique QST (Quadratic Synchronous Transit ) repose sur l’hypothèse d’un comportement quadratique de la HSEP au voisinage du point selle.

La méthode du « collier de perles élastique » ou NEB (Nudged Elas- tic Band ) [6] exploite par analogie la propriété qu’aurait dans notre espace tridimensionnel un collier de perles monté sur un cordon élas- tique de se conformer spontanément au chemin de moindre altitude (donc à l’IRC), s’il était tendu par dessus un col séparant deux vallées où ses extrémités seraient fixées. L’algorithme génère des images interpolées régulièrement espacées entre les configurations réactifs R et produits P. Un potentiel attractif fictif est généré entre deux images consécutives. Pour chaque image, la configuration d’énergie minimale est recherchée sous la contrainte de ces forces fictives qui minimisent sur l’ensemble de la chaîne l’écart à la direction RP. Ce type d’algorithme s’implémente très efficacement sur une machine parallèle, chaque image étant distribuée sur un processeur particulier, les communications entre processeurs étant limitées aux contraintes d’alignement.

Dès lors qu’une approximation raisonnable d’un état de transition est obtenue, caractérisée par une matrice hessienne présentant au mieux un seul, éventuellement quelques modes normaux de vibra- tion de fréquences imaginaires, la localisation du point selle peut être affinée par une optimisation de géométrie sous contraintes :

recherche d’un maximum d’énergie le long du mode dissociatif le plus probable (fréquence imaginaire la plus élevée) et d’un mini- mum le long de tous les autres modes normaux. Cette méthode est appelée « suivi des vecteurs propres » (Eigenvectors Following).

En règle générale, les algorithmes de recherche de l’état de tran- sition fonctionnent d’autant mieux que le chemin réactionnel est simple et fait intervenir un petit nombre de coordonnées nucléaires. Les outils de visualisation graphique du chemin réactionnel postulé apportent une aide précieuse dans la préparation des calculs. La détermination ab initio précise d’un état de transition et de la barrière d’énergie associée représente toujours un surcoût très significatif en temps de calcul, par rapport à une « simple » optimisation de géo- métrie. La valeur de l’information obtenue justifie le prix à payer

dans les nombreux cas de figure où une détermination expérimen- tale de la cinétique intrinsèque d’une étape réactionnelle élémentaire est hors d’atteinte.

Notons finalement que la dépendance exponentielle de r en G indiquée par la relation (33) implique que l’erreur relative sur r est de l’ordre du rapport de l’erreur absolue sur G à RT. Ce dernier terme valant typiquement 1 kcal/mol, et une erreur sur G du même ordre au mieux étant plutôt la norme, on voit qu’il ne faut pas espérer beaucoup mieux en général, dans l’état actuel des

techniques de modélisation moléculaire, qu’une évaluation de

l’ordre de grandeur de r (100 % d’erreur relative).

7. Descripteurs moléculaires, relations structures- propriétés et formulation

L’ingénieur chimiste ayant pour tâche, dans le cas le plus général, la production d’une substance exprimant de manière optimale une propriété d’usage, au meilleur prix de revient, en toute sécurité, et avec le plus souvent une forte valeur ajoutée à l’innovation, dispose de degrés de liberté dans le choix des structures chimiques, d’une part, et de leur association en « formules », d’autre part. Que cette propriété d’usage soit une couleur, un ensemble de propriétés méca- niques ou une activité biologique, nous avons vu que le cas le plus favorable correspond à la mise en évidence d’un déterminisme physico-chimique clair et quantitatif pour une propriété d’usage. Envisagée comme technique de l’ingénieur, la modélisation molé- culaire dans son ensemble tend à des découvertes de cet ordre. Malheureusement ce déterminisme est bien souvent si complexe que de très nombreuses années-chercheurs doivent être investies pour aboutir à un tel résultat. L’enjeu économique ne le justifie pas toujours. Ou encore, les méthodes expérimentales et théoriques combinées ne sont pas à même, en l’état instantané de la science, de cerner suffisamment le mécanisme. C’est pourquoi la recherche de corrélations entre mesures de propriétés et éléments qualitatifs et quantitatifs de description des structures s’avère très souvent une alternative raisonnable et fructueuse. Cette démarche est générale- ment désignée dans la littérature anglo-saxonne spécialisée par les acronymes QSAR (Quantitative Structure Activity Relationship) et QSPR (Quantitative Structure Property Relationship).

La recherche du modèle corrélatif optimal relève des techniques d’analyse statistique des données [12].

La modélisation moléculaire permet de générer de nombreuses quantités caractéristiques pour une structure chimique donnée, ou descripteurs. II peut s’agir tout simplement de la masse molaire, ou encore des coefficients stœchiométriques associés à chaque élé- ment dans la formule brute. La donnée d’une formule développée permet de comptabiliser des groupes fonctionnels ou, puisqu’il s’agit d’un graphe moléculaire, de calculer des indices topologiques fondés dans la théorie des graphes. De manière encore plus élabo- rée, la construction d’une conformation spatiale représentative donne accès à des caractéristiques géométriques telles que les dimensions du parallélépipède enveloppe, les caractéristiques de

l’ellipsoïde d’inertie, etc. Cette conformation spatiale pourra corres- pondre à un minimum de l’énergie potentielle représentée par un champ de forces ou bien traitée au niveau quantique. La représen- tation spatiale de la distribution de densité électronique fournit les descripteurs souvent très pertinents que sont les moments multi- polaires de la structure. Des effets d’environnement (présence d’un

solvant, influence de champs électriques

compte, tout comme par le biais de simulations de dynamique moléculaire ou de Monte Carlo l’effet de la température et de la pression sur les valeurs moyennes et leurs fluctuations.

La démarche consiste typiquement à rechercher, pour un ensemble

de structures {S 1 ,

S n } (par exemple des molécules d’une

)

peuvent être pris en

,

S p ,

,

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © EditionsT.I.

J 1 013 7

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

certaine famille) appelé ensemble d’apprentissage, une corrélation mathématique explicite entre une propriété mesurée Y et un

ensemble {X 1 ,

(35)

Le calcul des descripteurs X ki correspondant à une structure S i , n’appartenant pas à l’ensemble d’apprentissage, et la connaissance du modèle F permettent d’estimer la propriété Y i en l’absence de mesure expérimentale. Un tri a priori des structures selon un critère de valeur seuil ou d’intervalle pour la propriété Y est donc envisa- geable. Seules les structures survivant à ce tri virtuel seront syn- thétisées. La mesure effective de leur propriété permet, le cas échéant, d’étoffer l’ensemble d’apprentissage et, par là, d’améliorer la valeur prédictive du modèle F. On entrevoit ici l’esquisse d’une boucle d’autoapprentissage, complément nécessaire des nouvelles méthodes d’expérimentation à haut débit.

On gardera à l’esprit, cependant, que la valeur prédictive de ce type de modèle est intrinsèquement limitée : il est prudent de considérer ces modèles comme des outils « d’interpolation » entre structures plutôt que des outils d’extrapolation, sauf à rester dans un voisinage raisonnable des structures de l’ensemble d’appren- tissage. Un modèle peut toutefois révéler un authentique détermi- nisme physico-chimique, comme on en donnera dans le dossier suivant [J 1 014] un exemple : dans cette mesure, la démarche QSAR/QSPR n’est pas dénuée de valeur heuristique, mais le plus souvent il n’est guère possible de tirer de conclusions au-delà du constat d’une corrélation parfois complexe faisant intervenir des variables apparemment indépendantes.

Bien entendu, dans la plupart des cas, ce sont des tris « multicri- tères » qui permettront de cerner au mieux les structures idoines.

,

X k ,

,

X m } de descripteurs de ces structures :

X kp ,

X mp )

Y p = F (X 1p ,

Exemple : un nouvel antifongique devra non seulement s’avérer actif vis-à-vis de sa cible, mais encore sélectif, inoffensif pour les plantes et leurs hôtes (par exemple les abeilles), compatible avec tel ou tel vecteur de mise en œuvre

La liberté d’exploitation de la structure devra être vérifiée : on notera au passage que la brevetabilité d’une famille de structures chimiques repose entre autres sur une description suffisante. La modélisation moléculaire fournit à cet égard en principe un nou- veau et très vaste champ descriptif. Dès lors, en effet, qu’un modèle prédictif du type de la relation (35) a été élaboré, il synthétise une forme d’activité inventive pour laquelle il peut s’avérer opportun de rechercher une protection juridique : les revendications porteront alors sur des structures caractérisées par des valeurs des descrip- teurs X ki bornées par des seuils ou confinées dans des fourchettes préférées. Le mode de calcul des descripteurs devra alors être décrit en détail.

En pratique, un projet QSAR commence par l’identification de l’ensemble d’apprentissage : plus ce dernier est fourni, plus robuste seront le ou les modèles à bâtir. Ce n’est pas la partie la moins coûteuse, tant s’en faut, car il s’agit d’associer une cause molécu- laire, c’est-à-dire la présence d’une substance pure parfaitement caractérisée, à la mesure sans ambiguïté d’un effet. La réponse linéaire ou non linéaire à un ajout dosé donne généralement une réponse pertinente. L’application des méthodes de « fouille de données » (data-mining) à des archives accumulées pendant de longues périodes d’expérimentation par essais et erreurs peut se révéler une approche efficace pour la valorisation, dans la perspec- tive QSAR, d’un patrimoine de connaissances spécialisées.

La deuxième étape consiste en un calcul du plus grand nombre possible de descripteurs pour chacune des structures constituant l’ensemble d’apprentissage. Un module commercial de qualité acceptable en propose plusieurs centaines. Le choix d’une gamme initiale de descripteurs résultera généralement d’un compromis équilibrant souci d’exhaustivité et temps de calcul. L’expérience acquise sur le type de problème à traiter et, bien entendu, le rai- sonnement hypothético-déductif appuyé sur la plus large culture physico-chimique possible sont ici des facteurs essentiels de suc- cès. Cette étape débouche sur la constitution d’une matrice descrip-

tive initiale D o de n lignes et m + 1 colonnes, les n éléments de la

première colonne étant les mesures expérimentales Y

étant fournis par les n · m valeurs calculées X kp des descripteurs.

Les spécialistes d’une très grande entreprise multinationale affir- ment travailler avec une base de l’ordre de 15 000 descripteurs, applicables à un catalogue de produits purs disponibles comportant plusieurs millions de références. La disponibilité industrielle d’un produit implique des informations de coût, délai et quantités, ainsi qu’une fiche toxicologique. Bien évidemment, pour un problème de formulation donné, seul un sous-ensemble limité d’un tel thesaurus sera mis en œuvre : encore faut-il le délimiter à bon escient.

, les autres

p

Un premier tri parmi les descripteurs peut être effectué sur la base de la matrice de corrélation C carrée symétrique de dimension (m + 1) · (m + 1) construite à partir de D o . Les éléments de cette

matrice sont les coefficients de corrélation entre variables :

r ij (1 i, j

m + 1)

r ij = c ij /(v i v j ) 1/2

(36)

avec

c ij

v i et v j

c ij

=

covariances, variances sur les variables représentées par les colonnes i et j de la matrice D o telles que :

v i

=

(

x

i

(

x

<x

i

i

>)

<x

(

x

i

j

>) 2 /n

<x

 

1 i n

(37)

j

>)/n

1 i, j n

(38)

où les x i et <x i > représentent respectivement les valeurs prises par une variable dans la colonne correspondante i de D o et leur moyenne (qu’il s’agisse de la variable dépendante Y à expliquer ou des variables explicatives X k ). Il est souvent utile de procéder à une standardisation des données dans chaque colonne avant de calculer la matrice C.

Les coefficients r

ij

varient entre + 1 (corrélation parfaite) et – 1

(anticorrélation parfaite). Un coefficient nul signale l’absence totale de corrélation. Les termes diagonaux sont trivialement égaux à 1. Les termes non diagonaux permettent d’identifier, d’une part, s’il existe des variables X k corrélées ou anticorrélées à Y et, d’autre part, les redondances dans le choix des descripteurs, signalées par de fortes corrélations entre les variables correspondantes. Sur cette base, il est possible de construire une matrice de description D 1 res- treinte à la variable Y et aux variables X k moyennement ou forte- ment corrélées (ou anticorrélées) à Y et non significativement corrélées entre elles. L’analyse statistique affinée, visant à construire le meilleur modèle F possible pour l’ensemble d’apprentissage donné, sera menée à partir de la matrice D 1 .

L’analyse statistique comporte classiquement plusieurs phases, après l’analyse initiale qui vient d’être décrite : la phase de réduction des données peut s’appuyer sur l’analyse en composantes principales ; l’analyse en grappes regroupe les variables selon des critères de similarité. Ce sont les diverses techniques de régression de données qui permettent l’élaboration du modèle F optimal :

régression linéaire simple ou régression multilinéaire, moindres carrés partiels (PLS pour Partial Least Squares ) et approximation par fonctions génétiques (GFA, Genetic Function Approximation). L’approche GFA optimise la forme fonctionnelle et les paramètres du modèle F au moyen d’un algorithme génétique. L’analogue des « gènes » est fourni par des termes mathématiques élémentaires, monômes, splines, etc. Le « chromosome » formé par combinaison linéaire de ces gènes est soumis à une pression sélective définie par un critère adaptatif, ici la valeur d’une fonction objective de type erreur quadratique moyenne sur la variable à expliquer. Entre popu- lations successives formées de nombreux chromosomes, l’évolution procède par sélection des plus aptes, mutations aléatoires et recom- binaisons. Un critère de convergence évolutive permet d’identifier le modèle optimal relativement à la variabilité génétique introduite (diversité des gènes, taille des chromosomes, taille des populations). L’approche GFA est très puissante, notamment du fait de la liberté qu’elle autorise sur la forme fonctionnelle du modèle F.

J 1 013 8

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © EditionsT.I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

Dans une phase finale, un modèle de régression des données doit être qualifié par une série de tests statistiques mesurant la qualité de l’ajustement et son pouvoir prédictif. Les tests de validation croisée consistent, par exemple, à séparer de manière systématique ou aléatoire l’ensemble d’apprentissage en un sous-ensemble d’ajustement du modèle et un sous-ensemble de validation pour lequel le résidu carré moyen ne doit pas être significativement dif- férent du résidu carré moyen obtenu sur la totalité de l’ensemble d’apprentissage.

8. Raccordement d’échelles en temps et en espace

Les méthodes de modélisation moléculaire représentent la matière à l’échelle spatio-temporelle de l’atome, dont les unités sont typiquement le bohr (0,05 nm) et la femtoseconde (10 15 s).

Une simulation atomistique basée sur des champs de force peut appréhender, dans l’état actuel des capacités informatiques, l’évo- lution temporelle d’un élément de volume renfermant de l’ordre de 10 6 atomes sur une durée de l’ordre de la nanoseconde (10 6 pas de temps).

En calcul ab initio, suivre de l’ordre de 10 3 atomes sur quelques picosecondes (10 3 pas de temps) représente déjà un tour de force.

L’ingénieur envisage couramment la maîtrise d’effets perceptibles à notre échelle « macroscopique » (le mm et la seconde) : si la phy- sique statistique nous assure que les phénomènes macroscopiques sont réductibles aux phénomènes microscopiques, la question de la représentativité statistique de l’échantillonnage qu’il effectue se pose constamment pour le praticien des simulations et modélisations moléculaires : de telles simulations prennent-elles suffisamment en compte certains événements « rares », ou décrivent-elles aux échelles adéquates la structuration spatiale du milieu ? Déjà, la description de phénomènes importants aux échelles pertinentes pour les diverses formes de nanotechnologies en émergence pose des problèmes de recherche ouverts.

Exemples :

La fréquence de rotation typique pour un cycle catalytique d’une réaction mise en œuvre industriellement à grande échelle est de l’ordre du hertz, au mieux de 10 3 s 1 soit, selon la relation (33), une barrière d’énergie libre pour l’étape limitante située entre 25 et 35 kcal · mol 1 :

la probabilité qu’un seul événement réactif de ce type puisse être décrit durant une simulation de dynamique moléculaire ab initio d’une durée totale de 10 12 s est au mieux 10 9 , alors que ce niveau de des- cription prenant en compte correctement la rupture et la formation des liaisons chimiques est probablement le seul pertinent. Les milieux colloïdaux sont très fréquemment rencontrés aussi bien dans le champ technologique (émulsions, colles, alliages de poly-

mères

lule vivante

que dans les systèmes naturels (sols et roches argileux, cel-

Leurs propriétés physico-chimiques sont très fortement

dépendantes, entre autres, de l’échelle spatiale des objets en inter- action qui les constituent. L’échelle dite « mésoscopique », qui couvre

typiquement 10 à 100 nm, est souvent cruciale pour cette matière qua- lifiée de « molle », dont la densité est proche de celle de l’eau liquide. Cela représente typiquement de 10 5 à 10 8 atomes. Des temps caracté- ristiques longs, de l’ordre de la microseconde ou moins encore, s’avè- rent souvent importants pour les propriétés de tels milieux. Enfin, les interactions déterminantes entre objets de taille mésoscopique sont de longue portée (électrostatiques, dispersives intégrées sur un grand

nombre d’atomes

et leur description par l’intégrale d’interactions

élémentaires entre paires atomiques s’accommode mal du choix de « rayons de coupure » faibles habituellement recherché pour limiter la lourdeur des calculs. Ainsi, dès l’échelle mésoscopique, les méthodes de simulation atomistiques, même basées sur des champs de force empiriques, se trouvent confrontées à leurs limites et bien souvent mises en échec.

)

).

)

Les méthodes de raccordement d’échelles cherchent à pallier aux limitations que l’on vient de décrire, en réalisant un transfert vers les échelles spatio-temporelles supérieures de l’information fonda- mentale accessible au niveau microscopique. Les méthodes appe- lées « Monte Carlo cinétique (kinetic Monte Carlo, kMC) et « dynamique dissipative de particules » (Dissipative Particle Dyna- mics, DPD) illustreront ce propos.

8.1 Raccordement en temps :

le Monte Carlo cinétique (kMC)

En kMC, on fait l’hypothèse qu’une configuration évolue dans le temps du fait d’une succession d’événements indépendants de probabilités d’occurrence très variables, avec une probabilité nulle d’occurrence simultanée. La trajectoire temporelle est donc incré- mentée par pas de durée aléatoire. Une simulation kMC permet de tirer avec le même taux de succès des événements élémentaires très fréquents et très rares : l’échelle des temps est ainsi décrite sur un intervalle arbitrairement grand. Divisons le temps écoulé depuis l’origine en k intervalles égaux

de durée t = t /k. Calculons la probabilité p

faisant passer le système de l’état i

de fréquence intrinsèque

qu’un événement

i j

ν i j

à l’état j se produise pour la première fois entre t et t + t. Soit la probabilité totale Γ tot définie par :

Γ tot

=

ν

i j

(39)

où la somme est étendue à toutes les possibilités de sortie de la configuration actuelle notée i.

À partir de t = 0, la probabilité pour que l’événement i j ne se

soit

pas

produit

au

bout

de

t

est

(1 – Γ tot t ).

Elle

devient

(1 – Γ tot t ) k après t = kt. On obtient donc :

 
 

p i j = (1 – Γ tot t ) k ν i j t

 

(40)

En passant à la limite k → ∞, on obtient la probabilité différen-

tielle

(41)

Au temps t, la distribution de densité de probabilité de la transi- tion i j est donc :

(42)

En remarquant que la probabilité d’obtenir l’état j à partir de l’état i est à chaque instant :

(43)

P i j (t ) = dp i j /dt = exp (– Γ tot t ) ν i j

dp i j = exp (– Γ tot t ) ν i j dt

dp i j :

p (i j) = ν i j /Γ tot

on peut introduire la distribution des temps d’attente au temps t, ou de survie d’une configuration quelconque, P att (t ) :

(44)

P att (t ) = Γ tot exp (– Γ tot t )

Il vient ainsi :

(45)

La mise en œuvre d’une simulation kMC exige que les fréquences

de tous les événements élémentaires

possibles soient connues à l’avance. De plus, à chaque instant, il est

constitué de tous

les événements susceptibles de survenir à partir de la configuration actuelle i, de façon à pouvoir calculer Γ tot . Puisque les événements successifs survenant au cours du temps « physique » sont supposés le faire aléatoirement selon une distri- bution uniforme, la probabilité qu’un événement survienne dans un intervalle de temps δt doit être un nombre aléatoire ξ, uniformément distribué entre 0 et 1 :

nécessaire de répertorier le sous-ensemble de

intrinsèques de l’ensemble

P i j (t ) = P att (t ) p (i j )

ξ

δt

= 0

P att (t ) dt

=

[

1

exp

(

Γ tot

δt)]

(46)

T oute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © Editions T .I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

J 1 0 1 3 9

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

On en déduit :

(47)

Une boucle élémentaire de l’algorithme kMC, due à Bortz, Kalos

et Lebowitz [7] comporte donc un premier tirage au hasard d’un évé-

nement de sortie de la configuration i parmi les événements pos- sibles, conduisant à la configuration j, puis un deuxième tirage au

hasard du nombre ξ, qui permet d’incrémenter l’horloge de δt selon

δt = – ln (1 – ξ)/Γ tot

la

relation (47). Les événements susceptibles de survenir à partir de

la

nouvelle configuration j doivent alors être exhaustivement recen-

sés, ce qui permet d’actualiser la valeur de Γ tot .

Le kMC ab initio met en œuvre cet algorithme, en prenant en compte des fréquences d’événements élémentaires calculés selon

la relation (33), les barrières d’énergie libre à franchir étant obtenues

par le calcul ab initio. Une telle procédure implique généralement une simplification de la description spatiale des configurations du système. Typiquement, les atomes sont placés aux nœuds d’un réseau régulier sous-jacent à l’organisation réelle du système (par

exemple, réseau cubique pour un métal ou alliage cfc). L’analyse ab initio de la HSEL réelle permet d’identifier aux minimums locaux les configurations à prendre en compte, qui seront affectées au réseau simplifié. La localisation des états de transition entre minimums locaux permet d’évaluer les barrières cinétiques et donc les fré- quences intrinsèques de transition. Le transfert d’information depuis l’échelle microscopique vers les échelles de temps longues est ainsi effectif.

Le kMC se prête à la description statistique d’équilibres dyna- miques, en prenant en compte de facto l’entropie de configuration.

Cette méthode a trouvé récemment de nombreuses applications, par exemple pour simuler l’apparition et le réarrangement de défauts ponctuels dans les alliages métalliques soumis à une irra- diation par des particules très énergétiques. Certains critères inter- nationaux prédictifs du vieillissement des propriétés mécaniques d’alliages utilisés pour la fabrication de composants du cœur de centrales électronucléaires sont actuellement issus d’études aux- quelles les simulations de type kMC ont apporté des contributions très importantes [8].

Un autre champ d’application émergent concerne les phéno- mènes de surface tels que la croissance cristalline, ou la catalyse hétérogène : le système décrit est la surface d’un solide échangeant des atomes ou espèces moléculaires avec une phase fluide. Les évé-

nements élémentaires sont l’adsorption, le saut diffusif en surface,

la désorption. Il s’y ajoute, dans le cas de la catalyse hétérogène,

des événements réactifs entre atomes adsorbés conduisant à une espèce produit adsorbée, elle-même susceptible de désorber en phase fluide. Un bilan des espèces en phase fluide moyenné dans

le temps permet d’accéder à la cinétique intrinsèque de la réaction

catalytique.

Exemple : le kMC ab initio a révélé récemment des effets configurationnels en phase adsorbée insoupçonnés jusqu’à présent pour la réaction d’oxydation du monoxyde de carbone catalysée par le ruthénium. Les prédictions se sont révélées en très bon accord avec les expériences disponibles [9].

La figure 5 montre le bon accord entre le résultat théorique et des simulations kMC pour le cas d’école d’une réaction chimique

A + B C catalysée par une surface homogène et uniforme pré-

sentant un seul type de sites d’adsorption selon un mécanisme de

Langmuir-Hinshelwood.

8.2 Du microscopique au mésoscopique :

la dynamique dissipative de particules (DPD)

La DPD concerne avant tout les fluides complexes et leurs inter- faces. Par rapport à la simulation atomistique, le changement

25 000 20 000 15 000 10 000 5 000 0 600 800 1 000
25
000
20
000
15
000
10
000
5 000
0
600 800
1 000
1 200
1 400
Taux de production (s –1 )

Température (K)

Le réacteur est supposé ouvert, avec des pressions partielles de A et B imposées. En train plein, le résultat théorique. Les symboles correspondent aux résultats de simulations kMC : cercles, réseau unidimensionnel périodique comprenant 1 000 sites ; triangles, réseau carré périodique de 32 x 32 sites. Les barres d'erreur sont figurées pour chaque simulation : l'incertitude est plus grande à haute température, régime dans lequel la fraction de sites occupés devient faible.

Figure 5 – Vitesse de production de C en fonction de la température pour une réaction chimique A + B C selon un mécanisme de Langmuir-Hinshelwood en catalyse hétérogène [10]

d’échelle spatiale est obtenu en considérant que les lois de la dyna- mique peuvent s’appliquer à des particules de fluide intégrant le mouvement collectif d’un grand nombre de molécules et interagis- sant entre elles par le biais de potentiels « mous », c’est-à-dire peu variables avec la distance entre paires, et de courte portée. Dans ces conditions, la conservation de l’énergie à travers les collisions entre particules peut être assurée avec des pas de temps sensiblement plus élevés qu’en dynamique moléculaire, ce qui autorise égale- ment une montée en échelle temporelle. La DPD, que l’on peut faire remonter à l’article fondateur de Groot et Warren [11] appartient, avec les simulations dites « gaz sur réseaux », à une classe de méthodes de simulation de la dynamique des fluides dites à « gros grains ».

À chaque particule, une masse, une position et une vitesse sont attribuées à chaque instant. Une simulation DPD procède par intégration numérique des lois du mouvement de Newton exacte- ment comme une simulation de dynamique moléculaire, mais la force d’interaction entre deux particules est la somme de 4 compo- santes :

avec

F

F

F

F

F ij

=

F

C

ij

+++

ij

ij

F

D

F

A

R (48)

F ij

C force centrale répulsive qui contribue à conserver l’énergie (les collisions seraient purement élastiques si les autres composantes étaient nulles),

D force dissipative, simulant les effets visqueux, propor- tionnelle à la vitesse relative des deux particules,

A force centrale aléatoire destinée à compenser la fric- tion dissipative,

R force de rappel harmonique qui n’est appliquée que lorsque les particules i et j sont consécutives au sein d’une même supermolécule (représentant, par exemple, la connexion entre « tête » polaire hydro- phile et « queue » lipophile dans un tensioactif ou entre « blobs » dans un polymère).

ij

ij

ij

ij

J 1 013 10

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite. © Editions T.I.

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

Ce document a été délivré pour le compte de 7200038556 - universite de la reunion sce commum documentation // 195.220.151.50

MODÉLISATION MOLÉCULAIRE

tiwekacontentpdf_j1013

Si u

ij

est le vecteur unitaire de la droite joignant deux particules

distance r ij , les expressions proposées par

i et j, séparées par la

Groot et Warren sont :

F

avec

C

ij

=

r c

a ij

( 1

r

ij

) u

ij

pour r

ij

<

r

c

et

F

C

ij

=

0 pour r

ij

>

r c

(49)

rayon de coupure identifié au « rayon » de la par- ticule,

a ij

D

F ij

=

γω

D

paramètre d’interaction répulsive.

(

r

ij

)

[

et

u

ij

v

ij

F

D

ij

] u

=

ij

pour r

0 pour r

ij

ij

<

>

r c

r c

avec

F

A

ij

v ij

= v j v i vecteur vitesse relative,

γ constante multiplicative,

ω D (r ij )

fonction de poids.

= σω

A (

r ij

)

ζ ij

(t ) u

ij

pour r

ij

<

r

c

et

F

A

ij

=

0 pour r

ij

(50)

>

r c

(51)

avec

F

R

ij

σ ω A (r ij ) ζ ij (t )

=

Cr ij u ij

constante multiplicative,

fonction de poids,

variable aléatoire du temps, de moyenne nulle.

(52)

avec C constante de force.

On peut montrer que, pour faire converger le système à l’équilibre dans l’ensemble de Gibbs et pour satisfaire au théorème de fluctua- tions-dissipation, les contraintes suivantes doivent être satisfaites :

ω D (r ij ) = [ω A (r ij )] 2

(53)

σ 2 /γ = kT

avec

k

constante de Boltzmann,

T

température absolue.

(54)

Finalement, le choix suivant est fait habituellement :

ω D (r ij ) = (1 – r ij ) 2 pour r ij < r c

Dans une simulation DPD, un nombre arbitraire de types de par- ticules peut être pris en compte, et une grande flexibilité est pos- sible dans la représentation des connexions covalentes (force harmonique) entre certaines particules. Des séparations de phase sont observées lorsque, par exemple, des particules de types A et

.

Comme attendu, si une faible fraction des particules A et B sont connectées, figurant des espèces tensioactives, ces entités se loca- liseront à l’interface entre les phases A et B. La présence de phases solides peut être simulée en affectant, à un certain type de parti- cules S, une masse arbitrairement grande devant les autres masses et un coefficient de répulsion a ss faible.

B sont mises en présence, avec

(55)

R

F AB

=

0

et

a AA

a

BB

a AB

Le théorème du viriel permet d’obtenir une expression de la pression P ou, plus généralement, du tenseur des contraintes local dans le système simulé. La tension interfaciale Σ entre deux phases

séparées A et B peut, dès lors, être évaluée selon l’expression

classique :

Σ

=

P

[

xx

(x)

1/2

(

P

yy

(x)

+

P

zz

(x))] dx

(56)

avec P xx contrainte normale à l’interface,

P yy et P zz

contraintes tangentielles ;

l’intégration étant menée de l’intérieur de la phase A vers l’inté-

moyen de

l’interface. Les simulations DPD sont donc, en principe, adaptées pour rendre compte de manière générique de la grande variété de structures mésoscopiques qui peuvent apparaître dans les fluides dits « complexes ». La paramétrisation correcte de ces simulations constitue la difficulté principale.

Groot et Warren ont montré qu’un fluide pur simple représenté

par DPD obéit généralement à l’équation d’état :

P = ρkT + 0,101 a AA ρ 2

rieur de

la

phase

B

le

long d’un axe normal au plan

(57)

avec

ρ

densité en termes de particules par unité de volume,

P

pression.

La compressibilité adimensionnelle κ 1 du fluide a alors pour expression :

κ 1 = (1/kT ) (P /ρ) T = [1 + (0,202 a AA ρ/kT )]

Le paramètre </