Vous êtes sur la page 1sur 1

International Joint Conference

CB-WR-MED Conference/ 2nd AOP’Tunisia Conference


for
Sustainable Water Management
Tunis: April, 24 – 27 , 2013

CARACTERISATION NON CONVENTIONNELLE DE LA DISTRIBUTION DES


HYDROCARBURES AROMATIQUES POLYCYCLIQUES DANS L’EAU
Bouarra Nabil , Haddag Hamza, Boufenaya Hamza, Messadi Djelloul*

nabilos_26@yahoo.fr

I- Introduction
Résumé
Les hydrocarbures aromatiques polycycliques (HAP) sont des contaminants organiques qui sont Les hydrocarbures aromatiques polycycliques (HAP) sont des molécules organiques issues de la combustion
largement répandues dans l'environnement, ils ont des effet cancérogène, mutagène et incomplète des matières carbonées suite à des processus naturels, mineurs, et des processus anthropiques,
spermatogénétique, certains HAP sont répertoriés à la Relation Environnement-Eau parmi les 129 majoritaires. Les HAP sont constitués d’atomes de carbone et d’hydrogène formant au moins deux anneaux
polluants prioritaires par l’agence américaine de protection de l’environnement (US-EPA) le aromatiques condensés, Ils sont libérés dans tous les compartiments de l’environnement. Le nombre de HAP
comportements de HAP dans l'environnement à attiré une attention considérable dans le monde. identifiés à ce jour est de l’ordre de 130[1]. Parmi ceux-ci, une liste restreinte est généralement considérée pour
La solubilité aqueuse (Sw) des HAP à un grand intérêt pour déterminée la distribution et l'accumulation
les études environnementales. Ce sont les 16 polluants retenus comme prioritaires par l’agence
dans l'eau, l'air, sol et dans les organismes vivant, ainsi leur vitesse de migration et les taux de
dégradation dans l’environnement.
environnementale américaine (US-EPA) [2], elle contient les HAP les plus étudiés et posant des problèmes
La prédiction de la solubilité aqueuse et / ou d'absorption par l'homme a été l'objectif de nombreux majeurs du fait de leur toxicité. Le transport et le devenir des HAP dans l’environnement dépend, en partie de
chercheurs ces dernières années. Les méthodes linéaires sont couramment utilisées pour la leurs propriétés physicochimiques, comme la solubilité dans l’eau, et leurs répartitions relatives entre les
construction des modèles QSPR, telles que la régression linéaire multiple (RLM), régression partielle différentes phases environnementales. La solubilité dans l’eau peut être reliée à la température de fusion, en
des moindres carrés (PLS), régression moins ordinaire au carré (OLS) ... association avec le volume moléculaire et l’aire de la surface de van der Waals qui le limite [3]. Des modèles à
Dans notre étude nous avons appliqués la méthode de la régression multiple pour modéliser la 2 régresseurs ont ainsi été établies, Ils nécessitent, cependant la connaissance de la température de fusion, un
solubilité de 16 HAP prioritaires contrôlant leur évolution dans l'environnement, la sélection des
descripteurs moléculaires a été faite par algorithmes génétiques. Les résultats montre que le modèle
paramètre expérimental aussi difficile à évaluer théoriquement que la solubilité elle-même.
obtenu est très robuste aussi sa capacité prédictive est très importante Q 2=97,89 ,R2=98,57 ,en outre, le Dans ce travail nous avons relié la solubilité dans l’eau (- log S) des HAP prioritaires, à des descripteurs
modèle est très hautement significatif F= 412,41. calculés avec le logiciel DRAGON [4], en favorisant l’approche hybride combinant algorithme génétique, pour
le choix de sous ensembles de descripteurs significatifs, et régression linéaire multiple.
Mots clés : solubilité, régression multiple, QSPR, HAP, pollution des eaux. La qualité de l’ajustement et la robustesse du modèle ont été vérifiées par validation interne.

II- Méthodes
Les solubilités des HAP prioritaires (exceptée celle du fluorène) rapportées dans [5], ont été utilisées pour l’analyse des relations structure / solubilité aqueuse.
Les structures des 15 molécules ont été obtenues à l’aide du logiciel Hyperchem Pro 6.03 [6], et les géométries finales à l’aide de la méthode semi-empirique PM3 [7], Tous les calculs ont été
menés dans le cadre du formalisme RHF sans interaction de configuration ; les structures moléculaires ont été optimisées à l’aide de l’algorithme Polak- Ribière avec pour critère une racine du
carrée moyen du gradient égale à 0,01 kcal /mol. Les géométries ainsi optimisées ont été transférées dans le logiciel informatique DRAGON [4], pour le calcul de plus de 1600 descripteurs
appartenant à 20 classes différentes.
En utilisant les options correspondantes du logiciel DRAGON, nous avons éliminé les descripteurs qui n’apportent aucune information (écarts types inferieures à 0,0001), ensuite de deux
descripteurs hautement corrélés(r>0,95) est éliminé celui qui présente les plus hautes corrélations croisées avec les autres descripteurs.
Les descripteurs importants sont alors sélectionnés par algorithme génétique dans la version MOBY DIGS [8] de Todeschini en maximisant le coefficient de prédiction Q². Les principaux
paramètres ont été fixés comme suit: taille de la population du modèle Pop= 30; nombre maximum de descripteurs L=2, de telle sorte à associer à chaque descripteurs un nombre d’échantillons
supérieur à 5; probabilité de croisement, p c = 0,5 probabilité de mutation, pM = 0 ,01.

III- Résultats
La solubilité dans l’eau des HAP a été reliée à des paramètres structuraux (tableau 1) qu’on peut
rattacher aux indices basés sur les valeurs propres(VEA1) et aux indices WHIM(Ku) [10] ; le coefficient
de corrélation de Pearson pour ces 2 descripteurs valant r = 0,463 pour une probabilité p = 0,083.
Le modèle retenu a pour équation :

-log S = -24,89 (±1,44) + 8,61 (± 0,40) VEA1 + 13,88 (± 2,13) Ku

n = 15 ; R²(%) = 98,6 ; Q² (%) = 97.89 ; Q²BOOT (%) = 97.17; s= 0,5315 ; F= 412,41- p = 0,000

Les valeurs des paramètres statistiques montrent que les 2 descripteurs VEA1 et Ku permettent de
corréler les solubilités des 15 HAP. En effet, la valeur du coefficient de détermination signifie que
98,6% de la variabilité de log S, peut être expliquée par ces 2 descripteurs. La grande valeur de
paramètre de Fisher (F=412,41 ; p= 0,000) indique un modèle très hautement significatif.
La qualité de l’ajustement a été vérifiée en procédant à une validation croisée par « leave-one-out ». La
figure 1, qui reproduit les valeurs calculées (–log S i) en fonction de celles observées (–log S i) fait
ressortir une faible dispersion caractéristique d’un bon ajustement, d’ailleurs confirmé par la grande
valeur de Q² (=97,89%).

Figure1. Graphe des valeurs calculées de (-logS) en fonction des valeurs expérimentales

La figure 2 qui représente le graphe des coefficients statistiques Q² et R² permet de comparer les
résultats obtenus pour les modèles randomisés (carrés bleus) au modèle réel de départ (point noir).
Il est clair que les statistiques obtenues pour les vecteurs modifiés de la solubilité sont plus petites
que celles du modèle réel, et pour la majeure partie ou obtient un Q² < 0.
Ceci permet d’assurer qu’une relation structure / solubilité réelle a été établie.

Figure 2. Test de randomisation associé au modèle SPR

IV- Conclusion
Références
Nous avons relié la solubilité de 15 HAPs prioritaires, à des descripteurs 1-INERIS-hydrocarbures Aromatiques Polycyclique- Guide méthodologique. Rapport d’étude N°66244-
DESP-R01, 2005, pp.85.
moléculaires. Les modèles SPR ont été établis en utilisant l’analyse de 2- US-EPA. Chemical Fate Rate Constants for SARA section 113 Chemicals and Superfund Health
Evaluation Manual Chemicals. US Environmental Protection Agency, Office of Toxic Substances,
régression multilinéaire associant l’approche algorithme génétique pour la Washington, DC.6-02-4245. http:// www.epa.gov .
sélection de sous ensembles de variables significatives ( logiciel MOBY 3- R.S. Pearlman, S. H. Yalkowsky, S. Banerjee, Water Solubilities of polynuclear Aromatic and
Heteroatomic Compounds, J. phys. Chem. Ref. Data, 13 (02) (1984) 555-562.
DIGS) en maximisant la valeur du coefficient de prédiction Q²LOO .La taille 4.-R.Todeschini, V. Consonni, M, Pavan, DRAGON Software for the calculation of Molecular Descripteurs.
de chaque modèle a été fixée à 2 descripteurs. La qualité de l’ajustement a été Release 5.4 for windows, Milano , 2006.
5- EPA Report, EPA-600/8-90/-003, 1990.
vérifiée en procédant à la représentation des valeurs observées en fonction 6- Hyperchem TM. Release 6.03 for Windows, Molecular Modelling System. 2000.
7- JJP. Stewart. Optimization of parameters for semi empirical methods. Comput. Chem., 10(1989) 209-220,
de celle calculées. La grande valeur de Q2 obtenue reproduit pratiquement 221-224.
celles du coefficient de détermination multiple correspondant, ce qui fait 8-R. Todeschini, D. Bellabio, V. Consonni, A. Mauri, M. Pavan. MOBY DIGS Software for Multilinear
Regression analysis and Variable Subset Selection by Genetic Algorithm. Release 1.0 for windows, Milano
ressortir la qualité de modèle obtenu. Le test de randomisation montre, (2004).
dans tous les cas, que seul le vecteur réel des observations conduit à 9-N.R. Draper, H. Smith, Applied Regression Analysis, Third Edition, Wiley Series in probability and
Statistics , New York,1998.
des valeurs élevées des statistiques R2 et Q2, ce qui prouve que le 10- R. Todeschini, V. Cononni, Molecular descriptors for Chemoinformatics. Second, Revised and Enlarged
modèle obtenu n’est pas dû au hasard. Edition. Vol.I: Alphabetical Listing. Series Editors: R. Mannahold, H. kubinyi, G.Folkers. Wiley-VCH
Verlag GmbH & CO. KGaA (2009).

Author Nabil BOUARRA

Contact of the supervisor: d_messadi@yahoo.fr

Institution of chemistry

Address. Université Badji Mokhtar –Annaba-B.P12, Annaba 23000- Algérie.

Vous aimerez peut-être aussi