Académique Documents
Professionnel Documents
Culture Documents
L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
Electronique
Gologie
Agronomie
Sociologie
Sociologue
Agronome
? ? ?
Floue, incertaine
Diversifie Disperse
Odeur, polluant atmosphrique Source de chaleur dans un btiment Qualit des eaux de surface Changements climatiques
le rayonnement direct du soleil fausse la mesure de temprature l'humidit de l'air, la pluie dtriorent les contacts, les cbles, l'lectronique tempratures extrmes : -20 40 C
protection anti-radiation
tanchit des botiers, des passages lectriques composants adapts, attention aux capteurs utilisant l'eau (psychromtres, tensiomtres, ) protections : grande rsistance d'isolement, circuit limitant le courant de dcharge travers l'instrument
foudre, surtensions
Alimentation lectrique
recharge possible par panneau photovoltaque dimensionner selon la consommation de l'appareil et la priode d'chantillonnage
mmoire optimale
calcul de la frquence d'chantillonnage en fonction du nombre de donnes, de l'autonomie dsire et du temps de rponse du phnomne ne choisir cette solution que pour des campagnes de longue dure penser au GSM
tempte, grle
1. Contexte de la rcolte et du traitement des donnes dans l'environnement 2. Concept d'indicateurs globaux 3. Concept de signature 4. Units et chelles 5. L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
Diffrence entre les units spatiales utilises pour les mesures lmission et les mesures dans lenvironnement ( limmission). A lmission : au niveau de la municipalit A limmission : mesures ponctuelles, prs des industries et des grands axes de circulation. Problme dextrapolation toute la rgion.
Comparer les pays entre eux Belgique : 10 M habitants 30 500 km2 France : 61 M habitants 550 000 km2 Allemagne : 81 M habitants 357 000 km2
Comparer les pays entre eux : exemple du facteur dmission du SO2 pour lindustrie de la pte papier
Rappel : concept du facteur d'mission But : faciliter le calcul des flux d'mission de certains polluants dont la mesure directe est considre comme longue, complexe ou chre. Mthode : calculer le flux d'mission (par exemple en g/jour de SO2) en multipliant une unit fonctionnelle de "production" (par exemple des tonnes de produit fini) par un "facteur d'mission" propre au polluant et au type de processus. Exemple : dterminer les flux de polluant lis au trafic automobile Facteur d'mission = grammes de CO par km parcouru idalement, ce facteur doit tre adapt au type de vhicule (essence, diesel, ) et aux conditions de conduite (ville, route, autoroute, )
Comparer les pays entre eux : exemple du facteur dmission du SO2 pour lindustrie de la pte papier
Pte papier procd Kraft: une solution contenant du sulfure de sodium, appele liqueur blanche sert dissoudre chimiquement la lignine qui relie entre elles les fibres de la cellulose du bois. Cette tape (digestion) libre du SO2. Mais le SO2 est principalement mis lors de l'incinration du bois et de l'oxydation des composs soufrs rduits dans le four de rcupration, o le liquide rsiduel du processus (liqueur noire) est brl pour rcuprer de la chaleur et des produits chimiques. Facteur d'mission (mthode simplifie) : 1 seul facteur pour toute l'entreprise : ex. au Canada 3.1 kg de SO2 par tonne de pte sche produite Facteur d'mission (mthode dtaille) : diffrents facteurs pour chaque poste : 3 kg/T pour l'incinration du bois, 2.1 kg/T pour le four de rcupration sans contact direct (1.7 kg/T si contact direct) et 0.008 kg/T pour l'tape de caustification. Facteurs fort diffrents selon les pays, les procds, les techniques d'puration mises en uvre
Comparer les pays entre eux : exemple du facteur dmission du SO2 pour lindustrie de la pte papier
2.2 kg SO2 par tonne de pte sche 3.1 kg SO2 par tonne de pte sche
Communiquer linformation
}
Ncessit dune reprsentation graphique simple et non ambigu
Quels types de grandeurs ? Besoin dindicateurs pour quantifier et simplifier les phnomnes, pour aider comprendre les ralits trs complexes de lenvironnement
Dfinition de lOCDE : un indicateur est un paramtre donnant des informations sur un phnomne, sur lenvironnement ou sur une zone gographique. Il a une signification synthtique et doit tre labor pour un besoin spcifique.
From : L.Braat The predictive Meaning of Sustainability Indicators In In search of Indicators of Sustainable Development Kuik, O., Verbruggen, H., Editor, 1991
Exemple dindice intgrateur : lvaluation du confort thermique sur base de paramtres simples
Exemple dindice intgrateur : lIndice de Pollution Organique (IPO) selon Leclerq et Maquet (1987)
Parameter Classes 5 4 3 2 1 2.0 2.0-5.0 5.1-10.0 10.1-15.0 >15.0 0.1 0.1-0.9 1.0-2.4 2.5-6.0 >6.0 5 6 11-50 51-150 >150 15 16-75 76-250 251-900 >900 BOD5 mg O2/l Ammonium mg N/l Nitrites g N/l Orthophosphates g N/l
Organic Pollution Index (O.P.I.) = Average value of class numbers for the 4 parameters. Average value 5.0-4.6 4.5-4.0 3.9-3.0 2.9-2.0 1.9-1.0 Pollution level No organic pollution Weak organic pollution Moderate organic pollution Strong organic pollution Very strong organic pollution Color Blue Green Yellow Orange Red
10
Paramtres : Profondeur de visibilit du disque de Secchi (S, en mtres) Phosphore total (P, en g/L) Chlorophylle a (C, en g/L) TSI (Trophic State Index)= TSI = 60 - 14.41 Ln(S) TSI = 9.81 Ln(C) + 30.6 TSI = 14.42 Ln(P) + 4.15 TSI total = moyenne des 3 Oligotrophe si TSI moyen <35 Msotrophe si TSI moyen entre 35 et 45 Eutrophe si TSI moyen >45
Exemples dindices intgrateurs (pollution atmosphrique) : Indice franais de la qualit de lair : ATMO
Indice
1 2 3 4 5 6 7 8 9 10
Poussires
0-10 10-20 20-30 30-40 40-50 50-65 65-80 80-100 100-125 >125
SO2 (g/m3)
0-40 40-80 80-120 120-160 160-200 200-250 250-300 300-400 400-600 >600
NO2 (g/m3)
0-30 30-55 55-85 85-110 110-135 135-165 165-200 200-275 275-400 >400
O3 (g/m3)
0-30 30-55 55-80 80-105 105-130 130-150 150-180 180-250 250-360 >360
11
Si lindice est fiable, il peut servir de norme ou pour calculer une taxe. Exemple : UCP = Unit de charge polluante, pour valuer la taxe sur les rejets deaux uses industrielles en Belgique. UCP = 360 [(Q/180)(a+0.35(MS/5000)+0.45(DCO/525))x(0.4+0.6d)+ Q1((Xi+0.2Yi+10Zi)/500)+(Q1(N+P)10000)+(0.2Q2t/10000)]
Avec : MS = matires en suspension (mg/l) Q = volume journalier dvers (l) DCO en mg/l aprs dcantation d = nombre de jours de dversement annuels/225 Q1 = volume annuel dvers (m3) hors refroidissement Q2 = volume annuel dvers (m3) pour le refroidissement Xi = somme concentrations en As, Cr, Cu, Ni, Pb, Ag (mg/l) Yi = concentration moyenne en Zn (mg/l) Zi = somme concentrations en Cd et Hg (mg/l) N = concentration en azote total (mg/l) P = concentration en phosphore total (mg/l) t = cart de temprature entre dversement et eau rceptrice ( C)
Unit commune : catgorisation de la variable Du moins grave vers le plus grave 10 classes, de 0 10 entre 0 et 15000 litres de fuel par an et par vhicule
10 classes, de 0 10 entre 0 et 1000 grammes de benzne mis par an et par vhicule 10 classes, de 0 10 entre 0 et 120 dB par vhicule 7.5m du milieu de la chausse
12
4/10
7/10
3/10
Si mme concept de gravit de la nuisance mme nombre dintervalles mmes types dintervalles Possibilit de sommer les 3 cotes 4/10 + 7/10 + 3/10 Ou dtablir des moyennes 4.7/10 (comme pour les cotes dexamens)
Pondration des variables Modles orients mcanismes : le facteur dquivalence Exemple : effet de certains gaz sur le rchauffement global de la plante
Le modle compare le mcanisme de rchauffement de la plante dune substance de rfrence (ex. : CO2) aux mcanismes dautres substances dans les mmes conditions mesure relative
GWPi =
a c (t )dt
i i 0 ref
a
0
c ref (t )dt
T est lhorizon temporel (en annes) ci(t) est la concentration de la substance i au temps t ai est leffet dune masse unitaire de la substance i symboles ref = paramtres correspondants pour le CO2
Au total :
13
Horizon temporel T du modle GWP Temps court : T=20 50 ans Effets court terme
Intergovernmental Panel on Climate Change (IPCC) : compilation des meilleures estimations des GWP Greenhouse gas
CO2 CH4 N2O CFC12 (CF2Cl2)
20 years
1 35 260 7100
100 years
1 11 270 7100
500 years
1 4 170 4100
Pondration des variables Modles orients effets physiques : le facteur de conversion Exemple : toxicit des gaz Le modle est bas sur les concentrations maximales acceptes, ou sur une norme : Ex. : MAC (Maximum Accepted Concentration ou TLV (Threshold Limit Value) effet sur lhomme et non mcanisme
Indicateur dmission (volume) = quantit de substance mise (kg)/ MAC (kg/m3) Indicateur de pollution dans lenvironnement (sans dimension) = Concentration mesure (kg/m3)/MAC (kg/m3)
14
Exemple : indicateur TX-4 (OCDE) Emissions de mtaux lourds vers leau et les sdiments
4 mtaux retenus : Hg, Pb, Cd et As (assimil aux mtaux) Pondrs selon leur cotoxicit et par rapport larsenic missions en arsenic quivalents
Cadmium 3.3
15
Exemple de pondrations : la toxicit humaine pour les mtaux lourds dans lair
Metal As Cd Cr6+ Cu Hg Ni Pb Zn Weighing 4700 580 47000 0.24 120 470 160 0.033
16
Energie dpense
Combustible Fuel oil Mineral coal Natural gas Timber (dry) Diesel oil
1. Contexte de la rcolte et du traitement des donnes dans l'environnement 2. Concept d'indicateurs globaux 3. Concept de signature 4. Units et chelles 5. L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
Etudes de cas : problme de pollution de l'air aux alentours d'un centre de compostage situ proximit d'une autoroute qui est coupable ?
17
Etudes de cas : problme de pollution des eaux souterraines aux alentours d'un centre d'enfouissement technique situ non loin d'un zoning industriel qui est coupable ?
Etudes de cas : problme d'acidit du sol proximit d'un centre commercial quelle est la cause : les eaux uses ou les eaux de pluie ?
Mthode lgante : la signature, image de la proportion des diffrents constituants d'un mlange C'est implicitement ce principe qui est appliqu quand on ralise une datation d'objet au carbone 14
Pour rappel, le carbone est prsent sous diverses formes dans l'atmosphre et donc dans tout corps vivant changeant avec l'atmosphre : 12C, 98.89%, 13C, 1.108% et 14C, 1.3 10-12% Cet quilibre est maintenu par les ractions diverses dans l'atmosphre (cration de 14C par collision d'azote avec un neutron et, en mme temps, dsintgration de 14C en 12C et 13C). Quand un corps meurt, les changes avec l'atmosphre cessent et l'quilibre est rompu le 14C continue se dsintgrer, mais il n'y a plus d'change avec l'atmosphre, donc le n'est plus renouvel on dose le 14C dans le corps mort, en mesurant son degr de radioactivit. Connaissant la demi-vie du 14C (soit 5715 ans), on connat la date de la mort (AGE). AGE = ln Ao/A * 8033 ans avec A0=radioactivit du carbone 14 dans un chantillon "actuel" A=radioactivit du carbone 14 dans l'chantillon ancien Toute cette mthode est base sur l'hypothse d'une proportion connue des atomes de carbone dans le corps vivant.
14C
18
Par extension : signature isotopique Dans tous les corps vivants de l'environnement, il existe des proportions connues des diffrents isotopes d'un atome (par exemple 13C/12C, ou 15N/14N, ) Or ces proportions des lments contenus dans les polluants, leurs
On retrouve des BTEX partout, et la mesure absolue de leurs concentrations ne donne pas beaucoup d'indication mais leurs proportions relatives est indicatrice de la source
dans les gaz d'chappement des vhicules proportion BTEX 1:2:0.5:1.3 en moyenne, mais variable selon le moment dans la journe (heures de pointe ou heures calmes) et le type de carburant signature BTEX = bon indicateur du trafic routier par rapport d'autres sources et de l'intensit du trafic au cours du temps
Assessment of vehicular and non-vehicular contributions to hydrocarbons using exclusive vehicular indicators Chih-Chung Chang, Jia-Lin Wang, Shaw-Chen Liu and Shih-Chun Candice Lung Atmospheric environment, 40 (2006) 6349-6361
19
1:6.6:1.2:6.3
1:2.9:0.9:4.1
1:2.1:0.5:2.7
1:5.3:1.2:5.8
1:5.2:-:6.5
1:4.2:-:5.4
1:2.6:-:2.5
Assessment of vehicular and non-vehicular contributions to hydrocarbons using exclusive vehicular indicators Chih-Chung Chang, Jia-Lin Wang, Shaw-Chen Liu and Shih-Chun Candice Lung Atmospheric environment, 40 (2006) 6349-6361
15 de l'EPA
Fluorne Phnanthrne Anthracne Pyrne Benzoanthracne Chrysne Dibenzoanthracne
Signatures diffrentes des 15 HAP de l'EPA dans diffrents sdiments de lacs amricains
HAP
La signature des HAP permet d'identifier la source de la pollution : 2 3 cycles aromatiques fuel 4 6 cycles aromatiques combustion, suie Prylne dcomposition de plantes
Dif
fr en ts
sit
es
20
Outdoor
Autre exemple : signature COV (Composs Organiques Volatils) dans les missions de bois moisis
Pas de compos "typique" de l'odeur de moisi, mais diffrence de signature du bois sain et du bois moisi
-pinene -pinene
-pinene -pinene
les signatures spectrales (cd les diffrences ou les rapports de rflectance dans diffrentes bandes de frquence) peuvent tre traites comme valeurs numriques pour donner des images du sol, de la vgtation ou de l'eau en fausses couleurs
21
Fausses couleurs
Canal 4 : 0.76-0.90 nm (proche IR) eau = faible rflectance (noir), champs verts = haute rflectance, fort et zones rsidentielles = diffrentes rflectances
Exemple : "Normalized Difference Vegetation Index" NDVI = (Proche IR-Rouge)/(Proche IR+Rouge) = image de la photosynthse Carte de la vgtation (fausses couleurs) : vert clair = vgtation vigoureuse, marron = absence de croissance
Juillet
Janvier
La pluie est charge des polluants atmosphriques et pntre dans la nappe la dtection dans l'eau souterraine de polluants typiquement anthropiques permet de dater l'eau (pour tudier le taux de renouvellement, l'histoire des pisodes de pollution, ) Avant 1960 : ni CFC (gaz propulseurs), si SF6 (isolant lectrique) Entre 1970 et 1990 : augmentation des CFC (puis interdits par le protocole de Montral) Entre 1970 et aujourd'hui : augmentation du SF6 si on trouve des CFC dans une eau, c'est qu'elle a entre 20 et 50 ans, donc qu'elle est entre dans la nappe au moment de l'intensification des pratiques agricoles et des activits humaines elle est potentiellement pollue
22
Pour pouvoir identifier la cause d'une pollution, il faut souvent mlanger plusieurs variables
Ex. : rose de pollution, qui mlange la concentration en un polluant, la direction (et la vitesse) du vent On calcule la concentration moyenne du polluant sur une priode donne, par secteur d'origine du vent (ventuellement pondre par la vitesse moyenne du vent dans ce secteur)
Exemple: Evaluation de la qualit de l'air ambiant prs du complexe sidrurgique de Marchienne-au-Pont (Charleroi), ISSeP 18/05/2006
23
Rpartition du niveau de NO2 en fonction du secteur de vent sur la place de l'Opra Paris entre le 24 mai et le 21 juin 2006 la pollution vient surtout du sud-est (Rue du Quatre-Septembre)
AirParif "Campagnes de mesure de la qualit de l'air en sites trafic parisiens forte frquentation pitonne (dcembre 2006)
1. Contexte de la rcolte et du traitement des donnes dans l'environnement 2. Concept d'indicateurs globaux 3. Concept de signature 4. Units et chelles 5. L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
Diversit des units et des chelles dans les sciences environnementales En environnement : beaucoup de disciplines et chacun a ses propres rfrences Exemple : degr Celsius 0= conglation de l'eau 100= bullition de l'eau
degr Farenheit (1706) 0= temprature d'un mlange de glace pile et de sel temprature du corps humain = 100
24
25
1 hectare = 104 m2
1 barn = 10-28 m2
Pour le temps : seconde, jour, semaine, mois anne Problmes : 1 mois ne contient pas toujours le mme nombre de jours (28, 29, 30, 31) et ne contient pas un nombre entier de semaines
REM = Roentgen Equivalent Men = dose unitaire de radiation ionisante qui engendre les mmes effets biologiques que ceux qui sont dus 1 Roentgen de rayons X maintenant le Sievert
26
Rfrence europenne !!! (3 4 fois plus de consommation d'eau aux USA et beaucoup moins en Afrique)
27
Charge polluante 1 ouvrier = 1/2 E.H. 1 employ = 1/3 E.H. 1 lve = 1/10 1/3 E.H. 1 lit = 1 E.H. 1 place = 1/3 E.H. 1 personne = E.H.
Got de l'eau liste non exhaustive de qualificatifs : saveur acide, amre, got de vase, de moisi, de terre, (idem pour odeur, bruit)
Tables de conversion
vers le Systme international (S.I.) exemple pour la longueur
Unit
angstrm anne-lumire fermi foot furlong inch micron mile mille nautical mile (UK) parsec perch pica point (imprimerie) rod unit astronomique yard
28
Formules de conversion
Pour les gaz : fluides compressibles on ne peut pas employer simplement la densit pour passer d'un volume une masse Cv est une concentration volumique (volume de gaz par volume d'air) en ppm (parts pour million) ou ppb (parts pour milliard) c'est un rapport de volumes (sans dimension) comment passer la concentration Cg en masse par unit de volume (mg/m3) ?
Cv = rapport de volumes
nombre de moles du produit dans 1 m 3 d' air volume d' une mole = 1 m 3 d' air Cg 24.45 litres MM g = 1 m 3 d' air
24.45 Cv = Cg MM g
Maintenant : 1 650 763.73 x longueur d'onde dans le vide correspondant la transition entre niveaux 2p10 et 5d5 de l'isotope 8636Kr
29
Unit SI hertz (Hz) joule (J) volt (V) pascal (Pa) lux (lx) gray (Gy)
Dimensions en units SI s-1 kg m2 s-2 kg m2 s-3 A-1 kg m-1 s-2 cd m-2 m2s-2
30
v=Kdi
v=vitesse de l'eau (m/s) i=gradient de pression KD=conductivit hydraulique
Si i en Pa/m KD a les dimensions m3 s kg-1 Mais lorsque la pression est exprime en m KD est en m/s
Dfinitions
Dose absorbe (absorbed dose) : quantit de "polluant" reue pendant un temps donn par un milieu ou un sujet expos Dose absorbe spcifique (specific absorbed dose) : idem, mais ramen l'unit de masse du rcepteur (ex: par kg de masse corporelle) Dose collective (collective dose) : dose individuelle x nombre de personnes exposes Dose cumule (cumulative dose) : somme des doses reues durant un intervalle de temps donn
31
Quantification des effets pharmacologiques des mdicaments : Relation dose-effet Dr. J.M. Reymann, Dr. B. Saag
32
Dose ltale 50 [DL50] (lethal dose 50 [LD50]) : dose qui provoque la mort chez 50% des individus) notion de "mort" de l'individu souvent test sur des animaux, puis extrapol l'homme DE50<DT50<DL50 et DL50/DE50 ou DT50/DE50 = "marges de scurit"
Dose minimum entranant un effet observ (Lowest Observed Effect Dose [LOED]) = Dose proche de la NOEL, mais juste un peu suprieure pour entraner un effet significatif
Doses limites
Effets chroniques
Dose journalire acceptable [DJA] (Acceptable Daily Intake [ADI]) = Dose sans effet adverse observ (NOEL) valable pour une journe souvent = NOEL x facteur de scurit, par exemple ADI=NOEL/100
33
34
Echelles
Echelle nominale Caractristique Codage arbitraire des objets mesurs Non Non Classification en catgories Echelle ordinale Classement des objets en ordre selon le rang d'un attribut Non non Evident pour les mesures mtriques, plus difficile pour des jugements, des apprciations Transformation monotone : si la squence est la mme Histogrammes, "Pie charts" Echelle de Mohs, de Beaufort Echelle intervalles Les intervalles peuvent tre compars Oui Non Rfrence arbitraire (ex. : 0 C = glace fondante) Echelle rapports (cardinale) Mesures mtriques, intervalles o la multiplication est possible Oui Oui Mesure "classique" en rfrence un point "zro"
Transformation autorise
Remplacer individuellement chaque code par un autre Diagrammes de Venn Codage de plantes, de professions,
Transformation linaire de type ax+b Courbes sans signification l'origine des axes Quotient intellectuel, chelle des C
Transformation scalaire uniquement (changement d'units) Courbes avec rfrences fixes Force, nergie, longueur
Reprsentation
Exemple
Nature de la saveur et du got de l'eau Saveur acide amre sale sale et amre Got bicarbonat, alcalin mtallique chlor d'hydrocarbure de pharmacie de terre ou de vase de moisi
Origine possible
fer, manganse, cuivre traces d'hydrocarbures produits organiques eaux de zones calcaires, eaux stagnantes moisissures, champignons, levures
Echelles
Echelle nominale Caractristique Codage arbitraire des objets mesurs Non Non Classification en catgories Echelle ordinale Classement des objets en ordre selon le rang d'un attribut Non Non Evident pour les mesures mtriques, plus difficile pour des jugements, des apprciations Transformation monotone : si la squence est la mme Histogrammes, "Pie charts" Echelle de Mohs, de Beaufort Echelle intervalles Les intervalles peuvent tre compars Oui Non Rfrence arbitraire (ex. : 0 C = glace fondante) Echelle rapports (cardinale) Mesures mtriques, intervalles o la multiplication est possible Oui Oui Mesure "classique" en rfrence un point "zro"
Transformation autorise
Remplacer individuellement chaque code par un autre Diagrammes de Venn Codage de plantes, de professions,
Transformation linaire de type ax+b Courbes sans signification l'origine des axes Quotient intellectuel, chelle des C
Transformation scalaire uniquement (changement d'units) Courbes avec rfrences fixes Force, nergie, longueur
Reprsentation
Exemple
35
Duret 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Talc, friable sous l'ongle Gypse, rayable avec l'ongle Calcite, rayable avec une pice en cuivre Fluorite, rayable avec une trace lgre au couteau Aporite, rayable au couteau Orthose, rayable la lime, par le sable Quartz, raye une vitre Topaze, rayable par le carbure de tungstne Corindon, rayable au carbure de silicium Diamant, rayable uniquement avec un autre diamant
Formule chimique Mg3Si4O10(OH)2 CaSO42H2O CaCO3 CaF2 Chaque lment raye le prcdent Ca5(PO4)3(OH-,Cl-,F-) KAlSi3O8 SiO2 Al2SiO4(OH-,F-)2 Al2O3 C
Niveau 1 2 3 4 5 6 7 8 9
Effet observ Vibrations non perceptibles par l'homme Les lustres bougent lgrement La vaisselle tremble Dgts matriel Les vitres se cassent Les chemines s'croulent Les tuiles tombent du toit Des fissures apparaissent dans le sol Les canalisations cassent Les murs s'croulent Les voies ferres se plient Les immeubles s'croulent Les ponts se cassent Tout est violemment projet dans les airs Le sisme dtruit toutes les constructions
Fume s'lve verticalement Fume dvie Frmissement des feuilles Feuilles et petites branches constamment agits Le vent soulve la poussire et les feuilles de papier Les arbustes se balancent Grandes branches agites, fils lectriques faisant du bruit, parapluie difficile utiliser Arbres agits en entier, marche contre le vent pnible Branches casses, marche contre le vent impossible Tuyaux de chemine et ardoises arraches Rare l'intrieur des terres. Arbres dracins, dommanges aux habitations Trs rarement sur terre Jamais sur terre
La mer est comme un miroir Rides ressemblant des cailles de poisson Vaguelettes courtes Trs petites vagues cume Petites vagues devenant plus longues Vagues modres Lames, crtes d'cume blanche La mer grossit, l'cume est souffle en tranes Lames de hauteur moyenne, plus allonges Grosses lames paisses, tranes d'cume Trs grosses lames, visibilit rduite Lames trs hautes Air plein d'cume, visibilit nulle
3.4-5.4 5.5-7.9 8.0-10.7 10.813.8 13.917.1 17.220.7 20.824.4 25.428.4 28.532.6 >32.7
7 8 9 10 11 12
Grand frais Coup de vent Fort coup de vent Tempte Violente tempte Ouragan
36
1 2 3 4 5
Echelles
Echelle nominale Caractristique Codage arbitraire des objets mesurs Non Non Classification en catgories Echelle ordinale Classement des objets en ordre selon le rang d'un attribut Non non Evident pour les mesures mtriques, plus difficile pour des jugements, des apprciations Transformation monotone : si la squence est la mme Histogrammes, "Pie charts" Echelle de Mohs, de Beaufort Echelle intervalles Les intervalles peuvent tre compars Oui Non Rfrence arbitraire (ex. : 0 C = glace fondante) Echelle rapports (cardinale) Mesures mtriques, intervalles o la multiplication est possible Oui Oui Mesure "classique" en rfrence un point "zro"
Transformation autorise
Remplacer individuellement chaque code par un autre Diagrammes de Venn Codage de plantes, de professions,
Transformation linaire de type ax+b Courbes sans signification l'origine des axes Quotient intellectuel, chelle des C
Transformation scalaire uniquement (changement d'units) Courbes avec rfrences fixes Force, nergie, longueur
Reprsentation
Exemple
Echelles intervalles
Echelle de quotient intellectuel Estimation en rfrence la mdiane de la population (QI=100)
QI 70 85 100 110 115 120 130 % des personnes ayant un QI suprieur 97.7 84 50 25 16 7 2.3
Les personnes possdant un QI=140 ne sont pas "deux fois plus intelligentes" que celles ayant un QI=70
Echelle de temprature en C
20 n'est pas le double de 10 C C
37
Echelles
Echelle nominale Caractristique Codage arbitraire des objets mesurs Non Non Classification en catgories Echelle ordinale Classement des objets en ordre selon le rang d'un attribut Non non Evident pour les mesures mtriques, plus difficile pour des jugements, des apprciations Transformation monotone : si la squence est la mme Histogrammes, "Pie charts" Echelle de Mohs, de Beaufort Echelle intervalles Les intervalles peuvent tre compars Oui Non Rfrence arbitraire (ex. : 0 C = glace fondante) Echelle rapports (cardinale) Mesures mtriques, intervalles o la multiplication est possible Oui Oui Mesure "classique" en rfrence un point "zro"
Transformation autorise
Remplacer individuellement chaque code par un autre Diagrammes de Venn Codage de plantes, de professions,
Transformation linaire de type ax+b Courbes sans signification l'origine des axes Quotient intellectuel, chelle des C
Transformation scalaire uniquement (changement d'units) Courbes avec rfrences fixes Force, nergie, longueur
Reprsentation
Exemple
Echelles rapports
Echelles non linaires Echelles logarithmiques : pour traduire les effets sensitifs chez l'homme, pour viter la manipulation de trop grands nombres dB pour le bruit, pH pour l'acidit, Cartographie (ex. : chelle ordinale de mesure de l'intensit olfactive)
38
Attention aux phnomne de synergie et d'inhibition des odeurs addition de type vectorielle pour des mlanges binaires
1. Contexte de la rcolte et du traitement des donnes dans l'environnement 2. Concept d'indicateurs globaux 3. Concept de signature 4. Units et chelles 5. L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
Incertitude =? Erreur
Dfinition de "vraie"
39
L'valuation de l'erreur peut servir corriger la valeur mesure et, par chance, cette valeur peut effectivement se retrouver trs prs de la vraie valeur la valeur ainsi corrige ne prsente pratiquement plus d'erreur.
Mais l'incertitude reste la mme, car l'exprimentateur n'est pas sr que la correction a t efficace.
Vitesse quelle hauteur par rapport au sol ? Vitesse moyenne ? mdiane ? Calcule sur quelle frquence d'chantillonnage ?
40
Variabilit temporelle Exemple : rendement d'une station d'puration dpend du moment dans la journe, de l'poque dans l'anne,
Variabilit spatiale Exemple : concentration en nitrates dans une nappe varie en fonction de la profondeur et de la distance la source de pollution
Rcipient de prlvement d'eau pas bien rinc. Oprateur trop prs du sonomtre
41
42
Avant d'effectuer la mesure, on peut prendre des prcautions pour minimiser l'erreur alatoire
Biais, dispersion, justesse, fidlit Racine de la variance du paramtre = Dispersion (composante alatoire de l'erreur) Si c'est la moyenne que l'on veut valuer
Biais = diffrence (en valeur absolue) entre l'estimateur et la vraie valeur du paramtre (composante systmatique de l'erreur) Pour la moyenne
Biais = y
Ni juste, ni fidle
Juste et fidle
43
Biais, dispersion, justesse, fidlit 1. Biais Identifier les causes : pas trop difficile
Biais, dispersion, justesse, fidlit Echantillonnage de la fraction respirable (<10m) des arosols
Principe du cyclone : on impose un mouvement circulaire aux particules les grosses tournent vers l'extrieur, puis descendent par gravit les petites restent sont entranes par le vortex intrieur ascendant
Sources de biais : COV gnrs par le sac et par la pompe de prlvement, COV adsorbs sur les parois du sac
44
Biais, dispersion, justesse, fidlit Prlvement des dioxines en continu dans les chemines
Sources de biais : effet de mmoire de la sonde qui s'est encrasse par un pisode de pollution lors d'un prlvement prcdent
Sources de biais : effet de la lumire ou de la temprature sur l'chantillon durant son transport
Biais, dispersion, justesse, fidlit 1. Biais Quantifier le biais : beaucoup plus difficile !!!
45
Biais, dispersion, justesse, fidlit 2. Dispersions Additives par les variances erreurs qui sont additifs ce sont les carrs des
Difficile galement de quantifier les diffrentes composantes de l'erreur (s1, s2, sm)
Consquence sur l'assurance qualit de l'analyse : faux positifs et faux ngatifs Le rsultat de la mesure sert prendre une dcision une erreur d'chantillonnage (ou d'analyse) peut conduire se tromper dans la dcision prise. Matrice de confusion.
Exemple : recherche de traces d'arsenic dans l'eau de baignade.
Prdiction
Il y avait de l'As et on l'a dtect Il y avait de l'As et on ne l'a pas dtect (erreur II ou ) Il n'y avait pas d'As et on ne l'a effectivement pas dtect Il n'y avait pas d'As et on en a pourtant dtect (erreur I ou )
Oui
Ralit Oui
Non FN VN
VP FP
Non
46
A=
VP + VN VP + VN + FP + FN
Sensibilit=Taux de vrais positifs = % positifs correctement identifis par rapport tous les positifs rels Idal = 1 (100%)
SE =
VP VP + FN
Classification de rsultats
Avec prise en compte de lincertitude => Classification plus fine Rsultats non- conformes Non- conforme Seuil Rsultat conforme Rsultats conformes Probable non-conforme Possible non-conforme
47
[C]
[C]
Lab1
Lab2
Lab1
Lab2
Ne pas "noyer" l'interlocuteur avec trop de chiffres, mme s'ils sont significatifs tout dpend du message faire passer Exemple : j'ai pay ma voiture 16745 23 cents Les chiffres significatifs ne sont pas utiles pour l'interlocuteur
En physique, en l'absence d'un intervalle d'incertitude explicite, on admet que celui-ci est gal une demi unit du dernier chiffre fourni. si la valeur mesure de la biomasse d'une portion de rivire vaut m=23453 g, on suppose que le dernier chiffre (3) est incertain, on a donc
48
Anneaux 1 et 2: Les deux premiers anneaux indiquent les deux premiers chiffres de la valeur de la rsistance. Pour notre exemple : anneau vert 5 anneau bleu 6 Anneau 3 : Il indique le nombre de zros rajouter. Anneau rouge 2 donc on rajoute derrire les premiers chiffres 2 zros, ce qui revient aussi multiplier par 102. La valeur de la rsistance est donc R=5600 Anneau 4 : C'est une indication du fabricant sur la prcision de la valeur de la rsistance. Elle est donne en pourcentage. Anneau dor prcision +/- 5%.
Donc, la rsistance est de 5600 280 on ne peut crire R=5600 (les deux derniers zros ne sont pas significatifs), mais bien 5.6 k
Combien de chiffres significatifs prsenter ? A recommander : la notation "ingnieur", avec des puissances de 10 comprenant des exposants en multiples de 3 10-3, 106, 10-9, 1012, Par exemple, pour rsoudre un problme il faut convertir le volume d'un bassin d'orage de 23.5 m3 en ml ne pas crire 23 500 000 ml, mais 23.5x106 ml !!! Autre exemple : la distance de la Terre au Soleil (unit astronomique) n'est pas constante, elle vaut, en moyenne sur une anne 1 UA = 1,495 978 70 1011 m.
souvent on arrondit cent cinquante millions de km OK, mais cela doit s'crire : 1 UA = 1,50 108 km, ou 1 UA = 1,50 1011 m, et non 150 000 000 km. Sinon, on croirait que l'unit astronomique ne varie pas de plus de 1km, or elle varie de 402 130 km sur une anne !!!
Vu le danger des dioxines, la norme a t fixe une valeur trs basse : 0.1 ng/Nm3, qui est trs prs de la limite de dtection de la mthode de prlvement et d'analyse. Si la LOD est de 0.1 ng/Nm3, on ne peut pas ajouter un deuxime chiffre significatif. 0.14 ng/Nm3 est-il tolr ? la Rgion wallonne a dcid de "tolrer" des valeurs jusqu' 0.199999 ng/Nm3.
49
Perception
Perception
Perception
Concentration
Log Concentration Un intervalle d'incertitude symtrique sur une chelle logarithmique devient asymtrique sur l'chelle de perception
Exemple : incertitude sur une concentration d'odeur de 1000 uo/m3 = [500,2000 uo/m3]
Diagramme Cause-Effet (Ishikawa) Objectifs Sassurer que toute source potentielle a t identifie et ventuellement prise en compte Indispensable dans le cas dune approche bottom-up (quantification de chaque source individuelle, par rapport l'approche "top-down", qui value l'incertitude de manire globale, pour l'ensemble du processus) Faciliter le regroupement des sources
50
Conc _ ech =
P r l v e m e n t
E ta lo n n ag e
In d ice co m p te u r
P re s s io n c o m p te u r
T em p ra tu re c o m p teu r
E ta lo n n ag e c o m p te u r
R p tab ilit
T a ra g e C o n d e n s at
C o m p te u r
P e rc a g e
L o t d e ca r to u c h e
T e m p r atu r e d e la c a rto u c h e
C ar to u ch e X A D
P re s sio n c o n d e n s atio n
T em p e ra tu re c o n d e n s a tio n
Is o cin tism e
E a u r s id u elle F iltre
D io x in e C o n c e n tra tio n
C a rto u c h e X A D S p cific atio n s S e rin g u e fo u rn is s e u rs T em p ra tu re V o lu m e d e d o p a n t F io le Lot D u r e D ilu tio n S o lv a n ts d lu tio n s P r -co n ce n tra tio n E ta lo n n ag e D o p ag e L ot S o lva n t R in c a g e Condensat C o lo n n e S p cifica tio n s S o lu tio n s d ta lo n n a g e P r -c o n c e n tr a tio n C o lo n n es V o lu m e d e d o p a n tS er in g u e S p cific atio n s fo u rn iss e u rs D o p ag e
S ch a g e
S u rfa c e d e p ic
A c id ifica tio n R in c a g e
R in c a g e s o n d e
E x tra c tio n
P u rific a tio n
A n a ly s e
51
l'chantillonnage (variations alatoires entre chantillons, ) les conditions de stockage des chantillons (dure, conditions) les effets des instruments (limites de prcision de la calibration, du contrle de la temprature, ) la puret des ractifs la stchiomtrie relle, qui peut diffrer de la stchiomtrie suppose si la raction est incomplte les conditions opratoires (variation de volume due la temprature, ) les effets de matrice et d'chantillon, en gnral (stabilit par exemple) les effets mathmatiques (par exemple, le fait de linariser une courbe de calibration ou de tronquer ou d'arrondir une mesure) la correction de blanc (incertitudes dues la pertinence du "blanc") les effets dus l'oprateur (erreurs de lecture, d'interprtation) les effets alatoires.
S'il s'agit de la mme temprature (p.ex. : temprature du labo ne la prendre qu'une seule fois en compte
Prcision Calibration
Volume
Le biais sur un chantillon risque peut-tre d'tre le mme que sur le blanc se simplifient
52
Il est possible que l'erreur sur le volume de la verrerie soit ngligeable par rapport celle de la balance
Distinguer ce qui est biais (valu par talonnage) et ce qui est dispersion (valu par rplicats)
Se baser sur les quations physiques : ex. : dilatation des corps en fonction de la temprature
L'erreur vaudra alors a/3 (probabilit = aire = environ 2/3 de l'aire totale)
53
c u( x )
2 i i
54
1. Contexte de la rcolte et du traitement des donnes dans l'environnement 2. Concept d'indicateurs globaux 3. Concept de signature 4. Units et chelles 5. L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
L'chantillonnage est une tape trs complte et fondamentale de la surveillance de l'environnement. Elle comprend : le choix des endroits de mesure dans l'espace le choix des moments de mesure dans le temps (poque, dure, frquence, synchronisation) les prcautions de prlvement d'chantillon ou de placement d'un appareil de terrain
Pourquoi un chantillon ?
Slection de 200 personnes caractristiques pour une enqute concernant les habitudes de tri des dchets dans la province de Luxembourg (population-mre = 240000 habitants)
55
Toutes les combinaisons de n parmi N sont autorises, avec la mme probabilit n/N (cas du tirage sans remise)
D'abord, identifier les individus (ex. : toutes les personnes d'une rgion donne) Ensuite : tablir la liste des individus (ex. : en les identifiant par un numro unique) pas l'annuaire tlphonique (car alors on ne s'adresse qu'aux gens qui ont le tlphone) Gnrateur de nombres alatoires Exemple : fonction ALEA.ENTRE.BORNES(a;b) d'Excel
Prcautions !!!! distribution rectangulaire spcifier les bornes (ou faire une transformation affine (ax+b) de la fonction) nombres entiers (arrondir ventuellement) liminer les doublons si le tirage est sans remise)
on peut calculer diverses caractristiques statistiques, Application la valeur moyenne d'une variable (par exemple la distance au premier parc conteneurs)
y=
1 n yi n i =1
56
on peut redresser le tirage en donnant moins de "poids" aux units de grande taille
Par exemple : exploitations agricoles tires d'aprs leur surface entreprises tires d'aprs leur chiffre d'affaire mnages tirs d'aprs le nombre de personnes (p.ex. pour une enqute "dchets")
application au calcul de la valeur moyenne d'une variable (par exemple la quantit d'engrais utilise par une exploitation agricole, X tant la taille de l'exploitation en ha)
y=
i=n Xi/X
1 n yi n i =1 i
i = probabilit d'inclusion, Xi="taille" de l'unit i, X="taille" totale si i=1, l'unit i ne reprsente qu'elle-mme, si i=0.01, l'unit i reprsente 100 units de la population
S'il existe une "stratification", c'est--dire une structure sous-jacente ex. : classes d'ge, de sexes, de catgories socio-professionnelles,
on pratique un chantillonnage alatoire simple indpendamment dans chacune des classes intressant si chaque strate est homogne et s'il existe une grande diffrence entre les strates en gnral : chantillonnage proportionnel (rapport nh/Nh constant)
57
Application la valeur moyenne d'une variable (par exemple la quantit annuelle d'eau consomme, pour diffrentes classes d'ge h)
1 y= N
N
h =1
yh
S'il existe des "grappes" ex. : familles, communes, rues, passagers d'un mme vol, patients d'un mme mdecin, d'un mme hopital, on choisit des grappes au hasard et on chantillonne tous les individus d'une mme grappe Intressant, mme si on ne dispose pas de la liste de toute la population Indiqu surtout si les individus sont trs dissemblables dans une mme grappe, mais si les diffrentes grappes se ressemblent
Application la valeur moyenne d'une variable (par exemple le nombre de voyages par an pour les k passagers i d'un mme vol g, m "vols" sont analyss au total)
yg =
1 k y gi k i =1
y=
1 m yg m g =1
58
et slection de certaines d'entre elles Deuxime degr : slection d'units au sein des grappes Diffrence avec le sondage en grappe : chaque grappe dsigne n'est pas explore exhaustivement Avantage : la base de sondage pour les units secondaires peut tre construite durant la "visite" des units primaires choisies
= "mission raliser"
59
Mthode des quotas Avantages : pas besoin d'une liste exhaustive des individus dans la population frais rduits car les enquteurs choisissent eux-mmes les personnes sondes Inconvnients : pas possible de calculer la marge d'erreur, car les statistiques ne s'appliquent pas souvent : biais systmatique d l'enquteur (ex.: jolies filles, personnes disponibles )
mthode qui dpend beaucoup de la qualit du travail de l'enquteur, de son honntet scientifique. souvent : problme de "fin de feuille" (les dernires personnes trouver): l'enquteur est tent de "tricher"
Ex. : la sortie d'un magasin de literie pour des acheteurs de matelas, sur un quai de gare pour un sondage sur les transports en commun, Grand biais possible et aucune possibilit de statistiques.
60
Trs conomique, mais biais important, car uniquement bas sur les relations humaines.
Avantage sur la mthode des quotas : moins de libert l'enquteur Mais : prparation plus longue d'itinraires "alatoires", consultation de cartes, choix
la plus conomique la moins dfendable statistiquement la seule possible pour certaines tudes (mdicales par exemple) Ex. Audimat analyse du courrier : l'avis des personnes qui crivent la station n'est pas reprsentatif interviews sur les programmes regards la veille : fait appel la mmoire (risque d'erreur) panels avec journaux d'coute (personnes permanentes charges de noter leurs impressions) : uniquement les gens disponibles (biais) panels audimtriques (appareils enregistreurs sur la TV) : rapide et prcis, mais enregistre, mme si personne ne regarde
61
1. Contexte de la rcolte et du traitement des donnes dans l'environnement 2. Concept d'indicateurs globaux 3. Concept de signature 4. Units et chelles 5. L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
Intensit de l'odeur entre 0 et 5 (0=pas d'odeur, 5=odeur insupportable) 0 signifie quelque chose et il ne faut pas coter "0" une valeur manquante !!!
62
Rappel : chelle rapport (intervalles + "zro") = chelle la plus "solide" mathmatiquement possibilit d'appliquer les statistiques
Date 1/01/2000 2/01/2000 3/01/2000 4/01/2000 5/01/2000 6/01/2000 7/01/2000 8/01/2000 9/01/2000 10/01/2000 11/01/2000 12/01/2000 13/01/2000 14/01/2000 cuivre (ppm) 0.08 0.05 0.04 0.03 0.01 0.05 0.13 0.16 0.11 0.09 0.07 0.04 0.02 0.03 chrome (ppm) 0.13 0.1 0.1 0.02 0.03 0.14 0.1 0.08 0.11 0.11 0.09 0.08 0.1 0.09 zinc (ppm) 0.63 0.65 0.4 0.01 0.03 0.23 0.31 0.37 0.37 0.39 0.27 0.36 0.46 0.29
2
1 2 frquence( y ) = e 2
1 y y
y
CV =
Rappel : chelle intervalles (intervalles mais pas de "zro") possibilit d'appliquer les statistiques, mais pas CV
T_air -4.4 0.12 1.44 9.46 8.98 12.6 15.82 15.34 14.36 9.98 4.3 2.62 4.94 3.06 4.18 7.8 12.82 13.94
CV =
OK
Rappel : chelle ordinale (catgories, mais en ordre) les notions classiques de statistiques sont moins pertinentes
45
Nuisance acoustique 4 1
Nbre d'obs.
40 35 30 25 20 15 10
0 1 5 5 2
1 3 2 0 5 1 4 4 5
0 0 1 2 NUISANCE 3 4 5
Moyenne = 2.6875 ???? pertinence sur une chelle ordinale Cependant, les rsultats de statistiques peuvent s'avrer pertinents
63
Exemple : enqute "chauffage dans la province de Luxembourg 1. le volume total de la maison, exprim en m3 2. le nombre de personnes habitant la maison (de 1 8) 3. l'ge du chef de mnage (en classes croissant avec l'ge, de 1 8) 4. l'isolation thermique de la maison (en classes croissant avec le degr d'isolation , de 0 10) 5. la satisfaction du point de vue du confort thermique (en classes codes de 1 5, le confort "neutre" tant cod 3) 6. la satisfaction du point de vue du cot (en classes codes de 1 5, un cot "acceptable" tant cod 3) 7. le cot annuel total du chauffage (en BEF) 8. l'intensit du chauffage dans la maison (en classes croissant avec la temprature de consigne et le nombre de pices chauffes, codes de 0 18) 9. l'anne de construction de la maison (en classes crossant plus la maison est rcente, codes de 1 4) 10. la situation de la maison (1=isole, 2=jumele, 3=entre mitoyens)
???
Rappel : chelle nominale (dichotomique prsence/absence- ou classes sans ordre) les notions classiques de statistiques ne peuvent tre appliques
Site Site 1 Site 2 Epilobe 0 0 Iris 1 1 Anmone 1 0 Carex 0 0 Polygonum 1 0 Sorbier 0 1 Sagittaire 1 0 Bouleau 1 1
Anmone 1 0
indice de similarit entre deux sites si c=nombre d'espces partages entre les deux sites (2 ici) a, b nombres d'espces rencontres uniquement sur chacun des deux sites (2 et 3 ici) Indice de Jaccard SJ Indice de Srensen CC
SJ =
c a+b+c
CC =
ici :
2c a + b + 2c
ici : SJ=2/(2+3+2)=2/7=0.29
CC=(2x2)/(2+3+2x2)=4/9=0.44
64
Parachutisme 0 1
Pesticides 1 0
mthodes "statistiques" adaptes ex. tables de contingence : compter les effectifs et croiser les variables
Rivire Semois Semois Ton Semois Ton Semois Semois Semois Ton Ton Ton Semois
Poisson Truite Ombre Truite Ombre Ombre Truite Truite Ombre Truite Ombre Ombre Truite
Ton 2 3 5
Totaux 6 6 12
Ide du test : si la Semois et le Ton sont des rivires "quivalentes" la diffrence entre le nombre de truites dans les deux rivires est-elle significative ou peutelle tre attribue au hasard ? Test 2 : comparaison de valeurs "observes" des valeurs "thoriques" (par exemple 3 truites dans les deux rivires).
65
mthodes "statistiques" adaptes l'accord qualitatif inter-observateurs Ex. : diagnostic de deux mdecins le patient Pi est atteint de la maladie M
Individu P1 P2 P3 P4 P5 P6 P7 P8 P9 Mdecin A 1 0 1 1 1 0 0 0 1 Mdecin B 1 1 1 1 0 1 0 0 0
L'accord peut aussi tre d au hasard il faut enlever la composante alatoire si P0 est la probabilit d'accord observ et Pe est la probabilit d'accord alatoire
P0 Pe 1 Pe
P P = 0 e 1 Pe
Ici =(0.56-0.51)/(1-0.51)=0.102
Accord Excellent Bon Modr Mdiocre Mauvais Trs mauvais Kappa
0,81
n n
i =1
ii
0,80 - 0,61 0,60 - 0,41 0,40 - 0,21 0,20 - 0,0 < 0,0
soit la moyenne des termes diagonaux dans le tableau de contingence ici 5/9=0.56 Pe=somme des produits des effectifs marginaux divise par le carr de la taille de lchantillon = 1 2 ni ni ici (4x4+5x5)/92=0.51 n 2 i =1
Ex. : abondance du triton crt dans les mares, en fonction de la profondeur et de la luminosit
Endroit L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 Profondeur (cm) 50 60 100 40 120 80 30 40 150 200 45 Luminosit (Lux) 200 500 200 160 25 120 50 400 100 30 300 Abondance abondant abondant rare abondant prsent prsent rare abondant rare prsent abondant
variables quantitatives
variable qualitative
66
Profondeur
Abondance
Luminosite
abondant
rare
prsent
500
400
300
200
100
abondant
rare Abondance
prsent
450 400
Luminosite
abondant
Luminosite
rare
40
42
44
46
48
50
52
54
56
58
60
62
80 60 40 20
Profondeur
Luminosite = 142.8571-0.6339*x
140
40 60 80 100 120 140 160
Profondeur
120
prsent
100
Luminosite
80
60
40
20 60
80
100
120
140
160
180
200
220
Profondeur
mthodes "statistiques" adaptes graphismes) par classe Analyse factorielle (composantes principales) en regroupant les "scores" (observations) par centre de gravit : ex.: enqute "chauffage" 10 variables et 800 observations (mnages) regroups par profession ou combustible,
67
Objectif : tudier l'influence d'un (ou de plusieurs) facteur(s) qualitatif(s) sur une variable quantitative !!!! toujours au moins 1 variable quantitative et 1 variable de classement !!!
Endroit L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 Profondeur (cm) 50 60 100 40 120 80 30 40 150 200 45 Luminosit (Lux) 200 500 200 160 25 120 50 400 100 30 300 Abondance abondant abondant rare abondant prsent prsent rare abondant rare prsent abondant
Profondeur
Test non significatif pour la profondeur : la profondeur n'a pas d'influence sur l'abondance (les dispersions des 3 classes se chevauchent)
prsent
500
400
300
Luminosite
200
Test significatif pour la luminosit: la luminosit a une d'influence sur l'abondance (les dispersions des 3 classes sont distinctes)
100
-100
-200
abondant
rare
Abondance
prsent
Au dpart, surtout ne rien filtrer de l'information de base !!! Ex. : Mme si, par la suite, le traitement de donnes prvoit d'utiliser des classes d'ge, encoder l'ge rel dans le fichier de base !!! Il sera encore temps plus tard de catgoriser.
Sexe M F M
68
L'information brute doit tre code par observation : un tableau d'occurrences (contingence) est dj une transformation des informations brutes dans le but d'un traitement de donnes.
les nitrates en excs dans les lgumes sont bons pour la croissance (c'est videmment faux, notre organisme ne peut en recevoir que trs peu); l'eau de source vient d'une grande cavit situe dans les roches du sol (c'est faux, elle est situe dans les porosits du sol, mais pas dans un "rservoir souterrain"); une eau est potable si elle est claire et limpide (c'est faux, beaucoup de polluant sont invisibles lorsqu'ils sont dissous dans l'eau); il y a des sources partout dans le monde (c'est faux, beaucoup de rgions ne possdent pas de sources).
10 11 8 9 9
Une fois que le fichier brut est encod, il faut parfois catgoriser les variables !!! importance d'une bonne catgorisation !!! Exemple : pour fabriquer un histogramme de frquences afin de vrifier la normalit de la distribution Exemple : 101 stations dans le bassin du Ton
Identification T2S1 T3S1 T4S1 T5S1 L1S1 L2S1 T6S1 R1S1 R2S1 T7S1 T8S1 V3S1 T9S1 O2 (mg/l) 10.1 10 10.2 11.6 11.2 10.2 10.1 11.6 11.4 10.2 10.2 10.2 %O2 85 84 86 94 92 85 86 97 97 87 86 85 t ( C) 6.8 6.65 6.9 6.2 6.3 6.15 7.35 6.6 7.2 7.05 7 7 Cond (S/cm) 261 203.5 259 255 337 357.5 343 295 304 338.5 314.5 367.5 pH 7.7 8 7.9 8.6 8.2 8.2 8.1 8.3 8.3 8.1 8.5 8.1
69
en 20 intervalles gaux
ou en 8 intervalles en progression gomtrique: (0-10, 10-20, 20-40, 40-80; 80-160, 160-320, 320-640 et 640-1280).
70
Pour certains types d'analyses (p.ex. analyse des correspondances), une variable code en plusieurs catgories doit parfois tre transforme en classes dichotomiques Ex. mesure du niveau de radon en diffrents endroits de la province de Luxembourg, avec diffrentes gologies et diffrentes saisons et diffrentes distances l'anticlinal ardennais
Gologie Sg Sg G G Sg Sg Sg Sg
Dist. Anticl. 13.2 13.2 13.1 13.1 27.2 27.2 6.8 6.8
pour une analyse des correspondances : catgorisation en classes exclusives, y compris les variables quantitatives (intensit de la radioactivit, distance l'anticlinal)
Ident
Localit
Low Bq
Medium Bq
Hig hBq
Printemps
Et
Auto mne
Hiver
Sg
Faible dist.
Grande dist.
0 0 1 1 0 0 0 1
1 1 0 0 1 1 1 0
0 0 0 0 0 0 0 0
0 0 0 1 0 0 0 0
0 1 0 0 0 1 0 1
1 0 1 0 1 0 1 0
0 0 0 0 0 0 0 0
1 1 0 0 1 1 1 1
0 0 1 1 0 0 0 0
0 1 0 0 0 1 0 1
1 0 0 0 1 1 1 1
71
1. Contexte de la rcolte et du traitement des donnes dans l'environnement 2. Concept d'indicateurs globaux 3. Concept de signature 4. Units et chelles 5. L'incertitude de la mesure 6. Echantillonnage 7. Traitement de donnes catgorielles et de donnes numriques mlanges 8. Reprsentation graphique des donnes
La reprsentation graphique des donnes une toute premire tape indispensable du traitement des donnes parfois suffisante pour tirer des conclusions
Diamtre
Nuages de points xy pour deux variables quantitatives : ex. hauteur et diamtre des arbres
15 23 25 27 31 32
72
Parfois utile de transformer un axe ou les deux en coordonnes logarithmiques pour "condenser" l'information pour vrifier une dpendance logarithmique ou exponentielle entre les variables Ex. : volution temporelle du dficit (par rapport la saturation) de l'oxygne dissous dans l'eau lors d'un essai d'aration Allure : Ln(Cs-C)=A+B t c'est--dire Cs-C=exp(A+Bt) ou encore Cs-C=aeBt
!!! valeurs sur l'axe des ordonnes repres par rapport la variable d'origine (ce ne sont pas les valeurs en logarithmes qui figurent sur l'axe) !!!
Ex. : relation entre nombre de voitures en 30" et gne sur une chelle de 0 5
30 29 20 18 35 33 ..;
73
Si plus de deux variables : possibilit de graphiques 3D illusion "artistique" du 3D pas toujours facile interprter souvent prfrer diagrammes 2D deux deux Exemple : liaison entre les teneurs en phosphates, en nitrates et en matires en suspension de divers chantillons d'eau d'une rivire (Attert, Belgique)
N-NH4 (mg N/l) 0.018 0.015 0.023 0.047 0.045 0.046 0.045
P-PO4 (mg P/l) 0.049 0.051 0.053 0.08 0.088 0.088 0.09
MES (mg/l) 6 4 6 6 5 5 2
Ce type de diagramme 3D s'impose si x et y sont des coordonnes de la surface du terrain Ex. : niveau sonore (axe z) par rapport aux coordonnes de terrain (axes x et y)
Prfrer dans ce cas des modles de terrain plus complexes (krigeage, ) et des logiciels adapts (Surfer, Arc Info, ) Ex. : niveaux (altitudes) au CET de Cour-au-Bois
74
Diagrammes en btonnets : surtout utiliss si pas ncessairement de liens entre les observations de "l'axe des x" Soit : Diagrammes de valeurs (y=valeurs)
6 jours 9 jours 12.2 11.5 11.7 11.7 12 jours 11.1 11.4 10.4 10.3 15 jours 10.3 10 10.1 9.9
Ex. : pourcentage de rtention des polyphnols dans les eaux uses d'une huilerie d'olives (margines)
m1 m2 m3 m4
Soit : diagrammes de frquences Ex. : enqute chez les mdecins concernant l'opportunit de crer un service de mdecine de l'environnement : "y a-t-il une demande des patients ?" "pensez-vous qu'il y a une influence de l'environnement sur les maladies ?" Echelle de 1 4
Mdecin D1 D2 D3 D4 D5 D6 D7 D8 Influence de l'environnement 1 2 2 3 2 3 2 1 Demande patients 2 2 3 4 2 3 3 3
Diagrammes en "Camemberts" ("Pie chart") Pour montrer que le total fait 100% des rponses
souvent diagrammes de frquences ex. : avis des mdecins sur l'opportunit d'un service d'analyse des milieux intrieurs
75
Histogrammes diagrammes de frquence pour mettre en vidence la distribution des valeurs Ex. : occurrences des observations de diffrentes classes de diamtre des arbres en fort
Diagrammes symboliques pour mettre en vidence le concept de "signature" globale Ex. : diagramme "radars" pour les concentrations (en mq/l) de 6 ions principaux : Ca++, Mg++, SO4--, HCO3-- + CO3--, Cl- et K+ + Na+ dans 6 rivires 1-Vesdre, 2-Getz, 3-Helle, 4-Gileppe, 5-Loubas, 6-Soor
Autre type de diagramme symbolique : les visages de Chernoff les valeurs relatives des variables slectionnes pour le graphique sont reprsentes par les variations des traits faciaux spcifiques (largeur, hauteur du visage ou de la bouche, paisseur du nez, ).
76
Courbes en fonction du temps 1. Trac horizontal en squence (les intervalles de temps sont tous gaux) Ex. : volution de la concentration en NH4+ (mg/Nl) l'entre et la sortie d'une station d'puration exprimentale constitue d'un marais plant de Typha latifolia.
Courbes en fonction du temps 2. Graphique saisonnier de sous-sries Ex. : temprature moyenne mensuelle de l'air Malonne, prs de Namur sur 5 annes conscutives. Les 12 barres horizontales fournissent la valeur moyenne de la temprature de l'air sur les 5 annes, pour chaque mois (de janvier dcembre) et chaque btonnet vertical permet de juger, en un seul coup d'il, des carts de chaque anne particulire par rapport cette moyenne.
Courbes en fonction du temps 3. Suppression d'une moyenne, d'une tendance ou d'une saisonnalit Ex. : temprature moyenne mensuelle de l'air Malonne, prs de Namur sur 5 annes conscutives. Quand la priodicit sinusodale annuelle est supprime, on peut apprcier les variations plus erratiques de la temprature
77