Vous êtes sur la page 1sur 15

Corrlation et causalit

Daprs www.acnice.fr/ses/stage/outilsstatistique s/correlationetcausalite.ppt

La dpendance (corrlation)

Lorsquune distribution prsente 2 caractres, il est parfois lgitime de se demander sil existe un lien entre eux. On sinterroge alors sur la possible dpendance, dans un sens ou dans lautre de ces deux variables.

La reprsentation graphique : le nuage de points

Le graphique en nuage de points permet de mettre en vidence la relation entre 2 variables. En abscisses, on porte la variable explicative X et en ordonne, la variable explique Y.

Des reprsentations graphiques de corrlation?


Ces reprsentations graphiques correspondent-elles une relation de corrlation?

Des reprsentations graphiques de corrlation?


Ces reprsentations graphiques correspondent-elles une relation de corrlation?

Une mise en vidence graphique de lexistence dune corrlation

Quelle diffrence oprez-vous entre dpendance totale et liaison relative?

Une mise en vidence graphique de lexistence dune corrlation

De la dpendance la causalit
La mise en vidence dune relation graphique ne signifie pas quun lien de causalit existe entre les 2 variables.

Exemple : Fautes dorthographe et pointure


Diagramme de dispersion du nombre de fautes d'orthographe en fonction de la pointure
Nombre de fautes dorthographe

Les lves ayant les plus grands pieds font moins de fautes. Ces deux grandeurs apparemment indpendantes s'avrent en fait lies ngativement
Source : Nicolas Gauvrit, Statistiques : mfiez-vous, Ellipses, 2007.
Pointure

Les variables de confusion


Si deux grandeurs sont lies, il se peut qu'il n'y ait en fait aucune causalit entre elles.

Il se peut qu'aucune relation logique ne puisse alors tre tablie entre les deux variables.
Mais il se peut aussi qu'on trouve une causalit indirecte, passant par une autre variable (ou grandeur). Dans un tel cas, on appelle cette variable cache variable de confusion.

Exemple : Fautes dorthographe et pointure


Diagramme causal entre la pointure, le nombre de fautes, et la variable de confusion ge
Source : Nicolas Gauvrit, Statistiques : mfiez-vous, Ellipses, 2007.

L'exemple des fautes d'orthographe et de la taille des pieds est un cas o une telle variable de confusion intervient : il sagit de l'ge. Dans une cole, les plus grands pieds correspondent, en moyenne et globalement, aux lves les plus vieux, donc ceux de CM2, meilleurs que les CE1 ou les CP en orthographe...

Corrlation contraire au lien causal

Les variables de confusion peuvent faire apparatre des liens de corrlation entre des variables indpendantes. Mais, il existe des cas, o la corrlation est le contraire du lien causal.

Exemple : esprance de vie et consommation dalcool


Diagramme de dispersion de l'esprance de vie la naissance en fonction de la consommation d'alcool par pays
Esprance de vie

Le diagramme ci-contre montre une liaison positive entre les 2 variables. Cela voudrait donc dire que lorsque lon boit plus dalcool, on vit plus vieux.

Consommation dalcool

Source : Joseph Klatzman, Attention stisitiques !, La Dcouverte 1996.

Exemple : esprance de vie et consommation dalcool


Diagramme de dispersion de l'esprance de vie la naissance en fonction de la consommation d'alcool par pays
Esprance de vie

La figure ci-contre nous permet de mieux analyser la relation entre ces 2 variables.
On y dcouvre que : les pays les plus riches sont ceux o lon boit le plus Les pays les plus riches sont aussi ceux o lon vit le plus longtemps.

Consommation dalcool Source : Joseph Klatzman, Attention statistiques !, La Dcouverte 1996.

Exemple : esprance de vie et consommation dalcool


En fait, il faut considrer la variable de confusion "richesse du pays". Cette variable agit sur l'esprance de vie de manire inverse de la consommation d'alcool.

Autrement dit, si l'on considre un pays comme la France, on peut dire que dans ce pays :

les gens boivent beaucoup parce qu'ils sont assez riches pour se le permettre. Cela a pour effet de rduire l'esprance de vie. Mais d'un autre ct, la richesse du pays permet aussi de meilleurs soins, une meilleure alimentation globale. Cela augmente considrablement l'esprance de vie. Cette augmentation fait plus que compenser la rduction d'esprance de vie due la consommation d'alcool.

Le diagramme causal de la figure ci dessous donne une reprsentation de la situation.