Vous êtes sur la page 1sur 1

Mohammed Fellaji - mention SDI

Vulgarisation scientifique de l’étude de cas :

Titre scientifique : «  Inférence statistique des relations de causalité. Vers des algorithmes
d'apprentissage éthiques ? »

Titre grand-public proposé : Comment déterminer les relations de cause à effet ?

Feuillet :

Y a-t-il un moyen pour tester tous les scénarios possibles d’une expérience ? Un moyen qui nous
permettra d’expérimenter avec toutes les conditions initiales possibles et ainsi de prendre
seulement la bonne décision qui reflète la meilleure stratégie. Un exemple d’actualités est
l’efficacité des vaccins contre le covid : une manière conclusive sera de tester, sur la même
population, le même vaccin et ensuite conclure sur l’utilisation ou pas de ce vaccin. Sachez alors
qu’un tel outil existe et ce n’est pas la machine à remonter le temps.

L’objectif de notre étude de cas est effectivement de chercher les relations de causalité dans une
base de données. Comme on ne peut pas pour le moment remonter le temps pour tester les
différents scénarios, on utilisera des outils mathématiques pour estimer le résultat d’une
expérience, qu’on l’a déjà, si on aura changé les conditions initiales. Dans le cas où on se base
seulement sur les données on ne va que déterminer les relations d’associations entre les variables
(corrélations par exemple). Le problème avec cette approche est qu’on ne peut pas déterminer les
relations de cause à effet, d’où l’intérêt d’utiliser l’inférence causale qui se base à la fois sur les
données et sur les hypothèses causales qu’on doit introduire et formuler.

Pour contourner la différence entre l’association et la causalité, une solution peut être de mener
une expérience aléatoire qui consiste à appliquer un traitement (ou pas) à un individu. Un exemple
d’expériences aléatoires est la lancement d’un dé : on ne va appliquer le traitement que si on
obtient 1, 2 ou 3. Par contre, la nature de l’expérience aléatoire nécessite de faire ce choix lors de
la génération des données qui peut ne pas être conforme aux normes éthiques (surtout dans le
domaine de la médecine par exemple où on ne peut pas appliquer un traitement sans tenir en
compte de l’état du patient). De même, on ne peut pas faire cette distinction si la base de donnée
n’est pas générée d’une manière aléatoire. Dans ce cas, on peut utiliser les algorithmes de
l’intelligence artificielle pour chercher les relations de causalités dans la base de données.

Vous aimerez peut-être aussi