Vous êtes sur la page 1sur 10

Introduction du cours

Déroulement du cours

Cours-TD : 9 séances de 2h

TP : 3 séances en 1/2 groupe (2h) + 1 séance d'évaluation (1h)

M3C
20% Examen partiel écrit (1h30, semaine 46 à conrmer)
20% Contrôle continu
10% 2 QCMs (10min, autour des semaines 40 et 43)
10% TP évalué (1h, semaine 50)
60% Examen terminal (1h30 avant ou après coupure de Noël)
Modalités habituelles des examens écrits : calculette autorisée, pas de
document.

Introduction à la Statistique 2 / 10
C'est quoi ?

Gare à l'orthographe...

Les statistiques : ensemble de mesures (résumées ou non) pris au sein d'une


population.

La Statistique : science étudiant ces observations, consistant à recueillir,


traiter, valider et interpréter les données.

3 catégories

La statistique descriptive : outils pour décrire/résumer les données, ouvrant


des débuts de réexion.

La statistique inférentielle : méthodes permettant de généraliser à l'échelle


d'une population des conclusions tirées à partir d'un échantillon, en se
donnant un niveau de conance et une modélisation probabiliste du
phénomène considéré.

La statistique prédictive : prédire des données à partir d'observations déjà à


disposition.

Introduction à la Statistique 3 / 10
Objectifs et programme du cours

Objectifs

Appréhender l'omniprésence d'incertitudes dans le monde empirique.

Apprendre diérents outils statistiques aidant à prendre en compte ces


incertitudes.

Se familiariser avec ces outils au travers d'applications biologiques ou


médicales.

Programme

Chapitre 1 : Statistique descriptive

Chapitre 2 : Introduction à la modélisation probabiliste et à la Statistique


inférentielle

Chapitre 3 : Introduction aux tests statistiques

Chapitre 4 : Intervalles de conance

Chapitre 5 : Catalogue de tests

Introduction à la Statistique 4 / 10
Autre objectif du cours

 On peut faire dire ce qu'on veut aux chires 


(J.-M. Stateu)

Introduction à la Statistique 5 / 10
Espérance de vie

On est jamais aussi bien soigné que par soit-même.

• Répartition des âges de décès en 2012 dans une population de 100000 personnes

Âges 0 2 10 20 30 40 50 60 70 80 90 100
Nb de
360 70 91 391 613 1246 3210 6536 11534 25156 38360 12433
décès

⇒ Espérance de vie pour cette génération ≈ 81.45 ans.

• Répartition des âges de décès en 2012 des médecins parmi ces 100000 personnes

Âges 0 2 10 20 30 40 50 60 70 80 90 100
Nb de
0 0 0 0 2 4 11 22 39 85 129 42
décès

⇒ Espérance de vie pour les médecins de cette génération ≈ 82.13 ans.

MAIS : pour être médecin, il faut faire de longues études... ⇒ Les morts les plus
précoces ont lieu entre 20 et 30 ans.

Remarque : Espérance de vie pour la population de plus de 20 ans ≈ 82.11 ans.

Introduction à la Statistique 6 / 10
Traitement d'une tumeur

Un patient vient de se faire diagnostiquer une tumeur, heureusement traitable via


un des 2 traitements suivants : chimiothérapie ou chirurgie.

Le patient décide de s'en remettre à la littérature scientique concernant les taux


de réussites de ces 2 traitements et trouvent les résultats suivants obtenus sur
2000 patients (1000 traîtés par chimiothériapie, 1000 traîtés par chirurgie).

76.1%
Thérapie Réussite % Réussite
Chimio. 761/1000
Chir. 658/1000 65.8%

Il décide donc de s'en remettre à la chimiothérapie.

Introduction à la Statistique 7 / 10
Traitement d'une tumeur

Une fois son médecin averti de sa décision, celui-ci l'informe qu'il faut prendre en
compte la taille de la tumeur avant de se décider et trouvent cette fois les
résultats suivants (avec les mêmes nombres de patients) :

Taille
Thérapie Réussite % Réussite
Tumeur

90%
Chimio. 671/818 82%
Petite
Chir. 94/105

63%
Chimio. 90/182 49%
Grosse
Chir. 564/895

Ici c'est la chirurgie qui s'avère être le meilleur choix, et ce peu importe la taille de
la tumeur.

Retournement de situation : en fait ces résultats sont issus des mêmes


données... Quelle décision prendre alors ?

Introduction à la Statistique 8 / 10
Explication

Paradoxe de Simpson

À partir d'un même jeu de données, on peut obtenir des résultats complètement
opposés selon comment on aborde leur analyse.

Facteur de confusion

Il y a 3 points à relever
1 On cherche initialement à évaluer l'eet du traitement sur les chances de
guérison.
2 Les grosses tumeurs sont par essence plus compliquées à guérir.
3 On utilise plus souvent des chirurgies dans le cas de grosses tumeurs.

La taille de la tumeur est un facteur de confusion : elle inuence les chances de


guérison ET le choix du traitement.

Si on ignore ce facteur, on se retrouve alors avec une conclusion erronée sur le


plan statistique.

Introduction à la Statistique 9 / 10
Facteur de confusion

Comment se prémunir du paradoxe de Simpson ?

Éviter les études rétrospectives basées sur des données pré-existantes et ne


prenant pas compte des potentiels facteurs de confusion

Favoriser les études prospectives : le plan d'expérience est déni après avoir
identié les diérents facteurs de confusion.

Autres classiques du genre

Paradoxe de Simpson dans Youtube (merci D. Louapre)

Fumer est bon pour la santé

→ D.R. Appleton et al. : Ignoring a covariate : An example of Simpson's


paradox, dans The American Statistician (1996)

Véritable étude sur les traitement de tumeurs

→ C.R. Charig et al. : Comparison of treatment of renal calculi by open


surgery, dans British medical journal (1986)

Introduction à la Statistique 10 / 10

Vous aimerez peut-être aussi