Vous êtes sur la page 1sur 25

Statistiques appliquées à la Génétique

18 février 2021

0
Principe des tests
• Différentes étapes doivent être suivies pour tester une
hypothèse :
• (1) définir l’hypothèse nulle (notée Ho),
• (2) choisir un test statistique pour contrôler Ho,
• (3) définir la distribution de la population théorique Ho,
• (4) définir le niveau de signification du test (risque a),
• (5) calculer l'écart entre les données de l’échantillon et les
valeurs attendues d'après Ho,
• (6) rejeter ou non l’hypothèse posée, calculer le risque
d’erreur effectif
• (7) interpréter

1
Le choix de Ho :
le rasoir d’Ockham
• William of Ockham
(Frère franciscain, 1285-1347)

• Le principe de parcimonie consiste à n'utiliser que le


minimum de causes pour expliquer un phénomène

• Principe d’économie d’hypothèses déjà énoncé par


Aristote (384-322 AD)

• Les hypothèses suffisantes les plus simples sont les


plus vraisemblables

• Pourquoi faire compliqué quand on peut faire simple ? 2


Le choix de Ho

• Les séries de données sont issues


d’une même population ?

• La (ou les) série(s) de donnée(s) respecte(nt)


un principe énoncé par Ho ?

3
Différents tests

• les tests d'indépendance ou


d'homogénéité testent l'homogénéité
de distribution de valeurs entre au moins
2 échantillons. Karl Pearson (1857–1936)

La loi théorique ou la valeur du paramètre testé est inconnue.


On cherche seulement à tester si les échantillons peuvent être
issus d'une même population, c'est-à-dire suivent la même loi
• les tests de conformité ou d'ajustement testent la
conformité entre le(s) échantillon(s) et une distribution
(suivant une loi précise comme la loi binomiale, ou les
lois énoncées par Mendel) fixée par l'hypothèse
4
2/ Application en génétique
de la drosophile
Caractère couleur du corps

SSR x Souche black


A//A a//a

[sauvage] F1 x F1 [sauvage] A//a [black]

Hyp.: Les deux souches ne


diffèrent que pour 1 seul
gène concernant la couleur F2 : 775 [sauvage]
du corps.
225 [black] 5
2/ Application en génétique
de la drosophile
Caractère couleur du corps

SSR x Souche black


A//A a//a

[sauvage] F1 x F1 [sauvage] A//a [black]


Gamètes Femelles A a
Hyp.: Les deux souches ne Mâles
diffèrent que pour 1 seul A A//A [SSR] A//a [F1]
gène concernant la couleur F2 : 775 [sauvage]
a a//A [F1] a//a [black]
du corps.
225 [black] 6
Khi2 de Conformité
Exemple du cours #3, chapitre II : Croisement de mouches de couleur de corps
sauvage ([gris]) par des mouches de couleur de corps noir ([black]) et croisement
des F1 entre elles.

Phénotype des OBSERVE THEORIQUE


descendants
[gris] 775

[black] 225

Le tableau de croisement des gamètes dicte les résultats attendus => test de conformité
7
Khi2 de Conformité
Exemple du cours #3, chapitre II : Croisement de mouches de couleur de corps
sauvage ([gris]) par des mouches de couleur de corps noir ([black]) et croisement
des F1 entre elles.

Phénotype des OBSERVE THEORIQUE


descendants
[gris] 775 1000 x 3/4

[black] 225 1000 x 1/4

Somme 1000 1000

La somme des effectifs théoriques est égale à la somme des effectifs observés

8
Khi2 de Conformité
Exemple du cours #3, chapitre II : Croisement de mouches de couleur de corps
sauvage ([gris]) par des mouches de couleur de corps noir ([black]) et croisement
des F1 entre elles.

Phénotype des OBSERVE THEORIQUE


descendants
[gris] 775 750

[black] 225 250

9
Calcul du Khi2 et des ddl
• Mesure de l’écart entre effectifs théoriques et
effectifs observés :
2=((Xobs-Xth)2/Xth)

• Le nombre de degrés de liberté (ddl) est défini


par le (nombre de Lignes-1)x(nombre de Colonnes-1)
du tableau de valeurs observées

10
Calcul du Khi2 et des ddl
Le ddl est le nombre de cases du tableau de valeurs observées
qu’il faut remplir pour pouvoir compléter l’ensemble de ce
tableau si on connaît les sommes marginales du tableau.

Ex. Force du Faible Moyenne Forte


phénotype
Mutant 1
Mutant 2

11
Calcul de la probabilité
• Probabilité d’avoir l’écart observé ou un écart
plus grand entre effectifs théoriques et
effectifs observés :
• 2(k) avec k, le nombre de degrés de liberté (ddl)

• Densité de probabilité Fonction de répartition


f(t) = [t(k/2-1)e(-t/2)]/[2(k/2G(k/2))] Intégrale de f(t) : F(t)=p(f(t)<t)

t t 12
Degrés de liberté Table de Khi2

0,95

95%
3,84
5%

13
3,84
Degrés de liberté Table de Khi2

0,95

95%
3,84
5% (surface sous la
courbe au delà de la
valeur de Khi2 de 3,84)

14
3,84
Table de Khi2

0,95

95%
3,84 5,99
5%

15
5,99
Prise de décision
• p est le risque de se tromper si on rejette Ho.
C’est la probabilité de trouver un tel écart (ou un écart
plus grand) entre les résultats observés et les résultats
théoriques prédits par Ho.
• Si 2obs≤2seuil => p ≥ aseuil
On ne peut pas rejeter Ho. Le risque de se tromper serait trop
élevé !!!
• Si 2obs≥2seuil => p ≤ aseuil
On rejette Ho avec moins de aseuil (p) risque de se tromper.

16
Prise de décision

• Mesure de l’écart entre effectifs théoriques et


effectifs observés :
2=((Xobs-Xth)2/Xth)
Ex. :
2=(775-750)2/750+(225-250)2/250 = 3,33
2seuil=3,84 avec 1 ddl et aseuil = 5%
Comme 2obs≤2seuil => p ≥ aseuil
=> On ne rejette pas Ho.
(on n’accepte pas Ho, car des effectifs plus grands
pourraient conduire à un rejet d’Ho) 17
Prise de décision
Khi2 observé < Khi2 seuil
Ecarts faibles fréquents
=> Ho ne peut pas être rejetée Si p<5%, on rejette Ho et
on recherche la probabilité la plus faible
à laquelle on peut rejeter Ho.

Khi2 observé > Khi2 seuil


=> Ho peut être rejetée
avec <5% risque de se tromper

avec <1% risque de se tromper

Khi2seuil 5% Khi2 18
seuil 1%
Limites du test de Khi2

• Le test de Khi2 ne permet de comparer que


des EFFECTIFS (pas des proportions…)

• Tous les effectifs théoriques doivent être ≥ 5

19
Exemple à 3 ddl

Degrés de
liberté
OBSERVE m1 m2 m3 m4 Somme

[mâle] 68 36 44 28 176

[femelle] 92 90 85 77 344

Somme 160 126 129 105 520

Si Ho est « les 4 mutants ont la même fréquence de mâles. » => Test d’homogénéité
THEORIQUE m1 m2 m3 m4 Somme

[mâle] 176

[femelle] 344

Somme 160 126 129 105 520

20
Exemple à 3 ddl

Degrés de
liberté
OBSERVE m1 m2 m3 m4 Somme

[mâle] 68 36 44 28 176

[femelle] 92 90 85 77 344

Somme 160 126 129 105 520

Si Ho est « les 4 mutants ont la même fréquence de mâles. » => Test d’homogénéité
THEORIQUE m1 m2 m3 m4 Somme 2obs= 9,34
[mâle] 54,15 42,65 43,66 35,54 176
Pour aseuil=5%, 2seuil= 7,82
[femelle] 105,85 83,35 85,34 69,46 344 donc 2obs ≥ 2seuil et aobs ≤ aseuil
Somme 160 126 129 105 520
On rejette Ho avec moins de 5%
de risque de se tromper
(mais plus de 1% de risque).
=> Les 4 mutants N’ont PAS la même fréquence de mâles.
21
Exemple à 3 ddl

Degrés de
liberté
OBSERVE m1 m2 m3 m4 Somme

[mâle] 68 36 44 28 176

[femelle] 92 90 85 77 344

Somme 160 126 129 105 520

Si Ho est « les 4 mutants ont 30% de mâles. » => Test de conformité

THEORIQUE m1 m2 m3 m4 Somme

[mâle] 156

[femelle] 364

Somme 160 126 129 105 520

22
Exemple à 3 ddl

Degrés de
liberté
OBSERVE m1 m2 m3 m4 Somme

[mâle] 68 36 44 28 176

[femelle] 92 90 85 77 344

Somme 160 126 129 105 520

Si Ho est « les 4 mutants ont 30% de mâles. » => Test de conformité

THEORIQUE m1 m2 m3 m4 Somme
2obs= (68-48)²/48+(36-37,8)²/37,8
+(44-38,7)²/38,7+(28-31,5)²/31,5
[mâle] 48,00 37,80 38,70 31,50 156 +(92-112)²/112+(90-88,2)²/88,2
+(85-90,3)²/90,3+(77-73,5)²/73,5
[femelle] 112,00 88,20 90,30 73,50 364 = 13,62

Somme 160 126 129 105 520

=> Au moins un des 4 mutants N’a PAS 30% de mâles. 23


Exemple à 3 ddl

Degrés de
liberté
OBSERVE m1 m2 m3 m4 Somme

[mâle] 68 36 44 28 176

[femelle] 92 90 85 77 344

Somme 160 126 129 105 520

Si Ho est « les 4 mutants ont 30% de mâles. » => Test de conformité


2obs= 13,62
THEORIQUE m1 m2 m3 m4 Somme

Pour aseuil=5%, 2seuil= 7,82


[mâle] 48,00 37,80 38,70 31,50 156
Pour aseuil=1%, 2seuil= 11,35
[femelle] 112,00 88,20 90,30 73,50 364
donc 2obs ≥ 2seuil et aobs ≤ aseuil
On rejette Ho avec moins de 1%
Somme 160 126 129 105 520 de risque de se tromper
(mais plus de 0,1% de risque).
=> Au moins un des 4 mutants N’a PAS 30% de mâles. 24

Vous aimerez peut-être aussi