Vous êtes sur la page 1sur 15

Génétique des populations

Virgil Fievet - virgil.fievet@u-bordeaux1.fr


Jean-Rémi Pape - jean-remi.pape@u-bordeaux1.fr
Valérie Schurdi-Levraud - vschurdi@bordeaux.inra.fr
José A. Campoy - jacampoy@bordeaux.inra.fr
Fréderic Labbé - frederic.labbe@pierroton.inra.fr
Florian Delerue - florian.delerue@u-bordeaux.fr
March 10, 2014

1 Structure des populations et mesures de la diversité génétique


1.1 Calcul des indices de diversité génétique
La variable d’intérêt en génétique des populations est la fréquence des allèles dans les populations. Il
s’agit donc de savoir les calculer. Lorsque le lien entre génotype et phénotype est direct ou lorsque l’on
utilise des marqueurs moléculaires codominants comme les mini- ou les microsatellites, le calcul est rela-
tivement simple et suit les règles présentées dans la boite suivante.

Nb d’individus qui présentent le génotype


fréquence génotypique =
Nb total d’individus dans la population
Nb d’allèles du type considéré
fréquence allélique =
Nb total d’allèles
Nb d’allèles du type considéré
=
ploïdie x Nb total d’individus

Exercice 1
Chez l’Homme, le groupe sanguin MN est déterminé par un gène à deux allèles codominants M et N. Le
phénotype des individus d’une population d’aborigènes australiens et d’une population d’anglais a été
noté et les résultats sont donnés ci-après :

Groupes sanguins
[M] [MN] [N]
Aborigènes 22 216 492
Anglais 363 634 282

1. Quel est le niveau de ploïdie de l’espèce humaine ?


2. Calculer les fréquences pM et pN , les fréquences des deux allèles de ce locus, (a) dans l’échantillon
de la population australienne et (b) dans l’échantillon de la population anglaise.

Exercice 2
Chez le moustique, il existe un gène de résistance aux insecticides correspondant à la modification de
la cible de certains composés toxiques: l’acétylcholinestérase. Le gène codant pour cette enzyme, dont

1
l’allèle sauvage est AceS , a en effet subi une mutation ponctuelle et présente un nouvel allèle AceR . Cet
allèle code pour une enzyme moins sensible à l’action de l’insecticide (Cette enzyme a pour rôle de re-
larguer et dégrader le médiateur acétylcholine dans l’espace inter-synaptique après le passage d’un influx
nerveux. Si elle est inhibée, l’influx nerveux circule en continu et l’insecte meurt). La mise au point d’un
test biochimique de l’activité acétylcholinestérase permet de distinguer les trois génotypes possibles. Par
exemple, dans une population de Camargue. Le génotypage de 416 individus récoltés en Camargue a
donné les résultats suivants :

Génotypes
AceS /AceS AceS /AceR ] AceR /AceR
Effectifs 220 130 66

1. Calculer les fréquences alléliques à ce locus

Des marqueurs moléculaires très utilisés en génétique des populations : les VNTRs, encore
appelés les microsatelittes.

Les marqueurs microsatellites se situent dans des régions de l’ADN qui consistent en répétition de motif
de 1 à 6 nucléotides. Les microsatellites sont localisés à travers l’ensemble du génome nucléaire et
chloroplastique (parfois dans le génome mitochondrial).
La traduction anglaise est : Simple sequence repeats (SSRs), short tandem repeats (STRs) ou encore
Variable Number of Tandem Repeats (VNTRs).
Le polymorphisme de ses marqueurs est donc un polymorphisme de longueur.
La façon de révéler ce polymorphisme consiste à sélectionner et amplifier ses fragments par PCR puis à
faire migrer les amplicons par électrophorèse (gel ou capillaire).

Exemple : motif = AAG (3 nucleotides)

Ind 1 − allele 1 AAG AAG AAG AAG AAG AAG

Ind 1 − allele 2 AAG AAG AAG AAG AAG AAG AAG AAG AAG AAG AAG

Ind 2 − allele 1 AAG AAG AAG AAG AAG AAG AAG AAG AAG AAG AAG AAG

Ind 2 − allele 2 AAG AAG AAG AAG AAG AAG AAG AAG

Exercice 3
La suivante est une représentation schématique de la photographie d’un gel d’électrophorèse après mi-
gration des produits PCR. Deux locus microsatellites ont été amplifiés et les produits de la PCR ont été
placés sur le même gel. Le locus 1 présente des allèles dont la taille est comprise entre 90 et 98 paires de
bases. Le locus 2 présente des allèles dont la taille est comprise entre 150 et 160 paires de bases.

2
Pour chacun des 2 locus, déterminez le nombre d’allèles et calculez en les fréquences.
160
140
Taille

120
100

0 5 10 15 20 25

Individus

Exercice 4

Chez les escargots des bois européens (Cepaea nemoralis), la couleur de la coquille est déterminée par
un gène qui présente plusieurs allèles.
L’allèle codant pour la couleur marron (CM ) est dominant par rapport aux allèles codant pour les couleurs
rose (CR ) et jaune (CJ ).
Les raports de dominance sont les suivants : CM > CR > CJ .

Dans un échantillon d’une population de Cepaea, les phénotypes suivants sont obervés :

3
Couleur N
Marron 236
Rose 231
Jaune 33
Total 500
En supposant que cette population est à l’équilibre de Hardy-Weinberg, calculez les fréquences al-
léliques des allèles CM , CR , CJ .

1.2 Tester l’équilibre d’Hardy-Weinberg


Le modèle d’Hardy-Weinberg est le premier modèle de la génétique des populations. On parle de modèle
car, à partir d’un ensemble d’hypothèses, il génère des prédictions sur ce que l’on devrait observer en
population.

Les hypothèses du modèle sont:


• l’organisme est diploïde
• la reproduction est sexuée
• les générations ne se chevauchent pas
• locus avec 2 allèles
• les fréquences alléliques sont identiques selon les types d’individus reproducteurs (typiquement les
mâles et les femelles)
• accouplements aléatoires
• union aléatoire des gamètes
• taille de la population très large voire infinie
• migration négligeable
• mutation négligeable
• pas de sélection
Ainsi, tester si une population respecte les attendus de ce modèle revient à valider ses hypothèses dans
la population en question. Si les prédictions du modèle et les observations en population sont conformes,
on dit que cette population est à l’équilibre d’Hardy-Weinberg.

Le modèle d’Hardy-Weinberg est central en génétique des populations. Il constitue la base de la dé-
marche de la discipline. La première étape de la démarche en génétique des populations revient à tester
si une population est à l’équilibre. Dans le cas où elle s’en écarte, les causes sont à rechercher dans les
hypothèses de départ.

Il est relativement simple de tester si une population est à l’équilibre d’Hardy-Weinberg (HW) pour
des caractères codominants car le calcul des fréquences alléliques est simple.
Le principe du test peut être résumé en 3 étapes:
1. A partir d’un échantillon d’individus issus d’une population, le dénombrement des effectifs géno-
typiques observés permet de calculer les fréquences alléliques observées.
2. Les valeurs des fréquences alléliques permettent de calculer les effectifs génotypiques attendus prédits
selon le modèle d’Hardy-Weinberg.
3. La comparaison des deux distributions d’effectifs par un test statistique du χ2 permet de décider
si les effectifs génotypiques observés sont conformes ou non aux prédictions du modèle d’HW.

4
(Effectifs Observés − Effectif théoriques)2
χ2 =
Effectifs théoriques

1-0.995 1-0.975 1-0.1 1-0.05 1-0.025 1-0.02 1-0.01 1-0.005 1-0.001


1 0.00004 0.00098 2.70554 3.84146 5.02389 5.41189 6.63490 7.87944 10.82757
2 0.01003 0.05064 4.60517 5.99146 7.37776 7.82405 9.21034 10.59663 13.81551
3 0.07172 0.21580 6.25139 7.81473 9.34840 9.83741 11.34487 12.83816 16.26624
4 0.20699 0.48442 7.77944 9.48773 11.14329 11.66784 13.27670 14.86026 18.46683
5 0.41174 0.83121 9.23636 11.07050 12.83250 13.38822 15.08627 16.74960 20.51501
6 0.67573 1.23734 10.64464 12.59159 14.44938 15.03321 16.81189 18.54758 22.45774
7 0.98926 1.68987 12.01704 14.06714 16.01276 16.62242 18.47531 20.27774 24.32189
8 1.34441 2.17973 13.36157 15.50731 17.53455 18.16823 20.09024 21.95495 26.12448
9 1.73493 2.70039 14.68366 16.91898 19.02277 19.67902 21.66599 23.58935 27.87716
10 2.15586 3.24697 15.98718 18.30704 20.48318 21.16077 23.20925 25.18818 29.58830
11 2.60322 3.81575 17.27501 19.67514 21.92005 22.61794 24.72497 26.75685 31.26413
12 3.07382 4.40379 18.54935 21.02607 23.33666 24.05396 26.21697 28.29952 32.90949
13 3.56503 5.00875 19.81193 22.36203 24.73560 25.47151 27.68825 29.81947 34.52818
14 4.07467 5.62873 21.06414 23.68479 26.11895 26.87276 29.14124 31.31935 36.12327
15 4.60092 6.26214 22.30713 24.99579 27.48839 28.25950 30.57791 32.80132 37.69730
16 5.14221 6.90766 23.54183 26.29623 28.84535 29.63318 31.99993 34.26719 39.25235
17 5.69722 7.56419 24.76904 27.58711 30.19101 30.99505 33.40866 35.71847 40.79022
18 6.26480 8.23075 25.98942 28.86930 31.52638 32.34616 34.80531 37.15645 42.31240
19 6.84397 8.90652 27.20357 30.14353 32.85233 33.68743 36.19087 38.58226 43.82020
20 7.43384 9.59078 28.41198 31.41043 34.16961 35.01963 37.56623 39.99685 45.31475

Table 1: Table de χ2

Exercice 5
Reprenez les données de l’exercice 1 et testez :

1. Si les effectifs des différents génotypes des populations anglaises et australiennes sont significative-
ment différents ou non
2. Si chacune des deux populations est à l’équilibre d’HW sur ce locus

Exercice 6
Une étude menée aux Etats-Unis a montré que 70 % des Nord-Américains peuvent percevoir le goût
amer de la phénylthiocarbamide alors que les individus restants ne lui trouvent aucun goût. La capacité
de déceler ce goût est sous le contrôle d’un locus à deux allèles dont l’un, l’allèle T , domine sur l’autre,
l’allèle t.

1. Quels sont les différents génotypes possibles ?


2. En supposant que la population est à l’équilibre d’HW, calculez les fréquences pT et pt des deux
allèles.
3. A partir des fréquences que vous venez de déterminer, calculez la fréquence des différents génotypes
? des différents phénotypes ?
4. Pour quelle raison avons nous postulé que la population est à l’équilibre dans la question 1 ?

Exercice 7
Le gel d’électrophorèse présente les résultats du génotypage d’un marqueur microsatellite dans une pop-
ulation de rats noirs de Madagascar.

1. Développez le modèle d’Hardy-Weinberg pour un locus à 3 allèles et 4 allèles ?


2. Calculez les fréquences alléliques à partir du gel d’électrophorèse.

5
140
135
130
125
120

0 10 20 30 40 50 60

Suite de l’exercice 7
La figure ne montre qu’une petite partie des génotypes de l’échantillon de rats. Le nombre total
d’individus dont l’ADN a été analysé est égal à 1780 pour la colonie de rats d’Antananarivo. Les résultats
sont présentés dans le tableau :

Génotype 2424 2428 2432 2436 2828 2832 2836 3232 3236 3636
Effectif 568 230 240 235 108 68 85 72 83 91

Table 2: Effectif de 1780 rats noirs de Madagascar. L’écriture des génotypes a été simplifiée : le génotype
homozygote 124pb-124pb est reporté comme 2424.

3. Calculez les effectifs attendus des génotypes en considérant que la population est à l’équilibre.
4. Déterminez si la population est à l’équilibre d’HW pour ce locus.

6
2 ECARTS A LA PANMIXIE
2.1 Accouplements préférentiels
Le régime d’accouplement des organismes ne respecte généralement pas l’hypothèse d’accouplements au
hasard assumée par le modèle d’Hardy-Weinberg. Dans les faits, de nombreux systèmes d’accouplement
chez les espèces créent des écarts aux prédictions du modèle d’Hardy-Weinberg que nous sommes en
mesure de prévoir. Nous avons ici une très bonne illustration de la pertinence du modèle d’HW : il
repose sur des hypothèses de fonctionnement fortes des populations mais chacune de ses hypothèses peut
être mise à l’épreuve et générer de nouvelles prédictions. Le modèle d’Hardy-Weinberg est ce qu’on ap-
pelle le modèle nul (null model) en génétique des populations car il prédit ce que l’on devrait observer
lorsqu’aucune force évolutive agit sur les fréquences alléliques et génotypiques.

Le terme "accouplement préférentiel" (assortative mating) est employé pour désigner les systèmes
d’accouplement non aléatoires. Ils peuvent être positif (reproduction entre apparentés) ou négatif (évite-
ment de la consanguinité, accouplement préférentiel entre génotypes/phénotypes différents).
Au niveau des individus, les accouplements consanguins augmentent la probabilité que la descendance
présente un génotype homozygote. Ceci résulte simplement du fait que deux individus apparentés ont
plus de chances de partager des allèles identiques que deux individus pris aléatoirement dans la popula-
tion.
Au niveau de la population, les accouplements consanguins augmentent la fréquence des génotypes
homozygotes - et donc diminue la fréquence des génotypes hétérozygotes - par rapport à ce qu’elle devrait
être si les accouplements se faisaient tous de manière aléatoire.
Il y a donc 2 manières d’aborder l’effet de la consanguinité : au niveau des individus en analysant les
généalogies et les pédigrées, au niveau de la population en analysant les écarts aux prédictions d’HW,
notamment en terme de différence du taux d’hétérozygotie.

Le taux d’hétérozygotie, ou hétérozygotie, d’une population fait référence à la fréquence des hétérozy-
gotes. Elle peut être de deux types :

1. l’hétérozygotie observée Ho quantifie la fréquence observée des hétérozygotes


2. l’hétérozygotie attendue He quantifie la fréquence attendue des hétérozygotes, prédite à l’aide du
modèle d’HW.

L’hétérozygotie attendue est également appelée diversité génétique de Nei (Nei’s gene diversity).
k
X k−1
X k
X
He = 1 − p2i = 2pi pj
i=1 i=1 j=i+1

avec k le nombre d’allèles du locus.

Exercice 8
L’hétérozygotie attendue est appelée diversité génétique (de Nei) car elle renseigne à la fois sur le nombre
d’allèles et leur distribution dans les populations.

Considérez un locus à 4 allèles et construisez un graphique présentant en abscisse la fréquence de


l’allèle majoritaire et en ordonnée l’hétérozygotie attendue dans la population.

7
a1 a2 a3 a4
1 1.00 0.00 0.00 0.00
2 0.85 0.05 0.05 0.05
3 0.70 0.10 0.10 0.10
4 0.55 0.15 0.15 0.15
5 0.40 0.20 0.20 0.20
6 0.25 0.25 0.25 0.25

Table 3: Frequence allelique

2.2 Indice de Fixation


Au niveau des populations, l’effet des accouplements non aléatoire sur la fréquence des génotypes peut
se mesurer en comparant l’hétérozygotie attendue pour une population en équilibre et l’hétérozygotie
observée. Cette comparaison s’effectue à l’aide de l’indice de fixation F (encore noté f ).
He − Ho
F =
He

Les écarts aux attendus d’HW, le coefficient de consanguinité et l’indice de fixation sont tous inter-
reliés. Une façon de le mettre en évidence est de regarder comment la consanguinité réduit la proportion
d’hétérozygotes à chaque génération :

AA = p2 + f pq
Aa = 2pq − f 2pq
aa = q 2 + f pq

Puisque 2pq correspond à l’hétérozygotie attendue, remplaçons le par He .

Aa = Ho = He (1 − f )

Ce qui donne :

Ho He Ho (He − Ho )
f =1− = − =
He He He He

Exercice 9

A partir des données de l’exercice 6, calculez l’indice de fixation F .


Un suivi démographique a montré un taux de consanguinité f = 0.198 dans cette population. Testez si
les fréquences génotypiques observées dans l’exercice précédent sont en accord avec les estimations qui
tiennent compte de cette consanguinité.

Exercice 10
Les systèmes d’accouplement ont comme conséquence de modifier les proportions des génotypes dans les
populations par rapport à ce qui est attendu à l’équilibre.
La reproduction clonale est un système de reproduction fréquent dans la nature, que ce soit la repro-
duction de nouveaux ramets chez les plantes (stolon des fraisiers) ou encore la parthénogenèse chez les
pucerons par exemple.
L’objectif de cet exercice est de simuler ce système d’accouplement et de déterminer si il influence les

8
paramètres de diversité génétique.

Partons d’une population de X individus dont les génotypes sont présentés dans le tableau suivant.
La colonne "mult" correspond au nombre de fois que le génotype en question sera multiplié après repro-
duction clonale.

• Calculer les fréquences des allèles


• Calculer l’hétérozygotie observée et l’hétérozygotie attendue de cette population

• la population est-elle à l’équilibre d’Hardy Weinberg ?


• Calculer l’indice de fixation FIS

allele_1 allele_2 mult


1 158 158 4
2 101 158 8
3 158 101 2
4 158 158 7
5 101 158 9
6 101 158 4
7 158 158 2
8 101 158 7
9 158 158 6
10 101 101 4
11 158 101 7
12 158 101 6
13 158 101 4
14 101 101 4
15 158 101 2

Table 4: Genotype et coefficient multiplicateur des 15 individus initiaux

Suite des questions de l’exercice


Multipliez chaque génotype par le nombre qui lui correspond dans la colonne "mult" pour simuler la
reproduction clonale de chaque génotype.

• Calculer les nouvelles fréquences des allèles


• Calculer l’hétérozygotie observée et l’hétérozygotie attendue de cette nouvelle population
• La population est-elle à l’équilibre d’Hardy-Weinberg ?

• Calculer l’indice de fixation FIS

9
Exercice 11

Cet exercice est issu des résultats publiés par Thomas D. ALS (National Institute of Aquatic Re-
sources, Technical University of Denmark) et 9 co-auteurs dans la revue Molecular Ecology en 2011 sous
le titre :
All roads lead to home: panmixia of European eel in the Sargasso Sea

Le comportement de reproduction et la structure génétique des populations de l’anguille européenne


(Anguilla anguilla) est un grand classique des intrigues scientifiques. Les anguilles adultes sont dis-
tribuées dans les eaux douces des régions côtières des milieux subarctiques du Nord de l’Europe aux
environnements subtropicaux du Maroc et des régions méditerranéennes de l’Egypte. Pendant des siè-
cles, les lieux de frai (reproduction) de l’anguille Européenne sont restés inconnus. Ce n’est qu’en 1923 que
Schmidt a identifié une zone commune de reproduction à toutes les populations d’anguilles Européenne
et Américaine (A. rostrata) : le sud de la mer des Sargasses.
Les larves issues de la reproduction sont ensuite transportées par le Gulf Stream vers les sites nourriciers
des côtes Européenes et Méditérranéennes.

Si les individus de toutes les populations se retrouvent au même endroit pour se reproduire, les condi-
tions de la panmixie devraient se retrouver dans chacune des populations d’adultes, quelque soit sa taille
ou sa position géographique.
C’est en partie pour répondre aux questions liées à cette hypothèse que les auteurs ont décidé d’utiliser
une approche de génétique des populations avec l’aide de 21 marqueurs moléculaires de type microsatel-
lites.

Les 4 figures suivante représentent des gels d’électrophorèse pour 1 des 21 locus pour 4 populations
d’anguille échantillonnées en France, en Suède, au Maroc et en Islande.

10
Genotype Effectif
1 176184 2
2 180184 1
3 182182 2
4 182184 5
5 184184 39
6 184186 2
7 184194 1

Table 5: Table des genotypes

11
Genotype Effectif
1 176184 1
2 182184 8
3 182186 2
4 184184 33
5 184186 6

Table 6: Table des genotypes

12
Genotype Effectif
1 176184 1
2 182184 7
3 182186 1
4 184184 39
5 184186 3

Table 7: Table des genotypes

13
Genotype Effectif
1 162184 1
2 182184 9
3 184184 39
4 184186 5
5 184188 1

Table 8: Table des genotypes

• Combien d’allèles présente ce locus globalement ?


• Combien d’allèles présente ce locus dans chacune des populations ?
• Quel est le génotype des individus marqués 1, 2 et 3 sur les 4 figures ?

• Calculer les fréquences alléliques dans chaque populations

14
• Testez si les populations sont à l’équilibre d’Hardy-Weinberg sur ce locus (posez les hypothèses du
test, écrivez le tableau des effectifs attendus, calculez la statistique du test et concluez en vous
servant de la table qui se trouve dans le document)

15

Vous aimerez peut-être aussi