Vous êtes sur la page 1sur 81

U.E.

:
Niveau : Master 1
Responsable : Dr GNANGBE Flix

Laboratoire de
Gntique
GENETIQUE DES POPULATIONS
2
3
TABLE DES MATIRES Page
ECUE 1 : POLYMORPHISME ET STRUCTURE ENETI!UE DES
POPULATIONS
CHAPITRE I : INTRODUCTION A LA ENETI!UE DES POPULATIONS 5
I" BRE# RAPPEL HISTORI!UE 5
II" NOTIONS DE DI$ERSITE PHENOTYPI!UE ET DE $ARIABILITE
ENETI!UE DES POPULATIONS
6
III" NOTION DE POPULATION 7
I$" NOTION DE METAPOPULATION 7
$" LES METHODES ET LES OB%ECTI#S DE LA ENETI!UE DES
POPULATIONS
9
CHAPITRE II : LE POLYMORPHISME ET LA STRUCTURE ENETI!UE DES
POPULATIONS NATURELLES
11
I" LE POLYMORPHISME 11
-1 Dfinition du polymorphisme 11
-2 Les marqueurs de polymorphisme 13
-2-1 Les marqueurs srologiques chez l'homme : les groupes sanguins 14
-2-1-1 Le systme ABO 14
-2-1-2 Le systme Rhsus 15
-2-1-3 Le systme MN 17
-2-1-3 Le systme HLA 17
-2-2 Les marqueurs enzymatiques 18
a) Les enzymes monomriques 18
b) Les enzymes dimriques monogniques 19
c) Les enzymes dimriques digniques 20
-2-3 Les marqueurs RFLP 21
-2-4 Les marqueurs d'ADN mitochondrial 23
-2-5 Les marqueurs RAPD (Random Amplification of Polymorphic DNA) 24
-2-6 Les marqueurs AFLP (Amplified Fragment Length Polymorphism) 24
-2-7 Les marqueurs microsatellites 25
-2-8 Les marqueurs SNP (Single Nucleotid Polymorphisms) 26
-2-9 Les marqueurs chromosomiques 27
II" LA STRUCTURE ENETI!UE DES POPULATIONS 28
-1 Dfinition de la Structure gnotypique par un locus deux allles 29
-2 Dfinition de la structure gnique (structure alllique) en un locus bialllique 29
-3 Dfinition de la structure gnique en un locus polyalllique 30
III" LA DISTANCE ENETI!UE ENTRE DEU& POPULATIONS 31
CHAPITRE III : IN#LUENCE DES SYSTEMES DE CROISEMENTS SUR LA
STRUCTURE ENETI!UE DES POPULATIONS
33
I" DE#INITION DES MODELES 33
II" LE MODELE DE LA PANMI&IE : LOI DE HARDY"'EINBER 36
ECUE 1 : POLYMORPHISME ET STRUCTURE
ENETI!UE DES POPULATIONS
4
CHAPITRE I : INTRODUCTION A LA ENETI!UE DES POPULATIONS
I" BRE# RAPPEL HISTORI!UE
Dans son ouvrage "Philosophie zoologique" paru en 1809, Lamarck dfend l'ide
que les tre vivants, loin d'tre immuables peuvent voluer. Bien que le principe
fondamental de l'volution du vivant ait t nonc, son explication par Lamarck
travers le processus de la descendance par l'hrdit des caractres acquis se
rvlera totalement errone.
Un demi-sicle plus tard, soit en 1859, Charles Darwin publie son ouvrage "L'Origine
des espces au moyen de la slection naturelle ou la lutte pour l'existence dans la
nature" dans lequel il dveloppe les ides matresses qui fonderont la thorie
moderne de l'volution biologique. Mais cette poque, l'ide d'volution, qui n'tait
pas du tout rcente, est aussi partage par un autre scientifique anglais, Alfred
Wallace. C'est avec lui que Darwin prsente en 1858, devant la Linnean Society, une
communication intitule "Sur la tendance des espces former des varits, et sur le
maintien des varits et des espces par des moyens naturels de la slection".
Pour Darwin, les changements qui interviennent dans les formes du vivant peuvent
s'expliquer par de lentes et graduelles modifications, conserves par la slection
naturelle.
Sur le plan scientifique, si le concept de l'volution biologique est admis, ses
mcanismes font cependant natre des controverses. Francis Galton (cousin de
Darwin) s'affiche comme le dfenseur d'une volution par variations discontinues. l
est considr comme le fondateur de la biomtrie pour laquelle il reoit l'aide du
mathmaticien Karl Pearson, l'inventeur du test Khi-2. l faut rappeler que l'ensemble
de ces dbats se droule dans l'ignorance des mcanismes de l'hrdit puisque les
lois de Mendel, pourtant dcouvertes en 1866, sont restes dans l'oubli jusqu' leur
redcouverte au dbut du XX
me
sicle.
Pendant la premire moiti de ce XX
me
sicle, on voit se greffer sur la thorie
mendlienne de l'hrdit et sur la thorie darwinienne de l'volution par slection
naturelle, un formalisme mathmatique labor par A. Fisher, S. Haldane et S.
Wright. Cette modlisation a donn naissance la Thorie synthtique de
l'volution , appele encore synthse no-darwinienne , dont le plus grand
dfenseur du T. Dobzhansky.
Cette thorie fdre le rle des mutations qui font apparatre des gnes nouveaux
(facteurs de l'hrdit) dans les populations naturelles et le rle de la slection
naturelle qui intervient pour trier les gnes les uns par rapport aux autres en fonction
de la valeur adaptative qu'ils confrent aux caractres des individus qui les portent.
5
L'volution biologique est donc concevoir non pas au niveau des individus mais
plutt celui de la population entire qui recle beaucoup plus de gnes.
Ainsi prend forme, paralllement, la thorie mathmatique de la gntique des
populations fonde sur le concept des frquences des divers allles d'un gne dans
la population. Mais cette thorie, en plein essor dans la premire moiti du XX
me
sicle, tait tout de mme limite dans ses applications par le manque de marqueurs
gntiques. En effet, les tudes sur l'volution biologique taient jusqu'alors menes
au niveau phnotypique.
En utilisant la technique de l'lectrophorse des protines sur de grands
chantillons, Harris Hubby et Lewontin montrent, en 1966, que les variants mis en
vidence prsentent une sgrgation mendlienne. Par ailleurs, cette technique
rvle l'existence d'une variabilit gntique extraordinaire, ce qui tait jusqu'alors
insouponn dans les populations naturelles.
Les analyses molculaires qui permettent la comparaison des squences d'acides
amins dans les protines et des squences de nuclotides dans les acides
nucliques ont rendu possible l'application d'une nouvelle approche mathmatique.
En effet, cette convergence a permis l'laboration d'une thorie d'volution des
gnes dont le japonais Motoo Kimura est le principal artisan. C'est sous le nom de
"Thorie neutraliste de l'volution" qu'est popularise la thorie selon laquelle les
changements volutifs molculaires et le polymorphisme sont essentiellement dus
des mutations. Celles-ci sont presqu'assez neutres vis--vis de la slection naturelle
pour que leurs comportement et devenir soient principalement rgis par les
mutations et drive gntique alatoire.
Ce bref rappel historique montre quel point l'volution biologique, dans son
explication, demeure toujours un sujet controverse.
II" NOTIONS DE DI$ERSITE PHENOTYPI!UE ET DE $ARIABILITE ENETI!UE
DES POPULATIONS
La diversit phnotypique est l'une des proprits gnrales des populations
naturelles. De cette observation est ne l'expression rcente de biodiversit .
Dans toute population, les individus prsentent, pour la plupart des caractres, des
phnotypes trs diffrents. Dans l'espce humaine par exemple, on connat une
grande diversit de taille, de poids, de la forme du corps, de la couleur et de la
texture des cheveux, de la couleur de la peau, des yeux, et de bien d'autres traits ou
aptitudes physiques et psychologiques.
Dans la plupart des populations naturelles, la diversit phnotypique rsulte des
diffrences entre les gnotypes des individus ; ce sont ces diffrences entre les
6
gnotypes individuels qu'on appelle variabilit gntique. La variabilit gntique se
manifeste par la prsence de plusieurs allles chaque locus. Diverses techniques
(l'lectrophorse des protines par exemple) permettent de rvler cette variabilit.
III" NOTION DE POPULATION
ntuitivement, le mot population est utilis pour dsigner un groupe d'organismes
appartenant la mme espce. Mais il est ncessaire de clarifier ce concept dans le
cadre de la gntique des populations. En gntique des populations, ce mot
dsigne un groupe d'individus de la mme espce vivant dans une zone
gographique suffisamment restreinte pour que tout membre de la population puisse
se croiser avec tout autre ( condition, bien sr, qu'ils soient de sexes opposs). La
dfinition prcise d'une telle communaut est difficile et varie d'une espce l'autre ;
il existe presque toujours une certaine structuration gographique des espces parce
que la rpartition des individus dans l'espace ne se fait pas au hasard. Les membres
d'une espce sont rarement rpartis de faon homogne ; il y a presque toujours des
regroupements ou des agrgations : une structuration en troupeau, en hordes, en
bandes, etc. La subdivision de la population est souvent provoque par la
structuration du milieu en zones favorables l'habitat et zones dfavorables. La
population humaine par exemple, se regroupe ou s'agglomre dans des villes et des
villages, l'cart des dserts et des montagnes.
En gntique des populations, c'est ces units locales de croisements qu'on
s'intresse car l'intrieur de celles-ci les frquences allliques varient de faon
systmatique. En fin de compte, ces variations interviennent sur l'volution des
caractres adaptatifs. Les units locales de croisement sont souvent appeles
populations locales ou dmes. Elles constituent les units de base de la gntique
des populations et sont aussi parfois appeles populations mendliennes car les lois
de Mendel s'y appliquent.
I$" NOTION DE METAPOPULATION
C'est un ensemble de populations en dsquilibre dmographique, interconnectes
par des vnements de migration (flux gniques), surtout la faveur d'vnements
de recolonisation lors des extinctions locales conscutives des perturbations
cologiques. Certains auteurs considrent cet ensemble comme une population et
les populations qui le composent comme des sous-populations, populations locales
ou dmes. A l'image de ce qui se passe classiquement dans les populations
7
individuelles, la mtapopulation suit une dynamique sous l'influence de processus
dmographiques (migration, goulots dmographiques, extinction, recolonisation) ;
c'est--dire qu'il y a des changes de migrants entre populations (ou sous-
populations ou dmes) ; des populations (ou sous-populations ou dmes) qui
apparaissent ; et des populations (ou sous-populations ou dmes) qui disparaissent
(voir schma ci-dessous).
E(e)*+e ,e ,-.a)i/ue au .iveau ,0u.e )1ta*2*u+ati2.
8
$" LES METHODES ET LES OB%ECTI#S DE LA ENETI!UE DES
POPULATIONS
Parmi les disciplines biologiques, la gntique des populations est particulire en ce
sens que l'analyse et la rflexion thoriques ont largement prcd la description et
l'exprimentation.
La dmarche thorique consiste, dans la cadre d'un modle, mettre en quation le
jeu des diffrents facteurs. On peut ainsi prdire quelle doit tre la structure
gntique d'une population dans des conditions donnes et quelle volution doit
entraner un changement dfini de ces conditions.
Les difficults de l'exprimentation sont videntes. La principale est le facteur temps.
Les volutions des populations sont des phnomnes lents qui ncessitent une
observation prolonge sur un grand nombre de gnrations. Ds l'origine le matriel
de choix a t et demeure la Drosophile. A partir de 1933, L'Hritier et Teissier ont
conu des cages populations (dmomtres) permettant une tude au laboratoire
de populations de quelques milliers de mouches pendant plusieurs dizaines de
gnrations. ls ont t ainsi mme d'prouver la thorie. Les simulations sur
ordinateur sont depuis venues complter et relayer les cages populations.
L'observation des populations naturelles s'est pendant longtemps heurte
l'obstacle de "la fiabilit des marqueurs de polymorphisme". En effet, la plupart des
caractres phnotypiques dont la variabilit est immdiatement perceptible ont d'une
part un dterminisme gntique complexe et d'autre part sont sensibles l'influence
des conditions du milieu. Une partie de la variabilit est purement phnotypique
(c'est--dire non corrle au gnotype). l a fallu attendre le dveloppement de la
biologie molculaire pour disposer de techniques permettant une tude efficace.
Ainsi, les techniques d'lectrophorse des protines d'une part, et des acides
nucliques (ADN) digrs aux enzymes de restriction d'autre part, ont permis aux
chercheurs de disposer d'un grand nombre de marqueurs fiables et stables. En
observant la variabilit au niveau des produits primaires de l'action des gnes
(polymorphisme antignique et enzymatique) et mme au niveau de l'ADN lui-mme,
on obtient une image non biaise de la variabilit gntique.
Comme objectifs, la gntique des populations se propose :
1- de dcrire la structure gntique des populations naturelles, ce qui implique
le dnombrement des diffrents allles prsents chaque locus, l'estimation de leurs
frquences respectives ainsi que celle des frquences des diffrentes combinaisons
de gnes (gnotypes haplodes et diplodes) ;
2- d'apprcier le rle respectif des facteurs dont l'interaction engendre la
structure actuellement observe. Ces facteurs sont :
9
- les modalits de la rencontre et de la fusion des gamtes, c'est-
-dire les modalits prcises du systme de croisement,
- la mcanique chromosomique miotique,
- les mutations,
- les migrations, c'est--dire le passage d'individus d'une
population une autre de la mme espce,
- la slection, ce qui englobe l'ensemble des facteurs qui font
que l'importance de la contribution d'un reproducteur la gnration suivante
dpend de son gnotype,
- l'effectif de la population
3- de prvoir quelles modifications d'un pool gnique seront provoques par la
variation des facteurs qui viennent d'tre numrs et par l mme d'lucider les
mcanismes de l'volution biologique.
10
CHAPITRE II : LE POLYMORPHISME ET LA STRUCTURE ENETI!UE DES
POPULATIONS NATURELLES
I" LE POLYMORPHISME
I"1 D13i.iti2. ,u *2+-)2r*4is)e
Sous l'influence du phnomne de la mutation, un gne donn peut se prsenter
sous plusieurs formes allliques. Ce fait important dtermine les gnticiens des
populations raisonner en termes de frquences allliques. Le concept de frquence
alllique sous-tend l'ide de polymorphisme gntique.
Le polymorphisme gntique est dfini comme tant la coexistence de plusieurs
allles en un locus. Par opposition, un locus pour lequel on ne trouve qu'un seul
allle est dit "monomorphe". l convient d'ajouter que les allles doivent tre en
frquences du mme ordre de grandeur et qu'il ne doit pas y avoir un allle trs
prdominant. Dans la pratique, les gnticiens se fixent un seuil, c'est--dire "un
critre de polymorphisme" : le polymorphisme gntique est la coexistence dans une
mme population de deux allles ou plus en un locus, le plus frquent d'entre eux ne
dpassant pas la frquence de 0,95. Certains auteurs se fixent un seuil moins svre
de 0,99. Ce seuil, bien que fix arbitrairement, sert tout de mme attirer l'attention
sur les gnes dont la variabilit est rpandue ; Ces critres sont choisis aussi pour
tre compatibles avec l'tude d'un nombre raisonnable d'individus (de l'ordre de la
centaine).
Dans toutes les grandes populations, des allles rares existent pour la plupart des
gnes. Un allle est dit rare lorsque sa frquence dans la population est infrieure
0,5 % ; entre 1 et 2 individus sur 1000 sont htrozygotes pour un gne rare
n'importe quel locus (selon Harris et Hopkinson en 1972, l'issue d'une tude
lectrophortique de protines codes pour 43 locus chez 250 000 europens).
Beaucoup d'allles rares sont dfavorables et on suppose que leur maintien dans les
populations ne peut tre d qu' des mutations rcurrentes. Ce type de
polymorphisme qui rsulte d'un quilibre entre la slection naturelle et la mutation est
appel cryptopolymorphisme. Le polymorphisme gntique, tel que nous l'avons
dfini dans ce paragraphe, ne concerne que les gnes qui ont une frquence trop
leve pour tre uniquement explique par des mutations rcurrentes vers des
allles nocifs. On exclut donc le cryptopolymorphisme.
En toute rigueur, la dfinition du polymorphisme suppose qu'il y a coexistence
d'allles diffrents pour un locus donn au sein de la mme population. L'existence
11
d'allles diffrents dans des populations diffrentes ne constitue pas, proprement
parler, un cas de polymorphisme (on doit parler plutt, dans ce cas, de polytypisme).
Le polymorphisme est un fait d'observation courante : la couleur des yeux, des
cheveux, les groupes sanguins chez l'homme ainsi que la taille ou la musculature, ou
encore la couleur du pelage chez les chats, sont des exemples parmi tant d'autres.
La plupart des diffrences que nous constatons entre les individus se ramnent
des cas de polymorphisme gntique, mme s'il n'est pas toujours facile de prciser
les units gntiques en cause.
Or ce fait banal constitue, bien y rflchir, un paradoxe flagrant : si le moteur de
l'volution est bien la slection naturelle, comme Darwin l'a propos, nous devrions
nous attendre ce que la structure hrditaire qui se reproduit le plus efficacement
soit la seule subsister terme. Une population ne devrait donc comporter
gnralement qu'un allle chaque locus, la mutation prs.
Aussi, une explication possible, lorsque nous nous trouvons en face de gnes
polymorphes, est que la slection n'agisse pas : il s'agirait d'un polymorphisme
neutre (un polymorphisme et des allles sont dites neutres slectivement si le
remplacement d'un allle par un autre ne modifie pas les valeurs slectives des
individus qui les possdent). Toutefois, dans ce cas, la drive gntique doit oprer,
et nous verrons qu'elle aboutit, elle aussi, l'homognit.
Pour expliquer l'existence au sein des populations d'une diversit sous contrle
gntique, nous ne pouvons chapper au dilemme :
- soit il existe un mcanisme slectif responsable du maintien du
polymorphisme : c'est l'hypothse "slectionniste" ;
- soit les gnes polymorphes sont neutres mais alors la population n'est pas
l'quilibre : c'est l'hypothse "neutraliste".
Re)ar/ue :
L'estimation du taux de polymorphisme de la population est note

P ( ne pas
confondre avec

p
qui est l'estimation de la frquence alllique).
100 x
tudis delocus total Nombre
s polymorphe locus de Nombre
P

L'estimation du taux d'htrozygotie individuelle de la population pour un locus


donn est note

H
100 x
tudis indivius ' totald Nombre
tes htrozygo individus ' d Nombre
H

12
Le taux d'htrozygotie moyenne de la population est not

H
100 x
tudis locus de total Nombre
H
H
locus de nombre

I"5 Les )ar/ueurs ,e *2+-)2r*4is)e


Jusqu' une poque assez rcente, les exemples de polymorphisme que l'on pouvait
donner portaient le plus souvent sur des caractres morphologiques. Peu de gnes
avaient t identifis avec prcision et il y avait gnralement, entre les gnes
analyss et leur expression, une grande distance en termes de complexit des
mcanismes biologiques mis en jeu.
Quelques rares exemples taient cependant bien tudis comme les groupes
sanguins chez l'homme.
Depuis les annes 1960, on dispose d'un moyen de quantifier l'importance du
polymorphisme au niveau mme des produits des gnes grce la technique
d'1+e6tr2*42r7se ,es *r2t1i.es ()ar/ueurs a.tig1.i/ues et e.8-)ati/ues). Un
intrt particulier de cette technique est qu'elle rvle aussi les locus non
polymorphes, contrairement aux mthodes gntiques classiques.
Plus rcemment, le dveloppement des techniques de biologie molculaire a permis
d'aborder l'tude du polymorphisme au niveau de l'ADN lui-mme. Ainsi, une
technique comme la mise en vidence du polymorphisme dans les sites de
restriction de l'ADN peut tre utilise. On a pu, grce celle-ci, rvler une large
variabilit entre individus pour le nombre et la position de divers sites de restriction
(on parle de "Polymorphisme de Longueur de Fragments de Restriction", ou plus
couramment, selon l'abrviation anglaise de R#LP). Ce polymorphisme concerne
tout le gnome, y comprises et surtout les portions non codantes qui n'taient pas
accessibles par l'tude des protines.
Encore plus rcemment, avec les avances de la biologie molculaire, une technique
dite PCR (acronyme anglais de "Polymerase Chain Reaction" ; en franais
"raction en chane par polymrase") a t mise au point en 1985 par Karry Mullis
(prix Nobel de chimie 1993). C'est une technique d'amplification gnique, c'est--dire
qu'elle permet de reprer un fragment d'ADN ou de gne prcis, mme prsent en
quantit infime dans un mlange, puis de le multiplier rapidement. Ainsi la PCR a
13
permis de dvelopper de nouveaux marqueurs de l'ADN, savoir les )ar/ueurs
)i6r2sate++ites, )ar/ueurs A#LP, )ar/ueurs RAPD.
A ces marqueurs, il faut ajouter ceux qui sont mis en vidence par squenage ; ce
sont les marqueurs ,0ADN )it2642.,ria+ et les marqueurs de dernire gnration
appels SNP (pour Single Nucleotide Polymorphism) ou SNP , galement tudi
par squenage ou par la technique des biopuces ADN.
I"5"1 Les )ar/ueurs s1r2+2gi/ues 64e8 +042))e : +es gr2u*es sa.gui.s
Les antignes de surface des hmaties spcifient les groupes sanguins chez
l'homme. Les antignes peuvent tre de nature protique ou polysaccharidique. ls
sont gntiquement dtermins. Un mme gne peut spcifier plusieurs antignes :
le produit de la traduction d'un gne (protine) pouvant porter plusieurs motifs
antigniques. De mme, un antigne peut tre spcifi par plusieurs gnes : un motif
antignique pouvant rsulter de l'association des produits de la traduction de
plusieurs gnes. Lorsque l'antigne est protique, le gne le spcifie directement.
Lorsque l'antigne est un oligosaccharide, les gnes spcifient les enzymes qui
catalysent la liaison des sucres.
Les systmes de groupes sanguins, dont la dcouverte du premier (systme ABO)
remonte au dbut du XX
me
sicle, se comptent aujourd'hui par dizaines chez
l'homme. Nous ne considrerons ici que quelques uns.
I"5"1"1 Le s-st7)e ABO
l existe deux antignes dont la structure chimique est connue ; il s'agit de chanes
oligosaccharidiques branches fixes sur un polypeptide. Les antignes A et B ne
diffrent que par le sucre terminal : galactosamine (A) ou galactose (B). A ces deux
antignes correspondent chez l'homme quatre phnotypes diplodes, c'est--dire
quatre groupes sanguins :
groupe sanguin AB = [AB] : prsence simultane des 2 antignes,
groupe sanguin A = [A] : prsence de A absence de B,
groupe sanguin B = [B] : prsence de B absence de A,
groupe sanguin O = [O] : absence des 2 antignes A et B.
L'analyse gntique par l'tude des gnalogies rvle, en particulier, que les
individus [AB] ne produisent que deux types de gamtes : les uns portent le
dterminant gntique de l'antigne A mais pas celui de B, les autres celui de
l'antigne B mais pas celui de A.
14
Formellement, l'hypothse d'une srie de 3 gnes allles A, B et O rend compte des
sgrgations observes. L'allle A spcifie l'antigne A, l'allle B l'antigne B. L'allle
O est muet. Corrlativement cette hypothse :
- le phnotype [AB] correspond au gnotype htrozygote
- le phnotype [A] correspond aux gnotypes et
- le phnotype [B] correspond aux gnotypes et
- le phnotype [O] correspond au gnotype .
Le polymorphisme gntique au locus AB est gnral dans toutes les populations
humaines. Les frquences des 3 allles A, B et O varient d'une population l'autre
mais aucun allle n'est jamais trop rare. L'allle O est presque toujours le plus
frquent. C'est parmi les indiens d'Amrique que les allles A et B sont les plus
rares. L'allle B est plus frquent dans les populations asiatiques (0,17)
qu'europennes (0,06).
Re)ar/ues :
1- Les antignes du systme ABO sont ubiquitaires car on les trouve non seulement
sur les rythrocytes mais aussi sur les leucocytes, plaquettes et mme sur les
cellules pidermiques desquames par le fotus dans le liquide amniotique,
permettant le groupage prnatal.
2- Chez 78 % des individus dits "scrteurs", des antignes de groupes ABO
hydrosolubles sont mis en vidence dans certaines scrtions : salive, sucs digestifs,
sueur, larmes, urine, lait, sperme. Le caractre scrteur ou non scrteur est li
un couple de gnes allles Se/se, indpendant du locus du systme ABO et situ sur
un autre chromosome. Le gnotype rcessif homozygote entrane la "non
scrtion" chez les sujets qui le possdent.
I"5"1"5 Le s-st7)e R41sus
En 1939 Levine, chez une femme qui venait de mettre au monde un enfant mort-n
atteint d'rythroblastose fotale , note un choc transfusionnel la perfusion du
sang de son mari, pourtant ABO compatible. Le srum de la femme contenait un
anticorps actif contre les globules rouges de l'enfant, du mari et de 85 % des sujets
pris au hasard.
15
A
B
=
B
B
=
B
O
=
A
A
=
A
O
=
O
O
=
se
se
=
L'anne suivante, Landsteiner et Wiener obtiennent chez des lapins immuniss avec
des hmaties de Macacus rhesus un srum agglutinant 85 % des hmaties de sujets
pris au hasard.
On a montr que les anticorps prsents chez cette femme ont la mme spcificit,
c'est--dire reconnaissent le mme antigne que ceux qu'un lapin fabrique la suite
de l'injection d'hmaties du singe Rhsus. Cet antigne a donc t appel Rhsus.
C'est pourquoi l'anticorps trouv chez la femme a t nomm anticorps anti-rhsus ;
les sujets qui le possdent sont dits Rh
+
, et Rh
-
ceux qui en sont dpourvus.
Selon Fisher et Race, le systme Rhsus est gntiquement dtermin par 3 locus
trs fortement lis sur le bras court du chromosome 1. Ces locus portent chacun
deux allles (D et d pour le premier, C et c pour le second et, E et e pour le dernier).
Les allles C et c sont codominants tout comme E et e. Par contre, D est dominant
sur d qui n'est pas immunogne. D est de loin le meilleur immunogne. L'antigne
cod par D n'est autre que le facteur Rhsus standard. Le possder est ncessaire
et suffisant pour tre considr comme Rh
+
. C'est pourquoi on raisonne
gnralement comme si le systme Rhsus n'est dtermin que par un couple
d'allles D/d (avec D dominant et d rcessif).
Le tableau prsente les 8 haplotypes (combinaisons allliques dans les gamtes)
du systme Rhsus et leurs frquences.
Ta9+eau I : Ha*+2t-*es ,u s-st7)e R41sus se+2. #is4er et Ra6e
Phnotypes Haplotypes Frquences
approximatives
Sujets Rh
+
DCE 0,002
DCe 0,420
DcE 0,140
Dce 0,026
Sujets Rh
-
dCE 0,000
dCe 0,010
dcE 0,012
dce 0,390
La maladie hmolytique du nouveau-n qui consiste en la lyse des hmaties se
produit lorsqu'une mre Rh
-
, donc dd, met au monde un enfant Rh
+
, Dd. Cela peut se
produire lorsque les couples sont :
soit dd x _DD ==> 100 % d'enfants Dd
soit dd x _Dd ==> 50 % d'enfants Dd
La maladie ne frappe que 6 % des nouveau-ns Dd dont la mre est dd. En absence
de soins, elle est mortelle 3 fois sur 4. Seulement 5 % des nouveau-ns malades
sont le produit d'une premire grossesse. En principe, les hmaties du fotus et par
consquent les antignes D ne franchissent par le placenta et ne peuvent donc pas
16
provoquer de raction immunitaire chez la mre. Le contact peut se produire lors de
l'accouchement de telle sorte que la mre se trouvera immunise lors d'une
grossesse ultrieure (les anticorps franchissent le placenta).
I"5"1": Le s-st7)e MN
Le systme de groupes sanguins MN est gntiquement dtermin par un locus 2
allles M et N codominants. Trois groupes sanguins sont donc exprims
corrlativement aux 3 gnotypes possibles :
MM ==> phnotype [M] = groupe M
MN ==> phnotype [MN] = groupe MN
NN ==> phnotype [N] = groupe N
I"5"1": Le s-st7)e HLA
Comme les rythrocytes, les cellules nucles possdent leur surface des
antignes qui provoquent la production d'anticorps hmagglutinants. Ces antignes
reprsentent le systme d'histocompatibilit l'origine des phnomnes de rejet des
allogreffes et des allergies.
Le systme HLA (Human Leucocyte A) est gntiquement contrl par plusieurs
locus ayant en commun la facult d'tre polyallliques et codominants. l suffit qu'un
sujet prsente un allle sur l'un de ses deux chromosomes homologues n 6 pour
que l'on dtecte le produit du gne sur la membrane de la cellule. Selon Klein, les
gnes de cette rgion peuvent tre groups en trois classes :
- classe : couple de gnes HLA-A, B et C
- classe : couple de gnes HLA-A, et DR
- classe : elle concerne les composants du complment : C
2
, C
3
et C
4
(le
complment reprsente avec les anticorps l'lment essentiel du systme humoral
de dfense contre les agents infectieux ; il active la lyse cellulaire, bactrienne ou
virale).
Sur le plan pratique, lors d'une greffe, les produits gniques de la classe servent de
cible pour tous les agents naturels cytotoxiques (lymphocytes et anticorps) ; les
gnes de la classe codent l'activation de la premire raction du non soi .
I"5"5 Les )ar/ueurs e.8-)ati/ues
17
Les enzymes sont des protines catalytiques qui peuvent tre fonctionnelles sous la
forme d'une seule chane polypeptidique (enzymes monomriques) ou de deux
chanes polypeptidiques ou plus (enzymes polymriques). Les enzymes
polymriques peuvent donc tre dimriques, trimriques, ttramriques, etc.
Le caractre amphotre des protines permet leur sparation dans un champ
lectrique uniforme en fonction de leur charge lectrique.
Si une mutation gnique a pour consquence le remplacement, dans la structure de
la protine code, d'un acide amin basique (ex : acide aspartique, acide
glutamique) par un acide amin acide (ex : arginine, lysine) et vice versa, elle
entranera une modification de la charge nette de la protine concerne. Or, si des
protines codes par les diffrents allles d'un mme gne (isoenzymes ou
isozymes) diffrent entre elles par la charge lectrique, elles pourront tre dissocies
par la technique d'lectrophorse. Si, pour un systme enzymatique donn, des
allles diffrents du ou des gnes qui le code(ent) sont prsents chez un individu, ils
seront tous rvls travers le profil enzymatique lectrophortique.
Ainsi, dans une population naturelle donne d'une espce donne, si tous les
individus ont le mme gnotype pour le systme enzymatique tudi (par exemple la
malate dshydrognase ou MDH), l'lectrophorse ne conduira qu' un seul profil
enzymatique, quelle que soit la taille de l'chantillon analys. Par contre, si des
gnotypes diffrents sont reprsents dans cette population, l'lectrophorse
permettra de les mettre tous en vidence travers des profils enzymatiques
polymorphes condition que la taille de l'chantillon analys soit grande. Dans ce
cas, on parle de polymorphisme lectrophortique. l est important de faire
remarquer aussi que pour un gnotype donn, le profil enzymatique rvl par
lectrophorse dpend la fois de la structure fonctionnelle de l'enzyme tudie, du
nombre d'allles actifs et du nombre de locus en jeu.
a; Les e.8-)es )2.2)1ri/ues
Si une enzyme monomrique est code par un locus 3 allles actifs S
1
, S
2
et
S
3
, l'lectrophorse conduira six profils enzymatiques correspondant aux six
gnotypes possibles S
1
S
1
, S
2
S
2
, S
3
S
3
, S
1
S
2
, S
1
S
3
et S
2
S
3
, s'ils sont tous prsents
dans l'chantillon analys (Figure 1).
18
#igure 1 : Profil lectrophortique d'une enzyme monomrique code par un locus
3 allles actifs S
1
, S
2
et S
3
.
9; Les e.8-)es ,i)1ri/ues )2.2g1.i/ues
Si une enzyme dimrique est code par un locus 3 allles actifs S
1
, S
2
et S
3
,
l'lectrophorse conduira six profils enzymatiques correspondant aux six
gnotypes possibles S
1
S
1
, S
2
S
2
, S
3
S
3
, S
1
S
2
, S
1
S
3
, S
2
S
3
s'ils sont tous prsents dans
l'chantillon analys (figure 2). ci, il convient de distinguer les bandes homomres
(homodimres) formes par l'association de deux chanes polypeptidiques codes
par le mme allle, d'une part, des bandes htromres (htrodimres) formes par
l'association de deux chanes polypeptidiques codes par des allles diffrents,
d'autre part. Chez l'htrozygote, la bande htrodimre se positionne entre les 2
bandes des homodimres.
#igure 5 : Profil lectrophortique d'une enzyme dimrique code par un locus 3
allles actifs S
1
, S
2
et S
3
.
6; Les e.8-)es ,i)1ri/ues ,ig1.i/ues
Si une enzyme dimrique est code par deux locus 2 allles chacun (S
1
et
S
2
pour l'un, F
1
et F
2
pour l'autre) tous actifs, l'lectrophorse conduira neuf profils
19
enzymatiques correspondant aux neuf gnotypes possibles, s'ils sont tous prsents
dans l'chantillon analys. Le profil lectrophortique du double htrozygote
dpend de l'activit des dimres htrogntiques (dimres forms par l'association
de 2 chanes polypeptidiques codes chacune par un allle de chaque locus : S
1
F
1
,
S
1
F
2
, S
2
F
1
et S
2
F
2
). Le double htrozygote prsentera un profil 10 bandes dans le
cas o les dimres htrogntiques sont actifs (figure 3).
#igure : : Profil lectrophortique d'une enzyme dimrique code par 2 locus 2
allles chacun avec htrodimres htrogntiques actifs.
1 = S
1
S
1
F
1
F
1
4 = S
1
S
2
F
1
F
1
7 = S
2
S
2
F
1
F
1
2 = S
1
S
1
F1F
2
5 = S
1
S
2
F
1
F
2
8 = S
2
S
2
F
1
F
2
3 = S
1
S
1
F
2
F
2
6 = S
1
S
2
F
2
F
2
9 = S
2
S
2
F
2
F
2
Re)ar/ue : Si une enzyme est code par un locus deux allles dont un seul est
actif, l'autre tant muet, l'htrozygote prsente le mme profil lectrophortique
une bande que l'homozygote pour l'allle actif, que l'enzyme soit monomrique ou
20
polymrique. L'homozygote pour l'allle muet ne prsente pas de bande. Tout se
passe comme si on se trouvait dans un cas de dominance/rcessivit, et la
distinction entre l'homozygote pour l'allle actif et l'htrozygote ne peut se faire qu'
travers des test-cross ou des autofcondations si cela est possible.
I"5": Les )ar/ueurs R#LP
On peut rvler les polymorphismes des molcules d'ADN en utilisant des enzymes
de restriction qui coupent les molcules d'ADN en des points prcis de la squence
de nuclotides appels sites de restriction. Par exemple, l'enzyme Eco R coupe
l'ADN en des sites qui comportent la squence des 6 nuclotides GAATTC.
L'enzyme Alu coupe l'ADN en des sites qui comportent la squence des quatre
nuclotides AG CT.
La plupart des enzymes de restriction utilises dans les tudes des populations ont
des sites de restriction soit de quatre, soit de six nuclotides. Comme les enzymes,
les fragments de restriction peuvent tre spars par lectrophorse. Mais
contrairement aux enzymes, la reconnaissance des fragments d'ADN ncessite des
techniques particulires. Celle qu'on utilise le plus souvent est un transfert selon la
mthode de Southern. La procdure de transfert de Southern est la suivante :
1)- les fragments d'ADN issus de la digestion sont spars par lectrophorse puis
transfrs et fixs sur une membrane de nitrocellulose ou de nylon.
2)- la membrane est place dans une solution contenant une sonde radioactive qui
se fixe sur les molcules homologues d'ADN attaches la membrane.
21
3)-aprs lavage, la membrane est expose au contact d'un film photographique o
apparaissent des bandes sombres inscrites par les dsintgrations radioactives de la
sonde.
Les polymorphismes qu'entranent la prsence ou l'absence de sites de restriction
sont en fait des polymorphismes de la longueur des fragments de restriction (RFLP)
puisque cette longueur est modifie. l suffit donc d'avoir des fragments d'ADN
clons pour mettre en vidence des RFLP ; ces derniers sont rpartis travers le
gnome et sont rpandus chez presque tous les organismes.
Les RFLP prsentent un grand intrt en gntique des populations humaines en
servant la fois pour la cartographie du gnome et pour le marquage des maladies
gntiques.
E(e)*+e :
Soient 2 chromosomes homologues A et a (chaque chromosome correspond en fait
une molcule d'ADN)
Les traits sur les chromosomes indiquent les sites de restriction.
Pour les 3 combinaisons gnotypiques AA, Aa et aa nous aurons :
Profils ou diagrammes lectrophortiques de restriction des 3 gnotypes :
22
I"5"< Les )ar/ueurs ,0ADN )it2642.,ria+
L'ADN mitochondrial (ADNmt) possde un avantage majeur par rapport l'ADN
nuclaire : il est transmis d'une gnration l'autre uniquement par la mre
(mitochondries prsentes dans le cytoplasme de l'ouf) et limite la recombinaison
gntique (sauf exception). Ainsi, contrairement aux squences chromosomiques
pouvant tre affectes par les vnements de recombinaison (crossing-overs), la
diffrence entre deux squences d'ADNmt peut tre interprte comme la
consquence de la mutation seulement. l a aussi t montr rcemment que le
manque d'efficacit des mcanismes de rparation de l'ADNmt, acclrait son
volution (par mutation) compare au reste du gnome. Certaines squences
l'intrieur de la rgion de contrle (rgion non codante) de l'ADNmt, voluent encore
plus rapidement et la large diversit gntique observe ces squences permet
des tudes trs fines de phylognie. Enfin, l'ADNmt est facilement amplifi car les
squences d'initiations ( amorces ou primers ) sont quasiment les mmes pour
toutes les espces. Ces marqueurs permettent d'tudier la gntique des
populations sous forme "haplode" ; on parle d'haplotypes.
Certaines critiques ont toutefois t apportes l'utilisation de cet ADN, notamment
sur le rle potentiel de la slection sur son mode d'volution. En effet, vu la faible
taille du gnome mitochondrial, la fixation de mutations avantageuses dans les
squences codantes de l'ADNmt pourrait influencer la frquence des allles des
zones dites neutres par le phnomne d'auto-stop ( hitchhiking ) ou dsquilibre
de liaison (situation dans laquelle deux allles sont plus frquemment associs que
ne le voudrait le hasard). D'autre part, des tests de neutralit ont permis de montrer
que la distribution des mutations de l'ADNmt n'tait pas en accord avec celle
attendue par rapport un modle neutre.
23
I"5"= Les )ar/ueurs RAPD >Ra.,2) A)*+i3i6ati2. 23 P2+-)2r*4i6 DNA;
Les RAPD (en franais amplification alatoire dADN polymorphe) utilisent
l'amplification (par la technique PCR) de fragments non codants d'ADN pour mettre
en vidence la diversit gntique inter individuelle. Les amorces des RAPDs (les
squences qui permettent la reconnaissance et l'amplification de l'ADN) sont de
petites tailles (environ 10pb) et non spcifiques. Les amorces vont donc se fixer de
manire alatoire dans le gnome. Le nombre et la taille des segments amplifis
permettent de mettre en vidence les diffrences entre les individus. Bien que d'un
cot peu lev et permettant de mettre en vidence une large variabilit en un faible
nombre de ractions, cette technique un dfaut majeur : sa faible reproductibilit
d'une raction l'autre et plus gnralement d'un laboratoire un autre. D'autre part,
il s'agit d'une technique dite dominante, ne permettant pas de mettre en vidence si
un individu est homozygote ou non un locus donn.
I"5"? Les )ar/ueurs A#LP >A)*+i3ie, #rag)e.t Le.gt4 P2+-)2r*4is);
La technique des AFLP (Polymorphisme de longueur des fragments damplification)
est fonde sur la mise en vidence conjointe de polymorphisme de sites de
restriction et de polymorphisme d'hybridation d'une amorce de squence arbitraire.
L'ADN est soumis une digestion par des enzymes de restriction. Les tailles des
fragments obtenus sont dpendantes des enzymes utilises. Ensuite, il y a addition
aux extrmits des fragments de restriction d'adaptateurs nuclotidiques spcifiques
des enzymes de restriction utilises. ls sont de squences connues. Les fragments
sont ensuite amplifis par PCR, en utilisant comme amorce un oligonuclotide
complmentaire de la squence de l'adaptateur, prolong de quelques nuclotides
arbitraires (de 1 3) appels bases dbordantes. Seuls sont amplifis les fragments
possdant les bases complmentaires de ces bases arbitraires. l s'agit donc
d'amorces slectives permettant de rduire le nombre de fragments amplifis une
centaine : sans ces squences dbordantes, il y aurait amplification de milliers de
fragments. Les bandes sont visualises par lectrophorse sur gel d'acrylamide. Le
principal avantage de la technique AFLP est, comme les RAPD, la relative facilit de
la mise au point des marqueurs qui ne demande pas de connaissance a priori du
gnome de l'espce tudie. Mais contrairement aux RAPD, cette mthode montre
une reproductibilit leve, mais ncessite un ADN de trs bonne qualit. Cette
technique est relativement peu utilise dans les tudes sur la diversit gntique.
24
I"5"@ Les )ar/ueurs )i6r2sate++ites
Les microsatellites (ou SSR : simple sequence repeats, ou SSRP : simple sequence
repeat polymorphisme ou STR : short tandem repeats) sont sans doute les
marqueurs les plus employs dans les tudes de suivi de la diversit gntique. Les
microsatellites sont des squences d'ADN non codantes composes de motifs de 1
6 nuclotides (mono-, di-, tri-, ttra-nuclotides ou d'hexa-nuclotides ; au-del de
cette limite on parle de minisatellites) qui se rptent en tandem, de 10 60 fois
voire un peu plus, et qui sont dissmines dans l'ensemble du gnome aussi bien
chez les eucaryotes que chez les procaryotes.
Exemple dallles microsatellites :
- microsatellite motif di-nuclotidique rpt 6 fois (TG)
6
: TGTGTGTGTGTG
- microsatellite motif ttra-nuclotidique rpt 3 fois (GCCA)
3
: GCCAGCCAGCCA
Bien que prsents dans la plupart des organismes, les microsatellites sont rpartis
de manire irrgulire dans le gnome. Leur nombre varie aussi d'un taxon l'autre.
Les marqueurs microsatellites sont largement utiliss en gntique des populations.
Leur trs fort taux de mutation (de l'ordre de 10
-6
10
-2
) les rend hautement
variables. Leur grande diversit facilite la discrimination prcise des individus ou des
groupes d'individus, de mme que les mesures de distances gntiques. Bien que
les microsatellites soient non codants, certains auteurs ont propos qu'ils jouent un
rle dans la rgulation et le fonctionnement des gnes. Les microsatellites ont aussi
t associs aux effets de la virulence pathogne de certains micro-organismes. Lors
de l'analyse des microsatellites, une phase importante est l'amplification de la
quantit d'ADN par la mthode de la PCR.
Un avantage des microsatellites est leur co-dominance, c'est--dire que les deux
tats allliques diffrents prsents dans un gnome diplode sont amplifis. Par
ailleurs, ces marqueurs sont jugs slectivement neutres, jusqu' preuve du
contraire.
(i) Polymorphisme de longueur
Un allle d'un locus microsatellite est identifi aprs amplification par PCR
et migration lectrophortique, comparativement un tmoin (marqueur) de taille
connu. Les allles du marqueur microsatellite sont constitus par le nombre de
rptition dont les variations entranent des diffrences de taille entre ces allles.
25
Ces variations sont produites par des mutations correspondant des insertions ou
dltions d'un ou plusieurs motifs au cours de la rplication de l'ADN.
Bien que, de manire gnrale, la technique de PCR soit trs prcise, certaines
erreurs peuvent se produire qui vont affecter les mesures de la diversit gntique.
Ces erreurs sont d'autant plus probables que la qualit de l'ADN est mauvaise et/ou
ancienne. Gnralement deux types d'erreurs sont dcrits :
- la non amplification d'un des brins de l'ADN : les allles nuls ou allelic drop-
out (non amplification d'un des allles un locus donn chez un individu
htrozygote) avec pour consquence une sous-estimation de la diversit ;
- l'erreur d'amplification de l'ADN (techniquement appele dcalage de la
fentre de lecture) entrane une surestimation de la diversit en gnrant des allles
qui n'existent pas.
(ii) Intrts des microsatellites en gntiue des populations
Les microsatellites sont des outils de choix pour :
- tudier les espces autogames et clonales
- caractriser le systme reproducteur des populations naturelles
- tudier l'influence des rgimes de reproduction sur la structure gntique
- tudier les modalits de perte de sexualit et la variation des taux
d'autofcondation.
I"5"A Mar/ueurs SNP >Si.g+e Nu6+e2ti, P2+-)2r*4is)s;
Avec les SNP ou SNP , l'tude de la diversit se fait sur des sites caractriss
par une seule paire de base, avec deux tats, homozygote ou htrozygote,
possibles. l s'agit d'un polymorphisme gntique li des mutations ponctuelles
isoles : polymorphisme d'un seul nuclotide (polymorphisme nuclotidique). C'est
un type de variation stable de la squence d'ADN gnomique, portant sur une seule
base, toutes les 100 300 bases environ du gnome. Les SNP sont trs nombreux
dans le gnome ; chez les humains, ils reprsenteraient 90 % de la variation
gntique. Leur taux de mutation lent (10
-9
10
-8
) les rendrait plus aptes des
tudes de phnomnes long terme. Beaucoup de SNP n'ont pas d'implication
fonctionnelles mais ils dfinissent un locus unique dans le gnome et sont
polymorphes. Les SNP se trouvant dans les rgions codantes (SNPc) et dans les
rgions rgulatrices des gnes sont particulirement intressants pour raliser la
cartographie des maladies multifactorielles (tude d'association de gnes candidats
impliqus dans ces maladies).
26
I"5"B Les )ar/ueurs 64r2)2s2)i/ues
Une htrognit gntique existe galement au niveau des chromosomes
travers des variations qu'on observe dans leur structure et/ou leur nombre. On parle
alors de remaniements chromosomiques structuraux et/ou de variations
chromosomiques numriques. Chez des organismes comme la Drosophile o il
existe des chromosomes polytnes gants dans les glandes salivaires larvaires, il
est trs ais d'observer ces remaniements chromosomiques structuraux. ls
consistent en des inversions, des dltions (ou dficiences), des translocations
simples, des translocations rciproques et des duplications. Ainsi, dans les
populations californiennes de Drosophila pseudoo!scura coexistent trois structures
du chromosome N3 diffrant par des inversions. Elles ont t appeles standard
(ST), Arrowhead (AR) et Chiricahua (CH). Par exemple, dans un chantillon de 345
mouches prleves au hasard dans l'une de ces populations, on a not la
composition suivante :
STST = 36 STAR = 108
ARAR = 81 STCH = 30
CHCH = 9 ARCH = 81
Les remaniements chromosomiques structuraux existent aussi dans les populations
humaines. Par exemple, une dltion du bras court du chromosome N5 est
responsable d'une maladie appele maladie du cri du chat ; une translocation
rciproque entre le chromosome N14 et le chromosome N21 est responsable du
mongolisme (trisomie 21) par translocation ou mongolisme hrditaire.
En ce qui concerne les variations chromosomiques numriques, elles consistent en
des aneuplodies (nullisomie, monosomie, trisomie, etc.) ou en des euplodies
(polyplodies = triplodie, ttraplodie, pentaplodie, etc.). Dans les populations
humaines, on note la prsence d'une monosomie du chromosome sexuel X chez les
femelles responsable du syndrome de Turner et une disomie du mme chromosome
chez les mles l'origine du syndrome de Klinefelter.
Les variations polyplodes, quant elles, sont peu frquentes dans le rgne animal
o l'tat diplode est la rgle (mles haplodes des hymnoptres, souches triplodes
parthnogntiques des pucerons). Elles sont beaucoup plus frquentes dans le
rgne vgtal dans l'volution duquel elles ont certainement jou un grand rle.
II" LA STRUCTURE ENETI!UE DES POPULATIONS
27
Dans une population d'un organisme haplode, la proportion d'individus portant un
allle donn fournit directement la frquence de cet allle dans la population. Dans
ce cas, frquence gnotypique et frquence gnique (on dit aussi frquence
alllique) se confondent. Mais dans les populations d'organismes diplodes (ce sont
ces populations auxquelles nous nous intressons principalement), les gnes sont
associs par paire dans les individus ; il est alors ncessaire de distinguer deux
choses pour dfinir la structure gntique de la population au locus considr :
Les "frquences gnotypiques" qui reprsentent les proportions des diffrents
gnotypes dans la population au locus considr.
Les "frquences gniques" (dites aussi "frquences allliques") qui reprsentent
les proportions des diffrents allles dans la population au locus considr.
C'est l'ensemble de ces paramtres qui permet de dcrire la structure gntique des
populations.
La connaissance de la structure gnique est trs importante pour le gnticien des
populations car c'est d'abord l'volution des frquences des gnes qui est
significative pour l'volution biologique : la population est vue comme un "pool de
gnes", "un stock de gnes" dont la composition est susceptible d'voluer, les
individus n'tant que des porteurs transitoires de ces gnes.
Si la connaissance de la structure gnotypique permet de dduire facilement celle de
la structure gnique, le passage inverse est impossible sans hypothse
supplmentaire ; en effet, avec les mmes frquences allliques, on peut avoir des
structures gnotypiques trs diffrentes selon que les gnes homologues sont
associs dans les individus plutt entre gnes semblables (on a surtout des
homozygotes) ou plutt entre gnes diffrents (on a surtout des htrozygotes).
Ainsi, une population avec 50 % de gnes A et 50 % de gnes a peut tre constitue
uniquement d'homozygotes AA et aa dans les mmes proportions, ou uniquement
d'htrozygotes Aa, ou de diverses proportions de ces 3 gnotypes.
D'autre part, lorsque plusieurs gnes sont impliqus dans l'volution d'un caractre,
il est ncessaire de connatre la structure gntique chaque locus. Mais cela ne
suffit pas car d'autres paramtres seront ncessaires pour dcrire la faon dont les
gnes de locus diffrents sont associs dans les individus. Ainsi, si nous savons
qu'une population contient 50 % d'individus AA et 50 % de aa un premier locus, et
50 % d'individus BB et 50 % de bb un second locus, la structure gntique est
parfaitement dfinie chacun de ces locus. Mais cela ne nous dit pas si la population
contient des individus AABB et aabbb, ou AAbb et aaBB, ou les quatre gnotypes et
en quelles proportions. C'est pourquoi les modles qui tudient l'volution de la
28
structure gntique plusieurs locus font appel davantage de paramtres et sont
trs complexes.
II"1 D13i.iti2. ,e +a Stru6ture g1.2t-*i/ue *2ur u. +26us C ,eu( a++7+es
Elle se fait par la dtermination des frquences dans la population des diffrents
gnotypes au locus considr. Cela n'est possible que si l'on peut reconnatre les
diffrents gnotypes ce locus, par leur phnotype (variation discontinue, pas de
dominance) ou par l'examen de leurs descendances.
Dans une population diplode, considrons un locus deux allles codominants A
1
et
A
2
par rapport auquel on analyse un chantillon de N individus prlevs au hasard.
Soient x, y et z les frquences absolues (on dit aussi les effectifs) des trois
gnotypes A
1
A
1
, A
1
A
2
, et A
2
A
2
respectivement.
( )
N
x
A A fr
1 1
;
( )
N
y
A A fr
2 1
;
( )
N
z
A A fr
2 2
;
avec x +y + z = N.
II"5 D13i.iti2. ,e +a stru6ture g1.i/ue >stru6ture a++1+i/ue; e. u. +26us
9ia++1+i/ue
Elle se fait par la dtermination de l'ensemble des frquences des allles au locus
considr. Si nous gardons l'exemple du locus du paragraphe prcdent et si nous
dsignons par p et q les frquences relatives des deux allles A
1
et A
2
respectivement, alors nous aurons :
( )
N
y
N
x
N
y x
p A fr
2
1
2
2
1
+
+


( ) ( )
2 1 1 1
2
1
A A fr A A fr p +

( )
N
y
N
z
N
y z
q A fr
2
1
2
2
2
+
+


29
( ) ( )
2 1 2 2
2
1
A A fr A A fr q +

avec 1 +

q p
II": D13i.iti2. ,e +a stru6ture g1.i/ue e. u. +26us *2+-a++1+i/ue
Soit un locus avec les allles A
1
, A
2
, ., A
i
, ., A
n
en frquences p
1
, p
2
..p
i
, ..p
n
respectivement. Dsignons par A
i
A
i
les gnotypes homozygotes et A
i
A
j
les gnotypes
htrozygotes (i < j).
Si kA
i
A
i
est le nombre d'individus de chaque gnotype homozygote et kA
i
A
j
le
nombre d'individus de chaque gnotype htrozygote, alors nous aurons :
( )
( )
1
2
1
2
1
2
2
1

+
+
+

>

>
>

n
i
i
i j
j i i i i
i j
j i
i i
i j
j i i i
i i
p avec
) A A ( fr A A fr p
N
A kA
N
A kA
N
A kA A kA
p A fr
Re)ar/ue :
Ces formules de dtermination des frquences gnotypiques et allliques sont
toujours vraies : elles n'impliquent aucune supposition sur le rgime de reproduction
ou l'existence ou non de pressions volutives.
En gnral l'chantillonnage ne porte que sur une fraction de la population (entit
elle-mme gnralement mal dfinie dans ses limites). Les frquences calcules
comme dans les paragraphes -1, -2, et -3 partir d'un chantillon sont des
estimateurs corrects des frquences de la population.
On peut dterminer la frquence d'un allle donn avec un intervalle de confiance :
si p est la frquence relle de l'allle dans la population et

p son estimation partir


de l'chantillon de taille N, alors l'intervalle de confiance de p est :
30
N
) p ( p
U p p
N
) p ( p
U p

1 1
2
1
2
1
2
1

U
est une valeur donne par la table de la loi normale centre et rduite.
III" LA DISTANCE ENETI!UE ENTRE DEU& POPULATIONS
La distance gntique qui spare deux populations est le reflet du degr de
diffrenciation gntique qui existe entre elles. Plus prcisment, il sera question
dans ce paragraphe de diffrenciation alllique. Par exemple, si le polymorphisme de
deux populations A et B est tudi par rapport plusieurs systmes enzymatiques,
de nombreux locus seront impliqus. Tous les allles de chaque locus seront
identifis et leurs frquences estimes pour chacune des populations. Considrons
l'un de ces locus et dfinissons les paramtres suivants :
A ) i (
p
= frquence de l'allle i au locus considr dans la population A.
B ) i (
p
= frquence de l'allle i au locus considr dans la population B.
A ) ii (
J
= probabilit d'avoir deux fois le mme allle i si on effectue deux tirages non
exhaustifs dans la population A.
B ) ii (
J
= Probabilit d'avoir deux fois le mme allle i si on effectue deux tirages non
exhaustifs dans la population B.
AB ) ii (
J
= Probabilit d'avoir deux fois le mme allle i si on effectue un tirage dans la
population A et un autre tirage dans la population B.

i
A ) i ( A ) ii (
p J
2
;

i
B ) i ( B ) ii (
p J
2
;
B ) i (
i
A ) i ( AB ) ii (
p p J

On appelle coefficient d'identit ou indice de ressemblance le paramtre


AB
dfini par
la relation :
B ) ii ( A ) ii (
AB ) ii (
AB
J J
J

- Si au locus considr les deux populations A et B ont la mme structure alllique,


alors
AB
= 1
- Si au locus considr les deux populations A et B n'ont aucun allle en commun,
alors
AB
= 0
Au lieu d'un seul locus, si on en avait considr plusieurs, on aurait obtenu des
valeurs moyennes pour les paramtres prcdents et on les aurait notes :
31
A ) ii (
J
; B ) ii (
J
; AB ) ii (
J
et
AB

B ) ii ( A ) ii (
AB ) ii (
AB
locus de nombre
B ) ii (
B ) ii (
locus de nombre
A ) ii (
A ) ii (
J J
J
et
tudis locus de total Nombre
J
J ;
tudis locus de total Nombre
J
J avec



Selon Nei, la distance gntique qui spare les populations A et B est donne par la
relation :
AB B A
Log D

- Si A et B prsentent la mme composition alllique pour les locus tudis, DA-B = 0 ;


- Si A et B n'ont aucun allle en commun,
+
B A
D
32
CHAPITRE III : IN#LUENCE DES SYSTEMES DE CROISEMENTS SUR LA
STRUCTURE ENETI!UE DES POPULATIONS
Dans ce chapitre, il sera surtout question de dterminer l'effet des croisements qui se
produisent dans une population sur les frquences relatives des gnotypes qui
contiennent les allles d'un gne polymorphe. Les frquences de tous les divers
croisements possibles dfinissent les relations mathmatiques qui lient frquences
allliques et frquences gnotypiques. Gnralement ces relations mathmatiques
sont dduites de modles de population.
I" DE#INITION DES MODELES
Un modle consiste en une simplification volontaire d'une situation complexe en vue
d'liminer les dtails superflus pour s'intresser seulement l'essentiel de la
question. En gntique des populations, nous devons tenir compte de facteurs tels
que la taille de la population, les modes de croisements, la rpartition gographique
des individus, les mutations, les migrations et la slection. Le but final est de
comprendre les effets combins de tous ces facteurs et d'autre encore ; mais ceux-ci
sont si nombreux et interagissent de faon si complexe qu'ils ne peuvent tre pris en
considration tous la fois. On imagine alors des situations plus simples dans
lesquelles il est possible d'identifier les facteurs les plus importants et de ngliger les
autres.
Un type de modle utilis frquemment en gntique des populations est le modle
mathmatique qui consiste en un ensemble d'hypothses dcrivant les relations
mathmatiques entre des quantits mesures ou mesurables (les paramtres) dans
un systme ou un processus. Les modles mathmatiques sont toujours plus
simples que les situations relles qu'ils sont censs expliquer. Dans l'idal, un
modle devrait inclure toutes les caractristiques essentielles du systme et exclure
tous les aspects superflus. La qualit ou l'utilit d'un modle dpend souvent du
degr d'approximation de cet idal.
En bref, un modle est, en quelque sorte, une analogie. Comme toutes les
analogies, sa validit se situe seulement entre certaines limites, et au-del de ces
limites, cela devient trompeur ou mme absurde.
L'un des modles mathmatiques les plus importants en gntique des populations
est le modle gnrations non chevauchantes : ce modle se rapporte des
populations prsentant un cycle reproductif trs simple dans lequel les individus de
chaque gnration meurent avant la naissance des membres de la gnration
suivante (figure 4).
33
#igure < : Modle gnrations non chevauchantes (cas d'une plante annuelle par
exemple).
Rigoureusement, ce modle s'applique seulement certains insectes vie courte ou
des plantes annuelles qui ont de courtes priodes de croissance. Ce type de
population hypothtique avec son cycle de reproduction simple est utilis en
gntique des populations comme une premire approximation de populations aux
cycles de reproduction plus complexes.
Comme nous le verrons bientt, les calculs des frquences gnotypiques thoriques
bass sur ce modle conviennent pour la plupart des utilisations, et ce sont souvent
des approximations satisfaisantes mme pour les populations dont les cycles de
reproduction sont longs et complexes comme l'espce humaine.
Dans le dveloppement de ce cours de gntique des populations qui va suivre,
nous n'utiliserons que le modle gnrations non chevauchantes.
Plusieurs modes de croisements peuvent tre utiliss dans le cadre de ce modle
car la structure gnotypique de la population une gnration donne dpend en
partie de la loi d'union des gamtes deux deux la gnration prcdente pour
former les zygotes.
Un des plus simples et des plus importants modes de croisement est la panmixie ;
les croisements s'effectuent au hasard pour les gnotypes considrs. En panmixie,
la probabilit qu'un individu se croise avec un autre d'un gnotype donn est gale
la frquence de ce gnotype dans la population.
l est important de garder l'esprit qu'un croisement peut tre au hasard pour
certains caractres mais, en mme temps, non alatoire pour d'autres. Chez les
tres humains par exemple, les croisements semblent au hasard pour les groupes
sanguins, les phnotypes des isozymes (ou allozymes), les polymorphismes des
RFLP, et pour de nombreux autres caractres ; mais les croisements ne se
produisent pas au hasard pour d'autres traits comme la couleur de la peau et la taille.
34
La panmixie est le mode de croisement le plus rpandu dans la plupart des
populations naturelles, mais certains carts la panmixie peuvent tre
considrables.
Quand le choix du conjoint est bas sur le phnotype, on dit qu'il y a homogamie
phnotypique. Elle est dite positive quand les individus ont tendance choisir un
conjoint dont le phnotype est identique au leur. Dans le cas de l'homogamie
phnotypique ngative, les individus ont tendance choisir un conjoint dont le
phnotype est diffrent du leur. Evidemment, mme en panmixie, certains couples de
conjoints prsentent des phnotypes identiques ou diffrents ; l'homogamie dcrit
seulement des situations dans lesquelles les phnotypes des conjoints sont plus
souvent identiques ou plus souvent diffrents que ce qu'on attendrait en panmixie.
Dans la nature, il existe de nombreux exemples d'homogamie phnotypique
positive ; c'est ce qu'on observe chez les plantes floraison prcoce qui se croisent
entre elles tout comme les plantes floraison tardive.
Mme dans les populations humaines il existe une tendance l'homogamie
phnotypique pour les traits comme la taille, le quotient intellectuel (dans le seul sens
de niveau d'tudes), et aussi pour des critres socio-conomiques.
L'homogamie phnotypique ngative quant elle est beaucoup plus rare. Chez les
vgtaux, un exemple bien connu est celui des primevres o il existe une
htrostylie ; deux types de fleurs se rencontrent dans la plupart des populations, en
proportions peu prs gales : le type brvistyl avec un style court et de grandes
tamines et le type longistyl avec un style long et des tamines courtes. Les
polynisations ne se font que de manire croise.
D'autre part, quand le choix du conjoint est bas sur le gnotype, on dit qu'il y a
homogamie gnotypique ; elle peut tre positive ou ngative.
Dans tous les cas d'homogamie, lorsque l'ensemble de la population est soumis au
mme mode de reproduction, on parle d'homogamie totale ; l'homogamie est
partielle si une partie seulement de la population la pratique.
Par ailleurs, lorsque les croisements n'impliquent que des conjoints apparents, on
dit qu'il y a consanguinit ou endogamie. Contrairement l'homogamie qui
n'implique que les gnes sur lesquels est bas le choix du conjoint (et les gnes qui
leur sont lis), la consanguinit concerne tous les gnes.
Le tableau donne les principaux systmes de croisements avec leurs
caractristiques.
35
Ta9+eau II : Caractristiques des modes de croisement.
M2,es ,e 6r2ise)e.ts Cara6t1risti/ues
Panmixie
Les conjoints se croisent au hasard
indpendamment de leurs phnotypes et leurs
gnotypes
Homogamie positive
Les phnotypes ou les gnotypes des conjoints se
ressemblent plus que par simple hasard
Homogamie ngative
Les phnotypes et les gnotypes des conjoints sont
plus diffrents que par simple hasard
Endogamie ou consanguinit Les conjoints sont apparents
II" LE MODELE DE LA PANMI&IE : LOI DE HARDY"'EINBER
Comme nous venons de le signaler, lorsque la probabilit de rencontre et de fusion
de deux gamtes de gnotypes X
1
et X
2
est uniquement dtermine par la frquence
de ces gnotypes dans la population de gamtes, on dit que la population est
panmictique.
II"1 Cas ,0u. +26us aut2s2)i/ue 9ia++1+i/ue
II"1"1 Les 3r1/ue.6es g1.i/ues s2.t i,e.ti/ues ,a.s +es ,eu( se(es
Envisageons un locus autosomique o coexistent deux allles A
1
et A
2
; par rapport
ce locus, il y a deux gnotypes haplodes A
1
et A
2
, et par consquent deux classes de
gamtes. Soient p
n
et q
n
leurs frquences respectives une gnration donne que
nous noterons G
n
(avec p
n
+ q
n
= 1). Si la probabilit de fusion de deux gamtes est
uniquement dtermine par leur frquence (panmixie), les frquences des trois
classes de zygotes possibles seront :
2
2 2 2 1
2
1 1
2
n n n n
q A A ; q p A A ; p A A
l est facile de montrer que cette structure de population est une structure d'quilibre
stable si les conditions suivantes sont remplies :
1) Absence de mutations
36
2) Absence de slection : les diffrents gnotypes haplodes (A
1
et

A
2
) et
diplodes (A
1
A
1
, A
1
A
2
et A
2
A
2
) ont la mme viabilit et la mme fcondit, on dit
qu'ils ont la mme valeur slective.
3) Absence de migrations (les migrations et les immigrations sont ngligeables).
4) Effectif de la population thoriquement infini (absence de drive gntique).
En effet, compte-tenu du droulement de la miose, les htrozygotes A
1
A
2
produisent deux types de gamtes A
1
et A
2
en proportions gales, soit
( )
n n n n
q p q p 2
2
1
Aprs la miose, donc la gnration suivante (G
n+1
), les frquences des gnotypes
haplodes A
1
et A
2
sont les suivantes :
Pour A
1
=p
n+1
= p
2
n
(contribution des homozygotes A
1
A
1
) + p
n
q
n
(contribution des htrozygotes A
1
A
2
) = p
n
(p
n
+q
n
) = p
n
Pour A
2
=q
n+1
=q
2
n
(contribution des homozygotes A
2
A
2
) + p
n
q
n
(contribution des
htrozygotes A
1
A
2
) = q
n
(p
n
+

q
n
) = q
n
Ainsi donc *
.D1
E *
.
et /
.D1
E /
.
En absence de slection sur la phase haplode et de mutations, les frquences des
gamtes A
1
et A
2
sont celles des produits miotiques A
1
et A
2
. Leur fusion au hasard
redonnera les trois classes de zygotes avec des frquences p
2
n,
2p
n
q
n
et q
2
n
.
En absence de slection sur la phase diplode, les frquences des adultes
reproducteurs diplodes seront gales celles des zygotes.
Ces considrations que nous venons de voir ont t dveloppes simultanment et
indpendamment au dbut du 20
me
sicle par un biologiste anglais du nom de
HARDY et un biologiste autrichien du nom de WENBERG.
En gnralisant on a donc : P
n+1
=p
n
= p et q
n+1
= q
n
= q
D'o la structure p
2
, 2pq, q
2
appele structure gnotypique de HARDY- WENBERG
ou structure d'quilibre panmictique.
La loi de HARDY- WENBERG, dans sa forme actuelle, s'nonce comme suit : "Dans
une population diplode isole d'effectif illimit non soumise la slection et dans
laquelle il n'y a pas de mutation, les frquences gniques restent constantes ; si les
croisements sont panmictiques, les frquences gnotypiques se dduisent
directement des frquences gniques et elles restent aussi constantes".
II"1"5 Les 3r1/ue.6es g1.i/ues ,i337re.t ,0u. se(e C +0autre
37
Envisageons le cas d'un locus autosomique deux allles A
1
et A
2
dans une
population diplode prise une gnration quelconque G
n
avec une ingalit des
frquences allliques dans les deux sexes.
La structure gamtique de la gnration (G
n
) est donc :
p
n

A
1
et q
n

A
2
chez les femelles (p
n

+ q
n

= 1)
p
n
_
A
1
et q
n
_
A
2
chez les mles (p
n
_
+ q
n
_
= 1)
La structure gnotypique panmictique zygotique et au niveau des adultes
reproducteurs la gnration suivante (G
n+1
) sera :
p
n
_
p
n

A
1
A
1
(p
n
_
q
n

+ p
n

q
n
_
) A
1
A
2
q
n
_
q
n

A
2
A
2
Les frquences gniques (ou frquences gamtiques) aprs la miose des adultes
reproducteurs de G
n+1
sont :
pn+1 = p
n
_
p
n

+
2
1
(p
n
_
q
n

+ p
n

q
n
_
)
Sachant que q
n

= 1 p
n

et q
n
_
= 1 p
n
_
, en remplaant q
n

et q
n
_
par ces valeurs
nous aurons :
P
n+1
=
2
1
(p
n
_
+ p
n

) et q
n+1
=
2
1
(q
n
_
+ q
n

)
Ainsi aprs une seule gnration de reproduction panmictique, l'quilibre gntique
est restaur, c'est--dire que les frquences deviennent identiques dans les 2 sexes
et la structure devient panmictique la deuxime gnration. En effet :
p
_
n+1
= p

n+1
= p
n+1
= p
q
_
n+1
= q

n+1
= q
n+1
= q
D'o p
2
A
1
A
1
, 2pqA
1
A
2
et q
2
A
2
A
2
partir de la deuxime gnration (G
n+2
).
L'quilibre panmictique pour un locus autosomique 2 allles appelle quelques
remarques :
38
1) l permet d'tablir une relation entre les frquences des gnotypes haplodes
et diplodes de sorte qu'il est possible de dduire graphiquement les unes des
autres (figure 5).
Comme le montre la figure 5, la frquence maximale des htrozygotes est
2
1
. Elle est obtenue lorsque les deux allles sont galement frquents (p = q
=
2
1
). Par ailleurs, les arcs de parabole y = p
2
, y = q
2
sont respectivement
tangents l'axe des abscisses lorsque p = 0 (q = 1) ou q = 0 (p = 1).
Autrement dit, lorsqu'un gne est rare dans une population, il y est
essentiellement prsent l'tat htrozygote. Si ce gne est rcessif, il
passera inaperu. Lorsque p est petit,
2 2 2
2 2
p
p
p
pq
p

; par exemple si
p =0,01 (10
-2
) il y aura dans la population 200 fois plus d'htrozygotes A
1
A
2
que d'homozygotes A
1
A
1
.
2) l permet de dterminer la vitesse d'atteinte de l'quilibre. En effet, si une
population s'carte accidentellement de sa structure d'quilibre, celui-ci se
rtablit en une gnration si les frquences des gnotypes diplodes sont
demeures gales dans les deux sexes et en deux gnrations si ce n'est pas
le cas. Le retour la position d'quilibre la suite d'un cart est donc
extrmement rapide.
39
#igure = : Relation entre les frquences gnotypiques et les frquences allliques
dans une population soumise la loi de HARDY-WENBERG.
II"5 Cas ,0u. +26us aut2s2)i/ue )u+tia++1+i/ue ave6 1ga+it1 ,es 3r1/ue.6es
g1.i/ues ,a.s +es ,eu( se(es.
S'il coexiste un locus autosomique n allles dont les frquences sont
respectivement p
1
, p
2
... p
i
... p
n
, il existe dans une population diplode
l'quilibre panmictique
2
1) n ( n +
gnotypes diplodes, soit n gnotypes homozygotes
dont les frquences sont p
2
1
, p
2
2
, ., p
2
i
, ., p
2
n
et
2
1) n ( n
gnotypes htrozygotes
tels que A
i
A
j
dont les frquences sont de type 2p
i
p
j
.
Exemple : Si nous avons un locus autosomique 4 allles A
1
, A
2
, A
3
et A
4
de
frquences p
1
, p
2
, p
3
et p
4
dans les deux sexes, la structure gnotypique panmictique
de la population sera la suivante :
40
4 3 4 3 4 2 4 2 3 2 3 2
4 1 4 1 3 1 3 1 2 1 2 1 4 4
2
4 3 3
2
3 2 2
2
2 1 1
2
1
2
A A p p , A A p p , A A p p
, A A p p , A A p p , A A p p , A A p , A A p , A A p , A A p
soit 10 gnotypes diplodes possible avec 4 homozygotes et 6 htrozygotes.
II": Cas ,0u. +26us 9ia++1+i/ue +i1 au se(e
II":"1 Les 3r1/ue.6es g1.i/ues s2.t 1ga+es ,a.s +es 5 se(es.
Envisageons le modle d'un locus li au sexe avec 2 allles B
1
et B
2
de frquences
p
n
et q
n
respectivement une gnration quelconque G
n
. La structure gnotypique
panmictique de la population zygotique et de la population des adultes reproducteurs
la gnration suivante (G
n+1
) est la suivante :
Chez les femelles : p
2
n
B
1
B
1
, 2p
n
q
n
B
1
B
2
, q
2
n
B
2
B
2
Chez les mles : p
n
, q
n

II":"5 Les 3r1/ue.6es g1.i/ues ,i337re.t ,0u. se(e C +0autre
Dans ce cas, la structure gnotypique de la population gamtique la gnration n
(G
n
) est :
Chez les femelles :
p
n

B
1
et q
n

B
2
(avec p
n

+ q
n

= 1)
Chez les mles :
p
n
_
B
1
et q
n
_
(avec p
n
_
+ q
n
_
= 1)
A la gnration suivante (G
n+1
), la structure gnotypique de la population zygotique et
de la population des adultes reproducteurs est la suivante :
Chez les femelles :
p
n
_
p
n

B
1
B
1
, (p
n
_
q
n

+ p
n

q
n
_
) B
1
B
2
, et q
n
_
q
n

B
2
B
2
Chez les mles :
p
n

, q
n


41
B
1
B
2
B
1
B
2
l est ais de montrer que la structure de la population gamtique G
n+1
est :
Chez les femelles :
p

n+1
=
2
1
(p
n
_
+ p
n

) et q

n+1
=
2
1
(q
n
_
+ q
n

)
Chez les mles :
p
_
n+1
= p
n

et q
_
n+1
= q
n


Dans cette situation, comment voluent les frquences gniques dans chaque sexe
au cours des gnrations ? l est plus judicieux de suivre cette volution chez les
femelles car la connaissance de la structure gnotypique gamtique chez les
femelles une gnration donne permet de dduire celle des mles la gnration
suivante. Calculons l'cart Ap

= p

n+1
- p
n


Ap

= p

n+1
- p
n

=
2
1
(p
n
_
+ p
n

) - p
n

=
2
1
(p
n
_
- p
n

)
Ap

= p

n+1
- p
n

=
2
1

(p
n

- p
n
_
)
En remplaant p
n
_
par p

n-1
, on obtient :
p

n+1
- p
n

=
2
1

(p
n

- p

n-1
)
p
n

- p

n-1
=
2
1

(p

n-1
- p

n-2
)
p

n-1
- p

n-2
=
2
1

(p

n-2
- p

n-3
)

p
2

- p
1

=
2
1

(p
1

- p
0

)
La rsolution de cette rcurrence se fait en multipliant les termes de part et d'autre
de l'galit et on obtient alors :
p

n+1
- p
n

=
n

,
_

2
1
(p
1

- p
0

)
En remplaant p
1

par
2
1
(p
0
_
+ p
0

) cette relation devient :


p

n+1
- p
n

=
n

,
_

2
1
[
2
1
(p
0
_
- p
0

)]
De mme nous pouvons crire que :
42
p
n

- p

n-1
=
1
2
1

,
_

n
[
2
1
(p
0
_
- p
0

)]
p

n-1
- p

n-2
=
2
2
1

,
_

n
[
2
1
(p
0
_
- p
0

)]

p
2

- p
1

=
1
2
1

,
_

[
2
1
(p
0
_
- p
0

)]
p
1

- p
0

=
0
2
1

,
_

[
2
1
(p
0
_
- p
0

)] = 1 x [
2
1
(p
0
_
- p
0

)]
La rsolution de cette rcurrence s'obtient en additionnant les termes de chaque ct
de l'galit ; ainsi,
p

n+1
p
0

=
1
1
]
1

,
_

+ +

,
_

,
_

+
n
2
1
2
1
2
1
1
2

x
2
1
(p
0
_
- p
0

)
Si on pose que
1
1
]
1

,
_

+ +

,
_

,
_

+
n
2
1
2
1
2
1
1
2

= &,
calculons alors
2
1

& qui donne la relation suivante :


2
1

& =
1 3 2
2
1
2
1
2
1
2
1
+

,
_

+ +

,
_

,
_

,
_

Calculons maintenant
& -
,
_

2
1
& =
2
3
& =
1
2
1
1
+

,
_


n
==> & =
1
1
]
1

,
_


+1
2
1
1
3
2
n
En remplaant X par sa valeur on obtient :
p

n+1
p
0

=
1
1
]
1

,
_


+1
2
1
1
3
2
n
x
2
1
(p
0
_
- p
0

)
=
1
1
]
1

,
_


+1
2
1
1
3
1
n
(p
0
_
- p
0

)
p

n+1
= p
0

+
3
1
[(p
0
_
- p
0

,
_

,
_


+1
2
1
1
n
]
p

n+1
= p
0

+
3
1
[(p
0
_
- p
0

) - (p
0
_
- p
0

)
1
2
1
+

,
_

n
]
p

n+1
=
3
1
(3p
0

+ p
0
_
- p
0

)
3
1
(p
0
_
- p
0

)
1
2
1
+

,
_

n
p

n+1
=
3
1
(2p
0

+ p
0
_
)
3
1
(p
0
_
- p
0

)
1
2
1
+

,
_

n
43
On peut donc crire aussi que :
p
n

=
3
1
(2p
0

+ p
0
_
)
3
1
(p
0
_
- p
0

)
n

,
_

2
1

,
_


0
2
1
n
n quand
p
n


3
1
(2p
0

+ p
0
_
) =
3
2
p
0

+
3
1
p
0
_
Ainsi donc, quand le nombre de gnrations (n) augmente indfiniment, la frquence
de B
1
chez les femelles (p
n

) tend vers sa valeur d'quilibre gale


3
1
(2p
0

+ p
0
_
).
Quand l'quilibre est atteint, les frquences gniques dans les 2 sexes s'galent et
on retrouve la structure gnotypique diplode panmictique.
On peut tudier aussi les fluctuations de l'cart entre les frquences gniques des 2
sexes au cours des gnrations. Pour l'allle B
1
, il s'agit d'tudier par exemple
l'volution de l'cart E = p

- p
_
. A la gnration n, nous noterons cet cart En. Nous
aurons donc :
E
n
= p
n

- p
n
_
=
2
1
(p
_
n-1
+ p

n-1
) - p

n-1
E
n
=
2
1
(p
_
n-1
- p

n-1
) =
2
1

(p

n-1
- p
_
n-1
)
E
n
=
2
1

(p

n-1
- p
_
n-1
) =
2
1

E
n-1
E
n-1
=
2
1

(p

n-2
- p
_
n-2
) =
2
1

E
n-2
E
n-2
=
2
1

(p

n-3
- p
_
n-23
) =
2
1

E
n-3

E
1
=
2
1

(p
0

- p
0
_
) =
2
1

E
0
Pour rsoudre cette rcurrence il suffit de multiplier les termes de chaque ct de
l'galit. On obtient alors :
0
2
1
E E
n
n

,
_


Re)ar/ue :
A la suite d'un cart, la position d'quilibre n'est atteinte que d'une manire
asymptotique. La diffrence entre la frquence d'quilibre d'un gnotype et la
44
frquence existante (observe) est rduite de moiti chaque gnration. Le retour
une situation proche de la structure d'quilibre est donc nanmoins rapide.
II"< I.tr2,u6ti2. au )2,7+e C *+usieurs +26us
Soit deux locus o coexistent deux allles pour chacun : A
1
et A
2
puis B
1
et B
2
avec
des frquences respectives p
n
, q
n
et r
n
, s
n
une gnration donne G
n
. La frquence
d'quilibre d'un gnotype ne dpendant que des frquences des gnes qui le
constituent, nous aurons la gnration suivante (G
n+1
) pour les deux locus
considrs la fois :
p
2
n
r
2
n
A
1
A
1
B
1
B
1
2p
2
n
r
n
s
n
A
1
A
1
B
1
B
2
p
2
n
s
2
n
A
1
A
1
B
2
B
2
2q
2
n
r
n
s
n
A
2
A
2
B
1
B
2
q
2
n
r
2
n
A
2
A
2
B
1
B
1
2p
n
q
n
r
2
n
A
1
A
2
B
1
B
1
q
2
n
s
2
n
A
2
A
2
B
2
B
2
2p
n
q
n
s
2
n
A
1
A
2
B
2
B
2
4p
n
q
n
r
n
s
n
A
1
A
2
B
1
B
2
Le point important est que cette structure d'quilibre est la mme, que les gnes
soient indpendants ou gntiquement lis.
Toutefois, l'existence d'une liaison influe trs fortement sur la vitesse d'atteinte de
l'quilibre comme nous le verrons plus loin. Dans le cas de deux locus autosomaux
ports par des chromosomes diffrents, la structure gnotypique d'quilibre est
atteinte au maximum en deux gnrations.
La structure gnotypique panmictique que nous venons de prsenter relativement
aux deux locus 2 allles chacun semble indiquer que les allles d'un locus donn,
par exemple A
1
et A
2
, s'associent au hasard ceux de l'autre locus B
1
et B
2.
En
ralit il n'en est pas toujours ainsi car il peut arriver que des allles de gnes
diffrents ne s'associent pas au hasard.
II"<"1 N2ti2. ,e ,1s1/ui+i9re ,e +iais2.
Quand les allles de gnes diffrents s'associent au hasard, la frquence d'un
gamte portant une combinaison particulire d'allles est gale au produit des
frquences de ces allles. Dans ce cas, pour notre exemple deux locus, les quatre
types de gamtes et leurs frquences seraient p
n
r
n
A
1
B
1
; p
n
s
n
A
1
B
2
; q
n
r
n
A
2
B
1
et
q
n
s
n
A
2
B
2
.
Les gnes qui sont associs au hasard sont dits en quilibre de liaison et les gnes
non associs au hasard sont dits en dsquilibre de liaison.
45
II"<"5 E(*ressi2. 32r)a+is1e ,u ,1s1/ui+i9re ,e +iais2.
Pour faciliter la comprhension de ce qui va suivre, dsignons maintenant les
frquences de A
1
et A
2
par 1 A
p
et 2 A
p
respectivement, et les frquences de B
1
et
B
2
par 1 B
p
et 2 B
p
respectivement une gnration quelconque G
n
. Parmi les
quatre combinaisons gamtiques possibles A
1
B
1
, A
1
B
2
, A
2
B
1
et A
2
B
2
que peut produire
un individu htrozygote pour les deux gnes, considrons l'une d'entre elles (par
exemple A
1
B
1
) et raisonnons :
Si nous dsignons par 1 1B A
g
la frquence relle du gamte A
1
B
1
, deux situations
peuvent se prsenter :
- Soit que les allles des deux gnes s'associent au hasard (quilibre de liaison), et
alors nous aurons 1 1B A
g
= 1 A
p
x 1 B
p
;
- Soit que les allles des deux gnes ne s'associent pas au hasard (dsquilibre de
liaison), et nous aurons dans ce cas 1 1B A
g
= 1 A
p
x 1 B
p
D
Si nous admettons arbitrairement que la frquence relle de A
1
B
1
est :
A
1
B
1
= 1 1B A
g
= 1 A
p
x 1 B
p
+ D, alors D = 1 1B A
g
1 A
p
x 1 B
p
Le paramtre D ainsi dfini est appel dsquilibre de liaison de la population pour
les deux locus considrs. l reprsente donc un cart l'association alatoire des
allles de deux gnes diffrents. La connaissance des frquences allliques et du
paramtre D suffit donc au calcul des frquences gamtiques dans la population.
Dterminons donc les frquences des trois autres combinaisons gamtiques.
P2ur +a C2)9i.ais2. A
1
B
5
:
Pour calculer la frquence des gamtes A
1
B
2
, il suffit de se rappeler que
l'ensemble des gamtes portant A
1
est en frquence 1 A
p
; donc :
D p p g donc ; p p or
D ) p ( p D p p p g g D p p g g p
B A B A B B
B A B A A B A B A B A B A B A A

+ + +
2 1 2 1 2 1
1 1 1 1 1 2 1 2 1 1 1 2 1 1 1 1
1
1
P2ur +a C2)9i.ais2. A
5
B
1
:
Le mme raisonnement nous permet d'crire que :
D p p g donc ; p p or
D ) p ( p D p p p g o ' d g D p p g g p
B A B A A A
A B B A B B A B A B A B A B A B

+ + +
1 2 1 2 2 1
1 1 1 1 1 1 2 1 2 1 1 1 2 1 1 1
1
1
P2ur +a C2)9i.ais2. A
5
B
5
:
46
De mme nous pouvons crire que :
D p p g
D p p g
D p p g
D p p g
: avons nous nt rcapitula En
D p p g donc ; p p or
D ) p ( p D p p p g g D p p g g p
B A B A
B A B A
B A B A
B A B A
B A B A B B
B A B A A B A B A B A B A B A A


+
+
+
+ + + +
1 2 1 2
2 1 2 1
2 2 2 2
1 1 1 1
2 2 2 2 2 1
1 2 1 2 2 2 2 2 2 1 2 2 2 1 2 2
1
1
l faut faire remarquer que le signe du paramtre D est une question de convention et
il est donc sans importance. Ce paramtre est aussi appel dsquilibre gamtique
puisqu'il est dfini partir des frquences gamtiques.
Par ailleurs, nous concevons intuitivement que le dsquilibre de liaison puisse tre
maximal lorsque la connaissance d'un allle un locus permet de prdire coup sr
l'allle de l'autre locus auquel il sera associ ; en d'autres termes, le paramtre D est
maximal lorsqu'il n'existe dans la population que deux des quatre combinaisons
gamtiques pour les deux gnes ; par exemple lorsqu'il n'existe que A
1
B
1
et A
2
B
2
ou
A
1
B
2
et A
2
B
1.

Dans ce cas
2 2 1 1
B A B A
p p et p p

,
_


2
1
2
1
2
1
2
1
1 2 2 1 2 2 1 1
B A B A B A B A
p p et p p ou p p et p p
Le paramtre D fluctue entre
4
1

et
4
1
+
(
4
1

> D >
4
1
+
) selon que les gamtes
reprsents sont A
1
B
1
et A
2
B
2
ou A
1
B
2
et A
2
B
1
4
1
2
1
4
1
4
1
2
1
2
1
2
1
4
1
4
1
2
1
4
1
2
1
2
1
2
1
2 1 2 1
1 1 1 1


+ + +
+
D D D
D p p g
ou
D D D
D p p g
B A B A
B A B A
II"<": Ev2+uti2. ,u ,1s1/ui+i9re ,e +iais2. s2us +es restri6ti2.s ,e HARDY"
'EINBER
Quand une population est sous les restrictions de H-W, l'quilibre de liaison entre les
gnes finit par tre atteint. Cependant, cet quilibre de liaison est atteint
progressivement, et parfois trs lentement. A
1
A
2
B
1
B
2
L'quilibre de liaison est atteint avec une vitesse qui dpend des proportions relatives
des divers types de gamtes qui peuvent tre produits par un individu htrozygote
47
A1
B1
A2
B2
aux deux locus. En effet, celui-ci, s'il est de gnotype , produira des gamtes
parentaux A
1
B
1
et A
2
B
2
ainsi que des gamtes recombins A
1
B
2
et A
2
B
1.
Si au
contraire son gnotype est , il fabriquera des gamtes parentaux A
1
B
2
et A
2
B
1
ainsi que des gamtes recombins A
1
B
1
et A
2
B
2.
Si nous dsignons le taux de recombinaison entre les deux gnes par le paramtre r,
alors nous savons que chaque gamte parental a pour frquence
2
1 r
et chaque
gamte recombin la frquence
2
r
. Le paramtre r est < 1 et compris entre 0 et 0,5
(0 > r > 0,5). Le taux de recombinaison entre deux gnes dpend de la position des
gnes sur le chromosome. S'ils se trouvent sur des chromosomes diffrents, le taux
de recombinaison r =0,5 ; ce qui signifie que les quatre types de gamtes sont
produits en proportions gales. Si les deux gnes sont sur le mme chromosome, le
taux de recombinaison dpend de la distance qui les spare.
Dans ce cas r =0 si les deux gnes sont trs proches l'un de l'autre au point qu'ils ne
peuvent recombiner par crossing-over et r = 0,5 si les deux gnes sont trs loigns
l'un de l'autre au point qu'ils ont autant de chance de recombiner que de ne pas
recombiner.
Le taux de recombinaison entre les gnes est un paramtre important en gntique
des populations parce que la vitesse avec laquelle l'quilibre de liaison est atteint
dpend de sa valeur. Pour mieux percevoir l'effet de la recombinaison sur l'approche
de l'quilibre de liaison, raisonnons partir du modle suivant :
Soit une population fondatrice (population la gnration de dpart = G
0
) dans
laquelle il existe un dsquilibre de liaison D
0
. Considrons dans cette population le
mme modle deux locus avec deux allles chacun comme prcdemment. Toutes
les hypothses de H-W tant satisfaites, les frquences gniques resteront
constantes au cours des gnrations. Mais qu'en sera-t-il du dsquilibre de liaison ?
Prenons la combinaison gamtique A
1
B
1
et suivons l'volution de sa frquence au
cours du temps.
A la gnration gamtique G
n
, la frquence relle de ce gamte est
1 1B A
g
. Ce
gamte peut avoir t produit la suite de deux vnements qui s'excluent
mutuellement :
- Soit que A
1
B
1
a t produit parce que le chromosome portant les deux gnes n'a
pas subi de recombinaison (probabilit = 1 - r) ; dans ce cas parmi les chromosomes
de cette nature la frquence de A
1
B
1
est la mme que dans la gnration prcdente
( 1 1 1 n ) B A (
g
). Donc la probabilit pour que le gamte A
1
B
1
soit produit de cette
manire = (1 - r) ( 1 1 1 n ) B A (
g
).
48
A1
B2
A2
B1
- Soit que A
1
B
1
a t produit parce que le chromosome portant les deux gnes a subi
une recombinaison (probabilit = r) ; dans ce cas parmi les chromosomes de cette
nature la frquence de A
1
B
1
est simplement gale la frquence des gnotypes
dans la gnration prcdente et cette frquence est gale
1 1 B A
p p

car les croisements se font au hasard (le point d'interrogation en indice signifie
n'importe quel allle du gne). Donc la probabilit pour que le gamte A
1
B
1
soit
produit de cette deuxime manire =
1 1 B A
p rp
(voir encadr ci-dessous).
49
A1
B?
A?
B1
50
Finalement, la gnration gamtique G
n
, la frquence du gamte
n ) B A ( B A n ) B A
g p rp g ) r ( B A
1 1 1 1 1 1 1 1 1
1 +
.
Pour suivre l'volution du dsquilibre de liaison au cours des gnrations, rsolvons
cette quation de la manire suivante :
On peut donc crire que :
( )
0 1
2 1
1
1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1
1
1
1
1
1 1
1
D ) r ( D
D ) r ( D
D ) r ( D
: que crire donc peut on
D p p g et D p p g or
p p g ) r ( p p g
p p ) r ( p p g ) r (
p p p p p rp g ) r ( g
n n
n n
n B A n ) B A ( n B A n ) B A (
B A n ) B A B A n ) B A (
B A B A n ) B A
B A B A B A n ) B A n ) B A (





+
+ +

En multipliant les termes de chaque ct de l'galit on obtient


0
1 D ) r ( D
n
n

ou la
relation de Li. Comme 1 - r < 1, (1 - r)
n
tend alors vers zro quand n devient grand,
mais la vitesse avec laquelle (1 - r)
n
tend vers zro dpend de r ; plus r est proche de
zro, plus la vitesse est lente (figure 6)
Re)ar/ue :
En terme de frquences gamtiques, le paramtre D satisfait la relation
1 2 2 1 2 2 1 1 B A B A B A B A
g g g g D
. L'quilibre est atteint pour D = 0. Dans la plupart des
populations naturelles d'organismes sexus sauf en cas de consanguinit leve,
provoque par l'autofcondation par exemple, les valeurs de D sont typiquement
zro ou proches de zro (indiquant un quilibre de liaison) moins que les gnes ne
soient lis de faon trs proche.
51
#igure ? : Cas de deux loci. Evolution vers l'tat d'quilibre. L'cart initial l'quilibre
(D) diminue au cours des gnrations. Cette volution est fonction du pourcentage
de recombinaison (r) entre les deux loci tudis.
52
II"<"< Les 6auses *2ssi9+es ,0u. ,1s1/ui+i9re ,e +iais2.
Certains facteurs peuvent tre l'origine d'un dsquilibre gamtique :
1) Si une population donne provient d'un mlange rcent d'au moins deux
autres populations qui avaient des compositions gamtiques trs diffrentes,
celle-ci sera le sige de dsquilibres de liaison qui disparatront
progressivement.
2) La slection gamtique peut aussi induire des dsquilibres de liaison. On
conoit intuitivement que ce puisse tre le cas si, par exemple les
combinaisons A
1
B
1
et A
2
B
2
sont meilleures aux combinaisons A
1
B
2
et A
2
B
1
.
3) Le phnomne de l'"auto-stop gnique" peut conduire aussi des
dsquilibres de liaison (un gne dfavorable peut quand-mme se reprendre
dans une population s'il est fortement li un autre gne trs favorable).
4) Le simple hasard dans une population d'effectif limit peut induire aussi des
dsquilibres de liaison.
II"= Les C2.s1/ue.6es ,e +a L2i ,e HARDY"'EINBER
II"="1 D1ter)i.ati2. ,e +a 3r1/ue.6e ,es g7.es r16essi3s
Lorsque les hypothses de HARDY-WENBERG sont satisfaites dans une population
(donc une population panmictique en quilibre), la frquence des individus de
phnotype rcessif permet de dduire la frquence de l'allle rcessif dans cette
population. Par exemple, nous savons que chez l'homme l'albinisme est un
phnotype li une mutation rcessive. Si dans une population donne 1 individu
sur 10 000 est albinos, la frquence du gne albinos se dtermine de la faon
suivante :
Soit a le gne albinos et / sa frquence ; sous les hypothses de HARDY-
WENBERG :
[ ] 01 0
10000
1
10000
1
2
, q q albinos
53
II"="5 D1ter)i.ati2. ,e +a 3r1/ue.6e ,es t-*es ,e 6r2ise)e.ts et ,e +a
3r1/ue.6e ,es g1.2t-*es ,a.s +eurs *r2g1.itures
Considrons l'exemple d'un locus autosomique deux allles A
1
et A
2
de frquences
respectives p et q. la structure gnotypique d'une population diplode en quilibre
panmictique est p
2
A
1
B
1
, 2pqA
1
A
2
et q
2
A
2
A
2
. Dans le tableau nous indiquons tous
les types de croisements possibles et la structure gnotypique de leurs prognitures
en conditions de panmixie.
Ta9+eau III : Frquences des types de croisements et frquences des gnotypes
dans leurs prognitures dans une population en quilibre panmictique.
Les types de
croisements
Frquences des
types de
croisements
Frquence des gnotypes dans les
prognitures
A
1
A
1
A
1
A
2
A
2
A
2
A
1
A
1
x A
1
A
1
p
2
x p
2
= p4 P
4
0 0
A
1
A
1
x A
2
A
2
2 (p
2
x q
2
) = 2p
2
q
2
0 2p
2
q
2
0
A
1
A
1
x A
1
A
2
2(p
2
x 2pq) = 4p
3
q 2p
3
q 2p
3
q 0
A
2
A
2
x A
2
A
2
q
2
x q
2
= q
4
0 0 q
4
A
2
A
2
x A
1
A
2
2(q
2
x 2pq) = 4pq
3
0 2pq
3
2pq
3
A
1
A
2
x A
1
A
2
2pq x 2pq = 4p
2
q
2
p
2
q
2
2p
2
q
2
p
2
q
2
Z (p
2
+ 2pq + q
2
)
2
= 1 p
2
2pq q
2
III" LE MODELE DE L0HOMOAMIE
L'homogamie est un systme de croisement couramment utilis en slection animale
et vgtale. Chez les animaux, l'insmination artificielle se pratique aprs un choix
prfrentiel des gniteurs partir de critres bien dfinis. Chez les vgtaux on
observe la mme tendance car la production d'hybrides se fait aprs un choix
phnotypique des parents.
L'homogamie tant un systme de croisement non panmictique, les frquences
gnotypiques seront modifies au cours des gnrations contrairement aux
frquences allliques qui continueront de rester constantes. En effet, par rapport aux
conditions de la loi de HARDY-WENBERG, seul le systme de croisement change
ici mais les autres conditions restent satisfaites.
III"1 L042)2ga)ie g1.2t-*i/ue *2sitive t2ta+e
54
L'homogamie gnotypique est possible lorsque, pour un locus deux allles, la
distinction phnotypique des trois gnotypiques possibles est aise (cas d'allles
codominants). Dans le cas d'allles dominants, cela devient pratiquement
impossible.
L'homogamie gnotypique positive totale s'observe dans les populations de plantes
autogames strictes comme c'est le cas chez les plantes clistogames (dont la fleur
ne s'ouvre pas maturit).
III"1"1. Etu,e ,0u. 6as *arti6u+ier
Considrons le modle d'un locus autosomal deux allles codominants A
1
et A
2
.
Admettons que la population fondatrice (G
0
) n'est constitue que d'individus
htrozygotes A
1
A
2
. Sous l'homogamie gnotypique positive totale (HGPT) la
premire gnration (G
1
) sera constitue de
2 1 2 2 1 1
2
1
4
1
4
1
A A , A A , A A
.
A la deuxime gnration (G
2
), chaque gnotype se croisant toujours par lui-mme,
nous aurons :

2 1 2 2 1 1 2 1 2 2 1 1 2 1
2 2 2 2
1 1 1 1
4
1
8
1
8
1
2
1
4
1
4
1
2
1
2
1
4
1
4
1
4
1
4
1
A A A A A A A A A A A A A A
A A A A
A A A A
+ +
1
]
1

+ +

Finalement la population G
2
sera constitue de
2 1 2 2 1 1
4
1
8
3
8
3
A A et A A , A A
. De cette
volution des frquences gnotypiques, nous dduisons que la frquence des
htrozygotes la n
ime
gnration (G
n
) que nous dsignerons par H
n
est gale
n
2
1
.
On s'aperoit intuitivement que
n n
H
2
1

--> zro quand n augmente (n --> ). On en


conclut que l'homogamie gnotypique positive totale est un systme de croisement
trs efficace pour liminer les gnotypes htrozygotes d'une population.
III"1"5 Etu,e ,0u. 6as g1.1ra+ ave6 62e33i6ie.t ,e 62rr1+ati2. ga)1ti/ue
55
Considrons deux allles A
1
et A
2
, de frquences p et q, d'un locus autosomal dans
une population d'organisme diplode. Attribuons aux gamtes la valeur arbitraire 1
ou 0, selon qu'ils apportent l'allle A
1
ou A
2
. Appelons g et g' les deux gamtes qui
s'unissent pour former un zygote. Le coefficient de corrlation gamtique s'crit :
' g g
' Covgg


Ce coefficient est classiquement estim par l'expression :
( )( )
( ) ( )




2 2
' g ' g g g
' g ' g g g
Vrifions que dans le cas de la panmixie, ce coefficient est nul.
A
1
1 et A
2
0 ===>
p xq xp ' g g + 0 1
Pour les 3 gnotypes diplodes nous aurons :
A
1
A
1
g =1 ; g' = 1 et frquence = p
2
A
1
A
2
g = 1 ; g' = 0 et frquence = 2pq
A
2
A
2
g = 0 ; g' = 0 et frquence = q
2
Le numrateur de

est donc :
( )( ) ( )( ) ( )( )
( )( ) ( )( ) ( )( )
0
1
1
2 0 0 0 1 2 1 1
2 1 1
1 2 2 1
2 1 2 0 0 0 1 2 1 1
2 2 2 2
2 2 2
2 2 2 3
2 2 2 3
2 2 4 2 3
2 2 4 4 2 3 2 2
2 2 4 3 2
2 2 2 4 3 2 2 2
+
+
+
+
+
+ + + +

+ +
+ + + +
q p q p
q p ) p ( q p
q p q p q p
q p q p ) p ( p
q p p q p p
q p p p q p p p p q p p pq p p p
q p q et p q que Sachant
q p p ) q ( p ) q ( p
q p q p p ) q ( p p p p q p p pq p p p
Le dnominateur de

tant positif,

est videmment nul.


Dans un systme de croisement non panmictique, les deux tirages de gamtes
ncessaires pour raliser un gnotype ne sont plus indpendants. On peut alors
reprsenter cette situation par un modle o les zygotes forms rsultent soit d'un
choix entre les gamtes (probabilit C), soit d'une rencontre au hasard de ces
gamtes (probabilit 1 - C). On dmontre que c est identique la valeur absolue du
coefficient de corrlation gamtique

. dans le cas de l'homogamie positive et de la


56
consanguinit, on peut crire C =

, avec

> 0 ; c reprsente exactement ici le


coefficient de corrlation gamtique. Dans le cas de l'homogamie ngative, on aura
C = -

, avec

< 0.
Puisque nous nous trouvons dans le cas de l'homogamie gnotypique positive totale,
tablissons la structure gnotypique d'une population soumise un tel rgime de
croisement. Choisissons l'un quelconque des trois gnotypes (par exemple A
1
A
1
) et
raisonnons :
A une gnration quelconque que nous noterons G
n
, avec un coefficient de
corrlation gamtique de la population = C
n
, la probabilit de ralisation du gnotype
A
1
A
1
a deux origines exclusives :
1) Un gamte portant A
1
(qui a une probabilit p dans la population des gamtes)
s'unira obligatoirement avec un gamte A
1
(probabilit C
n
) ; cette ventualit a
donc une probabilit C
n
p de se produire.
2) Un gamte portant A
1
(probabilit p) s'unira au hasard (probabilit 1 - C
n
) un
autre gamte A
1
(probabilit p) ; cette ventualit a une probabilit (1 - cn)p
2
de se produire.
Finalement la probabilit de ralisation de A
1
A
1
est gale :
C
n
p + (1 - C
n
)p
2
= p
2
+ C
n
pq.
Un raisonnement analogue nous conduit la probabilit de ralisation de
A
2
A
2
= C
n
q + (1 - cn)q
2
= q
2
+ C
n
pq.
Quant au gnotype A
1
A
2
, sa ralisation ne peut provenir que de la rencontre au
hasard (probabilit 1 - C
n
) des gamtes A
1
(probabilit p) et A
2
(probabilit q) ; d'o la
probabilit de A
1
A
2
= 2pq (1 - C
n
).
La structure gnotypique de la population G
n
est donc :
pq C q A A
) C ( pq A A
pq C p A A
G
n
n
n
n
+

+
2
2 2
2 1
2
1 1
1 2
Cette formulation montre parfaitement les carts par rapport l'quilibre de HARDY-
WENBERG. Pour suivre l'volution des frquences gnotypiques de la population
au cours des gnrations sous l'homogamie gnotypique positive totale, dsignons
par D
n
, H
n
et R
n
les frquences relatives des gnotypes A
1
A
1
, A
1
A
2
et A
2
A
2
G
n
, et par
D
n+1
, H
n+1
et R
n+1
les frquences de ces mmes gnotypes la gnration suivante
(G
n+1
). Sous ce rgime de reproduction, les relations qui lient les frquences des
gnotypes de G
n
celles des gnotypes de G
n+1
sont :
57
n n n
n n
n n n
H R R
H H
H D D
4
1
2
1
4
1
1
1
1
+

+
+
+
+
En remplaant les termes par leurs valeurs nous avons :
[ ]
[ ]
[ ] ) C ( pq pq C p pq C p R
) C ( pq ) C ( pq H
) C ( pq pq C p pq C p D
n n n n
n n n
n n n n
+ + +

+ + +
+ +
+ +
+ +
1 2
4
1
1 2
2
1
1 2
1 2
4
1
2
1
2
1
1 1
2
1
2
1
Les frquences gniques p et q restant constantes au cours des gnrations,
l'volution de la structure gnotypique de la population ne dpend que de l'volution
du paramtre c. il suffit donc d'tablir une relation entre C
n
et C
n+1
pour voir comment
voluent les frquences gnotypiques sous l'homogamie gnotypique positive totale.
Pour cela, raisonnons partir de l'un des 3 gnotypes, soit A
1
A
1
par exemple :
[ ] ) C ( pq pq C p pq C p D
n n n n
+ + +
+ +
1 2
4
1
2
1
2
1
En rsolvant cette quation on obtient :
2
1 2
2
1
1
n n n
n n
C C C
C C
+

+
+
2
1
1
n
n
C
C
+

+
Pour voir comment volue c, on dtermine l'cart
C C C
n n

+1
2
1
2
1
2
1
1
n
n
n
n
n n
C
C
C
C
C
C C C


+

+
A l'quilibre, 0
1 1

+
C C C C C
n n n
On peut crire 0
2
1
0


C
C ( C est la valeur du coefficient de corrlation
gamtique l'quilibre).
58
1 0
2
1

C si seulement et si
C
; donc sous l'homogamie gnotypique positive
totale, la structure gnotypique de la population volue vers un tat d'quilibre
caractris par C = 1.
La structure gnotypique d'quilibre sous ce rgime de reproduction est :
pq q pq C q A A
) C ( pq A A
pq p pq C p A A
+ +

+ +
2 2
2 2
2 1
2 2
1 1
0 1 2
Ainsi, si une population initiale (n = 0) tait panmictique (C
0
= 0) et si l'homogamie
gnotypique positive totale est alors pratique de manire irrversible, terme, la
population ne comprendra que les gnotypes homozygotes. Le tableau V donne la
variation du coefficient de corrlation gamtique au cours des gnrations dans une
telle population et la figure 7 la vitesse d'limination des htrozygotes.
#igure @ : Homogamie total. Vitesse d'limination des htrozygotes
Dans le cas de l'homogamie phnotypique positive total.
Dans le cas de l'homogamie gnotypique positive totale
59
Ta9+eau I$ : Variation du coefficient de corrlation gamtique dans une population
initialement panmictique et soumise une homogamie gnotypique positive totale.
Gnrations 0 1 2 3 4 5 - - - n - - -
C C
0
C
1
C
2
C
3
C
4
C
5
- - - C
n
- - - C
Valeurs de C 0
2
1
4
3
8
7
16
15
32
31
- - - 1 -
n
2
1
- - - 1
III"5 L042)2ga)ie g1.2t-*i/ue *2sitive *artie++e ,e tau( s (HGPP)
On tudie ici une population de structure gnotypique semblable la prcdente
mais en supposant qu'une fraction s se reproduit par homogamie et donc une
fraction (1- s) par panmixie.
En raisonnant comme prcdemment, on peut tablir les rcurrences suivantes pour
les frquences des trois gnotypes :
2 2
2
1
2 1 1
1 1
2
1
1
4
2 1
2
1
4
A A pour q ) (
H
R R
A A pour pq ) (
H
H
A A pour p ) (
H
D D
n
n n
n
n
n
n n
+ +
+
+ +
+
+
+
La composante panmictique de la frquence de chaque gnotype est donne par
1 1
2
1 A A pour p ) (
, 2 1
2 1 A A pour pq ) (
et
2 2
2
1 A A pour q ) (
. Contrairement
au rgime de reproduction prcdent, ici les htrozygotes ne sont pas totalement
limins l'quilibre. En effet, si nous dsignons par H la frquence des
htrozygotes l'quilibre, on aura :
H H H H
n n n

+ 1 1
) ( pq
) (
H
) ( ) ( pq H H o ' d
2
2
1 4
1 1 2
2

Etudions l'cart l'quilibre. Soit H H


n
:
60
) H H ( H H
) ( pq H ) ( pq H H H
) ( pq H ) ( pq H H H
n n
n n
n n


1
]
1

1
1
1
2
1 2
2
1 2
2
1 2
2
1 2
2
l apparat ainsi une rcurrence qu'on peut rsoudre de la manire suivante :
) H H ( H H
) H H ( H H
) H H ( H H
n n
n n

0 1
2 1
1
2
2
2

En multipliant les termes de chaque ct de l'galit, on obtient :


pq
) (
pq
) (
H H
: finalement a on ) ( en valeur sa par H remplaant en
H ) H H ( H o ' d ) H H ( H H
n
n
n
n
n
n


+
1
]
1

,
_

,
_

,
_


2
1 4
2
1 4
2
2
2 2
0
0 0
l existe donc dans le cas de l'homogamie gnotypique positive partielle un tat
d'quilibre pour le quel la frquence des htrozygotes H est diffrente de zro,
mais plus faible que dans une population totalement panmictique (figure 8).
En remarquant que pq ) C ( H 2 1 o C dsigne le coefficient de corrlation
gamtique de la population l'quilibre, on tablit :

+










2
2 2 2
2
1 2
1
2
1 2
1
2
1 4
2 1
C
) (
C
) (
) C (
pq
) (
pq ) C ( H


2
C
La structure gnotypique l'tat d'quilibre d'une population soumise une
homogamie gnotypique positive partielle de taux s est donc :
61
pq q pq C q A A
pq ) ( ) C ( pq A A
pq p pq C p A A

+ +

+ +
2
2
2
1 1 2
2
2 2
2 2
2 1
2 2
1 1
#igure A : Homogamie partielle. Evolution vers l'tat d'quilibre pour diffrents taux
d'homogamie ( ).
Dans le cas de l'homogamie phnotypique positive partielle.
Dans le cas de l'homogamie gnotypique positive partielle
62
E(er6i6e ,e TD :
Dmontrez qu'on peut obtenir encore

2
C
en tablissant la relation de
rcurrence qui lie les coefficients de corrlation gamtique de deux gnrations
successives, puis en calculant la valeur de C qui annule C (c'est--dire C).
III": L042)2ga)ie *41.2t-*i/ue *2sitive t2ta+e
III":"1 Etu,e ,0u. 6as *arti6u+ier
Considrons le mme modle d'un locus autosomal deux allles A
1
et A
2
, avec
cette fois A
1
dominant sur A
2
, dans une population d'organisme diplode. A une
gnration de dpart G
0
, admettons que cette population est compose de 100%
d'htrozygotes A
1
A
2
. Etudions alors l'volution d'une telle population si elle est
soumise systmatiquement une homogamie phnotypique positive.
La structure gnotypique de la population aprs une gnration de reproduction (G
1
)
est :
4
1
2
1
4
1
2 2 2 1 1 1
A A , A A , A A
Au plan phnotypique, la G
1
est compose de
[ ] [ ]
2 1
4
1
4
3
2
1
4
1
A et A ) ( +
. Pour
dterminer les structures gnotypique et phnotypique de la population G
2
, il faut
raliser qu'on a deux types de croisements :
[ ] [ ]
[ ] [ ]
2 2
1 1
2
1
A x A ) (
A x A ) (
C2.tri9uti2. ,e
[ ] [ ]
1 1
A x A
C +a stru6ture ,e
5
Pour savoir l'apport de ce type de croisement G
2
, il est judicieux de dterminer la
composition gamtique dans la sous-population [A
1
] de G1. Pour cela, il faut se
rappeler que dans
[ ]
1
A
de G
1
nous avons
3
1
A
1
A
1
et
3
2
A
1
A
2
; d'o la frquence des
gamtes portant A
1
dans [A
1
] de G
1
est gale (
3
1
+
2
1
x
3
2
) =
3
2
et la frquence
63
des gamtes portant A
2
dans [A
1
] de G
1
est gale
3
1
. La contribution des
croisements [A
1
] X [A
1
] la structure de G
2
s'obtient en faisant :
2 2 2 1 1 1
2
2 1
12
1
3
1
3
1
3
1
3
2
4
3
A A A A A A A A + +
1
1
]
1

,
_

+
C2.tri9uti2. ,e
[ ] [ ]
2 2
A x A
C +a stru6ture ,e
5
Les croisements [A
2
] X [A
2
] donnant 100% de A
2
A
2
, leur contribution G
2
est gale
2 2 2 2
4
1
100
4
1
A xA A A % x
.
En dfinitive, en faisant le bilan des deux apports, les structures gnotypique et
phnotypique de la population G
2
seront :
[ ] [ ]
2 1
2 2 2 2 2 1 1 1
3
1
3
2
3
1
4
1
12
1
3
1
3
1
A et A soit
A A A A , A A , A A

,
_

+
Pour passer de G
2
G
3
on tient le mme raisonnement et on montre ainsi que G
3
est
compose de
[ ] [ ]
2 1 2 2 2 1 1 1
8
3
8
5
8
3
4
1
8
3
A et A soit , A A et A A , A A
.
Dans ce cas particulier, si nous dsignons par H
n
la frquence des htrozygotes
une gnration quelconque G
n
, nous aurons la relation de rcurrence
1
1
+

n
H
n
Comme l'homogamie gnotypique positive totale, l'homogamie phnotypique positive
totale conduit inluctablement l'limination des htrozygotes mais avec une
vitesse beaucoup plus lente (fig.7)
Dans l'exemple du cas particulier que nous venons de considrer dans ces deux
modes de croisement, G
10
(n = 10), nous aurons, dans le premier cas,
1024
1
2
1
10 10
H
, et dans le deuxime,
11
1
1 10
1
10

+
H
III":"5 Etu,e ,u 6as g1.1ra+ ave6 62e33i6ie.t ,e 62rr1+ati2. ga)1ti/ue
Considrons une population diplode ayant initialement ( G
0
) une structure
totalement panmictique p
2
A
1
A
1
, 2pqA
1
A
2
et q
2
A
2
A
2
. En admettant A
1
dominant sur A
2
,
la structure phnotypique panmictique de cette population est :
[A
1
] = p
2
+ 2pq = p (1+q)
64
[A
2
] = q
2
Si partir de G
0
cette population est soumise systmatiquement une homogamie
phnotypique positive totale, sa structure gnotypique et phnotypique une
gnration quelconque (G
n
) sera :
[ ]
} [ ] pq C q A pq C q A A
pq ) C ( pq C p A
pq ) C ( A A
pq C p A A
n n
n n
n
n
+ +
+ +


+
2
2
2
2 2
2
1
2 1
2
1 1
2 1
2 1
Avec p et q reprsentant les frquences de A
1
et A
2
respectivement, et C
n
le
coefficient de corrlation gamtique de la population G
n
. on peut simplifier la
frquence du phnotype dominant [A
1
] et obtenir :
[A
1
] = p
2
+ C
n
pq + (1-C
n
) 2pq = p
2
-C
n
pq + 2pq =
= p[p + 2q - C
n
q]
= p[1 + q - C
n
q]
= p[1 + q (1 - C
n
)]
FA
1
G E *F1 D />1 " C
.
;G
Pour dterminer la structure gnotypique de la population G
n+1
, il faut dterminer
l'apport des croisements [A
1
] X [A
1
] d'une part, et celui des croisements [A
2
] X [A
2
]
d'autre part.
C2.tri9uti2. ,es 6r2ise)e.ts FA
1
G & FA
1
G C +a stru6ture ,e
.D1
Dans [A
1
] de G
n
, les frquences gnotypiques sont :
[ ]
[ ] ) C ( q
) C ( q
) C ( q p
pq ) C (
A A
) C ( q
q C p
) C ( q p
pq C p
A A
n
n
n
n
n
n
n
n
+

+
+

+
+

1 1
1 2
1 1
2 1
1 1 1 1
2 1
2
1 1
Si nous dsignons par p' et q' les frquences des gamtes portant A
1
et des gamtes
portant A
2
respectivement dans la sous-population [A
1
] de G
n
, nous aurons :
65
( )
) C ( q
) C ( q
' q
) C ( q
) C ( q
' q
) C ( q
' p
) C ( q
q C q q C p
) C ( q
C q
) C ( q
q C p
' p
n
n
n
n
n n
n n
n
n
n
n
+


1
]
1

+

+
+ +

1
]
1

+
+
+

1 1
1
1 1
1 2
2
1
1 1
1
1 1 1 1
1 2
2
1
1 1
La contribution des croisements [A
1
] X [A
1
] dans la structure gnotypique finale de
G
n+1
est donc :
[ ] [ ]
[ ] [ ]
[ ] [ ]
[ ]

+
1
]
1

,
_

,
_

+
1
]
1

+

) C ( q
) C ( q p
A A
) C ( q p
) C ( q
) C ( q
A ' q A A
) C ( q
) C ( pq
A A
) C ( q p
) C ( q
) C ( q
) C ( q
A ' q ' p A A
) C ( q
p
A A
) C ( q p
) C ( q
A ' p A A
n
n
n
n
n
n
n
n
n
n
n
n
n
n
1 1
1
1 1
1 1
1
1 1
1 2
1 1
1 1
1
1 1
1
2 2
1 1
1 1
1 1
1
2
2 2
2
1
2
2 2
2 1
1 2 1
1 1
2
1
2
1 1
C2.tri9uti2. ,es 6r2ise)e.ts FA
5
G & FA
5
G C +a stru6ture ,e
.D1
Ces croisements donnant 100% de gnotypes A
2
A
2
, leur contribution G
n+1
est
[q
2
+ C
n
pq] x 100% = (q
2
+ C
n
pq) A
2
A
2
En faisant le bilan des contributions des deux types de croisements, la structure
gnotypique de la population G
n+1
est :
[ ]
[ ]
[ ]
2
2
2
2 2 1
2 1
1 1
1 1
1
1 1
1 2
1 1
A pq C q
) C ( q
) C ( q p
A A ; A
) C ( q
) C ( pq
A A
) C ( q
p
A A
n
n
n
n
n
n

+ +
+

66
Pour suivre l'volution de la structure gnotypique de la population sous
l'homogamie phnotypique positive totale avec coefficient de corrlation gamtique, il
suffit d'tablir une relation de rcurrence entre les coefficients de corrlation
gamtique de deux gnrations successives. Pour cela, considrons par exemple le
gnotype htrozygote A
1
A
2
; G
n+1
, sa frquence peut s'crire :
) C ( q
p C q
C
) C ( q
) q ( C q
) C ( q
C qC q
) C ( q
C
C
) C ( q
) C ( pq
pq ) C ( A A
n
n
n
n
n
n
n n
n
n
n
n
n
n
+
+

+
+

+
+ +


+
+
+
1 1 1 1
1
1 1
1 1
1 1
1
1
1 1
1 2
2 1
1
1
1 2 1
Pour dterminer la valeur de c l'quilibre, calculons C .
) C ( q
) C ( q
C
) C ( q
) C C ( q
) C ( q
qC qC q
) C ( q
qC qC ) p ( C q
) C ( q
qC qC C p C q
C
C
) C ( q
p C q
C C C
n
n
n
n
n
n
n
n
n
n
n n
n
n
n n n
n
n
n
n n
+


+
+

+
+ +

+
+ +

+
+ +

+
+

+
1 1
1
1 1
2 1
1 1
2
1 1
1
1 1
1 1
2 2
2
2
2
1
A l'quilibre,
0
1 1

+
C C C C C
n n n
( C est la valeur du coefficient de
corrlation gamtique l'quilibre).
0
1 1
1
0
2


) C ( q
) C ( q
C
; le numrateur de C s'annule pour 1 C .
La structure gnotypique de la population l'tat d'quilibre sera donc :
pq q pq C q A A
pq ) C ( A A
pq p pq C p A A
+ +

+ +
2 2
2 2
2 1
2 2
1 1
0 2 1
67
!termination de la "ruence des htro#ygotes $ une gnration donne
sous lhomogamie phnotypiue positi%e totale
Cela revient dterminer H
n
; or nous avions dj tabli que :
p H H
p H H
p H H
: que crire pouvons nous que mme de
;
p H H
) C ( pq
) C ( q
) C ( pq H
) C ( pq
) C ( q
H
: crire donc peut On
) C ( q
) C ( pq
pq ) C ( H
n n
n n
n n
n
n
n n
n
n
n
n
n
n n
2
1 1 1
2
1 1 1
2
1 1 1
2
1 1 1
1 2
1
1 2
1 1
1 2
1 1 1
1 1
1 2
2 1
0 1
2 1
1
1
1
1
1 1
+
+
+
+

+
+
+
+ +

Pour rsoudre cette rcurrence, on additionne les termes de chaque ct de l'galit


et on obtient :
0
0
0
0 1
2
2
2
1 1
2
1 1 1
nH p
pH
H
p
n
H H
Donc
p
n
H H
n
n
n
+
+
+
+
+

(Fig. 7)
E(er6i6e ,e TD :
Soit une population initialement panmictique avec deux allles A
1
et A
2
un locus
autosomal, ayant les frquences respectives p = 0,7 et q = 0,3. Quelle est la
frquence des htrozygotes dans cette population aprs 10 gnrations de
reproduction par homogamie phnotypique positive totale ?
68
III"< L042)2ga)ie *41.2t-*i/ue *2sitive *artie++e ,e tau( H
Si nous gardons le mme modle gntique que dans le cas prcdent, une
gnration quelconque (G
n
), la structure gnotypique d'une population soumise
une homogamie phnotypique positive partielle de taux s sera :
pq C q A A
pq ) C ( A A
pq C p A A
n
n
n
+

+
2
2 2
2 1
2
1 1
2 1
A la gnration suivante (G
n+1
) la structure gnotypique de la population sera la
suivante :
[ ] [ ]
[ ] [ ]
[ ] [ ]
2 2
1
2
2 2
1 2 1
2
1
2
1 1
1
2 1 2
1
q ) ( ) pq C q ( A ' q A A
pq ) ( A ' q ' p A A
p ) ( A ' p A A
n
+ + +
+
+
Pour tudier la variation du coefficient de corrlation gamtique en vue de dterminer
la structure gnotypique de la population l'quilibre, raisonnons partir du
gnotype htrozygote de G
n+1
.
Nous savons qu' G
n+1
, la frquence de A
1
A
2
est aussi gale (1 - C
n+1
)2pq d'o :
[ ] [ ] pq ) ( A ' q ' p pq ) C (
n
2 1 2 2 1
1 1
+
+
En remplaant p', q' et [A
1
] par leurs valeurs (voir paragraphe prcdent), on obtient :
69
[ ]
[ ]
) C ( q
) p C q (
C
) C ( q
q ) q ( C
) C ( q
C qC q
) C ( q
C ) C ( q
C
) C ( q
) C (
C
pq ) (
) C ( q
) C ( pq
pq ) C (
pq ) ( ) C ( q p
) C ( q
) C ( q
) C ( q
pq ) C (
n
n
n
n
n
n
n n
n
n n
n
n
n
n
n
n
n
n
n
n
n
n
+
+

+
+

+
+ +

+
+ +

+
+


+
+


+ +
1
]
1

+

+
+
+
+
+
1 1 1 1
1
1 1
1 1
1 1
1
1 1
1
1
2 1
1 1
1 2
2 1
2 1 1 1
1 1
1
1 1
1
2 2 1
1
1
1
1
1
On remarque que la relation de rcurrence de C est la mme que pour l'homogamie
phnotypique positive totale, multiplie par le taux s d'homogamie de la population.
Etablissons alors la variation de ce coefficient :
) 1 ( 1
) 1 (
) 1 ( 1
) 1 ( 1
) (
2 2
1
n
n n
n
n n n n
n
n
n
n n
C q
q C q p qC
C
C q
p C q qC q C C
C
C
C q
p C q
C C C
+
+ +

+
+ + +

+
+

+

Le dnominateur de C tant ici toujours positif, son signe dpend de celui du


numrateur.
Pour C
n
= 0, le numrateur est gal sq, donc positif.
Pour C
n
= 1, le numrateur est gal s-1, donc ngatif.
l existe alors une valeur de C
n
qui annule C , et qui correspond une valeur
d'quilibre pour la population. Cette valeur d'quilibre C du coefficient de corrlation
gamtique sera fournie par la racine comprise entre 0 et 1 de l'quation du second
degr en C :
0 1
2
+ + q C ) q q ( C q
A l'quilibre, les frquences de chaque gnotype seront :
70
pq C q A A
pq ) C ( A A
pq C p A A
+

+
2
2 2
2 1
2
1 1
2 1
L'homogamie phnotypique positive partielle n'est donc pas un obstacle au maintien
du polymorphisme dans les populations (fig. 8).
I$" LE MODELE DE L0ENDOAMIE OU CONSANUINITE
I$"1 P2siti2. ,u *r29+7)e
Une union est dite endogame ou encore consanguine lorsque les anctres sont
communs aux deux conjoints. La notion de consanguinit est donc une notion
relative. Elle se rfre l'existence d'anctres communs dans les quelques
gnrations prcdentes.
Nous verrons que l'influence des anctres communs loigns est ngligeable.
La consanguinit peut tre une consquence automatique de la faiblesse de l'effectif
d'une population.
Elle peut tre lie aussi au faible pouvoir de dplacement des individus
(consanguinit de position chez les escargots). Elle est rgulire dans certaines
espces (espces autofcondes chez les plantes). Elle est vite ou au contraire
recherche pour des raisons religieuses ou conomiques dans l'espce humaine.
I$"5 C2e33i6ie.t ,e 62.sa.gui.it1 i.,ivi,ue+ 3 2u 62e33i6ie.t ,e *are.t1.
Le fait qu'un individu soit issu d'une union consanguine a pour consquence que
les deux gnes allles qu'il porte un locus peuvent tre les copies d'un mme gne
prsent chez un anctre commun, copies qui lui ont t transmises l'une par son
pre, l'autre par sa mre. On dit alors que ces deux allles sont "identiques par
hrdit".
Tout individu issu d'une union consanguine peut tre caractris par un coefficient
de consanguinit individuel (f

) qui est gal la probabilit que deux de ses gnes


allles soient identiques par hrdit.
Autrement dit, ce coefficient est gal la proportion de ses locus o il possde deux
allles identiques par hrdit.
Deux individus P et M sont dits apparents si et seulement s'ils ont au moins un
anctre commun.
71
Un individu consanguin est donc un individu qui est n d'une union entre apparents.
La probabilit que 2 individus apparents aient 2 gnes identiques par hrdit (plus
prcisment lorsqu'on en tire au hasard un chez chacun) est appel coefficient de
parent de ces 2 individus. Ce coefficient a t dfini pour la premire fois par
MALECOT en 1948. Le coefficient de parent de deux individus P et M est not 4
PM.
Si P et M sont les parents directs de , alors

4
PM
= f

.
Esti)ati2. ,e 3
I
Considrons la gnalogie suivante :
est issu d'une union consanguine puisque ses parents P et M ont un anctre
commun A. Soient e
1
et e
2
les deux allles de un locus quelconque, a
1
et a
2
les
deux allles de A ce mme locus. Quelle est la probabilit que e
1
et e
2
proviennent
de A ?
Soit e
1
l'allle transmis par P. l y a une chance sur 2 qu'il provienne de C, 1 sur 4
de B et 1 sur 8 de A. De mme il y a une chance sur 2 que e
2
transmis par M
provienne de D et 1 sur 4 qu'il provienne de A.
La probabilit que e
1
et e
2
proviennent de A est donc
5
2
1
32
1
4
1
8
1

,
_

. Plus
gnralement, elle est gale
n

,
_

2
1
, 'n' tant le nombre de maillons de la chane qui
relie P M en passant par A.
72
Ceci tant, quelle est la probabilit que e
1
et e
2
soient identiques par hrdit ? ou
bien e
1
et e
2
sont l'un et l'autre des copies de a
1
(probabilit =
2
1
), ils sont forcment
identiques (probabilit = 1).
Ou bien l'un est une copie de a
1
, l'autre de a
2
(probabilit =
2
1
). La probabilit qu'ils
soient identiques par hrdit est par dfinition f
A
, coefficient de consanguinit
individuel de A.
La probabilit, si e
1
et e
2
provenant de A, soient identiques par hrdit est donc :
( )
A A
f f + + 1
2
1
2
1
1
2
1
En dfinitive, il faut que les 2 allles homologues d'un locus que a reus de P et M
proviennent d'abord de A (probabilit =
n

,
_

2
1
) et qu'ils soient en plus identiques
(probabilit =
( )
A
f + 1
2
1
) pour estimer le coefficient de consanguinit individuel de .
Finalement : ( )
A
n

f f +

,
_

1
2
1
2
1
Si A n'est pas issu d'une union consanguine, alors
0
A
f
. On a alors
1
2
1
+

,
_

f .
Si P et M ont plusieurs anctres communs, f

est la somme des termes


correspondant chaque anctre :
( )
i
i
A
N i
i
n

f f +

,
_

1
2
1
2
1
1
Re)ar/ues : >i)*2rta.t;
1- Si on a plusieurs voies P-A-M par lesquelles P et M ont pu recevoir 2 gnes
identiques de A, il faut en tenir compte dans le calcul de f
.
On appelle chane de parent la voie P-A-M par laquelle deux gnes identiques de A
sont transmis P et M.
2- Une chane de parent relie toujours les 2 parents de en passant par l'anctre
commun.
3- Une chane de parent change une seule fois de direction dans l'chelle des
temps au niveau de l'anctre commun.
4- Une chane de parent ne peut pas passer deux fois par le mme individu.
73
5- Deux chanes de parent sont diffrentes ds qu'elles ont au moins un maillon
diffrent.
E(e)*+e 1 :
Calcul du coefficient de consanguinit individuel d'un enfant de simples cousins
germains.
2 des 4 grands parents de appartenant la mme fratrie, P et M sont cousins
germains.
Les anctres communs P et M sont A et B.
Nous aurons donc :
( )
B / A / A
i
i
n

f f f f
i
i
+ +

,
_

1
2
1
2
1
2
1
f
/A
: on a une seule chane de parent qui est P-C-A-D-M =>
( )
A A /
f f +

,
_

1
2
1
2
1
4
; en admettant que A n'est pas consanguin, on a
0
A
f

d'o
32
1
2
1
5

,
_

A /
f
f
/B
: On a une seule chane de parent qui est P-C-B-D-M =>
( )
B B /
f f +

,
_

1
2
1
2
1
4
; en admettant que B n'est pas consanguin, on a
0
B
f
d'o
32
1
2
1
5

,
_

B /
f
74
Finalement,
16
1
32
1
2 +
B / A /
f f f

Conclusion : 1 locus sur 16 pris au hasard sera identique par hrdit
E(e)*+e 5 :
Calcul du coefficient de consanguinit individuel d'un enfant issu d'une famille
reprsente par la gnalogie suivante :
Les anctres communs de P et M sont E, F et G
( )
G / F / E / A
i
i
n

f f f f f
i
i
+ + +

,
_

1
2
1
2
1
3
1
f
/E
: On a 2 chanes de parent qui sont P-H-F-E-G-J-M et P-H-G-E-F-J-M
( )
E E /
f f +

,
_

1
2
1
2
1
2
6
E tant consanguin,
( ) ( )
4
1
2
1
2 0 0 1
2
1
2
1
1
2
1
2
1
0
3 2 2

,
_

,
_

+ +

,
_

+
E B A B A B / E A / E E E
f f et f ; f f f f f f
256
5
2
1
5
2
1
5
2
1
4
1
1
2
1
2
1
2
8 2 6 6

,
_

,
_

,
_

,
_

,
_


E / E /
f f
f
/F
: On a une seule chane de parent qui est P-H-F-J-M.
75
( )
32
1
2
1
0 1
2
1
2
1
5 4

,
_

,
_

F / F F F /
f f ; f f
f
/G
: on a une seule chane de parent qui est P-H-G-J-M :
( )
32
1
2
1
0 1
2
1
2
1
5 4

,
_

,
_

G / G G G /
f f ; f f
Finalement,
082 0
256
21
32
1
32
1
256
5
, f f f f f
G / F / E /
+ + + +
E&ERCICE DE TD :
Calculez le coefficient de consanguinit individuel d'un enfant dont les parents P et
M sont double cousins germains.
I$": D1ter)i.ati2. ,es 3r1/ue.6es g1.2t-*i/ues ,a.s +a ,es6e.,a.6e ,0u.
6r2ise)e.t 62.sa.gui.
Considrons dans une certaine population d'organisme diplode un locus autosomal
deux allles e
1
et e
2
dont les frquences sont p et q respectivement (p + q = 1)
Soit f

le coefficient de consanguinit de tout individu issu d'une union consanguine


quelconque dans cette population. Si nous considrons la descendance de l'un de
ces croisements consanguins, quelle y sera la distribution des 3 gnotypes e
1
e
1
, e
1
e
2
et e
2
e
2
?
Pre.2.s *ar e(e)*+e +e g1.2t-*e e
1
e
1
:
Sa formation peut se faire de deux manires qui s'excluent mutuellement :
1) Ou bien les 2 gamtes qui ont fusionn pour donner ce gnotype portent
des gnes identiques au mme locus (probabilit = f

), dans ce cas un seul tirage de


gamte suffit (probabilit = p). La probabilit d'avoir e
1
e
1
par cette ventualit est fxp.
2) Ou bien les 2 gamtes qui ont fusionn pour donner e
1
e
1
portent des gnes
non identiques au mme locus (probabilit = 1 - f

), dans ce cas deux tirages de


gamtes sont ncessaires (probabilit = p
2
). La probabilit d'avoir ce gnotype par
cette deuxime ventualit est gale (1 - f

)p
2
.
76
Finalement, la frquence de e
1
e
1
dans la descendance de l'union consanguine
considre est : e
1
e
1
= p
2
(1 - f

) + f

p = p
2
+ f

pq.
Un raisonnement analogue nous permet de dterminer les frquences des deux
autres gnotypes :
e
1
e
2
= (1 - f

)2pq
e2e2 = q
2
(1 - f

) + f

q = q
2
+ f

pq
I$"< L0i.,i6e ,e 3i(ati2.
En gardant le mme modle gntique d'un locus autosomal 2 allles e
1
et e
2
,
appelons H la frquence relle des htrozygotes e
1
e
2
dans la population. Si pour ce
locus les croisements se font au hasard dans la population, la frquence des
gnotypes htrozygotes devrait tre 2pq selon la loi de HARDY-WENBERG, mais
pour gnraliser, nous appellerons H
t
l'htrozygotie obtenue pour les croisements
au hasard. On dfinit l'indice de fixation ou coefficient de consanguinit de la
population par la relation
t
t
H
H H
F

En termes biologiques, F mesure la diminution de l'htrozygotie par rapport une


population de mmes frquences allliques o les croisements se font au hasard.
Comme H
t
= 2pq, la frquence relle des gnotypes htrozygotes dans la
population consanguine peut s'exprimer en fonction de F soit :
H E H
t
" H
t
# E H
t
>1 " #; E 5*/>1 " #;.
On peut aussi dterminer les frquences des gnotypes homozygotes e
1
e
1
et e
2
e
2
en
fonction de F. Supposons que la frquence relle du gnotype e
1
e
1
soit D. Comme la
frquence de e
1
= p, nous devons avoir
H D p
2
1
+
. Or H = (1 F)2pq, donc
( ) [ ] Fpq p Fpq ) q ( p Fpq pq p pq F p D + + +
2
1 2 1
2
1

De mme, si nous dsignons par R la frquence relle de e
2
e
2
, nous obtenons :
R = q
2
+ Fpq
77
Ainsi, on peut exprimer la structure gnotypique d'une population consanguine en
fonction des frquences allliques et du coefficient de consanguinit F de la
population :
Fpq q e e
pq ) F ( e e
Fpq p e e
+

+
2
2 2
2 1
2
1 1
2 1
La structure gnotypique de la population ainsi dfinie est appele structure de
Wright. Quelle que soit la structure gnotypique d'une population, elle peut toujours
se mettre sous cette forme :
(1 - F)(p
2
+ 2pq + q
2
) + F(p+q)
Si dans une population donne on admet que la consanguinit est le seul facteur qui
induit l'cart par rapport la structure de HARDY-WENBERG, alors

i
i i
f Y F
;
Y
i
= frquence des individus de la population ayant un coefficient de consanguinit
individuelles f
i
.
I$"= Les e33ets ,e +a 62.sa.gui.it1
L'effet principal de la consanguinit est la diminution de l'htrozygotie au profit de
l'homozygotie. Dans les populations totalement consanguines, l'htrozygotie est
trs faible, voire nulle. C'est ce qu'on observe dans les populations d'espces
autogames strictes ou dans les populations issues de croisements frre-sour sur de
nombreuses gnrations.
Nous savons que tous les pools gniques contiennent des allles rcessifs ltaux ou
semi-ltaux.
L'augmentation de l'homozygotie due la consanguinit doit s'accompagner d'une
augmentation de la ltalit prinatale ainsi que d'une augmentation de la frquence
d'individus peu viables et/ou porteurs de tares plus ou moins graves. C'est ce qu'on
observe gnralement dans les populations humaines et dans les populations
vgtales allofcondes soumises la consanguinit.
Pour les populations humaines, on dispose de deux mthodes pour apprcier les
effets de la consanguinit :
1) On recense les couples consanguins, on dtermine la frquence des "tars"
parmi leurs descendants puis on la compare la frquence observe parmi les
78
descendants d'un lot tmoin de couples non consanguins. Le meilleur tmoin est
constitu par les descendants des frres et sours des couples consanguins qui n'ont
pas eux-mmes contract d'union consanguine et qui sont rests dans les mmes
conditions de milieu.
2) L'autre mthode consiste recenser les individus tars et dterminer la
proportion de ceux qui sont issus d'une union consanguine ; cette proportion est
ensuite compare celle observe dans l'ensemble de la population. L encore se
pose le problme du choix judicieux de l'chantillon tmoin.
C'est trs probablement cette augmentation de la frquence d'apparition des tares
causes par des gnes rcessifs qui est responsable du tabou qui frappe les unions
les plus consanguins dans la plupart des socits humaines.
Re)ar/ue :
Dans la mesure o la valeur slective de l'htrozygote est suprieure celle des
homozygotes (cf. chapitre 4), un facteur comme la consanguinit qui tend diminuer
le taux d'htrozygotie est dfavorable.
I$"? Les )2,es ,e 6r2ise)e.ts s-st1)ati/ues
Quand on lve des animaux ou qu'on cultive des plantes, il est souvent intressant
de connatre la rapidit avec laquelle le coefficient de consanguinit s'accrot quand
on maintient une ligne avec un mode de croisement systmatique comme
l'autofcondation (homogamie gnotypique positive totale) rpte, les croisements
frre-sour ou les rtrocroisements (back-cross) avec des souches standard. Dans le
cas de l'autofcondation, on peut calculer le coefficient de consanguinit de la
population la gnration n(F
n
) par la relation : ( )
1
1
1
2
1

,
_

n n
F F puisqu'on a un
seul maillon et un seul individu dans ce maillon.
En faisant apparatre le terme 1 - F
n
ou indice panmictique, on obtient :
79
( )
( )
( )
( )
( )
( )
0 1
3 2
2 1
1
1
1
1
1
1
2
1
1
1
2
1
1
1
2
1
1
1
2
1
1
1
2
1
2
1
2
1
2
1
2
1
1
1
2
1
1 1
F F
F F
F F
, mme de ; F F
F
F
F
F F
n n
n n
n n
n
n
n
n n







+

,
_

En multipliant les termes de chaque ct de l'galit on obtient :


( ) ( )
0 0
1
2
1
1 1
2
1
1 F F F F
n
n
n
n

,
_

,
_


#
I
est le coefficient de consanguinit de la population la gnration initiale.
E(e)*+e :
Quand F
0
= 0 (cas d'une population initiale compose de 100% d'htrozygotes), on
aura :

16
15
8
7
4
3
2
1
4
3
2
1

F
F
F
F
Beaucoup de plantes parmi lesquelles des plantes cultives comme le soja, la
tomate, le sorgho, l'aubergine, le riz, le bl. se reproduisent par autofcondation
prdominante. Chez ces plantes, chaque individu est donc hautement homozygote.
On peut donc dire que les espces de plantes autofcondes sont constitues par la
juxtaposition de lignes homozygotes gntiquement distinctes les unes des autres
puisque les allles se fixent ou se perdent au hasard.
80
l est trs important de faire remarquer que mme si l'autofcondation est
prdominante chez ces espces, celle-ci s'accompagne d'un certain taux de
reproduction croise qui assure un flux d'changes gntiques ainsi que le maintien
d'un certain niveau d'htrozygotie rsiduelle.
Chez le riz et la tomate, le taux d'allofcondation est de 0,03 ; il est de 0,1 chez le bl
et le haricot et de 0,3 chez le tabac et le colza.
l faut noter, pour terminer avec ce paragraphe, que les croisements frre-sour
conduisent l'homozygotie moins rapidement que l'autofcondation. Par exemple la
frquence des htrozygotes la gnration n(H
n
) est, dans le cas des croisements
frre-sour, gale :
2 1
4
1
2
1

+
n n n
H H H
;
Au lieu de
1
2
1

n n
H H
pour l'autofcondation.
La figure 9 prsente quelques exemples d'augmentation thorique du coefficient de
consanguinit pour les croisements systmatiques.
#igure B : Augmentation thorique du coefficient de consanguinit F pour des modes
systmatique de croisement : autofcondation, croisements frre-sour, croisements
demi-frre-sour et rtrocroisements rpts
81

Vous aimerez peut-être aussi