INTRODUCTION

Racine Samba Sow
 Variations des caractères discrètes ou continues
: couleur, cornes, groupes sanguins.
 Nature discontinue des facteurs mendéliens
s’accorde bien avec la nature discrète de
l’expression de tels caractères.
 Relation simple entre le phénotype (ce que l’on
observe) et le génotype (ce qui nous intéresse).
 Variations observables chez des
organismes vivants très souvent
continues.
 Individus d’une population répartis de
façon continue : taille, poids, Q lait
etc…
 L’interprétation génétique de la
variation de ces caractères apparaît de
prime abord plus compliquée que dans
 on est souvent incapable de
déceler des gènes en ségrégation
responsables de la variation
observée, et on ne peut pas
associer sans ambiguïté un
phénotype donné à un génotype
particulier.
 Les variations observables chez des organismes
vivants sont très souvent continues dans une
certaine gamme de valeurs.
 L’interprétation génétique de la variation de
ces caractères apparaît plus compliquée que
dans le cas précédent : on est souvent incapable
de déceler des gènes en ségrégation
responsables de la variation observée, et on ne
peut pas associer sans ambiguïté un phénotype
donné à un génotype particulier.
 Ceci ne signifie pas que l’hérédité des
caractères à variation continue repose sur des
fondements différents de ceux concernant les
gènes bien individualisés.
 Objet de la génétique quantitative : rendre
compte de l’hérédité de ce type de caractère
(un caractère quantitatif est un caractère dont
l’observation passe par une mesure).
 Branche de la génétique née dans la
controverse au sujet de l’hérédité des caractères
quantitatifs et des principes régissant leur
évolution.
 Début du XXème siècle, a opposé les «
mutationnistes » et les « biométriciens ».
 Les premiers, dont le plus fameux fut William
Bateson, considéraient que les lois de Mendel
ne s’appliquaient pas aux caractères à variation
continue : ils étaient amenés à remettre en
cause la théorie de Darwin (1859) selon laquelle
les caractères quantitatifs avaient subi une
évolution graduelle sous l’action de la sélection
naturelle.
 Les seconds, emmenés par le statisticien Karl
Pearson, soutenaient la théorie de Darwin et
appréhendaient l’hérédité des caractères
quantitatifs à travers l’analyse statistique des
liaisons existant entre les valeurs mesurées
chez des individus apparentés, mais sans
pouvoir cependant interpréter leurs résultats à
la lumière des lois de Mendel.
 Chez le haricot, le croisement de variétés à
fleurs blanches et à fleurs rouges donnait «
toute une série de couleurs, du pourpre au
violet pâle et blanc » .
 Mendel explique ce phénomène en considérant
que la couleur de la fleur du haricot est un
mélange de caractères élémentaires, la
transmission de chacun suivant les mêmes
règles que celles mises en évidence chez le pois.
 Suggérant ainsi ce qu’aujourd’hui nous
décrivons comme l’intervention de plusieurs
locus pour rendre compte de la variation
continue de certains caractères.
 Plus tard, des sélectionneurs de plantes comme
l’Américain East (1903) ou le Suédois Nielson
Ehle (1908) firent des expériences étayant cette
hypothèse multifactorielle.
 C’est en 1918 que le statisticien anglais Ronald
Fisher propose un modèle de synthèse, rendant
à la fois compte des lois de Mendel et des
relations biométriques entre apparentés.
 Ce modèle a fait l’objet de développements
ultérieurs, mais reste le fondement actuel de la
génétique quantitative.
 Applications de la génétique quantitative :
épidémiologie génétique (chez l’homme) ,
l’amélioration des plantes et des animaux
domestiques et la compréhension de certains
mécanismes de l’évolution
 Nul doute que l’homme a depuis des temps
très anciens, voire dès les débuts de la
domestication, mis en œuvre des procédures
de sélection des espèces qu’il exploitait.
 Une référence fort respectable nous est donnée
par la Bible, où l’on peut découvrir le procédé
imaginé par Jacob, alors gardien des brebis de
son beau-père Laban, afin de conserver pour
lui-même les descendants des brebis les plus
robustes et de ne laisser à Laban que la
progéniture des brebis chétives (Genèse,
chapitre 30, versets 32 à 43).
 Remontant moins loin dans le temps, on peut
constater qu’aux siècles derniers, des
procédures empiriques de sélection avaient
déjà permis d’individualiser des variétés ou
des races améliorées :
 A titre d’exemple, la mise en place de la
sélection généalogique chez la betterave par le
français Vilmorin au milieu du XIXème siècle, ou
la création de la race bovine Longhorn et de la
race ovine Dishley par l’anglais Robert
Bakewell au milieu du XVIIIème siècle.
 Amélioration des espèces domestiques a
largement bénéficié de l’essor de la génétique
quantitative, en même temps que du
développement des expérimentations et de
l’usage des statistiques.
 En effet, dans de très nombreuses espèces, les
progrès génétiques se sont fortement accélérés
dès lors que des méthodes rationnelles ont pu
être généralisées dans le cadre de programmes
intégrés (entre les deux guerres pour les
plantes, à partir du lendemain de la seconde
guerre mondiale pour les animaux).
 A ce titre, il faut souligner la contribution majeure
de certains généticiens ou statisticiens, dont
Kempthorne (USA), Lush (USA), Robertson
(Ecosse) et Henderson (USA) ;
 Ont, sur les fondements de la génétique
quantitative, développé à partir du milieu du
20ieme siècle des méthodologies aujourd’hui
largement utilisées, tant en ce qui concerne
l’estimation de certains paramètres génétiques,
l’évaluation des reproducteurs et leur utilisation,
que l’optimisation des procédures de sélection.
 Il est cependant indéniable que l’amélioration
des espèces domestiques a largement bénéficié
de l’essor de la génétique quantitative, en
même temps que du développement des
expérimentations et de l’usage des statistiques.
 En effet, dans de très nombreuses espèces, les
progrès génétiques se sont fortement accélérés
dès lors que des méthodes rationnelles ont pu
être généralisées dans le cadre de programmes
intégrés (entre les deux guerres pour les
plantes, à partir du lendemain de la seconde
guerre mondiale pour les animaux).
 A ce titre, il faut souligner la contribution
majeure de certains généticiens ou statisticiens,
dont Kempthorne (USA), Lush (USA),
Robertson (Ecosse) et Henderson (USA), qui
ont, sur les fondements de la génétique
quantitative, développé à partir du milieu du
20ième siècle des méthodologies aujourd’hui
largement utilisées, tant en ce qui concerne
l’estimation de certains paramètres génétiques,
l’évaluation des reproducteurs et leur
utilisation, que l’optimisation des procédures
de sélection.
 Notion de population recouvre un concept
difficilement réductible à une définition unique.
Au sens de la génétique, une population
représente une entité de reproduction au sein
d’une espèce.
 Définition néanmoins vague ; ne précise ni le type
de reproduction, ni le critère permettant d’affecter
un individu à une entité plutôt qu’à une autre.
 Nous considérons la population comme un
ensemble d’individus possédant certaines
caractéristiques communes :
 il peut s’agir des pieds de maïs d’une parcelle,
d’une colonie d’insectes dans une forêt, des
habitants de la commune de Saint Louis
(Sénégal) ou de la République Populaire de
Chine (1,25 milliard d’habitants), etc.
 Pour décrire la variabilité au sein d’une
population, une première solution consiste à
fournir le résultat brut de la collecte de
données, c’est-à-dire la liste des valeurs
numériques mesurées sur tous les individus
pour les différents caractères observés.
 Le volume des données peut être extrêmement
important et ne permet pas d’appréhender
correctement la situation générale de la
population. Aussi, a-t-on recours aux
statistiques, dont un des rôles est de synthétiser
l’information.
 1. La distribution
 Une représentation graphique permet de
rendre compte de la manière dont les valeurs
numériques se répartissent dans la gamme de
variation observée : c’est la distribution. Il
s’agit d’un graphe où en abscisse se trouvent
les valeurs numériques et en ordonnée la
fréquence (ou le nombre) des individus que
l’on trouve avec une valeur donnée ou dans un
intervalle donné.
 La figure 1 représente la distribution de la taille de
mille étudiants de l’université de Harvard. On voit
que l’allure de la distribution change selon la
précision avec laquelle a été faite la mesure, ou, ce
qui revient au même, la largeur des classes que
l’on constitue pour réaliser le graphe. Si le pas de
classe adopté est de 10 cm, les étudiants se
répartissent en cinq classes (Figure 1.a). Si l’on
peut mesurer à 1 cm près, les classes se subdivisent
(Figure 1.b). Si l’on poursuit le processus, en
affinant les mesures et en supposant que l’on peut
mesurer un très grand nombre d’individus, on
tend vers une distribution continue (Figure 1.c).
 La figure 1 nous indique également que la
distribution de la taille, dans la population
observée, se rapproche, dans sa forme, de la
courbe « en cloche » caractéristique de la loi
normale (voir Stat).
 Les caractères quantitatifs présentent une
variation continue. La figure 2 montre quelques
exemples de variation observée pour des
caractères d’importance agronomique ou
zootechnique.
 Même lorsque le caractère mesuré est par
nature discontinu, car représentant la somme
d’un nombre d’objets distincts (nombre de
grains sur un épi de maïs, nombre de soies
abdominales chez la drosophile, nombre de
jeunes dans une portée de truie, etc.), le
nombre de classes observées peut être élevé, et
l’on considère la variation de ce type de
caractère comme continue (voir figure 2.d).
 La distribution normale est une distribution
très fréquemment rencontrée pour un grand
nombre de caractères dans toutes les espèces
(voir figure 2). De ce fait, l’analyse statistique
des caractères auxquels on s’intéresse en
génétique quantitative est souvent facilitée.
 Toutefois, les caractères pour lesquels on ne
peut pas admettre la normalité de la
distribution nécessitent un traitement
approprié. Par exemple, une transformation
mathématique des données par des fonctions
telles que le logarithme, la racine, etc. permet
souvent de normaliser les distributions.
 2. La moyenne
 La distribution reste néanmoins peu facile à
manipuler, et ne donne pas immédiatement une
valeur représentative du caractère dans la
population : si nous demandons à un obstétricien
combien pèse un bébé à la naissance en France, il
ne nous présentera pas une courbe de distribution,
mais nous répondra, « autour de 3,2 kg ». La
moyenne, ou espérance, est le concept statistique le
plus utilisé pour donner un ordre de grandeur
d’un caractère.
 Cependant, on peut parfois être amené à
donner le mode (valeur la plus fréquemment
observée) ou la médiane (valeur autour de
laquelle l’effectif de la population se répartit
équitablement). En cas de distribution normale,
ces trois paramètres sont égaux.
 3. La variance
 Pour décrire l’amplitude de la dispersion
autour de la moyenne, on utilise le plus
souvent la variance, qui est la moyenne des
carrés des écarts à la moyenne (voir le
mémento statistique en fin de ce chapitre) et
s’exprime dans le carré de l’unité du caractère
mesuré. L’écart-type, quant à lui, est égal à la
racine carrée de la variance et s’exprime dans
l’unité du caractère.
 A titre d’illustration, le tableau 1 donne les
paramètres des distributions reportées aux figures
1 et 2. Une propriété intéressante de la loi normale
est que l’on peut facilement calculer la proportion
d’individus dont la valeur se situe au-delà (ou en
deçà) d’un certain seuil par rapport à la moyenne ;
des tables donnent ces proportions pour une loi
normale centrée réduite, c’est-à-dire dont la
moyenne est nulle et la variance est égale à 1 (voir
Stat). Ainsi, il est bien connu que, dans le cas d’une
distribution normale, 95 % des valeurs se situent
dans un intervalle allant de -1,96 à + 1,96 écarts-
types de part et d’autre de la moyenne.
 Si l’on préfère, on peut également dire que
seulement 2,5 % des valeurs se situent à plus de
1,96 écarts-types au-delà de la moyenne, et
réciproquement en deçà de la moyenne. A titre
d’exemple, la distribution de la teneur en protéines
du lait étant rigoureusement ajustée à une
distribution normale (figure 2.c), les chiffres du
tableau 1 nous indiquent que 95 % des vaches
Montbéliardes contrôlées en 1988 ont eu une
valeur de taux protéique comprise entre 27,6 et
35,4 g/kg, ce qui représente un bon aperçu du
champ de variation du caractère dans la
population considérée.
 Lorsque l’on étudie une population, il est rare
que l’on ne s’intéresse qu’à un seul caractère
mesurable sur les individus qui la composent.
En amélioration des plantes ou des animaux, ce
n’est quasiment jamais le cas. Il est donc
important de disposer d’outils permettant, au
minimum, de décrire une population de façon
bidimensionnelle.
 1. La distribution à deux dimensions
 Pour rendre compte graphiquement d’une
distribution à deux dimensions, on construit un
nuage de points : chaque individu est représenté
sur le graphe par un point dont les coordonnées
sont égales aux valeurs respectives pour les deux
caractères étudiés. La figure 3 montre une
construction de ce type, à partir de données
recueillies sur une espèce d’ongulé sauvage, le
bouquetin des Alpes, Capra ibex ibex. La forme du
nuage de points suggère une liaison statistique
entre les deux caractères mesurés, liaison qu’il est
possible de quantifier.
 2. La corrélation
 Le coefficient de corrélation (de Pearson) est le
paramètre usuel pour quantifier l’association entre
deux variables. Ce coefficient se calcule comme
étant le rapport de la covariance entre les deux
variables au produit de leurs écarts-types
respectifs ; la covariance est l’espérance du
coproduit des deux variables centrées (voir
mémento statistique). Le coefficient de corrélation
entre deux variables X et Y est sans dimension et
varie de -1 à +1. Il mesure le degré de liaison
linéaire entre les deux variables mais n’implique
pas toujours une relation de cause à effet.
 Si la corrélation est positive, les valeurs élevées de
Y sont préférentiellement associées à des valeurs
élevées de X. En cas de corrélation négative, ce
sont les valeurs faibles de Y qui sont associées
préférentiellement aux valeurs élevées de X.
Quand le coefficient de corrélation est élevé en
valeur absolue, l’association est rigoureuse et le
nuage de points est resserré autour d’une droite. A
contrario, une valeur proche de zéro indique que la
liaison linéaire est imparfaite, une valeur de zéro
signifiant l’indépendance linéaire entre les deux
variables.
 Lorsque deux variables suivent conjointement une
loi normale, leur coefficient de corrélation est le
meilleur indicateur de leur association statistique.
A l’inverse, deux variables peuvent avoir entre
elles une liaison forte mais non linéaire (par
exemple X sur l’ensemble des réels et Y=X2) et être
en corrélation nulle, car comme indiqué plus haut,
la corrélation mesure une liaison qui est de type
linéaire. Lorsque l’on ne connaît pas a priori le
type de liaison entre deux variables, l’observation
de leur distribution bidimensionnelle est
indispensable et se restreindre au seul calcul du
coefficient de corrélation pour juger de leur liaison
peut conduire à de grossières erreurs.
 3. La régression linéaire
 L’existence d’une corrélation linéaire entre
deux variables permet de prédire la valeur
d’une variable à partir de la valeur prise par
l’autre variable. En effet, connaissant X, il est
possible de prédire Y par Ŷ, selon l’équation
suivante : Ŷ = a + bX
 Le coefficient de régression (b) représente la
pente de la droite, c’est-à-dire la quantité selon
laquelle, en moyenne, la variable Y varie
lorsque la variable X croît d’une unité. Quant
au coefficient a, il représente simplement
l’ordonnée de la droite à l’origine (c.à.d. le
zéro de la variable X).
 Les coefficients a et b de cette droite de
régression sont déterminés de façon à
minimiser la variance d’erreur entre les
valeurs prédites par l’équation ci-dessus (Ŷ) et
les valeurs réelles de Y sur l’échantillon
considéré (méthode des moindres carrés, voir
Stat). Plus la corrélation entre les deux
variables est élevée, plus la prédiction de
l’une à partir de l’autre est précise (plus Ŷ est
proche de Y).
 L’intérêt de la technique de régression linéaire
est de permettre une prédiction de la valeur
d’un individu pour un caractère qui nous
intéresse alors que la mesure en est difficile ou
très coûteuse, voire impossible dans les
conditions où l’on se trouve. L’objectif des
mesures faites chez le bouquetin des Alpes et
présentées à la figure 3 était justement de
fournir un prédicteur simple du poids des
animaux afin de permettre le suivi régulier des
populations, notamment de la croissance des
animaux.
 On conçoit en effet que, dans l’habitat naturel
du bouquetin, le transport d’une bascule soit
quelque peu malaisé. Un mètre-ruban est bien
moins encombrant et d’un maniement très
facile. Les prédictions que l’on peut faire du
poids des animaux à partir de la simple meure
de leur tour de poitrine sont jugées
suffisamment fiables pour l’objectif que l’on
s’est assigné : les erreurs de prédiction sont de
faible ampleur et elles n’ont que peu de
conséquences pratiques.
 La régression fait l’objet de très nombreuses
applications, dans des domaines très variés.
Notamment, il sera largement discuté, dans le
cadre des enseignements correspondants, de
l’usage extrêmement courant que l’on fait de la
régression linéaire en amélioration des plantes
et en amélioration des animaux, pour prédire
ce que l’on ne peut en général pas observer
directement, la valeur génétique pour un
caractère donné, à partir de ce que l’on voit, le
phénotype.
 EXERCICES
 Le tableau ci-dessous donne les valeurs numériques
ayant servi à l’établissement du graphe relatif à la
liaison entre le tour de poitrine (TP) et le poids chez 35
mâles de bouquetin des Alpes (Toïgo, 1998 ; cf. figure 3
dans le chapitre I). A partir des éléments partiels de
calcul qui sont fournis, calculer :
 - la moyenne et l’écart-type de chacun des caractères.
 - les coefficient de corrélation entre les deux caractères.
 - l’équation de la droite de régression permettant de
prédire le poids en fonction du tour de poitrine.
 A. Définitions
 1. Le phénotype et le génotype
 Le phénotype est la manière dont un organisme
nous apparaît, pour un niveau d’observation
donné.
 En génétique quantitative, les caractères que l’on
étudie font l’objet d’une mesure.
 Ainsi, on appelle valeur phénotypique le résultat
de la mesure effectuée sur un individu. Dans le
milieu professionnel de la sélection, animale ou
végétale, on parle également de performance.
 Notons qu’en génétique végétale, l’entité sur
laquelle on réalise une mesure peut être un
mélange d’individus, par exemple l’ensemble
des individus cultivés sur une même parcelle
; dans ce cas, la valeur phénotypique peut se
définir à l’échelle de la parcelle : elle
représente en fait une moyenne de valeurs
phénotypiques individuelles.
 Le génotype d’un individu en un locus est
l’ensemble des gènes qu’il possède à ce locus
(deux gènes homologues pour un individu
diploïde). Le génotype en plusieurs locus1 est
l’ensemble des génotypes à chacun des locus.
 Si l’on considère l’ensemble du génome et
l’ensemble des caractéristiques phénotypiques des
organismes, aucun individu ne peut être
strictement identique à un autre, hormis le cas
d’organismes obtenus par multiplication
végétative ou le cas des vrais jumeaux (encore ces
exceptions ne concernent-elle que le génotype). En
pratique, nous emploierons les termes "génotype"
et "phénotype" dans un sens restreint, c’est-à-dire
pour les seuls caractères qui nous intéressent et les
gènes qui les influencent.
 Sauf indication contraire, les termes «
génotype » et « phénotype » sont employés
par rapport à un ensemble défini de
caractères.
 2. Le milieu
 a. Le milieu : ensemble des causes non
génétiques de variation
 Le milieu désigne (1) l’environnement dans
lequel vit (ou a vécu) l’individu observé, (2)
certains états physiologiques qui lui sont
propres et (3) l’observateur lui-même.
 La première acception est certainement la plus
intuitive. En production végétale, on range
dans cette catégorie des facteurs tels que
l’année (influence du climat), la parcelle
(influence des conditions topographiques et de
sol), les doses d’engrais appliquées aux
différents stades du développement de la
plante, les traitements phytosanitaires
effectués, les conditions de récolte, etc.
 En production animale, on considère des
facteurs tels que l’année (influence du climat
sur les ressources fourragères), l’élevage
(influence des potentialités agricoles de
l’exploitation, du mode de conduite des
animaux et de la technicité de l’éleveur), la
saison de mise-bas en cas de production laitière
ou de croissance des jeunes, etc.
 Parmi les caractéristiques physiologiques
propres à l’individu que l’on considère comme
facteurs de milieu, l’âge concerne les cultures
permanentes et les animaux : le rendement en
fruits d’un cep de vigne ou d’un arbre fruitier
varie en fonction de son âge ; il en est de même
chez tous les animaux en ce qui concerne la
taille et le poids, chez les femelles de
mammifères en ce qui concerne l’intensité de la
production laitière, etc.
 Le stade physiologique à un âge donné joue
également sur les valeurs phénotypiques : cycle
et stade de végétation des plantes fourragères,
stade de lactation des femelles laitières, etc.
 L’observateur, enfin, a une influence au travers
du protocole de mesure qu’il applique, de la
précision de ses instruments de mesure, et des
erreurs de mesure qu’il peut commettre.
 b. Facteurs de milieu contrôlés et non
contrôlés
 Dès maintenant, il faut introduire une autre
classification des facteurs de milieu, qui est
déterminante dès lors que l’on est au stade de
l’expérimentation ou de l’analyse des données
recueillies sur le terrain.
 Les facteurs de milieu contrôlés sont des
facteurs de milieu que l’on identifie comme
tels, dont on sait ou dont on pense qu’ils ont
un effet important sur les caractères étudiés :
on parle également de macro-milieu. Ici, non
seulement on peut enregistrer les conditions
propres à plusieurs individus, mais on peut
agir dessus : par exemple, on peut apporter à
une culture une fumure azotée plus ou moins
forte, mais contrôlée.
 Les exemples donnés plus haut relèvent en fait
tous de cette catégorie. Ainsi, en même temps
que l’on mesure le rendement en fruits d’un
arbre fruitier, on enregistre l’année
correspondante, la parcelle, l’âge de l’arbre, etc.
Lorsque l’on mesure la production laitière
d’une vache, on enregistre également le
numéro du troupeau, le rang de lactation de
l’animal, sa date de mise-bas (donc de
démarrage de la lactation), etc.
 Au stade de l’analyse, on considère qu’un effet
de macro-milieu s’applique en commun à tous
les individus se trouvant dans une catégorie de
milieu donnée.
 Les facteurs de milieu non contrôlés sont des
facteurs, soit que l’on ne maîtrise pas car ils
échappent à l’observateur, soit que l’on
n’enregistre pas car le recueil de l’information
correspondante est trop compliqué ou trop
coûteux. On pense que ces facteurs non
contrôlés induisent chacun des faibles
variations, car résultant de microphénomènes
locaux, s’appliquant à de manière différente à
chaque individu : on parle aussi de micro-
milieu.
 Cette distinction entre macro-milieu et micro-milieu
comporte une part d’arbitraire liée à l’échelle
d’observation à laquelle on se situe. Ne pas
enregistrer un facteur de milieu qui, en réalité,
induit des variations importantes, conduit à des
erreurs d’analyse ; dans la pratique de la sélection,
où l’on doit corriger les données pour les effets des
facteurs de milieu contrôlés, une telle omission a des
répercussions relativement graves.
 B. Mise en évidence des facteurs de variation
génétique
 Les caractères quantitatifs présentant une
variation continue, la mise en évidence des
facteurs génétiques à l’origine de cette
variation est en général plus compliquée que
pour les caractères pour lesquels les individus
observés se rangent dans un petit nombre de
catégories.
 Quelques résultats expérimentaux vont nous
permettre de donner des éclaircissements et de
poser certaines hypothèses quant à l’hérédité
de ces caractères.
 1. L’hypothèse multifactorielle
 Plusieurs expériences ont été réalisées au début du
XXème siècle afin de confronter la variation des
caractères quantitatifs à la théorie mendélienne
(notons que Mendel lui-même, au travers de ses
expériences sur la couleur de la fleur chez
Phaseolus multifloris, avait déjà posé les bases de
l’hérédité multifactorielle). Pour se ramener dans
les mêmes conditions, les parents utilisés pour les
croisements étaient des « lignées pures », c’est-à-
dire homozygotes à tous les locus.
 Cet état est facilement obtenu chez des plantes
se reproduisant naturellement par
autofécondation (plantes autogames) : après
plusieurs générations d’autofécondation, le
coefficient de consanguinité au sein d’une
lignée tend vers 1, c’est-à-dire que tous les
individus de la lignée sont homozygotes, à
chacun des locus, pour le même allèle (voir
GP).
 La figure 4 présente les résultats d’une
expérience de croisement réalisée par East
(1916) à partir de deux lignées consanguines
d’une espèce ornementale de tabac différant
pour la longueur des fleurs. Compte tenu du
régime d’autofécondation, à l’intérieur de
chacune des deux lignées parentales (P1 et P2),
tous les individus sont génétiquement
identiques.
 De même, tous les individus de la première
génération de croisement (F1) sont
génétiquement identiques : notamment, ils sont
tous hétérozygotes aux locus où les deux
lignées parentales diffèrent.
 Ainsi, la variance observée chez les parents et en
F1 est d’origine strictement environnementale. Par
contre, l’accroissement substantiel de la variance
observée en F2 (F1 x F1) évoque une ségrégation
de gènes. Si le polymorphisme en un seul locus
était responsable des variations observées de la
longueur de fleur, la distribution de la F2 devrait
être un mélange des distributions respectives de
P1, F1 et P2 dans des proportions mendéliennes
(1/4, 1/2 et 1/4), ce qui n’est manifestement pas le
cas.
 Cette expérience fut poursuivie par l’analyse
de la réponse à la sélection en F3. L’ensemble
des résultats a permis de suggérer que les
lignées parentales différaient non pas à un
locus, mais pour plusieurs ayant une influence
sur le caractère mesuré.
 En effet, les distributions globales observées
s’accordent bien avec l’hypothèse d’une
distribution binomiale en plusieurs locus
indépendants les uns des autres.

 Les variations observées des caractères
quantitatifs sont imputables (1) aux
ségrégations à plusieurs locus et (2) à des
facteurs de milieu.
 2. Mise en évidence de locus ayant un effet sur un
caractère quantitatif
 a. Description détaillée d’une expérience sur
drosophile
 La mise en évidence de gènes induisant des
variations pour un caractère quantitatif suppose
une variation allélique aux locus concernés. Pour
cela, il est utile de prendre comme matériel d’étude
des populations différant nettement pour le
caractère observé.
 Cela peut se trouver dans des populations
naturelles, ou bien être obtenu par sélection
divergente (sélection de deux lignées dans des sens
opposés pour un même caractère) : si en plusieurs
locus, il existe des allèles qui sont « favorables » à
l’obtention de fortes valeurs du caractère et des
allèles « défavorables », on peut raisonnablement
penser (voir GP) que la fréquence des allèles «
favorables » sera plus élevée dans la lignée
sélectionnée pour une augmentation de la
moyenne du caractère que dans la lignée
sélectionnée vers une diminution.
 La figure 5 présente les résultats d’une
expérience de ce type réalisée sur drosophile.
Le caractère étudié est le taux de survie à une
certaine dose de DDT. Les individus observés
sont ceux d’une F2 obtenue après le croisement
de parents issus de deux lignées différentes,
une lignée sélectionnée pendant plusieurs
générations pour la résistance au DDT et une
lignée de contrôle.
 Dans ces lignées, les chromosomes comportent
des suppresseurs de recombinaison et sont
porteurs de marqueurs génétiques qui
permettent d’identifier la provenance de
chaque chromosome chez les individus de la
F2.
 La figure 5 montre clairement que les
chromosomes contribuent aux variations de
résistance au DDT : très schématiquement, plus la
proportion de chromosomes provenant de la
lignée résistante est importante dans le génome
des individus, plus ceux-ci sont résistants. Ces
résultats sont cohérents avec l’hypothèse
multifactorielle évoquée plus haut, puisqu’ils
mettent en évidence l’action d’au moins trois locus
(au minimum un par chromosome, en réalité plus)
sur les variations de résistance au DDT chez la
drosophile.
 Une analyse plus détaillée permet de préciser l’action
des chromosomes (et donc des locus qui y sont portés).
Ainsi, il apparaît que la substitution d’un chromosome
3 de la lignée de contrôle par un chromosome 3 de la
lignée résistante confère une résistance plus élevée
quelle que soit la combinaison aux autres
chromosomes (comparer les valeurs respectives des
types 1 et 4, 5 et 8, 12 et 15). Ceci n’est pas vrai pour le
chromosome X : les individus de type 2 sont plus
résistants que ceux de type 1, les individus de type 8 le
sont plus que ceux de type 7, mais il n’y a pas de
différence entre les individus de type 14 et 15.
 Par ailleurs, la comparaison des individus de type
1 et 6, d’une part, et de ceux de type 8 et 13, d’autre
part, montre que les effets "bénéfiques" des
chromosomes X et 3 de la lignée résistante ont
tendance à se cumuler (ce qui ne signifie pas qu’ils
s’ajoutent strictement).
 Les locus responsables des variations des
caractères quantitatifs ont des effets qui se
cumulent.
 Figure 5. Taux de survie à une dose de DDT chez
la drosophile. Les individus observés comportent
diverses combinaisons de chromosomes, décrites
pour les chromosomes X, 2 et 3, respectivement : c
= chromosome originaire de la lignée de contrôle,
s = chromosome originaire de la lignée
sélectionnée pour la résistance au DDT.
 Source : Crow, 1957.
 b. Gènes marqueurs et gènes majeurs
 Une analyse plus fine peut être réalisée si, au lieu
de repérer l’origine du génome des individus
chromosome par chromosome, on peut le faire sur
des fragments chromosomiques plus petits. Ceci
est maintenant possible grâce au marquage
moléculaire pratiqué sur des organismes
recombinant normalement. Plusieurs types de
marqueurs moléculaires sont aujourd’hui
disponibles : RFLP, AFLP, microsatellites, SNP,
etc.
 A côté d’espèces modèles (l’homme, la souris, la
drosophile, Arabidopsis, le riz, certaines levures
ou bactéries…, où l’on en est au stade du
séquençage du génome entier), les études chez les
espèces majeures de plantes cultivées ou
d’animaux d’élevage ont fourni un grand nombre
de marqueurs, capables de baliser l’ensemble du
génome, et qui, une fois ordonnés sur une carte
génétique, autorisent l’étude fine des variations
des caractères quantitatifs.
 L’analyse des descendances obtenues avec
recombinaison permet de révéler des co-
ségrégations entre les allèles aux marqueurs et les
valeurs observées pour des caractères quantitatifs.
Couplées à la carte génétique des marqueurs, ces
analyses conduisent à la localisation
chromosomique de locus dont le polymorphisme
induit des variations sur les caractères étudiés,
locus nommés QTL (de l’anglais Quantitative Trait
Locus). Le principe de la détection de QTL et les
applications de cette méthodologie sont présentés
au chapitre VI.
 Il n’a pas été besoin d’attendre les progrès de la
génétique moléculaire pour mettre en évidence des
locus polymorphes responsables de variations
importantes pour un caractère quantitatif. De
simples expériences de sélection divergente et/ou
de croisement ont permis dans divers cas de
détecter certains locus de ce type, par simple
observation des distributions. A titre d’exemple, la
figure 6 présente la distribution du poids à 60 jours
dans une lignée de souris sélectionnée pour de
faibles poids, et dans laquelle une forme de
nanisme est apparue.
 Les individus observés ayant été élevés
rigoureusement dans les mêmes conditions de
milieu, l’hypothèse de la ségrégation d’un gène
induisant de grandes différences de poids a été
avancée afin d’expliquer l’aspect bimodal de la
distribution. Les résultats d’accouplements
d’individus issus de chacun des deux sous-
ensembles de la lignée ont permis de valider
cette hypothèse.
 Il a été établi que le locus concerné (dénommé «
pygmée ») possède deux allèles, l’allèle muté,
responsable du nanisme, étant quasi-récessif
par rapport à l’allèle normal. Ainsi, tous les
individus du sous-ensemble inférieur de la
distribution sont des homozygotes pour l’allèle
muté.
 Bien sûr, pour que l’action d’un gène soit
décelable au vu des seules distributions, il faut
que les différences induites par ce gène soient
grandes en regard de la variation totale
observée. Dans l’exemple de la figure 6, l’écart-
type total est de 3,5 g pour l’échantillon
mesuré.
 La différence entre la valeur moyenne des
individus nains (homozygotes mutés) et celle des
individus normaux (autres génotypes) est de
l’ordre de 8 g, soit environ 2,25 unités d’écart-type,
ce qui est considérable : à titre de comparaison,
cela équivaut à un gène qui induirait chez
l’homme un écart d’une quinzaine de cm pour la
taille. Aussi, de tels gènes sont-ils appelés gènes
majeurs, du fait de l’ampleur des différences
phénotypiques qu’ils occasionnent.
 Dans de nombreuses espèces domestiques,
l’existence de gènes majeurs pour certains
caractères quantitatifs a pu être décelée par analyse
des distributions. Cependant, des analyses fines de
génétique quantitative mettent en évidence une
composante héréditaire autre que celle relative aux
locus concernés (c’est le cas pour les données de la
figure 6). On ne peut toutefois pas individualiser
les autres locus impliqués ;
 aussi, suppose-t-on qu’ils sont relativement
nombreux et que le polymorphisme en chacun de
ces locus induit de faibles différences : on parle de
polygènes. Enfin, il existe beaucoup de caractères
pour lesquels aucun gène majeur n’a pu encore
être mis en évidence.
L’existence d’un gène majeur n’exclut pas celle
d’autres gènes induisant des variations pour le
caractère étudié.

Sign up to vote on this title
UsefulNot useful