Vous êtes sur la page 1sur 18

SEPMET

Projet Statistique (UE 2.3)

Étude du déterminisme génétique de l’épiaison dans un


croisement biparentale entre Triticum ssp dicoccum et Triticum
ssp durum.

Préparé par : Jemay SALOMON

Novembre 2022
Introduction
Le blé dur joue de plus en plus un rôle important dans la diète alimentaire au niveau du
pourtour méditerranéen. Au fur à mesure que les demandes globales augmentent, la
nécessité d’améliorer certains caractères jouant un rôle primordiale dans l’élaboration
finale du rendement est cruciale. Les difficultés rencontrés dans l’amélioration du blé dur
sont le résultat de différents événements, parmi lesquels : les processus de sélection et
de domestication. Ces derniers ont conduit à une perte de diversité génétique important
au fil du temps. Ceci dit, certains traits jugés importants pour l’amélioration tels que :
rusticité de la plante, appareil racinaire puissant, la résistance à certains pathogènes ne
sont présentes que dans les sous-espèces primitives comme T. t. ssp dicoccum. Pour
remédier à cette situation, l’introgression d’allèles spécifiques d’intérêts des formes
primitives vers la forme sauvage est cruciale. Pour ce faire, il paraît donc important
d’étudier le déterminisme génétique de ces caractères d’intérêt en travaillant sur des
croisements biparentaux entre T. turgidum ssp durum et T. t. ssp dicoccum.
La variabilité génétique liée à la l’épiaison joue un rôle important dans l’adaptation d’une
culture à différents environnements. Celle-ci pourrait être exploitée pour sélectionner des
variétés pour des environnements spécifiques. Chez le blé tendre (Triticum aestivum),
les auteurs Zikhali et Griffiths (2015) ont confirmé que la phénologie est contrôlé par des
gènes de précocité et de sensibilité à la photopériodes et la vernalisation. Des études ont
déjà révélé l’existence de trois loci à effet majeur sur la sensibilité à la photopériode ; ils
se situent sur les chromosomes 2A, 2B et 2D (Beales et al, 2007). Il en est de même pour
la précocité et la vernalisation, des études ont déjà révélé la présence de régions
chromosomiques ou gènes associés à ces caractères (Law et al, 1976). Chez le blé dur
(Triticum durum), les travaux de Maccaferri et al (2008) ont mis en évidence trois QTLs
à effet majeur sur l’épiaison (ils se situent sur les chromosomes : 2AS, 2AL et 7BS).
Récemment, Nishimura et al (2018) ont identifié un QTL pour la précocité (germination-
épiaison) sur le chromosome 7AS dans une population de lignée recombinante provenant
d’un croisement entre Triticum turgidum L. ssp. dicoccum et T. turgidum L. ssp. turgidum
conv. pyramidale. Cependant très peu d’études ont mis l’accent sur les types de QTLs
trouvés. Alors une première question se pose sur la nature des QTLs associés à la
phénologie du blé dur : sont-ils adaptatifs ou constitutifs ? Le travail présenté ici propose
d’étudier le déterminisme génétique de l’épiaison sur une population de lignées
recombinantes issue d’un croisement entre T. turgidum ssp durum et T.t. ssp dicoccum
évaluée sur plusieurs environnement. Le principal objectif de ce travail est d’identifier les
régions chromosomiques (QTLs) associés à l’épiaison et regarder si ces QTLs sont les
mêmes sur les environnements étudiés.

Matériels et méthodes
Matériel végétal
Le matériel d’étude est composé d’échantillons de grains de lignées de blé dur
(T. turgidum, 2n=4x=28). Ces lignées sont issues d’un croisement entre T.t. ssp dicoccum
et T.t. ssp durum. A partir de la F2, ces lignées ont été toutes fixées.

Description du jeu de données


Les jeu de données utilisées a été donnée par l’équipe académique du Master 2. Les
données proviennent de lignées fixées évaluées dans différents environnements (année
X lieu) pour de nombreux caractères dans un premier temps ; dans un deuxième temps,
on a les données moléculaires.

Les deux principaux jeu de données :

a. Données phénotypiques
Le jeu de données qui sera analysée dans le cadre de cette étude, c’est le
« pheno_champ.csv ». Il contient les mesures de teneur en protéine du grain (protéines),
la précocité d’épiaison (épiaison), la hauteur de la plante (hauteur), et la résistance à la
fusariose (fusa. Les analyses se porteront uniquement sur la précocité d’épiaison et ceci
sur l’année 2013 avec 3 environnement (capelle2013, grisolles2013 et mauguio2013)
pour faciliter les analyses.

b. Données moléculaires
1643 SNPs issus de capture d’exons est utilisé dans le cadre de cette étude. Ces SNPs
sont les résultats d’une étude scientifique sur le déterminisme génétique de la résistance
du blé au virus de la mosaïque(Wheat Spindle Streak Mosaic Virus, Holtz et al, 2015).
Les données utilisées sont : i) les données génotypage de 163 lignées avec les 1643
SNPS et ii) la carte génétique des 1643 SNPs.
NB : Pour la détection de QTLs les données phénotypiques (données observées) seront
utilisées.

Analyse statistique
Modèle statistique pour le calcul de l’héritabilité.

𝑌𝑖𝑗𝑘 = µ + 𝛼𝑖 + 𝑏𝑗 + 𝑒𝑖𝑗𝑘
𝑌𝑖𝑗𝑘 : Performance de la lignée j dans l’environnement i, de répétition k
µ : Paramètre fixe d’intercept
Les hypothèses sur les paramètres du modèle
𝛼𝑖 : Facteur environnement fixe
𝑏𝑗 ~N(0,δ2𝐿 ) : (δ2𝐿 : 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 des lignées)
𝑏𝑗 : facteur lignée aléatoire
𝑒𝑖𝑗𝑘 : L’aléas individuels iid
𝑒𝑖𝑗𝑘 ~N(0,δ2 ) : (δ2 : 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑟é𝑠𝑖𝑑𝑢𝑒𝑙𝑙𝑒)

Héritabilité
2 𝐿 𝛿2
Héritabilité au sens large : 𝐻𝑠𝑙 = 𝛿2+𝛿 2
𝐿
2 𝛿𝐿2
Héritabilité du dispositif : 𝐻𝑠𝑙𝐷 = 2
𝛿𝐿2 +𝛿 ⁄𝑛𝑗
Le logiciel R est utilisé pour toutes les analyses.

1. PARTIE I
Détection de QTLs
Analyse de simple marqueur : Cette méthode permet de chercher les QTLs localisés
proche du marqueur considéré qui impliquent dans la variabilité du caractère quantitatif
étudié.
a. Analyse de variance : 𝑃𝑖𝑗 = µ + 𝛼𝑖 + 𝑒𝑖𝑗
µ : Moyenne de la population
𝑃𝑖𝑗 : Valeur phénotypique de l’individu (épiaison)
𝛼𝑖 : Effet associé au marqueur considéré
𝑒𝑖𝑗 𝑖𝑖𝑑 ~𝑁(0, 𝛿 2) :Résidu du modèle

H0 : 𝛼1 = 𝛼2 = 𝛼𝑖 = 0 (Pas d’effet du génotype au marqueur)


H1 : Il existe au moins un 𝛼𝑖 différent de 0
Avantages et inconvénients : Cette méthode ne nécessite pas une carte génétique
complète pour être mise en pratique, par contre, elle ne permet pas de bien identifier
mesurer l’effet exacte des QTLs. Autrement dit, on ne sait pas si le QTL a un effet
fort mais loin du marqueur ou s’il a un effet faible mais proche du marqueur.
b. Analyse par simple intervalle : Cette technique permet de tester la présence d’un
QTL à n’importe quel point du génome en utilisant les informations génotypiques
aux marqueurs flanquant de la position testée. Cette analyse est basée sur la
méthode de maximum de vraisemblance. A partir de là, on teste l’hypothèse
d’existence d’un gène à effet quantitatif entre deux marqueurs en calculant le
rapport entre la probabilité d’observation d’un QTL et la probabilité de ne pas avoir
un QTL sur les mêmes données. La cartographie par simple intervalle a pour
intérêt de pouvoir déterminer avec beaucoup plus de précision la position des
QTLs mais, par contre on a la difficulté de séparer deux QTLs proches.

𝐿(µ, 𝛿) = ∏𝑖 ∑𝑗 𝑝𝑖𝑗 φ(𝑦𝑖 ; µ𝑗 , 𝛿 2 ) : Maximum de vraisemblance avec moyenne et


écart type.
𝐿(µ, 𝛼, 𝛿)
𝐿𝑂𝐷 = 𝑙𝑜𝑔10 ( )
𝐿(µ, 0, 𝛿)
Avec 𝛼=0 en absence de QTL.

c. Analyse par intervalle composite : cette méthode est basée sur la cartographie
par simple intervalle ; elle permet d’éliminer de la résiduelle les effets des QTLs
non liés. Comme avantage, elle est plus précis que la méthode par simple
intervalle. Par contre, c’est une méthode itérative, donc demande une bonne
puissance de calcul.
𝑦𝑗 = µ + 𝑏 ∗ 𝑥𝑗∗ + ∑ 𝑏𝑘 𝑥𝑗𝑘 + 𝑒𝑗 ~iid: N(0, δ2)

Avec yj : phénotype de l’individu j ; µ :performance moyenne de la population ; b* :


effect du gros QTL (QTL à effet majeur) ; 𝑥𝑗∗ effet additif du au génotype au
marqueur ; 𝑏𝑘 : coéfficient de regression partielle de y sur le kième marqueur de
l’individu j et ej résidu du modèle (Zeng, 1994).

Résultats
Analyse phénotypique
Les données sur la précocité à l’épiaison présente une distribution bimodale suivant
l’histogramme réalisé (Figure 1.A). Cette répartition bimodale provient du fait qu’il a un
effet environnemental très prononcé entre capelle2013 et les deux autres (grisolles2013
et maguio2013). Les boîtes à moustaches réalisées (Figure 1.B) ont montré que dans
l’environnement capelle2013, les plantes sont plus tardives (en moyenne) comparé aux
deux autres environnements. La durée de la phase végétative est forcément influencée
par l’environnement. Toutefois, à l’intérieur même des environnements, les génotypes
semblent répartir en deux groupes. Un groupe tardif et un groupe plus ou moins précoce
comparé aux autres.

Deux héritabilité (au sens large) sont calculées : héritabilité individuelle et l’héritabilité du
dispositif. Les valeurs trouvées sont respectivement, 0.65 et 0.85 pour l’héritabilité
individuelle et celle du dispositif. Ces valeurs suggère que la précocité à l’épiaison est un
trait peu influencé par les aléas individuels et par conséquent, ce caractère a une bonne
héritabilité.

Détection de QTLs
a. Analyse de variance
Une analyse de variance a été utilisée pour tester la significativité des marqueur; la
correction de Bonferroni (seuil=4.51) a été appliquée pour déterminer le seuil. Suivant les
résultats obtenus (Annexe 1), un total de 30 (unique) marqueurs ont été significatifs pour
tous les trois environnements (certains marqueurs sont répétés). Les pourcentages de
variabilité expliqué par les marqueurs ont varié de 10.99 % à 40.1% sur l’ensemble des
trois environnements. Le SNP1573 se trouvant sur le chromosome 7B explique la plus
grande part de variabilité pour les environnements : cappelle2013 : 31.6% et
grisolles2013 : 40.1%. Pour l’environnement mauguio2013, toujours sur le chromosome
7B, le SNP1575 explique 39.22% de la variabilité observée.
Les p-values sont tracés le long du génome pour la visualisation des résultats (Annexe
2). Les graphiques montrent que le nombre et les régions du chromosomes impliquées
varient en fonction de l’environnements. Par contre un QTL sur le chromosome 7B est
trouvé stable sur les trois environnements. En résumé : i) pour mauguio2013, on a trouvé
3 QTLs provenant des régions 7B, 5B et 2A ; ii) pour cappelle2013, 2 QTLs provenant du
Figure 1 :Histogramme (A) et boxplots en fonction de l'environnement (B) pour la précocité à
l'épiaison

Simple interval mapping Composite interval mapping

Figure 3: Analyse QTLs « Simple intervalle » pour l'épiaison sur les Figure 2: Analyse QTLS "Intervalle composite" pour l'epiaison sur les trois
trois environnements (cappelle2013, grisolles2013, mauguio2013) environnements (cappelle2013, grisolles2013, mauguio2013)
7B et du 4A ont été détectés ; iii)pour grisolles2013, on a 2 QTLs provenant des
régions du 7B et 5B. Au total, 4 QTLs (unique) ont été détecté pour sur les trois
environnements suivant la représentation des p-values sur le génome.
b. Cartographie par simple intervalle
La cartographie par simple intervalle utilisant le test de maximum de vraisemblance
(α=0.05 et 1000 permutations) a été utilisé pour délimiter la avec plus de précision les
positions de QTLs. Suivant cette méthode on a trouvé les mêmes QTLs détectés par
analyse de variance avec la même répartition mais avec beaucoup plus de précision en
termes de distance (Figure 3, Annexe 3). Un QTL stable sur tous les environnements situé
sur le 7B, il explique 31.5% (effet additif moyen a=1.93) de la variabilité observée que ce
soit l’environnement considéré. Le QTL sur le chromosome 4A pour l’environnement
cappelle2013 explique 11% de la variabilité avec un effet additif moyen de 1.16. Les QTLs
trouvé pour l’environnement mauguio2013 sur les chromosomes 2A et 5B ont expliqué
respectivement 15.4 % et 12 % (avec leur effet additif moyen respectifs, 1.78 et 1.57).
Celui trouvé sur le 5B dans l’environnement grisolles2913 explique 12.3% avec un effet
additif a=1.55.
a. Cartographie par intervalle composite
La cartographie par intervalle composite a permis d’éliminer de la résiduelle les effets des
QTLs non liés. Celle-ci permet d’augmenter la puissance de détection et de précision sur
les QTLs. En utilisant cette méthode, les mêmes QTLs trouvé avec la méthode SIM sont
détecté aussi sauf les QTLs significatifs sur les chromosomes 5B (env : grisolles2013)
et sur le 2A (env :mauguio2013) ne sont plus significatifs. Suivant cette technique, 3 QTLs
uniques sont resté significatifs. Celui qui est stable pour tous les environnements (trouvé
sur le 7B), celui sur le 5B (env : mauguio2013) et 4A (capelle2013).

Discussion
Test statistique
Pour l’analyse de variance, un seuil α=0.05 (avec la correction de Bonferroni : p-value
seuil=4.51) a été retenu comme seuil de significativité des marqueurs. Cette méthode
est très conservatrice en terme de seuil mais par contre elle permet d’éviter toute sorte
de biais ou faux positifs. Dans un contexte de sélection assistée par marqueurs, une telle
méthode semble cohérent et suffisamment robuste puisqu’on veut diminuer les risques
de se tromper sur le QTL associé au caractère mesuré. Contrairement si on s’intéressait
à une étude d’exploration des potentielles régions du génome impliquées dans le
déterminisme génétique d’un caractère, certains marqueurs avec des p-value autour de
4 seraient des potentiels candidats ; donc cette technique ouvre la voie à l’exploration
d’autres régions du génome (On pourrait tester d’autres méthodes en calculant le seuil
de détections sur le nombre de SNPs efficace puisque certains SNPs vont être liés).
Pour la cartographie par simple et composite intervalle, un test de permutations
(perm=1000) a été utilisé pour identifier le maximum lodscore qui pourrait arriver par
hasard, et ce lodscore maximal est défini comme seuil de significativité. Ces techniques
permettent de minimiser les biais dû à la configuration des données. La détection de QTL
passant par ces méthodes sont également robuste. Néanmoins, il est probable d’avoir
des QTLs non détectés. Certains QTLs identifiés avec la correction de Bonferroni ne sont
plus significatifs avec cette méthode. Cette technique augmente la précision certes, mais
elle trop robuste si on veut faire des analyses exploratoires du génome.

Déterminisme génétique
Le déterminisme génétique de l’épiaison est contrôlé par un QTL stable(constitutif) a effet
majeur se trouvant sur le chromosome 7B et d’autres petits QTLs adaptatifs se trouvant
sur 4A, 2A et 5B suivant l’environnement. Le QTL a effet majeur explique à 31.5% les
variation des dates d’épiaison. Ces résultats montre que le l’épiaison est contrôlé par
plusieurs régions du génome. Récemment, Gupta et al (2020) ont découvert des loci sur
le chromosome 4A et 2A impliquant dans la date de floraison chez le blé dur. Ces
résultats mettent en évidence quelques loci bien connus contrôlant la sensitivité à la
photopériode chez le blé dur et tendre : Ppd-A1 sur le 2A (Beales et al, 2007). Sur le
chromosome 5B des gènes de vernalisation ont été déjà repéré dans la littérature : Vrn-
B1 (Law et al, 1976). Sur le chromosome 7B, un gène de vernalisation Vrn-3 (Yan et al ,
2006) a été également mis en évidence. Un QTL sur le chromosome 7B (position : 56
cM), proche de celui trouvé dans cette étude (position :11.5) est également impliqué dans
la résistance du blé dur au virus de la mosaïque striée (Holtz et al, 2017). Ceci nous
amène à faire l’hypothèse dans cette région du chromosome 7B (0-100 cM) localise peut
être des gènes/locus a effets pléiotropes.

Conclusion
En conclusion, l’épiaison chez le blé dur est contrôlé par un QTL stable a effet majeur
localisé sur le chromosome 7B (c7B.loc15) et d’autres QTL adaptatifs à effets mineurs. Des
analyses ont été conduit sur les BLUPs (non présenté dans cette étude) ont mis en
évidence le QTL 7B également. Proche de cette région, d’autre QTLs associés à d’autres
caractères chez le blé dur ont été mis en évidence également. L’une des perspectives de
ce travail serait de faire une cartographie fine (augmenter le nombres d’individus avec
plus d’événement de recombinaison + nombre de marqueurs pour cette région). Dans la
mesure du possible, on pourrait faire une caractérisation fonctionnelle. Toutefois, ce
QTLs pourrait être utilisé dans un programme de sélection (SAM).
PARTIE II
Matériels et méthodes
A- Génétique d’association
La génétique d’association permet d’établir les relations statistiques entre la variation
phénotypique et la variation des génotypes au marqueurs (SNPs) au sein d’une population. Dans
le cadre de cette étude deux approches complémentaires ont été faites pour étudier le
déterminisme génétique de l’épiaison chez des lignées recombinantes de blé dur.
1. Une approche de détection QTLs (Partie I)
2. Une approche de génétique d’association (Partie II).
Dans cette partie, ce sont les BLUPs pour l’épiaison sur 3 environnements (cappelle2013,
grisolles2013 et mauguio2013) qui ont été utilisé pour faire la GWAS et la prédiction génomique.
Par contre, le progrès génétique est calculé sur la moyenne des épiaison sur les trois
environnements.
Pour la génétique d’associations deux modèles complémentaires ont été utilisés :
a. Modèle linéaire mixte à simple locus : 𝑌𝑖 = µ + 𝑋𝑖𝑗 𝐵𝑗 + 𝑍𝑖 𝑢𝑖 +ɛ

(effet fixe) (effet alea)

Avec 𝑌𝑖 : phénotype de la lignée i ; µ : moyenne générale ; 𝑋𝑖𝑗 : valeur allélique de la lignée i au


jème SNP ; 𝐵𝑗 : effet de la variation allélique au SNP j ; 𝑍𝑖 𝑢𝑖 : effet aléatoire du fond génétique et
ɛ les résidus du modèle.
𝑢𝑖 ~N(0, δ2K) et ɛ~N(0, δ2r) : K c’est le matrice d’apparentement calculé sur les marqueurs (SNPs).

b. Modèle linéaire mixte multi locus : C’est une combinaison du modèle linéaire mixte
tenant compte de l’apparentement (similarité génétique) entre les individus combiné avec
un modèle de régression multiple. Ce modèle consiste à débuter l’analyse d’association
avec un modèle nul (sans cofacteurs) et au fur à mesure on mets en cofacteurs les SNPs
qui soient significatifs puis on élimine à posteriori les SNPs qui sont les moins significatifs
(Segura et al, 2012).

Modèle nul : 𝑌𝑖 = µ + 𝑍𝑖 𝑢𝑖 +ɛ
Modèle avec cofacteurs : 𝑌𝑖 = µ + 𝑋𝑖𝑗 𝐵𝑗 + 𝑍𝑖 𝑢𝑖 +ɛ

B- Prédiction génomique
Le modèle animal a été utilisé pour faire la prédiction génomique et s’écrit comme suit :
𝑌 = µ + 𝑋𝐵 + 𝑍𝑢 +ɛ
Y est le vecteur des performances des individus, µ est la moyenne générale, X est la matrice
des incidences pour le vecteur des effets fixes B, Z est la matrice d’incidence pour le vecteur
u des valeurs additives et ɛ est le vecteur des résidus du modèle.
C- Calcul du progrès génétique
Le progrès génétique est calculé suivant la formule ci-dessous :

GWS FIG 1 : Calcul du progrès


génétique

Héritabilité
2 𝐴 𝛿2
Héritabilité au sens stricte : ℎ𝑠𝑠 = 𝛿2 +𝛿 2
𝐴
𝛿𝐴2 ∶ Variance additive ; 𝛿 2 : Variance résiduelle

Résultats
A- Génétique d’association
Modèle simple Locus

1A 1B 2A 2B 3A 3B 4A 4B 5A 5B 6A 6B 7A 7B

GWS FIG 2 : Manathan plot pour le modele à simple locus

Les résultats montrent que la majorité des p-


values est distribuée de manière uniforme et
quelques-uns sortent du lot. Ce qui
correspond aux SNPs sur lesquels on a des
GWS FIG 3 : QQ-plot du modele à simple locus signaux.

Suivant les résultats obtenus à partir de ce


Un QQ-plot (GWS FIG 3) a été réalisé pour modèle, sur le chromosome 7B, un pic a été
vérifier la distribution uniforme des p-values . identifié (4SNPs ont dépassé le seuil de
Bonferroni); ceci correspond à un QTL
associé à l’épiaison(GWS FIG 2).

Modèle Multi Locus


Une approche multi locus a été faite pour
mieux appréhender les effets des locis a
effets majeurs (ce que le modèle à simple
locus ne permet pas de prendre en compte).
Les QQ-plots(GWS FIG 4) ont été réalisés
suivant le processus de cette méthode. Le
modèle avec 1 cofacteur (seuil de
Bonferroni) était le meilleur modèle. Le SNP GWS FIG 4 : Selection de meilleur modele (Gauche les QQ_plots pour 6
modeles testés; Droite : QQ-plot du meilleur modèle)
le plus significatif est le SNP1573 ; le
meilleur modèle est obtenu lorsque on met
cet SNP en cofacteur.
Le manathan plot réalisé pour le meilleur
modèle(GWS FIG 5) identifie la même région
que celle trouvée avec le modèle à simple
locus. Un seul SNP reste très significatif
(seuil de Bonferroni). Ceci dit Un QTL à effet
majeur associé à l’épiaison a été identifié sur
ce chromosome (7B). Un ANOVA (GWS FIG
7) et un boxlot (GWS FIG 6) ont été réalisés
pour les génotypes à ce SNP. Suivant le
1A 1B 2A 2B 3A 3B 4A 4B 5A 5B 6A 6B 7A 7B
boxplot réalisé, les deux classes génotypes
à ce SNP (AA, BB) sont significativement GWS FIG 5 : Manathan plot pour le meilleur modèle
différents les uns des autres. Ce QTL
explique 35% de la variabilité au sein des
BLUPs.
B- Prédiction génomique
Une prédiction génomique à partir du modèle
décrit dans les matériels et méthodes a été R2 =0.35
faite en utilisant deux stratégies de
validation : le simple validation et le cross-
validation. 80% des génotypes a été utilisé
pour entraîner le modèle et 20% pour la
validation. Un accuracy de 40% a été
obtenu(GWS FIG 8) pour simple validation.
Par contre, pour le « cross-validation », le GWS FIG 6: Box plot pour le SNP1573
simple validation a été réalisé sur 500 cycles
(c’est un échantillonnage aléatoire à chaque
cycle) ; On fait une moyenne des
« accuracy » obtenus sur chaque cycle pour
valider le modèle. Un accuracy de 0.57 a été
obtenu.
GWS FIG 7 : ANOVA pour le SNP1573
GWS FIG 8: Prediction génomique pour les BLUPs
(simple validation)

A- Progrès Génétique
Le calcul du progrès génétique a été réalisé sur les données d’épiaison moyenne (sur 3
environnements). Ces moyennes sont parfaitement corrélés avec les BLUPs . L’objectif c’est de
calculer le gain attendu si on fait la sélection pour les variétés tardives (déplacer la moyenne faire
la droite (GWS FIG 1). L’héritabilité au sens stricte a été calculée à partir de la matrice
d’apparentement réalisé sur les marqueurs; une héritabilité de 0.97 a été trouvée. 20 lignées
avec les nombres de jours à l’épiaison les plus élevés (12.34% de la totalité des individus) ont
été gardées, puis on applique la formule de calcul du progrès génétique. Un gain de 6.7 jours a
été obtenu sur une génération.

B- Discussion
Dans une première partie de cette étude, la méthode de détection de QTL à été utilisée en amont.
Cette méthode est largement adaptée aux types de données qu’on a : données sur les lignées
biparentales. Vu que dans une population biparentale, le déséquilibre de liaison est surtout liée à
la distance physique et les lignées sont proches génétiquement. Des analyses plus raffinées en
termes de précision de la détection ont été appliquées également(SIM, CIM). Ces méthodes,
particulièrement la « composite intervalle mapping », elle permet d’ignorer les effets des QTLs
non liés. La méthode de détection de QTLs a de nombreuses limites : i) elle ne peut pas être
appliquée à des populations structurées où le DL peut être lié non seulement à la distance
physique mais également à la structure génétique des populations (comme par exemple les
panels d’associations) ; ii) les modèles de détection de QTLs n’est pas forcément approprié à des
traits polygéniques et elle ne permet pas de bien séparer clairement les QTLs à effets majeurs
des QTLs à faibles effets. D’où l’intérêt parfois d’utiliser d’autres approches de recherche de QTLs
dont les modèles de génétique d’association. Les modèles de génétique d’association permettant
de corriger les effets de structure des populations ne sont pas forcément adaptés dans le cadre
de ce travail. On utilise ces modèles surtout lorsqu’on travaille avec une population dont les
relations d’apparentement n’est pas forcément connus et que le DL est liée à autres facteurs que
la distance physique. Par contre le modèle linéaire mixte multi-locus (MLMM) est d’une
importance capitale parce qu’elle permet de voir les QTLs à effet majeurs comparé au modèle
linéaire mixte à simple locus.
Dans ce cadre de ce travail, le modèle de détection de QTLs précis ( CIM) a abouti aux même
résultats que le modèle MLMM. On a trouvé pour tous les deux un QTL stable sur le chromosome
7B, bien que pour la méthode de détection de QTLs, d’autres QTLs adaptatifs ont été mis en
évidence. En effet la GWAS a été conduit sur les (BLUPs), on s’attend à ce que le QTL associé
soit stable (indépendant de l’effet environnement). Par contre, le modèle de GWAS (MLMM)
n’était pas nécessaire dans le cadre de lignée recombinantes. Parce qu’il n’y a pas vraiment un
effet de structure de population à considérer. Ce qui fait que les deux méthodes ont abouti aux
mêmes résultats pour les BLUPs.
La prédiction génomique réalisée sur les BLUPs a donné des résultats assez proche de la
littérature pour l’épiaison. Le « cross-validation » a permis de passer d’un accuracy de 0.40 à
0.57. Sur le Triticum aestivum, Huang et al (2016) ont trouvé un accuracy 0.56 pour ce même
trait en utilisant la méthode rrBLUP. On pourrait penser à utiliser les BLUEs à la place des
BLUPs ; les résultats restent presque identiques (non présenté dans ce travail) puisque ces deux
variables étaient parfaitement corrélées. D’autres approches peuvent être également envisagées
pour la prédiction génomique comme par exemple le Machine Learning (ML) couplé avec la
matrice de d’apparentement (ou similarité génétique). On pourrait faire l’hypothèse aussi qu’en
augmentant le nombre de marqueurs, peut être qu’on pourrait tomber sur des SNPs intéressants.
Ce qui n’est pas forcément évident puisqu’on est dans une structure génétique (lignées) ou le DL
est très liée à la distance physique, ça pourrait augmenter le risque d’avoir des marqueurs très
liés et faire baisser les puissances de détection ou n’apporte rien de plus.
Le gain génétique réalisé parais peu significatif en sélectionnant les individus avec pas mal de
variance génétique. Ce choix a été fait parce qu’on veux conserver de la variabilité qui pourrait
être exploitée au fur à mesure du processus de sélection. Contrairement, on pourrait sélectionner
les 2 ou 3 meilleures lignées ; ce qui allait réduire drastiquement la variance génétique
exploitable.
Références bibliographiques
Zikhali, M., & Griffiths, S. (2015). The effect of Earliness per se (Eps) genes on flowering time
in bread wheat. Advances in wheat genetics: From genome to field, 339-345.
Beales, J., Turner, A., Griffiths, S., Snape, J. W., & Laurie, D. A. (2007). A pseudo-response
regulator is misexpressed in the photoperiod insensitive Ppd-D1a mutant of wheat (Triticum
aestivum L.). Theoretical and Applied Genetics, 115(5), 721-733.
Law, C. N., Worland, A. J., & Giorgi, B. (1976). The genetic control of ear-emergence time by
chromosomes 5A and 5D of wheat. Heredity, 36(1), 49-58.
Nishimura, K., Moriyama, R., Katsura, K., Saito, H., Takisawa, R., Kitajima, A., & Nakazaki,
T. (2018). The early flowering trait of an emmer wheat accession (Triticum turgidum L. ssp.
dicoccum) is associated with the cis-element of the Vrn-A3 locus. Theoretical and Applied
Genetics, 131(10), 2037-2053.
Maccaferri, M., Sanguineti, M. C., Corneti, S., Ortega, J. L. A., Salem, M. B., Bort, J., ... &
Tuberosa, R. (2008). Quantitative trait loci for grain yield and adaptation of durum wheat (Triticum
durum Desf.) across a wide range of water availability. Genetics, 178(1), 489-511.
Gupta PK, Balyan HS, Sharma S, Kumar R. (2020) Genetics of yield, abiotic stress tolerance
and biofortification in wheat (Triticum aestivum L.). Theor Appl Genet 133:1569–1602
Yan L, Fu D, Li C, Blechl A, Tranquilli G, Bonafede M et al (2006) The wheat and barley
vernalization gene VRN3 is an orthologue of FT. Proc Natl Acad Sci USA 103:19581–19586
Huang, M., Cabrera, A., Hoffstetter, A., Griffey, C., Van Sanford, D., Costa, J., ... & Sneller,
C. (2016). Genomic selection for wheat traits and trait stability. Theoretical and Applied
Genetics, 129(9), 1697-1710.
Annexe 1 : Tableau résultats de l’analyse de variance, p value, moyenne du génotype
au marqueurs, position et distance des principaux marqueurs significatifs.
cappelles2013
marqueur pos Distance p-value R2 moy.A moy.B a
SNP749 4A 55.6 2.73E-05 0.1110512 161.4667 163.7903 1.161828
SNP752 4A 58.4 2.30E-05 0.1115692 161.3373 163.6479 1.155269
SNP1572 7B 4.2 1.44E-08 0.1899903 164.1207 161.1031 1.508798
SNP1573 7B 13.7 1.57E-13 0.315859 164.7255 160.8526 1.936429
SNP1574 7B 17.3 2.66E-08 0.2169434 164.6038 161.2763 1.663729
SNP1575 7B 17.7 9.50E-07 0.1835134 164.3913 161.3467 1.522319
SNP1576 7B 29.8 1.41E-08 0.2059694 164.2778 161.1023 1.587753
SNP1577 7B 41.8 5.07E-07 0.1699232 164.1053 161.1852 1.460039
SNP1582 7B 52.3 3.03E-05 0.1119848 163.6667 161.325 1.170833

mauguio2013
pos Distance p-value R2 moy.A moy.B a
SNP273 2A 111.9 2.86E-05 0.1542724 136.1408 132.5833 1.778756
SNP274 2A 113 1.10E-05 0.134796 135.6026 132.569 1.516799
SNP1152 5B 123.6 1.89E-05 0.1237355 136.5417 133.4301 1.55578
SNP1156 5B 126.3 2.30E-05 0.12058 136.5192 133.3778 1.570726
SNP1572 7B 4.2 3.68E-10 0.2270279 136.931 132.8866 2.022218
SNP1573 7B 13.7 2.71E-16 0.373023 137.8431 132.5474 2.647884
SNP1574 7B 17.3 4.05E-15 0.3858288 138.1132 132.6711 2.721077
SNP1575 7B 17.7 1.56E-14 0.392253 138.0435 132.4533 2.795072
SNP1576 7B 29.8 2.01E-07 0.1760836 136.7593 133.0909 1.834175
SNP1577 7B 41.8 1.71E-06 0.155464 136.4561 132.9753 1.740416
SNP1578 7B 44 5.28E-06 0.1345205 136.4262 133.2235 1.60135

grisolles2013
pos Distance p-value R2 moy.A moy.B a
SNP1189 5B 157.3 2.48E-05 0.1188687 137.9902 134.6576 1.666294
SNP1572 7B 4.2 3.30E-10 0.2281054 138.5345 134.0412 2.246623
SNP1573 7B 13.7 8.96E-18 0.4017265 139.6275 133.6474 2.990041
SNP1574 7B 17.3 8.89E-10 0.256844 139.1226 134.1842 2.469215
SNP1575 7B 17.7 8.52E-10 0.272085 139.2935 134.1667 2.563406
SNP1576 7B 29.8 2.73E-08 0.1986272 138.2593 134.0739 2.092698
SNP1577 7B 41.8 8.77E-11 0.2669205 138.9298 133.8704 2.529727
SNP1578 7B 44 3.13E-09 0.2169767 138.2869 133.9882 2.149325
SNP1579 7B 46.9 2.56E-07 0.1617559 138.1 134.3313 1.884337
SNP1580 7B 48.1 4.10E-06 0.1469324 137.8707 134.3333 1.768678
SNP1581 7B 51.9 5.49E-06 0.1315158 137.8456 134.4259 1.709831
SNP1582 7B 52.3 4.50E-06 0.1337581 137.8986 134.4125 1.743025
SNP1583 7B 52.6 5.86E-06 0.1350696 137.9697 134.4872 1.741259
SNP1586 7B 57.7 2.66E-05 0.109935 137.6406 134.4667 1.586979
SNP1587 7B 58.9 2.67E-05 0.11058 137.7313 134.5698 1.580788
SNP1592 7B 63.7 1.65E-05 0.1335083 137.5081 134.25 1.629032
SNP1593 7B 64.1 1.93E-05 0.1149486 137.5411 134.3291 1.605991
SNP1594 7B 64.4 1.54E-05 0.1270869 137.4262 134.1266 1.649824
SNP1596 7B 67.7 5.26E-07 0.1661375 138.0593 134.2256 1.916856
SNP1597 7B 68 7.22E-06 0.1309057 137.7917 134.3605 1.715601
SNP1598 7B 68.7 2.73E-06 0.1478368 137.9692 134.3267 1.821282
SNP1599 7B 70.3 3.89E-07 0.1909646 138.1863 134.0822 2.052041
SNP1600 7B 71.2 2.52E-05 0.1126493 137.6029 134.4578 1.572555
SNP1603 7B 76 1.00E-05 0.1223057 137.7836 134.5235 1.630026

Annexe 2 : Distribution des p-value le long des chromosomes (avec les seuil de
Bonferroni) : (résultats de l’analyse de variance)
Résultats analyse pour SIM et CIM

Methode : SIM
Env: cappelle2013
Marquers plus proche QTL chr pos a %Variabilite
SNP749 c4A.loc56 4A 56 1.16 11
SNP1573 c7B.loc11.5 7B 11.5 1.93 31.5

Env: grisolles2013
SNP1152 c5B.loc124 5B 124 1.55 12.3
SNP1573 c7B.loc12 7B 12 1.93 31.5

Env: mauguio2013
SNP273 c2A.loc112 2A 112 1.78 15.4
SNP1156 5B 126 1.57 12
SNP1573 c7B.loc15 7B 15 1.93 31.5

Methode : CIM
Env: cappelle2013
Marqueurs plus proche loci chr pos a %Variabilite
SNP749 4A 55.6 1.16 11
SNP1573 c7B.loc11.5 7B 11.5 1.93 31.5

Env: grisolles2013
SNP1573 c7B.loc12 7B 12 1.93 31.5
Env: mauguio2013
SNP1156 c5B.loc118.5 5B 118.5 1.57 12
SNP1573 c7B.loc15 7B 15 1.93 31.5

Vous aimerez peut-être aussi