Vous êtes sur la page 1sur 10

Les marqueurs molculaires en gnomique structurelle et

fonctionnelle, les SNP concepts et applications.


Hespeels Boris
Rsum ; Les marqueurs molculaires permettent de caractriser un gnome de manire fiable, spcifique et
rapide. Ces dernires annes, leur utilisation na jamais cess de crotre tant en gnomique fonctionnelle quen
gnomique structurelle. Au milieu de marqueurs comme la RFLP, lAFLP et les microsatellites, les SNP (Single
Nucleotide Polymorphism) simposent progressivement comme les marqueurs molculaires de demain. Tout au
long de ce travail, des techniques choisies visant mettre en vidence les SNP seront explicites. La technique de
lEcoTilling sera un peu plus dveloppe tant une nouvelle mthode de dtection de SNP grande chelle,
reproductible et abordable financirement. Une brve prsentation de la gntique dassociation, permettant la
mise en vidence dassociations entre un profil molculaire donn et un phnotype, clturera cet article. Ce
travail a t rendu possible grce Mr P. Van Cutsem que je remercie pour ses nombreuses relectures, critiques
et encouragements tout au long de ce travail ainsi quaux membres de lURBV pour leur accueil.

Introduction
Ltude de gnomes, la dtermination et la
comparaison de gnotypes ne peuvent aujourdhui
tre ralises par squenage systmatique que pour
quelques espces modles, essentiellement pour une
raison de cot. Malgr lmergence de nouvelles
technologies permettant un squenage plus rapide et
moins cher - dont le systme genome sequencer
20 de la socit ROCHE qui permet en un seul
cycle de 4h, de squencer, dordonnancer et de
comparer 20 millions de bases avec une exactitude
voisine de 100 %1 - lalternative au squenage
choisie par de nombreux laboratoires travers le
monde reste lutilisation de marqueurs molculaires.

Les marqueurs molculaires permettent de


caractriser un gnome de manire fiable, spcifique
et rapide. Le prsent travail introduit le concept de
marqueurs molculaires en gnomique structurelle et
fonctionnelle. La gntique fonctionnelle tant
dfinie comme lapplication des mthodes
exprimentales globales visant valuer la fonction
des gnes, en utilisant les donnes et outils mis
disposition par la gnomique structurelle comme la
mise en place de cartes gntiques.

La notion de polymorphisme est omniprsente dans


les marqueurs molculaires abords par ce travail. La
diffrence entre individus d'une mme espce rside
dans le polymorphisme du gnome, certaines
squences tant conserves, d'autres prsentant des
variations de squence. On distingue ainsi trois types
de polymorphisme: le polymorphisme de squence, le
polymorphisme
d'insertiondltion
et
le
polymorphisme de nombre d'units de rptitions
dans les rgions rptes.

Lutilisation du concept de marqueur molculaire


utilis dans ce travail tire ses rfrences du livre
Les marqueurs molculaires en gntique et
biotechnologies vgtales, D. de Vienne, INRA,
1998 . Le marqueur molculaire y est dfini
comme un locus polymorphe capable de
renseigner sur le gnotype de lindividu qui le porte
et dinformer sur le gnotype dun ou de locus
voisins. Le marqueur a une position dfinie dans le
gnome et doit idalement prsenter les
caractristiques suivantes :

Le marqueur idal est codominant, ce qui


signifie quun htrozygote peut tre
diffrenci de lhomozygote au locus en
question
Il est non pistatique, c'est--dire que le
gnotype peut tre lu partir de son
phnotype sans influence du gnotype des
autres locus. Il y a une absence dinteractions
intra et inter locus.
Le marqueur est neutre, une modification des
locus marqueurs na pas dautres effets
phnotypiques que ceux qui permettent de
dterminer son gnotype.
Le gnotype peut tre infr partir du
phnotype quel que soit le milieu, un bon
marqueur molculaire est donc insensible au
milieu.

Il est possible de mettre en vidence le


polymorphisme de squence directement par un
squenage de fragments homologues. Inversement,
les marqueurs molculaires abords dans ce travail
permettent, eux, la mise en vidence du
polymorphisme de faon indirecte et non exhaustive
mais de manire rapide, fonde sur la dtection de
diffrences: de sites de restriction; de conformation;
de stabilit; de site d'hybridation d'amorces
oligonuclotidiques.
Ce travail se limitera ltude des marqueurs
molculaires de type ADN. Ces marqueurs sont

Le marqueur doit tre polymorphe, c'est-dire quil doit possder plus dun allle au
moins dans la population tudie.

-1-

L'AFLP
ou
Amplified
Fragment
Lenght
Polymorphisme, (Vos et al, 1995)2, combine la
technique de la RFLP la PCR. La RFLP utilise ainsi
les enzymes de restriction et l'hybridation d'amorce
PCR. L'ADN est cliv par deux enzymes de
restriction (exemple Eco RI et Mse I2). Des
adaptateurs de squences connues (20pb) sont ajouts
de part et d'autre des fragments d'ADN. Les bouts
ajouts constituent un template pour la fixation
d'amorces PCR. On amplifie ainsi les fragments
d'ADN via PCR. Les conditions sont prvues pour
privilgier l'amplification des fragments Eco RIMseI au dtriment des fragments Eco RI-Eco RI et
MseI-MseI 2. Dans une deuxime tape dite slective,
on utilisera les mmes amorces mais prolonges
l'extrmit 3' de quelques nuclotides arbitraires (1
3) 3. Cette tape permet de n'amplifier que les
fragments complmentaires des bases arbitraires
entranant une rduction du nombre de fragments
amplifis. Une centaine de fragments sont finalement
rvls en gel d'acrylamide aprs lectrophorse.
Ceux-ci correspondent aux fragments dont le
polymorphisme provient des sites de restriction mais
galement des sites d'hybridation des bases
arbitraires.

disponibles en nombres quasi illimits mais


prsentent galement lavantage dtre indpendants
du stade de dveloppement ou de lorgane analys,
lADN tant le mme dans tous les tissus.
Il existe un nombre croissant de marqueurs
molculaires et de techniques pour mettre en
vidence ces derniers. Il est impossible de dresser une
liste exhaustive de la totalit des marqueurs et des
techniques existantes ! Nous avons donc slectionn
un certain nombre de marqueurs et de techniques en
fonction de leur utilisation, pour une raison historique
(cas de la RFLP) ou pour leur potentiel dans le futur
(voir les microarrays par exemple).
Nous commencerons par rappeler les techniques
RFLP, AFLP, lutilisation et la dtection de
microsatellites. Nous prsenterons ensuite les
principales proprits des Single Nucleotide
Polymorphism (SNP) et un choix de mthodes de
dtection de ceux-ci. Aprs avoir prsent la
technique de lEcoTilling et le concept de gntique
dassociation, nous expliciterons les qualits des SNP
comme marqueurs molculaires ainsi que leur
capacit de devenir un marqueur davenir travers de
nombreuses applications actuelles et futures en
biologie animale et vgtale.

Les microsatellites ou SSR (Single Sequence


Repeats), sont des motifs d'une six5 bases rptes
n fois dans le gnome, lindice n pouvant
varier dun individu lautre. Les microsatellites se
trouvent travers tout le gnome. Il y a environ 6.5 x
105 microsatellites disperss dans le gnome
humain6. Hautement polymorphe, la variation du
nombre de rptitions serait due un phnomne de
glissement de rptition lors de la rplication de
l'ADN.

Marqueurs molculaires: RFLP,


AFLP, SSR, SNP
La RFLP (dveloppe par Botstein et al.1980) ou
Restriction Fragment Lenght Polymorphism repose
sur des enzymes de restriction et la variabilit de
taille des fragments d'ADN obtenus via ces enzymes
de restriction. Une enzyme de restriction coupe
l'ADN dans des squences en palindrome appeles
sites de restriction. Le site de restriction est
spcifique de l'enzyme qui reconnat des squences
de 4, 6, 8 ou parfois plus de paires de bases. Un grand
nombre de fragments dADN peut tre obtenu par la
digestion dun gnome par une enzyme de
restriction : une enzyme ayant un site de
reconnaissance de 6 bases va couper l'ADN toutes les
4096 bases en moyenne. Un gnome de 109 bases va
donc produire environ 25.000 fragments de longueurs
variables 3. La spcificit d'une enzyme de
restriction est telle qu'une variation d'un nuclotide
dans la squence de restriction empche le clivage du
site par l'enzyme. Nous observerons donc un
polymorphisme de longueur de fragment en fonction
de la prsence ou labsence d'un site de restriction. La
RFLP nest plus que rarement utilise aujourdhui.
Pour des informations concernant la mthode
exprimentale de la RFLP, on se rfrera Botstein
et al. (1980)4 ou de Vienne (1998)2.

C'est l'aide de PCR que l'on va mettre en vidence


les microsatellites. Si un microsatellite donn n'est
pas spcifique d'un locus, les rgions flanquantes, par
contre le sont. Une paire d'amorces spcifiques de ces
rgions flanquantes amplifiera donc ce seul
microsatellite 2. On spare les fragments amplifis
par lectrophorse et une diffrence de la taille du
microsatellite amplifi se traduit directement dans
une variation de la distance de migration.
Les microsatellites sont entre autres utiliss en
criminalistique pour comparer l'ADN d'un suspect
avec l'ADN prlev sur le lieu du crime.
La figure 1. reprend les principales tapes de l'AFLP,
de lRFLP et des SSR.

-2-

Tableau comparatif des marqueurs RFLP, AFLP et SSR.

Marqueurs Avantages
RFLP

AFLP

SSR

Inconvnients

La RFLP est une mthode fiable et facilement


transfrable entre laboratoires.
Il s'agit d'un marqueur codominant.
Aucune information sur la squence n'est
requise.
La technique est principalement base sur des
homologies de squences, elle peut tre
utilise pour des analyses phylogntiques
entre espces.
Elle est utilisable pour faire des cartes
gntiques de liaisons.
Il sagit dun marqueur locus spcifique qui
peut galement permettre ltude de syntnies
(une syntnie tant la prsence simultane sur
le mme chromosome de deux ou plusieurs
loci, indpendamment de leur liaison
gntique).
La RFLP est une technique simple ne
ncessitant pas de sondes particulires.

LAFLP permet un survol rapide de


l'ensemble du polymorphisme du gnome.
Elle est hautement reproductible.
Il ny a pas besoin de connatre une squence
et de crer des sondes spcifiques.
Elle permet la cration facile et rapide de
cartes gntiques.
LAFLP permet la cration dun profil de
transcrits qui reflte lexpression et la
rpression de gnes (AFLP-cDNA)
Cette technique peut tre applique de
nombreuses espces (animaux, plantes,
bactries).
LAFLP ne ncessite aucune connaissance
pralable de squences du gnome de la
plante tudie, ni la construction des banques
gnomiques ou cDNA, lencontre des SSR
ou des RFLP3.

Les microsatellites sont des marqueurs codominants.


Ils sont trs largement utiliss.
Il y a une grande frquence de SSR dans le
gnome.
Les microsatellites sont bien rpartis travers
tout le gnome7.
Ils sont reproductibles.
Les microsatellites sont faciles manipuler3.
On observe un polymorphisme lev de SSR
dans la population humaine8.

-3-

La RFLP ncessite une grande


quantit d'ADN.
Elle n'est pas automatisable, vu les
tapes de transfert et d'hybridation2.
Certaines espces possdent un taux
peu lev de polymorphisme.
Un faible nombre de locus sont
dtects par exprience.
Cette technique ncessite d'avoir
recours une banque de sondes.
La mthode est peu rapide.
Son cot est lev.
Il est ncessaire de se transmettre les
sondes entre laboratoires3.

La gnration d'une grande quantit


d'information ncessite une analyse
automatise
et
la
technologie
informatique.
Ce sont des marqueurs dominants.
Les marqueurs AFLP sont souvent
localiss aux centromres et aux
tlomres.
Le laboratoire doit tre form dans
lanalyse de donnes.
LAFLP, tant couverte par un brevet
de la socit nerlandaise Keygene qui
a mis au point cette technique, est une
mthode coteuse.
Ces difficults limitent l'utilisation de
l'AFLP grande chelle pour des
applications comme la slection
assiste par marqueurs.

La prparation des microsatellites est


assez lourde car il faut cribler une
banque gnomique enrichie avec une
sonde du microsatellite, squencer les
clones positifs, synthtiser les amorces
oligonuclotidiques et tester les paires
d'amorces dans un chantillon
d'individus 2.

Actuellement, les SNP du gnome humain sont


tudis principalement dans le cadre du projet
HapMap (voir www.hapmap.org). Ce projet HapMap
dfinit des SNP comme tant des marqueurs uniques
dun haplotype. Le but du projet HapMap est de
pouvoir dfinir des haplotypes, soit des rgions
conserves, pouvant tre retrouves dans plusieurs
individus dune mme origine par exemple. Un
haplotype peut tre dfini comme une combinaison
dallles caractrisant un individu. Ainsi dans une
population tire au hasard, on peut trouver diffrents
haplotypes en diffrentes proportions. Le projet
HapMap identifie les haplotypes courant dans quatre
populations issues de divers endroits du monde.
Cest ainsi quen dtectant les SNP marqueurs
dune personne (gnotypage), les chercheurs seront
en mesure de caractriser tous les haplotypes prsents
dans le gnome de cette personne. On estime que le
nombre de SNP ncessaires pour contenir la plupart
de linformation sur la variation gntique se situe
entre 300 000 et 600 000, soit beaucoup moins que
les 10 millions de SNP courants . A long terme on
espre pouvoir faire le lien entre les haplotypes et un
phnotype donn. Ainsi, par exemple dans le milieu
mdical, un haplotype donn correspondrait un
facteur tendant vers un certain type de pathologie.11

Les SNP (prononcs snip ) ou Single Nuclotide


Polymorphism
constituent
la
majorit
du
polymorphisme du gnome (90% du polymorphisme
du gnome humain9). La base de l'information
contenue dans cette introduction aux SNP est tire,
sauf indication contraire, du livre Prcis de
gnomique, Gibson de Boek, 2004 . Les SNP sont
des mutants naturels qui ne concernent qu'un seul
nuclotide. Remarquons avant tout la diffrence entre
polymorphisme et mutation: un SNP provient d'une
mutation dans une population. Mais lors de
lobservation dun variant pour une squence donne
dans une population, le SNP observ nest plus une
mutation car il correspond un vnement depuis
longtemps rvolu, il n'est plus qu' un variant de
squence rare ou d'un polymorphisme .
On observe un SNP lors du changement d'une base en
une autre : transition ou transversion (les insertions et
dltions d'une seule base sont galement reconnues
comme SNP). Les transitions tant des
changements d'une purine en une autre purine ou le
changement d'une pyrimidine en une autre
pyrimidine. Les transversions sont des changements
de purines en pyrimidines et vice versa .
La classification la plus courante des SNP se rfre
la nature de la base modifie. Ainsi, les SNP non
codants se trouvent dans les rgions 5 ' et 3' UTR et
dans les introns. Les SNP codants peuvent tre des
polymorphismes de substitution - changement de
l'acide amin cod - ou des polymorphismes
synonymes - changement du codon mais l'acide
amin reste le mme-. Les frquences des diffrentes
combinaisons de SNP possibles dans le gnome ne
sont pas les mmes. Ainsi 2/3 des SNP impliquent
une transition de C en T9. En comparant deux
gnomes humains pris au hasard, on trouve
approximativement un SNP toutes les 1000pb dans
les rgions non codantes et un SNP toutes les 3000pb
dans les rgions codantes8.

Au-del de lintrt pour le marqueur molculaire, les


SNP permettent lidentification de gnes et la mise
en vidence de liens entre la prsence de SNP et un
phnotype donn. Les SNP sinscrivent ainsi en
gnomique fonctionnelle pour ltude de gnes
candidats. Le gne candidat tant un gne susceptible
dtre impliqu dans une fonction dintrt que lon
va pouvoir tudier grce aux SNP qui le caractrisent.
Certains SNP se trouvant dans des rgions codantes
affectent le phnotype en changeant un acide amin
en un autre12 . On a pu ainsi montrer que la prsence
de certains SNP caractrisait une maladie ou une
propension dvelopper une maladie (maladie
dAlzheimer, Martin et al, 2000 ou le diabte type II
Horikawa et all, 2002). La prsence dun SNP dans
une rgion rgulatrice, promotrice, peut aussi affecter
la transcription dun gne. La majorit des SNP nont
cependant pas deffet direct sur le phnotype !

Compars aux autres marqueurs molculaires, les


SNP prsentent l'avantage d'une rpartition
homogne dans tout le gnome et d'tre
excessivement nombreux. Ce nombre lev de SNP
permet la cration de cartes gntiques de haute
densit. Les SNP permettent encore ltude de
recombinaisons
et
de
rarrangements
chromosomiques15. Avec leur faible taux de
mutations par gnration (10-8) les SNP peuvent
servir de marqueurs pour suivre l'volution des
espces (Crow et al., 1995; Li et al., 1996). Le faible
taux de mutation par gnration permet galement
lutilisation des SNP pour raliser des tests de
paternit10.

Il existe actuellement de nombreuses techniques


visant mettre en vidence la prsence de SNP dans
l'ADN. Dans ce travail, nous nous limiterons l'tude
des techniques suivantes: Squenage complet du
gnome, ASO, DASH, puces ADN, TaqMan,
molecular beacons et SSCP.

Mthodes de dtection des SNP


La mthode la plus simple au niveau thorique pour
dtecter des SNP consiste squencer
systmatiquement des gnomes et comparer ensuite

-4-

ces derniers. Le squenage complet tant une


opration coteuse et lourde, la plupart des stratgies
d'identification de SNP commencent par la
comparaison de quelques individus avant de vrifier
les rsultats obtenus sur un chantillon plus grand.
Ces techniques favorisent la mise en vidence de
SNP non rares, et limitent le nombre total de
polymorphismes transmis au sein d'une population.
Les squences dADN tudies proviennent
majoritairement dEST, Expressed Sequence Tag, qui
sont des squences dADN transcrits. Il sagit en effet
dADN obtenu sur base dARNm. Les SNP trouvs
seront donc des SNP gniques, provenant de gnes et
sont intressants tudier car la probabilit quils
aient un impact sur le phnotype est plus grande que
pour un SNP pris alatoirement dans le gnome,
pouvant tre localis dans une squence non
transcrite. On peut ainsi se rfrer la base de
donnes Genbank pour trouver des squences de
nombreuses espces et ainsi comparer plusieurs
gnomes d'une mme espce. Cependant, les fichiers
Genbank peuvent fournir des squences avec des
scores de mauvaise qualit. Il est donc difficile de
dterminer si la diffrence rsulte d'une erreur de
lADNc de dpart13. Le site NCBI possde galement
une base de donnes de SNP ainsi que divers outils
informatiques pour traiter ceux-ci. Les banques de
donnes NCBI et GenBank ne constituent quun bref
aperu des innombrables sites permettant laccs
des bases de donnes de SNP.

mal apparie, soit une mutation par rapport la


squence de rfrence de la sonde, peut entraner un
changement de la temprature de fusion de 3 5
degrs. On peut effectuer de nombreux tests ASO en
ralisant l'exprience sur une plaque multipuits (96
ou 384). Il est ainsi possible de tester la prsence de
SNP dans diffrentes parties du gnome en fonction
de la squence de la sonde. Les sondes sont
marques de telle sorte quun appariement parfait
fournit un signal maximal et qu'un msappariement
ne fournit aucun signal. La mthode ASO est une
mthode de gnotypage grande chelle. Elle
prsente cependant des inconvnients tel un manque
de prcision et la ncessit d'employer de grandes
quantits de produits radioactifs. Il nest toutefois pas
ncessaire dutiliser une sonde radioactive : il existe
maintenant des fluorophores, plus pratiques et moins
dangereux utiliser.
Il est galement possible dutiliser deux sondes.
Celles-ci ont une squence identique except pour
une seule base. Si lon veut mettre en vidence la
prsence dun SNP sur une squence amplifie par
PCR par exemple, on mettra en contact le produit
PCR avec les deux sondes spcifiquement dessines
pour la mise en vidence dun SNP. On aura
pralablement dfini les conditions exprimentales,
notamment de temprature, pour favoriser
lhybridation de la sonde identique la squence
amplifie. Un mauvais appariement, soit un SNP,
aura pour consquence de rendre lhybridation sondesquence ADN instable. En fonction du signal mis
par lune ou lautre sonde, on pourra mettre en
vidence la nature du SNP10. Ce principe dit dAllel
specific hybridisation est illustr en figure 2.

La mthode de squenage- comparaison a t


utilise pour dtecter des SNP dans le gnome
humain via le recouvrement de BAC, Bacterial
Artificial Chromosome, provenant dindividus
diffrents. De mme, des SNP ont pu tre mis en
vidence partir de squenage de clones provenant
de Reduced Representation Libraries . En
rduisant la complexit du gnome en clonant des
fragments de gnome choisis, en construisant un
gnome de taille rduite, un mme locus tait
squenc de nombreuses fois dans plusieurs clones
aux gnomes diffrents (Altshuler et al. 2000). Tous
ces clones pouvaient tre compars au gnome
humain de rfrence. La mthode shotgun a permis
galement de mettre en vidence de nombreux SNP
chez l'Homme (Venter et al. 2001). Des morceaux de
squences obtenus par la mthode shotgun ont ainsi
t compars au gnome de rfrence. Plus on
compare de gnomes, plus le nombre de SNP
augmente14.

La mthode DASH (Howell et al 1999), Dynamic


Allele Specific Hybridisation, directement inspire de
la technique ASO, permet une plus grande spcificit
des sondes ainsi qu'un plus grand rendement. Cette
technique se base comme l'ASO sur la temprature
d'hybridation entre la sonde et le template, soit la
squence susceptible de contenir un SNP. Via PCR,
on slectionne la squence cible et on lui ajoute une
biotine. Le produit PCR est ensuite dpos dans un
puits de plaque de micro-titration tapiss de
streptavidine : la squence cible restera colle la
streptavidine. Le brin complmentaire est limin par
lavage dans une solution dnaturante. Aprs ajout des
nuclotides-sondes, ceux-ci vont aller s'hybrider la
squence complmentaire. Le colorant utilis, Syber
Green I, va s'intercaler entre les bases d'ADN double
brin. En augmentant progressivement la temprature
de la plaque de 35 85, les sondes
oligonuclotidiques vont progressivement se dtacher
de leur template : on observe alors une diminution de
la fluorescence. Comme l'on sait que les sondes
parfaitement hybrides rsisteront des tempratures
plus leves que les sondes prsentant des

L'ASO ou lhybridation d'oligonuclotides alllespcifiques est comme son nom l'indique une
technique permettant la dtection de SNP par
hybridation de sondes. Les sondes employes sont
longues
d'environ 15 nuclotides. Ces sondes
possdent une temprature de fusion spcifique en
fonction de leur contenu en GC. Cependant, une base

-5-

msappariements, on pourra facilement dtecter la


prsence de SNP. Le schma de la mthode DASH
est prsent en figure 3. Les autres avantages de cette
technique sont sa simplicit (aucune enzyme utilise
lors de la procdure) et le fait que les mmes
conditions standards permettent la mise en vidence
de locus identiques. Il est donc possible de rpter
lexprience et de retrouver les mmes rsultats.
Cependant la procdure visant slectionner le
template reste encore complexe et le cot de la
streptavidine encore lev. Les sondes peuvent
galement prendre des structures secondaires altrant
la puissance de l'exprience15.

rapporteur tandis qu' l'extrmit 3', on rajoute un


quencher. On peut faire correspondre un rapporteur
un SNP particulier (exemple, VIC pour G et FAM
pour A). Les sondes TaqMan possdent galement
leur extrmit 3' un MGB (minor groove binder) qui
permet une meilleur discrimination alllique. Il
stabilise l'hybridation de la sonde TaqMan au
Template.
La figure 4 illustre les diffrentes tapes de
l'utilisation de TaqMan dans la dtection de SNP.
Deux amorces PCR permettent d'amplifier une
squence d'ADN (150 pb) contenant le SNP d'intrt.
Une PCR est dmarre, lorsque l'ADN est dnatur
(suite une augmentation de la temprature), les
sondes TaqMan peuvent venir s'hybrider au SNP si la
squence est homologue. On a mis deux sondes
TaqMan, chacune homologue d'un SNP et marque
diffremment. Dans le cadre 2, le SNP correspond
un C (sur le template) et un G sur la sonde TaqMan.
A ce stade, il n'est pas encore possible de dire quel
SNP se trouve sur la squence amplifie. Aprs
fixation de lamorce gauche, la DNA polymrase
synthtise le brin complmentaire de l'ADN. Il s'agit
d'une DNA polymrase ampli TaqGold. Celle-ci
possde une activit exonuclase 5'. Elle dgrade la
sonde TaqMan fixe sur le template et libre donc le
marqueur du quencher. Il devient possible de dtecter
le marqueur. La couleur de celui-ci est fonction du
SNP prsent sur la squence d'intrt 13,15, 18, 19.

LASO (ainsi que la mthode DASH16) peuvent tre


utiliss pour la ralisation de puces ADN,
microarrays, destines la mise en vidence de SNP
grande chelle. Les microarrays permettent en effet
de raliser en une seule tape un grand nombre
dhybridations. Dans le cas des microarrays, une srie
doligonuclotides sont attachs chimiquement sur
une surface solide comme une plaque de verre. Un
centimtre carr peut accueillir jusqu 10.000
oligonuclotides diffrents17. Ces oligonuclotides
peuvent ensuite tre hybrids des squences dADN
amplifies via PCR. Pour chaque SNP il existe
environ 10 oligonuclotides diffrents. Cette
multiplication doligonuclotides par SNP est
ncessaire car lhybridation entre loligonuclotide et
la squence ne dpend pas seulement de la prsence
ou non dun SNP mais galement des rgions
flanquantes du SNP ainsi que de la structure
secondaire de la squence cible15. Cest pourquoi, il
est difficile dobtenir les conditions optimales
permettant lanalyse simultane dun grand nombre
de SNP10.

Les molecular beacons (commercialises sous le


nom de hairloop par la socit Serial Genetics28) sont
des squences oligonuclotidiques qui possdent une
squence complmentaire aux deux extrmits d'une
squence spcifique d'une rgion o se trouve un
SNP. Les deux extrmits tant complmentaires, la
sonde adopte une conformation en pingle cheveux.
De plus, l'extrmit 5' se trouve un fluorophore, et
un quencher l'extrmit 3'. Dans la conformation en
pingle cheveux, le quencher se retrouve en face du
rapporteur et inhibe donc son signal. Lorsque la
squence centrale est complmentaire de la squence
du gnome sonder, la sonde se dplie et s'hybride
l'ADN complmentaire. La distance entre le quencher
et le rapporteur est alors trop grande pour que le
quencher absorbe l'nergie du rapporteur. Dans le
typage d'un SNP, on utilise deux molecular beacon:
Un spcifique de l'allle sauvage et l'autre, spcifique
de l'allle mutant, chacun tant marqu d'un
fluorophore diffrent permettant une discrimination
des allles dans une seule raction PCR13, 15, 20.

La mthode TaqMan (Holland et al., 1991) est une


mthode de dtection directe. Elle permet de coupler
l'amplification et le gnotypage en une seule tape.
Les techniques de dtection directes (TaqMan,
balises molculaires (Stem Loop), DOL-FRET)
permettent une conomie de travail et de temps au
laboratoire et rduisent le risque d'erreur en limitant
le nombre de manipulations.
La mthode TaqMan commercialise par Applied
Biosystems exploite le principe FRET (Fluorescence
Resonance
Energy
Transfert)
entre
deux
fluorophores, un rapporteur et un quencher . Le
quencher empche la visualisation du rapporteur
en absorbant l'nergie mise par le rapporteur excit.
L'effet quencher est fonction de la distance. Ainsi, si
les deux fluorophores sont trop loigns l'un de
l'autre, le quencher n'inhibera plus le rapporteur.

Il est possible de dtecter plusieurs cibles diffrentes


dans une seule et mme raction. Cela se ralise
l'aide de plusieurs molecular beacons spcifiques de
cible diffrentes et chacune marque par une couleur
diffrente. La limite du nombre de diffrents
fluorophores utiliss est dtermine par la capacit de

Il est possible de raliser une sonde TaqMan


correspondant une squence spcifique d'un SNP
tester. A l'extrmit 5' est ajout un chromophore

-6-

dtection des
simultanment
diffrentes.

instruments
plusieurs

pouvoir
longueurs

dtecter
d'ondes

prcision de l'exprience. Les enzymes utilises


restent cependant relativement coteuses15.
La
SSCP,
Single-Stranded
Conformation
Polymorphism, permet la dtection de SNP sur base
de la configuration tridimensionnelle dun brin
dADN. En effet, un simple brin dADN adopte une
structure particulire. Une variation dun ou plusieurs
nuclotides se traduira directement par une
modification de la structure 3D du brin. Dans un
environnement aux paramtres dfinis, une squence
donne
prendra
une
structure
spcifique.
Lobservation dun changement de la conformation
3D dun simple brin dADN sera, dans ces
conditions, synonyme dune variation de la squence.

L'avantage de la mthode TaqMan et du molecular


beacon rside dans le fait que tout se fait
principalement lors d'une seule tape combinant PCR
et dtection10. Linconvnient du systme molecular
beacon est la difficult de conception des sondes.
Chaque sonde doit tre dessine afin que la boucle
puisse correctement se dplier lors de son hybridation
sa cible. Un profil de dnaturation doit tre dfini
pour chaque sonde dessine21.
La figure 5 reprend le principe du Molecular Beacon.
Le pyrosquenage est une mthode base sur une
cascade de ractions enzymatiques de 4 enzymes et
de leurs substrats. Cette raction produit de la lumire
lorsquun nuclotide est complmentaire la matrice.
La dtection se fait sur base du re-largage d'un
pyrophosphate lors du passage de lADN polymerase
et de l'ajout d'une base. On utilise ainsi une solution
contenant un simple brin d'ADN avec une amorce,
une ADN polymerase, de l'ATP sulfurylase,
luciferase et apyrase. Les quatre nuclotides sont
ajouts dans la solution dans un ordre dfini. Lorsque
le nuclotide ajout correspond la base qui suit
lamorce du cot 3' et s'hybride, lADN polymrase
se met en marche et gnre un pyrophosphate.
L'extension de lamorce doit inclure la prsence
d'adenosine 5' phosphosulfate (APS) et l'enzyme ATP
sulfurylase qui convertit l'APS en ATP en prsence
de pyrophosphate22. La luciferase utilise alors l'ATP
form pour gnrer de la lumire. La lumire gnre
tant fonction du nombre de nuclotides incorpors,
cette mthode est donc galement intressante pour
des gnomes polyplodes (Rickert et al, 2002). En
effet, le pyrosquensage est une mthode
quantitative : un individu polyplode gnrera une
raction plus importante quun individu haplode. De
mme, un individu homozygote pourra tre
diffrenci dun htrozygote pour un SNP
particulier, lhomozygote ayant une probabilit forte
de gnrer un signal deux fois plus important que
lindividu htrozygote. L'excs de chaque nuclotide
est dgrad par ajout d'apyrase10. Un thiodriv de
dATP doit tre utilis pour viter la stimulation
constante de la lucifrase22. Le pyrosequenage est
illustr en figure 6.

La SSCP sapplique en 3 tapes illustres en figure 7.


Premirement, la squence dintrt est amplifie par
PCR avec ajout damorces complmentaires aux
deux brins. Dans une mme exprience il sera donc
possible dobserver la conformation des deux brins
de lADN complmentaires. Deuximement, une
augmentation de la temprature permet la
dnaturation des deux brins et un refroidissement
brutal empche ceux-ci de se r- hybrider. Les deux
brins adoptent indpendamment une structure 3D
propre. Les produits PCR sont spars par une
lectrophorse capillaire (CE). En fonction de leur
structure, leurs migrations seront diffrentes dans
llectrophorse. La dtection de SNP se fera par
comparaison des diffrents profils dlectrophorse
provenant dindividus diffrents. La SSCP permet
donc de mettre en vidence la prsence ou non de
SNP, elle ne renseigne pas sur le nombre, la
localisation prcise et la nature du SNP23.
Cette mthode lavantage dtre facilement
reproductible en laboratoire puisque les mmes
conditions
exprimentales
doivent
permettre
dobtenir un mme profil 3D de lADN. Les
paramtres
exprimentaux
permettent
une
optimisation des rsultats obtenus. Remarquons
galement que le principe de la SSCP peut
sappliquer galement de lARN14.

LEcoTilling, une alternative aux


mthodes de dtections existantes.
Les techniques dtailles ci-dessus sont pour la
plupart fortement utilise par de nombreux
laboratoires, cest notamment le cas des microarrays
qui bnficient aujourdhui dun grand impact
mdiatique grce au nombre dobservations
ralisables par puce ADN. Nous avons jug utile
de prsenter lEcoTilling comme une technique trs
rcente, encore peu utilise en laboratoire mais
prsentant de nombreux avantages susceptibles

Cette mthode prsente de nombreux avantages pour


l'tude de gnomes ayant des SNP peu espacs entre
eux ainsi que pour la dtection d'insertion/dltions
(Guo et al., 2003). En augmentant la temprature de
la raction (Eriksson et al, 2004) et en bloquant
l'extrmit 3' du template pour prvenir de la fixation
d'un nuclotide non spcifique (Utting et al., 2004 ),
il est possible d'augmenter la spcificit et la

-7-

dintresser long terme de nombreux laboratoires et


entreprises par sa facilit de mise en uvre et son
cot attractif.

Un SNP, soit une diffrence dun nuclotide dans la


squence dun individu par rapport au modle de
rfrence, apparatra dans cet hteroduplex comme
un mauvais appariement de bases.

LEcoTilling est une adaptation de la technique du


TILLING, Targeting Induced Local Lesions in
Genomes, qui permet la mise en vidence du
polymorphisme, dont des SNP, dans une population.
Nous nous appuierons sur la publication de L. Comai
et., al (2004)24 pour dcrire la technique de
lEcoTilling.

Lajout dendonuclase CEL I, comme dans le


Tilling, qui coupe lADN chaque msappariement
entrane la cration de fragments de taille diffrente.
Le produit de la digestion est dpos sur un gel
dlectrophorse. Si lindividu de lcotype ne
prsente aucune variation gntique par rapport
lindividu de rfrence dans la squence amplifie,
les
deux
fragments
dADN
shybrideront
parfaitement. LADN ne sera pas dirig et les
fragments dposs sur le gel dEcoTilling auront une
taille gale celle du fragment amplifi par PCR. Si
au contraire, lindividu tudi prsente un SNP, un
changement de base un endroit donn par rapport
lindividu de rfrence, il y aura hybridation des
deux fragments dADN mais avec msappariement
de base au niveau du SNP. Aprs digestion de lADN
par lenzyme de restriction, la taille du fragment
rsultant sera fonction de la position du SNP dans la
squence amplifie. La prsence de plusieurs SNP
dans la squence implique la prsence de fragments
de plusieurs tailles dans le gel de sortie de
lEcoTilling. Le marquage de lextrmit 5, grce
aux amorces fluorescentes utilises lors de la PCR,
permet, outre la dtermination de la position du
fragment dans le gel, son orientation. Ainsi, le
fragment qui sera court et qui migrera donc loin dans
le gel sera d un SNP proche de lextrmit 5. Au
contraire, si un SNP est localis vers lextrmit 3 de
la squence dADN, le fragment obtenu via CEL I
sera grand et aura une courte distance de migration
dans le gel.

Le Tilling tout dabord est une mthode combinant


des mutations induites chimiquement et le crible
dune squence dintrt par PCR (Colbert et al.,
2001 ; McCallum et al., 2000). Une rgion dADN
allant jusqu' 1kpb est amplifie avec des amorces
fluorescentes pour un ensemble de souches
dindividus muts. Les parties mutes correspondent
des mauvais appariements entre bases. Ces
mutations sont reconnues par lendonuclase CEL I
qui va cliver lADN aux endroits de mutations. De
cette manire, on gnre des fragments fluorescents
de tailles diffrentes. La position de la mutation
dterminera la distance de migration des fragments
sur un gel dlectrophorse.
La technique de lEcoTilling va se servir de la
capacit du Tilling dtecter des mutations et va
ladapter la mise en vidence du polymorphisme du
gnome, dont principalement les SNP. La technique
dcrite ci-dessous peut tre applique tout individu
(du monde animal, vgtal ou bactrien).
Un individu de rfrence est choisi et un pool
constitu dindividus diffrents nomm cotype est
constitu. Lcotype sera comparer lindividu de
rfrence.

En figure 8 se trouve la photo dun gel


dlectrophorse contenant 96 puits. Il est possible
dy visualiser les diffrences gnomiques entre 96
cotypes diffrents. On observe sur celui-ci
lexistence de 10 sites de polymorphisme.
LEcoTilling ne se limite pas la dtection de SNP,
elle permet galement la mise en vidence
dinsertion/dltion ainsi que de MNP, Multiple
Nucleotide Polymorphism25 : SNP pour deux bases,
(CT>TA dans lexemple illustr). Grce
lEcoTilling, il est possible de dterminer la nature
du polymorphisme des 96 cotypes en seulement 10
squenages dans le cas prsent. Le recours au
squenage est obligatoire pour la dtermination de la
nature du SNP, celle-ci ntant pas dtectable dans le
gel dlectrophorse : un SNP A>T apparaissant de la
mme manire et au mme endroit quun SNP G>T
au mme locus.

On amplifie une squence dADN pouvant aller


jusqu 1000pb par PCR de lindividu de rfrence
ainsi que des diffrents individus de lcotype.
On utilise des amorces fluorescentes qui permettent
lobtention dun produit marqu. Sans ce marquage,
il serait impossible de localiser lADN dans un gel
dlectrophorse, tape ralise plus tard dans le
protocole exprimental.
Dans chaque puits dune plaque multi-puits sont
dposs des fragments amplifis de lindividu de
rfrence, ainsi que dun cotype. Chaque puits de la
plaque correspond une comparaison entre un
individu de lcotype et lindividu de rfrence.
Aprs dnaturation, les brins dADN sont rhybrids,
formant des htroduplex entre lADN de lindividu
de rfrence et lADN de lindividu tudi.

Les sorties dEcoTilling peuvent se faire galement


par un analyseur de taille de fragments. Les rsultats

-8-

apparaissent ds lors sur ordinateur sous laspect


illustr en figure 9. Lutilisation de cette technique
est plus rapide et les rsultats plus faciles manipuler
que dans le cas du gel dlectrophorse. La figure 10
reprend les grandes tapes de lEcoTilling, le tout
pouvant tre ralis en moins de 24heures !26

Introduction la gntique
dassociation
Il nous a sembl utile dintroduire la fin de ce travail
quelques notions de gntique dassociation, une
nouvelle approche de gntique fonctionnelle o les
SNP pourront jouer un rle important dans les annes
venir.

LEcoTilling permet la dtection rapide de diffrents


haplotypes, les haplotypes dintrts pouvant tre
squencs par la suite. LEcoTilling peut tre
appliqu la mise en vidence de SNP,
dinsertion/dltion
mais
galement
de
microsatellites. Une mise en vidence de dltion est
illustre en figure 11 partir dune sortie EcoTilling
type informatique.

La gntique dassociation sinscrit dans la gntique


fonctionnelle en associant un haplotype un phnotype.
La premire approche en gntique dassociation
consiste raliser un inventaire de toutes les formes
allliques prsentes dans un chantillon donn. Les
chercheurs recherchent ensuite des associations entre un
profil molculaire donn et un phnotype.
Une autre approche utilise le dsquilibre de liaison.
Cette approche consiste dabord cartographier le
gnome ou une squence spcifique sans apriori sur le
gnome. Lapproche prcdemment dcrite ci dessus se
focalisant notamment sur le criblage de gnes
candidats.30

LEcoTilling permet une tude facile du


polymorphisme avec un excellent taux de dtection.
Il est possible de mettre en vidence plusieurs SNP
dans une squence dfinie en une seule tape. La
technique peut permettre des analyses en gnomique
fonctionnelle. Ainsi, en comparant un individu de
phnotype mutant avec un individu de phnotype
sauvage, on peut dterminer facilement les variations
gnomiques impliques dans le phnotype mutant au
locus candidat. Cette mthode est applicable
nimporte quel organisme, htrozygote et
polyplode, soit
prsentant un
ou plusieurs
polymorphismes sur deux ou plusieurs allles. Un
autre avantage de lEcoTilling est que cette mthode
ne ncessite aucune connaissance pralable de la
squence analyser, except pour la cration des
amorces PCR.

Le dsquilibre de liaison correspond une rpartition


non alatoire dallles pour un certain nombre de locus
contigus31. Les gnes sont en temps normal lis entre
eux en fonction de la structure physique et de leur
position sur le chromosome. Statistiquement, certains
allles peuvent avoir une plus grande chance dtre
spar par une recombinaison que dautres, trs proche
lun de lautre qui voyageront ensemble au cours du
temps. Le dsquilibre de liaison dpend de la
frquence de recombinaison des chromosomes, plus la
distance entre deux allles est importante, plus la
probabilit quil y ait un phnomne de recombinaison
entre eux est importante.
De grandes squences conserves peuvent voyager
ensemble et prsenter donc un dsquilibre de liaison
lev. Le dsquilibre de liaison peut tre de 50 250
kb chez A. Thaliana ou quelques kilobases pour le
mas30.

Rcemment, on a pu appliquer la technique de


lEcoTilling au gnome humain (Bradley et. al.,
2006). Sur 384 individus, 5 gnes ont t cribls par
EcoTilling. Il en rsulte la dcouverte de 28
nouveaux SNP rares. Parmi ceux-ci, 12 taient des
SNP non synonymes (lacide amin tait chang).
Huit de ces 12 SNP se sont rvls causer des
changements de conformations importants la
protine quils constituaient. LEcoTilling se rvle
donc tre une bonne mthode pour la dtection de
SNP dans le gnome humain. Lutilisation de deux
sondes diffrentes (deux amorces diffrentes en
fonction de la squence de rfrence et de la
squence compare, IRD700 et IRD800) permettant
une observation dans deux canaux et limite le nombre
de faux positifs. On estime pouvoir abaisser le cot
de lEcoTilling pour ltre humain 0,001$ par base
tudie, soit 1000$ par mgabase tous frais
compris . Ceci correspond un prix 50 fois infrieur
la mthode de squenage Sanger27.

Ces squences o se produit le dsquilibre de liaison


peuvent abriter un ou plusieurs SNP. Sachant que chez
lHomme il existe en moyenne un SNP toutes les
1000pb une rgion de 10kb pourra statistiquement
accueillir 10 SNP. Dans le cas ou la squence en
question prsenterait un dsquilibre de liaison, cela
voudrait dire que les SNP voyageraient ensemble. La
prsence
dun
des
10
SNP
impliquerait
automatiquement la prsence des 9 autres ainsi que la
prsence de la squence prsentant le dsquilibre de
liaison. Il est donc possible dallger les cartes
gntiques, en utilisant un SNP au lieu de 10 dans
lexemple cit.
Dans le cas de la gntique dassociation, une squence
prsentant un taux lev de dsquilibre de liaison
pourrait tre associe un phnotype. Si un SNP est
dfinit dans cette squence, le SNP pourra tre associ

-9-

au phnotype ! Le SNP voyagera avec la rgion donnant


le phnotype dintrt. Le SNP peut se trouver des
centaines de paires de bases du gne infrant sur le
phnotype, mais peu tre dans certaines situations la
cause mme du phnotype.

Conclusion
Aprs avoir rappel les principes de base des marqueurs
RFLP, AFLP et SSR, nous avons dfini les proprits
des SNP, Single Nucleotide Polymorphism, et prsent
une slection de techniques visant mettre en vidence
la prsence de SNP.

Rfrences
1.
2.
3.

4.

5.
6.
7.
8.

Il nexiste pas de mthode parfaite de dtection et de


mise en vidence de SNP. Parmi la multitude de
techniques disponibles nous pouvons souligner les
microarrays ou puces ADN de plus en plus utiliss.
Ceux-ci permettent un criblage dun grand nombre de
SNP en une seule tape. Nanmoins cette technique est
encore peu abordable. LEcoTilling est une technique
trs rcente qui pourrait constituer une mthode de
choix pour des laboratoires souhaitant mettre en
vidence de nombreux SNP de faon rapide, facilement
automatisable et conomique.

9.
10.

11.
12.
13.
14.
15.
16.

Les SNP constituent la majorit du polymorphisme du


gnome. Grce leur grand nombre et leur rpartition
tout au long du gnome, les SNP sont actuellement un
marqueur molculaire de choix : ils constituent une
alternative crdible au squenage systmatique.
Les SNP sinscrivent donc dune part en gnomique
structurelle par leur utilisation, entre autres pour la
cration de carte gntique. Dautre part ils peuvent
galement jouer un rle important en gnomique
fonctionnelle. Les SNP sinscrivant dans le projet
HapMap visant la cration dhaplotypes pour le
gnome humain. Le projet ayant long terme lambition
de pouvoir permettre la dtection prcoce de tendance
une pathologie particulire pour un patient dont on
pourrait aisment dterminer les haplotypes grces aux
SNP. Les SNP constituent galement dexcellents
marqueurs pour le suivi et la caractrisation de gnes
candidats. La caractrisation des SNP de lHomme et de
leur influence sur le phnotype peut tre applique
lensemble des organismes vivants si bien que les SNP
peuvent tre sujet dtude dans de nombreux domaines :
mdecine, agriculture, tude de lvolution et de la
diversit des populations,

17.
18.
19.
20.
21.
22.

23.

24.
25.

26.
27.

28.

http://www.roche.com/home/products/prod_diag/prod_diag_pro
ducts/prod_diag_gen-seq20.htm page consulte le 23 mars 2007
Les marqueurs molculaires en gntique et biotechnologies
vgtales, D. de Vienne, INRA, 1998
Applications des marqueurs molculaires dans lamlioration du
bl tendre pour la rsistance aux maladies et aux insectes,
Bouchra Najimi, Biotechnol. Agron. Soc. Environ. 2003
Construction of genetic linkage Map in man using Restriction
Fragment Length Polymorphisms, Botstein et al, Am JHum
Genet, 1980
Strategies for microsatellite isolation: a review, L. Zane,
Molecular Ecology, 2002
Genomes 2, TA Brown, Bios Scientific Publishers, 2002, p. 130
Discovery and Application of SNP Markers in Plants,
DBHATTRAMAKKI, CAB International, 2001
Genetics Analysis of genes and genomes, D L Hartl, Jones and
Bartlett Publishers, 2004, p. 73
The essence of SNPs, A J. Brookes, Genes, 1999
SNPs in forensic genetics: a review on SNP typing
methodologies, Beatriz Sobrino, Forensic Science International,
2005
http://www.hapmap.org/whatishapmap.html.fr page consulte le
25 mars 2007
Discovery and Applications of SNP Markers in Plants, Rafalski
et al, Ed. CABI Publishing, 2001
Prcis de gnomique, Gibson de Boek, 2004, p 274
Detection of Single Nucleotide Polymorphisms, Pui-Yan Kwok,
current issues mol biol, 2003
Development of the ligation detection reaction LDR TaqMan
Assay: a novel SNP genotyping method, T. Borodina, 2005
Methodes for genotyping Single Nucleotide Polymorphisms,
Kwok, Annu. Rev. Genomics Hum. Genet, 2001
Automation in Genotyping of Single Nucleotide Polymorphisms,
Gut, Annu. Rev. Genomics Hum. Genet, 2001
TaqMan Drug Metabolism Genotyping Assay reference guide,
Applied Biosystems, 2007
TaqMan SNP Genotyping Assays, Applied Biosystems, 2007
http://www.serialgenetics.com/retd1.html page consulte le 15
avril 2007
Quantification des acides nucliques par PCR quantitative en
temps rel, C. Tse, Ann Biol Clin, 2003
Single Nucleotide Polymorphism
(SNP)
Genotyping
TechniquesAn Overview, Twyman, Encyclopedia of
Diagnostic Genomics and Proteomics, 2005
Single-Stranded Conformation Polymorphism (SSCP) on
Applied Biosystems Capillary Electrophoresis Systems, Applied
Biosystems, 2006
Efficient discovery of DNA polymorphisms in natural
population by EcoTilling, Comai et al, The Plant Journal, 2004
EcoTILLING for the identification of allelic variation in the
powdery mildew resistance genes mlo and Mla of barley, N.
Mejlhede, Plant Breeding, 2006
A protocol for TILLING and Ecotilling in plants and animals,
Bradley, Nature, 2006
High-throughput discovery of rare human nucleotide
polymorphisms by Ecotilling, Bradley, Nucleic Acids Research,
2006
http://www.serialgenetics.com/retd1.html page consulte le 15
avril 2007

29. http://www.serialgenetics.com/endo1.html page consulte le 3


avril 2007
30. Le regard de la gnomique sur la diversit naturelle des plantes
cultives, J. David et al., Biofutur, 2006
31. Applications of single nucleotide polymorphisms in crop
genetics, Antoni Rafalski, Current Opinion in Plant Biology,
2002

- 10 -

Vous aimerez peut-être aussi