Vous êtes sur la page 1sur 109

Séquençage

Définition

• Le séquençage de l’ADN, est la détermination de la


succession des nucléotides le composant.

• Cette technique utilise les connaissances qui ont été


acquises depuis une trentaine d'années sur les
mécanismes de la réplication de l'ADN.
Méthode enzymatique de Sanger

• Basée sur le principe de l’électrophorèse sur gel de


polyacrylamide, elle permet de séparer entre elles des
molécules d’ADN monocaténaires dont la longueur ne diffère
que par un seul nucléotide

• On peut ainsi séparer, pour une même famille moléculaire,


des molécules longues de 10 à 1.500 nucléotides sous forme
d’une série de bandes électrophorétiques différentes
Principe de la méthode de Sanger

• Dans cette technique, on utilise une solution composée de molécules


d’ADN monocaténaires, toutes identiques

• On hybride ensuite un petit oligonucléotide, au même endroit sur


chacune des molécules d’ADN, cet oligonucléotide servant donc
d’amorce pour la synthèse d’un ADN qui sera complémentaire de la
matrice ADN monocaténaire initialement purifié

• l’ADN polymérase peut synthétiser une copie à partir de cet ADN


modèle

• Cette synthèse est stoppée une fois qu’un nucléotide modifié est
incorporé

• Ces nucléotides modifiés sont appelés: 2’,3’-didésoxyribonucléotides


(ddNTP)
Les didésoxnucléotide (ddNTP)

• Un didésoxnucléotide ou ddNTP, est un dNTP dont radical


hydroxyl, situé sur le carbone terminal 3’, a disparu au profit d’un
hydrogène 3’
Synthèse d'un brin d'ADN après ajout d'un
dNTP ou d’un ddNTP
Méthode

Il faut préparer 4 mélanges:


• Le fragment qui doit être séquencé
• Un petit morceau d'ADN dont la séquence est complémentaire à
l'extrémité 3' du fragment à séquencer (amorce)
• Les 4 dNTP's (dCTP, dATP, dGTP, dTTP)
• L'ADN polymérase
• Dans chaque tube, de petites quantités d'un ddNTP
fluorescent ou radioactif
--> son incorporation aléatoire stoppant la synthèse

On obtient à la fin des réactions un ensemble de brins


d'ADN de tailles variées, selon l'endroit où un ddNTP se
sera inséré et que la réaction aura ainsi été stoppée
Figure.
Séquençage par la
méthode
enzymatique de
Sanger en
présence de
didésoxyribonuclé
otides.
• A. La technique enzymatique de Sanger implique la synthèse de
nouvelles molécules d’ADN complémentaires d’une matrice
monocaténaire.
• B. La synthèse de nouvelles molécules d’ADN ne continue pas
indéfiniment car le milieu réactionnel contient de petites quantités
didésoxnucléotide qui bloque l’élongation des chaînes car son radical
hydroxyl, situé sur le carbone terminal 3’, a disparu au profit d’un
hydrogène 3’, ce qui empêche la formation d’une liaison
phosphodiester.
• C. La synthèse de nouvelles chaînes d’ADN en présence de ddATP
conduit à un arrêt de l’élongation en face d’un nucléotide T de la
matrice, et à la production d’une famille de molécules qui se
terminent par A. Ces molécules sont alors dépo-sées dans un puits du
gel de polyacrylamide, tout comme celles des familles de chaînes
synthétisées par les réactions avec ddTTP, ddGTP ou ddCTP.
• D. Dans l’expérience représentée, les bandes sont visualisées après
autoradiographie, car on avait rajouté du dNTP radioactif dans le
milieu réactionnel. Après avoir repéré le puits dans lequel se situe
chacun des nucléotides, la séquence représentée à droite est lue à
partir de la bande qui a migré le plus loin (la plus petite) en bas de
l’électrophorèse (ici, G) et ainsi de suite
Principe de la méthode de Sanger

● La synthèse d’ADN complémentaire est effectuée


grâce à l’ADN polymérase en présence de désoxy-
ribonucléotides triphosphate (dNTPs), substrats
de la réaction

● Dans cette réaction, une faible quantité d’un des


didésoxynucléotides (ddNTP) a aussi été rajoutée

● L’ADN polymérase ne fait pas la distinction entre


dNTP et ddNTP : ce dernier sera alors incorporé
normalement dans la chaine polynucléotidique en
cours de synthèse, bloquant celle-ci
Principe de la méthode de Sanger

● Si c’est le ddATP qui est incorporé, il y a arrêt de


synthèse du polynucléotide en face des thymidine
de la matrice ADN

● Cependant, du fait de la présence de grandes


quantités d’ATP normal dans le milieu, la synthèse
ne s’arrêtera pas toujours dès le premier T lu sur
la matrice

● Cette terminaison se fait statistiquement, même


après incorporation de plusieurs centaines d’ATP,
avant qu’un ddATP ne soit incorporé
Principe de la méthode de Sanger

● On se trouve donc en présence d’un mélange de


nouvelles chaînes de désoxyribonucléotides de
différentes longueurs, qui se terminent toutes
par un ddATP

● On réalise ensuite une électrophorèse sur gel de


polyacrylamide et on charge la famille d’oligo-
nucléotides synthétisés en présence de ddATP
dans un puits ... et dans les autres puits on
chargera les produits obtenus successivement en
présence de ddCTP, ddGTP et ddTTP
Principe de la méthode de Sanger

● Après électrophorèse, la séquence d’ADN peut


alors être lue en fonction de la position de la
bande sur le gel

● La séquence est donc lue dans le sens 5’>3’ jusqu’à


ce qu’on arrive dans le gel à une région ou les
bandes ne sont plus distinguables les unes des
autres et la lecture impossible
Méthode de Sanger

C
C
e
ès ie
G
r T
p ho a p h G
tro iogr T
ec d
AACGGTACACG El ora A
t C
Au C
G
T
Hybridation T
5’
de l’amorce

AACGGTACACG
*T
*TT *TTG *TTGC
*TTGCCAT *TTGCCATG *TTGCC
*TTGCCA *TTGCCATGT *TTGCCATGTG *TTGCCATGTGC

dCTP dCTP dCTP dCTP+ddCTP


dGTP dGTP dGTP+ddGTP dGTP
Synthèse dTTP dTTP+ddTTP dTTP dTTP
(fragment *dATP+ddATP *dATP *dATP *dATP
de Klenow)
A° T° G° C°

AACGGTACACG
Méthode de Sanger
ADN polymérases et séquençage

● Toutes les ADN polymérases dont l’activité


dépend d’une matrice nucléotidique est capable
d’allonger une amorce ayant été hybridée à une
molécule d’ADN simple brin, mais toutes les ADN
polymérases ne catalysent pas la réaction de
façon appropriée au séquençage

● Trois critères sont nécessaires pour que le


séquençage puisse être effectué correctement :
1. Forte réactivité (affinité et activité)

- Elle est définie par la longueur du polynucléotide


qui est synthétisé, avant que l’enzyme ne cesse
toute activité naturellement

- Une polymérase dont l’activité sert au séquen-


çage doit être très réactive et ne pas se disso-
cier de la matrice ADN avant d’avoir pu incor-
porer un didéoxynucléotide qui entraîne l’arrêt
de la synthèse
2. Activité exonucléasique 5’>3’ nulle ou négligeable

- La plupart des ADN polymérases ont aussi des


activités exonucléasiques, c’est-à-dire qu’elles
sont capables de dégrader l’ADN tout comme
elles peuvent le synthétiser

- Une activité exonucléasique 5’>3’ permet à l’ADN


polymérase de digérer un brin d’ADN déjà hybri-
dé à la matrice. C’est un inconvénient dans le ca-
dre du séquençage car cela modifie la longueur
correcte des chaines d’ADN en synthèse et donc
empêche la lecture correcte des bandes électro-
phorétiques du gel de polyacrylamide
3. Activité exonucléasique 3’>5’ nulle ou négligeable

- Cette propriété est nécessaire, sinon les


dideoxynucléotides incorporés en bout de chaîne
disparaîtraient après incorporation
● Ces 3 conditions sont nécessaires pour le séquen-
çage, mais les ADN polymérases naturelles n’y
satisfont pourtant pas complètement

● On utilise alors pour le séquençage des ADN


polymérases artificiellement modifiées

● La première des ADN polymérases artificielles a


été la polymérase de klenow produite à partir de
l’ADN polymérase I de E. coli dont le site actif
responsable de l’activité exonucléasique 5’>3’ à été
supprimé >>> Le fragment de klenow est pourtant
peu réactif et la longueur des fragments pouvant
être synthétisés n’est que d’environ 250 pb
● Actuellement, on utilise la Séquenase® produite à
partir d’une ADN polymérase modifiée et dont le
gène à été incorporé dans le bactériophage T7

● La Séquenase® est une enzyme très réactive ne


présentant aucune activité exonucléasique et qui a
des qualités exceptionnelles pour le séquençage,
comme une activité polymérasique très puissante
et rapide, ainsi que la capacité à utiliser de
nombreux nucléotides modifiés comme substrats
Méthode enzymatique de Sanger

● La méthode de séquençage enzymatique de


Sanger nécessite de disposer d’une matrice
d’ADN monocaténaire

● Différents moyens existent pour obtenir cet


ADN monocaténaire :
1. L’ADN peut être cloné dans un vecteur
plasmidique

- L’ADN obtenu est bicaténaire et sera trans-


formé en ADN monocaténaire par dénaturation
alcaline ou chauffage avant de pouvoir servir de
matrice au séquençage

- C’est la technique la plus utilisée car le clonage


dans des plasmides est très courant

- Cependant, une des difficultés de la technique


est de préparer de l’ADN plasmidique sans
contamination
2. L’ADN peut être cloné dans un vecteur de type
bactériophage M13

- M13 est un phage à ADN monocaténaire, capable


d’infecter E. coli. Il a été construit spécifique-
ment pour produire des amorces ADN mono-
caténaires pour le séquençage

- Après infection d’E. coli, l’ADN de M13 est con-


verti en ADN bicaténaire par réplication (forme
réplicative). Cette forme est copiée jusqu’à ce
qu’environ 100 copies soient présentes dans la
cellule. Les vecteurs de clonage produits à partir
de M13 portent des copies de l’ADN bicaténaire
correspondant à la forme réplicative du M13
- Les vecteurs sont donc manipulés comme des
plasmides, la seule différence étant que les
cellules transfectées par les vecteurs recombi-
nants M13 peuvent libérer des phages contenant
de l’ADN moncaténaire qui comprend l’ADN du
phage et toute la molécule qui à été insérée

- Ces phages peuvent donc être la source de


matrice ADN monocaténaire pour le séquençage
par la méthode de Sanger

- L’inconvénient est que si le fragment inséré est


d’une longueur supérieure à 3 kb, il peut y avoir,
lors du clonage des réarrangements ou des
délétions de l’ADN inséré
Figure. Obtention d’un ADN monocaténaire par
clonage dans un bactériophage vecteur de type
M13.

Les vecteurs de type M13 sont obtenus sous deux


formes différentes : une forme à ADN
bicaténaire (molécule réplicative) ou une forme à
ADN monocaténaire (version retrouvée dans les
bactériophages). La forme réplicative peut être
manipulée de la même façon qu’un vecteur de
clonage de type plasmide, avec possibilité de lui
intégrer un insert d’ADN, après action d’une
enzyme de restriction puis ligation. Par
transfection, le vecteur recombinant ainsi créé
est introduit dans une bactérie Escherichia coli. A
l’intérieur de E. coli, le vecteur bicaténaire se
réplique et dirige la synthèse de copies ADN
simple brin qui sont ensuite encapsidées dans des
phages. Ces derniers seront expulsés hors de la
cellule lors de sa lyse. Les particules que
constituent les phages peuvent être collectées
dans le milieu de culture après centrifugation, les
bactéries ayant sédimenté sous forme de culot.
En présence de phénol, on retire alors la capsule
protéique qui recouvre les phages. On peut
ensuite purifier la version monocaténaire du
vecteur recombinant, sur laquelle on pourra
réaliser un séquençage de l’ADN.
3. L’ADN peut être cloné dans un phagemide
- Un phagemide est un vecteur construit à partir
d’un plasmide qui contient, en plus de l’origine de
réplication du plasmide lui-même, l’origine de
réplication du phage M13 ou d’un autre phage
dont le génome est simple brin
- Si E. coli contient à la fois un phagemide et la
forme réplicative d’un phage auxilliaire (helper
phage), dont le génome présente les gènes des
enzymes nécessaires à la réplication et à l’enca-
psidation des phages, l’origine de réplication du
phage sera activée, initiant la synthèse de nou-
velles particules de phage qui contiendront la
version monocaténaire du phagemide
- L’ADN bicaténaire du phagemide est donc
converti en ADN monocaténaire, qui peut alors
servir de matrice pour le séquençage par la méthode
de Sanger

- Ce type de système évite l’écueil de l’instabilité


du clonage dans le phage M13 et peut donc être
utilisé pour étudier des fragments d’ADN ayant
une taille de 10 kb ou plus
Utilisation de la PCR pour produire de l’ADN
monocaténaire

● Plusieurs méthodes sont disponibles pour produire


un ADN monocaténaire par PCR

● La plus efficace est de modifier une des deux


amorces, de telle sorte que le brin correspondant
puisse être facilement isolé.

● Un des moyens est d’attacher simplement une


minuscule bille métallique à l’amorce modifiée, puis
d’utiliser un champ magnétique pour purifier le
brin correspondant
Figure. Utilisation de la PCR pour la préparation
d’une matrice ADN, pour son séquençage selon la
méthode enzymatique de Sanger.

La PCR est effectuée avec une amorce normale


(ici, en rouge) et une amorce marquée par une bille
métallique (ici, en marron). Après PCR, les brins
marqués sont purifiés simplement au moyen d’un
aimant.
Préparation de l’amorce

● Pour démarrer une expérience de séquençage par


la méthode de Sanger, un oligonucléotide servant
d’amorce est hybridé à une matrice ADN

● L’amorce est nécessaire car l’ADN polymérase ne


peut initier seule la synthèse de la nouvelle molé-
cule d’ADN à partir d’un ADN monocaténaire : il
doit y avoir une courte région bicaténaire, pré-
sentant une extrémité 3’ libre, afin que l’enzyme
puisse créer de nouvelles liaisons phosphodiesters
et ainsi allonger le nucléotide
● L’amorce joue aussi le rôle crucial d’outil permet-
tant de déterminer la région d’ADN matrice qui va
être séquencée

● Dans la plupart des expériences de séquençage, on


utilise une amorce dîte “universelle” et qui est en
fait complémentaire de la partie du vecteur ADN
immédiatement adjacente du point auquel on a
inséré le fragment d’ADN à étudier

● Cette amorce universelle est donc utilisable pour


séquencer tous les fragments d’ADN insérés dans
le vecteur au même endroit
● Cependant, si le fragment d’ADN à séquencer a
une longueur supérieure à ~750 pb, on n’obtiendra
seulement qu’une partie de la séquence

● Si l’ADN bicaténaire d’un plasmide est utilisé en


tant que matrice, une séquence supplémentaire
pourra être obtenue à partir de l’autre extrémité
de l’insert : il est alors possible de prolonger la
séquence dans une direction donnée en utilisant
une amorce non universelle qui a alors la propriété
de s’hybrider à l’intérieur de l’insert ADN
Figure. Différents types d’amorces utilisables
dans le séquençage selon la méthode enzymatique
de Sanger.

A. Une amorce universelle va s’hybrider sur l’ADN


matrice au niveau d’une séquence adjacente à la
séquence de l’insert ADN à séquencer. Ainsi, une
amorce universelle permet de séquencer n’importe
quelle séquence d’ADN insérée, mais on ne peut
alors séquencer qu’une seule extrémité de l’ADN
inséré.
B. On peut obtenir le séquençage de fragments
d’ADN beaucoup plus longs grâce à l’utilisation de
plusieurs amorces internes (qui s’hybrident à
l’intérieur de la séquence ADN insérée) au cours
de différentes expériences de séquençage selon
la méthode enzymatique de Sanger.
Séquençage par PCR

● La découverte d’ADN polymérases ayant permis le


développement de la PCR a eu pour résultat la mi-
se au point de nouvelles méthodes de séquençage

● Ainsi, la technique appelée séquençage par cycles


thermiques a deux avantages par rapport à la
technique enzymatique classique :

- Elle utilise comme matériel de départ l’ADN


bicaténaire et non monocaténaire

- Seules de très petites quantités d’ADN matrice


sont nécessaires, à tel point que l’ADN n’a plus
besoin d’être cloné avant le séquençage
● Le séquençage par cycles thermiques est effectué
comme une PCR classique mais en présence d’une
seule amorce, et chaque milieu réactionnel com-
porte un des ddNTPs : Seul un des brins de la
matrice est copié puisqu’il n’ya qu’une seule amorce
● Le produit de la réaction de la PCR s’accumule
donc de manière linéaire et non pas exponentielle,
comme cela était le cas pour la PCR classique.
● La présence de ddNTPs dans le milieu réactionnel
entraîne la terminaison de la copie des brins,
comme dans la technique de Sanger, ce qui produit
une famille de polynucléotides qui peuvent être
analysés ... et donc la séquence est lue après
électrophorèse sur gel de polyacrylamide
Figure. Séquençage au moyen de cycles
thermiques.

Une PCR particulière est réalisée en présence


d’une seule amorce et de didésoxynucléotide dans
le milieu réactionnel. Les produits de PCR obtenus
forment une famille de molécules d’ADN de
longueur variable, qui se terminent par le ddNTP
qui a été utilisé dans le milieu (ici, A). On dépose
chacune des familles de molécules dans un puits
sur un gel de polyacrylamide et une
électrophorèse standard est effectuée.
Marqueurs radioactifs utilisés lors des réactions de
séquençage

● La technique classique de séquençage par la


méthode de Sanger utilise des marqueurs radio-
actifs permettant de visualiser les bandes
obtenues après électrophorèse sur gel de poly-
acrylamide par autoradiographie

● En général, dans ces réactions de séquençage, seul


un des nucléotides est radioactif et ainsi les
nouveaux brins synthétisés sont marqués sur toute
leur longueur, permettant d’obtenir une grande
sensibilité de détection
● Pour permettre une meilleure résolution des dif-
férentes bandes électrophorétiques, on utilise en
général le 33P ou le 35S car leurs énergies
d’émission sont relativement faibles, contraire-
ment au 32P qui présente une forte énergie
d’émission mais une mauvaise résolution du signal
du fait de sa déflection dans le milieu
Méthode de Sanger
Marqueurs fluorescents utilisés pour les réactions
de séquençage

● L’utilisation de marqueurs fluorescents et de leur


système de détection a permis l’automatisation du
séquençage

● Un marqueur fluorescent spécifique et différent


est rattaché à chacun des quatre ddNTPs : les
chaînes polypeptidiques nouvellement synthé-
tisées qui se terminent par le nucléotide adénine
sont ainsi marqués avec un fluophore donné, celles
se terminant par le nucléotide cytosine par un
autre marqueur fluorescent, ...
● En utilisant ces différents marqueurs on peut
donc faire les quatre réactions de séquençage (A,
C, G et T) en même temps, dans le même tube à
essai, et ensuite déposer les quatre familles de
molécules ainsi obtenues dans un seul puits sur un
gel de polyacrylamide, puisque les détecteurs
maintenant utilisables sont capables de détecter
et de discriminer chacun des quatre signaux
différents et de déterminer, pour chaque bande,
si elle représente un A, un C, un G ou un T
● On peut alors lire directement la séquence des
bandes séparées par électrophorèse, au fur et à
mesure de leur passage devant le détecteur,
imprimer le résultat sur un support lisible, ou
alors stocker les données dans un PC

● Si on combine cette technique à des instruments


de robotique, capables de préparer automatique-
ment les milieux réactionnels, de déposer le
résultat sur un gel, puis de lire le gel, on obtient
une technique complètement automatisée
Figure. Séquençage automatique en présence de
didésoxynucléotide marqué par une substance
fluorescente.

A. Toutes les réactions de la méthode


enzymatique de Sanger sont effectuées dans un
seul tube en présence des quatre
didésoxynucléotides qui sont chacun marqués par
une molécule fluorescente spécifique. Dans le
séquenceur automatique, les différentes bandes
issues de l’électrophorèse sur gel de
polyacrylamide passent devant un détecteur de
fluorescence, capable d’identifier chacun des
marqueurs, et l’information est transférée à un
ordinateur qui la transforme en courbes colorées.
B. Ici, la séquence conduit à des pics verts pour A,
bleus pour C, noirs pour G et rouges pour T.
Séquençage automatique

Ordinateur

Laser Détecteur

Gel
Innovation à partir des techniques
conventionnelles de séquençage
● En dépit de la mise au point de techniques auto-
matisées, les méthodes conventionnelles de
séquençage de l’ADN souffrent de ce qu’elles sont
limitées à quelques centaines de pb seulement par
essai

● Cela veut donc en fait dire qu’on ne peut explorer


qu’environ cinq millionnième du génome par
expérience de séquençage

● Ainsi on étudie continuellement les possibilités


d’amélioration technique du séquençage de l’ADN
pour une acquisition plus rapide des données
● L’introduction récente de nouveaux séquenceurs,
utilisant la séparation capillaire plutôt que
l’électrophorèse sur gel de polyacrylamide et
présentant 96 canaux, permet de déterminer
simultanément 96 séquences en moins de 2 h, soit
1.000 séquences différentes par jour

● L’avenir proche permettra d’augmenter encore ce


rendement de séquençage à 384 ou 1.024
séquences en simultané

> On parle de séquençage à haut débit


● De nouvelles technologies de séquençage ont été
mises au point pour permettre une acquisition des
données encore plus rapide : le pyroséquençage

● Le pyroséquençage ne nécessite pas de d’électro-


phorèse ou autre technique de séparation : c’est
une technique plus rapide que celle enzymatique

● Dans de cette technique, la matrice ADN est


copiée directement en absence de ddNTPs, et, au
fur et à mesure de la synthèse d’une nouvelle
chaîne ADN, l’ordre d’incorporation de quatre
dNTPs est détecté et la séquence lue durant
l’avancement de la réaction
● On détecte l’incorporation d’un nouveau nucléotide
donné sur l’extrémité 3’ d’une chaîne grâce à la
libération d’un pyrphosphate, qui a lieu lors de la
création de la liaison ester phosphorique

● Grâce à l’enzyme sulfurylase, cette libération est


convertie en une chimioluminescence dont les
photons peuvent être détectés

● En pratique, on ajoute chacun des dNTPs l’un


après l’autre, en présence d’une nucléotidase, de
telle façon que les dNTPs non incorporés à la
chaîne polynucléotidique puissent être détruits
avant qu’un autre lot de dNTP ne soit à nouveau
ajouté
Figure. Pyroséquençage.

La synthèse de nouveaux brins d’ADN se fait en


absence de didésoxynucélotides. Chaque dNTP est
ajouté individuellement en présence d’une
nucléotidase, qui dégrade tout dNTP qui n’aurait
pas été incorporé dans la chaîne en cours de
synthèse. On détecte alors l’incorporation d’un
nucléotide grâce aux photons émis lors de la
libération du pyrophosphate, qui suit
l’incorporation de ce nucléotide et al formation de
la liaison phosphodiester. On peut, par analyse de
cette production de lumière, suivre l’ordre dans
lequel les nucléotides sont incorporés dans la
chaîne d’ADN en croissance.
● Cette méthode pourrait sembler compliquée, mais
en fait elle ne nécessite qu’une addition répétitive
et automatique des dNTPs au milieu réactionnel,
et peut donc être automatisée très facilement,
permettant alors de réaliser simultanément de
nombreuses expériences en parallèle
Technique de séquençage
grâce à l’utilisation des puces
Qu’est-ce-qu’une puce microarray,
une puce à ADN ou une biopuce ?
● Les procédés de microarray et de biopuce ont été
mis au point afin de permettre de nombreuses
expériences d’hybridations en parallèle

● Leurs principales applications sont :

- Le criblage de sites polymorphes (ex: SNP)

- La comparaison de populations d’ARN d’origines


cellulaires différentes

- Le séquençage
Analyse fonctionnelle des génomes à l’aide des biopuces d’ADN

Technique utilisant des produits PCR (amplicons) ou des oligonucléoti-


des déposés sur des lames de verre + Marquage Cy4 et Cy5
● Définition :

Ce sont des rangées de molécules d’ADN


immobilisées sur matériaux solides pour
les microarrays (verre ou membrane de
silicone) ou étalées en couches denses
sur une bille de silicone (biopuces) afin
de pouvoir effectuer, en même temps,
de nombreuses analyses d’hybridation
● Les microarrays et les biopuces sont produits sur
des matrices faîtes de matériaux différents

● Dans les deux cas, cependant, un grand nombre de


molécules de sondes ADN, chacune présentant
une séquence différente, sont immobilisées à des
places bien déterminées sur une surface solide

● Les sondes peuvent être des oligonucléotides de


synthèse ou de courtes molécules d’ADN comme
les ADNc
● Au tout début, les oligonucléotides ou les ADNc
étaient immobilisées sur des lames de microscope
ou des membranes de nylon : c’est ce qu’on a appe-
lé les microarrays

● Par cette approche, on ne pouvait produire qu’une


faible densité de segments d’ADN différents,
soit environ 6.400 points organisés en rangées
(arrays) de 80x80 points sur une surface de
18x18mm

> Ceci permet ainsi d’examiner confortablement


une population d’ARN donnée, mais s’avère peu
rentable quand il s’agit de typer des sites poly-
morphes comme les SNP
● Pour préparer des plaques d’une densité extrême-
ment haute, les oligonucleotides ont alors été
synthétisés in situ, directement à la surface de
billes de verre ou de silicone, d’où le nom qui leur a
été donné : puces d’ADN ou biopuces

● La méthode classique de synthèse d’un oligo-


nucléotide nécessite l’addition des nucléotides
l’un après l’autre à l’extrémité 3’ de la molécule
dont la séquence finale est alors déterminée
par l’ordre dans lequel chacun des trinucléotides
phosphate (dNTPs) est ajouté au milieu
Analyse fonctionnelle des génomes à l’aide des biopuces d’ADN

"Genechips" d’Affymetrix

>>> Les oligonucléotides sont directement


synthétisés sur les puces
Analyse fonctionnelle des génomes à l’aide des biopuces d’ADN

"Genechips" d’Affymetrix

Détail d’une puce


● Si la même technique avait été utilisée pour produire
une biopuce, vu leur petite taille, on se serait
retrouvé
avec des rangées d’oligonucléotides identiques

● Pour éviter ce biais, on utilise comme substrat des


dNTPs modifiés ne se fixant qu’après activation par la
lumière : ces dNTPs modifiés sont aussi ajoutés l’un
après l’autre, à la surface des micropuces

> C’est la photolithographie, utilisée pour diriger le


flux lumineux vers une seule position choisie parmi
les nombreuses rangées différentes, permettant
ainsi de déterminer exactement lequel des oligo-
nucléotides en cours de synthèse sera allongé du
dNTP ajouté
Analyse fonctionnelle des génomes à l’aide des biopuces d’ADN

"Genechips" d’Affymetrix
La photolithographie est utilisée pour produire des réseaux contenant
des centaines de milliers de sondes oligonucléotidiques déposées à des
densités extrêmes

Groupe de protection sensible à la lumière


● On peut atteindre une densité d’environ 250.000
oligonucléotides différents par cm2, ce qui permet
de cribler jusqu’à 125.000 polymorphismes diffé-
rents en une seule expérience

- GeneChip® Mapping 250/500K, kit permettant le génotypage


de plus de 500.000 SNPs grâce à une paire de puces 250K
- Genome-Wide Human SNP array 5.0®, permettant le génotypage
de plus de 1.000.000 SNPs
- Genome-Wide Human SNP array 6.0®, permettant le génotypage
de plus de 1.800.000 SNPs
● Afin de permettre une hybridation éventuelle, la
plaque d’oligonucléotides est incubée avec l’ADN
cible à étudier, auparavant marqué

● Les oligonucléotides qui ont hybridés avec l’ADN


cible sont déterminés en scannant la surface de la
plaque et en mémorisant les positions auxquelles
le signal de marquage est émis et détectable

● Des marqueurs radioactifs peuvent être utilisés


pour analyser les résultats de microarray à faible
densité, mais pourtant cette technique est peu
résolutive pour les biopuces et on lui préfère alors
le marquage fluorescent détectable par scanner
ou par microscopie confocale à fluorescence
Figure. Utilisation des microarrays et des
biopuces.

Afin de permettre l’hybridation éventuelle, la


plaque d’oligonucléotides est incubée avec l’ADN
cible à étudier, marqué auparavant. Les
oligonucléotides qui se sont hybridés avec l’ADN
cible sont déterminés en scannant la surface de la
plaque et en mémorisant les positions auxquelles
le signal de marquage est émis et édtectable. Des
marqueurs radioactifs peuvent être utilisés pour
analyser les résultats de microarray à faible
densité, et le signal est analysé électroniquement
par imagerie du signal émis par le phosphore.
Cette technique est cependant peu résolutive
pour les biopuces qui sont extrêmement denses et
on lui préfère alors un marquage fluorescent
détectable par scanner ou, en routine, par
microscopie confocale à fluorescence.
Comment utilise-t-on les puces pour séquencer ?

● Une puce, comportant des rangées de différents


nucléotides, pourrait être utilisée pour le séquen-
çage d’une molécule d’ADN qui serait ainsi testée
par détection des hybridations

● L’hybridation avec un oligonucléotide particulier


de la plaque, qui constitue la puce à ADN, indique
que cet oligonucléotide est présent dans la molé-
cule à tester, et on peut donc en déduire la
séquence
Figure. Séquençage de l’ADN grâce aux
technologies utilisant les puces à ADN.

Chaque puce à ADN est composée d’une


microplaque comportant des rangées de puits
dans lesquels on a fixé tous les oligonucléotides
de 8-mer possibles. L’ADN à séquencer est
marqué par une molécule fluorescente et appliqué
sur la puce à ADN. La position où il y a eu
hybridation est déterminée grâce à un microscope
confocal. Chaque oligonucléotide qui s’est hybridé
représente une séquence de 8 nucléotides
présente sur l’ADN en cours de séquençage qui
sert ainsi de sonde. On peut déduire la séquence
de l’ADN sonde après analyse de toutes les
séquences chevauchantes des oligonucléotides qui
se sont hybridés.
● Le problème avec cette approche technique est la
longueur maximale de la molécule d’ADN pouvant
être sequencée (qui est égale à la racine carrée du
nombre d’oligonucléotides présents sur la plaque)

● Ainsi, si on utilise une puce à ADN comprenant 48


65.536 oligonucléotides différents de 8-mer
(tous les différents oligonucléotides comprenant
8 nucléotides), la longueur maximale de séquence
lisible est de 256 pb

● Avec des puces comportant 1.048.576 oligonucléo-


tides différents de 10-mer, on ne pourrait pas
séquencer une molécule d’ADN de plus de 1 kb
● Pour séquencer une molécule comportant un million
de pb (1 Mb), ce qui représente l’avance technique
souhaitable aujourd’hui, la micropuce à ADN
devrait comporter 1x1012 différents oligonucléo-
tides de 20-mer

● Cette dernière possibilité peut sembler farfelue


mais les avancées technologiques, tant dans la
miniaturisation que dans les techniques de
détection visuelle, font que cela pourrait être
possible demain !
Assemblage des séquences

Comment maitriser le séquençage d’un chromosome


qui comporte quelques 10aines de millions de bases
(Mb) à partir de la multitude de séquences
produites par la technique de Sanger ?

● L’approche directe pour assembler les courtes sé-


quences, obtenues à partir de nombreuses expé-
riences intermédiaires de séquençage est d’en
examiner les chevauchements : c’est l’approche
par la technique du coup de fusil, ne nécessitant
aucune connaissance préalable du génome à étu-
dier et pouvant donc être réalisée même en
absence de carte génétique ou physique
Figure. Assemblage des séquences par la méthode
"shotgun".

La molécule d’ADN est scindée en de nombreux


petits fragments, dont chacun est séquencé. La
séquence totale est assemblée après recherche
des chevauchements de séquences entre
fragments. En pratique, un chevauchement de
plusieurs dizaines de bases est nécessaire pour
établir que deux séquences sont bien
consécutives, et pouvoir ainsi les lier l’une à la
suite de l’autre.
● Cette technique de coup de fusil ou "shotgun"
représente la technique standard pour séquencer
le génome court des procaryotes, mais elle s’avère
par contre très compliquée pour des génomes plus
longs

● Ainsi, pour n fragments donnés, le nombre de che-


vauchements possibles est égal à 2n2-2n

● Le deuxième problème soulevé par cette techni-


que de coup de fusil est celui de la possibilité de
multiplication des erreurs lorsqu’il existe des
régions d’ADN répétitives dans la séquence à
analyser
Figure. Problèmes soulevés par
la méthode "shotgun".

A. La molécule d’ADN contient


une séquence répétitive en
tandem, faite de nombreuses
copies de la séquence GATTA.
Lorsque la séquence est étudiée,
un chevauchement peut être
identifiée entre deux fragments,
mais malheureusement ce
chevauchement peut provenir de
n’importe quelle extrémité de la
séquence répétitive en tandem.
Si cette possibilité n’est pas
étudiée et si les fragments ne
sont pas positionnés de façon
adéquate, on risque de déléter la
séquence mère recherchée de la
totalité de la séquence répétitive
en tandem.
B. La molécule d’ADN contient deux copies d’une séquence répétitive, qui sont éloignées l’une de l’autre
dans le génome. Après examen des fragments d’ADN, deux fragments semblent se chevaucher mais un
des fragments comprend la partie gauche d’une des séquences répétitives alors que l’autre fragment
contient la partie droite de la seconde séquence répétitive. Dans ce dernier cas, si l’on n’identifie pas la
possibilité d’erreur, on risque de déléter la totalité de la séquence d’ADN comprise entre les deux
séquences répétitives éloignées de la structure finale de la séquence mère. Par ailleurs, si ces deux
répétitions génomiques étaient à l’origine situées sur deux chromosomes différents, alors on pourrait de
façon erronée relier ensemble ces deux séquences, ayant pourtant pour origine deux chromosomes
différents.
● Les difficultés d’application de cette méthode à
une grande molécule d’ADN contenant de nom-
breuses séquences répétitives font que cette
technique ne peut être utilisée seule pour séquen-
cer le génome des eucaryotes

● Il faut donc utiliser d’abord une carte du génome


qui servira de guide pour les expériences de sé-
quençage en mettant en place, pour ce génome,
un certain nombre de caractéristiques propres et
le positionnement de certains gènes
Figure. Méthodes alternatives
d’approche au séquençage du génome.

On a fait la carte génomique d’une


molécule d’ADN linéaire de 2.5 Mb qui
comprend la localisation de huit
marqueurs différents (A-H). A gauche
est schématisée la méthode d’analyse des
clones chevauchants contigus. Par cette
méthode, on analyse un des fragments
d’ADN et on le situe par rapport à la
carte, parce qu’il contient les marqueurs
A et B. ce fragment est alors séquencé
par la méthode "shotgun" et la séquence
replacée en position sur la carte. A
droite, on utilise la technique de
séquençage par la méthode "shotgun" sur
le génome entier, par laquelle on
assemble les différentes séquences du
génome entier obtenues au hasard. Le
résultat est l’assemblage de séquences
contiguës de quelques centaines de kb de
long. Si deux séquences contiguës
contiennent un marqueur, elles peuvent
alors être replacées sur la carte. Plus il y
a de marqueurs dans le génome, plus la
tâche sera facile.
Shotgun appliqué au séquençage du
génome de Haemophilus influenzae

● Les années 90 on vu s’installer une polémique


scientifique quand aux possibilités d’utilisation de
la technique du coup de fusil : en effet, beaucoup
de biologistes moléculaires pensaient que le nom-
bre des données collectées pour un génome à sé-
quencer (permettant de comparer les mini-
séquences et d’identifier leurs chevauchements)
était beaucoup trop important par rapport aux
capacités des outils d’analyse informatique à leur
disposition ... Ces doutes initiaux se sont envolés
quand la séquence de la bactérie Haemophilus
influenzae a été publiée en 1995
● Stratégie de séquençage
- La première étape a consisté à casser l’ADN gé-
nomique en petits fragments par sonication
- Les fragments obtenus ont ensuite été séparés
par électrophorèse sur gel de polyacrylamide, et
tous ceux de longueur comprise entre 1.6 et 2 kb
ont été purifiés puis insérés dans un vecteur
plasmidique, pour construire une banque d’ADN
génomique : dans cette banque, 19.687 clones
différents ont été pris au hasard et soumis à
28.643 expériences de séquençage
- L’assemblage des séquences a produit 140 lon-
gues séquences adjacentes, fragments uniques
et non chevauchants du génome entier
Figure. Utilisation de la technique de "shotgun"
pour le séquençage du génome de Haemophilus
influenzae.

L’ADN de H. influenzae a été soniqué et les


fragments de 1.6 à 2.0 kb de longueur ont été
purifiés sur gel d’agarose et insérés dans des
plasmides afin de produire une banque de clones.
On a ensuite identifié les séquences terminales de
chacun de ces clones et utilisé un ordinateur pour
repérer les séquences chevauchantes. On a pu
mettre en évidence 140 séquences adjacentes qui
ont ensuite été assemblées, grâce à un programme
informatique, selon un ordre correspondant à celui
de la séquence d’ADN génomique sauvage.
- Tout d’abord, il a été vérifié dans la banque gé-
nomique s’il existait des clones dont les deux sé-
quences terminales étaient localisées dans des
séquences adjacentes différentes : si un tel
clone était identifié, la séquence ADN insérée
devait correspondre à la séquence manquante, la
lacune, située entre les deux séquences adja-
centes

- De fait, 99 clones présentant ces propriétés ont


pu être identifiés et 99 de ces séquences lacu-
naires intermédiaires ont été séquencés sans
trop de difficulté
- Il restait à déterminer 42 séquences intermé-
diaires qui consistaient très probablement en sé-
quences ADN instables dans le vecteur de clona-
ge et donc non présentes dans la banque géno-
mique

- Pour combler ces lacunes, une autre banque


d’ADN génomique a été construite à partir d’un
autre vecteur de clonage : plutôt que d’utiliser
un autre plasmide, dans lequel les séquences non
clonées pouvaient encore être instable, la deu-
xième banque génomique a été construite dans le
bactériophage 
- Cette banque à été criblée au moyen de 84 oligo-
nucléotides présentant des séquences identiques
aux 84 séquences terminales des séquences
adjacentes non encore déterminées

- L’idée était que si deux oligonucléotides s’hybri-


daient au même clone , alors les extrémités des
séquences adjacentes (desquelles ils étaient dé-
rivés) devaient se trouver dans ce clone, et le
séquençage de l’ADN du clone  devait permet-
tre d’identifier la séquence de la lacune

- Par cette technique, 23 des 42 lacunes existant


dans les différentes séquences adjacentes ont
pu être identifiées
Figure. Assemblage du génome complet de
Haemophilus influenzae après étude des lacunes
présentes entre séquences adjacentes.

A. Les "séquences lacunaires" sont des séquences


intermédiaires non encore identifiées qui peuvent l’être
par séquençage de l’ADN de certains clones présents
dans la banque génomique. Dans cet exemple, les
séquences terminales des séquences adjacentes 1 et 2
sont retrouvées dans un seul clone. Si on séquence au
moyen d’amorces internes l’insert ADN de ce clone, on
pourra connaître la séquence lacunaire manquante.
B. Les "séquences manquantes" sont des portions
d’ADN qui ne sont plus présentes dans la banque de clo-
nes, probablement à cause du vecteur utilisé dans le-
quel ces séquences particulières du génome ne sont pas
stables et disparaissent. Il existe deux stratégies pos-
sibles pour retrouver ces parties de génome perdues. A
gauche, une autre banque génomique est préparée à
partir du phage , au lieu du plasmide utilisé en pre-
mier. On pourra tester cette deuxième banque au mo-
yen d’oligonucléotides correspondant aux extrémités
des séquences adjacentes de la première banque. On
observe ici que les oligonucléotides 1 et 7 hybrident un
même clone dont l’insert contient donc le fragment
manquant entre les clones 1 et 4 de la première banque.
A droite, on fait des PCRs avec les oligonucléotides rassemblés par paires. Seule la PCR des clones 1 et 7
donne un produit, confirmant ainsi que les extrémités de ces séquences adjacentes représentent bien
des séquences très proches sur le génome sauvage. Les produits PCRs, tout comme les inserts des clones
du phage , peuvent alors être séquencés et compléter la séquence manquante située entre les séquences
adjacentes 1 et 4 de la seconde banque.
● Une fois démontré que la technique du shotgun
pouvait être utilisée avec succès pour séquencer
rapidement un petit génome, une pléthore de gé-
nomes microbiens ont été séquencés

● La mise en pratique de cette stratégie a permis à


5 chercheurs d’achever le séquençage du génome
de Mycoplasma genitallium (580 kb) en 8 semaines
(Fraser et al., 1995)

● Les qualités de cette technique sont la rapidité et


la non nécessité au préalable de toute carte géné-
tique ou physique du génome à séquencer
Assemblage de séquences par la
technique des clones adjacents

● L’utilisation de la technique des clones adjacents


pour obtenir la séquence d’un génome eucaryote
représente l’approche technique conventionnelle,
qui a aussi été utilisée pour les génomes micro-
biens ayant auparavant été cartographiés par les
méthodes physiques ou génétiques
● Par cette technique, le génome entier est coupé
(en général par une digestion partielle) en frag-
ments pouvant aller jusqu’à 1.5 Mb, qui sont
ensuite insérés dans des vecteurs (BAC, YAC, ...)

● La technique consiste à identifier les clones con-


tenant des fragments chevauchants, puis à les
séquencer

● Les fragments clonés sont d’abord situés sur une


carte génomique (physique ou génétique) de telle
façon que l’on puisse vérifier et interpréter les
séquences obtenues en utilisant les particularités
de certaines séquences (RFLP, SSLP, SNP, ...) ou
certains gènes, présents dans ce génome
Polymorphisme de restriction de l’ADN (RFLP)

● Ce sont les premiers marqueurs ADN à avoir été


étudiés
● Les enzymes de restriction coupent les molécules
d’ADN au niveau de séquences spécifiques : en
raison de cette spécificité, le traitement par une
enzyme de restriction devrait toujours conduire à
la formation d’un couple de fragments identiques
● Ceci n’est pas toujours le cas lorsque l’on travaille
sur de l’ADN génomique, car il existe des sites de
restriction polymorphes présentant deux allèles
différents, l’un étant la séquence correcte et
l’autre la séquence mutée
Figure. RFLP (Restriction Fragment Length
Polymorphism) ou polymorphisme de taille des
fragments de restriction

La molécule d’ADN à gauche possède un site de


restriction polymorphe (marqué avec un astérisque)
qui n’existe pas dans la molécule d’ADN de droite. Le
RFLP est révélé par traitement par l’enzyme de
restriction car une molécule est coupée en quatre
fragments alors que l’autre ne l’est qu’en trois
fragments.
Figure. Deux méthodes de mise en évidence des RFLP
A. Par la méthode de Southern, l’ADN est digéré par une enzyme de restriction appropriée et les
fragments analysés par électrophorèse sur gel d’agarose. On transfère alors une partie du gel sur une
membrane de nylon et celle-ci est mise en présence d’une sonde, composée d’un fragment d’AND
comprenant la séquence du site de restriction. Si le site de restriction est absent, un seul fragment est
mis en évidence (puits n°2); si le site de restriction est présent, on en détectera deux (puits n°3).
B. Par PCR, on utilise des amorces qui s’hybrident avec chacune des extrémités du site de restriction
polmorphe. Après PCR, les produits sont traités par l’enzyme de restriction appropriée et analysés par
électrophorèse sur gel d’agarose. Si le ste est absent, on ne retrouve qu’une bande à l’autoradiographie;
par contre, deux bandes sont visualisées si le site est présent.
Polymorphismes de restriction
à séquences simples (SSLP)
● Les SSLP sont des séquences ordonnées répétiti-
ves dont les différents allèles contiennent un
nombre différent d’unités de répétition: les SSLP
sont multi-alléliques, chaque site pouvant présen-
ter plusieurs variants de longueurs différents
● Il existe deux types de SSLP
- Les minisatellites ou VNTR (Variable Number of
Tandem Repeats) dans lesquels l’unité répétitive
ADN peut comprendre 25 pb
- Les microsatellites ou STR (Simple Tandem
Repeat), l’unité répétitive comprenant un di- ou
un tétra-nucléotide
Figure. Minisatellites ou SSLP et leur mise en évidence

A. Deux allèles d’un SSLP. Dans l’allèle 1, le motif “GA” est répété trois fois, alors que dans l’allèle 2 il
est répété cinq fois.
B. Mise en évidence d’un minisatellite SSLP par PCR. On amplifie par PCR la région entourant le
minisatellite de l’ADN à étudier. On dépose les produits de la PCR dans le puits A d’un gel d’agarose
alors que dans le puits B on dépose des marqueurs de taille correspondant aux deux allèles. Après
électrophorèse, on voit que la bande unique en A a la même taille que le plus long des marqueurs d’ADN,
montrant que l’ADN testé ne contient que l’allèle 2.
Polymorphismes nucléotidiques (SNP)

● Il existe des positions dans le génome où certains


individus ont un nucléotide donné (par exemple G)
alors que les autres individus de la population
générale présentent à ce même endroit un autre
nucléotide (par exemple C) : ce sont des sites SNP

● Certains SNP peuvent être à l’origine de RFLP,


alors que certains autres sont silencieux

● Il existe environ 1.42 million de SNP dans le géno-


me humain dont seulement 100.000 présentent un
polymorphisme de restriction (SNP group, 2001)
On compte actuellement180 million(2012)
Figure. SNP (Single Nucleotide Polymorphism) ou
polymorphisme dû à une mutation ponctuelle.
Figure. L’hybridation des oligonucléotides est très spécifique.

L’hybridation en milieu très stringent entre un oligonucléotide et un


fragment d’ADN ne donne d’hybride stable que si l’oligonucléotide est
capable de s’hybrider base par base avec celles de l’ADN cible. S’il
existe une seule erreur d’appariement, l’hybide ne peut pas être formé.
Pour atteindre ces conditions de stringence, la température
d’hybridation doit êtrejuste en-dessous de la température de fusion ou
Tm de l’oligonucléotide. A des températures supérieures à la Tm, même
l’hybride parfait est instable. A plus de 5°C en dessous de la Tm, des
hybrides imparfaits sont stables. La Tm pour l’oligonucléotide
représenté dans cette figure est d’environ 58°C. Pour calculer la Tm d’un
oligonucléotide de 15 à 30 nucléotides de long, on applique la formule
suivante : Tm = (4 × nombre de G et de C) + (2 × nombre de A et de T).
● Remarque : Potentiellement, chaque SNP devrait
présenter quatre allèles différents, mais en réa-
lité il n’en existe en général que deux. Pourquoi ?

- Ceci a pour origine la manière dont les sites po-


lymorphes sont constitués puis transmis dans la
population

- En effet, un site SNP a pour origine une muta-


tion ponctuelle dans le génome, convertissant un
nucléotide donné en un autre nucléotide

- Si la mutation a lieu dans les cellules germinales


d’un individu donné, sa descendance pourra éven-
tuellement hériter de cette mutation et le site
SNP sera établi dans la population générale
- On sera alors en présence de deux allèles diffé-
rents seulement : la séquence originale et la
version mutée

- Pour qu’un troisième allèle puisse être observé, il


faudrait, d’une part, qu’une deuxième mutation
puisse avoir lieu, située exactement au même en-
droit du génome, et, d’autre part, que cette deu-
xième mutation soit, elle aussi, transmise aux
générations suivantes

- Bien que cela ne soit pas impossible, il y a extrê-


mement peu de chances que cela se produise et
c’est pourquoi la majorité des sites SNP ne pré-
sentent que deux allèles différents
● Les sites SNP ont l’avantage d’être très nombreux
et peuvent être typés par des méthodes qui ne
nécessitent pas d’électrophorèse sur gel

● Cet avantage est important puisque les techniques


d’électrophorèse sont difficiles à automatiser

● La détection des sites SNP se fait grâce à l’ana-


lyse par hybridation d’oligonucléotides

● Différentes stratégies de criblage des sites SNP


ont ainsi été mises au point : les puces à ADN ou
l’hybridation en solution
● Sur la puce, peuvent être fixés de nombreux oli-
gonucléotides différents

● L’ADN à tester présente un marquage fluorescent


et est déposé à la surface de la puce

● L’hybridation est détectée au microscope à fluo-


rescence, permettant de repérer avec exactitude
le signal fluorescent émis lors de l’hybridation
d’un oligonucléotide fixé à la puce par l’ADN à
tester

● On peut ainsi détecter de nombreux sites SNP en


une seule expérience
● Pour l’hybridation en solution, le repérage des
sites SNP se fait dans des puits d’une plaque de
microtitration dans laquelle chaque puits contient
un oligonucléotide différent

● Le système de détection est basé sur les proprié-


tés différentes des ADNs simple brin et des pro-
duits hybridés

● On utilise actuellement 2 marqueurs : un marqueur


coloré fluorescent et une substance qui empêche
l’émission de signal de fluorescence si elle est en
contact avec le marqueur fluorescent ... l’oligo-
nucléotide portant la fluorescence à l’une de ces
extrémités, le produit inhibiteur sur l’autre
● Ces deux extrémités s’apparient normalement,
empêchant la fluorescence

● En présence d’un fragment complémentaire, l’oli-


gonucléotide marqué et l’ADN testé s’hybrident,
séparant les deux extrémités de l’oligonucléotide,
et le signal fluorescent coloré apparaît
Figure. Détection d’un SNP par hybridation en solution.

On utilise une sonde oligonucléotidique, présentant à ses deux


extrémités, deux marqueurs. Un des marqueurs est une molécule
fluorescente et l’autre un marqueur d’extinction du signal de
fluorescence. Lorsque les deux extémités sont appariées, le signal
fluorescent est éteint. Lorsque la sonde s’hybride avec un fragment
d’AND cible, les deux extrémités de la sonde sont séparées et le
signal fluorescent apparaît. Ces deux marqueurs sont appelés
balises moléculaires.
● Des clones adjacents peuvent être construits pas
à pas le long du chromosome (méthode laborieuse)
● Une façon plus simple d’obtenir une série de clo-
nes contenant des fragments d’ADN chevauchants
est de partir d’un clone issu d’une banque génomi-
que et d’identifier un second clone dont l’insert
présente une séquence chevauchante avec le pre-
mier, puis un troisième, ... > c‘est ce que l’on a ap-
pelé la marche le long du chromosome, première
méthode mise au point pour l’assemblage d’une
banque de clones adjacents
● A l’origine, cette démarche a été utilisée pour sé-
quencer les portions d’ADN proches d’une région
déjà séquencée, en partant de banques de clones
● L’approche la plus directe est d’utiliser l’ADN
inséré dans un premier clone comme sonde
d’hybridation pour cribler l’ensemble des autres
clones

> Seuls les clones dont l’ADN inséré est chevau-


chant par rapport au premier peuvent s’hybrider
avec la sonde, puis ceux-ci sont ensuite utilisés
en tant que sonde pour continuer
Figure. Marche le long du
chromosome.

La banque génomique comprend


96 clones qui contiennent
chacun un insert différent. Pour
commencer la marche, l’insert
de l’un des clones est utilisé
comme sonde d’hybridation par
tous les autres. Dans cet
exemple, le clone A1 est la
sonde dont on voit qu’elle
s’hybride aux clones E7 et F6.
Les inserts de ces deux clones
doivent donc être chevauchants
par rapport à l’insert de A1.
Pour continuer la marche le long
du chromosome, on répète le
criblage mais cette fois avec
pour sonde l’insert du clone F6.
La sonde F6 s’hybride avec les
clones A1, F6 et B12, montrant
que l’insert contenu dans le
clone B12 est chevauchant par
rapport à l’insert de F6 et ainsi
de suite.
● Le problème le plus difficile à résoudre se pose
lorsque le génome contient une séquence répétée
dispersée dans le génome, car elle s’hybridera non
seulement avec la séquence adjacente suivante,
mais aussi plusieurs fois tout le long du génome,
et il sera alors impossible d’agencer les clones
dans le bon ordre

● Ces difficultés, liées a une hybridation non spéci-


fique, peuvent être réduites en bloquant les sé-
quences par une pré-hybridation avec de l’ADN
génomique non marqué
● Cependant, le problème ne sera pas totalement
résolu, surtout si la marche le long du chromosome
est faite au moyen d’une banque chevauchante
contenant de long inserts (telles les banques de
YAC ou de BAC)

● Cette technique est donc rarement utilisée pour


le séquençage de l’ADN humain ou un ADN simi-
laire présentant de nombreuses séquences répé-
tées dispersées dans le génome

> On utilise plutôt comme amorce un fragment


court de la séquence terminale de l’insert, ce qui
réduit les risques d’être en présence d’une sé-
quence répétée
● On peut dans ce cas accélérer la marche le long
du chromosome grâce à l’utilisation de la PCR pour
identifier les clones chevauchants

> Les amorces sont construites à partir de la sé-


quence terminale et sont alors testées sur
l’ensemble des autres clones de la banque

> Si un produit PCR de taille correcte est obtenu


avec un clone, cela permet de dire que ce clone
contient un insert chevauchant
Figure. Marche le long du
chromosome par PCR.

Dans le clone 1, les deux


oligonucléotides s’hybrident
dans la région 3’-terminale de
l’insert d’ADN. On les utilise
alors comme amorce au cours
de PCRs effectuées à partir de
tous les clones de la banque
génomique. Le clone 15 est le
seul à donner un produit PCR, ce
qui indique que les clones 1 et
15 sont chevauchants. On
séquence l’autre extrémité du
clone 15 et, pour continuer
cette marche, on utilise une
paire d’oligonucélotides
préparés à partir de cette
autre extrémité du clone 15. On
effectue un criblage sur tous
autres clones de la banque en
faisant des PCRs au moyen de
cette nouvelle paire d’amorces.