Vous êtes sur la page 1sur 8

7.

Séquences répétées en tandem (VNTR) : source de variabilité génétique

Les génomes eucaryotes sont composés d'un grand nombre de classes différentes de
séquences d'ADN répétitives, soit dispersées (principalement des transposons et des
rétrotransposons et certaines familles de gènes codant pour des protéines), soit disposées en
tandem (ARN ribosomal, familles de gènes codant pour des protéines, satellites, ADN
télomérique, ADN centromérique). [1]

Les séquences répétées en tandem (ou VNTR pour Variable Number of Tandem
Repeats) est un terme englobant employé pour designer un motif de séquence d'ADN unitaire
de taille variable, qui se répète plusieurs fois de manière continue dans le génome et qui est
hérité selon les lois mendéliennes. Un exemple de séquence répétée en tandem, entourée de
ses sequences flanquantes, est donné à la figure Ci-dessous. Dans cette répétition, la taille de
l’unité répétée est 4, le nombre de répétition est 8 et les lettres en gras dénotent les différences
entre les copies et le motif consensus : ACGT

Figure 1: Exemple de séquence répétée en tandem entourée de ses séquences flanquantes.

Bien que ces VNTR soient souvent classés et ignorés, le nombre de fois que la séquence
est répétée peut différer au sein et entre les individus, faisant ainsi de ces VNTR une entité
polymorphe [2]. Selon la taille du motif et de la répétition, on distingue les satellites, les
minisatellites et les microsatellites.

7.1. Les ADN satellites (ADN sat)


Les ADN Satellites sont le composant principal de l'hétérochromatine, qui se trouve
spécifiquement aux emplacements péricentromériques et subtélomériques des chromosomes
[3]. De plus, l'hétérochromatine pourrait occuper des locus interstitiels des chromosomes dans
des positions spécifiques des bras chromosomiques entre les régions subtélomériques et
péricentromériques, en particulier chez les invertébrés et les plantes.

Dr. BOUCHEMAL.K Page 1


Dr. BOUCHEMAL.K
Figure 2: Représentation schématique hypothétique d'un chromosome végétal. Le schéma décrit la structure du
‎centromère, la séquence des télomères de type Arabidopsis et différentes classes de répétitions subtélomériques ‎et
interstitielles [3]

Page 2
L'ADN sat est une classe d'ADN répétitif caractérisée par son organisation génomique
en longs réseaux d'unités disposées en tandem appelées monomères. Il se distingue le mieux
des autres séquences répétées en tandem (mini et microsatellites) par sa formation de réseaux
beaucoup plus grands s'étendant jusqu'à des mégabases de longueur et formant souvent des
blocs d'hétérochromatine qui apparaissent sous forme de chromocentres nucléaires et de
bandes chromosomiques [4]. La plupart des répétitions centromériques des plantes ont des
longueurs de 135 à 195 pb ou de 315–375 bp.

La centrifugation en gradient de densité d’ADN génomique a mis en évidence des


bandes mineures (ou satellites) d’une densité différente de la bande majeure représentant la
majeure partie du génome, formant des bandes satellites au-dessus (ADN riche en AT) ou en
dessous (ADN riche en GC) de la bande principale [5]. Classiquement, trois bandes peuvent
être identifiées, chacune comportant différentes familles de séquences répétées appelées
séquences satellites qui diffèrent les unes des autres par leur emplacement, leur longueur
d'unité répétée, leur abondance et leur séquence nucléotidique. Ces familles connaissent des
taux élevés de changement et de remplacement génomiques et sont généralement spécifiques
à une espèce et peuvent être aussi partagées par un groupe d'espèces apparentées [6].

Les ADN satellites ne sont généralement pas transcrits et sont considérés comme de
l’ADN ‘poubelle’ ou ‘camelote’ (junk DNA) [5]. Cependant, certaines séquences présentent
une conservation de séquence pendant de longues périodes évolutives [7].Cela a été interprété
comme une indication claire que ces séquences remplissent un rôle fonctionnel, mais pas
toujours [8]. Elles sont donc transcrites en ARN non codant et peuvent participer à la
formation et au maintien de la structure de l'hétérochromatine et à la modulation de
l'expression des gènes.

L'ADN satellite présente un degré élevé de polymorphisme dû aux variations du


nombre d'unités répétées causées par des mutations impliquant plusieurs mécanismes. Cette
hypervariabilité parmi les répétitions d'ADN satellites d'organismes apparentés et non
apparentés en fait d'excellents marqueurs pour la cartographie, la caractérisation des génomes,
la corrélation génotype-phénotype, la sélection assistée par marqueurs des plantes cultivées et
les études liées à la diversité génétique [9].

Dr. BOUCHEMAL.K Page 3


7.2. Les minisatellites
Les minisatellites sont une classe particulière de séquences répétées en tandem. Elles
sont constituées de répétitions d’un motif élémentaire de longueur allant d’une dizaine à une
centaine de nucléotides : entre 6 et 100 pb [10]. La longueur totale des minisatellites varie
suivant les locus entre 0,5 et 500 kb. Les minisatellites les plus longs sont généralement
localisés dans les régions sous-télomériques des chromosomes tandis que les minisatellites
interstitiels ont une longueur qui excède rarement 1 kb [11].
Les minisatellites hypervariables sont extrêmement polymorphes, tant du point de vue
du nombre de répétitions que de la taille des unités répétées. Cependant, les répétitions
minisatellites partagent un motif central consensus (ou core) qui présente une similitude avec
la séquence ‘chi’, séquence signal de recombinaison chez E. Coli et serait de ce fait
susceptible de favoriser les recombinaisons et par conséquent le polymorphisme des
minisatellites [5].
En raison de leur polymorphisme de longueur, qui résulte des variations du nombre de
répétitions, et de la capacité de certaines de ces puces à s'hybrider avec des dizaines d'autres
loci similaires dans tout le génome, les minisatellites ont ouvert la voie à l'empreinte ADN
pour l'identification individuelle (Figure 3). Certains minisatellites ont un taux de mutation
très élevé, ce qui implique un niveau de polymorphisme important. Par conséquent, ces
minisatellites sont particulièrement utiles entre autres pour l’identification génétique et les
tests de paternité (Genoscope) [12].

Dr. BOUCHEMAL.K Page 4


Figure 3 :‎Visualisation‎d’empreintes‎d’ADN‎multialléliques [13]
Les unités répétées minisatellites sont caractérisées par une séquence centrale d'environ 16 pb chez l'homme et
d'autres animaux. ‎(A) Une répétition de base minisatellite est présente à trois loci. ‎(B) Le nombre de répétitions
minisatellites à ces locus est indiqué pour un individu (la mère) qui est hétérozygote à chacun des trois locus. Le
Génotype du Locus 1 : (5, 2) répétitions ; le génotype du locus 2 : (7, 3) répétitions ; et le génotype du locus 3 :
(8, 1) répétitions. (C) Représentation d'une autoradiographie montrant les profils de fragments de restriction de
quatre individus à ces trois loci. A chaque locus du profil de l'enfant, un allèle est partagé avec la mère et l'autre
est partagé avec le père, comme on pouvait s'y attendre lorsque la maternité et la paternité ont été correctement
identifiées. Notez que l'individu non apparenté ne partage qu'un petit nombre de bandes avec les individus de
cette famille.

7.2. Les microsatellites


Les microsatellites sont des segments d'ADN composés d'unités disposées en tandem de
1 à 6 pb. Ils sont également appelés SSR (Simple Sequence Repeats), STR (Short Tandem
Repeats) ou encore SSLP (Simple Sequence Length Polymorphisms). Ils se trouvent chez les
procaryotes et les eucaryotes et sont largement distribués dans tout le génome, en particulier
dans l'euchromatine des eucaryotes, et l'ADN nucléaire et organellaire codant et non codant
[14].
Ce sont des segments d'ADN, constitués d'unités mono-, di-, tri-, tétra- et penta-
nucléotidiques se répétant en tandem, qui sont disposées dans les génomes de la plupart des
espèces eucaryotes. Par exemple :

Dr. BOUCHEMAL.K Page 5


AAAAAAAAAAA serait référencé comme (A)11
GTGTGTGTGTGT serait désigné par (GT)6
ACTCACTCACTCACTC serait désigné par (ACTC)4.

Figure 4 : les marqueurs microsatellites

Les plantes sont riches en répétitions AT, alors que chez les animaux, la répétition AC
est la plus courante. Cela semble être la caractéristique générale qui distingue les génomes
végétaux et animaux.
Les SSR se caractérisent par un faible degré de répétition par locus (5-100), une
distribution aléatoire dispersée d'environ (104-105) par génome et un degré élevé de
polymorphisme de longueur [15].

7.2.1. Types de microsatellites [16]

 En fonction de l'occurrence et de la source de développement (3 types d’SSR) :


a. Microsatellites génomiques ou nucléaires (gSSR) : microsatellites isolés du génome
nucléaire.

Dr. BOUCHEMAL.K Page 6


b. EST ou microsatellites géniques (EST-SSR) : microsatellites développés par
exploration de données ou en exploitant des séquences EST déposées dans des bases
de données publiques.
c. Microsatellites organellaires [SSR chloroplastiques (cpSSR) et SSR mitochondriaux
(mtSSR)] : microsatellites développés à partir du chloroplaste ou du génome
mitochondrial d'un organisme.

 En fonction du type de séquence de répétition (4 types d’SSR)

a. Microsatellite parfait : la séquence répétée est continue et n'est interrompue par aucune
base n'appartenant pas au motif [par ex. AGAGAGAGAGAG ou (AG)6].
b. Microsatellite imparfait : une paire de bases est présente entre le motif répété qui ne
correspond pas à la séquence du motif [par ex. AGAGAGAGAGCTAGAGAG ou
(AG)5CT(AG)3].
c. Microsatellite interrompu : une petite séquence dans la séquence répétée qui ne
correspond pas à la séquence du motif [par ex. AGAGAGAGCGTGAGAGAGAG ou
(AG)4CGTG(AG)4].
d. Microsatellite composé/composite : deux répétitions distinctives adjacentes présentes
dans la séquence [par ex. AGAGAGAGAGTCTCTCTC ou (AG)5(TC)4].

 En fonction de la longueur du motif répété (2 types d’SSR)

a. Microsatellites de classe I : SSR parfaits ≥ 20 nucléotides de long.


b. Microsatellites de classe II : SSR parfaits de ≥12 nucléotides et ≤20 nucléotides de
long.
7.2.2. Les microsatellites et leur influence sur les fonctions moléculaires
- La présence de SSR dans les régions codantes conduit à l'apparition de motifs répétitifs dans
les séquences d'acides aminés [17] et interviennent ainsi dans la régulation de l'expression des
gènes ou des fonctions moléculaires.
- La présence de SSR dans la région promotrice influence l'activité transcriptionnelle, alors
que leur présence dans les régions non codantes influence la régulation des gènes, la
transcription et les événements de recombinaison [18]
Quelques exemples :

Dr. BOUCHEMAL.K Page 7


 La sur-représentation des CT/GA et les répétitions CTT/GAA dans les flancs 5'
d'Arabidopsis thaliana suggèrent leur implication potentielle dans la régulation de
l'expression des gènes [19].
 Les répétitions (GA)n dans les promoteurs régissent la régulation de certains gènes
végétaux et présentent une affinité de liaison aux protéines [20].
 La variation des répétitions CT/GA dans la région 5'UTR du gène ‘waxy’ est corrélée
avec la teneur en amylose du riz.
 Chez le maïs, la présence de (CCG)n dans la région 5'UTR des gènes des protéines
ribosomiques régule la fécondation.

Dr. BOUCHEMAL.K Page 8

Vous aimerez peut-être aussi