Vous êtes sur la page 1sur 324

UNIVERSITE DE KINSHASA

Faculté des sciences


Departement de Biologie

Destiné aux étudiants de L1 Biologie

2018
2
INTRODUCTION

La biologie moléculaire est apparue au 20e siècle à la suite de l’élaboration des lois de la
génétique, la découverte des chromosomes et l’identification de l’ADN comme support
chimique de l’information génétique. Après la découverte de la structure en double hélice de
l’ADN, la biologie moléculaire a connu d’importants développements pour devenir un outil
incontournable de la biologie moderne à partir des années 1970. Il s’agit d’une discipline au
croisement de la génétique, de la biochimie et de la physique dont l’objet est la
compréhension des mécanismes de fonctionnement de la cellule au niveau moléculaire.

Aujourd’hui, avec la biochimie et la biologie cellulaire, la biologie moléculaire constitue l’une


des clés pour la compréhension du vivant. Elle fait partie des disciplines auxquelles l’étudiant
est confronté dès le début de ses études en biologie, en médecine ou en pharmacie et constitue
l’une des assises de l’enseignement dans les filières biologiques. En fait le terme biologie
moléculaire fait référence à des études sur la structure chimique et physique des
macromolécules biologiques, grands polymères de poids moléculaire élevé appartenant à trois
classes principales : les polysaccharides, les prtéines et les acides nucléiques.

Le postulat de l’uniformité des processus biologiques à la base du fonctionnement cellulaire


est un des facteurs qui a permis le développement rapide de la biologie moléculaire. Il
s’agissait d’admettre que les principes biologiques fondamentaux qui gouvernent l’activité des
organismes simples tels que les bactéries et les virus pouvaient être appliqués à des cellules
plus complexes, seuls certains détails peuvent varier. En fait, la biologie moléculaire s’est
largement développée grâce à l’idée que les avancées les plus productives ont été obtenues par
l’étude des systèmes simples tels que les bactéries et les virus et que ces systèmes sont à même
de fournir des informations à propos des processus biologiques plus facilement que les cellules
animales ou végétales.

Les bactéries et les virus en effet permirent aux biologistes d’identifier le rôle de l’ADN
comme support de l’information génétique d’une cellule. A partir de cette découverte, la
génétique moléculaire progressa rapidement entre la fin des années 1950 et le début des
années 1960. Elle put fournir de nouveaux concepts à un rythme rappelant la situation de la
physique au moment de l’avènement de la mécanique quantique dans les années 1920. En fait
l’ère de la biologie moléculaire commença véritablement avec la découverte en 1953 de la
structure en double hélice de l’ADN par James D. Watson et Francis Crick. Les résultats des
travaux d’Erwin Chargaff montrant que dans l’ADN de diverses sources la quantité d’adénine
(A) est toujours pratiquement égale à celle de thymine (T) et la quantité de guanine (G) à celle
de la cytosine (C) ont permis l’élaboration du modèle de la molécule d’ADN. De là est né le
concept d’appariement des bases A et T et des base G et C. Les travaux de Maurice Wilkins et
Rosalind Franklin ont fourni les preuves de la structure hélicoïdale de l’ADN et donné des
précisions importantes sur le diamètre de la molécule, la distance entre les plateaux de bases
appariées, le pas de l’hélice, etc. Dès son élaboration, le modèle moléculaire de l’ADN a eu
un impact considérable. Il a fourni des pistes pour comprendre comment l’information
génétique est associée à l’ADN et comment elle est transmise de génération à l’autre avec
fidélité. Ainsi dès sa naissance, la biologie moléculaire apparaît comme la fusion réussie des
deux disciplines qui l’ont précédée : la génétique et la biochimie.
3

A l’heure actuelle, la biologie moléculaire permet au biologiste de pénétrer au cœur de la


cellule vivante, de démonter et analyser, pièce par pièce, le génome des organismes vivants.
Son objectif principal est de percer le mystère du fonctionnement de l’ADN, le dépositaire de
toutes nos caractéristiques. Ses applications intéressent de multiples domaines : la recherche
fondamentale, la médecine y compris la médecine légale et l’anthropologie, l’industrie
pharmaceutique, l’agriculture et l’élevage, etc. La biologie moléculaire fait abondamment
appel à l’outil informatique notamment pour l’analyse des séquences d’ADN, un travail long
et fastidieux avec des moyens classiques. Actuellement on dispose des banques de séquences
internationales régulièrement mises à jour. Les systèmes biologiques utilisés dans des
expériences en biologie moléculaire sont divers : les virus, les cellules bactériennes
(procaryotes) et les cellules eucaryotes (les cellules de levures, les cellules animales et les
cellules végétales).

Bactériophages

Ce sont de petites particules qui ne peuvent se multiplier qu’à l’intérieur d’une bactérie. Les
phages ont été un sujet de choix pour de nombreuses expériences aussi bien en raison de leurs
structures simples (ils ne sont en général composés que de deux à dix constituants) que de
leurs cycles biologiques moins complexes par rapport à ceux des bactéries. Ils possèdent
cependant toutes les caractéristiques les plus essentielles à la vie. La plupart de phages ne
contiennent que quelques centaines de molécules protéiques, composées de une à dix espèces
moléculaires différentes et une seule molécule d’acide nucléique. Les molécules protéiques
peuvent être organisées suivant trois modèles : dans le modèle le plus commun, elles forment
une enveloppe appelée capside ou tête du phage, à laquelle est généralement attachée une
queue.

D’autres formes de phages ne possèdent que la capside. La forme la moins commune


correspond à un filament où les molécules protéiques constituent une structure tubulaire dans
laquelle est encastré l’acide nucléique. L’acide nucléique des phages peut être de l’ADN
double-brin (le plus fréquent), de l’ADN simple-brin, de l’ARN simple-brin ou de l’ARN
double-brin (le moins fréquent). Les phages sont des parasites obligatoires. Ils ne peuvent pas
se multiplier en dehors de la bactérie hôte. Le cycle biologique des phages commence
lorsqu’une particule phagique s’adsorbe sur la surface d’une bactérie sensible. Ensuite,
l’acide nucléique phagique quitte la particule phagique à travers la queue du phage (s’il y en a)
et pénètre dans la bactérie en traversant la paroi cellulaire bactérienne. Une fois à l’intérieur,
l’acide nucléique du phage transforme la bactérie en une machine à synthétiser (produire) des
phages. Après une heure environ, le délai variant suivant les espèces de phages, la bactérie
infectée éclate, c’est le processus appelé lyse et quelques centaines de phages sont relâchés. La
suspension de phages nouvellement formés est appelée un lysat de phages.

Une bactérie typique a un temps de division d’une demi-heure, alors qu’une seule particule
phagique engendre plus de 100 descendants durant la même période de temps. Ces phages
infecteront un plus grand nombre de bactéries, et ceux relâchés dans le second cycle
d’infection encore plus. Ainsi en deux heures, il y a eu pour les bactéries et pour les phages
4
quatre cycles d’infection, et cependant une seule bactérie a donné naissance à 2 4 = 16
bactéries, alors qu’un seul phage a engendré 1004 = 108 particules phagiques.

Par l’utilisation des procédés qui perméalisent la paroi et la membrane cellulaire de la bactérie,
des infections peuvent être réalisées avec de l’ADN phagique libre aussi efficacement qu’avec
les particules phagiques. Cette technique, appelée transfection, est extrêmement pratique,
puisqu’elle permet d’altérer une molécule d’ADN, soit chimiquement, soit physiquement et
ensuite de tester l’effet de cette modification en infectant une cellule avec l’ADN altéré.

En génie génétique, la transfection est un procédé essentiel largement utilisé dans les études
sur les virus des animaux et des plantes. Le cycle biologique d’un phage est hautement régulé,
mais d’une manière légèrement différente de la régulation métabolique de la bactérie. Les
phages sont totalement dépendants du métabolisme de leur hôte bactérien, aussi ce sont
fréquemment les systèmes de régulation des bactéries hôtes qui contrôlent les processus
métaboliques de base nécessaires aux phages, tels que la production d’énergie et la synthèse
des précurseurs de l’ADN, des ARN et des protéines.

Un phage infectant est capable de se reproduire en synthétisant son propre acide nucléique, ses
protéines de structure et finalement de provoquer la rupture de la paroi cellulaire bactérienne,
permettant la libération des phages néoformés. Ceci requiert une régulation au cours du temps
de différentes étapes de la production des phages. L’étude de cette régulation a représenté une
partie importante de recherches en biologie moléculaire et a fourni un grand nombre
d’informations sur les processus cellulaires de base. Les phages sont comptés à l’aide d’une
technique appelée titration de phages. Environ 100.000.000 bactéries et un aliquot d’une
suspension de phages sont mélangés, puis incorporés à un agar liquide maintenu en surfusion
(top agar), l’ensemble est ensuite versé sur un milieu nutritif solide.

Les bactéries se multiplient et forment un fond trouble visible dans le top agar, appelé tapis
bactérien. Pendant la multiplication des bactéries, chaque phage peut s’adsorber sur une
cellule et initier une infection à l’issue de laquelle environ 100 phages seront relâchés par
cellule. Ces phages vont rester localisés dans le top agar, s’adsorber sur les bactéries les plus
proches et s’y multiplier. Plusieurs cycles d’infection peuvent s’enchaîner et vont entraîner
l’apparition sur le fond trouble d’un halo transparent et net. Cette zone claire est appelée
plage. Chaque phage étant capable de former une plage, ils pourront être dénombrés.
Différents phages mutants produisent des plages caractéristiques et identifiables, rendant cette
technique pratique pour l’analyse génétique.

Dans le passé, les expériences en biologie moléculaire étaient réalisées en utilisant les virus
des procaryotes. Les avancées actuelles de la biolgie moléculaire permettent l’utilisation des
virus des eucaryotes comme des adénovirus et des rétrovirus. Malgré leur pouvoir pathogène,
en effet, les adénovirus comme les rétrovirus sont très utilisés actuellement pour leurs
performances dans des études sur les cellules eucaryotes. Il s’agit en fait des virus dits
sécurisés, c’est-à-dire débarrassés des segments responsables de la pathogénicité du virus ;
seuls les segments responsables du fonctionnement du virus sont conservés. Les systèmes
biologiques utilisés dans des expériences en biologie moléculaire sont divers : les virus, les
5
cellules bactériennes (procaryotes) et les cellules eucaryotes (les cellules de levures, les
cellules animales et les cellules végétales).

Cellules bactériennes

Ce sont des organismes unicellulaires autonomes. Leur unique chromosome n’est pas contenu
dans un noyau. Par rapport aux eucaryotes, leur organisation est simple. Schématiquement,
une bactérie est une solution composée de quelques milliers de particules chimiques peu
organisées, enfermée dans un compartiment plus ou moins étanche et protégée par une paroi
rigide. Les bactéries ont des caractéristiques qui en font des organismes pratiques pour
l’étude des processus biologiques fondamentaux : a- elles se multiplient aisément et
rapidement, b- elles sont peu exigeantes nutritivement, comparées aux cellules des organismes
pluricellulaires. Escherichia coli est la bactérie la plus utilisée en biologie moléculaire. Elle se
divise toutes les 20 minutes à 37°C dans des conditions optimales de croissance. Ainsi, à
partir d’une cellule unique, il est possible d’obtenir 109 bactéries en 20 heures.

Les bactéries peuvent se multiplier sur un milieu de croissance liquide ou sur une surface
solide. Une population se développant dans un milieu liquide est appelée culture bactérienne.
Si le milieu de croissance est un mélange simple ne contenant pas de composés organiques
autres qu’une source de carbone (sucre), il est appelé milieu minimum. Un milieu minimum
typique contient des ions Na+, K+, Mg++ , Ca++, NH4+, Cl-, PO4--- et SO4--- ainsi qu’une source
de carbone qui peut être du glucose, du glycérol ou du lactate. Une bactérie capable de se
multiplier sur un milieu minimum, c’est-à-dire capable de synthétiser des substances
organiques telles que des acides aminés, des vitamines et des lipides à partir des éléments du
milieu est appelée prototrophe. Une bactérie qui exige pour sa croissance d’autres substances
organiques que la source de carbone est appelée auxotrophe. C’est le cas, par exemple, d’une
bactérie exigeant l’acide aminé leucine dans son milieu de croissance est dite auxotrophe pour
la leucine, et le symbole génétique pour une telle bactérie est leu- . Un prototrophe sera
nommé leu+.

Les bactéries poussent fréquemment sur des surfaces solides. La première surface utilisée pour
la croissance des bactéries fut une tranche de pomme de terre crue. Elle fut plus tard remplacée
par un milieu solidifié par de la gélatine. Comme beaucoup de bactéries excrétaient des
enzymes dégradant la gélatine, il fallut rechercher un agent gélifiant inerte. L’agar est un agent
gélifiant obtenu à partir d’une variété d’algues utilisées abondamment comme agent
d’épaississement dans la cuisine japonaise. Il est résistant aux enzymes bactériennes et a donc
été universellement utilisé. Un milieu de croissance solide est appelé agar complet si le
milieu liquide est un bouillon nutritif, ou bien agar minimum si c’est un milieu minimum qui a
été gélifié. Ces milieux solides sont le plus souvent distribués dans des boîtes rondes appelées
boîtes de Pétri. Le dépôt de bactéries à la surface de l’agar est appelé un étalement.

Une bactérie se développant à la surface de l’agar peut se diviser mais du fait du manque de
mobilité de la plupart de bactéries, la descendance bactérienne est regroupée au niveau du
dépôt initial de la bactérie d’origine. Lorsque le nombre de descendants augmente
suffisamment, un amas de bactéries devient visible. Cet amas est appelé colonie bactérienne.
La formation de colonies permet de déterminer le nombre de bactéries d’une culture.
6
L’étalement de 100 cellules conduira, par exemple, à la formation de 100 colonies le jour
suivant. L’étalement est une méthode permettant de déterminer si une bactérie est
auxotrophe.

Pour ce faire, les boîtes d’agar minimum et d’agar complet sont préparées. Quelques centaines
de bactéries sont étalées sur chaque boîte. Les boîtes sont ensuite incubées une nuit dans une
étuve à 37°C. Quelques centaines de colonies seront trouvées sur les boîtes de milieu complet
puisque celui-ci satisfait les exigences de la plupart de bactéries. Si des colonies sont
également trouvées sur le milieu minimum, la bactérie est prototrophe. Si aucune bactérie ne
s’y développe, la bactérie est auxotrophe. L’agar minimum ne contient donc pas de
substances exigées pour sa croissance. Des boîtes de milieu minimum sont alors préparées en
y incorporant des suppléments variés. Si la bactérie est auxotrophe pour la leucine, par
exemple, seule l’addition de la leucine permettra la formation de colonies. En plus de ces
systèmes simples, les avancées de la biologie moléculaire ont permis l’utilisation des systèmes
plus complexes comme les levures, les cellules animales ou végétales.

Cellules de levures

Ce sont des organismes unicellulaires qui ont été utilisés depuis des millénaires pour la
production de vin et de la bière. Les levures peuvent être propagées en laboratoire et
dénombrées de la même façon, à bien de points de vue, que les bactéries. Elles poussent en
suspensions liquides, soit dans des milieux définis chimiquement, soit dans des bouillons
complexes. Elles se développent également sur une surface solide en formant des colonies. A
l’exception de levure se divisant par scissiparité, le mécanisme de multiplication de l’ensemble
de levures diffère des mécanismes de division de la bactérie mature par le fait que les levures
ne se divisent pas mais se multiplient par bourgeonnement. Chaque cellule mère produit une
cellule fille par excroissance à partir de sa paroi cellulaire. La cellule fille se développe et une
fois adulte, elle peut bourgeonner. La cellule mère peut bourgeonner plusieurs fois.

Par le passé, la majorité de recherches en biologie moléculaire ont été réalisées en utilisant des
bactéries et des virus du fait de leur relative simplicité par rapport aux cellules eucaryotes. Les
avancées technologiques ont rendu possible la réalisation d’études efficaces et informatives
sur les eucaryotes, comme la levure Saccharomyces cerevisiae. En effet, elle possède
l’organisation génétique et les stratégies de régulation typiques des eucaryotes tout en ayant la
facilité de manipulation et la vitesse de croissance des microorganismes comme les bactéries.
L’existence de deux phases, haploïde et diploïde, chez S. cerevisiae est également une
caractéristique intéressante.

Les cellules haploïdes qui sont de deux types sexuels différents peuvent fusionner pour former
une lignée cellulaire stable. Dans des conditions nutritionnelles particulières, ces diploïdes
subissent une méiose qui génère des spores sexuelles haploïdes. Ce système de croisement
permet la réalisation d’études génétiques détaillées et fait de la levure un bon système pour
l’étude de la recombinaison génétique et de la méiose. D’autres eucaryotes unicellulaires, tels
que l’algue Chlamydomonas et le protozoaire Tetrahymena, qui possèdent beaucoup de
propriétés de la levure, ont été également utilisés en biologie moléculaire des eucaryotes.
7
Cellules animales

Les recherches sur les cellules animales progressent beaucoup moins vite que les travaux sur
les bactéries et ceci pour deux raisons : la première provient du fait que les cellules animales
se divisent toutes les 24 à 48 heures, alors que la plupart de bactéries se divisent seulement
entre 25 à 50 minutes. Ainsi, les expériences utilisant les cellules animales prennent souvent
plus de temps que celles utilisant les bactéries. La deuxième raison est que les bactéries se
développant en culture ne sont pas significativement différentes des bactéries de la nature,
alors que les expériences avec les cellules animales exigent qu’elles soient retirées de l’animal
et souvent séparées les unes des autres. A la suite de ce traitement, ces cellules ont perdu leur
mode normal de nutrition et elles ne sont à l’évidence plus dans leur état naturel. De
nombreux milieux permettant la croissance des cellules en culture ont été développés.

Leur fonction première consiste à conserver aussi longtemps que possible les cellules vivantes,
mais ils ne les maintiennent pas toujours dans un état normal. La plus évidente des différences
est que la plupart de cellules prélevées sur un organisme meurent en quelques semaines. De
plus, durant ce laps de temps, quelques cellules se divisent, ce qui diffère de leur état de repos
dans l’organisme où elles ne se divisent pas. Parmi ces cellules, quelques-unes arrivent à
survivre et se multiplient alors indéfiniment : elles sont dites immortalisées, engendrant une
lignée cellulaire établie. Au cours du temps, ces cellules développent des anomalies dans le
nombre de leurs chromosomes et possèdent certaines propriétés des cellules tumorales.

Cellules végétales

Par rapport aux animaux, les végétaux présentent l’avantage d’être facilement accessibles à la
manipulation génétique : a- ils peuvent être autofécondés, b- une plante entière peut se
régénérer à partir d’une seule cellule. Cependant la grande taille de leur génome constitue un
inconvénient majeur (ce sont des polyploïdes). La méthode la plus employée pour transformer
efficacement les cellules végétales repose sur le plasmide Ti, présent dans la bactérie
Agrobacterium tumefaciens responsable de la formation des tumeurs sur les feuilles. Les
bactéries n’entrent pas dans les cellules des plantes mais transfèrent uniquement une région du
plasmide Ti, dite région T ou ADN-T par un mécanisme similaire à la conjugaison.

L’ADN-T contient les gènes des auxines et cytokinines, phytohormones responsables de la


multiplication incontrôlée des cellules végétales. L’ADN-T contient également les gènes qui
dirigent la synthèse des opines, acides aminés rares utilisés par la bactérie. Les facteurs libérés
par la cellule végétale, par suite d’une blessure, stimulent la transcription des gènes vir du
plasmide, responsables du transfert de l’ADN-T. Cet ADN-T est transféré sous forme d’un
ADN simple brin, puis grâce à des séquences répétées se trouvant à ses extrémités, il s’intègre
de manière aléatoire dans l’un des chromosomes de la cellule.

L’ADN simple brin du plasmide Ti resté dans la bactérie est répliqué pour former une ADN
double brin, ainsi la bactérie est à nouveau capable de transformer une autre cellule végétale.
Le système de transfert de l’ADN-T dans les cellules végétales est utilisé pour transférer des
gènes en remplaçant, dans le plasmide Ti, la région T par l’ADN étranger. Cette technique a
permis de produire des plantes résistantes à des herbicides, aux virus et aux insectes.
8

Cependant si ce système de transfert de l’ADN est efficace pour les végétaus dicotylédones, il
l’est beaucoups moins pour les monocotylédones (comme le maïs, le riz, le blé, etc) qui sont
pourtant d’un intérêt économique considérable. Etant entourées d’une paroi cellulosique, les
cellules des monocotylédones sont difficiles à transformer directement avec des vecteurs
d’ADN. Dans ce cas on utilise des préparations des protoplastes, c’est-à-dire des cellules
végétales débarrassées de leur paroi.

Matériel biologique utilisé

Toute étude en biologie moléculaire implique de disposer d'échantillons d'acides nucléiques.


Les études sont facilitées par le fait que toute cellule nucléée renferme dans l’ADN de son
noyau toute l'information génétique de l'individu entier, la différenciation ne consistant pas
(sauf rarissime exception) en une perte d'information. Les techniques d'extraction des acides
nucléiques sont relativement simples. Il convient simplement d'éviter toute destruction
enzymatique ou mécanique. En effet les acides nucléiques, qui sont stables dans la cellule
intacte, deviennent très vulnérables à la digestion par les nucléases endogènes une fois la
cellule lysée. De plus le très long filament d’ADN génomique est susceptible de subir des
cassures. La préparation en routine de l’ADN se réalise de plusieurs manières : à partir du
sang total, à partir des tissus ou des cellules, à partir des organes.
9
Chapitre 1

MACROMOLECULES BIOLOGIQUES

Une cellule typique contient de 104 à 105 molécules différentes. La moitié d’entre elles
correspond à de petites molécules, à savoir des ions inorganiques et des composés organiques
simples dont le poids moléculaire n’excède pas plusieurs centaines de daltons. Les autres
correspondent à de grands polymères dont le poids moléculaire va de 104 à 1012 daltons et qui
sont appelés des macromolécules. Ces macromolécules appartiennent à trois classes
principales : les protéines, les acides nucléiques et les polysaccharides, respectivement
polymères des acides aminés, des nucléotides et des sucres.

La connaissance des propriétés de ces macromolécules est essentielle pour la compréhension


des processus vivants. La diversité structurale des macromolécules va de pair avec la diversité
des êtres vivants. Chaque cellule possède des milliers de macromolécules différentes dont un
grand nombre varie d’un tissu à un autre chez un même individu. Les différences qui existent
entre frères et sœurs témoignent de variations des macromolécules, particulièrement de l’ADN
et des protéines. Les différences moléculaires sont plus importantes entre individus sans lien
de parenté et encore plus importantes entre les espèces.

En biologie moléculaire comme dans l’étude de la vie à tous les niveaux, la structure et la
fonction sont indissociables et compte tenu de la taille et de la complexité des
macromolécules, la compréhension de leur architecture permet de saisir leur fonctionnement
dans la cellule. En effet, les cellules élaborent des macromolécules en liant des molécules
organiques relativement petites pour former des chaînes appelées polymères. Un polymère est
une grosse molécule constituée d’un grand nombre d’unités structurales de base identiques ou
semblables qui sont rattachées le long d’une chaîne pouvant se déployer de différentes façons
dans l’espace. Les molécules organiques ou groupes de molécules organiques qui servent
d’unités structurales de base s’appellent monomères.

1.1 POLYSACCHARIDES

Les polysaccharides sont des polymères résultant de la condensation de quelques centaines à


quelques milliers de monosaccharides. Certains polysaccharides jouent le rôle de substances
de réserve glucidique et sont hydrolysés selon les besoins des cellules en glucides. D’autres
polysaccharides servent de matériaux de construction pour les structures qui protègent la
cellule ou l’organisme entier. Les végétaux par exemple emmagasinent l’amidon sous forme
de granules dans les chloroplastes de leurs cellules.

L’amidon est un polysaccharide de réserve glucidique des végétaux formé entièrement des
molécules de glucose. Les vertébrés, y compris l’homme, emmagasinent le glycogène surtout
dans les cellules du foie et des muscles. Le glycogène est un polysaccharide de réserve
glucidique formé exclusivement de glucose. Les organismes fabriquent des matériaux solides
à partir des polysaccharides structuraux tels que la cellulose, un polymère de glucose.
10
La cellulose est un constituant important de la robuste paroi des cellules végétales. Il est le
composé organique le plus abondant sur terre. La plupart des fruits frais, des légumes et des
céréales sont riches en cellulose, c’est-à-dire en fibres. En fait, les fibrilles de cellulose
amollissent les selles et leur donnent du volume, améliorant l’efficacité des contractions
intestinales. La chitine, le glucide utilisé par les arthropodes (insectes, araignées, crustacés et
autres) pour construire leur exosquelette, constitue un autre polysaccharide structural
important. Le monomère de la chitine est un sucre

1.2 PROTEINES

Les protéines représentent environ 50 % du poids sec de la plupart des cellules et jouent un
rôle dans presque toutes les fonctions des cellules. Les protéines ont plusieurs fonctions : elles
soutiennent les tissus, emmagasinent et transportent des substances, transmettent des messages
d’un point à l’autre de l’organisme, produisent le mouvement et défendent l’organisme contre
les substances étrangères. De plus, une catégorie particulière de protéines, les enzymes,
accélèrent de façon sélective la vitesse des réactions chimiques dans les cellules.

L’être humain possède des dizaines de milliers de protéines de différentes sortes, chacune
ayant une structure et une fonction spécifiques. Sur le plan de la structure, les protéines sont
les molécules les plus complexes que l’on connaisse. Comme leurs fonctions, leur structure
varie considérablement ; chaque type de protéines possède une forme tridimensionnelle
unique. Mais, pour diversifiées qu’elles soient, les protéines sont toutes des polymères
élaborés à partir de la même série de 20 acides aminés, les monomères universels des
protéines.

Chaque acide aminé peut être schématisé par un atome de carbone (le carbone α) sur lequel
sont fixés un groupement carboxyle, un groupement amine et une chaîne latérale notée R. Les
chaînes latérales sont généralement des chaînes ou des cycles de carbone comportant
différents groupements fonctionnels. Les chaînes latérales les plus simples sont celles de la
glycine (atome d’hydrogène) et de l’alanine (un groupement méthyle). Pour former une
protéine, le groupement amine d’un acide aminé réagit avec le groupement carboxyle d’un
second acide aminé. La liaison chimique qui en résulte est appelée liaison peptidique.

Les acides aminés sont assemblés les uns à la suite des autres pour former une chaîne
polypeptidique linéaire. Un composé formé de deux acides aminés est un dipeptide. En
augmentant le nombre d’acides aminés, on obtient des tripeptides, des tétrapeptides, ….
Lorsque le nombre d’acides aminés est élevé, on parle de polypeptides et en général, on
appelle protéines les polypeptides dont le poids moléculaire est supérieur à 5000. Les deux
extrémités de chaque protéine ne sont pas identiques. L’extrémité possédant le groupement
amine libre est appelée extrémité amino terminale. L’autre extrémité possédant un groupement
carboxyle libre est appelée extrémité carboxy terminale. Ces extrémités sont respectivement
appelées N (ou NH2) et C terminales.

En général, les chaînes latérales des acides aminés ne sont pas engagées dans la formation des
liaisons covalentes. Il existe une exception avec le groupement – SH de la cystéine, qui réagit
11
fréquemment avec une seconde cystéine localisée dans la même chaîne ou dans une autre
chaîne polypeptidique pour former un pont disulfure (S – S). Une protéine se compose d’une
ou de plusieurs chaînes polypeptidiques adoptant une forme tridimensionnelle définie, c’est-à-
dire une certaine conformation. La fonction d’une protéine repose sur sa conformation unique
et sur sa capacité de reconnaître une autre molécule et de s’y lier. Lorsqu’une cellule
synthétise un polypeptide, la chaîne polypeptidique se replie spontanément pour adopter la
conformation fonctionnelle de cette protéine, c’est-à-dire sa conformation native. Au cours de
ce processus, la conformation de protéines est renforcée par une variété de liaisons chimiques
entre les parties de la chaîne.

1.2. 1 STRUCTURE DES PROTEINES

La conformation d’une protéine comporte quatre niveaux d’organisation structurale : primaire,


secondaire, tertiaire et quartenaire. La succession d’acides aminés d’une protéine forme la
structure primaire. Les liaisons peptidiques en sont à la base. La plupart des protéines ont des
régions possédant une structure en hélice α que l’on peut imaginer comme un enroulement
autour d’un cylindre imaginaire, formant une spirale régulière. D’autres protéines ou régions
des protéines ont une conformation β, qui est une structure en feuillets successifs formant un
angle entre eux. Ces deux structures forment la structure secondaire, stabilisée par des liaisons
hydrogènes entre les groupements CO et NH des liaisons peptidiques. La structure
secondaire est maintenue par des liaisons faibles ou secondaires dont l’énergie est faible
comparée à celle des liaisons covalentes. De ce fait les liaisons faibles peuvent se former et se
romprent spontanément sans intervention d’enzymes, ni consommation importante d’énergie.
Les liaisons hydrogène, les liaisons électrostatiques et les liaisons hydrophobes font partie des
liaisons faibles, responsables de la structure hélicoïdale de la chaîne polypeptidique.

La structure spatiale complète d’une protéine constitue sa structure tertiaire. On y trouve des
régions formées d’hélices α, de feuillets β, des régions sans structure rigide, des repliements
souvent dus à la présence de proline. L’ensemble de ces structures est stabilisé par des
liaisons faibles et des liaisons disulfures. Dans l’ensemble, les acides aminés à groupement
hydrophobe sont localisés à l’intérieur de la molécule, les groupements hydrophiles sont situés
à la surface de la molécule.

Pour de nombreuses protéines, on définit les domaines. On appelle domaine d’une protéine
une région bien définie à la fois du point de vue structural et du point de vue fonctionnel. Ainsi
une enzyme peut comporter un domaine de fixation de substrat et un domaine de liaison au
coenzyme. Les structures secondaires et tertiaires des protéines sont maintenues par des
liaisons faibles et des liaisons disulfures. Si ces liaisons sont rompues, ces structures
disparaissent et la protéine est dite dénaturée, sa molécule devient désordonnée.
Généralement, la dénaturation fait perdre aux protéines leurs propriétés biologiques.

De nombreuses protéines sont formées de sous-unités, identiques ou non, ayant chacune une
structure primaire et secundo-tertiaire. C’est la structure quaternaire. Les sous-unités sont
réunies par des liaisons faibles. L’ARN polymérase par exemple est formée de cinq sous-
unités, la glutamate déshydrogénase est formée de six sous-unités identiques, la
12
lacticodéshydrogénase est formée de quatre sous-unités qui peuvent être identiques ou de deux
types différents.

Interactions non covalentes qui déterminent les structures tridimensionnelles


des protéines et des acides nucléiques

Les propriétés biologiques des macromolécules sont en partie déterminées par des interactions
non covalentes qui sont établies dans chaque molécule repliée en une structure
tridimensionnelle. Une interaction intrachaîne correspond à une interaction entre deux
régions d’une même chaîne d’un polymère. Une interaction interchaîne se passe entre deux
chaînes de deux polymères. Les chaînes polypeptidiques et polynucléotidiques linéaires
contiennent un certain nombre de liaisons au niveau desquelles existe une rotation libre. En
absence d’interactions intrachaînes, chaque monomère est libre de pivoter par rapport aux
monomères adjacents.

Cette rotation n’est limitée que par le fait que les atomes ne peuvent occuper le même espace
simultanément. La configuration tridimensionnelle d’une telle chaîne est appelée pelote
statistique. Elle correspond à une structure compacte et globulaire changeant de forme
continuellement en raison de mouvements des molécules du solvant. Dans la nature, les
molécules d’acides nucléiques et de protéines n’existent vraisemblablement que peu ou pas
sous la forme de pelote statistique, puisqu’il existe de nombreuses interactions entre les
éléments de ces chaînes. Ces interactions peuvent être des liaisons hydrogènes, des
interactions hydrophobes, des liaisons ioniques et des interactions de Van der Waals.
13
ACIDES AMINES INDIVIDUELS
14

Liaisons hydrogènes

Ce sont des liaisons formées entre un atome d’hydrogène lié par une liaison covalente et
possédant une légère charge positive et un atome vosin possédant une charge négative. C’est le
cas des deux liaisons peptidiques voisines dans l’espace. C’est également le cas entre un acide
chargé négativement et un alcool ou un phénol. C’est encore le cas entre un phénol et le noyau
imidazol de l’histidine, ect. Dans les acides nucléiques, les liaisons hydrogènes entraînent la
formation d’appariements entre les bases des nucléotides situés sur le même brin (interaction
intrachaîne).

Si ces appariements se faisaient au hasard, ils conféreraient à un polynucléotide simple-brin


une structure encore plus compacte qu’une pelote statistique. Les liaisons hydrogènes
intrachaînes de l’ADN sont responsables de sa structure hélicoïdale double-brin (interactions
interchaînes). Dans les protéines, des liaisons hydrogènes intrachaînes se produisent entre un
atome d’hydrogène porté par un azote d’une liaison peptidique et un atome d’oxygène d’une
autre liaison peptidique. Ces interactions sont responsables des configurations particulières des
chaînes polypeptidiques.

Interactions hydrophobes

Une interaction hydrophobe est une interaction entre deux molécules (ou parties de molécules)
plus ou moins insolubles dans l’eau. Le phénomène repose simplement sur le fait que deux
molécules peu solubles dans l’eau tendent à s’associer. De nombreux composants des acides
nucléiques et des protéines ont des propriétés hydrophobes. Les bases des acides nucléiques,
par exemple, sont des cycles organiques portant localement de faibles charges. Ces charges
localisées suffisent à maintenir une certaine stabilité dans l’eau, mais la majeure partie des
cycles organiques est peu soluble. Ceci provoque une réaction vis-à-vis de l’eau qui conduit
les bases à se rapprocher.

La façon la plus efficace de se regrouper consiste à mettre en contact les surfaces des cycles en
formant une structure qui correspond à un empilement de bases. Les bases étant adjacentes
dans la chaîne, l’empilement donne une certaine rigidité à des polynucléotides simple-brin et
tend à les étirer plutôt qu’à former des pelotes statistiques. La plupart des chaînes latérales des
15
acides aminés sont très peu solubles, ce qui peut conduire à l’empilement des cycles
benzéniques de la phénylalanine et à la formation de regroupements entre les chaînes
hydrocarbonées de l’alanine, la leucine, l’isoleucine et la valine. Puisque ces acides aminés ne
sont pas nécessairement adjacents, ces interactions hydrophobes tendent à réunir entre elles les
parties éloignées d’une chaîne polypeptidique.

Liaisons ioniques

Une liaison ionique résulte de l’attraction entre deux groupes polaires de charges opposées.
Quelques-unes des chaînes latérales des acides aminés possèdent des groupements ionisés,
chargés négativement comme les groupes carboxyliques des acides aspartique et glutamique
ou chargés positivement comme les groupements amines de la lysine, histidine et arginine. Ces
groupements peuvent établir des liaisons ioniques qui tendent à relier des parties distantes
d’une même chaîne.

Les interactions ioniques peuvent également être de type répulsif, comme par exemple, la
répulsion observée entre deux charges de même signe. Ainsi il serait improbable que le
repliement d’une chaîne polypeptidique conduise au rapprochement de deux acides
aspartiques. Les liaisons ioniques sont les plus fortes des interactions non covalentes.
Toutefois, elles dépendent de pH, qui peut modifier la charge des groupements, de fortes
concentrations en sels, dans lesquelles les ions isolent les groupements chargés les uns des
autres.

Interactions de Van der Waals

Les forces de Van der Waals existent entre toutes les molécules et résultent à la fois de dipôles
permanents et de la circulation des électrons. La force d’attraction entre deux atomes est
proportionnelle à 1/ r6 où r représente la distance entre leurs noyaux. Ainsi cette attraction est
une force très faible, significative seulement lorsque les deux atomes sont très proches l’un de
l’autre (1 à 2 A°). Les forces de Van der Waals sont très faibles et elles sont facilement
supprimées par un traitement thermique.

En général, ces forces s’exerçant entre deux atomes ne suffiraient pas à les maintenir à
proximité. Toutefois, si les interactions de plusieurs paires d’atomes sont combinées,
l’accumulation des forces d’attraction peut être suffisamment importante pour résister à un
traitement thermique. Ainsi deux molécules peuvent s’attirer si plusieurs des atomes les
composant peuvent mutuellement réagir. Toutefois, l’ajustement intermoléculaire doit être
presque parfait pour permettre aux atomes d’être très proches. Cela signifie que les deux
molécules ne peuvent se lier l’une à l’autre que si leurs forces sont complémentaires.

C’est également vrai pour deux régions séparées d’un polymère. Ainsi, les différentes régions
ne pourront garder leur cohésion que si leurs formes s’harmonisent. Quelquefois l’attraction de
Van der Waals n’est pas suffisante pour favoriser cette cohésion. Toutefois elle peut
significativement renforcer d’autres interactions faibles telles que des interactions
hydrophobes, si l’ajustement est bon. En résumé, l’effet des interactions non covalentes est de
16
contraindre une chaîne linéaire à se replier afin de rapprocher des régions différentes de la
chaîne qui peuvent être assez éloignées.

Les liaisons faibles ou secondaires assurent la stabilité des macromolécules, telles les protéines
et les acides nucléiques, grâce à leur très grand nombre qui compense la faiblesse de chaque
liaison individuelle. Les liaisons faibles permettent également la combinaison de deux
molécules s’il existe une complémentarité de conformation entre ces molécules. C’est
notamment le cas des liaisons enzyme – substrat, antigène–anticorps, ARNt–ARNm,
répresseur–ADN.

1.2.2 QUELQUES PROPRIETES DES PROTEINES

■ Propriétés physico-chimiques

Solubilité

La plupart des protéines sont solubles dans l’eau et dans les solutions aqueuses. La solubilité
des protéines dépend du pH et de la composition ionique du milieu, en particulier de la force
ionique (μ) ; la force ionique d’un sel étant égale à la moitié de la somme de la concentration
de chaque ion multipliée par le carré de la valence de cet ion. Ainsi, à faible force ionique, les
ions en général et les monovalents en particulier favorisent la solubilité en stabilisant les
groupes chargés des protéines.

De ce fait, certaines protéines sont solubles dans une solution diluée de NaCl alors qu’elles ne
sont pas solubles dans l’eau. A force ionique élevée, les ions tendent au contraire à précipiter
les protéines. En général la solubilité des protéines présente un minimum au voisinage du
point isoélectrique (pHi). En effet, au pHi, la répulsion entre molécules protéiques est
minimale et les molécules tendent à former des agrégats qui précipitent. Il faut en outre noter
que les solvants organiques en général et l’éthanol et l’acétone en particulier précipitent les
protéines en les dénaturant.

Propriétés électrolytiques

Les protéines sont considérées comme des polyélectrolytiques amphotères. Dans un milieu
basique, en effet, les protéines se comportent comme un anion ; elles sont donc chargées
négativement alors qu’inversement dans un milieu acide, elles se comportent comme des
cations et sont chargées positivement. Le pH auquel la somme des charges est nulle est appelé
pH isoélectrique (pHi). Le point isoélectrique des protéines oscille entre 1 (pepsine) et 10
(histone). La plupart des protéines ont un pHi compris entre 4 et 7.

■ Propriétés antigéniques

Antigène (qui provient de anti- : à l’opposé et gen- engendré) est une substance qui, introduite
dans un organisme, provoque la formation d’anticorps. Un anticorps étant une protéine
spéciale du sang dont la formation est provoquée par l’introduction dans le milieu intérieur
d’un organisme d’une substance qui lui est étrangère appelée antigène. Chaque anticorps est
17
spécifique et défensif et possède la propriété de se combiner avec l’antigène introduit pour en
neutraliser les effets toxiques. En fait, lorsque l’on injecte une protéine préparée à partir d’un
animal à un animal d’une autre espèce, il se forme dans certaines cellules de celui-ci (les
lymphocytes et les plasmocytes) une protéine qui va se combiner à la substance injectée en
supprimant ses effets toxiques éventuels.

La protéine injectée est appelée antigène et la protéine apparue dans l’organisme animal
injecté s’appelle anticorps. Lorsque l’antigène et l’anticorps sont mélangés dans certaines
proportions, on observe un précipité. Les réactions anticorps – antigène sont appelées
réactions immunologiques. Elles expliquent notamment l’action de la vaccination, de la
sérothérapie et les rejets des greffes. La partie de la protéine qui forme le complexe avec
l’anticorps, appelée déterminant antigénique, se combine au site spécifique de l’anticorps. Une
protéine peut comporter plusieurs déterminants antigéniques. L’association entre antigène et
anticorps se forme grâce aux liaisons faibles établies grâce à la complémentarité de forme des
molécules.

1.2.3 CLASSIFICATION DES PROTEINES

En général les protéines sont réparties en trois grandes catégories : les hormones et
neurotransmetteurs peptidiques, les holoprotéines dont les protéines globulaires et les
protéines fibrillaires, les hétéroprotéines comprenant les chromoprotéines, les lipoprotéines,
les glycoprotéines et les phosphoprotéines. Les quelques exemples cités dans cette section
démontrent combien les protéines sont impliquées dans diverses ativités qui se déroulent dans
le monde vivant.

■ Hormones et neurotransmetteurs peptidiques

Ce sont des substances qui, synthétisées dans des cellules spécifiques, apportent une
information à des cellules différentes de celles dans lesquelles elles ont été synthétisées. Les
hormones sont sécrétées dans des cellules endocrines, déversées dans la circulation pour aller
agir sur des cellules plus éloignées. Les neurotransmetteurs sont sécrétés dans les
terminaisons nerveuses et agissent sur des neurones voisins. Selon les cellules qui les
sécrètent, certaines substances se comportent comme hormones et comme neurotransmetteurs.
C’est le cas par exepmle des certains peptides hormonaux de l’hypothalamus qui sont aussi
des neurotransmetteurs cérébraux.

Hormones hypothalamiques

Les hormones peptidiques sécrétées par l’hypothalamus sont déversées dans l’hypophyse par
le système porte. Une partie de ces hormones est destinée à contrôler la sécrétion hypophysaire
dont certaines stimulent la sécrétion. On les appelle releasing factors (RF), alors que d’autres
inhibent la sécrétion, ce sont les release inhibiting factors (IF). A titre d’exemple, nous
citerons : a- Le TRF : un tripeptide qui contrôle la sécrétion de TSH et de la prolactine ou
PRL ; b- Le LH / FSH – RF : un décapeptide qui contrôle la sécrétion de FSH et LH ; c- Le
18
GH – RF : encore un décapeptide qui stimule la synthèse de l’hormone de croissance
hypophysaire (GH).

Une autre hormone, GH – IF ou somatostatine, est un peptide comprenant 14 acides aminés


qui inhibe cette synthèse. Il inhibe également la synthèse de TSH ; d- Deux hormones
sécrétées par les noyaux hypothalamiques sont également déversées dans l’hypophyse. Il
s’agit de la vasopressine qui favorise la réabsorption rénale de l’eau et empêche sa fuite
urinaire. Cette hormone augmente la tension artérielle. Il s’agit aussi de l’ocytocine qui
provoque la contraction de l’utérus et stimule la sécrétion du lait. Les deux hormones sont
constituées de 9 acides aminés.

Hormones hypophysaires

Il existe plusieurs hormones hypophysaires dont certaines contrôlent la synthèse et la sécrétion


d’autres hormones. Il s’agit de : a- l’ACTH (adrenocorticopic hormone), un peptide constitué
de 39 acides aminés, qui contrôle la synthèse et la sécrétion du cortisol par la
corticosurrénale ; b- la TSH (thyréo-stimuline) qui contrôle la synthèse des hormones
thyroïdiennes ; c- la FSH (folliculostimuline) qui contrôle la synthèse de l’oestradiol par les
ovaires ; d- le LH (hormone lutéinisante) qui ontrôle la formation de la progestérone dans les
ovaires et de la testostérone dans les testicules ; e- les LPH β et γ (lipotropic hormone) qui
agit sur le métabolisme des lipides par leur activité lipolytique ; f- les MSH α, β, γ
(melanocyte stimulating hormones) qui contrôlent l’activité des mélanocytes.

■ Holoprotéines

Ce sont des protéines qui ne sont constituées que des acides aminés ; leur hydrolyse ne peut
donner que des acides aminés. Ce groupe est formé des protéines globulaires et des protéines
fibrillaires.

● Protéines globulaires

Albumines

Très répendues dans les cellules, les albumines sont des protéines de masse moléculaire
élevée. Elles sont solubles dans l’eau avec un pHi est légerement acide (aux environs de 5).
Parmi les albumines on peut citer la sérumalbumine qui est la protéine la plus abondante dans
le sérum, la lactalbumine dans le lait et l’ovalbumile dans le blanc d’œuf. La sérumalbumine
par exemple est formée d’une seule chaîne de plus de 500 acides aminés ; son rôle biologique
est de maintenir la pression osmotique du sérum et de transporter de petites molécules
biologiquement importantes et des médicaments dans le sang.
19
Globulines

Ce sont des protéines de masse moléculaire plus élevée avec un pHi proche de la neutralité. Le
sang humain referme plus ieurs globulines : α, β, γ dont certaines transportent des ions
métalliques dans plasma. La transferrine par exemple est une β globuuline qui transporte le
fer, la céruloplasmine est aussi une β globuline qui transporte le cuivre. Les
immunoglobulines sont des γ globulines qui représentant les anticorps sanguins.

Elles sont formées de 4 chaînes identiques deux à deux, les chaînes lourdes H (heavy) et les
chaînes légères L (light) unies par des liaisons disulfures. On peut distinguer 5 classes
d’immunoglobulines : IgA, IgD, IgE, IgG, IgM. La liaison anticorps – antigène s’établit dans
une région de la molécule comprenant les parties N – terminales des chaînes H et L. Les
immunoglobulines ont une double spécificité : spécificité de l’espèce animale, leur permettant
de reconnaître les protéines étrangères, spécificité de la protéine qui provoque leur formation
et avec laquelle elles sont susceptibles de se combiner.

Histones

Ce sont des protéines basiques dont le pHi se situe aux environs de 10. Selon leur richesse en
acides aminés lysine et arginine ainsi que leur mobilité électrophorétique, on peut distinguer 5
types d’histones : H1, très riche en lysine, H2A et H2B, modérément riches en lysine, H3 et H4,
riches en arginine. H2A, H2B, H3 et H4 sont présentes dans la chromatine en quantités
équimoléculaires, constituent les particules appelées nucléosomes, leur masse moléculaire est
faible. Elles ont tendance à se combiner entre elles ainsi qu’à l’ADN. En effet, les acides
aminés basiques sont localisés vers l’extrémité N–terminale qui est la région qui se combine à
l’ADN, alors que les acides aminés hydrophobes sont localisés vers l’extrémité C–terminale,
permettant la liaison des histones entre elles.

L’histone H1, présente en quantité deux fois plus petite que les autres, forme un pont entre
nucléosomes ADN voisin. Il a été montré que les histones peuvent être phosphorylées sur les
sérines et thréonnines ou acylées et méthylées sur l’amine distale des lysines et que la
phosphorylation de H1 pourrait être le signal qui déclenche la mitose en provoquant la
condensation des chromosomes au cours du cycle cellulaire, alors que l’acétylation de H3 et H4
pourrait être un signal de mise en activité d’un gène.

Protamines

Ce sont des protéines basiques de la chromatine dans les spermatozoïdes. En effet la


chromatine des spermatozoïdes contient, à la place des histones, des protéines de masse
moléculaire faible, contenant une très forte proportion d’arginine (jusqu’à 90 %).

Calmoduline

C’est une protéine, universellement répendue dans le régne animal et végétal. Elle est formée
d’une chaîne polypeptidique comprenant 148 acides aminés qui sert d’intermédiaire à l’ion
Ca++ dans les différentes réactions de cet ion. En effet cette protéine, riche en acides aminés
20
acides, peut fixer 4 Ca++ par molécule sur 4 domaines différents. Ainsi le complexe
calmoduline – Ca active notamment la contraction des muscles lisses, la libération des
neurotransmetteurs dans les terminaisons des fibres nerveuses, etc.

Métallothionéines

Il s’agit d’un groupe de protéines, très répendues dans le régne animal et végétal, formées de
61 acides aminés dont 20 cystéines. Caractérisées par une masse moléculaire faible, elles sont
réparties en deux classes : MT I et MT II. En outre, elles possèdent la propriété de se combiner
spécifiquement à des métaux lourds, particulièrement le zinc, le cadmium et le cuivre. Ces
protéines jouent ainsi un rôle dans la mise en réserve et le métabolisme des métaux lourds.
Par ailleurs, la ferritine, une autre protéine de masse moléculaire élevée, abondante dans le
foie, la rate, la moelle osseuse et l’intestin, intervient dans la mise enréserve et l’absorption du
fer.

● Protéines fibrillaires

Ce sont des protéines allongées (dont certaines forment des fibres) qu’on peut regrouper en
protéines solubles dans les solutions salines concentrées et en protéines insolubles ou
scléroprotéines. Parmi les protéines solubles on peut citer le fibrinogène, une protéine
plasmatique riche en acide aminé cystéine qui est transformé en une protéine polymérisée, la
fibrine insoluble au moment de la coagulation du sang à la suite d’une blessure. Il se forme
ensuite un agrégat de plaquettes sanguines suivi d’une prise en masse du sang, ce qui empêche
le saignement. On peut également citer les protéines musculaires : la myosine et l’actine, deux
protéines impliquées dans la contraction musculaire.

La myosine est une protéine allongée, de masse moléculaire élevée, formée de 2 grandes sous
unités comprenant chacune une tête globulaire et une longue queue fibrillaire enroulée en
hélice α ainsi que de 4 sous unités de petite dimension. Chaque grande sous unité est
composée d’une méromyosine H comprenant la tête globulaire et d’une méromyosine L qui
comprend le reste de la partie fibrillaire. L’actine existe sous deux formes : l’actine G
globulaire et l’actine F formée par la polymérisation de l’actine G. L’actine F se combine à la
myosine pour former l’actomyosine. Ces protéines constituent le substrat essentiel de la
contraction musculaire. Actine et myosine sont également impliquées dans la motilité, la
contraction et les mouvements des chromosomes. En outre on trouve l’actine en particulier
dans les microfilaments et la chromatine.

Parmi les protéines insolubles, on cite le collagène, la protéine la plus abondante de


l’organisme chez les mammifères, caractérisé par sa très grande résistance à la tension.
Chaque molécule de collagène est formée de 3 chaînes polypeptidiques identiques ou
légèrrement différentes. La proline et l’hydroxyproline (acide aminé caractéristique du
collagène) forment un quart de l’ensemble des acides aminés. Il existe 10 types de collagène
qui se distinguent par la structure des chaînes, par l’assemblage des molécules en fibre et par
la localisation tissulaire.
21
D’autres protéines insolubles existent ; c’est notamment le cas de : l’élastine, une protéine
riche en acides aminés polaires, qui est le constituant principal des fibres élastiques
particulièrement dans les ligaments et les parois de gros vaisceaux ; la kératine, formée des
fibres très allongées, est le constituant protéique majeur des phanères (cheveux, ongles) et de
la laine ; la fibroïne, riche en glycocolle, en sérine et en alanine, est la principale protéine de la
soie. Elle présente une forte résistance mécanique.

■ Hétéroprotéines

Ce sont des protéines comportant une partie protéique appelée apoprotéine et une partie non
protéique polypeptidique appelée prosthétique. Selon la nature du groupement prosthétique,
on peut distinguer les chromoprotéines, les lipoprotéines, les glycoprotéines et les
phosphoprotéines.

● Chromoprotéines

Il s’agit d’un groupe hétérogène de protéines colorées comprenant des enzymes comme les
cytochromes, les catalases et les péroxydases. L’exemple classique de ce groupe est
l’hémoglobine, protéine formée de 4 sous unités identiques deux à deux. Il existe 3 types
d’hémoglobine chez un homme normal : l’hémoglobine HbA (sous unités α2 β2), HbA2 (sous
unités α2 δ2) chez l’homme adulte et l’hémoglobine fœtale ou hémoglobine F (sous unités α2
γ2) avant la naissance et peu après.

La structure de la molécule se présente comme suit : la chaîne α comporte 141 acides aminés,
les chaînes β, γ et δ comprennent 146 acides aminés, chaque chaîne est combinée à un
groupement prosthétique appelé hème, une molécule complexe composée de 4 noyaux
hétérocycliques azotés (pyrroles), un ion ferreux est lié aux 4 azotes des pyrroles, le fer est
combiné à une molécule d’oxygène dans l’oxyhémoglobine. Il convient de noter que le CO
possède une affinité plus grande pour l’hémoglobine que l’oxygène, ce qui explique la grande
toxicité de ce gaz.

● Lipoprotéines

Ce sont de très grosses molécules, de masse moléculaire élevée, qui présentent une polarité :
les régions hydrophiles des protéines et des phospholipides sont à la surface des molécules,
alors que les régions hydrophobes, les lipides neutres et le cholestérol sont à l’intérieur des
molécules. Les lipoprotéines représentent la forme de transport des lipides dans le sang. En
fait, les lipoprotéines assurent : a- le transport des acides gras de l’intestin dans les cellules
périphériques, b- le transport des acides gras du foie vers les cellules périphériques, c- le
transport du cholestérol du foie vers les cellules périphériques, d- le transport du cholestérol
des cellules périphériques vers le foie pour élimination. Ainsi les lipoprotéines se fixent sur
les récepteurs spécifiques des membranes cellulaires au niveau des puits recouverts et sont
ensuite internalisées dans des vésicules. A l’intérieur de la cellule ces vésicules sont détruites
et les molécules transportées sont libérées dans la cellule. Les lipides et les protéines sont
associés en lipoprotéines dans les membranes cellulaires.
22
● Glycoprotéines

Il s’agit d’un groupe de protéines comportant dans leur molécule une copule glycidique plus
ou moins importante appelée glycanne ou isoglycanne si elle est ramifiée et liée à la protéine
par covalence. Les principaux constituants des glycannes sont : glucose (Glc), galactose
(Gal), mannose(Man), N-acétylglucosamine(GlcNac), N-acétylgalactosamine (GalNac),
arabinose (Ara), xylose (Xyl), fucose (Fuc), acide N-acétylneuraminique (NANA). Les
chaînes glucidiques sont soit linéaires ou soit ramifiées et représentent de 1 à 85 ¨% de la
glycoprotéine. Généralement les glycannes sont associés à un acide aminé de la protéine, soit
à l’asparagine par une liaison amide, soit à un acide aminé alcool comme la sérine, la
thréonine, l’hydroxylysine ou l’hydroxyproline par une liaison osidique. Les glycoprotéines
sont impliquées dans plusieurs activités dans l’organnisme : Les trois hormones
hypophysaires :

1- FSH (follicule stimulating hormone) comportant environ 20 % de glucides, contrôle


l’activité des follicules chez la femme ; 2- LH (luteinizing hormone) qui contient plus de 20 %
des glucides, contrôle l’activité du corps jaune chez la femme et joue un rôle fondamental dans
la grossesse. Sous le nom d’ICSH (interstitial cell stimulating hormone) elle contrôle
également la sécrétion de la testostérone chez le mâle ; 3- TSH (thyroid stimulating hormone)
contrôle l’activité de la thyroïde. Les trois hormones sont formées de 2 sous unités, α et β.
Alors que la sous- unité α est identique dans les trois hormones, la sous- unité β est différente
dans les trois et détermine ainsi la spécifité de l’action hormonale.

On peut encore citer d’autres glycoprotéines comme : a- Le facteur intrinsèque du suc


gastrique indispensable pour l’absorption intestinale de la vitamine B12. Son absence est
responsable de l’anémie de Biermer par carence d’absorption de la vitamine B12 ; - Les
facteurs des groupes sanguins : responsables du phénomène d’incompatibilité au cours des
transfusions sanguines ; c- Les glycoprotéines des membranes plasmiques : impliquées dans le
phénomène de reconnaissance cellulaire. Chez les bactéries, les glycoprotéines de la paroi sont
en partie responsables du caractère antigénique spécifique de chaque bactérie ; d- Le mucus :
joue un rôle protecteur dans l’appareil respiratoire et dans le tube digestif ; dans le tractus
génital femelle, il facilite la progression des spermatozoïdes ; etc.

Ainsi les pricipaux rôles de la partie glycanne sont : 1- modification des propriétés physico –
chimiques de la molécule, notamment le changement de solubilité, de viscosité, de mobilité,
de résistance à la dénaturation ; 2- protection contre les enzymes protéolytiques ; 3- certaines
hormones sont inactives en absence de la copule glucidique ; 4- mécanisme de reconnaissance
soit entre cellule et cellule ou soit entre cellule et molécule particulièrement au niveau des
membranes.

● Posphoprotéines

Les phosphoprotéines comprennent un acide phosphorique dans leur molécule. L’acide


phosphorique peut estérifier un acide aminé alcool comme la sérine, la thronine ou la tyrosine,
l’acide aminé étant incorporé dans la protéine. Les phosphoprotéines les plus courantes sont :
1- la caséine : une phospho-glycoprotéine qu’on trouve dans le lait ; 2- les phosphoprotéines
23
du jaune d’œuf : très riches en sérine, en particulier la phosvitine, très riche en phosphore ; 3-
les phosphoprotéines du noyau cellulaire : les histones, la protamine et les protéines non
histones de la chromatine. Il convient de noter que la phosphorylation des protéines de la
chromatine semble jouer un rôle dans l’expression génétique et dans la régulation de la
croissance cellulaire ; 4- certaines protéines membranaires : en particulier celles appartenant à
des récepteurs.

1.3 ACIDES NUCLEIQUES

Un acide nucléique est un polymère dont les unités sont appelées nucléotides. Chaque
nucléotide est formé de trois composés : a- un sucre cyclique à 5 atomes de carbone. Il s’agit
du ribose dans le cas des acides ribonucléiques (ARN) et de désoxyribose dans le cas des
acides désoxyribonucléiques (ADN). La différence entre ribose et désoxyribose réside au
niveau du carbone n° 2 ; b- - une base azotée : les bases sont de deux types : les purines,
adénine et guanine, possèdent deux cycles et les pyrimidines, cytosine, thymine et uracile,
possèdent un seul cycle. Chaque base est attachée à l’atome du carbone 1’ du sucre par une
liaison dite N-glycosidique. Quatre bases composent l’ADN : A, G, C et T. Les ARN sont
également composés de quatre bases : A, G, C et U ; c- un phosphate lié au carbone 5’ du
sucre par une liaison phosphoester. Ce phosphate est responsable de la charge négative des
nucléotides et des acides nucléiques.

Une base liée à un sucre forme un nucléoside. Un nucléotide est un nucléoside associé à un
phosphate. Les nucléotides sont liés covalemment dans les acides nucléiques par une seconde
liaison phosphoester qui relie le phosphate 5’ d’un des nucléotides au groupement OH- en 3’
du nucléotide adjacent. Ainsi le phosphate forme deux liaisons esters avec les deux atomes de
carbone 3’ et 5’ des deux sucres différents. Cette structure est appelée groupement
phosphodiester. L’ADN est la molécule la plus importante des cellules vivantes. Elle contient
toute l’information nécessaire au fonctionnement de la cellule. L’ARN sert principalement
dans la synthèse des protéines à l’intérieur des cellules. Les ARN et les ADN peuvent être
hydrolysés à pH 13 alors qu’à pH 11 une molécule d’ARN typique est, à 37°C, hydrolysée en
ribonucléotides en quelques minutes.

De nombreuses enzymes sont capables d’hydrolyser les acides nucléiques. On les appelle des
nucléases. Elles montrent ordinairement une spécificité chimique et sont soit des
désoxyribonucléases (ADNases), soit des ribonucléases (ARNases). Un grand nombre
d’ADNases agissent uniquement sur des molécules d’ADN simple-brin ou sur des molécules
d’ADN double-brin, bien que quelques-unes puissent agir sur les deux types de molécules.

De plus, quelques nucléases agissent seulement aux extrémités des acides nucléiques, ôtant un
nucléotide à la fois. Elles sont appelées des exonucléases. Elles peuvent être spécifiques de
l’extrémité 3’ ou de l’extrémité 5’ du brin. La plupart de nucléases agissent à l’intérieur du
brin et sont appelées des endonucléases. Quelques-unes d’entre elles sont très spécifiques,
puisqu’elles ne coupent l’ADN qu’au niveau d’une séquence particulière. Les nucléases sont
impliquées dans de nombreuses fonctions biologiques. Elles sont souvent utilisées dans les
laboratoires pour se débarrasser d’acides nucléiques indésirables ou comme moyen d’analyse.
24
Les nucléases sites spécifiques, appelées enzymes de restriction, sont à la base du génie
génétique.

1.3.1 ACIDE RIBONUCLEIQUE (ARN)

Une cellule typique contient à peu près dix fois plus d’ARN que d’ADN. A l’exception d’un
phage et de quelques virus, la molécule d’ARN est un polynucléotide simple-brin. Il y a trois
formes primaires d’ARN : les ARN ribosomiques (représentés par trois ou quatre espèces
moléculaires différentes), les ARN de transfert (composés d’à peu près cinquante molécules
différentes) et les ARN messagers (composés de quasiment autant de molécules différentes
qu’il y a des gènes). Ces molécules ressemblent superficiellement à des molécules d’ADN
simple-brin dans lesquelles les régions simple-brin seraient entremêlées avec des régions
d’ADN double-brin intramoléculaires. Entre ½ et ⅔ des bases sont appariées.

Dans une molécule d’ADN simple-brin, l’appariement se fait au hasard et les régions
appariées ne contiennent au maximum que six bases. De plus, si un échantillon de molécules
identiques d’ADN est dénaturé et que des liaisons hydrogènes peuvent s’établir, les motifs de
bases appariées peuvent différer d’une molécule à l’autre. Par contre, dans les molécules
d’ARN, les régions appariées peuvent contenir jusqu’à 20 paires de bases et une molécule
particulière aura un motif d’appariement bien défini.

ARN COMME MATERIEL GENETIQUE

Chez certains organismes, l’ARN est malgré tout maintenu comme matériel génétique. En
général, il se présente sous forme d’une molécule simple-brin. Néanmoins, un petit nombre de
phages et de virus possèdent un ARN double-brin. Il convient de remarquer que l’ARN n’est
pas le matériel génétique des organismes uni- ou pluricellulaires dans lesquels le matériel
génétique doit avoir une grande stabilité chimique, mais celui des phages ou des virus chez
lesquels le matériel génétique est protégé du milieu extérieur par une enveloppe protéique.
De plus chez les phages et les virus, les molécules d’ARN passent la plus grande partie de leur
temps sous forme de particules inertes. Lorsqu’elles sont répliquées, le processus est très
rapide de telle sorte qu’un grand nombre de particules phagiques sont produites en un temps
relativement court. Le grand nombre de molécules produites compense ainsi la faible stabilité
chimique de l’ARN ; ce qui permet aux phages et aux virus à ARN de survivre en dépit de la
faible stabilité de leur matériel génétique comparé à celui des organismes à ADN

1.3.2 ACIDE DESOXYRIBONUCLEIQUE (ADN)

STRUCTURE DE L’ADN

La molécule d’ADN estt un polymère composé d’unités appelées nucléotides. Chaque


nucléotide est formé d’un sucre à 5 carbones (pentose), le désoxyribose, d’un groupement
phosphate et d’une base azotée. Le phosphate est attaché au carbone 5’ du désoxyribose et la
base au carbone 1’. Il exist 4 types de nucléotides différant par la nature de la base azotée : 2
purines (adénine et guanine) et 2 pyrimidines (cytosine et thymine). Un nucléoside est formé
d’un sucre et d’une base.
25

Les nucléotides sont attachés les uns aux autres par des liaisons covalentes ester-phosphate qui
relient le 5’-phosphate d’un nucléotide au 3-OH du nucléotide suivant. La chaîne
polynucléotidique est ainsi formée d’un squelette correspondant à une suite monotone sucre-
phosphate avec une succession de bases azotées branchées latéralement. Comme il existe 4
nucléotides différents, il y a un très grand nombre de séquences (combinaisons) de nucléotides
possibles. C’est la séquence de nucléotides qui détermine la spécifité de la molécule d’ADN.

D’après J. Watson et Fr. Crick, une molécule d’ADN est constituée de 2 chaînes
polynucléotidiques. Ces 2 chaînes sont associées par des liaisons hydrogènes et disposées de
telle sorte que les bases d’une chaîne soient en face à face avec les bases de l’autre chaîne. Les
bases sont toujours disposées de manière qu’une purine soit en face d’une pyrimidine et plus
précisément que l’adénine soit en face de la thymine et que la guanine soit en face de la
cytosine. Pour que les paires de bases soient face à face, dans une configuration propre à
s’associer pae des loaisone hydrogènes, il est écessaire que les 2 chaines soient disposées tête-
bêche, c’est-à-dire que, partant d’une extrémité de la molécule, une chaîne ait une polarité 5’-
P→3’- OH et l’autre aura la polarité 3’- OH→5’- P. Cette organisation confère à l’ADN une
structure spaciale en double hélice, les paires de bases complémentaires étant empilées avec
un espacement constant à l’intérieur du pas de cette hélice. Bien qu’en faible énergie, les
liaisons hydrogènes confèrent à l’ADN une grande stabilité à la température cellulire du fait de
leur nombre élevé. En effet, en peu plus d’une dizaine de paires de bases suffisnt pour assurer
la cohésion entre les 2brins complémentaires de chaque molécule. Or, les petites molécules
comportent plusieurs milliers de nucléotides. Les plus grandes molécules comportent des
centaines de milliers de paires de nucléotides. Le schéma de la structure de l’ADN proposé
par Watson et Crick tient compte des éléments suivants :

1- la molécule d’ADN est composée de deux chaînes de nucléotides ; 2- les deux chaînes
s’enroulent en spirale autour d’un axe central et forment une paire d’hélices à pas droit ; 3- le
squelette sucre-phosphate-sucre-phosphate est situé à l’extérieur de la molécule, les deux lots
de bases s’allongent vers le centre ; 4- les bases occupent des plans à peu près
perpendiculaires au grand axe de la molécule et sont donc empilées les unes au-dessus des
autres ; 5- les deux chaînes sont maintenues ensemble par des liaisons hydrogènes entre
chaque base d’une chaîne et une base de l’autre chaîne qui lui est associée ; 6- la distance
entre l’atome de phosphore du squelette et le centre de l’axe est de 10 Å, la longueur de la
double hélice est de 20 Å ; 7- la pyrimidine d’une chaîne est toujours appariée à une purine
de l’autre chaîne ; 8- les atomes d’azote unis au carbone 4 de la cytosine et au carbone 6 de
l’adénine sont principalement sous forme amine (NH2) plutôt qu’imine (NH). De même, les
atomes d’oxygène unis au carbone 6 de la guanine et au carbone 4 de la thymine ont
principalement une configuration cétonique (C = O) plutôt qu’énolique (C – OH). Ces
restrictions structurales dans la configuration des bases faisaient penser que l’adénine était la
seule purine structurellement capable de s’unir à la thymine et que la guanine pouvait seule
s’unir à la cytosine ; 9- les deux chaînes de la double hélice vont dans des sens opposés, c’est-
à-dire qu’elles sont antiparallèles ;

10- vus de l’extérieur de la molécule, les espaces qui séparent deux tours de l’hélice forment
deux sillons d’épaisseur différente : un grand sillon plus large et profond (sillon majeur) et un
26
petit sillon (sillon mineur) plus étroit et peu profond qui sont enroulés à la surface externe de
la double hélice. Des protéines qui s’unissent à l’ADN s’insèrent souvent dans ces sillons ; 11-
la double hélice fait un tour complet tous les 10 résidus (3,4 nm), soit 150 tours par poids
moléculaire d’un million ; 12- il n’y a pas de restriction quant à la séquence des bases dans
une chaîne donnée de la molécule. Cependant, dès qu’une séquence est définie dans une
chaîne, la séquence de l’autre chaîne est automatiquement déterminée. Cette restriction entre
les deux chaînes est à la base de leur complémentarité.

Sucres

Bases azotées

O NH 2
CH 3 N
H N N H
H
O N H N N

HOH O HOH 2C
O
2 C5
4 H 1 H H
H H H H H
3 2 HO H
HO OH

Thymidine (Thymine + ribose) Adénosine (Adénnine + désoxyribose)


27

NH 2
O
N H N
H N H
H
O N N
H 2N N
O
O
HO P O H 2C5 O HO O H 2C O
P
OH
4 H 1
HH H OH H H
3 2 H H
HO OH HO H

Cytidine monophosphate Guanosine monophosphate

Chaque base appariée se décale de 36° par rapport à l’appariement précédent, ce qui permet la
disposition de dix paires de bases appariées par tour d’hélice. Le poids moléculaire de l’hélice
par unité de longueur est approximativement de 2 x 106 daltons par micromètre. La double
hélice d’ADN est une hélice droite. Cela veut dire que lorsqu’un observateur parcourt l’axe de
l’hélice dans l’une ou l’autre direction, chaque brin tourne suivant le sens des aiguilles d’une
montre quand il s’éloigne de l’observateur. Si cette rotation se faisait dans le sens contraire
des aiguilles d’une montre, on aura une hélice tournant à gauche.

Appariement entre les bases

Dans la nature, les molécules d’ADN sont généralement des hélices tournant à droite. Les
appariements entre bases sont des caractéristiques très importantes de la structure de l’ADN,
puisqu’ils impliquent que les séquences en bases des deux brins soient complémentaires. Si
un brin a une séquence AATGCT, la séquence de l’autre brin sera TTACGA, lue dans le
même sens. Ceci a des conséquences importantes sur le mécanisme de réplication de l’ADN,
puisque la synthèse de chaque brin sera réalisée à partir de la séquence de son brin
28
complémentaire. Les deux brins de la double hélice d’ADN sont dits antiparallèles, c’est-à-
dire que l’extrémité 3’–OH de l’un des brins est adjacente à l’extrémité 5’–P de l’autre brin.
Ceci a deux conséquences : la première est qu’il existe une extrémité 3’–OH et une extrémité
5’–P à chaque bout d’une double hélice linéaire ; la seconde, qui est aussi la plus significative,
est que l’orientation des deux brins est différente.

Ainsi lorsque deux nucléotides sont appariés, le sucre d’un nucléotide est orienté de bas en
haut, tandis que le sucre de l’autre nucléotide est orienté de haut en bas. Du fait de
l’antiparallélisme des brins, il est nécessaire de disposer d’une convention pour énoncer la
séquence des bases d’une seule chaîne. La convention consiste à écrire la séquence avec
l’extrémité 5’– P à gauche. Par exemple, ATC représente le trinucléotide 5’- P – ATC – 3’-
OH. Les égalités [A] = [T] et [G] = [C] sont toujours vérifiées, mais par contre aucune règle
ne gouverne le rapport des concentrations totales de guanine et de cytosine par rapport à celles
d’adénine et de thymine, c’est-à-dire [G] + [C] ⁄ [A] + [T].

Ce rapport varie considérablement, allant de 0,37 à 3,16 pour différentes espèces de bactéries.
La façon la plus courante de rendre compte de la composition en bases de la molécule d’ADN
d’un organisme particulier n’est pas de donner les rapports mais la fraction de bases G + C
parmi l’ensemble des bases, c’est-à-dire ([G] + [C]) / [nombre total de bases]. Ce rapport est
appelé contenu en G + C ou pourcentage en G + C. La composition en bases de centaines
d’organismes a été déterminée.

D’une façon générale, la valeur du contenu en G + C est proche de 0,50 pour les organismes
supérieurs et il varie très peu d’une espèce à l’autre (de 0,49 à 0,51 pour les primates). Pour les
organismes inférieurs, le contenu en G + C varie largement d’un genre à l’autre. Chez les
bactéries courantes par exemple, les extrêmes sont de 0,27 pour le genre Clostridium à 0,76
pour le genre Sarcina. L’ADN de E. coli a un contenu en G + C de 0,50.

Molécules d’ADN circulaires et superenroulées

Les molécules d’ADN des procaryotes et de la grande majorité des virus sont circulaires. Une
molécule circulaire peut se présenter sous deux formes : un cercle fermé composé de deux
simple-brin complémentaires parcourant de façon continue le tour du cercle ou un cercle
ouvert ayant sur un ou sur deux brins une ou plusieurs cassures. A quelques exceptions près,
les molécules d’ADN fermées se présentent sous forme d’une molécule enroulée sur elle-
même. Une telle molécule est dite superenroulée. La conséquence de cela est que les
extrémités d’une molécule d’ADN linéaire peuvent être rapprochées et jointes pour former un
cercle continu.

Si, avant la fermeture du cercle, un des brins est soumis à une rotation de 360° par rapport à
l’axe de l’autre brin de façon à créer un déroulement de la double hélice, la molécule circulaire
résultante va, après reconstitution des liaisons hydrogènes, se replier sur elle-même. Cette
molécule va alors prendre la forme d’une structure en 8. Si la rotation avait été de 720°, il en
résulterait une structure superenroulée ayant deux chevauchements. La raison de cet
29
enroulement est la suivante : lors de la torsion de l’hélice de 720°, 20 paires de bases sont
rompues (puisqu’ un tour d’hélice contient 10 paires de bases).

Fragment d’une chaîne La double hélice d’ADN


polynucléotidique

Mais une molécule d’ADN a une telle propension à conserver une structure en hélice droite
(positive), avec 10 paires de bases par tour, qu’elle va se déformer pour réajuster la structure
de la double hélice. Cet ajustement crée, au niveau de la molécule circulaire, des contraintes
qui vont être absorbées par l’apparition d’un supertour. Lorsque l’ADN est superenroulé en
sens inverse du sens de l’enroulement intrinsèque de la double hélice (sens des aiguilles d’une
montre), on parle de supertours négatifs. Si le superenroulement s’effectue dans le même
sens que l’enroulement de la double hélice, on parle de supertours positifs. L’apparition des
supertours négatifs entraîne un relâchement de la structure qui diminue la rotation par paire de
bases ; la molécule d’ADN est dite sous-enroulée.

Les supertours positifs entraînant un resserement de la structure, on parlera d’ADN sur-


enroulé. Toutes les molécules d’ADN naturelles sont sous-enroulées et possèdent donc toutes
des supertours négatifs. Le niveau de surenroulement est exprimé par la densité
superhélicoïdale, c’est-à-dire le nombre de tours de superhélice par tour d’hélice. Ce nombre
est pratiquement le même pour toutes les molécules. En général, un supertour négatif est
produit toutes les 20 paires de bases.

Différentes formes de l’ADN


30

ADN COMME MATERIEL GENETIQUE

Le matériel génétique de tout organisme contient l’information déterminant les propriétés de


cet organisme. Il est également responsable de la transmission de cette information à sa
descendance. Dans presque tous les organismes le matériel génétique est constitué d’ADN.
Cependant, quelques bactériophages et quelques virus de plantes ou d’animaux ont un matériel
génétique constitué d’ARN. Plusieurs propriétés ont permis d’établir que l’ADN est le
support de l’information génétique des êtres vivants. Nous en citerons principalement quatre :

1-Transmission de l’information génétique des parents à la descendance. En effet, toutes les


cellules du corps doivent avoir la même constitution génétique ; cela signifie que le matériel
génétique doit être répliqué à l’identique à chaque division ;

2- Conservation et transmission de l’information. Le matériel génétique doit stocker


l’information génétique et transmettre cette information à la cellule en fonction des besoins de
celle-ci. Il doit ainsi coder la constellation de protéines exprimées par un organisme ;

3- Stabilité chimique de l’ADN et de son contenu informationnel. Les molécules d’ADN


doivent être d’une grande stabilité. Lorsqu’on compare des molécules d’ADN d’organismes
différents, une grande partie de l’information génétique contenue dans ces molécules, bien que
passée par de nombreuses divisions cellulaires depuis des millions d’années d’évolution, a
seulement subit de petits changements. Plusieurs facteurs contribuent à cette stabilité
notamment :

a- le squelette de pentoses phosphates des molécules d’ADN est une structure extrêmement
stable ; b- les liaisons C – C du pentose peuvent résister à toutes les attaques chimiques à
l’exception des acides forts à très hautes températures ; c- les liaisons phosphodiesters sont un
peu moins stables et peuvent être hydrolysées à la température ambiante à pH 7,2. Ces
conditions ne sont heureusement pas les conditions physiologiques ; d- la liaison
phosphodiester de l’ARN est rompue très rapidement en milieu alcalin. La réaction chimique
conduisant à cette rupture nécessite la présence d’un groupement OH au niveau du carbone 2’
du pentose. Dans l’ADN il n’y a plus de groupement OH au niveau du carbone 2’ du
désoxyribose ; par conséquent, la molécule d’ADN est plus résistante à l’hydrolyse alcaline.
En considérant la stabilité de la liaison phosphodiester, on comprend le choix du désoxyribose
comme constituant de l’ADN à la place du ribose ; e- la liaison N-glycosidique est
également très stable ; cette stabilité est renforcée par la nature cyclique des bases ; f- la
31
structure en hélice double-brin est une bonne protection contre les attaques chimiques ; g- les
bases qui portent l’information génétique sont des cycles hydrophobes possédant des
groupements chargés. Ces groupements chargés servent également de protection pour les
bases ; h- la nature hydrophobique des bases occasionne un empilement de ces bases si serré
que l’eau en est pratiquement exclue. Ceci empêche les composés solubles dans l’eau de venir
en contact étroit avec les bases ; j- chaque brin porte une information identique. Cela signifie
que la séquence nucléotidique d’un brin est complémentaire de celle de l’autre brin. Dans la
cellule, il existe des systèmes de réparation permettant l’excision d’une base incorrecte et son
remplacement par une base correcte grâce à la séquence complémentaire portée par l’autre
brin ; k- les bases par elles-mêmes sont très stables à l’exception de la cytosine. La cytosine
peut parfois être désaminée et donner de l’uracile.

4- La capacité de changement de la molécule d’ADN : la mutation


Même si la structure de l’ADN doit être relativement stable pour que l’organisme puisse
s’appuyer sur l’information qu’il code, il doit également, à de rares occasions, permettre à
l’information codée de subir des changements. Ces changements, appelées mutations,
constituent le matériel de base, la variation génétique, sur lequel agit la sélection naturelle.

NATURE CHIMIQUE DU MATERIEL GENETIQUE

L’origine de la science génétique remonte aux travaux du moine autrichien Grégor Mendel
dans les années 1860. De ses travaux Mendel tira les conclusions suivantes : les
caractéristiques des plantes sont contrôlées par des facteurs (unités) héréditaires qui furent plus
tard appelés gènes. Une plante individuelle possède deux copies du gène qui contrôle le
développement de chaque caractère, chacune provenant d’un des deux parents. Les deux gènes
peuvent être identiques ou non. Pour chacun des caractères étudiés, l’un des deux allèles est
dominant par rapport à l’autre qui est appelé récessif. Lorsque les deux allèles sont
simultanément présents dans la même plante, l’existence de l’allèle récessif est masquée par
l’allèle dominant. Les observations au microscope optique réalisées en 1880 ont indiquées
que durant la division cellulaire, le contenu du noyau s’organise en filaments visibles qui
furent appelés chromosomes, c’est-à-dire corps colorés. En 1903, W. Sutton désigna
directement les chromosomes comme support physique des facteurs génétiques de Mendel.
Les travaux de Morgan et ses collaborateurs en 1911 ont permis de montrer que la position des
gènes le long du chromosome (leur locus) était fixée et ne différait pas d’un individu à l’autre.
En 1952, la communauté scientifique accepta finalement l’idée selon laquelle les gènes sont
faits d’ADN. En 1953, Watson et Crick résolurent le mystère de la structure de l’ADN. Deux
études ont apporté les preuves que l’ADN est bien le matériel génétique des organismes
vivants : l’expérience de transformation bactérienne de Griffith et l’expérience du mélangeur
de Hersley et Chase.

Expérience de transformation bactérienne

Les études de Fred Griffith sur les pneumocoques (Streptococcus pneumoniae), bactéries
responsables de la pneumonie chez l’homme, ont permis la découverte de la nature génétique
de l’ADN. En général les pneumocoques sont entourés d’une capsule de polysaccharides qui
les protège des défenses de l’organisme hôte. Cette capsule est responsable de la virulence et
32
de l’aspect lisse (L) de bactéries en croissance sur un milieu solide. Griffith remarque que les
bactéries perdent leur virulence lorsqu’elles sont tuées par la chaleur notamment. Il remarque
également l’existence des mutants dépourvus de capsule dont les colonies présentent un aspect
rigueux (R) et qui sont non virulents.

Les pneumocoques virulents L ont été injectés au 1er groupe de souris qui sont toutes mortes à
la suite de ce traitement. Le 2e groupe de souris reçut des pneumocoques virulents L tués par la
chaleur et les souris du 3e groupe ont reçu des pneumocoques non virulents R. Dans ces deux
derniers cas, les souris survivent au traitement. Les souris du 4e groupe ont reçu un mélange de
pneumocoques L tués par la chaleur et de pneumocoques non virulents R vivants. Toutes les
souris du 4e groupe meurent à la suite de ce traitement. Les pneumocoques trouvés dans leur
sang étaient tous virulents L. Ainsi donc des bactéries R vivantes ont été transformées sous
l’influence d’un constituant des bactéries virulentes mortes en bactéries virulentes L.

Cette expérience a été baptisée « expérience de transformation bactérienne ». Il a été démontré


par la suite que le même résultat peut être obtenu en remplaçant les pneumocoques L tués par
un extrait cellulaire préparé à partir des pneumocoques L tués. Ce qui a permis de conclure
que l’extrait cellulaire contenait une substance baptisée principe transformant de nature
inconnue. Une purification partielle du principe transformant à partir de l’extrait cellulaire a
permis à Avery et ses collaborateurs de démontrer que la substance transformant était bien
l’ADN.

Expérience du mélangeur

La confirmation de la nature génétique de l’ADN viendra des travaux de A. Hersley et M.


Chase sur le phage T2 de E. coli. On sait que l’ADN est la seule substance du phage
contenant du phosphore alors que les protéines de la coque (contenant les acides aminés
méthionine et cystéine), sont les seules molécules à posséder du soufre. On cultive des phages
dans un milieu nutritif contenant comme source de phosphore du phosphore radioactif (32PO43-
), d’autres dans un milieu nutritif contenant comme source de soufre du soufre radioactif
(35SO42-).

Les nouvelles particules phagiques auront un ADN marqué radioactivement dans le premier
cas et dans le second cas les particules virales auront des protéines marquées radioactivement.
Ce qui a permis de suivre le devenir de chacun de 2 types de molécules (ADN et protéines)
lors de l’infection d’une bactérie hôte. Cette expérience consiste à réaliser l’infection des
bactéries (cellules) sensibles par les phages marqués au 35S ou au 32P, à séparer les cellules
infectées des phages par une agitation violente et à déterminer ensuite le ou les composants du
phage introduit dans la bactérie.

Dans la première expérience les bactéries sensibles sont mélangées à des phages marqués au
35
S. Après un temps d’incubation de quelques minutes, nécessaire à l’adsorption des phages
sur les bactéries, celles-ci sont séparées des phages non adsorbés par une centrifugation. On
obtient un culot composé des complexes bactéries-phages. Le culot est ensuite resuspendu et
soumis à une violente agitation pour décrocher les phages adsorbés sur les bactéries. Une
seconde centrifugation s’ensuit pour séparer complètement les bactéries (dans le culot) des
33
phages (dans le surnageant). La mesure de la radioactivité montre que 80% de 35S étaient
localisés dans le surnageant et 20% dans le culot. On explique les 20% de radioactivité dans le
culot par la présence des queues des phages restées associées aux bactéries à l’issue de
l’agitation.

Avec les phages marqués au 32P, on obtient 70% de radioactivité dans le culot et 30% dans le
surnageant. Ces 30% sont dus aux phages non virulents, incapables d’injecter leur ADN dans
les bactéries. Les bactéries contenues dans le culot respuspendues dans du milieu de culture se
montrent capables de produire des phages T2. Cela permis à Hersley et Chase de conclure que
la capacité d’une bactérie à produire des particules phagiques est associée au transfert du 32P et
donc de l’ADN des phages marqués. Cette expérience est connue sous le nom d’expérience
du mélangeur (mixer), du nom de l’appareil de cuisine utilisé comme appareillage
expérimental.

CHROMATINE

Le noyau en interphase contient un réseau fibrillaire présentant une forte affinité pour les
colorants basiques auquel Feulgen a donné le nom de chromatine. Au microscope photonique,
comme au microscope électronique, la chromatine appraraît hétérogène. Elle se présente soit
sous la fome de masses compactes qualifiées d’hétérochromatine qui apparaît sous forme de
plages gris foncé (dense aux électrons), soit sous la forme fibrillaire appelée euchromatine,
présentant un aspect plus diffus de teinte gris clair. L’euchromatine est dite active, elle est le
siège de transcriptions, tandis que l’hétérochromatine est dite inactive, sans activité
métabolique détectable. Il a été montré qu’à la fin de la mitose, la grande partie de la
chromatine qui compose les chromosomes mitotiques très condensés se disperse et retourne à
son état interphasique diffus. Dans la plupart de cellules cependant, environ 10 % du matériel
chromosomique garde sa forme condensée compacte pendant toute l’interphase.

L’hétérochromatine reste condensée pendant toute l’interphase alors que l’euchromatine


recouvre son état dispersé à la fin de la mitose. En fonction de la permanence de l’état
condensé, on divise l’hétérochromatine en deux catégories : l’hétérochromatine constitutive et
l’hétérochromatine facultative. L’hétérochromatine constitutive reste condensée en tout temps
et représente de l’ADN qui reste silencieux de façon permanente.

Dans les cellules des mammifères, la plus grande partie de l’hétérochromatine constitutive se
trouve près du centromère de tous les chromosomes et à quelques endroits particuliers, comme
le bras distal du chromosome Y chez les mâles. Chez beaucoup de plantes, les extrémités des
chromosomes, les télomères, sont aussi formées d’hétérochromatine constitutive. L’ADN de
l’hétérochromatine constitutive est principalement formé de séquences fortement répétées, il
est présumé dépourvu de gènes codant pour des protéines.

L’hétérochromatine facultative est inactivée spécifiquement au cours de certains stades de la


vie de l’organisme. Un exemple de l’hétérochromatine facultative est celui des chromosomes
X chez les mammifères. Les cellules des mâles ont un petit chromosome Y et un chromosome
X beaucoup plus grand. Les chromosomes X et Y ayant très peu de gènes en commun, les
mâles ne possèdent qu’un seul exemplaire des gènes portés par les chromosomes sexuels.
34

Bien que les cellules des femmes contiennent deux chromosomes X, un seul fonctionne pour
la transcription. L’autre chromosome X reste condensé sous forme d’une masse
hétérochromatique, appelée corpuscule de Barr, du nom de celui qui l’a découverte en 1949.
On pense que la production du corpuscule de Barr est un mécanisme grâce auquel les cellules
mâles et femelles disposent du même nombre de chromosomes X actifs et donc synthétisent
des quantités équivalentes des produits codés par les gènes liés à X.

Le chromosome X devient hétérochromatique dans toutes les cellules de la femelle des


mammifères à un stade précoce du développement embryonnaire. En fait, cela se produit aux
environs de la gastrulation. L’inactivation dans les embryons est un processus aléatoire, c’est-
à-dire que les chromosomes X d’origine paternelle et maternelle ont la même probabilité
d’être inactivés dans n’importe quelle cellule. De ce fait, le chromosome X paternel peut être
inactivé dans une des cellules de l’embryon et le chromosome X maternel dans une cellule
voisine. A partir de ce moment, c’est le même chromosome X qui est inactif dans toute la
descendance d’une cellule particulière. Le second chromosome X est réactivé dans les
cellules germinales avant le début de la méiose.

Les deux chromosomes X sont donc actifs pendant l’ovogenèse et tous les gamètes reçoivent
un chromosome X actif. Comme les chromosomes X provenant du père et de la mère peuvent
porter des allèles différents pour le même caractère, les femelles adultes sont, dans un certain
sens, des mosaïques génétiques parce que des allèles différents fonctionnent dans des cellules
différentes. Le mosaïcisme du chromosome X se traduit par des taches de couleur du pelage
de certains mammifères, comme chez les chats de calico. Chez l’homme, les gènes de
pigmentation ne sont pas localisés sur le chromosome X, d’où l’absence de femmes calico.

Cependant, l’existence de mosaïques dues à l’inactivation du chromosome X chez la femme a


été prouvée. En ce qui concerne le mécanisme responsable de l’inactivation, il a été suggéré
en 1992 que l’inactivation est initiée par une molécule d’ARN plutôt que par une protéine,
transcrite à partir d’un gène (Xist) localisé sur le chromosome X par ailleurs inactif. Le gène
homologue du chromosome X actif n’est pas transcrit. Cela représente un exemple rare
d’expression dans une portion chromosomique devenue hétérochromatique. Ainsi, des
molécules d’ARN peuvent fonctionner directement comme régulateurs des gènes, une fonction
encore inconnue de l’ARN.

La chromatine est une substance visqueuse qui renferme des acides nucléiques (ADN et
ARN), des protéines basiques (histones) et des protéines acides (non histones). Ces dernières
comprennent des ADN polymérases, des ribonucléases, etc. Les protéines non histones, très
nombreuses, possèdent des propriétés régulatrices (qui sont encore loin d’être toutes connues),
tandis que les protéines histones ont un rôle plutôt structural. Ce sont des protéines basiques,
les unes plus riches en lysine, les autres en arginine. Leur poids moléculaire est réduit.

Par leurs extrémités électropositives, elles se fixent sur les liaisons internucléotidiques
phosphodiesters de l’ADN. Elles peuvent s’unir entre elles ou avec des protéines non histones
par leurs régions apolaires. Tous les noyaux d’eucaryotes contiennent une quantité énorme
d’ADN non codant. Cette quantité est très largement en excès par rapport à celle qui est
35
nécessaire pour coder les protéines présentes dans la cellule. Chez les procaryotes, les gènes
responsables de la synthèse des ARN et des protéines constituent la plus grande partie du
génome. Chez beaucoup d’eucaryotes, au contraire, moins de 70 % du génome correspondent
à ces fonctions. Ceci implique que chez les eucaryotes, il existe de l’ordre de 30 % d’ADN dit
non-codant.

CHROMOSOMES

C’est en 1889 que Waldeyer donna le nom de chromosomes à la forme la plus condensée de la
chromatine observée au cours de la mitose. Les chromosomes semblent apparaître de novo au
début de la mitose et disparaître à nouveau après la mitose. Une cellule humaine contient
environ 6 milliards de paires de bases réparties entre 46 chromosomes. Chaque chromosome
renferme une seule molécule continue d’ADN et plus le chromosome est grand, plus long est
l’ADN qu’il contient. Etant donné que chaque paire de bases occupe environ 0,34 nm sur la
longueur de la molécule d’ADN, 6 milliards de paires de bases correspondraient à une
molécule longue de 2 mètres.

Dans la cellule, l’ADN est uni à de grandes quantités de protéines et d’eau (environ 6
molécules d’eau par paire de bases), qui augmentent encore son volume. Tout cela est
contenu dans un noyau dont le diamètre ne dépasse pas 10 μm alors que l’ADN devra être
accessible aux enzymes et aux protéines de régulation. De plus, la molécule d’ADN d’un
chromosome devra s’organiser pour ne pas s’emmêler avec les molécules des autres
chromosomes. On sait que les chromosomes sont composés de fibres appelées chromatine,
formées d’ADN et de protéines associées. Les protéines de la chromatine sont généralement
divisées en deux groupes principaux : les histones et les protéines chromosomiques non
histones. Les histones représentent une collection de petites protéines basiques bien définies
et les non histones comprennent un grand nombre de protéines différentes, structurales,
enzymatiques et régulatrices. La chromatine contient en outre un faible pourcentage d’ARN,
composés principalement de chaînes d’ARN naissantes à différents niveaux de maturation et
d’ARNsn qui interviennent dans l’épissage de pré-ARNm.

Alors que la dispersion de la chromatine dans une cellule interphasique rend plus facile la
réplication et la transcription de l’ADN, la chromatine de la cellule mitotique est sous sa forme
la plus condensée, qui facilite la livraison d’un paquet intact d’ADN à chaque cellule fille.
Lorsqu’un chromosome se condense pendant la prophase mitotique, il adopte une forme
distincte et constante, déterminée principalement par la longueur de la molécule d’ADN et la
position du centromère. Les préparations de chromosomes mitotiques sont couramment
réalisées à partir des cultures sanguines pour identifier les individus porteurs d’anomalies
chromosomiques. Cela permet de déceler des chromosomes supplémentaires, absents ou
grossièrement altérés.

Centromères

Tous les chromosomes possèdent un site où leur surface extérieure est nettement échancrée.
Cette échancrure représente le centromère du chromosome. Les centromères renferment de
l’hétérochromatine constitutive. Les centromères des chromosomes humains contiennent une
36
séquence longue d’environ 170 nucléotides (ADN satellite α) disposée en tandem et répétée de
2.000 à 30.000 fois par centromère. L’ADN centrométrique fixe des protéines spécifiques qui
servent de sites de fixation aux microtubules qui séparent les chromosomes pendant la division
mitotique. Les centromères divisent les chromosomes en bras. Selon la position du centromère
on peut distinguer 3 types de chromosomes : a- les chromosomes télocentriques, lorsque le
centromère occupe l’une des deux extémités du chromosome. De ce fait, le chromosome n’a
qu’un seul bras ; b- les chromosomes acrocentriques, losque le centromère est plus proche
d’une extrémité par rapport à l’autre. Le chromosome est ainsi divisé en deux bras inégaux :
un bras court et un bras long ; c- les chromosomes métacentriques, lorsque le centromère se
trouve au milieu du chromosome. Le centomère divise alors le chromosome en deux bras
égaux.

Télomères

Chaque extrémité de la molécule d’ADN de chaque chromosome possède un segment très


particulier de séquence répétée appelée télomère, qui forme une coiffe à chaque bout du
chromosome. Chez l’homme, les télomères possèdent la séquence TTAGGA répétée un
millier de fois. AATCCT

Contrairement à la plupart de séquences répétées, qui varient beaucoup entre espèces même si
elles sont étroitement apparentées, on trouve la même séquence télomètrique chez l’homme et
chez tous les vertébrés étudiés. Chez d’autres organismes comme les protozoaires et la levure,
les télomères ont des séquences différentes mais, comme pour les vertébrés, un des brins est
toujours riche en résidus guanosine et son complément en résidus cytidine. Le brin riche en G
court dans le sens 5’→3’ vers l’extrémité du chromosome et dépasse de 12 à 15 nucléotides
l’extrémité du brin riche en C. A cause de ce porte-à-faux, le brin riche en G forme une courte
queue monocaténaire aux deux extrémités du chromosome. Cette disposition persiste d’une
génération cellulaire à l’autre grâce à une enzyme spéciale, la télomérase, qui peut ajouter de
nouvelles unités répétitives à l’extrémité 3’ du brin riche en G. La télomérase est une
transcriptase inverse qui assemble l’ADN sur un modèle de l’ARN. C’est une enzyme très
inhabituelle en ce sens que l’ARN qui sert de modèle fait en réalité partie de l’enzyme elle-
même.

Les séquences télométriques sont également des sites où se fixent plusieurs protéines
spécifiques. Les télomères ont des rôles importants : ils sont nécessaires à la réplication
complète du chromosome ; ils protègent les chromosomes contre les nucléases et autres
influences déstabilisatrices ; ils empêchent la fusion entre les extrémités des chromosomes ;
ils facilitent les interactions entre les extrémités des chromosomes et l’enveloppe nucléaire
dans certains types cellulaires ; ils assurent la stabilité mitotique des chromosomes : après
irradiation par les rayons X, les chromosomes qui en sont dépourvus deviennent collants et
peuvent initier des cycles de cassures et de fusions.

Raccourcissant à chaque dividion cellulaire, les télomères contrôlent la capacité proliférative


de certaines de nos cellules. En effet, les cellules normales ne sont capables de se diviser en
culture qu’un nombre limité de fois avant de donner des signes de vieillissement et finalement
de la mort. L’une des causes en est un raccourcissement progressif des télomères. Il existe des
37
protéines spécifiques des séquences télométriques formant le télosome. Il existe également des
systèmes sophistiqués qui contrôlent l’intégrité de l’ADN : les enzymes de réparation se
mobilisent pour réparer les cassures qui apparaissent. Les télomères risquent donc de fusionner
entre eux par recombinaison ou par des mécanismes de fusion bout à bout, ce qui se
caractérise par la formation des chromosomes dicentriques instables.

En outre la machinerie de réparation peut facilement confondre les extrémités des


chromosomes avec des cassures d’ADN, nécessitant une réparation. Les protéines
télométriques jouent un rôle de protection et permettent aux télomères d’échapper aux
systèmes de réparation de l’ADN. Une enzyme, la télomèrase, peut rallonger les télomères.
Alors qu’elle est absente dans la majorité des cellules somatiques, près de 85% des tumeurs
présentent une activité de la télomérase. Contrairement aux cellules normales, les cellules
cancéreuses ne cessent de croître en culture. On dit qu’elles sont immortelles. Un des facteurs
pouvant contribuer à l’immortalité des cellules malignes est la réactivation de la télomérase,
qui conserve la longueur des télomères au cours des générations. Ainsi la télomérase est
devenue une cible de choix pour les agents anticancéreux.

Toutefois le délai de la perte de l’activité de la télomérase et l’induction d’une sénescence


cellulaire peut être important si les télomères des cellules sont longs. Ceci a modéré les espoirs
d’utilisation de la télomérase comme cible directe et orienté les recherches vers les
mécanismes impliqués dans la maintenance et le raccourcissement des télomères afin de
prendre pour cibles les télomères des cellules cancéreuses. Des études ont montré que
l’introduction du gène codant la télomérse (hTERT) dans des cellules primaires permet de
rétablir son expression et confère aux cellules un phénotype des cellules normales et jeunes de
manière indéfinie.

NUCLEOSOMES

Les nucléosomes constituent le premier niveau d’organisation du chromosome. Selon R.


Kornberg (1974), l’ADN et les histones sont organisés en sous-unités appelées nucléosomes.
Un nucléosome contient une particule qui constitue le noyau du nucléosome, composé 146
paires de bases d’ADN surenroulé, faisant à peu près deux spires autour d’un complexe
cunéiforme contenant huit molécules d’histones. Le noyau est un complexe formé de deux
molécules de chacune des histones H2A, H2B, H3 et H4.

Les particules de nucléosome sont reliées les unes des autres par un segment d’ADN de liaison
de longueur variable, habituellement de quelques 60 paires de bases. L’ADN d’un
nucléosome et une liaison représentent environ 200 paires de bases. Les noyaux des
nucléosomes (avec un diamètre d’environ 10 nm) et l’ADN nu de liaison (environ 2 nm de
diamètre) apparaissent comme des grains de chapelet. Une molécule d’histone H1 se trouve
normalement juste en dehors du noyau du nucléosome. Elle est associée aux deux extrémités
de l’ADN qui entre et qui sort des particules. Les résidus acides aminés basiques des histones
du noyau sont regroupés soit à l’une, soit aux deux extrémités de la molécule, le reste gardant
un caractère relativement hydrophobe.
38
Les portions des histones non chargées, les plus hydrophobes, occupent le centre de la
particule et favorisent leur agrégation en un noyau serré, tandis que les portions polaires,
basiques, du noyau forment des queues flexibles orientées vers l’extérieur de la particule, où
les résidus chargés positivement peuvent établir des liaisons ioniques avec les groupements
phosphates chargés négativement du squelette de l’ADN. Même si l’ADN est étroitement
associé au noyau d’histones par la surface interne de la fibre hélicoïdale, sa surface externe
reste exposée et peut interagir avec des molécules de régulation.

En raison de neuf molécules d’histones pour 200 paires de bases d’ADN, une cellule humaine
contenant 6 milliards de paires de bases d’ADN doit avoir près de 300 millions de molécules
d’histones. C’est la raison pour laquelle les cellules qui se divisent rapidement ont besoin de
plusieurs exemplaires des gènes d’histones pour répondre à leurs besoins. L’interaction entre
les histones et l’ADN est principalement de nature structurale. Elle est relativement
indépendante de la séquence nucléotidique. La formation des nucléosomes représente la
première étape importante du processus de condensation. Le deuxième niveau consiste à ce
que le mince filament de nucléosomes (10 nm) s’enroule pour donner le filament d’ordre
supérieur, plus épais (30 nm) grâce à l’interaction entre les molécules d’histone H1 des
nucléosomes voisins.

Particule cœur du nucléosome

L’étape suivante de condensation de l’ADN dans le noyau concerne l’organisation des


filaments de chromatine de 30 nm en une série de grandes boucles surenroulées. On estime
que chaque boucle renferme entre 10 et 150 Kb d’ADN et qu’elle est unie à sa base à des
protéines spécifiques comprenant une topoisomérase qui intervient dans le contrôle du degré
de spiralisation de l’ADN de la boucle. On pense que les boucles de l’ADN divisent le
génome en domaines contenant chacun un petit lot de gènes qui sont exprimés par un
mécanisme de régulation commun.

Le chromosome mitotique représente la condensation ultime de la chromatine ; une longueur


de 1μm de chromosome mitotique contient habituellement 1 cm d’ADN. Cette condensation
fait suite à un processus mal connu qui s’accompagne de la phosphorylation de pratiquement
toutes les molécules d’histones H1 sur les cinq résidus sérine de la molécule. D’autre part la
structure en nucléosomes de la chromatine non seulement sert de protection pour l’ADN, mais
aussi rend plus accessible son grand sillon, là où s’effectuent justement les interactions entre
l’ADN et les protéines, en particulier régulatrices.

Fibre de nucléosome (« perles sur un fil »)


39
ADN entre nucléosomes Filament d’ADN

Octamère d’histones ADN autour du nucléosome Nucléosome


(environ 200 pb d’ADN)

Les histones forment un groupe remarquable de protéines les plus abondantes du noyau. Elles
sont de petite taille tère très basique (11 à 28 kDa) et possèdent un caractère très basique (pH >
10). Les histones se répartissent en cinq groupes principalement en fonction de leur teneur en
lysine et arginine. Elles se différencient en outre par différentes modifications des acides
aminés comme la phosphorylation ou l’acétylation qui surviennent après la synthèse du
polypeptide.

Les quatre histones qui constituent le nucléosome sont de petites protéines monomériques de
masse moléculaire comprise entre 11.000 et 14.000 Da. Leurs structures sont voisines : la
partie centrale est globulaire et représente plus de 80% de la molécule où se rassemblent les
acides aminés les moins polaires. L’extrémité N-terminale est en forme de bras, très riche en
acides aminés basiques (Arg et Lys). Elle est ainsi chargée positivement au pH cellulaire.
C’est par ce bras N-terminale que les histones interagissent avec les charges négatives des
phosphates de l’ADN. On y retrouve tous les acides aminés susceptibles de subir des
modifications post-traductionnelles comme la phosphorylation, l’acétylation, etc) dont l’effet
est de modifier fortement la charge électrique des bras, soit en y apportant des charges
négatives (phosphorylation), soit en annulant simplement les charges positives (acétylation,
méthylation).

Il en résulte une modification des forces d’interaction entre l’histone et l’ADN dont le rôle
semble majeur dans les processus d’expression et de réplication. L’extrémité C-terminale est
aussi en forme des bras comportant quelques quelques acides aminés basiques. On n’y
retrouve aucun acide aminé susceptible de subir des modifications post-traductionnelles.
Complètement absent sur l’histone H4, ce bras est de longueur variable d’une histone à l’autre.
L’histone H1 ne fait pas partie du nucléosome. Elle participe à la compaction en interagissant
entre deux nucléosomes contigus. Ses deux bras peuvent être phosphorylées sur des sérines et
des thréonines. Les modifications post-traductionnelles (phosphorylation, acétylation) des
histones sont capables de moduler leur rôle dans la réplication et dans la transcription. Toutes
les histones sont phosphorylables sur des sérines et sur des thréonines. La phosphorylation de
l’histone H1 et à moindre titre de l’histone H3 est l’une des étapes clef de la mitose. Seules les
4 histones nucléosomiques sont acétylables in vivo.
Niveaux de l’empaquetage de la chromatine
40

Noyau en interphase Solénoïde Fibre de nucléosomes Double hélice


(~ 30 nm) (~ 10 nm)
(2 nm)

Il s’agit surtout des histones H3 et H4 dont 4 lysines peuvent ε-acétylées. Ces acétylations
jouent vraisemblablement un rôle dans les mécanismes transcriptionnelles. En effet les
histones hyper-acétylées sont principalement retrouvées au niveau des parties actives de la
chromatine.

Les gènes codant pour les histones ne sont transcrits que pendant la phase S du cycle
cellulaire, c’est-à-dire de manière synchrone avec la réplication de l’ADN. L’une de
principales caractéristiques des messagers des histones est de ne pas être polyadénylés. Les
gènes des histones sont sans introns, très répétés chez les eucaryotes, où leur nombre peut
atteindre quelques centaines chez l’oursin. Chez l’homme il existe une vingtaine de gènes des
histones, répartis entre les chromosomes 1, 6 et 12, ainsi que quelques pseudogènes. Les gènes
codant pour les 5 histones sont regroupés sur une distance de 6 à 9 kb, mais ils sont transcrits
séparément.

Chez certains organismes, les orientations transcriptionnelles peuvent être différentes : ce sont
des groupes entiers de 5 gènes des histones qui sont répétés et non pas les gènes de manière
individuelle. On pense que le grand nombre de gènes observé chez tous les organismes résulte
des recombinaisons non égales, sélectionnées au cours de l’évolution du fait de l’avantage
sélectif apporté, puisque ces molécules doivent être synthétisées en énorme quantité et ce
pendant un temps très bref (phase S). L’histone H1 est l’histone la moins conservée, cependant
son rôle est complètement différent de celui de quatre autre.

ADN REPETITIF

Chez les organismes supérieurs, une fraction importante du matériel génétique des cellules est
composée d’un grand nombre (jusqu’à un million) de copies identiques ou très semblables
d’un même segment. On ne connaît ni l’origine, ni le rôle de cet ADN répétitif. Au début des
années soixante, on savait que le gène était constitué d’une séquence unique et précise de
bases azotées et que l’ADN était constitué d’un enchaînement de gènes différents. En 1964, le
41
monde scientifique découvre que la plus grande partie de l’ADN des cellules de souris était
constituée de copies multiples des séquences de bases identiques ou très semblables. C’est
l’ADN répétitif. Actuellement l’ADN répétitif est identifié chez toutes les espèces d’animaux
supérieurs.

L’ADN répétitif représente entre 20 et 80 % de tout l’ADN selon les espèces. La répétition ne
se fait pas toujours avec une parfaite précision si bien que les membres d’une famille d’ADN
répétitif sont plus voisins qu’identiques. Le nombre de séquences de bases apparentées dans
une famille varie de 50 à 2 millions.
Chromosomes humains au stade prémétaphase
42
ADN REPETITIF
Rappelons que dans un génome, la plupart des gènes existent en deux copies ou un petit
nombre de copies. Chaque cellule eucaryote possède cependant de 100 à 5000 copies de
certains gènes codant pour des substances dont la cellule a besoin en grandes quantités, telles
l’ARN ribosomial et les histones. Les gènes des ARNr dans les oocytes de Xénope sont
présents en 2.000.000 exemplaires (amplification génique).

Le séquençage systématique de l’ADN a révélé en outre l’existence d’un grand nombre de


courtes séquences répétées d’ADN. Chez la drosophile par exemple, une séquence de 5
nucléotides AGAAG se répète environ 1000.000 fois au milieu d’un chromosome. Ces
séquences répétées sont non codantes. Certains ADN hautement répétitifs sont des
oligonucléotides (5-50 nucléotides) tels par exemple la séquence :
GTTACGTTACGTTACGTTACGTTAC… ou des segments d’ADN mobiles, les
transposons, appelés également gènes sauteurs. Les ADN répétitifs peuvent être classés en
plusieurs catégories : les ADN répétitifs en tandem ayant une longueur variable de quelques
bases à plusieurs milliers, les ADN répétitifs « simple séquence » forment probablement de 10
à 15 % de l’ADN total, les ADN répétitifs « séquences dispersées » probablement de 20 à 40
% de l’ADN total.

Le génome eucaryote contient dans une proportion pouvant aller jusqu’à 10 %, une sorte
particulière d’ADN répétitif non codant appelé ADN satellite. Le terme de satellite vient de ce
que les premiers ADN de ce type présentaient un taux inhabituel de nucléotides, ce qui a
permis d’isoler ces ADN par centrifugation en gradient de densité. Cet ADN apparaissait
alors comme un ADN mineur, d’où le nom de satellite. La séquence de bases d’un ADN
satellite composée de 1 à 250 nucléotides peut, dans certains cas, être répétée plusieurs
millions de fois. L’ADN satellite se trouve en général au niveau du centromère des
chromosomes. Il semble qu’au total, à peine 10 % de l’ADN nucléaire soit réellement
informatif et que 1 % seulement de l’ADN code pour des protéines. Si on le compare à l’ADN
codant, on constate que l’ADN hautement répété subit des mutations relativement fréquentes
et sans conséquence. Cet ADN peut donc être assez différent chez deux espèces étroitement
apparentées ou même chez deux individus de la même espèce.

La variabilité de l’ADN hautement répété peut-être mise en évidence par la technique des
empreintes génétiques (finger printing). Cette technique consiste à faire agir des enzymes de
restriction pour couper les séquences d’ADN répété en une série de fragments. Les fragments
des deux individus sont alors hybridés de manière à mettre en évidence les différences et les
similitudes. Si des mutations sont apparues au niveau où les enzymes doivent agir,
l’hybridation de l’ADN provenant des deux individus sera altérée et révèlera la différence qui
les distingue. La technique des empreintes génétiques permet notamment d’identifier les
individus à partir des traces de matériel cellulaires (base d’ongle ou de cheveu, sang ou sperme
séchés) et d’établir des filiations de parenté.

Plusieurs points mettent en évidence l’importance de l’ADN répétitif pour le fonctionnement


cellulaire et la survie de l’organisme. C’est notamment sa très large distribution, sa persistance
tout au long des millions d’années d’évolution et le fait qu’une partie au moins en est
exprimée, c’est-à-dire transcrite en ARN. On ne sait toujours pas si les segments répétés sont
43
des gènes, des fragments des gènes, ni s’ils possèdent une autre fonction que le codage des
protéines. On pense que l’ADN répétitif pourrait avoir une fonction d’organisation ou de
régulation.

DENATURATION ET RENATURATION DE L’ADN

La structure hélicoïdale des acides nucléiques est déterminée par l’empilement des bases
adjacentes d’un même brin. La structure en double hélice de l’ADN est maintenue grâce aux
liaisons hydrogènes s’établissant entre les bases complémentaires. Cette caractéristique a
permis de réaliser des expériences de dénaturation. Les énergies libres des interactions non-
covalentes ne sont pas plus élevées que l’énergie dégagée par l’agitation thermique à
température ambiante, si bien qu’aux températures élevées, les structures tridimensionnelles
des protéines et des acides nucléiques sont détruites. Une macromolécule est dite dénaturée
lorsqu’elle est dans un état désorganisé, état dans lequel elle a une structure proche de la pelote
statistique. L’état ordonné, qui est présumé être celui existant dans la cellule, est appelé natif.
Une transition de l’état natif vers l’état dénaturé est appelée dénaturation.

Lorsqu’un ADN double-brin ou un ADN natif est chauffé, les liaisons entre les deux brins
complémentaires sont rompues et ils se séparent. Ainsi un ADN dénaturé est simple-brin. Le
graphe représentant les variations d’une propriété physico-chimique de la molécule en
fonction de la température est appelé courbe de fusion. Cette dénaturation peut être détectée en
observant l’augmentation de la capacité d’une solution d’ADN d’absorber les rayons UV à une
longueur d’onde de 260 nm. Une absorption est exprimée par le logarithme du rapport entre la
lumière transmise et la lumière réfléchie. Elle est appelée absorbance A et dénommée A260
lorsqu’elle est mesurée à 260 nm. Les bases des acides nucléiques absorbent fortement la
lumière ultra-violette et le taux de lumière absorbée par un nombre donné de bases dépend de
leur proximité.

Lorsque les bases sont fortement ordonnées, c’est-à-dire très proches les unes des autres
comme dans un ADN double-brin, l’A260 est plus faible que celle de l’état moins ordonné
d’un ADN simple-brin. En particulier si une solution d’ADN double-brin a une valeur d’A260
égale à 1,00, une solution d’ADN simple-brin à la même concentration a une A260 égale à
1,37. Cette relation est souvent décrite en disant, soit que l’ADN double-brin est
hypochromique, soit que l’ADN simple-brin est hyperchromique. La valeur correspondante
pour des bases libres est de 1,60. Ainsi l’absorbance peut également être une mesure de la
dégradation des acides nucléiques. Lorsqu’une solution d’ADN est chauffée lentement et que
l’absorbance est mesurée aux différentes températures, on obtient une courbe de fusion. Les
caractéristiques de cette courbe sont les suivantes : a- l’A260 demeure constante à des
températures bien supérieures à celles rencontrées par les cellules vivantes dans la nature ; b-
l’augmentation de l’A260 se produit dans un intervalle de 6 à 8°C ; c- l’A260 maximum est
d’environ 37 % plus élevée que la valeur du départ.

Un paramètre pratique pour caractériser le changement d’état de la molécule d’ADN est la


température à laquelle l’augmentation de l’A260 atteint la moitié de sa valeur maximum. Cette
température est appelée la température de fusion, notée Tm. La Tm varie en fonction de la
composition en bases ainsi que des conditions expérimentales. Il a, par exemple, été observé
44
que la Tm augmente avec le pourcentage en G + C. Ce résultat a été interprété en terme de
nombre relatif de liaisons hydrogènes dans les paires G + C (trois liaisons) et dans les paires A
+ T (deux liaisons). La rupture d’une association G – C va nécessiter une plus grande
température que la rupture d’une association A – T, puisqu’il faut rompre un plus grand
nombre de liaisons hydrogènes. De plus, des agents qui augmentent la solubilité des bases
dans l’eau, et par conséquent diminuent les interactions hydrophobes, baissent également la
Tm. Ces résultats suggèrent qu’une interaction hydrophobique stabilise l’ADN. Ils
impliquent également qu’un polynucléotide tend à avoir une structure tridimensionnelle qui
maximise les contacts des groupements phosphates hydrophiles et minimise les contacts entre
les bases hydrophobes et l’eau.

Ceci explique pourquoi, dans l’ADN, les chaînes de sucres-phosphates sont orientées vers
l’extérieur et les bases empilées l’une sur l’autre vers l’intérieur. Cet empilement favorise la
formation des liaisons hydrogènes entre bases. De plus, les bases liées par des liaisons
hydrogènes s’empilent plus facilement. Ainsi ces deux interactions, hydrophobicité et liaisons
hydrogènes, agissent de façon coopérative pour former une structure très stable. Si une des
interactions est supprimée, l’autre est affaiblie. Ceci explique pourquoi la Tm décroît
nettement après l’addition d’un réactif supprimant l’une ou l’autre de ces interactions.

L’augmentation de pH est un agent dénaturant pratique, puisqu’il modifie les charges portées
par plusieurs groupements chimiques engagés dans des liaisons hydrogènes. Une base portant
de tels groupements perd donc sa capacité à former ces liaisons. A un pH supérieur à 11,3,
toutes les liaisons hydrogènes sont éliminées et l’ADN est complètement dénaturé. La chaîne
d’ADN est assez résistante à l’hydrolyse alcaline. Cette procédure constitue une méthode de
choix pour la dénaturation de l’ADN.

Les liaisons phosphodiesters sont détruites lorsque l’ADN est chauffé, ce qui limite
l’utilisation de la température pour dénaturer l’ADN. Il existe également au niveau de l’ADN
une force de répulsion entre les groupements phosphates des deux brins complémentaires, qui
sont chargés négativement. Ces charges sont neutralisées par des associations avec des
cations tels que Na+ et Mg++. Dans l’eau distillée, la répulsion est si grande qu’elle entraîne
la séparation des brins.

Bien qu’il soit stable, l’ADN est une structure dynamique dans laquelle les régions double-
brin s’ouvrent fréquemment pour former des bulles d’ADN simple-brin. Ce phénomène
important, appelé respiration, est supposé permettre à des protéines spécialisées d’interagie
avec la molécule d’ADN, comme par exemple lors du processus de transcription. Puisque les
paires G – C ont trois liaisons hydrogènes et les paires A – T n’en ont que deux ; cette
respiration de l’ADN se produira plus souvent dans les régions riches en A – T que dans les
régions riches en G – C.

L’ADN dénaturé peut être traité pour permettre la réformation d’un ADN natif. Ce processus
est appelé renaturation ou réassociation et l’ADN natif reformé est appelé ADN renaturé. La
renaturation est un outil particulièrement précieux pour la biologie moléculaire. Elle est
utilisée pour mesurer les parentés génétiques entre différents organismes. Elle est également
utilisée pour détecter des espèces particulières d’ADN, pour déterminer si certaines séquences
45
sont représentées plus d’une fois dans l’ADN d’un organisme particulier, et pour localiser des
séquences de bases spécifiques dans une molécule d’ADN.

Pour que la renaturation puisse se faire, deux conditions doivent être remplies : a. la
concentration saline doit être suffisamment importante pour que soient éliminées les
répulsions électrostatiques des groupements phosphates des deux brins, ce qui correspond à
des concentrations en NaCl de 0,15 à 0,50 M et b. la température doit être assez élevée pour
rompre les liaisons hydrogènes qui se forment aléatoirement dans l’ADN simple-brin.
Toutefois, la température ne doit pas être trop élevée, puisque les associations entre bases
appartenant à deux brins d’ADN ne pourront pas se faire ou être maintenues. La température
optimale pour la renaturation est de 20 à 25°C inférieure à la valeur de Tm. Il est important
de noter que les molécules d’ADN renaturées ne sont pas formées à partir des ADN simple-
brin d’origine puisque la renaturation est un processus de mélange aléatoire. Lorsque l’ADN
est associé, au cours de la renaturation, à des molécules d’ADN reconnaissables, ce processus
est appelé hybridation. Ces hybridations sont souvent réalisées à l’aide des filtres minces (ou
membranes) faits de nitrocellulose, disponibles dans le commerce. Ces membranes fixent
l’ADN simple-brin très fortement, mais elles ne peuvent pas fixer des molécules d’ADN
double-brin ou des molécules d’ARN. La renaturation peut être effectuée sur la membrane de
la manière suivante : un échantillon d’ADN dénaturé est filtré à travers la membrane. Les
ADN simple-brin sont fixés fortement sur la membrane par leur squelette de pentoses-
phosphates, les bases restant libres. La membrane est ensuite placée dans un sac contenant une
solution composée d’une faible quantité d’ADN radioactif dénaturé et d’un réactif permettant
d’éviter les fixations additionnelles d’ADN simple-brin sur la membrane.

Après une période d’incubation, la membrane est lavée. La radioactivité ne sera détectée
qu’aux endroits où l’ADN radioactif s’est apparié avec l’ADN fixé sur la membrane au cours
de l’hybridation. Ces hybridations sur membrane sont utilisées pour détecter des homologies
de séquence entre des ADN simple-brin et une molécule d’ARN. Cette méthode est appelée
hybridation ADN – ARN. Elle est particulièrement utile pour détecter le produit de
transcription d’une molécule d’ADN particulière. L’événement initial de la renaturation
correspond à une collision. Ainsi le taux de renaturation obéit à une loi d’action de masse et
augmente avec la concentration d’ADN. Cette dépendance vis-à-vis de la concentration a été
utilisée pour mettre en évidence quelques-unes des plus surprenantes propriétés de l’ADN des
eucaryotes et des procaryotes. Considérons deux solutions d’ADN de concentrations égales
en mg/ml. Si le poids moléculaire des molécules dans chaque solution diffère, les molécules
les plus petites se renatureront plus vite car leur concentration molaire plus grande augmentera
les chances de collision par unité de temps. Ce phénomène est une base des cinétiques de
renaturation. L’application de ce principe à une collection de molécules identiques, cassées en
petits fragments, donne des informations sur les séquences répétées présentes à l’intérieur
d’une molécule d’ADN.

MATERIEL GENETIQUE SELON LES ORGANISMES VIVANTS

Partant de l’idée que tous les êtres vivants manifestent les mêmes mecanismes fondamentaux
de la vie, on admet aujourd’hui que la substance chimique qui constitue le matériel génétique
est soit la même, soit très similaire chez tous les organismes. Il convient de rappeler que
46
depuis les travaux de Mendel on sait que la transmission des caractères se fait par
l’intermédiaire des particules distinctes que Morgan appelle facteurs héréditaires de Mendel. Il
s’agit, selon Morgan, des régions des chromosomes, les gènes, qui sont responsables de la
réalisation totale ou partielle d’un caractère.

MATERIEL GENETIQUE DES VIRUS

Les virus représentent une catégorie exceptionnelle d’organismes définis par leur nature
acellulaire. Ce sont des êtres non cellulaires, parasites intracellulaires obligatoires. Il existe
deux phases dans le cycle de vie d’un virus : l’une correspond à un état intracellulaire actif. Le
virus se multiplie aux dépens de la cellule hôte. Ceci explique les propriétés pathogènes des
virus, puisque généralement la cellule hôte ne survit pas à l’infection. L’autre correspond à un
état extracellulaire. Après sa libération en dehors de la cellule, la particule virale, appelée aussi
vorion, n’est qu’un ensemblage inerte des molécules organiques. A lui seul, le virion est
incapable de réaliser sa propre reproduction. Les virus sont constitués d’un acide nucléique et
un seul, soit de l’ADN ou soit de l’ARN et des protéines. On peut ainsi classer les virus selon
la nature de leur acide nucléique : les virus à ADN et les virus à ARN.

MATERIEL GENETIQUE DES BACTERIES

L’organisation des bactéries est plus complexe que celles des virus. Il s’agit des cellules qui
posèdent tous les types de macromolécules caractéristiques de la matière vivante : protéines,
lipides, polysaccharides, acides nucléiques (ADN et ARN). On connaît la nature du matériel
génétique des bactéries grâce aux expériences de transformation bactérienne. Ces expériences
montrent que l’ADN est la fraction chimiquement pure qui conserve l’activité de
transformation (bactérienne). Ainsi donc chez les bactéries, c’est l’ADN qui a les deux
propriétés qui définissent le matériel génétique : il sagit d’une substance douée de la capacité
d’induire un caractère spécifique et de provoquer sa propre reproduction.

MATERIEL GENETIQUE DES EUCARYOTES

L’ADN est également le matériel génétique chez les eucaryotes. On sait en effet que les
chromosomes sont les supports de l’hérédité. L’ADN est justement localisé dans les
chromosomes. Les lois de reproduction conforme ne s’expliquent que si le matériel génétique
est en quantité constante dans un même clone cellulaire. Si chaque gène est exactement
reproduit d’une génération celulaire à la suivante, alors la quantité de substance chimique
correspondant au matériel génétique est elle-même constante. Ceci est précisément vérifié
pour l’ADN mais nullement pour d’autres types de molécules. Le dédoublement d’ADN qui
précède chaque division cellulaire correspond à la synthèse d’une quantité d’ADN équivalente
à celle qui existait. L’ADN est donc remarquablement stable. Cette stabilité métabolique est
conforme à ce qu’on attend du matériel génétique et ne s’explique pas aux autres types de
molécules qui sont constamment renouvelés.
47
Chapitre 2

REPLICATION ET
REPARATION DE L’ADN
La capacité de se reproduire est une des propriétés les plus fondamentales de tout système
vivant. Chaque être vivant se reproduit en donnant naissance à un ou plusieurs êtres vivants
qui lui sont semblables grâce au mécanisme de duplication de l’ADN. Cette capacité d’auto-
duplication a été une des premières propriétés essentielles apparues au cours de l’évolution de
premières formes de vie primitives. Sans cette capacité de se propager, tout assemblage
primitif des molécules biologiques était voué à la disparition. Ainsi, les organismes se
dupliquent par reproduction asexuée ou sexuée, les cellules se dupliquent par division
cellulaire et le matériel génétique se duplique par réplication.

Il existe en fait un préalable à la division de chaque cellule vivante, c’est la duplication de son
information génétique avec comme conséquence que les deux cellules filles portent
exactement le même contenu informatif, rappelant l’un des dogmes de la biologie qui dit :
« lorsque la cellule-mère se divise, elle donne naissance à deux cellules filles identiques entre
elles et identiques à la cellule-mère ». Le mécanisme par lequel la cellule duplique son ADN
est connu, c’est la réplication de l’ADN qui a lieu au cours de la phase S du cycle cellulaire.
Grâce à ce mécanisme, une molécule d’ADN engendre deux molécules filles rigoureusement
identiques à la molécule du départ.

Cependant malgré son extrême stabilité au cours du temps, l’ADN subit parfois des
modifications, conduisant à l’apparition de nouveaux caractères. Deux phénomènes sont
susceptibles d’altérer la molécule d’ADN : la non-fidélité de la réplication et les agressions
physiques (rayonnements cosmiques, radioactivité et rayons ultraviolets) et chimiques
(molécules réactives et radicaux libres). Pour maintenir l’intégrité de l’ADN et de son contenu
informatif, il existe dans la cellule un ensemble de systèmes enzymatiques qui, à tout moment,
assurent la réparation de l’ADN lésé. Les processus de la réplication et de la réparation sont à
la base de la constance de la molécule d’ADN.

2. 1 REPLICATION DE L’ADN

Selon Watson et Crick, la réplication est considérée comme une séparation graduelle des brins
de la double hélice d’ADN par une succession de ruptures des liaisons hydrogène. Les deux
brins étant complémentaires, chacun contient l’information nécessaire pour la construction de
l’autre. Ainsi, dès que les brins sont séparés, chacun peut servir de modèle pour diriger la
production de son complément et reconstituer la double hélice. La conséquence de la
séparation physique des brins parentaux au cours de la réplication est que chacun des duplex
fils doit posséder un brin complet du duplex d’origine et un autre néoformé. Ce mode de
réplication est dit semi-conservatif, puisque chaque cellule fille reçoit une moitié de la
structure parentale. Le caractère semi-conservatif de la réplication de l’ADN a été démontré
par l’expérience réalisée en 1958 par M. Meselson et F. Stahl sur les bactéries. Ces chercheurs
cultivèrent des bactéries pendant de nombreuses générations dans des milieux contenant du
chlorure d’ammonium 15N comme unique source d’azote. En conséquence, les bases azotées
de l’ADN de ces cellules ne contenaient que l’isotope lourd de l’azote. Les cultures de
48
bactéries lourdes furent débarrassées de ce milieu par rinçage et incubées dans un milieu frais
avec des substances contenant 14N et des échantillons furent prélevés à des intervalles
croissants pendant une période correspondant à plusieurs générations.

L’ADN fut extrait des échantillons de bactéries et soumis à une centrifugation en chlorure de
césium. A l’équilibre, la position d’une molécule particulière d’ADN dans un gradient de
densité de chlorure de césium est directement liée à sa densité qui, dans ce cas, dépend
directement du pourcentage d’atomes de 15N par rapport aux atomes de 14N. Si la réplication
est semi-conservative, on doit s’attendre à voir la densité de l’ADN graduellement décroître
jusqu’à la fin d’une génération. Cette diminution de la densité proviendrait de la synthèse des
brins légers associés aux brins lourds. Après une génération, toutes les molécules d’ADN
seraient hybrides 15N14N et leur densité devrait être intermédiaire entre celle des ADN
entièrement lourds ou légers.

La réplication se poursuivant au-delà de la première génération, les brins nouvellement


synthétisés renferment de nouveau uniquement l’isotope léger et deux types de duplex
apparaissant dans le gradient : ceux qui contiennent les hybrides 15N14N et ceux qui ne
contiennent que 14N. La croissance se poursuivant dans le milieu léger, le pourcentage de
molécules d’ADN léger sera de plus en plus élevé. Cependant, tant que la réplication reste
semi-conservative, les brins parentaux lourds doivent rester intacts et se retrouver dans de
molécules d’ADN hybrides qui représentent une proportion de plus en plus faible de l’ADN
total.

2.1.1 ENZYMES IMPLIQUEES DANS LA REPLICATION

Le terme réplicase désigne l’enzyme impliquée dans la réplication d’un acide nucléique.
Plusieurs enzymes catalysent les différentes étapes de la polymérisation de la molécule
d’ADN, notamment les polymérases et les nucléases. Il existe deux types de nucléases : les
exonucléases et les endonucléases. Les exonucléases coupent les acides nucléiques à partir de
l’extrémité, les endonucléases coupent les acides nucléiques à l’intérieur de la molécule. Les
ARN polymérases catalysent la synthèse des molécules d’ARN alors que les ADN
polymérases catalysent la synthèse des molécules d’ADN.

Chez les bactéries, 5 ADN polymérases ont été trouvées : ADN polymérases I, II, III, IV et V.
L’ADN polymérse I est responsable de l’élimination de l’amorce et de la synthèse pour
remplir les lacunes produites lors de la synthèse. Ses activités exonucléases permettent
également sa participation à la réparation de l’ADN. L’ADN polymérase I (ADN pol I)
synthétise l’ADN à partir des quatre précurseurs et d’une matrice d’ADN à copier. Elle peut
agir au niveau d’une cassure simple-brin. L’ADN polymérase III est la principale enzyme de
la réplication seimi-conservative de l’ADN. Elle est responsable de la polymérisation de 5’ 3’
essentielle à la réplication de l’ADN in vivo. Son activité exonucléasique 3’ 5’ est activée
lorsqu’elle insert un nucléotide incorrect. Dans ce cas, la synthèse s’arrête et l’enzyme fait
marche arrière, excisant le nucléotide incoerrect. Ensuite l’enzyme reprend la polymérisation
dans la direction 5’ 3’, synthétisant le brin complémentaire du brin matrice. Les ADN
polymérases II, IV et V sont impliquées dans différents aspects de la réplication de l’ADN
49
endommagé par des éléments externes, comme les UV. L’ADN poltmérase II est codée par un
gène activé par l’interruption de la synthèse d’ADN au niveau de la fourche de réplication.

Dans sa forme active appelée holoenzyme, l’ADN polymérase III est un dimère constitué de
10 sous-unités : α, ε, θ, γ, δ, δ’, χ, ψ, β, τ. Les sous-unités α (la plus grande), ε et θ constituent
le cœur de l’enzyme, responsable de l’activité de polymérisation. La sous-unité α est
responsable de la polymérisaiton nucléotidique sur chaque brin matrice. ; la sous-unité ε est
responsable de l’activité exonucléasique 3’ vers 5’ et donc du processus de relecture. Les
sous-unités γ, δ, δ’, χ, ψ forment un complexe (dit) responsable de la liaison de l’enzyme à la
matrice au niveau de la fourche de réplicatio. La sous-unité β est utilisée comme « collier » de
serrage (clamp en anglais) pour empêcher que le cœur de l’enzyme ne se détache de la matrice
au moment de la réplication. La sous-unité τ est responsable de la dimérisation du cœur de
l’enzyme, permettant la synthèse simultanée de deux brins d’ADN au niveau de la fourche de
réplication. L’ADN, l’holoenzyme et les protéines associées forment un réplisome.

Les cellules possèdent des enzymes, appelées topoisomérases, capables de modifier le super-
enroulement d’une molécule d’ADN. L’une de ces enzymes, l’ADN gyrase, joue un rôle
critique pour supprimer la tension qui se crée au cours de la réplication, en se déplaçant le long
de l’ADN et en fonctionnant comme un pivot qui transforme la superhélice positive en une
superhélice négative. L’enzyme est capable de réaliser cela en clivant les deux brins du
duplex, en faisant passer un segment d’ADN de l’autre côté, puis en resoudant les points de
rupture, processus qui utilise l’énergie libérée pendant l’hydrolyse de l’ATP.

Le modèle de réplication semi-conservative suppose que la double hélice d’ADN est déroulée
et que les deux brins sont séparés ; ce qui exige la rupture des liaisons hydrogènes et des
interactions hydrophobes. Le plus souvent, l’hélice est déroulée par des enzymes appelées
hélicases (parfois déroulases). Les hélicases se fixent sur l’un des brins de l’ADN, le coupent
pour permettre son déroulement et le resoudent. Chez E. coli, l’hélicase hydrolyse les
molécules d’ATP et utilise l’énergie libérée pour dérouler l’hélice. La rupture des liaisons
entre deux paires de bases exige l’hydrolyse de deux molécules d’ATP. Il existe plusieurs
types d’hélicases agissant de concert. Certaines d’entre elles se fixent sur le brin orienté
3’ 5’ (Rep protéines), d’autres sur le brin orienté 5’ 3’ (hélicases II et III).

Chez E. coli, l’ADN pol III qui synthétise le brin précoce (ou brin principal) n’est pas située
immédiatement derrière l’hélicase. Ainsi l’hélicase laisse dans son sillage deux régions
d’ADN simple-brin : une grande région sur le brin copié par des fragments précurseurs et une
petite région située juste devant le brin précoce. Pour éviter la réassociation des brins et la
formation d’appariements intra-brins, les régions simple-brin sont recouvertes des protéines
qui se lient à l’ADN simple-brin, appelées protéines SSB (Single Strand Binding Proteins).
Ces protéines appartiennent à la classe de protéines capables d’établir des liaisons très fortes
avec l’ADN simple-brin et les unes avec les autres. Ainsi lorsque l’ADN pol III avance, elle
déplace les protéines SSB de manière à permettre l’appariement des nucléotides ajoutés au
brin en croissance.

Les protéines SSB sont des tétramères de masse moléculaire de 74 kDa qui se fixent à la
molécule d’ADN simple brin de la manière suivante : la fixation du premier tétramère sur
50
l’ADN favorise la fixation de la protéine suivante par augmentation de l’affinité apparente,
ainsi de suite jusqu’à ce que tout l’ADN passé sous forme simple brin soit recouvert de
protéine SSB formant une sorte de manchon, ceci rend les 2 brins rigides et les empêche de se
réassocier.

Certains systèmes de réplication utilisent une protéine regroupant les activités de hélicase et
SSB. C’est le cas du système de réplication du phage T4 de E. coli qui synthétise une
protéine du gène 32. Cette protéine est capable de se polymériser et de se fixer très fortement
sur l’ADN simple-brin. L’énergie dégagée par sa fixation est suffisamment grande pour
permettre le déroulement de l’hélice.

Les ADN polymérases connues ne sont pas capables d’établir une liaison entre un groupement
5’-P et un groupement 3’-OH. Ce type de liaison est réalisé par une enzyme appelée ADN
ligase. L’ADN ligase d’E. coli ne peut établir de liaison qu’entre deux désoxyribonucléotides
appariés adjacents. Elle ne peut donc pas relier les deux bords d’une brèche. Dans une
réaction de polymérisation, l’énergie d’activation permettant la formation des liaisons
phosphodiesters est obtenue par le clivage du groupement triphosphate. La ligase n’utilisant
que des groupements 5’-P comme substrat, l’énergie nécessaire à l’établissement des liaisons
est apportée par l’hydrolyse des molécules d’ATP ou par la nicotine adénine dinucléotide
(NAD). L’ADN ligase d’E.coli utilise le NAD. La source d’énergie varie suivant l’organisme.

2.1.2 Amorce (primer) d’ARN

Comme toutes les ADN polymérases, l’ADN pol III est incapable d’initier la polymérisation
de l’ADN ; elle a besoin d’une amorce. En effet, toutes les ADN polymérases connues sont
capables d’ajouter des nucléotides aux extrémités 3’-OH d’un ribo- ou d’un
désoxyribonucléotide apparié au brin servant de matrice. L’amorce du brin précoce comme
celle du brin tardif (secondaire) est réalisée grâce à un oligonucléotide d’ARN dont le nombre
de nucléotides varie d’un organisme à l’autre (environ 5 à 15 nucléotides). L’amorce d’ARN
est synthétisée en copiant une séquence particulière sur l’un des brins d’ADN. Elle diffère des
molécules d’ARN typiques puisqu’elle reste appariée au brin d’ADN. Chez les bactéries,
deux enzymes sont capables de synthétiser les amorces d’ARN : l’ARN polymérase, identique
à celle utilisée pour la synthèse des molécules d’ARN et la primase.

La synthèse de l’amorce débute par la formation d’un complexe de six protéines appelé
préprimosome. Il s’agit des protéines n, n’, n’’, i, DnaB et DnaC. La protéine n’se lie à l’ADN
simple-brin en fixant une molécule d’ATP. Ensuite une primase s’associe au préprimosome
pour former une unité appelée primosome. L’énergie libérée par l’hydrolyse de la molécule
d’ATP est utilisée pour déplacer le primosome le long de l’ADN jusqu’à ce que celui-ci
rencontre un site potentiel d’amorçage. Au niveau de ce site, la protéine DnaB altère la
structure de l’ADN. Cette altération permet à la primase d’initier la synthèse de l’amorce
d’ARN. La synthèse se poursuit ensuite par l’intervention successivement de l’ADN pol III, de
l’ADN pol I et de l’ADN ligase. L’assemblage du brin retardé (à partir de ses fragments
51
d’Okasaki) nécessite le remplacement des amorces ribonucléotidiques par des
désoxyribonucléotides. Chez E. coli ce remplacement est assuré par l’ADN pol I et l’ADN
ligase.

2.1.3 FRAGMENTS PRECURSEURS OU FRAGMENTS D’OKAZAKI

En 1968, Okazaki a découvert que chez E. coli, l’ADN nouvellement synthétisé était formé de
fragments qui, plus tard, étaient reliés les uns aux autres pour former des brins continus.
L’existence de ces fragments est en accord avec le mode de réplication semi-discontinue. Ces
fragments, appelés fragments d’Okazaki ou fragments précurseurs, possèdent les propriétés
prédites par le modèle de réplication semi-discontinue. Ils sont initialement de petite taille et
leur taille augmente au fur et à mesure qu’ils sont attachés les uns aux autres de manière à
former un brin d’ADN continu.

Le fragment d’Okasaki est synthétisé sous forme d’un brin complémentaire à la région simple
brin exposé par le mouvement de la fourche de réplication. Il y a 2 sortes de réactions
d’amorçage chez E. coli : le système φX (d’après le phage φX174 qui caractérise un type de
primosome et le système oriC (par référence à l’origine bactérienne) qui caractérise l’autre
système. Le primosome est formé de 6 protéines : PriA, PriB, PriC, DnaT, DnaB, DnaC. Au
cours de la réplication de φX174, un primosome s’assemblesur un site unique d’un brin
d’ADN appelé site d’assemblage de primosome (PAS). Le PAS est l’équivalent d’une origine
pour la synthèse du brin complémentaire de φX174.

Bien que le primosome se forme initialement sur le PAS de l’ADN de φX174, les amorces
sont initiées à différents endroits. Ceci suggère que le primosome (ou certains de ses
composants) se déplace le long de l’ADN simple brin jusqu’aux autres sites d’amorçage. PriA
et DnaB font partie des composants qui se retrouvent en derlier dans le colexeaux sites
d’amorçage. La nature des sites où s’arrête le primosome mobile n’est pas connue avec
précision. Le pas est reconnu par PriA qui peut déplacer les SSB de l’ADN simple brin. PriA
utilise le clivage d’ATP pour fournir l’énergie nécessaire à la réaction. Les réplicons de type
φX sont les seuls à utiliser PriA, car PriA (ainsi que priB et PriC dont les fonctionnements sont
inconnus) n’est pas nécessaire à la réplication des réplicons OriC.

DnaA est le composant central des primosomes φX et OriC. Elle fournit l’activité 5’→ 3’
hélicase qui déroule l’ADN. On peut dire qu’elle constitue le composant actif du point de
croissance. Elle est liée à l’ADN sous forme d’un complexe avec DnaC. DnaT est également
nécessaire à l’étape de préamorçage. Il faut une primase pour catalyser la réaction
d’amorçage. Pour les réplicons φX et OriC, la primase est le produit du gène dnaG. L’enzyme
est un polypeptide unique de 60 s’associe kD. La primase est une ARN polymérase utilisée
seulement dans des circonstances particulières, c’est-à-dire pour synthétiser de courtes
séquences d’ARN qui servent d’amorces à la synthèse d’ADN.

La primase DnaG s’associe transitoirement au primosome et est activée p r DnaB pour initier
la synthèse de l’amorce, typiquement formée de 11 à 12 bases. Elle synthétise des amorces
commençant par la séquence pppAG complémentaire de 3’-GTC-5’ de la matrice. La protéine
de liaison aux simples brins (SSB) est nécessaire en quantité stoechiométrique au niveau de la
52
fourche de réplication. Elle intervient dans plusieurs étapes de la réplication. Les mutants ssb
ont un phénotype quick-stop et sont différents au niveau de la réparation de la recombinaison
et de la réplication. Le primosome se déplace dans le sens inverse de l’élongation le long du
brin parental. En même temps que la fourche de réplication avance, elle crée une région simple
brin devant le primosome. Après chaque événement d’initiation, le primosome se déplace le
long du simple brin jusqu’eu site de départ du fragment d’Okasaki suivant. Le primosome se
déplace donc dans le même sens que la fourche de réplication, mais dans le sens opposé à
celui de la synthèse d’ADN du brin retardé.

La réaction au niveau d’oriC et l’amorçage des fragments d’Okasaki individuels qui s’en
suivent impliquent le chargement de DnaB sous l’intervention des protéines Pri. DnaB joue 2
rôles essentiels dans la réplication oriC : 1- DnaB possède une activité hélicase qui crée la
fourche de réplication dans l’ADN. Elle se déplace dans le sens 5’→ 3’. Le déroulement de
l’ADN fait appel à un clivage d’ATP ; 2-. Elle active la synthèse d’amorces par la primase
DnaG. L’interaction périodique de DnaB avec Dnag pourrat être suffisant pour amorcer les
fragments d’Okasaki. Le primosome d’un réplicon OriC pourrait donc être constitué
simplement de DnaB interagissant périodiquement avec une primase.

Comme le brin d’ADN ne contient pas de ribonucléotides, l’assemblage du brin secondaire


(tardif) nécessite le remplacement des amorces ribonucléotidiques par des
désoxyribonucléotides. Chez E. coli, ce remplacement est réalisé par l’ADN pol I et l’ADN
ligase. Ainsi, l’ADN pol III allonge le brin en croissance jusqu’à ce que le brin rejoigne
l’amorce du fragment précurseur précédent. L’ADN pol III ne peut aller plus loin parce que
son exonucléase 5’→ 3’ est inactivée sur de l’ADN apparié. Elle ne peut pas non plus réaliser
le déplacement du brin.

A ce stade, l’ADN pol III se dissocie de l’ADN en laissant une cassure simple-brin. L’ADN
ligase ne peut pas souder cette cassure du fait de la présence d’un groupement triphosphate et
de ribonucléotides à une de ses extrémités. A condition qu’il reste un groupement 3’-OH libre
au niveau de cette coupure, l’ADN pol I réalise un déplacement de brin qui s’étant jusque dans
la partie désoxy. A ce stade, l’ADN ligase entre en compétition avec l’ADN pol I et referme
la cassure. Ainsi le fragment est définitivement intégré dans le brin secondaire.

2.1.4 POLYMERISATION

Le démarrage du cycle de réplication d’un ADN double brin nécessite plusieurs activités
successives : - Les 2 brins d’ADN doivent d’abord être séparés. Il s’agit d’une réaction de
fusion sur une courte région ; - Un point de déroulement apparaît et se déplace le long de
l’ADN. Ceci marque la création d’une fourche de réplication qui continue sa progrssion durant
l’élongation ; - Les premiers nucléotides de la nouvelle chaîne doivent être synthétisés et
assemblés en une amorce. Cette action doit avoir lieu une fois pour le brin précoce, mais doit
être répétée au début de chaque fragment d’Okasaki pour le brin retardé. - La réplication
débute à un site spécifique du chromosome appelé origine de réplication (OriC). En effet, le
point de départ de la synthèse d’ADN est une région du chromosome appelée Ori C, constituée
de 245 paires de bases caractérisées par la répétition des séquences de 9 et 13 paires de bases.
53
On les appelle 9 mères et 13 mères. L’ouverture de l’hélice caractérisée par la formation de la
« bulle de réplication » constitue l’étape initiale. Elle est assurée par la protéine Dna A qui se
lie aux 9 mères. Ensuite le complexe Dna B et Dna C réalise la séparation des brins et la
déstabilisation de l’hélice.

Ainsi, par de nombreux aspects, l’origine de réplication est analogue à un promoteur de


transcription, étant donné que les deux types de séquence de régulation fonctionnent comme
sites de fixation pour les protéines d’union à l’ADN spécifiques qui déclenchent la synthèse de
l’ADN ou de l’ARN à un endroit particulier du modèle. Une fourche de réplication
correspond à un endroit où les brins de la double hélice sont en train de se séparer et les
nucléotides s’incorporent aux brins complémentaires néoformés.

La synthèse de l’ADN est réalisée à partir de 4 précurseurs (dNTP : dATP, dGTP, dCTP,
DTTP) et d’une matrice d’ADN à copier. Il convient de noter que seuls les 5’-triphosphates
servent de substrats à la réaction de polymérisation. La polymérisation se produit grâce à
l’addition d’une amorce constituée d’un oligoribonucléotide ou d’un
oligodésoxyribonucléotide apparié au brin d’ADN à copier dont le groupement 3’-OH
terminal est disponible. Ainsi, 1° la réaction de polymérisation requiert à la fois un
groupement 3’-OH libre et une matrice simple-brin à copie et 2° la polymérisation est une
réaction entre un groupement 3’-OH à une extrémité d’un brin en croissance et un nucléotide
5’- triphosphate.

Lorsque le nucléotide est ajouté, il fournit un autre groupement 3’-OH. Puisque chaque brin
d’ADN a une extrémité 5’-P et une extrémité 3’-OH, la croissance du brin se fait dans le sens
5’→ 3’. La première étape de l’initiation de la réplication est la fixation de quelque 30 copies
d’une protéine initiatrice spécifique à une séquence nucléotidique répétitive interne du site ori
C. Les molécules de la protéine initiatrice forment un complexe avec l’ADN enroulé autour
de lui, ce qui induit la séparation des brins d’ADN à un endroit contigu riche en paires de
bases A – T. A la séparation des brins font suite la pénétration d’une ADN hélicase dans la
région monocaténaire, la fixation des protéines d’union à l’ADN monocaténaire et le
recrutement d’autres protéines nécessaires à l’établissement d’une fourche de réplication
active.

Deux lots de protéines de réplication sont assemblés dès le début, de telle sorte que les
fourches peuvent progresser dans les deux sens à partir de l’origine. Les deux fourches de
réplication finissent par se réunir dans une région du chromosome appelée ter où la réplication
cesse, les enzymes de réplication quittent leurs sites d’association à l’ADN et les deux
chromosomes fils se séparent. Une topoisomérase spéciale intervient dans ce dernier
processus. Le contrôle de la réplication s’exerce dès l’origine. Dès que le mécanisme de
réplication a été assemblé et que les fourches ont quitté l’origine, la réplication se poursuit
dans la cellule jusqu’à ce que tout le chromosome soit répliqué. La fixation des protéines
régulatrices à l’origine détermine donc si la réplication a lieu ou non.
54

Fourche de réplication chez les procaryotes

Coordination de la synthèse des brins précoce et retardé

Les nouveaux brins d’ADN sont synthétisés en sens inverse. Une unité enzymatique se
déplace avec le point de déroulement et synthétise le brin précoce. L’autre unité progresse à
l’envers par rapport à l’ADN, le long du simple brin exposé.

Lorsque la synthèse du fragment d’Okasaki est terminée, la synthèse du fragment suivant doit
débuter à un endroit situé approximativement au voisinage du point de croissance du brin
précoce. Cela nécessite une translocation de l’enzyme synthétisant le brin retardé par rapport à
l’ADN. En même temps que le réplisome progresse le long de l’ADN en déroulant les brins
parentaux, il allonge le brin précoce. Le primosome initie périodiquement un fragment
d’Okasaki sur le brin retardé. Lorsque l’ADN polymérase termine la synthèse d’un fragment
d’Okasaki, 1- elle pourrait se dissocier de la matrice, ce qui permettrait l’assemblage d’un
nouveau complexe pour allonger le fragment d’Okasaki suivant ; 2- elle pourrait réutiliser le
même complexe.

2.1.5 ACTIVITES EXONUCLEASIQUES DES ADN POLYMERASES

De façon occasionnelle, les ADN polymérases ajoutent un nucléotide incapable de s’apparier


avec la base correspondante située sur le brin servant de matrice. Cette situation peut être
obtenue à la suite d’une erreur de la polymérase ou résulter d’une tautomérisation d’une
adénine ou d’une thymine. L’ADN polymérase réagit à la présence d’une base terminale mal
appariée en stoppant son activité de polymérisation ; puisque l’enzyme a besoin d’une amorce
correctement appariée. Suite à l’arrêt de la synthèse, l’activité 3’→5’ exonucléasique de la
55
polymérase est stimulée, ce qui conduit à l’excision de la base mal appariée. Après l’excision
de cette base, l’activité exonucléasique disparaît et l’activité de polymérisation recommence.
Cette activité exonucléasique est appelée relecture sur épreuve ou activité de correction
d’épreuves ou encore fonction d’édition de l’ADN polymérase. L’ADN pol I possède
également une fonction 5’→3’ exonucléasique dont les caractéristiques sont les suivantes : a-
les nucléotides sont excisés, un par un, à partir de l’extrémité 5’-P ; b- des coupures
successives peuvent exciser plus d’un nucléotide ; c- le nucléotide excisé doit être apparié ; d-
le nucléotide excisé peut être soit un désoxy- ou soit un ribonucléotide ; e- cette activité peut
se faire au niveau d’une cassure simple-brin pourvu qu’il existe un groupement 5’-P.

La principale fonction de cette activité exonucléasique 5’→3’ consiste à dégrader les amorces
ribonucléotidiques. Parmi les polymérases connues chez E. coli, l’ADN pol I est la seule à
pouvoir réaliser sans aide la réaction de déplacement de brin. Chez toutes les polymérases
connues, le brin néosynthétisé s’allonge dans le sens 5’→3’. L’extrémité en croissance a donc
un groupement 3’-OH libre. Les ADN polymérases ont la faculté de dégrader un polymère
d’acide nucléique comme celle de le synthétiser. Toutes les polymérases bactériennes
possèdent une activité d’exonucléase. Une exonucléase est une enzyme qui dégrade les acides
nucléiques en enlevant les nucléotides terminaux un à un.

Il y a des exonucléases 5’→ 3’ et 3’→5’ selon la direction suivie par la dégradation du brin.
En plus de son activité dans la polymérisation, l’ADN polymérase est une exonucléase 3’→5’
et 5’→3’. Ces trois activités se situent dans des domaines différents du même polypeptide.
Les deux activités exonucléasiques ont des rôles totalement différents dans la réplication. La
plupart des nucléases sont spécifiques, soit de l’ADN, soit de l’ARN, mais l’exonucléase
5’→3’ de l’ADN polymérase I dégrade les deux types d’acides nucléiques. L’action de la
primase laisse un morceau d’ARN à l’extrémité 5’ de chaque fragment d’Okazaki du brin
retardé, qui est éliminé par l’exonucléase 5’→3’ de l’ADN polymérase I. Alors que l’enzyme
élimine l’ARN, on pense qu’elle se sert de son activité de polymérase pour combler, avec de
l’ADN, la lacune qui en résulte. L’ADN ligase fixe ensuite par covalence ce fragment à
l’ADN voisin.

Occasionnellement, l’ADN polymérase ajoute, face à une adénine, une uracile à la place d’une
thymine, à l’extrémité du brin en croissance. Un système de réparation va exciser l’uracile en
la remplaçant par une thymine. Contrairement à l’activité exonucléasique 3’→5’ de
correction d’épreuves, ce système n’agit pas au niveau de l’extrémité, mais seulement lorsque
l’uracile est à l’intérieur d’un brin en croissance. Le processus d’excision produit une cassure
simple-brin transitoire qui est soudée par l’ADN ligase après que le nucléotide correct ait été
inséré. Ainsi, le brin principal est synthétisé de façon continue, mais à la fin de la synthèse, il
est fragmenté par l’excision de quelques uraciles.

La complexité du processus de réplication résulte probablement du fait qu’il exige une grande
fidélité, car plus la molécule d’ADN à répliquer est grande, plus la probabilité d’apparition
d’une erreur pendant le processus de réplication est forte. De plus, un ADN bactérien ne se
réplique qu’une fois par génération, alors qu’un phage se réplique un très grand nombre de
fois dans une cellule infectée. De ce fait, une réplique défective n’affectera pas de façon
significative le résultat de l’infection par le phage. Pour réduire la fréquence d’erreurs de
56
réplication au niveau tolérable, les organismes qui n’ont qu’une seule molécule d’ADN et un
événement de réplication peuvent avoir besoin, pour leur réplication, de l’intervention d’un
plus grand nombre de protéines. Ces protéines pourraient intervenir successivement et
indépendamment pour corriger un type particulier d’erreur.

2.1.6 REPLICATION CONTENUE ET DISCONTINUE

Dans le modèle de réplication présenté jusqu’ici, les deux brins néosynthétisés semblent se
répliquer de façon continue. Ce modèle est théorique puisqu’ aucune des molécules d’ADN
connues n’utilise ce modèle de réplication. En réalité, l’un des brins néosynthétisés est fait de
plusieurs fragments courts qui seront ensuite reliés les uns aux autres. L’examen d’une
fourche de réplication montre que si la croissance des deux brins se fait dans la même
direction, un seul de ces brins aura uniquement un groupement 3’-OH libre. Etant donné
l’antiparallélisme des brins d’ADN, l’autre brin aura un groupement 5’-P libre.

Trois hypothèses ont été formulées pour expliquer cette contradiction apparente : 1- il peut
exister une autre polymérase capable d’ajouter un nucléotide à l’extrémité 5’-P, permettant
l’élongation d’un brin dans la direction 3’ vers 5’ ; 2- Les deux brins s’allongent tous les deux
dans la direction 5’→3’, mais à partir des extrémités opposées de la molécule parentale. Si
ceci est correct, une fraction significative de la molécule non répliquée devrait être sous forme
simple-brin ; 3- La croissance des deux brins s’effectue au niveau d’une seule fourche de
réplication, dans la même direction 5’→3’. En conséquence, leur accroissement ne se fera pas
dans la même direction le long de la molécule parentale.

Seule la troisième hypothèse est valable ; les deux premières sont facilement invalidées. Car
aucune polymérase capable d’ajouter des nucléotides en 5’ n’a été découverte et la proportion
d’ADN intracellulaire sous forme simple-brin représente tout au plus 0,5 % de l’ADN total ;
alors qu’un grand nombre d’expériences supportent l’hypothèse d’une synthèse discontinue.
Dans ce modèle de synthèse, appelé synthèse semi-discontinue, le brin principal est synthétisé
de façon continue et le brin secondaire de façon discontinue, sous forme de courts fragments
synthétisés dans la direction correcte 5’→3’. A la fin de la synthèse, ses fragments sont
assemblés les uns aux autres pour former un brin continu.

2.1.7 REPLICATION BIDIRECTIONNELLE

Il a été noté que, peu après l’initiation du brin précoce au niveau de l’origine de réplication, le
premier fragment précurseur est synthétisé. Il a également été noté que la synthèse de chaque
fragment précurseur se termine lorsque l’extrémité du brin en croissance atteint l’amorce du
fragment précurseur précédemment synthétisé. S’agissant de la terminaison du premier
fragment précurseur, Deux hypothèses ont été formulées : a- il existe un signal de la
terminaison de la synthèse du premier fragment précurseur, b- un tel signal n’existe pas et la
synthèse du premier fragment se poursuit. Dans la seconde hypothèse, le premier fragment
précurseur est l’équivalent d’un brin précoce pour une fourche de réplication, se déplaçant
dans le sens des aiguilles d’une montre.
57
La réplication s’effectuant dans le sens des aiguilles d’une montre requiert la synthèse des
fragments précurseurs dans la seconde fourche de réplication. Ces événements conduisent à
l’existence sur la molécule d’ADN de deux fourches de réplication se déplaçant dans des
directions opposées. C’est ce qu’on appelle réplication bidirectionnelle. Dans le cas de la
première hypothèse, il n’existe qu’une seule fourche de réplication et la réplication est
unidirectionnelle. Aucune raison particulière ne permet de penser qu’il existe un tel signal de
terminaison.

2.1.8 SEMI – CONSERVATISME DE LA REPLICATION

La fidélité de la réplication de l’ADN repose sur le fait que chaque brin d’ADN sert de matrice
pour la synthèse d’un nouveau brin complémentaire. La réplication est ainsi dite semi-
conservative, puisque dans chaque molécule fille d’ADN, un brin provient de la molécule
mère, il est de ce fait conservé et un autre brin est nouvellement synthétisé. De cette manière la
réplication fournit 2 molécules d’ADN identiques entre elles et identiques à la molécule mère.
Ceci est confirmé par les expériences de Meselson et Stahl sur la bactérie E. coli.

Les bactéries E. coli ont été cultivées dans un milieu dit lourd où la source d’azote est 15NH4
(l’isotope 15N est plus lourd que l’isotope 14N). Les bactéries sont ensuite transférées dans un
milieu léger, contenant 14NH4Cl. A des intervalles de temps définis, l’ADN est analysé par
centrifugation en gradient de chlorure de césium. Cette dernière étape permet de séparer les
molécules d’ADN en fonction de leur densité relative, c’est-à-dire en fonction de leurs teneurs
en azote 15N. Les résultats suivants ont été obtenus :

1- après culture en milieu lourd, toutes les molécules sont homogènes et lourdes 15N15N ; les 2
brins contiennent 15N ; 2- après une génération en milieu léger, toutes les molécules d’ADN
sont homogènes et de densité moyenne 15N14N. Il s’agit des molécules dites hybrides ; 3-
après 2 générations en milieu léger, 50% des molécules d’ADN sont légères 14N14N et 50%
hybrides 15N14N. Par ailleurs, la dénaturation de l’ADN après une génération en milieu léger
et la séparation des brins en gradient de chlorure de césium donne 2 bandes de densités
comparables aux brins lourds et légers. Cette expérience confirme également que cet ADN
homogène et hybride est bien constitué d’un brin parental lourd et d’un brin néosynthétisé
léger.

La réplication semi-conservative a été mise en évidence chez les eucaryotes par le marquage
des cellules à la désoxythymidine 3H (le tritium, l’isotope radioactif de l’hydrogène) au cours
de la phase S du cycle cellulaire. A la fin de la première division cellulaire, les chromosomes,
analysés par autoradiographie, possèdent 2 chromatides radioactives. Après la seconde
division des cellules dans un milieu sans précurceur radioactif, tous les chromosomes restent
radiomarqués mais seule une chromatide de chaque chromosome est radioactive.

2.1.9 REPLICATION EN CERCLE ROULANT (OU CERCLE TOURNANT)

La réplication d’un seul brin peut être utilisée pour produire des copies de certaines molécules
circulaires. Une coupure ouvre un brin et l’extrémité qu’elle produit est allongée par l’ADN
polymérase. Le brin néosynthétisé déplace le brin parental d’origine. Ce type de rupture est
58
appelé cercle tournant ou cercle roulant, car on peut considérer que le point de coissance
tourne autour du brin atrice circulaire. Il pourrait en principe continuer indéfinement son
parcours. En même temps que ce point se déplace, la fourche de réplication allonge le brin
externe et déplace son partenaire précédent. Le nouveau matériel synthétisé étant lié
covalemment au matériel d’origine, le génome d’origine est donc fixé à l’extrémité 5’ du brin
déplacé. L’unité d’origine est suivie d’autant de génomes unitaires qu’il y a eu de révolutions
de synthèse autour de la matrice. Chaque révolution déplace le matériel synthétisé au cycle
précédent.

Le clivage de la queue correspondant à une unité génomique produit une copie linéaire du
réplicon circulaire d’origine. La forme linéaire peut être maintenue dans un état simple brin ou
être convertie en duplex par la synthèse du brin complémentaire (dont la séquence est
identique à celle du brin matrice du cercle tournant d’origine). Le cercle tournant permet
d’amplifier le réplicon (unitaire) d’origine. Ce mécanisme est utilisé pour produire des ADNr
amplifiés dans les ovocytes de Xénope. Les gènes codant les ARNr sont organisés en un grand
nombre de répétitions contiguës dans le génome. Une seule unité répétée issue du génome est
transormée en un cercle tournant. La queue déplacée, contenant de nombreuses unités
génomiques, est transformée en un ADN double brin. Plus tard, cet ADN sera activé à partir
du cercle, ce qui permettra aux 2 extrémités d’être reliées pour former un grand cercle d’ADN
amplifé. Le matériel amplifié est donc contitué d’un grand nombre d’unités identiques
répétées.

Ce mode de réplication conduit à la formation d’un cercle avec une branche linéaire. Il
ressemble à la lettre sygma, et pour cela il est appelé réplication σ ou réplication en cercle
roulant. La réplication en cercle roulant possède les caractéristiques suivantes : a- le brin
précoce est lié par covalence au brin parental servant à la synthèse du brin tardif ; b- la
branche linéaire possède une extrémité 5’-P, avant que ne commence la synthèse du fragment
précurseur ; c- la réplication en cercle roulant peut se produire sans interruption, conduisant à
la formation des concatémères, d- la matrice servant à la synthèse du brin précoce ne quitte
jamais la partie circulaire de la molécule.

La réplication par le biais de cercles tournants est courante chez les bactériophages. Les
génomes unitaires peuvent être clivés à partir de la queue déplacée, produisant des monomères
qui peuvent être encapsidés dans les particules phagiques ou utilisés pour des cycles de
réplication ultérieurs. Le phage φX174 est constitué d’un ADN circulaire simple brin appelé
brin+. Son brin complémentaire, le brin-, est synthétisé. Cette action produit un cercle double
brin qui est forme fermée covalemment dans laquelle sont céés des supertours. Une protéine
codée par le génome du phage, la protéine A, coupe le brin+ du duplex d’ADN au niveau d’un
site spécifique qui définit l’origine de réplication.

Après avoir coupé l’origine, la protéine A reste fixée sur l’extrémité 5’qu’elle a produite tandis
que l’extrémité 3’ est allongée par l’ADN polymérse. La structure de l’ADN joue un rôle
important dans cette réaction, car l’ADN ne peut être coupé que s’il est superenroulé. La
protéine A est capable de se fixer à un fragment d’ADN simple brin de 10 bases qui entoure le
site de coupure. Ceci suggère que le superenroulement est nécessaire pour assister la formation
d’une région simple brin qui fournit le site de liaison de la protéine A.
59

Lactivité enzymatique au cours de laquelle une protéine clive un duplex d’ADN et se fixe sur
l’extrémité 5’ libérée est parfois appelée relaxase. La coupure produit une extrémité 3’ – OH
et une extrémité 5’ – P (liée covalemment à la protéine A) qui interviennent toutes deux dans
la réplication de φX174. En utilisant le principe de cercle tournant, l’extrémité 3’ – OH de la
coupure est allongée à la suite de la formation d’une nouvelle chaîne. La chaîne s’allonge le
long du brin matrice circulaire (-) jusqu’à ce qu’elle parvienne au point de départ et déplace
l’origine. A ce moment, la protéine A fonctionne à nouveau. Elle reste liée au cercle tournant
ainsi qu’à l’extrémité 5’ de la queue déplacée et se trouve donc au voisinage lorsque le point
de croissance passe l’origine. C’est donc la même protéine A qui est disponible pour
reconnaître l’origine et la couper, se fixant à l’extrémité produite par la nouvelle coupure.

Ce cycle peut être répété indéfinement. Après la coupure, le ssimple brin déplacé (+) est
libéré sous une forme circulaire. La protéine A est impliquée dans sa circularisation. En fait, la
liaison des extrémités 3’ et 5’ du brin+ est assurée par la protéine A lors de la réaction au cours
de laquelle elle est libérée à la fin d’un cycle de réplication et débute un autre cycle. La
protéine A possède une propriété inhabituelle que l’on peut rapprocher de ces événements.
Elle agit en cis in vivo. Cela signifie que in vivo, la protéine A synthétisée par un génome
particulier ne peut se fixer qu’à l’ADN de ce génome. On ne sait pas comment cela est
possible. Cependant l’activité de la protéine A in vitro montre de quelle manière elle reste
associée au même brin parental matrice (-).

La protéine A possède 2 sites actifs : cela pourrait lui permettre de cliver la nouvelle origine et
de rester en même temps fixée à l’ancienne, puis de ligaturer le brin déplacé en un cercle. Le
brin déplacé (+) peut suivre 2 voies après sa circularisation. Au cours de la phase de
réplication de l’infection virale, il peut être utilisé comme matrice pour la synthèse du brin
complémentaire (-). Le cercle double brin peut alors être utilisé comme cercle tournant pour
engendrer davantage de descendants, ou bien au cours de la morphogenèse des phages, le brin
déplacé (+) peut être encapsidé dans les virions.

Réplication en cercle roulant ou réplication

3’ 5’

5’

+
60
Chez les phages, il est fréquent que la réplication donne naissance à des molécules filles
linéaires composées de nombreuses répétitions de la molécule d’ADN parentale. De telles
molécules sont appelées concatémères. Le plus souvent, ces concatémères constituent un
intermédiaire essentiel dans la production des particules phagiques. Lors de la conjugaison
bactérienne, une molécule d’ADN linéaire est transférée d’une cellule donneuse à une cellule
réceptrice par un processus réplicatif. Ces deux phénomènes sont dus à un mode de
réplication en cercle roulant (ou en cercle tournant). La synthèse d’une amorce n’est pas
nécessaire puisqu’il existe une extrémité 3’-OH à partir de laquelle peut-être synthétisé le brin
précoce. Dans cette synthèse, la polymérase utilisée est l’ADN pol III. Le déplacement du brin
est le résultat de l’action conjuguée de l’hélicase, des protéines SSB et de la polymérase.

2.1.10 REPLICATION D’UN ADN SIMPLE BRIN

La réplication d’une molécule d’ADN simple brin passe par la formation d’une molécule
d’ADN double brin à partir du simple brin noté brin (+). La formation de cette molécule se
déroule en quatre étapes : synthèse d’une amorce d’ARN, élongation à partir de cette amorce
d’un brin d’ADN par l’ADN polymérase III jusqu’à la synthèse complète du brin (–),
dégradation de l’amorce d’ARN et son remplacement par un fragment d’ADN grâce à l’ADN
polymérase I, liaison de ce fragment au brin (–) par l’ADN ligase. Cette molécule
intermédiaire est appelée ADN RFI (forme réplicative). La forme réplicative va servir pour la
synthèse de nombreuses molécules d’ADN simple brin (+).

2.1.11 ADNc ou ADN COMPLEMENTAIRE

L’ADNc est une molécule d’ADN synthétisée à partir d’un ARNm grâce à la transcriptase
inverse. Cette enzyme est capable de synthétiser une molécule d’ADN double à se servant
d’un ARNm comme matrice. La première étape consiste à la synthèse d’un ADN simple brin à
partir de la matrice d’ARNm, ce qui conduit à la formation d’une molécule hybride ARN-
ADN. L’ARN est ensuite détruit et le simple brin d’ADN va servir de matrice pour la synthèse
d’une molécule d’ADN double brin. L’ARNm étant la copie d’un gène, l’ADNc représente un
gène débarrassé de ses introns et de ses séquences de régulation. Les gènes eucaryotes étant
pourvus de nombreux introns alors que les bactéries ne disposent pas de système enzymatique
capable d’exciser les introns, l’ADNc est fréquemment utilisé lors des études sur les gènes
eucaryotes dans les bactéries

2.1.12 REPLICATION DES CHROMOSOMES EUCARYOTES

Par rapport aux procaryotes, les chromosomes eucaryotes ont une taille énorme. Leur
organisation est très complexe. La vitesse de déplacement d’une fourche de réplication chez E.
coli est d’environ 100.000 paires de bases par minute. Chez les eucaryotes, les polymérases
sont beaucoup moins actives et la vitesse est de l’ordre de 500 à 5000 paires de bases par
minute. Puisqu’une cellule animale contient à peu près 50 fois plus d’ADN qu’une bactérie, la
durée de la réplication de l’ADN d’une cellule animale devrait être 1000 fois plus grande que
celle du chromosome de E. coli ; ce qui conduirait à une durée de 30 jours si elle n’était initiée
qu’en un seul point.
61
Le plus souvent, la durée du cycle de réplication n’excède pas quelques heures. Ce temps peut
être obtenu grâce à l’existence de multiples sites d’initiation. L’ADN de la drosophile, par
exemple, possède environ 5000 sites d’initiation, séparés les uns des autres par 30000 bases et
répliqués de façon bidirectionnelle. Le nombre très élevé de fourches de réplication dans les
cellules eucaryotes nécessite une grande quantité de polymérases. C’est ainsi que chez E. coli,
il existe de 10 à 20 molécules d’holoenzyme ADN pol III par cellule. Une cellule animale
typique contient 20.000 à 60 000 molécules d’ADN polymérase. La réplication d’un ADN
double-brin comporte une étape de polymérisation et une étape de dissociation (séparation des
brins). La réplication de la chromatine, forme sous laquelle se présente l’ADN eucaryotique,
nécessite une étape supplémentaire de séparation de l’ADN et les octamères d’histones pour
former un nucléosome.

Le terme chromatine désigne un nucléosome contenant une histone H1 dans lequel l’ADN fait
deux tours pleins autour de l’octamère. La structure complète de la chromatine fibrillaire est
probablement une structure en zig-zag. L’assemblage de l’ADN et des histones est la
première étape du processus de raccourcissement du brin d’ADN dans un chromosome, à
savoir, une réduction d’un facteur sept de la longueur de l’ADN et la formation des fibres
flexibles de grains larges de 110 A° (11 nm), c’est-à-dire approximativement 5 fois l’épaisseur
de l’ADN libre. Si l’ADN ne se dissociait jamais de la bobine d’histones, la progression de la
fourche de réplication poserait de sévères contraintes géométriques. L’ADN nouvellement
synthétisé doit s’associer à des octamères d’histones pour former des nucléosomes comme la
molécule parentale.

L’observation des fourches de réplication dans un ADN non déprotéinisé pendant son
extraction montre que les nucléosomes sont formés très rapidement après la réplication. La
synthèse des histones se produit simultanément avec la réplication de l’ADN. Les histones
sont synthétisées dans la cellule au fur et à mesure de ses besoins, de telle sorte que la cellule
ne contient pas de quantités appréciables de molécules d’histones non-associées. Les
octamères parentaux ne se dissocient pas. Les histones nouvellement synthétisées forment
donc de nouveaux octamères. Ainsi, alors que la réplication est semi-conservative, la
production d’octamères d’histones est conservative. Une expérience, basée sur le fait que les
histones ne sont pas synthétisées en continu mais en fonction des besoins, montre que les
octamères ne se dissocient pas du brin portant les unités parentales.

Il a même été observé que chacune des fourches d’un œil de réplication possède une branche
d’ADN nue, l’autre branche portant les octamères parentaux conservés. Dans le système du
virus de mammifères comme le SV40 dont l’ADN est organisé en nucléosomes (ce qui n’est
pas le cas de tous les ADN viraux), les octamères parentaux sont exclusivement associés au
brin précoce. Et puisque la réplication de l’ADN, dans chaque œil, est bidirectionnelle et
puisque les octamères parentaux sont toujours associés à la synthèse du brin précoce, chaque
branche de l’œil est couverte d’une longue région d’octamères parentaux et d’une longue
région d’octamères nouvellement synthétisés. Le point de séparation de ces deux régions se
fait au niveau de l’origine de réplication.

Les expériences ont montré que toutes les origines de réplication d’un génome ne sont pas
activées au même moment. Des groupes de 20 à 80 réplicons adjacents sont activés
62
séquentiellement au cours de la phase S jusqu’à ce que l’ADN entier soit répliqué. Il a
également été montré que la synthèse de l’ADN est restreinte à la phase S du cycle cellulaire.
Six types d’ADN polymérases sont présents dans les cellules eucaryotes : Pol α, δ et ε sont
impliquées dans la réplication de l’ADN nucléaire, Pol β et ζ sont utilisées dans la réparation
de l’ADN enfin Pol γ est impliquée dans la synthèse de l’ADN mitochondrial.

Ainsi par rapport aux procaryotes, les cellules eucaryotes utilisent 4 nucléosides triphosphates
(dATP, dGTP, dCTP et dTTP) comme précurseurs, 1matrice simple-brin à copier et 1 amorce.
Alors que l’ADN bactérien est circulaire, l’ADN des cellules eucaryotes est linéaire. Sur
l’ADN bactérien, il existe une seule origine de réplication ; les chromosomes eucaryotes
comportent plusieurs origines de réplication se présentant sous forme de bulles de réplication
qui se forment lorsque l’hélice d’ADN s’ouvre. Au niveau de chaque origine, deux fourches
de réplication se forment et progressent dans des directions opposées. Il convient de noter que
ce nombre élevé de réplicons dans les cellules eucaryotes par rapport aux procaryotes
compense la lenteur de la synthèse de l’ADN eucaryote. Ainsi E. coli met 20 à 40 minutes
pour répliquer entièrement son génome, alors que la drosophile, 40 fois plus d’ADN, réplique
tout son ADN à seulement 3 minutes lors des divisions cellulaires embryonnaire.
Les grands principes de la réplication sont les mêmes chez les procaryotes et les eucaryotes.

Chez les eucaryotes, elle reste un événement plus rare, en raison du temps de génération plus
long. De plus, l’organisation de l’ADN en chromatine (ADN et histones) conduit à un degré
supérieur de complexité de la réplication dont toutes les étapes ne sont pas complètement
élucidées. La réplication est biderectionnelle et s’effectue généralement à partir de plusieurs
origines.

Le taux d’erreur par nucléotide incorporé est de l’ordre de 10-9 (soit 1 sur 1 milliard). Une
aussi grande fidélité de réplication est due non seulement à la spécificité d’appariement des
bases, mais aussi à la propriété de correction d’épreuves de l’ADN polymérase III. Ainsi la
réplication démarre à l’intérieur de la molécule d’ADN en un point appelé origine de
réplication, puis se poursuit dans les 2 directions.

2.1.13 REPLICON

Les gènes régulateurs du cycle cellulaire actionnent les signaux qui initient la réplication de
l’ADN et déclenchent la division cellulaire. Chez les procaryotes, l’initiation de la réplication
est un événement unique impliquant un seul site sur le chromosome bactérien et le processus
de division est réalisé par la mise en place d’un septum. Dans les cellules eucaryotes,
l’initiation de la réplication correspond au début de la phase S, une longue période durant
laquelle se déroule la synthèse d’ADN et qui implique de nombreux événements individuels
d’initiation. La division résulte d’une réorganisation de la cellule au cours d’une mitose.

L’unité de l’ADN dans laquelle se déroule un événement de réplication individuel est appelée
réplicon. Chaque réplicon fonctionne une fois et une seule dans un cycle cellulaire. Le
réplicon est défini par la présence des éléments de contrôle nécessaire à la réplication. Il
possède une origine au niveau de laquelle la réplication est initiée. Il peut également avoir un
site de terminaison au niveau duquel la réplication s’arrête. A l’origine le réplicon était défini,
63
chez les procaryotes, comme une unité possédant l’origine et le gène codant la protéine
régulatrice. Désormais le terme réplicon s’applique aux chromosomes eucaryotes pour décrire
une unité de réplication qui contient une origine, les gènes codant les protéines régulatrices
peuvent être situés ailleurs.

Le génome d’une cellule procaryote constitue un seul réplicon : les unités de réplication et de
ségrégation coïncident donc. Le réplicon le plus grand de ce type correspond au chromosome
bactérien. L’initiation au niveau d’une seule origine permet la répliccation du génome
complet et se produit une fois à chaque division cellulaire. Chaque bactérie haploïde possède
un seul chromosome. Ce type de contrôle de réplication est ainsi appelé à copie unique. Les
bactéries peuvent contenir des informations génétiques supplémentaires sous la forme de
plasmides. Un plasmide est un génome d’ADN circulaire autonome qui constitue un réplicon
physiquement indépendant. Un réplicon plasmidique peut se répliquer en même temps que le
génome bactérien ou bien être soumis à un type de contrôle différent. Lorsque le nombre de
copies d’un plasmide est supérieur à celui du chromosome bactérien, on dit que le plasmide
obéit à un contrôle multicopie.

Chaque ADN du phage ou du virus constitue également un réplicon capable de nombreuses


initiations au cours d’un cycle infectieux. Au contraire des chromosomes nucléaires qui ont un
contrôle à copie unique, l’ADN des mitochondries et des chloroplastesest plutôt régulé comme
celui des plasmides qui existent en grand nombre de copies par bactérie. Chaque cellile
contient de multiples copies d’ADN provenant de chaque organite et le contrôle de leur
réplication doit être en relation avec le cycle cellulaire.

2.1.14 ORIGINE DE REPLICATION

Une molécule d’ADN engagée dans la réplication possède 2 sortes de régions : la région non
répliquée formée du duplex parental et la région répliquée dans laquelle se forment deux
duplex fils. La région où la réplication a lieu s’appelle fourche de réplication (appelée parfois
point de croissance). Une fourche de réplication se déplace séquentiellement le long de l’ADN
à partir de son point de départ situé à l’origine. La réplication peut être unidirectionnelle ou
bidirectionnelle, selon qu’il se forme une ou deux fourches de réplication à partir de l’origine.
Dans la réplication unidirectionnelle, une fourche de réplication quitte l’origine et se déplace
le long de l’ADN. Dans la réplication bidirectionnelle, deux fourches de réplication sont
formées et progressent en sens opposés à partir de l’origine. Au microscope électrnique,
l’ADN en cours de réplication montre la région répliquée comme un œil à l’intérieur de la
région d’ADN non répliquée. S’il provient d’une réplication unidirectionnelle, l’œil
correspond à une origine fixe et une fourche de réplication en mouvement. S’il provient d’une
réplication bidirectionnelle, l’œil représente une paire de fourches de réplication.

Dans les deux cas, la progression de la fourche de réplication agrandit l’œil jusqu’à ce qu’il
engobe finalement la totalité de réplicon. Lorsqu’un réplicon est circulaire, la présence d’un
œil aboutit à la structure ϴ. Avec une molécule linéaire définie, on peut utiliser la microscopie
électronique pour mesurer la distance qui sépare chaque extrémité de l’œil de l’extrémité de
l’ADN. On compare ensuite les positions des extrémités des yeux avec celles des molécules
qui ont des yeux de différentes tailles. Si la réplication est unidirectionnelle, alors une seule
64
extrémité se déplace, l’autre correspond à l’origine fixe, mais si la réplication est
bidirectionnelle, les deux extrémités de l’œil se déplacent et l’origine se trouve au milieu des
deux.

Avec des régions indéfinies appartenant à de grands génomes, on peut utiliser deux brefs
marquages radioactifs pour marquer le mouvement des fourches de réplication. Si l’un des
marqueurs est plus intense que l’autre, on peut les distinguer grâce à leurs intensités relatives,
que l’on peut voir par autoradiographie. On remarque que dans le cas d’une réplication
unidirectionnelle, un marquage précède l’autre à une extrémité de l’œil. La répliation
bidirectionnelle produit un schéma de marquage (symétrique) aux deux extrémités de l’œil.
C’est ce qu’on observe généralement dans la réplication des chromosomes eucaryotes.

Une méthode pour cartographier les origines de réplication à plus haute résolution repose sur
les conséquences des changements de forme sur les migrations électrophorétiques d’un ADN.
Le génome d’E coli se réplique de façon bidirectionnelle à partir d’une seule origine, située
sur le locus génétique OriC. L’addition du locus OriC à n’importe quel fragment d’ADN crée
un plasmide artificiel qui peut se répliquer dans E. coli. Les réplicons procaryotes sont
généralement circulaires : l’ADN forme un cercle fermé sans extrémité libre. Le chromosome
bactérien ainsi que tous les plasmides et de nombreux bactériophages sont des structures
circulaires. Elles sont également courantes dans les chloroplastes et les ADN mitochondriaux.

La réplication d’une molécule circulaire évite le problème posé par la réplication des 2
extrémités d’une molécule linéaire, mais pose le problème de la terminaison de la réplication.
Le chromosome bactérien est répliqué de façon bidirectionnelle comme une seule unité, à
partir d’une origine unique (OriC). Les 2 fourches de réplication responsables de l’initiation au
niveau d’oriC se déplacent autour du génome jusqu’à un point de rencontre et la terminaison a
lieu dans une région précise. Les séquences qui provoquent la terminaison sont appelées sites
ter. Un site ter contient une courte séquence (environ 23 pb) qui entraîne la terminaison in
vitro. Les séquences de terminaison fonctionnent dans un seul sens. La terminaison fait appel
au produit du gène tus qui code une protéine reconnaissant la séquence consensus, ce qui
empêche la fourche de réplication de poursuivre sa progression.

On sait qu’habituellement les fourches de réplication se rencontrent et interrompent la


réplication à un endroit situé en face de l’origine, au milieu du chromosome. Les 2 régions de
terminaison (ter D, A et ter C, B) ont été identifiées et se trouvent à environ 100 kb de chaque
côté de ce point de rencontre. Chaque extrémité est spécifique du sens du déplacement d’une
fourche et ces extrémités sont disposées de telle sorte que chaque fourche devrait dépasser
l’autre pour pouvoir atteindre l’extrémité qu’elle reconnaît. Cet arrangement donne lieu à un
« piège pour les fourches de réplication » : si pour une raison quelconque, l’une des fourches
est retardée et que les 2 fourches ne se rencontrent pas à la position centrale habituelle, alors la
fourche la plus rapide est piégée dans la région ter pour attendre l’arrivée de la fourche la plus
lente.
65
ORIGINES DE REPLICATION MITOCHONDRIALES

Les origines des réplicons dans les chromosomes procaryotes et eucaryotes sont des structures
statiques. Elles sont constituées des séquences d’ADN reconnues dans leur forme double brin
et utilisées pour initier la réplication au moment opportun. L’initiation nécessite la séparation
des brins d’ADN et la mise en route de la synthèse (bidirectionnelle) d’ADN. Il existe
cependant des cas particuliers dont celui de l’ADN mitochondrial. Chez les mitochondries
(des mammifères), la réplication débute au niveau d’une origine spécifique de l’ADN double
brin circulaire. Mais au départ, seul un des 2 brins parentaux (le brin H) est utilisé comme
matrice pour la synthèse d’un nouveau brin. La synthèse a lieu sur une courte distance
seulement, déplaçant le brin partenaire d’origine (L), qui reste à l’état simple brin. L’état de
cette région lui a donné le nom de boucle de déplacement ou boucle D.

Dans les mitochondries des mammifères, on trouve une seule boucle D sous la forme d’une
ouverture du duplex de 500 à 600 bases. Le brin court qui maintient la boucle D est instable et
se déteriore : il est fréquemment dégradé et resynthétisé pour maintenir l’ouverture du duplex
à ce site. Certains ADN mitochondriaux contiennent plusieurs boucles D, ce qui reflète
l’utilisation d’origines multiples. Le même mécanisme est utilisé dans l’ADN des
chloroplastes où il y a 2 boucles D (dans les végétaux supérieurs). Pour répliquer l’ADN
mitochondrial des mammifères, le brin court de la boucle D est allongé. La région déplacée du
brin L d’origine devient plus longue, ce qui agrandit la boucle D. Cette expansion continue
jusqu’à ce qu’elle atteigne un point situé environ aux deux tiers du parcours le long du cercle.
La réplication de cette région expose une origine dan le brin L déplacé.

La synthlèse d’un nouveau brin H est initiée au niveau de ce site et elle progresse le long de la
matrice constituée par le simple brin H déplacé dans le sens opposé à celui de synthèse du brin
L. En raison de son comportement différé, la synthèse du brin H n’a réalisé qu’un tiers de son
parcours autour du cercle lorsque la synthèse du brin L s’achève. Ceci conduit à la libération
d’un cercle double brin complet et d’un cercle incomplet qui reste partiellement simple brin,
jusqu’à ce que la synthèse du brin H soit terminée. Les 2 extrémités de chaque nouveau brin
sont finalement reliées l’une à l’autre.

L’existence des cercles tournants et des boucles D a permis de découvrir un principe général :
« une origine peut être une séquence d’ADN qui sert à initier la synthèse d’ADN en utilisant
un brin comme matrice ». L’ouverture du duplex ne conduit pas nécessairement à l’initiation
de la réplication sur l’autre brin. Dans le cas de la réplication de l’ADN mitochondrial, les
origines de réplication des 2 brins se strouvent à des positions différentes.

2.1.15 EXTREMITES DES CHROMOSOMES LINEAIRES


ET REPLICATION

Les télomères sont des structures constituées de longues séries d’une courte séquence répétée
d’ADN liées aux protéines spécifiques, appelées protéines associées aux télomères. Chez
l’homme, les télomères comportent des répétitions en tandem de motifs (TTAGGG)n et sont
bordés des motifs hautement variables appelés répétitions subtélométriques. Les télomères
préservent l’intégrité et la stabilité des chromosomes. Il a été montré que les extrémités
66
doubles-brins des molécules d’ADN ressemblent à des cassures doubles-brins (CDB) qui
apparaissent lorsqu’un chromosome est fragmenté. De telles extrémités doubles-brins peuvent
fusionner avec d’autres extrémités, favorisant des réarrangements chromosomiques. Elles sont
aussi susceptibles d’être dégradées si elles ne fusionnent pas. Chez les eucaryotes, les
télomères sont conservés et leur raccourcissement progressif, qu’il soit normal ou
pathologique, est considéré comme un signe majeur de sénescence cellulaire.

La télomérase, aussi appelée télomère terminale transférase, est une enzyme isolée à l’origine
chez un protozoaire cilié, Tetrahymena, une enzyme tout à fait inhabituelle : c’est une
ribonucléoprotéine contenant un morceau d’ARN essentiel à son activité catalytique. La partie
ARN sert à la fois de guide et de matrice pour la synthèse de son ADN complémentaire,
processus appelé transcription inverse. En effet, chez Tetrahymena, le composant ARN
contient plusieurs répétitions de la séquence 5’– CCCCAA – 3’, complémentaire de la
séquence d’ADN télométrique qui doit être synthétisée (5’ – TTGGGG – 3’).
Chez l’homme, la séquence d’ADN télométrique répétée du brin retardé est 5’ – TTAGGG –
3’ et ne diffère de la séquence trouvée chez Tetrahymena que d’un nucléotide. Des fonctions
enzymatiques analogues ont été décrites chez tous les eucaryotes étudiés. Il convient de noter
que les séquences télométriques ont été hautement conservées au cours de l’évolution,
reflétant leur fonction critique au niveau des télomères.

Dans la plupart des cellules somatiques eucaryotes, la télomérase n’est pas active. De ce fait, à
chaque division cellulaire, les télomères de chaque chromosome se raccourcissent. Ainsi après
de nombreuses divisions cellulaires, les télomères se trouvent extrêmement érodés et les
cellules perdent leur capacité à se diviser, alors que les cellules malignes maintiennent une
activité télomèrase. Un rapprochement a été fait entre le raccourcissement des télomères et un
mécanisme moléculaire associé au vieillissement cellulaire.

2.2 REPARATION DE L’ADN

La vie sur terre est soumise à diverses forces destructrices qui trouvent leur origine dans
l’environnement interne et externe de l’organisme. Dans la cellule, l’ADN est une des
molécules les plus susceptibles de subir des lésions liées à l’environnement. Lorsqu’il est
touché par une radiation ionisante, par exemple, le squelette de la molécule d’ADN est
souvent rompu. Soumises à différentes substances chimiques communes dont certaines sont
produites par le métabolisme de la cellule elle-même, les bases de la molécule d’ADN voient
leur structure altérée. Exposées aux radiations ultraviolettes, des pyrimidines contiguës sur un
brin d’ADN ont tendance à interagir entre elles pour former des dimères, c’est-à-dire des
complexes covalents.

Certaines altérations de l’ADN peuvent être d’origine physique, d’autres sont d’origine
chimique. Les rayons cosmiques et la radioactivité sont des rayonnements très énergétiques
pouvant directement produire des lésions (comme des modifications de bases, des ruptures des
brins, etc). Ces rayonnements agissent également indirectement en induisant l’apparition des
ions superoxydes O-- chimiquement très réactifs. Moins énergétiques, les rayons ultraviolets
solaires induisent principalement des dimérisations de thymines adjacentes en créant un cycle
cyclobutyl entre les carbones 5 et 6 de chacune des thymines.
67

Les altérations d’origine chimique sont très diverses et peuvent provenir du simple
métabolisme normal de la cellule. C’est le cas des ions H+ et de l’agitaion thermique qui
peuvent retirer jusqu’à 10.000 bases puriques par jour et par cellule chez l’homme. Les lésions
de l’ADN peuvent être directes (dépurination, modification des bases comme des
désaminations, des oxydations, etc), création des liaisons covalentes entre les 2 brins ou
indirectes comme les drogues intercalantes. L’importance de ces altérations peut être
appréciée en estimant que chaque cellule d’un mammifère à sang chaud perd plusieurs milliers
de bases par jour. Si ces lésions ne sont pas réparées, elles entraîneraient une altération
permanente ou mutation de l’ADN. Si la mutation survient dans une cellule qui évolue en un
gamète, l’altération génétique peut être transmise à la génération suivante. Les mutations ont
aussi des effets dans les cellules non reproductrices. Elles peuvent interférer avec la
transcription et la réplication, aboutir à la transformation maligne d’une cellule et accélérer le
processus de vieillissement de l’organisme.

Face aux conséquences drastiques des altérations des molécules d’ADN et de leur fréquence
élevée, les cellules sont pourvues des mécanismes permettant la réparation des accidents
génétiques. En fait, les cellules disposent de différents systèmes de réparation capables de
corriger pratiquement tous les types de dommages qui peuvent atteindre la molécule d’ADN.
Il convient cependant de noter qu’on estime que moins d’une modification de base sur mille
échappe aux systèmes de réparation de la cellule. Les cellules procaryotes comme eucaryotes
possèdent une gamme d’enzymes qui cheminent le long de l’ADN, à la recherche d’altérations
et de distorsions qu’elles peuvent identifier et réparer. Dans certains cas, le dommage peut être
réparé directement. Cependant, la plupart de systèmes de réparation entraînent l’excision du
segment d’ADN endommagé, qui est sélectivement éliminé.

La grande majorité des mécanismes de réparation se base sur le fait que les deux chaînes de la
double hélice d’ADN sont complémentaires l’une par rapport à l’autre et de ce fait, chaque
brin possède l’information nécessaire pour reconstruire son partenaire. C’est ainsi que lorsque
un ou plusieurs nucléotides sont éliminés d’un brin, le brin complémentaire peut servir de
modèle pour la reconstruction du duplex d’ADN. On peut se rendre compte de l’importance
de la réparation de l’ADN quand on voit les conséquences, chez l’homme, des défauts dans la
réparation de l’ADN. L’étude de ces défauts (ces maladies) a ouvert un volet par où on
commence à entrevoir la nature des protéines impliquées dans la réparation de l’ADN. Par
ailleurs, la spécificité de l’hôte dans une souche bactérienne est le résultat de l’action d’une ou
plusieurs enzymes particulières, qui imposent des modifications précises de l’ADN. Le profil
de modification identifie l’origine de l’ADN. Il permet à la bactérie de distinguer son propre
ADN de tout ADN étranger, qui ne possède pas son profil. Cette différence rend un ADN
étranger sensible à l’attaque des enzymes de restriction qui reconnaissent l’absence, par
exemple, de groupement méthyle aux emplacements appropriés. La méthylation par exemple,
est l’une des modifications les plus courantes. Elle constitue une sorte de marquage informatif
pour les segments d’ADN.
68
2.2.1 LESIONS DE L’ADN

Une lésion de l’ADN correspond à n’importe quel changement introduisant une modification
par rapport à la structure habituelle en double hélice. Ces changements sont répartis en 2
grandes classes : des changements d’une seule base et des déformations structurales de l’ADN.
Des changements d’une seule base affectent la séquence de l’ADN mais pas sa structure
gobale. Ils ne touchent ni la réplication, ni la transcription lorsque les brins du duplex sont
séparés. Ainsi donc, ces changements ont des conséquences préjudicialbles pour les
générations futures, en raison de la modification de la séquence d’ADN.

C’est notamment le cas de la conversion d’une base à une autre qui ne s’apparie pas
correctement avec la base partenaire. Une désamination d’une cytosine qui crée une paire U.G
mal appariée ou une erreur de réplication qui incorpore une adénine à la place d’une cytosine
créant une paire A.G en sont des exemples. Ces changements peuvent entraîner une
déformation structurale très minime, mais le mauvais appariement ne persiste en général pas
au-delà de la réplication suivante. Des déformations structurales peuvent constituer un
obstacle physique à la réplication ou à la transcription. L’introduction des liaisons covalentes
entre des bases d’un même brin d’ADN ou entre des bases situées sur des brins opposés,
inhibe la réplication et la transcription.

Un exepmle bien connu de déformation structurale est celui provoquée par l’irradiation des
rayons ultraciolets créant des liaisons covalentes entre 2 thymines adjacentes et conduisant au
dimère de pyrimidines intracaténaires. Des conséquences similaires pourraient résulter de
l’addition d’un groupement volumineux sur la base, ce qui déformerait la structure de la
double hélice. Une coupure simple brin ou un retrait d’une base empêche un brin de servir de
matrice pour la synthèse d’ADN ou d’ARN. La caractéristique commune à tous ces
changements est le maintien du composé d’addition endommagé dans l’ADN. Les systèmes
de réparation peuvent identifier une gamme de déformations dans l’ADN comme des signaux
d’action. De plus, une cellule peut posséder plusieurss systèmes capables de réagir aux lésions
de l’ADN. Ces systèmes peuvent être répartis en plusieurs types généraux.

2.2.2 REPARATION DIRECTE

La réparation directe est rare et implique l’inversion ou le simple retrait de la lésion. C’est le
cas de la photoréactivation des dimères de pyrimidines, dans lesquels les liaisons covalentes
perturbantes sont défaites par une enzyme dépendante de la lumière. Ce système est très
répendu dans la nature. Il semble particulièrement important chez les plantes. Chez E. coli, il
dépend du produit d’un seul gène qui code une enzyme appelée photolyase.

Systèmes de réparation par excision

La réparation par excision est initiée par une enzyme de reconnaissance qui repère une base
endommagée ou un changement dans le parcours spacial de l’ADN. La reconnaissance est
suivie par l’excision de la séquence qui contient des bases endommagées, puis un nouveau
segment d’ADN est synthétisé pour remplacer le matériel excisé. De tels systèmes sont
69
courants : certains reconnaissent des lésions générales dans l’ADN, tandis que d’autres
agissent sur des altérations spécifiques des bases.

Systèmes de réparation par excision chez E. coli

Les systèmes de réparation par excision ont des spécificités variables, mais ils présentent tous
les mêmes caractéristiques générales. Chaque système enlève les bases mal appariées ou
endommagées de l’ADN, puis synthétise un nouveau segment d’ADN pour les remplacer.
Dans l’étape d’incision, la structure endommagée est reconnue par une endonucléase qui clive
le brin d’ADN des deux côtés de la lésion. Au cours de l’étape de l’excision, une exonucléase
5’→3’ enlève une partie du brin endommagé. Lors de l’étape de synthèse, la région simple
brin résultante sert de matrice à une ADN polymérase qui synthétise un remplaçant de la
séquence excisé. L’ADN ligase lie enfin cavalemment l’extrémité 3’ du nouveau matériel à
l’ancien matériel.

On peut identifier différents modes de réparation par excision grâce à l’hétérogénéité des
longueurs des segments d’ADN réparés. On qualifie ces systèmes de : 1- réparation de très
courts fragments (VSP pour very patch repair), 2- réparation de courts fragments, 3- réparation
de longs fragments. Le système VSP s’occupe de mauvais appariements entre des bases
spécifiques. Les deux derniers systèmes impliquent tous deux les gènes uvr. Le système uvr de
réparation par excision comprend 3 gènes : uvr A, B, C qui codent les composants d’une
endonucléase de réparation. D’abord une combinaison uvr AB reconnaît des dimères
pyrimidines et autres lésions volumineuses. Puis uvr A se dissocie et uvr C rejoint uvr B. La
combinaison uvr BC fait une incision de chaque côté, l’une à 7 nucléotides du côté 5’ du site
endommagé et l’autre à 3 – 4 nucléotides du côté 3’. uvr D est une hélicase qui assiste le
déroulement de l’ADN pour permettre le relâchement du simple brin entre les deux coupures.
L’enzyme qui excise le brin endommagé est probablement l’ADN polymérse I. La longueur
moyenne de l’ADN excisé est de 12 nucléotides, ce qui place ce système dans la catégorie des
réparations de courts fragments.

Dans le cas des lésions importantes, les réparations de courts fragments constituent 99% des
événements de réparation par excision. Le 1% restant représente le plus souvent le
remplacement des segments d’ADN de 1500 nucléotides environ, mais qui peuvent dépasser
9000 nucléotides. Ce système implique également les gènes uvr et l’ADN polymérse I. Une
différence existe entre les 2 modes de réparation. La réparation de courts fragments est une
fonction constitutive de la cellule bactérienne, tandis que la réparation de longs fragments doit
être induite par des lésions. Les réparations de longs fragments agissent sur des lésions situées
à proximité des fourches de réplication.

Déficience dans la réparation par excision des nucléotides chez l’homme

Deux exemples de défauts dans la réparation de l’ADN sont à l’origine de Xeroderma


pigmentosum et le syndrome de Cockayne, deux maladies génétiques chez l’homme. Le soleil
émet un flux constant de rayons ultraviolets qui font vieillir et muter les cellules de notre peau.
Les risques liés au soleil sont particulièrement bien illustrés par une déficience récessive rare,
70
Xeroderma pigmentosum (XP). Les individus souffrant de XP possèdent un système de
réparation défectueux, incapable d’éliminer les segments d’ADN endommagés par les rayons
ultraviolets. Il en résulte que les individus avec XP sont extrêmement sensibles à la lumière
solaire. Même une exposition très courte aux rayons ultraviolets directs du soleil peut induire
de nombreuses taches pigmentées sur les parties exposées de l’organisme et une forte
augmentation du risque de développer des cancers de la peau entraînant des difformités ou la
mort. Environ 20 % des patients XP manifestent en outre une dégénérescence neurologique et
un retard mental.

Le syndrome de Cockayne (SC) est une maladie héréditaire caractérisée par la sensibilité à la
lumière, un dysfonctionnement neurologique dû à la démyélinisation des neurones et à
diverses anomalies du développement, mais sans ou avec peu d’augmentation de la fréquence
des cancers de la peau. La déficience des cellules des individus avec le syndrome de
Cockayne se situe au niveau du système principal de réparation de l’ADN activement transcrit,
mais le reste du génome est réparé à un rythme normal. C’est probablement pourquoi ces
individus ne sont pas sujets à des cancers de la peau plus fréquents. Le cancer de la peau est
donc une des conséquences d’une correction défectueuse des dégâts induits par les rayons
ultraviolets.

Réparation de mauvais appariements

La réparation de mauvais appariements résulte d’un examen de l’ADN qui détecte des bases
voisines mal appariées. Les mauvais appariements qui se produisent au cours de la réplication
sont corrigés par une distinction entre les brins neufs et les brins anciens et par une correction
préférentielle de la séquence des brins néosynthétisés. L’enzyme utilisée est Dam méthylase,
qui reconnaît et méthyle en position N6 les bases A des séquences GATC. Juste après la
réplication, le brin néosynthétisé n’est pas encore méthylé alors que le brin matrice l’est depuis
le cyle de réplication précédent. Ainsi le brin naissant porteur de l’erreur est reconnu et coupé
et le fragment d’ADN incorrect est ensuite éliminé pour être remplacé grâce à l’action
combinée de plusieurs enzymes. D’autres systèmes s’occupent de mauvais appariements
produits par une conversion de base, telle qu’en provoque la désamination.

Systèmes de tolérance

Les systèmes de tolérance font face aux difficultés provenant d’un blocage de la réplication au
niveau d’un site endommagé. Ils fournissent à la séquence de la matrice endommagée un
moyen d’être copiée, avec sans doute une fréquence d’erreur élevée. Ils sont particulièrement
importants dans les cellules d’eucaryotes supérieurs.

Systèmes de compensation

Les sytèmes de compensation constituent un autre type de système de tolérance. Lorsqu’il


reste des lésions dans une molécule fille et que la réplication ait été forcée de dépasser le site
endommagé, alors un système de compensation utilise une réaction de recombinaison pour
obtenir une autre copie de la séquence à partir d’une source intacte. Ces sytèmes de réparaion
71
par recombinaison sont bien caractérisés chez des bactéries, mais on ignore l’importance qu’ils
ont ailleurs.

Systèmes de compensation chez E. coli

Les systèmes de compensation ont été appelés réparation post-réplicationnelle parce qu’ils
interviennent après la réplication ou réparation par recombinaison parce que leurs activités
sont en partie redondantes avec celles impliquées dans la recombinaison génétique. De tels
systèmes sont efficaces pour la réparation des erreurs commises dans le duplex fils au moment
de la réplication d’une matrice contenant des bases endomagées. Etant donné que le dimère de
pyrimidine empêche le site lésé de servir de matrice, la réplication est contrainte de passer par-
dessus. L’ADN polymérase avance probablement jusqu’au dimère ou près de lui. Puis elle
cesse la synthèse du brin fils correspondant. La réplication reprend plus loin. Il reste alors une
brèche importante dans le brin néosynthétisé.

Les duplex fils ainsi produits sont de natures différentes. L’un est formé du brin parental
endommagé, associé à un brin néosynthétisé contenant une large brèche. L’autre duplex
possède le brin parental normal et une copie complémentaire, également normale. Le système
de compensation se sert alors du brin fils normal. La brèche qui fait face au site lésé est
rempli grâce à la capture du brin homologue dans le duplex normal. Après cet échange de
simples brins, le duplex receveur est formé d’un brin parental (endommagé) et d’un brin du
type sauvage.

Le duplex du donneur contient un brin parental normal associé à un brin interrompu ; cette
brèche peut alors être complétée de façon habituelle par une synthèse réparatricce, produisant
un duplex normal. Les mêmes événements de réparation par recombinaison doivent être
répétés après chaque cycle de réplication, sauf si et jusqu’à ce que la lésion soit supprimée par
un système de réparation par excision. Les dimères sont un obstacle létal à la réplication, en
l’absence de la fonction RecA. Le gène recA et d’autres mutations rec identifient les voies de
compensation.

Système SOS

Il s’agit d’une succession complexe de changements phénotypiques impliquant de nombreux


gènes dont les produits possèdent entre autre des fonctions de réparation. Une grande variété
d’événements endommageant l’ADN est capable d’induire la réponse SOS. Le signal
inducteur pourrait être une petite molécule libérée à partir de l’ADN ou bien une structure
formée à l’intérieur de l’ADN. In vitro, l’activation de l’ADN nécessite la présence d’un
ADN simple brin et d’ATP. Le signal activateur pourrait donc être la présence d’une région
simple brin au niveau d’un site lésé.

Quelque soit la forme prise par le signal, son interaction avec Rec A est rapide : la réponse
SOS se produit dans les minutes qui suivent le traitement endommageant l’ADN. L’activation
de Rec A entraîne un clivage protéolytique du produit du gène lex A. Lex A est une petite
protéine (22 kD) relativement stable dans les cellules qui n’ont pas subi de traitement et dans
lesquelles elle agit comme un répresseur de nombreux opérons. La réaction de clivage est
72
inhabituelle : Lex A possède une activité protéasique lentente, activée par Rec A. Lorsque
Rec A est activée, elle conduit Lex A à entreprendre un clivage autolytique, ce qui inactive la
fonction répresseur de LexA et induit de façon coordonnée tous les opérons auxquels elle était
liée. Les gènes cibles de la répression de lex A concernent de nombreuses fonctions de
réparation dont rec A, lexA, uvrA, uvr B, uvrC et himA.

Certains des gènes SOS ne sont actifs que dans les cellules traitées tandis que d’autres sont
actifs dans les cellules non traitées, mais leur expression est augmentée par le clivage de Lex
A. Dans le cas de uvr B, qui est un composant du système de réparation par excision, le gène
possède 2 promoteurs : l’un fonctionne indépendamment de Lex A, tandis que l’autre est
soumis à son contrôle. Ainsi donc, après le clivage de Lex A, le gène peut être exprimé aussi
bien à partir du second promoteur que du premier. Lex A réprime ses gènes cibles en se fixant
à une séquence d’ADN de 20 kb appelée boîte SOS.

Ces boîtes SOS ne sont pas identiques dans tous les loci, mais elles ressemblent à une
séquence consensus contenant 8 positions toujours conservées. Entraîne les autres opérateurs,
les boîtes SOS chevauchent les promoteurs qu’elles régulent. Le locus lex A qui est soumis à
une répression autogène, possède 2 boîtes SOS. Rec A et Lex A sont les cibles mutuelles du
système SOS : Rec A provoque le clivage de LexA qui réprime rec A. la réponse SOS entraîne
donc l’amplification de la protéine Rec A et du répresseur LexA. Les résultats ne sont pas
contraadictoires, malgré ce que l’on pourrait penser.

L’augmentation de l’expression de la protéine Rec A est (sans doute) nécessaire à son rôle
direct dans les systèmes de réparation par recombinaison. Lors de l’induction, la concentration
de base de RecA (~ 1200 molécules / cellule) est augmentée de plus de 50 fois. Cette
concentration élevée dans les cellules induites garantit une quantité suffisante de Rec A pour
que toutes les protéines Lex A soient coupées. Ceci devrait empêcher Lex A de rétablir la
répression des gènes cibles.

La caractéristique la plus importante de ce système est qu’il assure un retour rapide à la


normale dans la cellule. Lorsque le signal inducteur est supprimé, la protéine RecA devient
incapable de déstabiliser LexA. A ce moment, le gène lexA est exprimé à un niveau élevé : en
l’absence des molécules de RecA activées, la protéine Lex A s’accumule rapidement en une
forme non coupée et interrompt l’expression des gènes SOS. Ceci expique pourquoi la réponse
SOS est facilement réversible.

L’activation de RecA entraîne également le clivage d’autres protéines répresseurs, dont celles
de plusieurs prophages. Parmi ces protéines se trouve le répresseur de lambda (avec lequel
l’activité protéasique a été découverte). Ceci expique pourquoi lambda est induit par
l’irradiation aux UV. Le répresseur lysogène est clivé, ce qui permet au phage de s’engager
dans le cycle lytique. Cette réaction n’est pas une réponse SOS de la cellule. Le phage
reconnaît au contraire que la cellule est en difficulté. Sa survie est donc mieux assurée s’il
s’engage dans le cycle lytique pour engendrer sa descendance. Dans ce sens, l’induction d’un
prophage se fait aux dépens du système cellulaire, car elle répond au même indicateur
(activation de Rec A).
73
Toutes les protéines cibles connues de l’activation de Rec A sont clivées au nniveau d’un
dipeptide de séquence Ala – Gly, situéé au milieu de la chaîne polypeptidique. Il y a seulement
une homologhie limitée des acides aminés situés de part et d’autre du peptide, ce qui suggère
que la structure tertiaire de la protéine est une caractéristique importante pour la
reconnaissance de la cible. Les deux activités de RecA sont relativement indépendantes. La
mutation rec A 441 permet le déclenchement de la réponse SOS sans traitement inducteur,
probablement parce que Rec reste spontanément dans un état activé. D’autres mutations
suppriment sa capacité d’activation, mais aucune n’empêcheRec A de fixer l’ADN. Il serait
utile d’isoler la mutation inverse, inactivant la fonction de recombinaison, mais lui laissant la
propriété d’induire la réponse SOS, pour démêler les effets directs et indirects de Rec A dans
les systèmes de réparation.

Gènes SOS

Lorsque les erreurs sont suffisamment graves pour arrêter la synthèse de l’ADN, elles
induisent l’expression d’un groupe de gènes importants appelés gènes SOS. L’arrêt de la
réplication provoque l’apparition d’ADN monocaténaire reconnue par l’enzyme de réparation
RecA. L’enzyme RecA agit en assurant des recombinaisons et en induisant l’autolyse du
répresseur des gènes SOS, la protéine LexA. LexA est une enzyme majeure bifonctionnelle
qui induit l’expression d’une vingtaine de gènes, ayant tous un rôle dans la réparation de
l’ADN.

Certains gènes SOS sont aussi induits lorsque, au cours de la réplication, une base est
manquante sur le brin matrice. Dans ce cas l’ADN polymérase se trouve dans la situation où
elle doit insérer une base sans disposer de la base complémentaire. Souvent elle incorpore une
base qui est probablement erronée et laisse la réplication continuer au lieu d’arrêter
complètement la duplication de l’ADN. Cette réparation peut modifier le message génétique
initialement porté par la molécule d’ADN, elle est pour cela appelée réparation sujette à
l’erreur.

Systèmes de réparation eucaryotes

La caractérisatipon biochimique des systèmes de réparation dans les cellules eucaryotes est
moins bien poussée. Les gènes impliqués dans les focntions de réparation ont été caractérisés
génétiquement dans la levure grâce à leur sensibilité aux rayonnements. On les appelle les
gènes RAD (pour radiation). Il existe 3 grands groupes de gènes de réparation dans la levure :
- groupe RAD 3 : gènes participant à la réparation par excision ; - groupe RAD 6 : gènes
nécessaires à la réparation post – réplicationnelle ; - groupe RAD 52 : gènes intervenant dans
les mécanismes utilisant une recombinaison. La réparation chez la levure est en relation avec
la transcription. Les gènes transcriptionnellement actifs sont réparés préférentiellement. La
réparation du brin transcrit est donc privilégiée (pour enlever les obstacles à la transcritpion).
Une connexion mécanique entre le système de réparation et l’ARN polymérase semble être à
l’origine de cette liaison.

La protéine RAD 3 qui est une hélicase nécessaire à l’étape d’incision est un composant du
facteur de transcription associé à l’ARN polymérase. Les cellules des mammlfères présentent
74
des différences au niveau de la quantité d’ADN resynthétisée après chaque lésion. Cependant
les pièces de réparation les plus longues chez les mammifères sont comparables à celles
synthétisées par les systèmes de réparation de courts fragments chez les bactéries. Ce système
intervient sur des lésions provoquées par une irradiation aux UV ou par des traitements ayant
des conséquences voisines. Un autre système resynthétise seulement 3 à 4 bases réparatrices
au niveau des sites endommagés par une irradiation aux rayons X ou par une alkylation.

Certaines maladies humaines héréditaires donnent une indication de l’existance et de


l’importance des systèmes de réparation chez les mammifères. La plus étudiée est la
Xeroderma pigmentosum (XP), qui est une maladie récessive résultant d’une hypersensibilité
à la lumière du soleil, en particulier aux UV. Elle se caractérise par des troubles au niveau de
la peau (et parfois par des conséquences plus graves). Cette maladie s’explique par une
faiblesse du système de réparation par excision. Les fibroblastes des patients XP présentent un
défaut dans l’excision des dimères de pyrimidines et autres groupements volumineux.
Plusieurs groupes de complémentation génétique (~ 9) ont été caractérisés, souvent par leur
déficience dans l’étape d’incision de la réparation.

Six des gènes identifiant les locus XP individuels ont été clonés et chacun possède un
équivalent chez la levure. Six des 11 locus du groupe qui contient RAD3 sont des homologues
des gènes de XP, ce qui suggère une conservation importante du système de réparation par
excision. Certains résultats indirects suggèrent que les cellules des mammifères possèdent des
systèmes de réparation par recombinaison. Là encore, ces systèmes pourraient être en relation
avec la recombinaison génétique elle–même. Le syndrome de Bloom, une maladie humaine
récessive en est un exemple. Une augmentation des aberrations chromosomiques, dont des
échanges des chromatides sœurs, pourrait être reliée au fonctionnement des systèmes de
recombinaison.

Il existe un lien entre transcription et réparation de l’ADN. En effet le brin matrice d’ADN
dans un gène est préférentiellement réparé lorsque l’ADN est endommagé. Chez les bactéries
et les eucaryotes, il existe une liaison entre l’ARN polymérase et l’activation de la réparation.
Chez les bactéries, l’activation de la réparation est assurée par le système de réparation par
excision uvr. Notons qu’il existe plusieurs sortes d’altérations des molécules d’ADN
notamment :

a- des substitutions de bases pendant la réplication : une base incorrecte sur un brin ne peut
plus s’apparier avec la base correspondante située sur l’autre brin. Ce défaut peut résulter
d’une erreur de réplication qui n’a pas été corrigée par les fonctions d’édition ou une
désamination spontanée transformant une cytosine en une uracile ou une adénine en une
hypoxanthine ;

b- des changements de bases résultant de l’instabilité chimique inhérente aux bases elles-
mêmes ou aux liaisons N-glycosidiques : ceci concerne les bases manquantes. En effet, parfois
la liaison N-glycosidique d’une purine peut être rompue spontanément à des températures
physiologiques. Ce processus est appelé dépurination. Le taux de dépurination spontanée est
d’environ une purine perdue sur 300 par jour à pH 7 et à 37°C. Ce qui conduit à la perte de
10000 purines par jour pour une cellule des mammifères ou de 0,25 purine par jour et par
75
génération pour une bactérie. Ce taux est augmenté lorsque le pH diminue ou lorsque la
température augmente.

c- des altérations résultant de l’action des agents chimiques ou environnementaux : il s’agit ici
des bases altérées. En effet, sous l’action de divers agents physiques ou chimiques, les bases
peuvent être changées en composés complètement différents. C’est le cas des radiations
ionisantes, comme les rayons γ émis par les radioisotopes naturels ou des rayons x en
laboratoire, qui peuvent casser les cycles des purines ou des pyrimidines et conduire à des
substitutions chimiques. L’altération la mieux étudiée est le dimère formé par deux
pyrimidines sous l’action des rayons UV. Le dimère de thymine est le plus remarquable de ses
dimères.

d- des cassures simple-brin : de nombreux agents sont capables de rompre les liaisons
phosphodiesters. C’est le cas des agents chimiques tels que les peroxydes, les composés ayant
un groupement sulfudril, certains ions métalliques comme Fe++, Cu++. Les radiations
ionisantes produisent aussi des cassures simple-brin. Le plus souvent, les cassures simple-brin
sont réparées par l’action de l’ADN ligase.

e- des cassures double-brin : les cassures double-brin surviennent, par exemple, lorsqu’une
molécule d’ADN comporte beaucoup de cassures simple-brin aléatoires. Deux cassures
peuvent alors être localisées en opposition chacune sur un brin. Cela entraîne la rupture de la
double hélice. Les cassures double-brin sont fréquentes lorsque les cellules sont irradiées par
des rayons γ lors de la de cancer. Généralement, les cassures double-brin ne sont pas réparées.

f- des liaisons croisées : il s’agit de la formation des liaisons covalentes entre une base située
sur un brin et une base située sur le brin complémentaire par certains antibiotiques comme la
mitomycine C ou par certains réactifs comme les ions nitrites.

Réparation de l’ADN et pathologie humaine

Certaines maladies congénitales dues au mauvais fonctionnement des systèmes de réparation


de l’ADN sont connues chez l’homme. Trois d’entre elles sont particulièrement
caractéristiques : Xeroderma pigmentosum, anémie de Franconi et Ataxia telangiectasia.
Xeroderma pigmentosum est une maladie récessive touchant les deux sexes. Elle est
caractérisée par un érythème intense des zones de peau découvertes accompagné de
télangectasies (dilatations des capillaires), de dégénerescence muqueuse, d’un retard mental et
d’une prédisposition au cancer. Dans la majorité des cas, le décès survient avant l’âge adulte,
le pronostic étant lié à l’évolution tumorale.

Les cellules semblent montrer une sensibilité normale aux rayonnements ionisants, mais une
sensibilité accrue aux UV. Une altération du système d’excision-resynthèse a pu ainsi être
mise en évidence, au niveau de l’endonucléase, ce qui se traduit par la non-réparation des
dimères pyrimidiques. Par contre, les trois enzymes intervenant après l’endonucléase dans le
système d’excision-resynthèse fonctionnent normalement, ce qui explique la réparation
normale des ruptures des chaînes dues aux rayons X par exemple.
76
L’anémie de Franconi est une affection autosomale récessive caractérisée par une
dégénerescence de la moelle osseuse (aplatsie médullaire) sur toutes les lignées cellulaires, de
multiples lésions anatomiques, un retard mental et une prédisposition aux leucémies et
cancers. La maladie atteint rarement l’âge adulte. On a également observé une plus grande
sensibilité aux rayonnements ionisants, aux UV et à certains produits chimiques. L’étude des
chromosomes a révélé que les lésions provoquées à n’importe quel moment du cycle ont pour
conséquence un taux maximal d’aberrations chromosomiques, donc sans réparation apparente.

Ataxia telangiectasia est également une maladie autosomale, principalement récessive, avec de
rares cas de dominance. Elle est particulièrement caractérisée par une ataxie cérébelleuse
(désorganisation de certains mouvements volontaires), de telangiectasies (dillatation des
capillaires) surtout occulaires, d’infections respiratoires et une prédisposition aux
lymphopathies chroniques. Les patients atteints d’A. telangiectasia sont deux à trois fois plus
sensibles aux rayonnements ionisants que les syjets normaux, avec une augmentation de la
radiosensibilité de toutes les lignées cellulaires. Toutes les cellules présentent une synthèse
d’ADN anormalement faible en phase S du cycle cellulaire et une phase prémitotique (G2)
réduite. Cependant un défaut de réparation de l’ADN n’a pu être mis en évidence.

2.2.3 REPARATION DES BASES INCORRECTRES

Il arrive que les ADN pol I et III incorporent dans l’ADN une base incorrecte, c’est-à-dire une
base qui ne peut pas s’apparier avec la base complémentaire située sur l’autre brin. De telles
erreurs sont normalement corrigées grâce aux fonctions d’édition de ces deux enzymes.
Toutefois, la nécessité de maintenir l’intégrité de la séquence nucléotidique de l’ADN est si
importante qu’il existe un second système de correction des erreurs qui auraient été oubliées
par les fonctions d’éditions. Il s’agit du système de réparation de mauvais appariements (ou
mésappariements). Dans ce système, une paire de bases non appariée est reconnue comme
incorrecte et un fragment polynucléotidique est excisé de l’un des deux brins. De ce fait, une
des composantes de la paire de bases non appariées est enlevée. La brèche résultant de
l’excision du segment simple-brin est comblée par l’ADN pol I et finalement l’ADN ligase
soude le brin nouvellement synthétisé au reste de la molécule d’ADN.

Pour ne pas être générateur d’erreurs, le système de réparation de mauvais appariements doit
être capable de distinguer la base correcte du brin parental de la base incorrecte de la molécule
fille. Cette information est donnée par la position des adénines particulières dans la séquence
GATC. Ces bases portent des groupements méthyl qu’on ne trouve nulle part ailleurs dans
l’ADN. La méthylation des bases de cette séquence est associée au processus de réplication
et s’effectue sur les molécules filles. Toutefois, elle n’est pas réalisée immédiatement au
niveau de la fourche de réplication mais quelque peu décalée. La conséquence de ce décalage
est que la molécule parentale est entièrement méthylée alors qu’il existe, au niveau de la
molécule fille, un gradient de méthylation. Ce gradient ayant son maximum au niveau de la
fourche de réplication.

Le système de réparation de mauvais appariements fait la distinction entre les degrés de


méthylation de chaque brin et quand il trouve un mauvais appariement, il excise
préférentiellement les nucléotides du brin le moins méthylé, qui correspond au brin
77
néosynthétisé. Ainsi, le brin parental sert toujours de matrice et permet au système de
réparation de corriger les bases incorrectes. Ce système de réparation de mauvais
appariements est aussi important pour une autre raison. Certaines molécules, appelées
analogues des bases, peuvent être incorporées dans l’ADN sans être reconnues par les
fonctions d’édition. Prenons l’exemple d’une base pouvant se présenter sous une forme énol
et sous une forme cétone et qui ne peut s’apparier avec une base standard que sous une seule
forme.

Imaginons une situation où l’équilibre énol-cétone se trouve déplacé en faveur de la forme


énol. Sous cette forme, cette base peut s’apparier avec par exemple la cytosine. Elle va donc
pouvoir être substituée à une guanine et être incorporée dans l’ADN. Sous sa forme énol, elle
s’apparie correctement avec une cytosine et n’est pas reconnue comme incorrecte par les
fonctions d’édition. Si cette base intégrée reprend la forme cétone par la suite, elle va créer, à
son niveau, un mauvais appariement, générateur de mutations. La cytosine peut quelquefois
perdre un groupement amine (désamination) et se transformer en uracile. Après un cycle de
réplication, cette transformation devrait conduire au remplacement d’une paire G-C par une
paire A-U qui deviendrait une paire A-T à l’issue d’un nouveau cycle de réplication. Ce
remplacement pouvant être mutagène, la cellule a mis au point un mécanisme permettant de
remplacer l’uracile non désirée par une cytosine.

La première étape de ce processus de réparation consiste à l’excision de l’uracile par une


enzyme, l’uracile N-glycosylase. Cette enzyme clive la liaison N-glycosidique en laissant le
désoxyribose dans le squelette de la molécule. En effet l’uracile N-glycosylase reconnaît les
bases uraciles dans l’ADN et les élimine en coupant la liaison N-glycosidique entre la base et
le désoxyribose, créant ainsi des sites apyrimidines ou apuriniques dits sites AP. Une seconde
enzyme, l’acide apurinique (AP) endonucléase fait une seule coupure, libérant une des
extrémités du désoxyribose. Il s’ensuit l’excision du désoxyribose et de quelques nucléotides
adjacents. Après quoi l’ADN pol I comble la brèche en incorporant des nucléotides corrects.
En enffet les endonucléases AP reconnaissent les sites AP et enlève le fragment d’ADN les
renfermant.

Il existe plusieurs autres ADN glycosylases capables de reconnaître des bases désaminées ou
altérées. Lorsque la cytosine est méthylée, sa désamination forme la thymine qui ne peut être
ni reconnue ni corrigée par ce mécanisme. Dans ce cas, la correction de l’erreur est réalisée
par le même mécanisme que pour les mésappariements. La chaleur, les acides et certaines
enzymes peuvent entraîner une perte de base, créant ainsi un site AP. La correction s’effectue
alors par le même procédé d’excision que celui décrit ci-dessus.

2.2.4 REPARATION DES ALKYLATIONS

Des groupements méthyle ou éthyle peuvent être transférés par des agents alkylants sur des
bases ou des phosphates de l’ADN. Ainsi la guanine peut être transformée en O-6-
méthylguanine qui de ce fait peut s’apparier par erreur avec la thymine. La réparation de cette
méthylation s’effectue de manière directe (c’est-à-dire sans coupure d’ADN) par une enzyme
spécifique, la O-6-méthylguanine méthyltransférase, qui transfère le groupement en question
de la base vers l’un de ses acides aminés. L’enzyme de réparation ainsi elle-même alkylée est
78
irréversiblement inactivée. De ce fait pour chaque réparation, une molécule de
méthyltransférase est sacrifiée.

2.2.5 REPARATION DES DIMERES DE THYMINE

Sous l’action des rayons UV, deux résidus de thymine adjacents peuvent être reliés par des
liaisons covalentes. Ces liaisons sont considérablement plus courtes que l’espace séparant les
deux thymines adjacentes. Pour cette raison, la formation d’un dimère de thymine entraîne
l’apparition d’une distorsion dans la structure double-brin. La forme du cycle de la thymine
est également modifiée : les doubles liaisons C = C sont transformées en des simples liaisons
C – C. Les effets les plus significatifs de la présence d’un dimère de thymine sont : a- la
distorsion de l’hélice d’ADN et b- l’appariement avec les adénines présentes sur l’autres brin
est affaibli ; ce qui entraîne un blocage de la fourche de réplication. Lorsque l’ADN pol III
arrive au niveau d’un dimère de thymine, la fourche de réplication se trouve bloquée.
Dimère de thymine

a- Formation d’un dimère de pyrimidines

b- Distorsion créée par le dimère de pyrimidines

Le dimère introduit une distorsion dans l’hélice et lorsqu’une adénine est ajoutée au brin en
croissance, l’ADN pol III réagit à cette distorsion comme s’il y avait un mésappariement ; les
fonctions d’éditions vont exciser cette adénine. Et le cycle reprend : une adénine est ajoutée
puis excisée. Ceci conduit à un blocage de l’ADN pol III au niveau du dimère. Le même
résultat peut être obtenu avec les bases altérées par des radiations ou chimiquement avec
lesquelles aucun nucléotide triphosphate ne peut plus s’apparier. Une cellule dont la synthèse
d’ADN est bloquée de façon permanente ne peut plus répliquer son ADN totalement et donc
79
ne peut plus se diviser. Il existe 4 mécanismes de réparation de dimères de thymine que l’on
peut regrouper en deux classes : 1° la réparation induite par la lumière ou photoréactivation et
2° la réparation indépendante de la lumière.

1. Réparation induite par la lumière ou photoréactivation

La photoréactivation correspond à un clivage enzymatique de dimères de thymine activé par la


lumière visible (300 à 600 nm). Une enzyme appelée enzyme de photoréactivation, l’enzyme
PR, a été isolée dans pratiquement toutes les cellules, des bactéries aux cellules animales.
L’enzyme PR par elle-même n’absorbe pas de la lumière et ne se fixe sur aucun composé
absorbant la lumière. Cependant, de façon tout à fait inconnue, le complexe ADN-enzyme PR
absorbe la lumière et utilise son énergie pour cliver les liaisons c – c des anneaux cyclobutyle.

2. Réparation indépendante de la lumière

Trois mécanismes distincts peuvent accomplir la réparation indépendante de la lumière : 1°


l’excision des bases endommagées par le mécanisme d’excision- réparation, 2° la
reconstitution d’une molécule d’ADN fonctionnelle à partir du brin non endommagé par le
mécanisme de réparation par recombinaison et 3° le système indépendant de l’altération ou
réponse SOS.

Système d’excision-réparation

L’excision-réparation correspond à un processus enzymatique comprenant 4 étapes. Chez E.


coli, ces 4 étapes peuvent être résumées par couper – rapiécer – couper – souder. Dans la
première étape, l’étape d’excision, une endonucléase reconnaît la distorsion introduite par la
présence d’un dimère de thymine et coupe l’ADN en avant de la partie endommagée, au
niveau du squelette de pentoses-phosphates.

Réparation par excision d’un dimère de thymine

Au site d’excision, il existe maintenant un groupement 5’- P du côté du dimère et un


groupement 3’-OH libre qui est reconnu par l’ADN pol I. Celle-ci synthétise un nouveau brin
en déplaçant le segment d’ADN qui porte le dimère de thymine d’environ 20 nucléotides (2e
étape). Ce segment est ensuite excisé (3e étape). L’étape finale correspond à la ligation du
segment néosynthétisé au brin d’origine par l’ADN ligase.
80
Réparation par recombinaison

Deux mécanismes permettent de poursuivre la synthèse d’ADN au-delà de dimères de


thymine : l’initiation post-dimérique, responsable de la réparation par recombinaison et la
synthèse transdimérique, responsable de la réparation par le système SOS. Les systèmes de
réparation par excision-resynthèse sont responsables de la correction de la majorité de dimères
de thymine. Toutefois ces dimères peuvent, avant d’avoir pu être réparés, interférer avec un
grand nombre de processus cellulaires. Ces dimères persistants sont éliminés par le processus
de réparation par recombinaison qui repose sur des échanges génétiques. Une façon de
s’accommoder du blocage de la synthèse de l’ADN par un dimère de thymine est de le
dépasser et d’aller initier la réplication plus loin. C’est ce qu’on appelle initiation post-
dimérique.
Synthèse postdimérique

Ce mécanisme seul ne permet pas la production de cellules viables puisque le brin possédant
les dimères de thymine continuera à donner des brins troués. Le mécanisme de recombinaison,
appelé échange simple-brin, va reconstituer des molécules d’ADN double-brin complètes.
L’idée essentielle de l’échange simple-brin est qu’un segment d’ADN simple-brin sans défaut
va être excisé du brin correct sur le segment d’ADN homologue et inséré au niveau de la
brèche créée par la présence d’un dimère de thymine.

Réparation par recombinaison

De telles initiations post-dimèriques se produisent après une pose d’environ 5 secondes par
dimère de thymine, mais le mécanisme responsable, qui paraît être indépendant de la présence
d’une amorce, est inconnu. Le résultat de ce processus est que les brins néosynthétisés ont de
larges trous, un par dimère de thymine non excisé. L’action combinée de l’ADN pol I et de
81
l’ADN ligase permet de lier ce segment aux régions adjacentes et ainsi de combler la brèche.
La brèche formée sur la molécule donneuse par l’excision est également comblée par l’action
combinée de l’ADN pol I et de l’ADN ligase. Si cet échange et le comblement de la brèche
sont réalisés au niveau de chaque dimère, il en résulte deux simple-brins néosynthétisés
complets. Chacun va pouvoir servir de matrice pour synthétiser des molécules d’ADN
normales au prochain cycle de réplication. Il convient de noter que ce système sera inefficace
si les deux dimères de thymine sont très proches l’un de l’autre, puisque les segments des brins
frères non endommagés ne seront pas disponibles pour être excisés. Les détails moléculaires
du processus de réparation par recombinaison ne sont pas connus avec précision.

La réparation par recombinaison est un mécanisme qui permet d’éliminer la nécessité de


bloquer la réplication pendant des heures afin de permettre aux mécanismes d’excision-
resynthèse d’éliminer des dimères de thymine. La réparation par recombinaison a été
observée chez les bactéries, mais on ne sait pas si elle existe dans les cellules des mammifères.
Comme elle se produit après la réplication de l’ADN, par opposition à la réparation par
excision-resynthèse, la réparation par recombinaison est souvent qualifiée de réparation post-
réplicative.

Radiorésistance de certaines bactéries : cas de la bactérie Deinococcus radiodurans

La particularité de cette bactérie est de résister de façon surprenante aux radiations : elle
supporte des rayonnements 1000 fois supérieurs à ceux qui peuvent tuer un homme. Alors
qu’une dose de 10 grays (Gy) est mortelle pour l’homme, il faut 100 Gy pour tuer la bactérie
E. coli ; Deinococcus radiodurans résiste pour sa part à plus de 10.000 Gy. Les raisons de la
résistance de cette bactérie aux rayonnements sont doubles. Elle est d’abord dotée d’un
système de réparation enzymatique de l’ADN particulièrement efficace. Juste après
l’irradiation, la réplication de l’ADN se trouve bloquée pour que la bactérie puisse utiliser un
processus de réparation dit de recombinaison multiple. Elle découpe les morceaux intacts d’un
chromosome endommagé et les recombine avec d’autres morceaux indemnes, reconstituant
ainsi un chromosome fonctionnel. Elle possède d’autre part une capacité exceptionnelle à
supporter l’action prolongée de l’oxygène, très dommageable pour l’ADN.

Les propriétés de Deinococcus radiodurans sont exploitées dans le traitement de déchets


radioactifs contenant des solvants toxiques, organiques ou chlorés. La bactérie dégrade
(pendant plus de 30 heures) le chlorobenzène, qu’elle utilise comme source de carbone et
d’énergie, dans un milieu où le débit de dose des rayonnements est de l’ordre de 60 Gy/h, alors
que E. coli ne se développe pas dans de telles conditions d’irradiation.

Système SOS

Le système SOS est un système permettant à la synthèse de se poursuivre au prix de la fidélité


de la réplication. C’est un processus générateur d’erreurs. En effet, lorsque deux brins d’ADN
intacts sont formés, ceux-ci contiennent des bases incorrectes. Le principe de ce système est
qu’il vaut mieux survivre avec des erreurs que de ne pas survivre du tout. Ce système
entraîne un relâchement des fonctions d’édition de façon à permettre la poursuite de la
82
synthèse d’ADN en dépit de la distorsion de l’hélice provoquée par la présence d’un dimère de
thymine ; on parle de synthèse transdimérique.

On sait maintenant que ce système SOS est la cause principale de mutations induites par les
rayons UV. Le système SOS est caractérisé par sa dépendance absolue vis-à-vis d’un gène
recA fonctionnel. Le produit du gène recA a une double fonction : 1° il a un rôle de régulation
et 2° il intervient directement sur les processus d’édition. La protéine RecA se fixe fortement à
l’ADN simple-brin, mais seulement très faiblement sur l’ADN double-brin. La distorsion
résultant de la présence d’un dimère de thymine produit une courte région stable d’ADN
simple-brin sur laquelle recA va se fixer.

Lorsque l’ADN pol III rencontre une région avec un dimère sur laquelle RecA est fixée, une
des sous-unités de l’ADN polymérase, celle qui est responsable de la fonction d’édition,
interagit avec la protéine RecA. Cette interaction inhibe la fonction d’édition, évitant ainsi
l’excision du nucléotide apparié au dimère et permet la progression de la fourche de
réplication. L’inhibition des fonctions d’édition par la présence de RecA sur le site du dimère
entraîne la non correction de mauvais appariements sur le brin néosynthétisé et donc la
formation de mutations.

Chapitre 3

EXPRESION DE L’ADN

Considérons une maladie humaine, la mucoviscidose. Il s’agit d’une anomalie due à la


présence d’un allèle déficient d’un seul gène. Cette maladie est si grave que dans le passé, elle
83
tuait généralement les malades dans leur enfance. Les symptômes affectent de nombreuses
parties du corps. Un des symptômes principaux est une sueur excessivement salée, mais la
cause la plus fréquente du décès est un blocage des voies aériennes par un type de mucus
inhabituellement épais. C’est donc qu’à l’évidence le gène concerné assure une fonction
essentielle au déroulement de la vie humaine. En fait, la fonction des gènes est un élément clé
pour comprendre cette maladie héréditaire et des milliers d’autres maladies qui affectent la
santé et peuvent conduire à une mort prématurée. Un gène étant défini comme une région de
l’ADN responsable de la réalisation d’un caractère spécifique.

Deux processus de transfert d’information constituent les fonctions de l’information génétique


contenue dans la molécule d’ADN : 1° au cours de la réplication, l’information génétique est
recopiée pour produire davantage d’ADN et 2° l’information génétique peut en outre être
traduite en protéines. L’expression des gènes correspond à un transfert de l’information
génétique de l’ADN à l’ARN, puis de l’ARN aux protéines. Les molécules d’ARN sont
synthétisées en utilisant la séquence nucléotidique de l’un des deux brins de l’ADN comme
matrice dans une réaction de polymérisation catalysée par des ARN polymérases. Le processus
par lequel les molécules d’ARN sont synthétisées est appelé transcription.

3.1 TRANSCRIPTION

Les produits initiaux de tous les gènes sont les acides ribonucléiques (ARN). L’ARN est donc
fabriqué au cours d’un processus qui copie la séquence nucléotidique de l’ADN. Puisque ce
processus rappelle la transcription (copie) des documents écrits, la synthèse de l’ARN est
appelée transcription. On dit que l’ADN est transcrit en ARN et on appelle l’ARN un
transcrit. On peut ainsi considérer l’ADN comme un manuel d’instructions nécessaires pour
produire tous les ARN dont la cellule a besoin, l’ARN étant la copie, qui peut être perdue, des
parties du manuel concernant la réalisation d’une tâche donnée.

3.1.1 DIFFERENTES CLASSES D’ARN

Les ARN peuvent être regroupés en deux grandes classes, les ARN informationnels et les ARN
fonctionnels. Les ARN informationnels sont des intermédiaires dans le processus de décodage
des gènes en chaînes polypeptidiques, tandis qu’un ARN fonctionnel constitue le produit final
fonctionnel. Pour la plupart des gènes, l’ARN est seulement un intermédiaire dans la synthèse
du produit fonctionnel final, qui est une protéine. L’ARN informationnel de cette majorité de
gènes est toujours un ARN messager (ARNm). Chez les procaryotes, le transcrit qui est
synthétisé sans modification à partir de l’ADN, appelé aussi le transcrit primaire, est l’ARNm.
Chez les eucaryotes en revanche, le transcrit primaire subit une maturation. Il s’agit de
modifications au niveau de ses extrémités 5’ et 3’ et du retrait de certains éléments du transcrit
primaire (introns). A la fin de cette maturation du pré-ARNm, un ARNm est produit.

La séquence des nucléotides dans l’ARNm est convertie en une séquence d’acides aminés
appartenant à une chaîne polypeptidique par un processus appelé traduction. Dans ce cas, le
mot traduction est utilisé dans le sens de traduction d’une langue étrangère. En effet, la cellule
dispose d’un moyen pour traduire le langage de l’ARN dans le langage des polypeptides. Les
protéines sont constituées d’une ou plusieurs chaînes polypeptidiques.
84

Les ARN fonctionnels remplissent de nombreux rôles. Ils ne sont cependant jamais traduits en
polypeptides. Chaque classe d’ARN fonctionnels est codée par un nombre relativement faible
de gènes (de quelques dizaines à quelques centaines). Les principales classes d’ARN
fonctionnels interviennent dans différentes étapes du traitement informationnel de l’ADN en
protéine. Deux de ces classes d’ARN fonctionnels se rencontrent chez tous les organismes. Il
s’agit des ARN de transfert (ARNt) et des ARN ribosomaux (ARNr).

Les molécules d’ARNt agissent comme des transporteurs qui apportent des acides aminés à
proximité de l’ARNm au cours du processus de traduction. Les ARNt sont des composants
généraux de la machinerie de traduction. Ils peuvent apporter des acides aminés à l’ARN de
tout gène codant une protéine. Les ARNr sont des composants des ribosomes. Ceux-ci sont
de gros ensembles macromoléculaires qui servent de guide pour coordonner l’assemblage de
la chaîne d’acides aminés d’une protéine. Les ribosomes sont constitués de plusieurs types
d’ARNr et d’environ 100 protéines différentes. Comme les ARNt, les ARNr sont les
composants traductionnels généraux qui peuvent être utilisés pour traduire l’ARNm de
n’importe quel gène codant des protéines.

Deux autres classes d’ARN fonctionnels impliqués dans le traitement de l’information sont
spécifiques des eucaryotes. Les petits ARN nucléaires (ARNpn, en anglais ARNsn pour small
nuclear ARN), sont impliqués dans l’épissage de pré-ARNm en ARN messagers dans le noyau
des cellules eucaryotes. Plusieurs ARNpn différents, associés à plusieurs sous-unités
protéiques, forment un assemblage macromoléculaire appelé une PRNpn (petite particule
ribonucléoprotéique nucléaire ; en anglais snRNP pour small nuclear ribonucleoprtein
particle).

Les petits ARN cytoplasmiquues (ARNpc) sont impliqués dans le mouvement des protéines à
l’intérieur de la cellule eucaryote. Plus fréquemment, ils garantissent que des polypeptides
destinés par exemple à être sécrétés hors de la cellule, soient insérés dans un des
compartiments membranaires de la cellule (le réticulum endoplasmique). Ceci débute le
processus de sécrétion protéique. Toutes les fonctions de l’ADN et des ARN sont basées sur
deux éléments clés : 1- les bases complémentaires de chaînes nucléotidiques simples-brins
peuvent s’associer par des liaisons hydrogène pour former des structures doubles-brins, 2- des
séquences de bases particulières appartenant à des acides nucléiques simple-brin peuvent être
reconnues par des protéines spécifiques qui se lient aux acides nucléiques.

Il existe ainsi deux types de gènes : ceux qui codent des protéines (en majorité) et ceux qui
codent des ARN fonctionnels. Les opérations sur l’ADN et sur l’ARN sont basées sur la
complémentarité des séquences des bases et sur la fixation à des sites spécifiques de diverses
protéines de liaison aux acides nucléiques.

3.1.2 SYNTHESE ENZYMATIQUE DES ARN

Il est bien connu aujourd’hui que la séquence d’acides aminés d’une chaîne polypeptidique est
déterminée par la séquence de bases spécifiques de l’ADN. Or, dans une cellule eucaryote,
l’ADN se trouve dans le noyau, alors que les protéines sont synthétisées dans le cytoplasme. Il
85
devrait exister un autre acide nucléique qui jouerait le rôle d’intermédiaire. Les expériences de
cytochimie ont permis de montrer qu’il existe, pour un tissu déterminé, une corrélation entre la
quantité d’ARN et l’activité de synthèse des protéines. Ces observations, les premières à
impliquer les ARN dans la synthèse des protéines, furent à l’origine d’un grand nombre de
travaux sur le rôle des ARN. Il convient de noter que les premiers indices de la manière dont
l’ADN régit la synthèse des protéines furent obtenus grâce à l’étude des bactériophages.

Les expériences de marquage avec chasse permettent de suivre au cours du temps une
population de molécules d’ARN synthétisées pratiquement simultanément. Ces expériences
ont montré qu’au moment de marquage, la radioactivité se trouve uniquement dans le noyau.
Dans les échantillons prélevés après la chasse, l’ARN marqué est localisé dans le cytoplasme.
Ces expériences consistent à ce que l’ARN synthétisé pendant une courte période de temps est
soumis à un bref marquage en présence des précurseurs radioactifs de l’ARN, suivi d’une
chasse par des précurseurs non radioactifs. L’ARN est synthétisé dans le noyau et migre
ensuite vers le cytoplasme.

En 1957, E. Volkin et al. ont observé que l’un des événements moléculaires les plus
significatifs qui suivent l’infection d’E. coli par le phage T2 est une bouffée de synthèse
d’ARN. Les bactéries infectées sont d’abord marquées à l’uracile radioactive, puis soumises à
une chasse en présence d’uracile froide. L’ARN isolé peu après le marquage est radioactif,
mais celui que l’on récupère un peu plus tard, après la chasse n’est pas marqué. Cela montre
que l’ARN a un temps de demi-vie très court. Dans le cadre conceptuel élaboré par F. Jacob et
J. Monod, cet ARN devait devenir le messager, c’est-à-dire la matrice qui fixe les acides
aminés dans les protéines. L’ARN polymérase est une des plus grandes enzymes connues.
Elle est constituée de cinq sous-unités : α, α, β, β et σ.

Fixation de l’holoenzyme ARN polymérase

3.1.3 POLYMERISATION

Les caractéristiques essentielles de la synthèse des ARN sont les suivantes : a- Les
précurseurs de la synthèse des ARN sont les 4 ribonucléoside-triphosphates (NTP) : ATP,
GTP, CTP, UTP ; b- La réaction de polymérisation est identique à celle se produisant lors de
la synthèse d’ADN ; c- La séquence de bases de la molécule d’ARN est déterminée par la
séquence de bases de l’ADN ; d- Une seule chaîne de la molécule d’ADN double-brin est
86
transcrite ; e- Une molécule d’ARN est synthétisée dans le sens 5’ vers 3’. Les nucléotides
sont ajoutés seulement à l’extrémité 3’-OH de la chaîne en croissance. De plus, le brin d’ARN
et le brin d’ADN sont anti-parallèles ; f- Les ARN polymérases sont capables d’initier la
croissance d’une chaîne. Elles n’ont pas besoin d’une amorce ; g- La synthèse d’ARN utilise
seulement des ribonucléoside-5’-triphosphates. L’extrémité 5’ d’une molécule d’ARN en
croissance possède un groupement triphosphate libre ; h- Les ions Mg++ sont nécessaires à
toutes les enzymes de polymérisation des acides nucléiques. Le processus de synthèse
d’ARN peut être décomposé en 4 étapes : fixation de l’ARN polymérase sur l’ADN double-
brin au niveau d’un site spécifique, initiation, élongation de la chaîne et la terminaison et
libération de la chaîne d’ARN.

Fixation et initiation

La première étape de la transcription est la fixation de l’ARN polymérase sur la molécule


d’ADN. Cette fixation est réalisée au niveau des régions de l’ADN qui signalent le début de la
transcription et appelées promoteurs, qui correspondent à des séquences spécifiques de 20 à
200 bases. Deux régions d’homologie apparaissent dans pratiquement tous les cas : les régions
–35 et –10 d’après leur localisation par rapport au site d’initiation de la transcription. La
région –10 est la séquence d’orientation de l’ARN polymérase, permettant à la synthèse de
s’effectuer de la gauche vers la droite. Elle est également la région où la double hélice s’ouvre
pour former le complexe enzyme-ADN ouvert. La séquence –35 est localisée à environ 35
bases en amont du site initial de fixation de l’ARN polymérase.

Le facteur σ, la sous-unité dissociable de l’ARN polymérase, permet à cette polymérase de


reconnaître et de se lier spécifiquement aux promoteurs. Tout d’abord, l’holoenzyme cherche
le promoteur et, dans un premier temps, s’y lie de manière relativement lâche en reconnaissant
les régions –35 et –10. La structure qui en résulte est un complexe fermé au promoteur.
Ensuite, l’enzyme se lie plus solidement et sépare les bases au voisinage de la région –10.
Une fois que la polymérase liée a provoqué cette dénaturation locale, on dit qu’un complexe
ouvert au promoteur s’est formé. Cette étape d’initiation conduisant à la formation d’un
complexe ouvert exige le facteur σ. En fait la sous-unité σ se fixe en premier au niveau de la
séquence –35, puis grâce à la grande taille de l’enzyme, la région appropriée de la polymérase
peut entrer en contact avec la région –10.

Une fois le complexe enzyme-promoteur ouvert formé, l’ARN polymérase est prête à initier la
synthèse. Pour ce faire, l’ARN polymérase dispose de deux sites de fixation de nucléotides
appelés site d’initiation et site d’élongation. Le site d’initiation fixe uniquement des purines
triphosphates. L’ATP est le plus souvent le premier nucléotide de la chaîne. Ainsi la première
base de l’ADN transcrite est le plus souvent une thymine. Le nucléotide d’initiation se fixe
sur l’enzyme dans le complexe enzyme-promoteur et forme une liaison hydrogène avec la
base complémentaire sur l’ADN. Le site d’élongation est ensuite rempli avec un nucléoside
triphosphate qui est sélectionné par sa capacité à former des liaisons hydrogènes avec la base
suivante du brin d’ADN. Les deux nucléotides sont ensuite liés l’un à l’autre. La première
base est libérée du site d’initiation et ainsi l’initiation est complète. Toutefois le dinucléotide
reste relié par des liaisons hydrogène à l’ADN.
87

Elongation

La phase d’élongation commence lorsque l’ARN polymérase libère la base d’initiation et se


déplace le long de la chaîne d’ADN. Après addition de plusieurs nucléotides
(approximativement huit) à la chaîne en croissance, l’ARN polymérase modifie sa structure et
perd sa sous-unité σ. Ainsi la plus grande partie de l’élongation est réalisée par l’enzyme
cœur. L’enzyme cœur se déplace le long de la molécule d’ADN et fixe le nucléoside
triphosphate capable de s’apparier avec la base suivante du brin d’ADN. La région ouverte
s’étend seulement sur un petit nombre de paires de bases, car l’hélice d’ADN se referme après
le passage de l’enzyme. Les liaisons hydrogènes entre la molécule d’ARN et la molécule
d’ADN sont rompues lorsque la double hélice se reconstitue. Ainsi il n’y a, durant la synthèse
d’ARN, que quelques bases de l’ARN appariés à la matrice d’ADN.

Terminaison

La terminaison de la synthèse de l’ARN se produit au niveau de séquences spécifiques de la


molécule d’ADN. Trois régions importantes ont été observées dans ces séquences : a. Une
séquence répétée inversée contenant une région centrale non répétée : ABCDEF-XYZ-
F’E’D’C’B’A’ dans laquelle A et A’, B et B’, etc, sont des bases complémentaires. Ainsi
cette séquence est capable de former un appariement intrabrin dans le transcrit, conduisant à
une structure en épingle à cheveux (palindrome) ; b. La seconde région est localisée dans
l’épingle à cheveux. Elle est composée d’une séquence en G + C ; c. Une troisième région
(facultative) est représentée par une séquence de paires de A–T. Cette séquence conditionne
l’apparition, au niveau de l’ARN, d’une séquence composée de 6 à 8 uraciles, suivies le plus
souvent par une adénine. L’étape finale du processus de terminaison est la séparation du
complexe enzyme cœur, ARN et ADN. A la suite de cet événement, l’enzyme cœur interagit
ave une sous-unité σ libre pour reformer l’holoenzyme, de nouveau disponible pour initier une
synthèse.

Séquences nucléotidiques (a) du site de terminaison de la transcription de l’opéron


tryptophane de E. coli et (b) de l’extrémité 3’ de l’ARNm.
88

3.1.4 COMPLEMENTARITE ET ASYMETRIE DE


LA SYNTHESE DE L’ARN

Les similitudes de l’ADN et de l’ARN suggèrent que la transcription est fondée sur la
complémentarité des bases, qui est aussi la clé de la réplication de l’ADN. L’ARN
polymérase, l’enzyme de la transcription, effectue la transcription d’une manière qui
ressemble beaucoup à la réplication. Ce modèle de transcription est confirmé par les données
cytologiques. Le fait que l’ARN puisse être synthétisé avec l’ADN comme matrice est
également démontré par la synthèse in vitro de l’ARN à partir des nucléotides en présence
d’ADN et d’une ARN polymérase extractible. Quelque soit la source de l’ADN utilisé, l’ARN
synthétisé possède un rapport (A+U/G+C) analogue au rapport (A+T /G+C) de l’ADN. Cette
expérience montre que la fréquence des paires A-T dans la séquence de l’ADN se reflète
exactement dans le contenu d’(A+U) dans l’ARN. En réalité, diverses preuves d’ordre
chimique confirment qu’en général la transcription se produit sur un seul brin, mais pas
nécessairement sur le même pour tout le chromosome. Ceci a été démontré par des
expériences d’hybridation.

J. Marmur et al. ont réussi à séparer les brins de l’ADN du phage SP8 de B.subtilis. Ils
dénaturèrent l’ADN, le refroidirent rapidement pour éviter sa renaturation et séparèrent ensuite
les brins dans le CsCl (chlorure de césium). Ils montrèrent que l’ARN de SP8 ne s’hybride
qu’avec un seul des deux brins, ce qui prouve que la transcription est asymétrique, c’est-à-dire
qu’elle ne s’effectue que sur un seul brin d’ADN. Bien que pour chaque gène l’ARN ne soit
synthétisé que sur un seul brin d’ADN à la fois, le même brin n’est pas nécessairement
transcrit tout le long du chromosome ou pendant toutes les phases du cycle de vie. L’ARN
produit à différents stades du cycle d’un phage s’hybride à différentes parties du chromosome,
ce qui montre que les gènes distincts sont activés à chaque stade. Le brin matrice de l’ADN
pour un ARN messager donné est appelé brin sens. Le brin d’ADN complémentaire est appelé
brin anti-sens. L’ARN messager a la même séquence que le brin antisens.

3.1.5 TRANSCRIPTION CHEZ LES EUCARYOTES

Les caractéristiques de bases de la transcription et de la structure des ARNm eucaryotes sont


similaires à celles des ARN bactériens. Il existe cependant 5 différences importantes : 1- les
cellules eucaryotes contiennent 3 ARN polymérases nucléaires différentes, responsables de la
synthèse de différentes classes d’ARN ; 2- la plupart des ARNm ont une durée de vie assez
89
longue ; 3- les extrémités 5’ et 3’ sont modifiées : une structure complexe, appelée coiffe
(cap), se trouve à l’extrémité 5’ des molécules d’ARNm. Leur extrémité 3’ est composée
d’une longue queue d’acide polyadénilique (polyA) ; 4- la molécule d’ARNm utilisée comme
matrice lors de la synthèse de protéines représente fréquemment un dixième de la taille du
transcrit primaire. Pendant la maturation des ARNm, des séquences appelées séquences
interposées ou introns sont excisées et les fragments situés de part et d’autres de l’intron sont
joint ; 5- tous les ARNm eucaryotes sont monocistroniques.

Le fait que l’ADN soit, dans les cellules eucaryotes, sous forme d’un complexe
nucléoprotéique (la chromatine) rend la transcription plus complexe chez les eucaryotes que
chez les procaryotes. Les trois classes d’ARN polymérases d’eucaryotes sont notées I, II, III.
Elles se distinguent les unes des autres par la nature des ions nécessaires à leur activité, la
force ionique optimale et leurs différentes sensibilités aux antibiotiques. Les ARN
polymérases eucaryotes sont principalement localisées dans le noyau. On trouve néanmoins
dans les mitochondries et les chloroplastes des ARN polymérases mineures. La mise en place
de la coiffe se produit immédiatement après l’initiation de la synthèse de l’ARNm,
probablement avant que l’ARN ne quitte le site d’initiation. Elle précède l’ensemble des
événements d’excision et d’épissage.

La signification biologique de la mise en place de la coiffe n’est pas encore complètement


établie. On pense néanmoins qu’elle est nécessaire à une synthèse protéique efficace. La
coiffe doit jouer un rôle dans la protection de l’ARNm vis-à-vis de la dégradation par des
nucléases. Elle doit également fournir un site de reconnaissance à la machinerie de synthèse
protéique. La plupart des molécules d’ARNm des cellules animales sont terminées du côté 3’
par une queue de polyA, qui a été ajoutée à l’ARNm primaire par une enzyme nucléaire, la
polyA polymérase. La longueur de la queue de polyA peut varier de 20 à 200 nucléotides. La
signification de cette queue de polyA est encore inconnue. On pense néanmoins qu’elle peut
augmenter la stabilité des ARNm.

Un rôle dans l’attachement de l’ARNm à la membrane cellulaire a également été proposé.


Quelques molécules d’ARNm cellulaire n’ont pas de queue de polyA. Ceci signifie que sa
présence n’est pas indispensable à la traduction. La plupart de transcrits primaires des
eucaryotes contiennent des séquences non traduites, les introns, qui interrompent la phase
codante. Ces séquences sont excisées lors du processus de maturation du transcrit primaire en
ARNm. Les introns peuvent représenter 50 à 90 % du transcrit primaire. Les séquences
codantes, les exons, sont assemblées les unes avec les autres pour donner la molécule
d’ARNm mature. Le nombre d’introns varie considérablement d’un gène à l’autre. Pour un
gène donné, il est différent d’un organisme à l’autre. De plus, à l’intérieur d’un gène, les
introns peuvent avoir des tailles différentes. Dans de nombreux cas, ils sont plus grands que
les exons. L’épissage se produit dans le noyau après la mise en place de la coiffe et l’addition
de la queue de polyA. L’existence de cet épissage explique pourquoi le noyau contient un
grand nombre de molécules d’ARNm de tailles différentes. Les introns sont excisés un par un
et la ligation s’effectue avant l’excision de l’intron suivant.

La traduction ne se produit pas avant que la maturation soit complète. A la fin des processus
de maturation, l’ARNm mature est transporté vers le cytoplasme où il sera traduit. Ce
90
processus d’épissage nécessite une grande précision. Une erreur de coupure d’un nucléotide
peut détruire le cadre de lecture d’un ARNm. La précision du processus de clivage repose sur
la séquence de jonction intron-exon. Dans tous les gènes étudiés, les sites d’épissage
présentent des analogies de séquence.

L’existence des introns semble être un gaspillage de matériel génétique surtout si l’on tient
compte de la taille des introns par rapport à celle des exons. De nombreuses hypothèses ont
été formulées sur l’origine des introns. L’une d’elles postule que chaque intron représente la
séquence codante d’une petite protéine ancestrale. Au cours de l’évolution, des réarrangements
se sont produits, entraînant la réunion des séquences de différents gènes.
Maturation de l’ARNm chez les eucaryotes

Ce processus conduit à la formation de nouvelles protéines. Dans de nombreuses protéines, le


repliement des chaînes polypeptidiques conduit à la formation des domaines. La structure
tridimensionnelle de ces protéines est telle qu’elles apparaissent formées de plusieurs régions
indépendantes, séparées par de courts segments polypeptidiques. De plus, les sites de fixation
de protéines à sites multiples et des enzymes ayant plusieurs activités catalytiques sont souvent
localisés dans de domaines différents. Dans de nombreux cas, la séquence d’acides aminés de
chaque domaine est codée par un seul exon, suggérant que chaque domaine dérive d’une
protéine ancestrale.

3.2 TRADUCTION

Si les gènes sont les segments d’ADN et si l’ADN est simplement un enchaînement de paires
de nucléotides, comment cette succession de paires de nucléotides dicte-t-elle la séquence
d’acides aminés des protéines ? L’analogie avec un code vient immédiatement à l’esprit. La
logique élémentaire dit que si les paires de nucléotides sont les lettres d’un code, une
combinaison de lettres pourrait former des mots représentant différents acides aminés. En fait,
le code génétique est l’ensemble de séquences nucléotidiques qui correspondent à chaque
acide aminé et aux signaux de traduction.

3.2.1 CODE GENETIQUE

Le gène est un segment d’ADN dont la séquence de nucléotides détermine la séquence des
acides aminés d’un polypeptide. Trois évidences sont maintenant établies : 1. La mutation
d’un gène affecte la capacité qu’ont les organismes de synthétiser des protéines, soit qu’ils ne
puissent plus synthétiser telle ou telle protéine, soit qu’ils produisent une protéine modifiée à
tel point qu’elle en devient plus ou moins inactive. Il y a donc une relation étroite entre le
91
gène et la protéine ; 2. A la forme mutante d’un gène correspond une altération de la séquence
nucléotidique de l’ADN. De 1 + 2, on peut dire que la séquence des nucléotides régit le type
de protéine synthétisée ; 3. La forme mutante non létale d’un organisme est caractérisée par
des protéines anormales, l’anomalie étant due à l’altération de la séquence des acides aminés
qui composent la protéine. De 2 + 3, on peut dire que la structure primaire d’une protéine,
c’est-à-dire la séquence spécifique des acides aminés est déterminée par la séquence spcifique
des nucléotides du fragment d’ADN qui la contrôle.

Puisqu’il existe 20 acides aminés, il doit exister au moins 20 codons, plus les signaux
d’initiation et d’arrêt de la synthèse protéique. Si tous les codons ont le même nombre de
bases, chaque codon doit avoir au moins 3 bases. On peut supposer que chaque base de
l’ARNm correspond à un acide aminé. Or il y a 4 bases dans l’ARNm et 20 acides aminés.
Avec une combinaison de deux bases, on aura 4 x 4 = 16 combinaisons. Ce qui ne correspond
pas aux 20 acides aminés. En considérant une combinaison de trois bases, on peut obtenir 4 x
4 x 4 = 64 combinaisons possibles.
Code génétique

En fait, le code génétique est un tableau de correspondance composé de triplets appelés codons
et la totalité de 64 codons possibles est porteuse d’information. De plus, dans les molécules
d’ARNm en cours de traduction, les codons ne se chevauchent pas mais sont lus
séquentiellement. Les caractéristiques du code génétique sont :

1. A part la méthionine et le tryptophane, qui sont codés par un seul codon, tous les autres
acides aminés sont représentés par plusieurs (de 2 à 6) codons synomymes : arginine, sérine et
leucine sont codés par 6 codons. De plus, des codons multiples correspondant à un seul acide
aminé diffèrent le plus souvent par un seul nucléotide. C’est le cas par exemple des codons
GGU, GGC et GGG qui codent pour la glycine. Pour ces raisons, le code génétique est dit
redondant ou dégénéré. L’une des causes de la dégénérescence du code résulte à l’existence
de plusieurs ARNt, caractérisés par des anticodons différents our un acide aminé précis. Une
autre cause de cette dégénérescence réside peut-être dans la possibilité qu’ont certains
anticodons des ARNt de s’apparier avec plus d’un codon ;

2. Il y a 3 codons de terminaison de la synthèse protéique, appelés codons stops ou codons


non-sens : UAA, UAG, UGA ; 3. Un seul codon sert de signal d’initiation de la synthèse
protéique, le codon AUG qui code pour la méthionine. La distinction entre le codon AUG
92
d’initiation dont la fonction est uniquement de coder pour la méthionine et les autres codons
AUG situés à l’intérieur de la molécule se réalise comme suit : chez les procaryotes des
séquences de bases spéciales sont utilisées à cet effet. Les eucaryotes utilisent un mécanisme
différent. Chez quelques organismes, le codon GUG est également utilisé comme codon
d’initiation pour la synthèse de quelques protéines.

A ce jour, les mêmes correspondances acide aminé – codon ont été observées dans la très
grande majorité des organismes, des virus, des procaryotes ou des eucaryotes. Pour cette
raison, le code génétique est dit universel. Les exceptions à ce code universel ont été
principalement rencontrées dans les mitochondries. Quelques exemples illustrent bien cette
universalité du code génétique.

Exemple 1 : infection des bactéries par les phages. Lors de cette infection, la bactérie
interprète le message provenant de l’ADN du phage.

Exemple 2 : synthèse de l’hémoglobine in vitro. Si on incube des ribosomes accompagnés de


leurs ARNm extraits d’Oryctolagus cuniculus et des ARNt liés à leurs acides aminés
provenant d’E. coli, il se fait la synthèse d’un polypeptide dont la structure est celle de
l’hémoglobine d’Oryctolagus cuniculus. Les ARNt bactériens interprètent donc correctement
le message génétique d’un mammifère.

Exemple 3 : culture des cellules humaines. Des cellules humaine provenant d’un malade
incapable de métabolisé le glucose. Losque ces cellules sont transformées par un phage λ
portant le gène gal+ d’E. coli, elles deviennent capables de métaboliser correctement le
galactose. Par contre, transformées par un phage λ portant le gène gal-, elles ne le peuvent pas.
Non seulement les cellules humaines peuvent traduire les codons d’ARNm de la bactérie, elles
peuvent encore transcrire l’ADN bactérien en ARNm fonctionnel. Certains gènes peuvent non
seulement être transférés avec succès d’une espèce à l’autre, mais aussi y fonctionner
correctement.

3.2.2 DIFFERENTES CLASSES D’ARN IMPLIQUEES


DANS LA SYNTHESE DES PROTEINES

Il existe trois classes principales de molécules d’ARN qui sont impliquées dans la synthèse des
protéines : les ARN messagers (ARNm), les ARN ribosomiques (ARNr) et les ARN de
transfert (ARNt). Tous sont synthétisés à partir des séquences d’ADN, mais chacun joue un
rôle différent dans la synthèse protéique.

ARN messagers (ARNm)

La séquence primaire d’une molécule d’ADN détermine la séquence d’acides aminés de


chaque chaîne polypeptidique d’une cellule. Un processus à plusieurs étapes est utilisé grâce
auquel l’information contenue dans l’ADN est convertie en une séquence d’acides aminés. Ce
processus débute avec la transcription de la séquence de l’un des brins d’ADN (brin codant),
conduisant à la synthèse d’une molécule d’ARN. C’est à partir de cette molécule, appelée
93
ARN messager, que sera obtenue, à l’issue du processus de traduction, la séquence d’acides
aminés.

Le segment d’ADN contenant l’ensemble de triplets codant pour une chaîne polypeptidique ou
phase codante ainsi que les signaux d’initiation et de terminaison s’appelle cistron. Si l’ARNm
code pour une seule chaîne polypeptidique, il est appelé ARNm monocistronique. Chez les
bactéries, une même molécule d’ARNm code souvent pour plusieurs chaînes polypeptidiques.
Dans ce cas, l’ARNm est dit polycistronique. La synthèse des protéines peut être initiée à
plusieurs centaines de nucléotides de l’extrémité 5’-P de l’ARNm.

La région de l’ARNm non traduite, située en amont de la région codante est appelée séquence
en 5’ ou séquence de tête. Cette séquence peut contenir des séquences de régulation, appelées
atténuateurs, qui contrôlent le niveau de synthèse protéique. Il existe des séquences non
transcrites du côté de l’extrémité 5’-P et du côté 3’-OH. Une molécule d’ARNm
polycistronique peut contenir des séquences intercistroniques ou espaceurs de plusieurs
centaines de nucléotides de long.

Une caractéristique importante des ARNm procaryotes est leur courte durée de vie. Il est
fréquent qu’un ARNm soit dégradé, sous l’action des nucléases, quelques minutes après sa
synthèse. Cela signifie que la synthèse continue d’une protéine particulière nécessite la
synthèse en continu de la molécule d’ARNm correspondante. Néanmoins la dégradation
rapide des ARNm peut être un avantage pour la bactérie dont l’environnement et les besoins
fluctuent fortement. La synthèse d’une protéine peut être adaptée aux besoins de la cellule,
simplement en contrôlant la transcription. Quand une cellule a besoin de cette protéine,
l’ARNm correspondant est synthétisé.
Dès que cette protéine cesse d’être indispensable, l’arrêt de la synthèse de l’ARNm suffit à
stopper la synthèse de cette protéine, puisque les molécules d’ARNm précédemment
synthétisées sont déjà dégradées.
ARN ribosomiques (ARNr)

Les protéines sont synthétisées grâce aux particules appelées ribosomes, qui contiennent des
molécules d’ARN. Chez les procaryotes, les ribosomes contiennent trois molécules d’ARN et
environ 52 protéines différentes. On y trouve également les enzymes nécessaires à
l’établissement des liaisons peptidiques entre acides aminés, un site de fixation de l’ARNm et
des sites d’introduction et d’alignement des acides aminés en attente d’assemblage dans la
chaîne polypeptidique.

Par rapport aux ARNm, les molécules d’ARN ribosomiques (ARNr) sont des molécules
stables. Un ribosome est une particule complexe, capable de mettre en contact une molécule
d’ARNm et des molécules d’ARNt chargées dans une position et une orientation appropriées,
de telle sorte que la séquence nucléotidique de l’ARNm soit traduite en une séquence d’acides
aminés. Tous les ribosomes contiennent deux sous-unités. Pour des raisons historiques, les
ribosomes intacts et les sous-unités sont caractérisés par des nombres représentant leur vitesse
de sédimentation. Chez les procaryotes, la particule ribosomique intacte est appelée ribosome
70 S et les sous-unités, qui sont inégales en taille et en composition, sont appelées 30 S et 50 S
(s est l’unité de mesure du taux de sédimentation). Les sous-unités 30 S et 50 S sont
94
composées de molécules d’ARN et des protéines. Chaque sous-unité 30 S contient une
molécule d’ARNr 16 S et 21 protéines différentes. La sous-unité 50 S contient deux
molécules d’ARNr : une molécule d’ARNr 5 S et une molécule d’ARNr 23 S et 32 protéines
différentes. Les molécules d’ARNr sont issues de la maturation d’un grand transcrit primaire.
De la même manière, un certain nombre de molécules d’ARNt proviennent, chez de nombreux
organismes, de la coupure de grands transcrits primaires contenant également des ARNr.

Les caractéristiques de base des ribosomes eucaryotes sont similaires à celles des ribosomes
bactériens. Les ribosomes eucaryotes sont cependant un peu plus grands. Ils sont constitués
d’un plus grand nombre de protéines différentes (environ 80) et d’une molécule d’ARNr
additionnelle. La signification biologique de ces différences est inconnue. Un ribosome
d’eucaryote typique (ribosome 80 S) est composé de deux sous-unités, 40 S et 60 S. Ces
tailles peuvent varier de plus ou moins 10 % suivant les organismes, par rapport aux
ribosomes procaryotes (bactériens) dont la taille est pratiquement identique chez toutes les
espèces examinées. Une sous-unité 40 S est constituée d’une seule molécule d’ARNr de 18 S
et d’environ 30 protéines. Une sous-unité 60 S est constituée de trois molécules d’ARNr :
une de 5 S, une de 5,8 S et une de 28 S ainsi que d’environ 50 protéines. Les ARNr 5,8 S, 18 S
et 28 S des eucaryotes correspondent aux 5 S, 16 S et 23 S des procaryotes. La contrepartie
bactérienne de l’ARNr 5 S eucaryote fait probablement partie de la séquence de l’ARNr 23 S.

ARN de transfert (ARNt)

La traduction de la séquence nucléotidique en une séquence d’acides aminés est réalisée grâce
à des molécules d’ARN particulières appelées ARN adaptateurs ou ARN de transfert (ARNt).
Ces ARNt, au nombre d’une cinquantaine, sont également considérés comme des ARN
stables. Chaque molécule d’ARNt est capable de lire spécifiquement un codon et d’amener,
au niveau d’un site particulier du ribosome, l’acide aminé correspondant. La synthèse des
molécules d’ARNt et des molécules d’ARNr est initiée au niveau d’un promoteur et terminée
au niveau d’une séquence terminatrice comme pour les ARNm. Cependant les propriétés
suivantes indiquent que les ARNt et les ARNr, à la différence des ARNm, ne sont pas des
transcrits primaires :

a- ces molécules sont terminées par un 5’- monophosphate à la place du triphosphate


existant aux extrémités de tous les transcrits primaires ;
b- les molécules d’ARNt et d’ARNr sont beaucoup plus petites que les transcrits
primaires ;
c- toutes les molécules d’ARNt contiennent d’autres bases que A, G, C et U. Ces bases
rares sont rarement présentes dans les transcrits primaires. Tous ces changements
moléculaires sont réalisés après la transcription par un ensemble de processus
regroupés sous le terme de modifications post-transcriptionnelles ou maturation ;
d- Les molécules d’ARNt, qui contiennent des bases autres que A, G, C, et U sont
obtenues à partir de différents transcrits primaires par une succession de coupures et de
modifications chimiques réalisées dans un ordre précis par plusieurs enzymes.

L’opération de décodage par laquelle la séquence nucléotidique d’un ARNm est traduite en
une séquence d’acides aminés est réalisée par des molécules d’ARNt et un jeu d’enzymes, les
95
amino-acyl-ARNt synthétases. Les ARNt sont de petites molécules d’acide nucléique simple-
brin dont la taille varie de 73 à 93 nucléotides. Leur extrémité 5’ se termine par un 5’-mono-
aussi bien que triphosphate. De plus, des séquences de bases complémentaires internes
peuvent former des régions double-brin permettant de définir une structure dans laquelle des
boucles d’ARN simple-brin sont reliées les unes aux autres par des zones d’ARN double-brin.
Trois régions de l’ARNt sont utilisées dans l’opération de décodage :

1. l’anticodon, une séquence de trois nucléotides capables de s’apparier avec la séquence d’un
codon présent sur l’ARNm. Il convient de noter qu’aucun ARNt normal n’a d’anticodon
capable de s’apparier à l’un quelconque des trois codons stops UAA, UAG, UGA. C’est la
raison pour laquelle ces codons sont dits codons d’arrêt.

2. un deuxième site sert d’attachement de l’acide aminé. Ce rôle est révolu à l’extrémité 3’-
OH de la molécule d’ARNt. L’acide aminé correspondant au codon présent sur l’ARNm
capable de s’apparier avec l’anticodon de l’ARNt est fixé covalemment à cette extrémité. Ces
acides aminés fixés sont reliés les uns aux autres pendant la synthèse protéique. Une
aminoacyl-ARNt synthétase fixe un acide aminé spécifique sur un ARNt possédant le bon
anticodon. Pour mener à bien cette opération, l’enzyme doit être capable de distinguer un
ARNt d’un autre.

3. cette distinction est réalisée à l’aide d’une région d’ARNt mal définie constituée de
plusieurs zones de la molécule et appelée région de reconnaissance.

Les différentes molécules d’ARNt et les aminoacyl synthétases sont désignées suivant le nom
de l’acide aminé qui peut être fixé à un ARNt particulier par une aminoacyl synthétase
particulière. La leucyl-ARNt synthétase, par exemple, attache l’acide aminé leucine à
l’ARNtleu. Lorsqu’un acide aminé est fixé sur l’ARNt, celui-ci est dit acylé ou chargé. Une
molécule d’ARNt acylée est désignée de plusieurs façons. Si l’acide aminé est la glycine, par
exemple, l’ARNt acylé devra être appelé glycyl-ARNt ou Gly-ARNt. Le terme non chargé
désigne une molécule d’ARNt dépourvue d’acide aminé. Comme le terme d’ARNt
malchargé désigne un ARNt portant un acide aminé incorrect.

Le plus souvent, il n’existe qu’une seule aminioacyl synthétase par acide aminé. Mais pour un
petit nombre d’acides aminés, codés par plus d’un codon, il existe plus d’une aminoacyl
synthétase. Le placement d’un acide aminé correct à la position appropriée dans la chaîne
polypeptidique requiert : 1° l’attachement de l’acide aminé correct à la molécule d’ARNt par
la synthétase et 2° la fidélité de l’appariement codon-anticodon. L’appariement codon-
anticodon repose uniquement sur la reconnaissance entre les paires de bases de l’ARNt et de
l’ARNm et que l’identité de l’acide aminé chargé sur l’ARNt n’influence pas cette
reconnaissance. Dans une expérience, l’ARNtcys était chargé avec une cystéine radioactive.
Cette cystéine a été ensuite convertie chimiquement en une alanine radioactive, conduisant à
un complexe alanyl-ARNtcys Cette molécule d’ARNt mal chargé a été ensuite utilisée dans
un système de traduction in vitro utilisant l’ARNm de la globine. Ce système est capable de
synthétiser la globine dont la séquence primaire en acides aminés est entièrement connue. A
l’issue de cette expérience, une globine marquée radioactivement a été obtenue.
96
Structure en feuille de trèfle de l’ARNt

Cette globine contenait l’alanine marquée aux positions normalement occupées par la cystéine.
Cette expérience a confirmé l’hypothèse selon laquelle l’ARNt est une molécule adaptatrice,
que la région de reconnaissance de l’acide aminé et l’anticodon étaient deux sites distincts et
que l’anticodon déterminait la position de l’insertion indépendamment de l’acide aminé
chargé. Quelques acides aminés ont des structures voisines. Cette similitude peut occasionner,
de la part des synthétases, des erreurs de chargement.

Couplage synthèse de l’ARN / synthèse du polypeptide chez les procaryotes

Si le taux d’erreurs était élevé, on peut s’attendre à l’existence d’un mécanisme d’édition
comme dans la réplication de l’ADN. La valine et l’isoleucine, par exemple, sont des acides
aminés qui peuvent être reconnus par la même aminoacyl-ARNt synthétase. L’isoleucyl-
ARNt synthétase peut former des valyl-AMP, qui vont rester liés à la synthétase. Cet
événement se produit une fois sur 225 événements d’activation. Ce qui signifie qu’une
isoleucine sur 225 est susceptible d’être remplacée par une valine. Une protéine typique
contient 500 acides aminés parmi lesquels on trouve 25 isoleucines.

Le mécanisme d’édition qui corrige l’erreur valine-isoleucine correspond à une étape


d’hydrolyse dans laquelle le valyl-AMP est clivé et ôté de l’enzyme. Cette hydrolyse est
réalisée par l’isoleucyl-ARNt synthétase elle-même. La fonction d’hydrolyse est déclenchée
par la tentative de fixation de la valine sur l’ARNtleu. Le nombre de fois où cette fonction
d’édition fait défaut, c’est-à-dire conduit à la formation d’un complexe valyl-ARNtleu, est
d’environ 1 sur 800. Ainsi la fréquence globale d’erreurs, qui correspond à la fraction des
sites de l’isoleucine occupés, dans une protéine, par une valine est de (1/225)(1/800)=
1/180000. Si toutes les mauvaises acylations ont la même fréquence, seulement 0,17 % de
protéines seront altérées.

3.2.3 SYNTHESE POLYPEPTIDIQUE CHEZ LES PROCARYOTES


97
Les modalités de la synthèse polypeptidique chez les procaryotes sont globalement identiques
à celles observées chez les eucaryotes. Chez les procaryotes, l’utilisation d’une molécule
d’ARNt spécifique de l’initiation est une caractéristique importante de l’initiation de la
synthèse polypeptidique. Cette molécule d’ARNt est acylée avec un acide aminé méthionine
modifiée, le N-formyl-méthionine (fMet). L’ARNt correspondant est appelé ARNtfMet. Les
deux ARNtfMet et ARNtMet reconnaissent le codon AUG, mais seul l’ARNtfMet est utilisé pour
l’initiation. L’ARNtfMet est acylé, dans un premier temps, avec la méthionine et une enzyme
ajoute un groupement formyl sur le groupement amine de la méthionine. Chez les eucaryotes,
la molécule d’ARNt d’initiation est également chargée avec une méthionine mais sans
formulation.

L’utilisation de ces molécules d’ARNt comme initiatrices signifie que, pendant la synthèse,
toutes les protéines procaryotes possèdent à leur extrémité –NH2 terminale une formyl-
méthionine. Ces acides aminés sont ensuite altérés ou excisés (maturation). Chez une
bactérie, la synthèse polypeptidique commence par l’association d’une sous-unité 30 S, d’une
molécule d’ARNm, d’un fMet-ARNt, de 3 protéines regroupées sous le nom de facteurs
d’initiation et d’une guanosine triphosphate (GTP). Ces molécules constituent le complexe de
préinitiation 30 S. Puisque la synthèse polypeptidique commence au niveau d’un codon
d’initiation AUG et que l’on trouve dans la séquence codante des codons AUG, il doit exister
sur l’ARNm des signaux permettant de différencier l’AUG d’initiation des autres codons
AUG. La manière dont s’effectue cette discrimination est différente chez les procaryotes et
chez les eucaryotes.

Dans les molécules d’ARNm procaryotiques, une séquence nucléotidique particulière


(AGGAGGU), appelée site de fixation du ribosome ou séquence de Shine-Dalgarno, située
près du codon AUG d’initiation, s’apparie avec la séquence complémentaire proche de
l’extrémité 3’ de l’ARNr 16 S du ribosome. Chez les eucaryotes, l’extrémité 5’ de l’ARNm
se fixe sur le ribosome, après quoi les molécules d’ARNm glissent le long du ribosome
jusqu’à ce que le codon AUG le plus proche de l’extrémité 5’ soit en contact avec le ribosome.
Après la formation du complexe 30 S de préinitiation, l’autre sous-unité du ribosome se fixe
sur le complexe pour former un complexe d’initiation 70 S. La sous-unité 50 S contient deux
sites de fixation d’ARNt, appelés le site A (aminoacyl) et le site P (peptidyl).

Lorsqu’elle se joint au complexe 30 S de préinitiation, la position de la sous-unité 50 S dans le


complexe d’initiation est telle que le fMet-ARNtfMet qui fait partie du complexe 30 S de
préinitiation, occupe le site P dans la sous-unité 50 S. Le placement de fMet-ARNtfMet dans le
site P fixe la position de l’anticodon du fMet-ARNtfMet de telle sorte qu’il peut s’apparier avec
le codon AUG d’initiation de l’ARNm. Le cadre de lecture est ainsi définitivement défini par
l’achèvement du complexe 70 S d’initiation. Une fois le site P occupé, le site A du complexe
d’initiation devient disponible pour une molécule d’ARNt dont l’anticodon est adjacent au
codon d’initiation. Après l’occupation du site A, une liaison peptidique peut se former entre la
N-formyl-méthionine et l’acide aminé adjacent à l’aide d’un complexe enzymatique, appelé
peptidyl transférase. Lorsque la liaison est formée, la N-formyl méthionine est séparé du fMet-
ARNt dans le site P. Après la formation de la liaison peptidique, une molécule d’ARNt non
chargée occupe le site P et un dipeptidyl-ARNt occupe le site A.
98
A ce niveau, il se produit trois mouvements : 1° l’ARNtfMet du site P, qui n’est plus lié à un
acide aminé, quitte ce site ; 2° le peptidyl-ARNt se déplace du site A vers le site P et 3°
l’ARNm se décale de trois bases de façon à placer le codon suivant devant le site A. Cette
étape nécessite la présence du facteur d’élongation protéique EF-G et de GTP. Il est très
probable que le déplacement de l’ARNm soit une conséquence du mouvement de l’ARNt. A
l’issue du déplacement de l’ARNm, le site A est encore disponible pour accepter une molécule
d’ARNt chargée ayant un anticodon correct. En fait l’allongement de la chaîne polypeptidique
requiert 2 molécules de GTP qui sont hydrolysés pour chaque acide aminé ajouté. Des facteurs
d’élongation EF (pour Elongation Factors) sont également indispensables. Il existe plusieurs
facteurs d’élongation : EF-Tu, EF-Ts, EF-G, etc.

EF-Tu réagit avec le GTP et l’ARNt chargé pour former le complexe aminoacyl- ARNt- GTP-
EF-Tu et place l’aminoacyl- ARNt au site A du ribosome, grâce à l’hydrolyse du GTP en
GDP. EF-Ts est un autre facteur qui participe à la régénération du complexe EF-Tu-GTP. Le
déplacement du peptidyl-ARNt du site A au site P est sous la dépendance du facteur
d’élongation G (EF-G) aussi appelé translocase. EF-G agit en s’associant au GTP et au
ribosome. Il permet la translocation et la libération de l’ARNt libre au sit P. La réutilisation de
ce fateur d’élongation nécessite l’hydrolyse du GTP en GDP et Pi.

Lorsque le codon de terminaison est atteint, il n’existe pas d’ARNt acylé capable d’occupé le
site A et ainsi l’élongation de la chaîne est arrêtée. Toutefois, la chaîne polypeptidique est
toujours attachée à l’ARNt occupant le site P. Le relargage de la chaîne est réalisé par des
protéines appelées facteurs de libération. En présence de ces facteurs, la peptidyltransférase
sépare le peptide de l’ARNt. Ainsi donc la terminaison du polypepetide comprend : le
repérage du codon d’arrêt, la rupture de la liaison ester entre le dernier ARNt et la chaîne
polypeptidique et la libération de cette dernière. Elle nécessite : a- la présence d’un codon qui
spécifie l’arrêt de l’élongation et b- l’intervention d’un facteur de dissociation RF (pour
Release Factor) capable de reconnaître le signal de terminaison de la chaîne et de favoriser la
rupture de la liaison avec ARNt et la libération de la chaîne.

Comme la chaîne polypeptidique n’était retenue sur le ribosome que par l’interaction établie
par l’ARNt au niveau du site P, elle est séparée du ribosome qui se dissocie en ses sous-unités
30S et 50S. Si l’ARNm est polycistronique et si le codon d’initiation du second peptide n’est
pas trop éloigné du codon stop du premier peptide, le ribosome 70 S ne se dissocie pas, mais
formera un complexe d’initiation avec le second codon AUG. La probabilité d’un tel
événement, au niveau du second codon, dépend de la distance entre celui-ci et le codon stop
du premier peptide. Dans certains systèmes génétiques, cette distance est si importante que la
synthèse protéique est toujours plus efficace à partir du premier codon d’initiation qu’à partir
des suivants. C’est un mécanisme qui permet de maintenir un gradient particulier entre des
protéines traduites à partir d’un ARNm polycistronique.

Chez les eucaryotes, il n’y a pas de réinitiation de la synthèse polypeptidique après la


rencontre d’un ribosome avec un codon stop. De plus, la synthèse polypeptidique chez les
eucaryotes est initiée lorsqu’un ribosome se fixe à l’extrémité de la molécule d’ARNm et
glisse le long de cet ARNm jusqu’au codon AUG. Il n’existe aucun mécanisme d’initiation de
la synthèse polypeptidique au niveau d’un autre codon AUG que le premier rencontré. Les
99
ARNm eucaryotiques sont toujours monocistroniques. Toutefois, un transcrit primaire peut
contenir les séquences codantes de plus d’une chaîne protéique. Ceci est l’arrangement le plus
fréquent chez les virus animaux.

3.2.4 ARNm POLYCISTRONIQUES

Un ARNm est dit polycistronique lorsqu’il contient les séquences codantes de plusieurs
protéines. Il possède ainsi une série de codons d’initiation et de terminaison. C’est le cas des
ARNm des procaryotes. La séquence type d’une molécule d’ARNm polycistronique codant
par exemple pour trois protéines est organisée de la manière suivante : initiation 1, protéine 1,
stop 1 – initiation 2, protéine 2, stop 2 – initiation 3, protéine 3, stop 3.
Traduction d’un ARNm polycistronique

La séquence précédant le premier codon d’initiation peut être de longueur variable allant
jusque plusieurs centaines de bases. De plus il existe ordinairement une séquence appelée
espaceur, longue de 5 à 20 bases et située entre un codon stop et le codon d’initiation qui suit.
Lorsqu’un ARNm possède la séquence codante d’une seule protéine, on parle d’un ARNm
monocistronique. C’est le cas général des ARNm des eucaryotes.

3.2.5 UNITES DE TRADUCTION

Lorsque la chaîne polypeptidique en train d’être traduite atteint une taille de 25 acides aminés,
le codon d’initiation de l’ARNm codant est complètement libre de tout ribosome. Cela permet
à un second complexe d’initiation de se former. Quand le second ribosome s’est déplacé
d’une distance égale à celle parcourue par le premier, un troisième complexe peut se former.
Ces processus de déplacement et de réinitiation se poursuivent jusqu’à ce que l’ARNm soit
couvert par des ribosomes avec une densité d’une particule 70 S tous les 80 nucléotides. C’est
cette grande unité de traduction qui est appelée « polyribosome » ou simplement
« polysome ». Sa configuration globale correspond à une série de complexes d’initiation se
déplaçant le long de l’ARNm à la même vitesse. Il s’agit de la forme courante des unités de
traduction dans toutes les cellules.

Comparé à ce que l’on obtiendrait s’ils n’existaient pas, les polysomes permettent d’obtenir un
taux global de protéines synthétisées plus élevé. De plus, le couplage traduction –
transcription permet de diminuer le délai nécessaire à la formation d’une protéine, puisque la
traduction peut commencer avant la libération des molécules d’ARNm par l’ADN. Ce
couplage permet également à la traduction de commencer avant une éventuelle dégradation
des molécules d’ARNm par des nucléases.
100

Polysome

Chez les procaryotes, les ARNm sont synthétisés suivant une direction permettant l’initiation
de la traduction avant la libération complète de l’ARNm. Ainsi le site de fixation au ribosome
est traduit en premier, suivi dans l’ordre par le codon AUG, la phase codante et enfin le codon
de terminaison. C’est pourquoi, chez les bactéries où il n’existe aucune séparation entre
l’ADN et les ribosomes, le complexe d’initiation 70 S peut se former avant la libération de
l’ARNm de l’ADN. On parle alors du couplage de la transcription et de la traduction.

Chez les eucaryotes, les ARNm sont synthétisés et maturés dans le noyau. Ils sont ensuite
transportés à travers la membrane nucléaire vers le cytoplasme où ils sont traduits au niveau
des ribosomes. Il ne peut donc y avoir couplage transcription – traduction. Il convient enfin de
noter que, puisque la traduction s’effectue dans le sens 5’→3’, une molécule d’ARNm en
cours de synthèse possède une extrémité 5’ libre.

3.2.6 MATERIEL GENETIQUE DES EUCARYOTES

En ce qui concerne le matériel génétique des eucaryotes, des observations ont permis de
montrer qu’il n’existe aucun lien entre le contenu en ADN et la taille d’un organisme.
Certaines plantes et certains amphibiens, par exemple, comportent 100 fois plus d’ADN par
noyau que l’homme. D’autres observations ont permis de mettre en évidence que, chez les
eucaryotes, le contenu en ADN du noyau est 10 fois supérieur à ce qui est nécessaire pour
coder l’ensemble des protéines.

Cela suggère que, contrairement à ce qui est observé chez les procaryotes, chez les eucaryotes
les gènes sont noyés dans une grande masse d’ADN apparemment non codant, mais dont
certaines séquences présentent une organisation particulière. On pense qu’au moins une partie
de cet ADN pourrait jouer un rôle pour le moment inconnu. Chez les mammifères les
séquences d’ADN sont hétérogènes, ce qui permet de distinguer trois types d’ADN : l’ADN
hautement répétitif (présent en un très grand nombre de copies), l’ADN moyennement répétitif
et l’ADN présent sous forme de séquences uniques. L’ADN hautement répétitif représente 10
à 15 % du génome des mammifères (quelques centaines de millions de paires de bases chez
101
l’homme). Il est non codant, sa fonction n’est pas encore connue. Il est principalement localisé
au niveau du centromère des chromosomes et correspond à l’hétérochromatine constitutive.
Ses séquences ne sont pas dispersées dans le génome mais localisées en certains points
particuliers. L’analyse des séquences de cet ADN a permis de distinguer trois types bien
définis.

Le premier type : largement majoritaire, est composé de motifs constitués de courtes


séquences (5 à 10 pb) répétées de très nombreuses fois (jusqu’à quelques centaines de milliers)
et disposées en tandem. Certaines observations ont permis de montrer que ces séquences
étaient hyperméthylées dans les cellules somatiques et hypométhylées dans les cellules
germinales. Le deuxième type correspond à des séquences répétées disposées en tandem, mais
plus longues (100 à 200 pb). Le troisième type est composé des séquences hautement
répétées dispersées (mini-satellites) situées en dehors de l’hétérochromatine constitutive.

Ces séquences ont permis de mettre en évidence les variations individuelles de la séquence
d’ADN et d’aborder tous les aspects de la filiation moléculaire : filiation entre cellules
(génétique somatique), filiation entre individus d’une même famille (pathologie génétique et
médecine légale), filiation entre individus appartenant à des populations différentes (génétique
des populations et anthropologie), filiation entre espèces différentes (phylogénie moléculaire).
L’ADN moyennement répétitif dont la majeure partie est non codante représente 25 à 40 %
du génome humain. Beaucoup plus hétérogène que l’ADN hautement répétitif, il est aussi
constitué des séquences répétées mais plus longues (100 à 1000 pb). Il s’agit d’un ADN
dispersé dans la totalité du génome. Il est tellement dispersé que si le génome est coupé au
hasard en fragments de 20 à 40 pb, plus de 90 % des fragments ont une chance de posséder
une parcelle de cet ADN. Les motifs ne sont souvent qu’imparfaitement répétés. Ils sont
siffisamment homologues pour s’hybrider, mais dans les hybrides les mauvais appariements
sont nombreux.

Une partie de l’ADN moyennement répétitif est codante. Il s’agit de l’ADN correspondant aux
gènes répétés plusieurs milliers de foiset qui codent pour des protéines dont la cellule a besoin
en grande quantité. Les principaus gènes de ce type sont les gènes des ARNr, ARNt, ARN 5S
et 7SL. Les gènes ribosomaux sont transcrits en précurseurs 45S qui, après maturation,
donneront 3 des 4 ARN du ribosome : les ARN 28S, 18S et 5,8S. Ces gènes ne sont pas
dispersés au sein du génome, mais rassemblés en batteries pouvant dépasser 200 copies.

Chez l’homme de tels gènes se retrouvent sur les bras courts des chromosomes acrocentriques
13, 14, 15, 21 et 22. Ces regroupements s’effectuent autour de l’organisateur nucléolaire. Il en
résulte une structure particulière au niveau du chromosome appelée constriction secondaire (la
constriction primaire étant le centromère). Dans la chromatine interphasique ces gènes sont
rassemblés dans la structure particulière, les nucléoles. Ceux-ci sont en nombre variable
suivant le type et l’acivité de la cellule.

La classe des gènes des ARNt, ARN 5S et 7SL comprend également les gènes codant pour
certains petits ARN retrouvés dans le noyau et le cytosol. Il existe chez l’homme plus de 200
gènes codant pour les ARN 5S, rassemblés par batteries en des points limités de la chromatine.
Dans certaines espèces comme le xénope, on peut plus de 20.000 copies des gènes codant pour
102
les ARN 5S. Les gènes des ARNt sont également organisés en groupes de gènes répétés en
tandem. On en retrouve environ 1200 chez l’homme. Les autres petits ARN sont encore moins
bien connus. Le plus souvent les gènes codant pour les protéines sont uniques ou en faible
nombre, sauf pour les gènes codant pour les histones. Ils codent pratiquement toujours pour
une protéine.

Généralement la structure d’un gène se présente de la manière suivante : le gène commence du


côté 5’ par une séquence non-transcrite dont la présence est nécessaire pour que la
transcription s’effectue qualitativement et quantitativement de manière normale. Vers – 100
par rapport au site d’initiation de la transcription commence la région dite promotrice où se
fixe l’ARN polymérase II. Vers – 70 à – 80 on retrouve souvent une séquence CAAT, où se
fixe un ou plusieurs facteurs protéiques de transcription. Vers – 25 à – 30, sauf dans de rares
cas, on retrouve la séquence TATA appelée TATA box ou Goldberg-Hogness box où se fixe
l’ARN polymérase II. La séquence TATA box est l’équivalent de pribnow box des
procaryotes (située vers – 10).

Une délétion artificielle de cette séquence entraîne la diminution du taux de transcription et la


perte de la fidélité du point exact d’initiation. Cette dernière se faisant quelques bases avant ou
après le site habituel. Vient ensuite le site d’initiation de la transription. Le plus souvent la
base correspondant à ce site est une purine. Suit une partie non codante de longueur variableet
ce jusqu’à la séuence ATG, codon méthionine, qui signale le lieu d’initiation de la tranduction.
Suivent ensuite une alternance des séquences conservées (exons) ou non (introns) dans la
version finale de l’ARNm cytosolique.

Un exon est défini comme toute séquence transcrite retrouvée dans les messagers cytosoliques.
Cependant des séquences exoniques non codantes plus ou moins longues peuvent bien exister,
en 5’ avant le codon ATG et en 3’ en aval du premier codon stop. Il est même possible de
trouver, comme dans l’oncogène cellulaire myc, un exon entier qui ne sera pas traduit. Un
exon ne correspond donc pas nécessairement à la partie codante du gène. Un intron est une
séquence transcrite éliminée par épissage au cours de la maturation du transcrit primaire. C’est
donc une séquence du transcrit primaire qui n’est pas retrouvée dans le messager cytosolique
mûr. Il n’existe aucune règle en ce qui concerne la longueur et le nombre des introns et des
exons. On sait seulement que le nombre et la longuer des exons ou des introns varient
considérablement d’un gène à l’autre.

L’un des codons stop (UAA, UGA, UAG) constitue le signal d’arrêt de la traduction. Dix à
vingt bases avant la fin du dermier exon on retrouve une séquence AATAAA, improprment
appelée séquence de polyadénylation, qui est une séquence de reconnaissance pour la coupure
du transcrit primaire. La terminaison de la transcription étant bien plus en aval, dans une
région riche en G et C, au niveau de signaux dont la nature n’est encore connue. Le gène se
termine par une région 3’ adjacente très mal connue où l’on a parfois caractérisé des séquences
régulatrices. Ainsi donc les limites des gènes sont relativement imprécises. Les tailles des
gènes sont très variables, pouvant atteindre jusqu’à 2 millions de paires de bases (gène de la
dystrophine). Il n’y a pas de relation directe entre la taille de la protéine et la longueur du gène
qui code pour elle, même si les grandes chaînes polypeptidiques correspondent à de grands
gènes.
103

3.3 REGULATION DE L’EXPRESSION DES GENES CHEZ LES PROCARYOTES

Le nombre de molécules protéiques produites par unité de temps varie d’un gène à l’autre, afin
de satisfaire les besoins de la cellule sans conduire à des synthèses inutiles. De ce fait, il existe
plusieurs mécanismes de régulation de l’expression des gènes, notamment les mécanismes de
régulation de type arrêt-marche qui permettent l’expression d’un gène au moment où les
conditions extérieures le demandent. D’autres systèmes de régulation permettent l’ajustement
de la concentration intracellulaire d’une protéine particulière en fonction des besoins imposés
par l’environnement.

En général, l’expression des gènes particuliers est contrôlée par des mécanismes qui sont
collectivement appelés régulation des gènes. Il convient cependant de noter que les systèmes
de régulation des procaryotes sont assez différents de ceux des eucaryotes. Les procaryotes
sont en général des organismes unicellulaires autonomes, qui se divisent aussi longtemps que
les conditions permettent un apport suffisant d’aliments. Leurs systèmes de régulation sont
organisés afin de permettre une croissance maximale dans un environnement particulier.

Ces stratégies s’appliquent aussi à des nombreux organismes unicellulaires eucaryotes, comme
les levures, les algues et les protozoaires. La nécessité pour les eucaryotes d’être organisés en
tissus conduit à des besoins différents de ceux des procaryotes. Dans un organisme en
développement comme un embryon, une cellule doit non seulement se multiplier mais
également subir des changements considérables dans sa forme et son métabolisme ainsi que
maintenir cet état différencié. Pendant les phases de croissance et de division cellulaire de
l’organisme, par contre, les cellules de cet organisme sont moins soumises aux pressions de
l’environnement qu’une cellule bactérienne. En effet, la composition de leur milieu de
croissance ne varie pas beaucoup au cours du temps. Ces milieux de croissance sont, par
exemple, le sang et la lymphe des animaux terrestres ou aériens, l’eau de mer pour les
animaux marins. Dans un organisme adulte, la croissance et la division de la plupart de
cellules sont arrêtées. Chaque cellule n’a donc besoin de maintenir qu’un minimum de
fonctions.

3.3.1 PRINCIPE DE LA REGULATION DES ACTIVITES DES GENES

Chez les bactéries et les phages, les systèmes de régulation du type arrêt– marche proviennent
d’un contrôle de la transcription : la synthèse d’un ARNm particulier n’est réalisée que si le
produit du gène est nécessaire, elle est bloquée si le produit du gène ne l’est plus. Par
convention, le terme arrêt de la transcription sera utilisé bien que cela puisse correspondre à un
niveau de transcription très faible. Cependant, dans le cas des spores bactériennes, la
transcription de la plupart des gènes est complètement bloquée. Dans les cellules eucaryotes,
le blocage complet de la transcription des gènes est plus fréquent, alors que chez les bactéries,
les exemples où la transcription d’un gène donné est complètement bloquée sont rares. Il
existe aussi des systèmes de régulation qui ne sont pas de type arrêt–marche. C’est le cas par
exemple des systèmes de régulation qui permettent une modulation quantitative de
l’expression d’un gène.
104
Dans les systèmes bactériens où plusieurs enzymes agissent en séquence dans une voie
métabolique, l’ensemble de ces enzymes peut être produit en même temps ou à des moments
différents. Ce phénomène, appelé régulation coordonnée, correspond au contrôle de la
synthèse d’une seule molécule d’ARNm polycistronique codant pour l’ensemble des enzymes
impliquées dans une même voie métabolique. Les mécanismes de régulation peuvent être
classés en plusieurs types. Chaque système dépend de la fonction des enzymes soumises à
cette régulation, en particulier leur appartenance à une voie de dégradation ou à une voie de
biosynthèse. Dans une voie de dégradation comportant plusieurs étapes, par exemple, la
synthèse des enzymes impliquées sera déterminée par la disponibilité de la molécule à
dégrader.

Dans une voie de biosynthèse, la synthèse des enzymes est régulée par le produit final. De
plus, une protéine peut participer à un système d’auto-régulation, même dans le cas où elle est
traduite à partir d’un ARNm monocistronique. Dans ce type de régulation, la protéine elle-
même peut inhiber l’initiation de la transcription de son ARNm. Quoique diversifiés, les
mécanismes de régulation peuvent être regroupés en deux catégories : la régulation négative et
la régulation positive. Dans un système de régulation négative, un inhibiteur présent dans la
cellule bloque la transcription. Un antagoniste de l’inhibiteur, généralement appelé inducteur,
est alors nécessaire pour initier la transcription. Dans un système de régulation positive, une
molécule effectrice active un promoteur. Aucun inhibiteur ne doit être neutralisé.

Une voie de dégradation peut être soit positivement, soit négativement régulée. Dans une voie
de biosynthèse, le produit final régule généralement négativement sa propre synthèse. Dans
des systèmes plus simples de régulation négative, l’absence du composé final augmente sa
synthèse et sa présence diminue cette synthèse.

3.3.2 SYSTEME DE REGULATION DE LA VOIE DE DEGRADATION :


OPERON LACTOSE

Chez E. coli, deux protéines sont nécessaires pour métaboliser le lactose : une enzyme appelée
β-galactosidase, qui clive le lactose (un β-galactoside) en galactose et glucose ainsi qu’une
protéine de transport appelée la perméase à lactose qui permet l’entrée du lactose dans la
cellule. Les expériences ont montré que le système d’utilisation du lactose était composé d’au
moins deux gènes : le gène lac Y, impliqué dans le transport du lactose à travers la membrane
plasmique, il correspond au gène de structure de la perméase à lactose et le gène lac Z, le gène
de structure de la β-galactosidase. Les expériences de cartographie génétique ont montré enfin
que les gènes lacZ et lacY étaient adjacents. Les observations suivantes ont permis de montrer
que le système d’utilisation du lactose était de nature arrêt – marche :

1- lorsque des cellules d’E.coli sont en croissance sur un milieu sans lactose ou sans autre β-
galactoside, les concentrations intracellulaires de β-galactosidase et de perméase sont
extrêmement faibles, c’est-à-dire à peu près une à deux molécules par bactérie. Mais lorsque le
lactose est présent dans le milieu de culture, le nombre de chacune de ces protéines
augmentent d’un facteur 105 ; 2- Lorsque le lactose est ajouté à une culture de bactéries lac+
en croissance sur un milieu sans lactose (mais aussi sans glucose), les β-galactosidase et
perméase sont synthétisées presque simultanément. L’analyse des ARNm présents dans les
105
cellules avant l’addition du lactose montre qu’il n’existe pas d’ARNm lac dans les cellules.
L’addition du lactose déclenche la synthèse des ARNm lac. Ces deux observations ont
permis de mettre en évidence deux caractéristiques du système de régulation de la voie de
dégradation du lactose : il est inductible et l’inducteur est le lactose.

Il existe des mutants synthétisant des ARNm lac aussi bien en présence qu’en absence d’un
inducteur. Ces mutants, qui ne sont plus régulés, sont dits constitutifs. Les expériences de
complémentation ont montré que ces mutants se répartissaient en deux groupes : lac I et lac
Oc. En l’absence d’un inducteur, une cellule lac I+ ne synthétise pas d’ARNm lac, tandis que
cet ARNm est synthétisé par les mutants lac I - . Le gène lac I est aussi un gène de régulation
dont le produit est un inhibiteur qui maintient le système à l’arrêt. Les mutants lac I- ne
synthétisent pas cet inhibiteur, ce qui permet au système d’être constitutivement en marche.
Les mutants lac I- sont récessifs. Les allèles sauvages (fonctionnels) du gène lac I+ sont
dominants, car dans le cas d’un diploïde partiel lac I-/lac I+, le système est régulé
normalement. Le produit du gène lac I est une protéine appelée répresseur. Il s’agit d’une
protéine qui se lie à l’opérateur et qui contrôle l’expression du gène. Le gène lac I est localisé
à côté du gène lacZ dans l’ordre suivant : lac I–lacZ – lacY.

Le gène lac O ne code pas pour un produit diffusible (comme une protéine), mais correspond
plutôt à une région non-codante de l’ADN. Ce site détermine si la synthèse du produit du gène
adjacent lacZ est inductible ou constitutive. La région lac O est appelée opérateur. Il s’agit
d’un segment d’ADN adjacent à un gène. Toutes les mutations lac O sont localisées entre les
gènes lac I et lacZ. L’ordre de quatre gènes du système lac est le suivant : lac I – lac O – lacZ
– lacY. Les mécanismes de régulation du système lac sont caractérisés par les faits suivants :

a. le système d’utilisation du lactose comporte deux sortes d’éléments : des gènes de structure
nécessaires au transport et au métabolisme du lactose et des éléments de régulation (le gène lac
I, l’opérateur lac O et le promoteur lac). L’ensemble de ces composants forme l’opéron
lactose ; b. les gènes lacZ et lacY sont transcrits en une seule molécule d’ARNm
polycistronique. Cet ARNm contient un 3e gène appelé lacA, qui code pour l’enzyme
transacétylase ; c. le promoteur initiant la transcription des gènes lacZ et lac I est situé à côté
de la région lac O ; d. la fixation du répresseur sur l’opérateur bloque l’initiation de la
transcription de l’ARNm lac ; e. le produit du gène lac I est un répresseur qui se fixe sur une
séquence d’ADN unique, l’opérateur ; f. les inducteurs stimulent la synthèse de l’ARNm lac
en se fixant sur l’opérateur, ce qui rend celui-ci inactif. Ce processus est appelé dérépression.

Ainsi en présence d’un inducteur, l’opérateur est libre, ce qui rend le promoteur disponible
pour l’initiation de la transcription. La β-galactosidase clive le lactose en glucose et galactose
qui sera transformé en glucose par les enzymes de l’opéron galactose. Cette enzyme fournit à
la cellule du glucose à partir du lactose. Si le milieu de culture contient du glucose et du
lactose, l’activité de l’opéron lactose n’est pas nécessaire. En effet, il n’y a pas de synthèse de
β-galactosidase tant que le glucose du milieu n’est pas entièrement épuisé.
106
Structure de l’opéron lactose

Lac I Promoteur opérateur Lac Z Lac Y Lac A

Cistron 1 Cistron 2 Cistron 3

Cette situation résulte du fait d’un blocage de la synthèse de l’ARNm lac en présence du
glucose. Ainsi, malgré la présence d’un inducteur inactivant le répresseur lac, la transcription
des gènes de l’opéron dépend d’un autre élément régulateur. L’activité de cet élément
régulateur dépend de la concentration en glucose d’une manière assez indirecte. L’expression
d’un opéron est régulée à deux niveaux : par le contrôle de la transcription d’un ARNm
polycistronique et par les concentrations relatives des protéines codées par cet ARNm, qui
sont déterminées par la fréquence d’initiation au niveau de chaque cistron. Cependant les
mécanismes par lesquels la transcription est régulée varient d’un système à l’autre. Les
systèmes inducteur–répresseur sont fréquents parmi les opérons contrôlant des voies
cataboliques.

3.3.3 SYSTEME DE REGULATION DE LA VOIE DE BIOSYNTHESE :


OPERON TRYPTOPHANE

L’opéron tryptophane (trp) d’E.coli contrôle la biosynthèse de l’acide aminé tryptophane. La


régulation de cet opéron est telle que lorsqu’il existe du tryptophane dans le milieu de culture,
l’opéron tryptophane est inactif. Ainsi, lorsque le tryptophane est en concentration suffisante,
la transcription de l’opéron est bloquée. Mais lorsque cette concentration devient faible,
l’opéron est à nouveau transcrit. Le tryptophane agit ainsi comme un répresseur et non
comme un inducteur.

Lorsque la quantité d’acide aminé est insuffisante, la carence en tryptophane est compensée
par un système de modulation de la transcription qui permet d’adapter le niveau de
transcription à la concentration intracellulaire en tryptophane. Ce type de régulation se
retrouve dans de nombreux opérons de biosynthèse d’acides aminés. Le tryptophane est
synthétisé en 5 étapes, chacune contrôlée par une enzyme particulière. Les gènes codant pour
ces enzymes (trpE, trpD, trpC, trpB, trpA) sont situés côte à côte sur le chromosome d’ E. coli
dans l’ordre d’utilisation dans la voie de biosynthèse. Ils sont transcrits sous forme d’un seul
ARNm polycistronique. Le gène trpE est le premier à être transcrit. Le promoteur et
l’opérateur sont situés à côté du gène trpE, ainsi que deux régions appelées le leader et
l’atténuateur, désignés respectivement pas trpL et trpa.

Structure de l’opéron tryptophane

Promoteur Opérateur Gènes de structure


Atténuateur
Séquence leader
Trp L Trp E
107
La protéine de régulation intervenant dans la répression de l’expression de l’opéron
tryptophane est le produit du gène trpR. Les mutations dans ce gène ou dans l’opérateur
conduisent à des synthèses constitutives de l’ARNm trp. Cette protéine, appelée apo-
répresseur trp, ne se fixe sur l’opérateur que si du tryptophane est présent. En effet, l’apo-
répresseur se combine avec le tryptophane pour donner la forme active du répresseur capable
de se fixer sur l’oparateur. Ainsi le répresseur actif ne bloque la transcription que lorsque du
tryptophane est présent. Lorsque l’apport en tryptophane est supprimé ou réduit, l’équilibre se
déplace vers la formation d’apo-répresseur inactif, ce qui libère l’opérateur et permet le
démarrage de la transcription. Ce type de régulation est du type arrêt – marche.

Apo-répresseur (sans tryptophane) opérateur actif (transcription)

Apo-répresseur + tryptophane répresseur actif + opérateur

Opérateur inactif (pas de transcription)

Ainsi donc, du moins chez les procaryotes, la régulation est purement transcriptionnelle. Elle
est basée sur l’interaction des protéines régulatrices avec l’ADN au niveau d’une région de
l’ADN appelée promoteur, située dans la partie 5’ non transcrite des gènes de structure. Ce
type de régulation est réalisé comme suit : un gène régulateur synthétise une protéine appelée
répresseur de manière constitutive mais à un taux très faible. A tout moment la bactérie ne
possède qu’environ 10 copies du répresseur, ce qui est très peu.

Le répresseur possède une très forte affinité pour une séquence de l’ADN appelée opérateur,
situé sur le chromosome bactérien entre le promoteur (la séquence où se fixe l’ARN
polymérase) et le premier gène de structure. La fixation du répresseur sur l’opérateur empêche
ainsi toute transcription du gène. De ce fait le gène est fermé. En ce qui concerne l’opéron
lactose, l’inducteur (le lactose) possède lui aussi une forte affinité pour le répresseur. Ainsi
lorsque le répresseur est présent, le lactose s’y fixe. Cette fixation provoque cependant une
transconformation de la molécule du répresseur qui lui fait perdre son affinité pour l’ADN. A
ce stade l’opérateur devient libre, ce qui autorise la transcription du gène.

Mais pour permettre une transcription efficace de l’opéron, une seconde condition est requise :
l’ARN polymérase doit se fixer au niveau du promoteur par l’intermédiaire de sa sous-unité σ.
Or cette fixation ne peut s’effectuer de manière spécifique et efficace que si un complexe
constitué de l’AMPc et de la protéine CAP (catabolite Activator protein) est préalablement
fixé à la partie 5’ du promoteur. Le but de cette régulation est double : nutritionnel et
économique. En effet l’un de deux constituants du complexe, l’AMPc, constitut chez les
procayotes un signal de faim cellulaire ; il est présent seulement lorsque le glucose manque
dans le milieu.

Ainsi donc aucune énergie ne sera gaspillée pour métaboliser le lactose si un nutriment simple,
le glucose, est présent. Dans ce cas on parle répression catabolique. L’anabolisme utilise des
opérons répressibles. Les gènes sont transcrits tant que le produit à synthétiser (Trp pour
l’opéron tryptophane) manque dans le milieu. Dans ce système, le répresseur n’a aucune
affinité pour l’opérateur tant qu’il n’est pas transconformé par l’acide aminé qui se comporte
108
comme un co-répresseur. Tous les opérons de ce type ont une structure analogue, à l’exception
de l’opéron arginine dont les gènes sont disséminés dans le chromosome bactérien, chacun
ayant son propre promoteur et sont propre opérateur soumis au même co-répresseur.

L’atténuation

L’atténuation est un système modulateur d’expression. Il s’agit d’un système de régulation


complémentaire des opérons répressibles, consistant en un contrôle de la transcription par la
traduction. En fait les opérons des gènes de synthèse des acides aminés ont comme
caractéristique de commencer par une séquence peptidique leader très riche en l’acide aminé
qui sera synthétisé par les enzymes produites par l’opéron. C’est le cas par exemple : il y a 8
thréonines parmi les 16 premiers acides aminés de la séquence leader de l’opéron thréonine ; 7
histidines dans la séquence leader de l’opéron histidine, etc. Si la concentration de l’acide
aminé est très faible, la concentration en ARNt chargé de l’acide aminé est aussi faible. Ceci
ralentit non seulement la traduction (le temps de recherche du bon ARNt chargé est long),
mais aussi la transcription. La séquence que l’ARN polymérase transcrit au moment où
intervient ce ralentissement est appelée site de pause.

L’effet majeur du ralentissement est qu’il donne le temps au messager, qui est en cours de
transcription, de se transconformer dans une structure différente appelée structure d’anti-
terminaison. Sous cette structure, le messager est transcrit jusqu’au bout. Si la concentration
de l’acide aminé est élevée, aucun ralentissement de traduction ne se produit et le messager
n’a pas le temps de se transconformer (il est dans sa forme naturelle dite de terminaison). Il
interfère avec la transcription et l’arrête au niveau de l’atténuateur. Le mécanisme de cette
interférence n’est pas encore connu. On sait seulement que l’ARN polymérase est relâchée au
niveau de l’atténuateur. Ce dernier a une séquence proche de celle que l’on retrouve au niveau
des sites de fin de trnascription. Ce contrôle de la transcription par la traduction est peut-être
utilisé par les virus et les cellules eucaryotes.

3.3.4 AUTRES TYPES DE REGULATION

AUTOREGULATION

De nombreuses protéines sont synthétisées à partir de transcrits initiés à un taux constant.


Pourtant, les besoins d’une cellule vis-à-vis du produit de certains gènes varient
considérablement. Il faut pouvoir adapter le niveau de transcription de ces gènes aux besoins
de la cellule. L’autorégulation est un des moyens permettant de réguler la synthèse d’un
ARNm monocistronique. Dans le système régulé le plus simple, le produit du gène est
également un répresseur. Il se fixe sur un opérateur adjacent au promoteur. Lorsque la
concentration du produit du gène dépasse celle dont la cellule a besoin, il se fixe sur
l’opérateur et la transcription est bloquée.

Si les besoins de la cellule augmentent, les molécules déjà synthétisées sont consommées. La
concentration intracellulaire en molécules non fixées à l’opérateur diminue. Dans ces
conditions, les molécules fixées quittent l’opérateur, ce qui libère le promoteur et permet la
transcription. L’autorégulation est le système de régulation utilisé pour réguler la synthèse de
109
la plupart de protéines de type répresseur, dont le répresseur de l’immunité du phage λ codé
par le gène cI, mais aussi de nombreuses enzymes dont la présence est nécessaire
constamment dans la cellule.

RETRO-INHIBITION

Lorsqu’une culture bactérienne dans laquelle l’opéron tryptophane a été déréprimé est mise en
présence de tryptophane, la répression s’établit rapidement et une faible quantité d’enzymes
est synthétisée. Cependant, les molécules d’enzymes déjà synthétisées vont persister un certain
temps dans la cellule. Un second type de régulation se met alors en place pour éviter une
consommation inutile de précurseurs et d’énergie. Ce type de régulation est appelé rétro-
inhibition. Il s’agit de l’inhibition de l’activité des enzymes d’une voie de biosynthèse par le
produit final de cette voie. Le mécanisme le plus commun de rétro-inhibition correspond à
une inhibition, par le produit final, de l’enzyme contrôlant la première étape de la voie de
biosynthèse.

A 1 B 2 C 3 D

Dans la voie catalysée par les enzymes 1, 2 et 3, par exemple, le produit D agira sur l’enzyme
1, ce qui correspond au mode d’inhibition le plus économique. Certaines voies de biosynthèse
sont impliquées dans la synthèse de deux produits à partir d’un précurseur commun.

E 5 F
4
A 1 B
2
C 3 D

Dans ce type de voie de biosynthèse, il n’est souvent pas souhaitable qu’un seul produit inhibe
les enzymes de la partie commune; cela conduirait au blocage des deux branches. En général,
la rétro-inhibition s’effectue spécifiquement sur les enzymes de chacune des deux branches de
la voie. Ici le système correspond à l’inhibition de l’enzyme 2 par le produit D et à
l’inhibition de l’enzyme 4 par le produit F. Dans ce cas, D n’influence pas la biosynthèse de
F et réciproquement. La conversion de A en B est inutile si D et F sont tous les deux
disponibles. Il existe de nombreux systèmes dans lesquels les deux produits finaux (D et F)
s’associent pour inhiber la première enzyme de la voie. Les rétro-inhibition s’exerçant sur une
voie de biosynthèse branchée peuvent être assez complexes.

REGULATION DES ACTIVITES DES GENES CHEZ LES EUCARYOTES

Il existe de nombreuses différences entre les eucaryotes et les procaryotes en ce qui concerne
la transcription et la traduction ainsi que l’organisation du génome : a- dans une cellule
eucaryote, une seule chaîne polypeptidique peut être traduite à partir d’un ARNm mature. Il
n’existe pas de structure du type opéron comme chez les procaryotes ; b- de nombreuses
protéines sont fixées sur l’ADN des eucaryotes, comme les histones qui participent à la
formation de la chromatine. Seule une petite partie de l’ADN est nue ; c- une grande partie de
110
séquences d’ADN des eucaryotes n’est pas traduite. Il existe des introns dans la plupart des
gènes eucaryotes ; d- les eucaryotes possèdent des mécanismes qui permettent le
réarrangement de segments d’ADN de manière contrôlée et l’augmentation du nombre de
gènes quand cela est nécessaire ; e- chez les procaryotes, les sites de régulation de la
transcription sont petits et proches. Ils sont situés généralement en amont des promoteurs. La
fixation des protéines régulatrices au niveau de tels sites stimule ou inhibe directement la
fixation de l’ARN polymérase ; f- chez les eucaryotes, les régions régulatrices sont beaucoup
plus grandes et peuvent être situées en une centaine de paires de bases des promoteurs.

Les protéines régulatrices se fixent au niveau de ces régions, mais à une distance trop grande
pour interagir directement avec le promoteur. g- les ARN des eucaryotes sont synthétisés dans
le noyau et doivent être transportés à travers la membrane nucléaire vers le cytoplasme pour y
être traduits. Une telle compartimentation n’existe sans doute pas chez les procaryotes. Les
cellules eucaryotes peuvent se présenter sous forme de cellules autonomes isolées, comme les
algues et les levures, ou soit appartenir à un tissu organisé. Les exigences de ces deux types de
cellules sont très différentes. Elles diffèrent également de celles des procaryotes. En effet,
l’environnement de cellules d’un tissu ne change pratiquement pas au cours du temps. Pendant
la phase de croissance d’un organisme, les cellules se différencient en réponse à des signaux
variés et pour la plupart encore inconnus.

Cependant, une fois différenciées, les cellules sont stables et produisent des molécules
particulières, soit à un taux constant, soit en réponse à des signaux extérieurs comme les
hormones. Bien que l’organisation de leurs gènes soit différente, les cellules eucaryotes
autonomes et les cellules procaryotes ont un certain nombre de caractéristiques communes,
notamment en ce qui concerne leurs systèmes de régulation. C’est chez la levure que les
mécanismes de régulation sont les mieux connus, mais avec moins de précision que pour les
opérons de E. coli.

Dans les détails les mécanismes de régulation sont souvent différents de ceux observés chez
les bactéries. Cependant les stratégies de régulation sont assez proches dans le sens où la
cellule autonome doit répondre aux fluctuations importantes de disponibilité des aliments
présents dans l’environnement. En ce qui concerne les systèmes de régulation des cellules
eucaryotes organisées en tissus, la majorité des informations proviennent des études sur les
mammifères, les amphibiens (le xénope), les insectes (drosophile), les oiseaux (le poulet) et
les échinodermes (l’oursin).

FAMILLES DE GENES

Les gènes des procaryotes qui ont des fonctions proches sont souvent organisés en opérons et
sont transcrits en un seul ARNm polycistronique. Ainsi le système entier est sous le contrôle
d’une seule région promotrice. Il peut être mis en marche ou être bloqué par un simple
contrôle exercé sur la région promotrice. Cette stratégie de régulation ne peut pas être utilisée
dans les cellules eucaryotes ; leur ARN étant généralement monocistronique. De nombreux
gènes eucaryotes ayant une certaine parenté (c’est-à-dire dérivant tous d’un gène ancestral
commun) peuvent être classés fonctionnellement en une famille de gènes. Ces gènes sont
111
rarement aussi proches les uns des autres que ceux d’un opéron, bien qu’ils puissent être
groupés (sans être adjacents, mais séparés par une centaine à un millier de paires de bases).

Ils sont souvent très dispersés, voire même localisés sur des chromosomes différents. Les
familles de gènes sont souvent classées en familles multigéniques simples, en familles
multigéniques complexes et en familles de gènes dont l’expression est régulée au cours du
développement. Une famille multigénique simple correspond à la répétition d’un ou plusieurs
gènes en tandem. L’exemple le plus simple correspond à la famille de gènes codant pour
l’ARN ribosomique 5 S. Il existe plusieurs groupes contenant chacun quelques centaines à
quelques milliers de gènes 5 S. Probablement tous les gènes d’un groupe sont transcrits en
même temps en réponse à un seul signal. Les gènes des ARNr 5,8 S, 18 S et 28 S de xénope
forment une autre famille multigénique dans laquelle le transcrit primaire contient les trois
séquences des ARNr, séparées par un petit espaceur.

Ces trois ARNr sont dans un rapport 1 :1 : 1 aussi bien dans la population des ARN totaux que
dans le ribosome. Ceci provient du fait que le transcrit primaire ne contient qu’une copie de
chacun de ces gènes ; ce qui est également le cas de l’ARNr d’E.coli. Bien que le rapport 1 :1
entre l’ARNr 5 S et chacun des ARNr 5,8 S, 18 S et 28 S est maintenu, l’ARNr 5 S est
transcrit séparement des autres. Une explication simple pourrait être que la transcription du
gène de l’ARNr 5 S et celle de l’unité 5,8 S, 18 S et 28 S soient initiées à partir du même
signal. Les familles multigéniques complexes consistent généralement en un groupe de
plusieurs gènes apparentés fonctionnellement dont chaque élément est transcrit
indépendamment (au contraire d’un transcrit correspondant à plusieurs gènes comme celui de
l’unité des ARNr) et séparés par un espaceur.

Chez l’oursin, par exemple, chacun de 5 gènes des histones est transcrit indépendamment,
mais dans la même direction. Au contraire, chez la drosophile, les 5 gènes sont transcrits dans
les deux directions. Chez la levure, l’organisation des gènes est encore différente. Il existe
deux groupes de gènes assez distants l’un de l’autre, chacun contenant un gène H2A et un gène
H2B, tandis que les autres gènes d’histones sont dispersés dans tout le génome. Dans tous les
cas, ces gènes sont considérés comme faisant partie d’une famille multigénique puisque leurs
produits sont apparentés et synthétisés dans des rapports fixes.

Les gènes dont l’expression est contrôlée au cours du développement correspondent à une
famille de gènes différents dont chacun ne s’exprime qu’à un moment particulier du cycle de
développement de l’organisme. Leur expression suit donc une séquence définie au cours du
temps. Le système le mieux connu est celui des gènes de la globine. L’hémoglobine est une
protéine tétramérique qui contient deux sous-unités α et deux sous-unités β. Cependant, il
existe de nombreuses formes pour chacune des sous-unités α et β, ne différant que par un ou
quelques acides aminés. Chacune des ces formes n’est synthétisée qu’à un moment donné du
stade de développement de l’organisme. Par exemple, après la fécondation, les sous-unités α1,
α2, ζ1, ζ2, ε, γG, γA, β et δ sont synthétisées aux moments suivants. Pendant la période
embryonnaire, la chaîne ζ2 de type α apparaît en premier, puis elle est graduellement
remplacée par la forme ζ1.
112
Dans les stades fœtaux et adultes, la chaîne α2 est prépondérante. Les deux chaînes de type β,
γG et γA (dont la dénomination provient du fait qu’elles diffèrent au même site par une
glycine ou alanine) sont en quantité équivalente. Au stade adulte, les chaînes de type β sont 50
fois plus nombreuses que les formes δ. Le résultat de ces changements est qu’avant la
naissance, toutes les hémoglobines contiennent deux chaînes ζ2 et deux chaînes ε. Après la
naissance, 98 % des hémoglobines contiennent deux chaînes α et deux chaînes β (hémoglobine
A) et 2 % contiennent deux chaînes α et deux chaînes δ (hémoglobine A2). Les gènes des
chaînes de types α et β forment des regroupements différents.

Une propriété remarquable de chacun de ces groupes de gènes réside dans le fait que les gènes
sont placés dans l’ordre dans lequel ils vont être exprimés au cours du développement.
Cependant, on ne connaît pas le rôle de ces différentes formes, ni par quel moyen leur
synthèse est programmée. L’examen de ces groupes de gènes chez de nombreux organismes
a donné des indications sur les origines de ces gènes et sur les facteurs évolutifs qui ont permis
leur maintien. Les poissons primitifs, les vers marins et les insectes n’ont qu’un seul gène de
globine. Les amphibiens possèdent des gènes α et β qui sont très liés. Les mammifères
inférieurs et les oiseaux ont plusieurs formes de gènes α et β et les groupes de gènes
correspondants sont sur les chromosomes différents.

Ainsi il a été postulé que la globine ancestrale (qui a pu apparaître il y a plus de 800 millions
d’années) était le produit d’un seul gène et que les familles de gènes de globine actuelle sont le
résultat d’une série de duplications, de mutations et de transpositions de ce gène ancestrale. Un
modèle évolutif a été construit permettant de rendre compte de ces données. Les petits
animaux sont capables de respirer même lorsqu’ils ne possèdent qu’une seule molécule
d’hémoglobine fonctionnelle. Ainsi des mutations spontanées du gène ancêstrale ont pu
apparaître chez ces organismes et former un hétérozygote des molécules tétramériques
capables de fixer l’oxygène. Or ces molécules tétramèriques ont une plus grande capacité à
distribuer l’oxygène aux cellules que les globines monomériques. Ce type de molécules a donc
pu permettre l’apparition d’animaux plus grands. Enfin, plus tardivement dans l’évolution des
mammifères, il a pu se produire une mutation touchant une des deux chaînes β. Celle-ci a pu
être dupliquée et ainsi de donner naissance à la forme γ de la globine que l’on retrouve dans le
fœtus.

L’hémoglobine fœtale a une affinité plus forte pour l’oxygène que l’hémoglobine adulte, ce
qui représente un avantage important pour le développement du fœtus. Des mutations et des
duplications successives des gènes de la globine ont pu apparaître pendant l’évolution des
primates et donner naissance aux différentes formes d’hémoglobine. L’existence des vestiges
de cette évolution conforte ce modèle évolutif. L’étude des fragments de globine chez
différents organismes a montré l’existence de séquences non fonctionnelles homologues de
gènes de globine exprimés. Ces séquences sont appelées pseudogènes, et elles sont
considérées comme des vestiges de l’évolution des séquences des gènes ancestraux
fonctionnels.

Ce processus évolutif peut être schématisé ainsi : le gène ancestral a été dupliqué et une de ces
deux copies a été mutée, devenant inactive. Puisqu’au moins une copie fonctionnelle du gène
était encore présente, la présence de cette mutation dans l’organisme n’a pas eu d’effet
113
défavorable, ce qui lui a permis de se maintenir. Par le même processus, d’autres mutations
ont pu s’accumuler dans ce gène au cours du temps. Les pseudogènes sont assez répandus,
mais ils sont rarement fonctionnels, soit puisqu’ils ne sont plus transcrits, soit puisque leurs
introns sont plus excisés ou soit puisqu’ils ne sont plus traduits.

REGULATION DE LA TRANSCRIPTION

En fonction de leur quantité, les ARNm des eucaryotes sont en général classés en trois
groupes, cette quantité étant exprimée en nombre de molécules par cellule : 1- les ARNm
peu abondants (quelques copies par génome haploïde) ; 2- les ARNm modérément abondants
(quelques copies à quelques centaines de copies par cellule) ; 3- les ARNm très abondants
(quelques centaines à quelques milliers de copies par cellule). Les ARNm peu abondants et
modérément abondants codent en général pour des enzymes et des protéines de structure. Les
ARNm très abondants sont transcrits à partir d’un petit nombre de gènes eucaryotes. Leur
production est associée à un changement de stade de développement. Un érythroblaste adulte
de la moelle osseuse, par exemple, produit une grande quantité d’ARNm qui correspond aux
globines adultes. Il n’y a que peu ou pas de globine produite dans les cellules-mères des
érythroblastes.

Une grande partie des connaissances accumulées sur la régulation de la transcription chez les
eucaryotes supérieurs provient de l’étude des ARNm abondants. Les hormones sont les
régulateurs de la transcription les mieux connus chez les eucaryotes supérieurs. Ces hormones
peuvent être de petites molécules, des polypeptides ou des petites protéines qui sont
transportées des cellules productrices d’hormones vers les cellules cibles. De nombreuses
hormones sexuelles agissent en bloquant la transcription. Si une hormone régule la
transcription, elle doit d’une manière ou d’une autre agir au niveau de l’ADN.

La pénétration de l’hormone dans la cellule cible et son transport vers le noyau est un
processus beaucoup plus compliqué que l’entrée du lactose dans une cellule d’E.coli. Les
hormones stéroïdes (H) sont des molécules hydrophobiques (non polaires) qui passent
librement à travers la membrane. La cellule cible contient un récepteur cytoplasmique
spécifique ® qui forme un complexe (H – R) avec l’hormone. Le récepteur R subit
généralement quelques modifications (dans sa forme et sa structure chimique) après la
formation du complexe H – R. La forme modifiée du récepteur est appelée R’.

Le complexe H – R’ passe alors à travers la membrane nucléaire et entre dans le noyau. Ce qui
se passe après cette étape de pénétration est très mal connu. Dans le noyau, il semble que seule
l’hormone participe à l’un des processus suivants : 1- fixation directe sur l’ADN, 2- fixation
sur une protéine effectrice, 3- activation d’une protéine fixée sur l’ADN, 4- inactivation d’un
répresseur, 5- changement de la structure de la chromatine permettant à l’ARN polymérase
d’accéder à l’ADN.

Dans la plupart des systèmes activés par des hormones, il a été possible de déterminer lequel
de ces mécanismes était impliqué. Dans le cas de l’action de glucose corticoïde, une hormone
qui inhibe la dégradation du glucose et stimule la synthèse du glucose dans le foie, l’initiation
de la transcription des gènes impliqués est obtenue par la fixation directe d’une protéine de
114
régulation positive sur l’ADN. Un autre exemple est la stimulation de la synthèse de
l’ovalbumine dans l’oviducte du poulet par les hormones sexuelles (œstrogène).

Lorsque les poulets sont traités par une injection d’œstrogène, les tissus de l’oviducte
répondent par la synthèse d’ARNm de l’ovalbumine. Cette synthèse se poursuit aussi
longtemps que l’œstrogène est administré. Une fois le traitement hormonal arrêté, le niveau de
synthèse décroît et 60 heures après l’arrêt de l’administration d’œstrogène, plus aucun ARNm
de l’ovalbumine n’est détectable. Lors du traitement de poulets par des oestrogènes, seul
l’oviducte synthétise l’ARNm de l’ovalbumine puisque les autres tissus ne possèdent pas de
récepteur pour l’hormone. L’absence d’un récepteur est la cause la plus fréquente de
l’insensibilité d’un type cellulaire à une hormone particulière. Le mécanisme responsable de la
spécificité tissulaire de la synthèse du récepteur n’est pas connu.

Régulation de la maturation des ARNm

Il est fréquent que deux cellules synthétisent la même protéine mais en quantité différente
même si cette synthèse a lieu à partir du même gène. Ce phénomène est souvent associé à la
présence des molécules d’ARNm différentes, qui ne sont pas traduites avec la même efficacité.
Dans le cas de la synthèse de l’α-amylase du rat, en fonction de différents types cellulaires, il
existe différentes molécules d’ARNm transcrites à partir du même gène. Ces différentes
molécules d’ARNm proviennent de maturations différentes du même transcrit primaire. Ainsi
les cellules de la glande salivaire du rat produisent plus d’enzymes que les cellules du foie,
bien que ce soit la même séquence codante qui soit transcrite. Chaque type cellulaire
synthétise le même transcrit primaire qui va être épissé suivant des mécanismes différents.

CONTROLE TRADUCTIONNEL

Chez les bactéries, la plupart de molécules d’ARNm sont traduites en un nombre équivalent de
fois, avec seulement de petites variations d’un gène à l’autre. Chez les eucaryotes, il existe de
systèmes de régulation intervenant au niveau des molécules d’ARNm. Celles-ci ne seront
traduites qu’après la réception d’un signal. On parle alors de régulation traductionnelle. Il
existe d’autres types de régulation traductionnelle notamment la régulation au niveau de la
durée de vie d’une molécule d’ARNm particulière et la régulation au niveau de synthèse
protéique générale. Un exemple de régulation traductionnelle concerne les ARNm masqués.
Après la fécondation d’un œuf, il est nécessaire de synthétiser de nombreuses protéines
nouvelles, comme par exemple les protéines nécessaires aux mitoses, à la synthèse des
membranes cellulaires ou d’autres composés cellulaires. Les œufs non fécondés d’oursin
accumulent de grandes quantités d’ARNm ayant une longue durée de vie. Ces ARNm sont
sous forme de particules composées d’ARNm et des protéines.

Ces ARNm ne sont pas traduits tant que l’œuf n’est pas fécondé. Mais dans les minutes qui
suivent la fécondation, ces molécules sont traduites. Les mécanismes qui stabilisent ces
ARNm et les protègent contre les ARNases avant la fécondation ainsi que ceux permettant
l’activation de leur traduction sont encore inconnus. Il existe un autre type de régulation
traductionnelle dans les œufs matures non fécondés. Ces cellules ont besoin de se maintenir
en état de marche, mais elles n’ont pas besoin de se multiplier, ni de changer de stade de
115
développement. Ainsi le niveau de synthèse protéique dans ces œufs est généralement bas.
Ceci n’est pas la conséquence d’un approvisionnement réduit en ARNm, mais d’une limitation
en élément non encore identifié appelé facteur de recrutement, qui interfère avec la formation
du complexe ribose – ARNm.

Un autre exemple de régulation traductionnelle est fourni par le contrôle de la durée de vie de
l’ARNm de la fibroïne de la soie. Pendant la formation de son concon, la glande à soie du
vers Bombyx mori synthétise abondamment une seule protéine, la fibroïne de la soie. Puisque
le ver met plusieurs jours à fabriquer son concon, c’est la quantité totale de fibroïne
synthétisée qui doit être importante et non le taux de synthèse. Le vers à soie réalise cet
objectif en synthétisant une molécule d’ARNm qui a une longue durée de vie. La
transcription du gène de la fibroïne est initiée au niveau d’un promoteur fort par un signal
inconnu. Environ 104 molécules d’ARNm de fibroïne sont synthétisées en quelques jours.

Une molécule d’ARNm eucaryotique typique a une durée de vie d’environ 3 heures avant
d’être dégradée. Les molécules d’ARNm de la fibroïne par contre subsistent pendant plusieurs
jours et ainsi, chaque molécule d’ARNm est traduite de façon répétée, ce qui conduit à la
formation de 106 molécules de fibroïne. Chaque gène permet ainsi la synthèse de 109
protéines en quelques jours. Dans son ensemble, la glande à soie fabrique pendant cette
période 300 μg de fibroïne, soit 1015 molécules, ce qui correspond à l’activité d’une cellule
comportant 106 copies du gène ou 5.105 cellules diploïdes contenant deux gènes. Si la durée de
vie de l’ARNm n’était pas augmentée, cette synthèse prendrait 100 jours ou il serait nécessaire
d’avoir 25 fois plus de copies du gène.

Un autre exemple d’ARNm à longue durée de vie est représenté par l’ARNm de la caséine, qui
est la protéine majeure du lait. Cette protéine est produite par les glandes mammaires. Lorsque
l’hormone prolactine est fournie aux glandes, la durée de vie de l’ARNm de la caséine
s’accroît. La synthèse de l’ARNm se poursuit également conduisant à une augmentation
significative de la production de la caséine. Lorsque la prolactine est épuisée, la concentration
en ARNm de la caséine décroît puisque ces ARNm sont dégradés plus rapidement.

POLYPROTEINES

Chez les procaryotes, la régulation coordonnée de plusieurs gènes est réalisée par le contrôle
de la synthèse d’une seule molécule d’ARNm polycistronique. Chez les eucaryotes, ce type
d’organisation n’existe pas, mais quelques systèmes présentent certaines analogies. En effet, il
existe des protéines qui sont synthétisées sous la forme d’une polyprotéine clivée après sa
traduction en protéines individualisées. Chaque protéine peut être considérée comme le
produit d’un seul gène. Dans la séquence codant pour une telle protéine, chaque gène n’est
pas séparé par des codons d’arrêt ou d’initiation, mais par une séquence correspondant à des
acides aminés spécifiques qui seront reconnus comme site de clivage par des protéases
particulières.

Ces polyprotéines peuvent posséder jusqu’à 10 sites de clivage. Ces sites de clivage ne sont
pas coupés simultanément, mais suivant un ordre particulier. Une polyprotéine permet
116
d’obtenir un rapport équimoléculaire entre les différentes protéines qui la composent. De plus,
le délai dans la coupure de la polyprotéine permet de libérer les protéines individuelles suivant
une cinétique particulière, ce qui est un mécanisme de régulation fréquemment rencontré chez
les virus animaux. De nombreuses polyprotéines ont été isolées. La synthèse des précurseurs
de l’ARNm tels que l’uridine triphosphate et la cytidine triphosphate par exemple suit une
voie de biosynthèse qui comporte les étapes suivantes :

Carbamoyl phosphate Aspartyl trans carbamoylase


Précurseur Carbamoyl phosphate
synthétase Aspartate Pi

Dihydro-orotase
N – carbamoyl aspartate Dihydroorotate CTP

Chez les bactéries, les trois enzymes sont synthétisées séparément. Chez la levure et
Neurospora, seulement deux protéines sont synthétisées. La première est la dihydroorotate,
l’autre est une grande protéine qui est clivée en deux protéines correspondant à la carbamoyl
phosphate synthétase et l’aspartyl transcarbamoylase. Les mammifères synthétisent une seule
protéine qui est clivée en trois enzymes. Les cellules des glandes salivaires et les cellules du
foie synthétisent des quantités différentes d’α-amylase en raison de l’épissage différentiel
d’une molécule d’ARNm unique. La même protéine est fabriquée dans les deux types de
cellules, mais en quantités différentes. Dans les muscles du poulet, il existe deux formes
différentes de la protéine musculaire la myosine synthétisée à partir du même gène.

Ces deux formes sont appelées les chaînes alcalines LC1 et LC3. Ce gène a deux sites
d’initiation de la transcription (séquence TATA), permettant la synthèse des deux transcrits
primaires différents. Ces transcrits sont maturés différemment pour donner des ARNm
codant pour l’une ou l’autre des deux formes de la protéine. Chez la drosophile, ce transcrit
primaire est maturé de quatre manières différentes, suivant le stade de développement. Une
classe de myosine se retrouve dans les pupes et les trois autres dans les embryons tardifs et
dans les stades larvaires. Les mécanismes qui permettent cette variation de maturation de ces
ARNm sont encore inconnus.
117
Chapitre 4

MUTATIONS

L’organisme vivant a tendance naturelle à passer d’un état héréditaire à un autre par le
processus appelé mutation. Lorsqu’on parle de changement, le point de référence, le standard
est fourni par le type sauvage. Celui-ci peut être soit une forme que l’on trouve dans la
nature, soit une forme couramment utilisée comme standard au laboratoire. Tout changement
qui provoque un écart par rapport au type sauvage est appelé mutation. Un changement qui
provoque un retour au type sauvage est appelé mutation réverse, une réversion ou une
mutation en retour. Une forme non sauvage d’un gène peut aussi être appelée une mutation.
Le terme mutant désigne un organisme, une cellule ou un gène dont le phénotype révèle la
présence d’une mutation.

Un événement mutationnel se rapporte à l’apparition proprement dite de la mutation alors que


la fréquence de mutations désigne la proportion de mutations présentes dans une population de
cellules ou d’individus. Un mutagène est un agent physique ou un réactif chimique capable
de provoquer l’apparition de mutations alors que le terme mutagenèse désigne le processus qui
produit une mutation. Les mutations obtenues naturellement sans intervention d’agents
mutagènes résultent d’une mutagenèse spontanée et les mutants obtenus sont des mutants
spontanés. Si un agent mutagène est utilisé, on parle de mutagenèse induite.

4.1 TYPES DE LESIONS DE L’ADN

Il existe deux grandes catégories de lésions d’ADN : les macrolésions (lorsqu’il s’agit des
lésions importantes) et les microlésions (pour des lésions mineures). Les macrolésions
concernent :

Les délétions ou perte d’un segment d’ADN

Les délétions résultent de l’excision d’un segment d’ADN avec rétablissement de la continuité
de la double hélice. Cette perte de matériel génétique est variable : de quelques dizaines de pb
à 2 à 5 millions de pb. Les très grandes délétions correspondent à la perte d’un segment
chromosomique plus ou moins important, voire un chromosome entier.

Les duplications

Les duplications consistent au dédoublement d’un segment plus ou moins long d’ADN.

L’amplification

Il s’agit de la multiplication, en général en tandem, des séquences normalement uniques. Une


même séquence d’ADN se présente dans la cellule en des centaines de milliers de copies. A
l’échelle cytogénétique l’amplification se manifeste par l’apparition de minichromosomes
118
surnuméraires ou de segments chromosomiques possédant des propriétés tinctoriales
anormales.

La fusion des gènes

C’est un cas particulier de réarrangement où une double cassure s’est produite dans deux
gènes avec transposition de l’un dans l’autre. La transposition peut avoir lieu dans à l’intérieur
d’un même chromosome ou intéresser deux chromosomes différents. Dans ce dernier cas, on
parle d’une translocation qui peut être soit détectable par les méthodes de la cytogénétique
(fusion bcr-abl du chromosome Philadelphie), soit par les méthodes infra-cytogénétiques
(fusion bcr-abl sans chromosome Philadelphie visible). Dans l’ADN résultant d’une
translocation, les gènes réboutés sont soit dans la même orientation (sur le même brin comme
dans la fusio bcr-abl de la leucémie myéloïde chronique), soit dans une orientation opposée
(sur des brins opposés comme le gène c-myc et le gène C-μ dans les lymphomes de Burkitt
avec translocation 8 : 14.

Les inversions

Il s’agit d’un changement d’orientation, tête-bêche, d’un segment plus ou moins long d’ADN
(une double cassure sur l’ADN et le segment interne se resoude après avoir effectué une
rotation de 180°C). Quant au déterminisme des macrolésions, on sait ajourd’hui que les
recombinaisons inégales induisent des changements quantitatifs sur la molécule d’ADN. En
effet en dehors des accidents dus à une malségrégation chromosomique, les macrolésions
résultent en général mais pas obligatoirement, des accidents des recombinaisons méiotiques.
Ainsi les délétions et les duplications proviennent d’une recombinaison illégitime entre
séquences très semblables mais pas nécessairement identiques, responsable d’une erreur
dalignement (crossing-over inégal). Ce mécanisme aboutit à la fois à l’élimination d’un gène
sur un chromosome et à la duplication sur un autre.

Le phénomène de recombinaison inégale explique en grande partie l’évolution des gènes et


notamment la création de familles et des superfamilles à partir d’un gène ancestral. Le
phénomène est favorisé par l’existence des séquences homologues très rapprochées sur un
même chromosome. Ces séquences pouvant être des séquences codantes comme dans le cas de
l’alpha-globine ou non codantes (comme dans le cas de l’ADN répétitif dispersé). Le
phénomène de recombinaison inégale peut aussi être d’origine mitotique, également par suite
d’un crossing-over inégal. C’est le cas des délétions portant sur des gènes du chromosome X,
responsables notamment de l’hémophilie A ou de la myopathie de Duchenne, qui sont
apparues de novo dans les gamètes mâles.

Les translocations

Les accidents méiotiques ou mitotiques aboutissant à une translocation sont responsables du


phénomène de fusion en orientation directe ou inversée. Certains cas de maladies génétiques
montrent que les translocations réciproques équilibrées s’accompagnent en fait d’une perte de
matériel génétique. C’est le cas du lyphome de Burkitt et de la leucémie myéloïde chronique.
Le lymphome de Burkitt est une lymphopathie maligne monoclonale. Il est caractérisé par une
119
translocation chromosomique entre le chromosome 8 cassé dans ou au voisinage du proto-
oncogènec-myc et l’un des trois chromosomes portant des gènes des immunoglobilines : le
plus souvent le chromosome 14 (chaînes lourdes), plus rarement le chromosome 2 (chaîne
légère kappa) ou le chromosome 22 (chaîne légère lambda).

L’aspect cytogénétique est celui d’une translocation équilibrée. Il s’agit d’une juxtaposition
entre c-myc et l’un des gènes des immunoglobilines qui s’accompagne d’une délétion allant de
quelques nucléotides à plusieurs centaines de nucléotides, avec dans certains cas une inversion
tête-bêche des séquences. La leucémie myéloïde chronique consiste en un chromosome
Philadelphie (Ph1) résultant d’une translocation entre le chromosome 9 et le chromosome 22.
L’échange est apparemment réciproque, cependant il se produit la fusion d’un gène du
chromosome 22 (bcr) et d’un gène du chromosome 9 (proto-oncogène c-abl) au cours de
laquelle le gène c-abl subit une amputation plus ou moins importante de sa partie 5’.

De multiples facteurs physiques et chimiques, endogènes et exogènes, tendent en permanence


à altérer la molécule d’ADN génomique et sont à l’origine de plusieurs types de lésions : des
cassures d’un brin, la création des liaisons covalentes entre deus bases contiguês ou
complémentaires, des modifications chimiques d’une base, l’excision d’une ou de plusieurs
bases, des erreurs de réplication. Généralement ces lésions sont reconnues et réparées par des
systèmes enzymatiques de la cellule. Cependant lorsque la réparation n’a pas lieu ou si elle est
défectueuse, l’événement accidentel survenu sur un seul brin peut être fixé lors de la
réplication suivante : il s’agit d’une mutation ponctuelle qui va se perpétuer dans les
générations cellulaires suivantes.

Les mutations ponctuelles sont considérées comme les causes les plus fréquentes de maladies
génétiques. Elles sont à l’origine de près de 70% des cas de maladies génétiques où un défaut
moléculaire intragénique a pu être caractérisé avec précision. Les mutations ponctuelles
consistent en des substitutions, des suppressions ou des additions des bases. Elles peuvent
résulter de perturbations biochimiques endogènes comme une dépurination spontanée, due à
une plus grande labilité de la liaison N-glycosidique reliant les bases puriques au squelette de
polydésoxyribose-phosphate ou à des transitions tautomériques (forme NH2
Forme ═ NH),
(forme C═ O forme C OH),

favorisant les appariements contre nature et surtout des désaminations avec des transitions de
l’adénine en l’hypoxanthine, de la guanine en xanthine et de la cytosine en uracile.
Généralement les dérivés formés de ces transformations sont ausitôt reconnus, excisés et
remplacés par les systèmes de réparation. Mais si la désamination porte une cytosine
méthylée, le produit formé sera le S-méthyle uracile, qui n’est autre que la thymine (qui est
une base normale de l’ADN et qui n’est donc pas reconnue comme un élément étrénger à
l’ADN).

De cette manière la transition accidentelle C T est fixée par le remplacement d’un G par un
A sur le brin opposé au moment de la réplicattion qui suit. Ainsi donc les sites comportant
une cytosine méthylée, c’est-à-dire certains doublets CG, sont des ceibles vulnérables et
constituent ce que l’on appelle des points chauds (hot-spots) de mutation. Cela montre que les
120
mutations ponctuelles peuvent aussi résulter d’une erreur de réplication ou de réparation
échappant à la vigilance des systèmes de contrôle. Ceci peut expliquer les mutations par
délétion ou addition d’une base ou d’un très petit nombre de bases.

Délétions et insertions

Des mutations peuvent également être causées par l’insertion ou la délétion d’une ou de
plusieurs bases. Certaines délétions ou insertions impliquent seulement un petit nombre de
nucléotides et ne peuvent généralement être détectées que par l’analyse moléculaire qui utilise
le séquençage de nucléotides. Dans d’autres cas, un segment substantiel du gène ou un gène
entier peut être délété. De telles mutations sont habituellement détectées par l’analyse de
l’ADN du patient par la méthode de Southern. Dans de rares cas, des délétions sont assez
importantes pour être visibles au niveau de l’analyse cytogénétique. Dans la plupart des cas,
de telles délétions éliminent plus d’un seul gène, et sont associées à un syndrome de micro-
délétion ou syndrome de gènes contigus.

Si des délétions ou insertions n’impliquent que quelques paires de bases et que ce nombre de
paires de bases n’est pas un multiple de 3 (c’est-à-dire ne correspond pas à un nombre entier
de codons), alors la mutation change le cadre de lecture de la traduction et résulte en une
séquence différente pour les acides aminés situés du côté carboxyl-terminal de la protéine. De
telles mutations sont appelées mutations frame-shift. Un exemple d’une mutation frame-shift
est la délétion d’une seule paire de bases au locus du groupe sanguin ABO. Cette mutation
distingue l’allèle non fonctionnel O de l’allèle A. La délétion change le cadre de lecture de la
traduction à partir du codon 86 jusqu’à un codon stop prématuré (qui n’est pas dans la phase
du cadre de lecture normal et qui n’est donc pas lu dans l’allèle A), situé 30 acides aminés plus
loin.

Comme on peut s’y attendre, la protéine résultante (qui mesure approximativement 1/3 de la
taille de la glucosyltransférase de type A ou B) possède des propriétés complètement
différentes du produit du gène normal. Une insertion causant un frame-shift est la mutation
observée le plus fréquemment chez les patients juifs ashkénazes atteints de la maladie de Tay-
Shas. Une insertion de 4 paires de bases modifie le cadre de lecture qui, comme dans
l’exemple du système ABO, crée un codon stop prématuré. Dans ce cas, la protéine
hexosaminidase A n’est pas produite, ce qui explique l’absence complète d’enzymes et la
grande sévérité du phénotype observé dans la forme infantile de la maladie.

D’autres petites insertions ou délétions ne causent pas de frame-shift parce que le nombre de
paires de bases impliquées est un multiple de 3. La délétion de trois paires de bases qui est
observée dans l’allèle muté le plus fréquemment associé à la fibrose kystique (CF) en est un
exemple. Cette mutation, trouvée dans près de 70% de tous les allèles mutés CF examinés, est
responsable de la synthèse d’une protéine anormale dans laquelle il manque un seul acide
aminé, une phénylalanine, en position 508.

Délétions et duplications par des événements de recombinaison


121
L’une des causes fréquentes de mutations implique une délétion ou une duplication résultant
d’un événement de recombinaison entre des séquences d’ADN similaires ou identiques. De
nombreux gènes font partie de familles multigéniques. Lorsque ces gènes sont disposés tête-
bêche dans la même région chromosomique, ils peuvent de temps en temps se décaler et
s’apparier de façon non conventionnelle au cours de la méiose (lorsque les deux chromosomes
homologues s’apparient) ou au cours de la mitose, après la réplication de l’ADN (lorsque les
deux chromatides sœurs échangent souvent de l’ADN). Une recombinaison se produisant
entre des chromosomes mal alignés ou entre les chromatides sœurs mal alignées peut-être à
l’origine d’une délétion ou d’une duplication des gènes. En fait, le mécanisme de crossing-
over inégal est à l’origine des délétions observées dans la famille des gènes de l’hormone de
croissance dans le cas de déficience familiale isolée en hormone de croissance.

Le crossing-over inégal semble également être la cause de la délétion observée dans un des
gènes de l’α-globine dans certaines α-thalassémies, de même qu’il semble être à l’origine des
variations dans le nombre de copies des gènes du pigment visuel vert dans le complexe des
gènes codant pour les pigments visuels sur le chromosome X ; cela aussi bien chez les
personnes ayant une vision des couleurs normales que les hommes atteints d’un défaut dans la
perception des couleurs rouge et verte. Une recombinaison entre des séquences homologues
d’ADN répété peut également être à l’origine d’une maladie génétique.

Une recombinaison entre des séquences de la famille Alu, une classe d’ADN répété et
disséminé à travers le génome, est responsable de la duplication de plusieurs exons dans le
gène du récepteur de la lipoprotéine de faible densité impliqué dans l’hypercholestérolémie
familiale. Un autre exemple concerne la mutation observée dans le cas des hommes XX
(individus dont le phénotype est masculin, mais dont le caryotype est 46, XX) résultant
également d’un échange aberrant entre les séquences Alu sur les bras courts du chromosome X
et du chromosome Y.

D’autres classes d’ADN répétitifs ont également été impliquées dans les délétions causant des
mutations somatiques dans les rétinoblastomes, une maladie dominante caractérisée par des
tumeurs malignes dans les yeux des enfants atteints. Le gène de rétinoblastome est un modèle
pour l’étude des oncogènes agissant de façon récessive. Les résultats obtenus suggèrent
qu’une recombinaison aberrante entre de courtes séquences d’ADN répété peut jouer un rôle
dans la genèse d’autres cancers humains. Un des exemples de recombinaison entre des copies
mal appariées alignées de séquences répétées explique la fréquence inhabituellement élevée de
délétions géniques dans le cas de l’ichtyose liée au chromosome X.

Le gène de la stéroïde sulfatase (STS), situé sur le bras court du chromosome X, est
complètement délété dans la grande majorité des cas d’ichtyose liée au chromosome X. Il a
été montré que dans 24 cas sur 26 examinés, la délétion est apparemment due à une
recombinaison entre de courtes séquences d’ADN répété en tandem, et localisées à environ
deux millions de paires de bases de part et d’autre du locus du gène de la STS. Puisque le
produit réciproque d’un crossing-over inégal, c’est-à-dire une duplication du gène de la STS,
n’a pas été observée, cette mutation récurrente doit nécessairement impliquer une
recombinaison intrachromosomique. On estime que 0,01% de la population a un chromosome
X dans lequel le locus STS a été délété par ce mécanisme.
122

4.2 TYPES DE MUTATIONS

4.2.1 SELON LA NATURE DU CHANGEMENT DE L’ADN

Mutations géniques / mutations chromosomiques

On reconnaît deux niveaux où les mutations peuvent se produire : les mutations géniques
lorsqu’un gène passe d’une forme allélique à une autre appelées aussi mutations aussi
mutations ponctuelles lorsque le changement se produit dans un gène et donc dans un locus
précis et les mutations chromosomiques lorsque des segments de chromosomes, ds
chromosomes entiers ou même des groupes de chromosomes subissent des altérations
génétiques, entraînant un nouvel environnement des chromsomes et des gènes qu’ils
contiennent.

Mutations somatiques / mutations germinales

Les mutations peuvent se produire soit dans un tissu somatique ou soit dans un tissu germinal.
On parle alors de mutations somatiques et de mutations germinales. Une mutation dans un
tissu somatique en développement provoque l’apparition d’une population de cellules
mutantes identiques, qui toutes descendent de la cellule qui a subi la mutation initiale. Une
population de cellules identiques qui dérivent d’une cellule mère par reproduction asexuée est
appelée clone. Comme les membres d’un clone tendent à rester groupés, ils forment
généralement des secteurs.

Plus un événement mutationnel se produit tôt dans le développement, plus le clone sera
important. Si son phénotype contraste avec celui des cellules sauvages qui l’entourent, le
secteur mutant peut-être identifié à l’œil nu. Chez les diploïdes, une mutation dominante se
manifeste dans le phénotype de la cellule ou du clone cellulaire qui la porte ; alors qu’une
mutation récessive ne sera pas exprimée, étant masquée par l’allèle sauvage. Les mutations
germinales apparaissent dans un tissu qui se différenciera en cellules reproductrices.

Si celles-ci participent à la fécondation, la mutation passera à la génération suivante. Un


individu de phénotype en apparence normal mais dont les ancêtres étaient normaux peut porter
des cellules reproductrices mutées. Celles-ci ne seront décelées que si elles participent à la
formation d’un zygote. C’est par exemple le cas de la mutation liée au chromosome X et
responsable de l’hémophilie affectant les familles royales européennes. Cette mutation trouve
probablement son origine dans les cellules germinales de la Reine Victoria ou de l’un de ses
parents. Cette mutation se manifeste uniquement chez les descendants mâles.

Mutations dominante / mutations récessives

Une mutation dominante provoque une déficience ou la mort de la cellule qui la porte. Si la
mutation survient dans un tissu dont les cellules se divisent encore, un clone muté peut se
former alors que si la mutation touche une cellule post-mitotique, donc qui ne se divise plus,
son impact sur le phénotype sera probablement négligeable.
123

Si la mutation entraîne un amoindrissement fonctionnel de la cellule, le clone cellulaire qui en


résulte s’éteindra spontanément. Si une mutation est sans effet, le clone se dilue dans la
population générale et la mutation passe inaperçue ; mais si la mutation, en agissant sur sa
croissance et sa prolifération, confère un avantage sélectif à la cellule, le clone cellulaire muté
peut s’emplifier considérablement. On explique ainsi la genèse des cancers qui apparaissent
comme des proliférations monoclonales résultant d’une altération fortuite du patrimoine
génétique d’une cellule somatique.

Les mutations qui provoquent le cancer surviennent dans une catégorie de gènes dénommés
proto-oncogènes. Plusieurs de ces gènes contrôlent la division cellulaire. Les mutations dans
ces gènes font entrer la cellule dans un cycle de multiplication non contrôlée, ce qui provoque
la formation d’un amas de cellules appelé tumeur. Signalons que lorsqu’une maladie
héréditaire dominante ou récessive liée au sexe n’est pas retrouvée dans les générations
antérieures, elle peut être due à une mutation récemment apparue dans la généalogie. Il peut
s’agir d’une néomutation ou d’une mutation de novo. La génétique classique ne permettait pas
d’apporter les preuves. Les méthodes de la génétique moléculaire permettent au contraire de
résoudre ce genre de problème.

Mutations spontanées / mutations induites

Les mutations peuvent se produire spontanément (au moment de la réplication de l’ADN) ou


être provoquées par les facteurs de l’environnement ; on parle de mutations spontanées ou
induites. Chez un hétérozygote, les effets d’une mutation peuvent être dominants ou masqués
par rapport à l’allèle sauvage ; il s’agit de mutations dominantes et/ou récessives.

Mutations ponctuelles / mutations multiples

Selon la nature du changement et le nombre de paires de bases modifiées, on peut


distinguer une mutation ponctuelle, dans laquelle il n’y a qu’une seule paire de bases touchée
et des mutations multiples, dans lesquelles au moins deux paires de bases sont impliquées. Une
mutation ponctuelle peut correspondre à la substitution, à l’insertion ou à la délétion d’une
base. Le plus souvent ce terme désigne la substitution d’un nucléotide.

Mutations en mosaïque

En considérant le cas de la myopathie de Duchenne, l’approche moléculaire suggère la


possibilité de mutations en mosaïque dans les gamètes. Il s’agit de familles où la lésion du
gène DMD est absente dans le génome constitutionnel maternel, bien qu’elle ait affecté de
manière récurrente la descendance (plus d’un enfant atteint). Cette situation ne peut résulter
que de la coexistence d’ovocytes normaux et anormaux. On parle alors d’une mosaïque. Cette
mosaïque peut s’expliquer par un accident mitotique, soit somatique au cours de
l’embryogenèse et on parle de mosaïque généralisée, soit pré-germinal dans un précurseur
gamétique et on parle de mosaïque germinale.
124
4.2.2 SELON LES CONSEQUENCES DES MUTATIONS
SUR L’INFORMATION GENETIQUE

Les conséquences des mutations sur l’ADN sont variées : elles peuvent se rapporter sur les
séquences codantes, sur les séquences non codantes mais essentielles pour la régulation des
gènes ou sur les séquences non codantes non essentielles à l’expression des gènes. La
mutagenèse dirigée est la technique la plus appropriée pour localiser les séquences
intéressantes de l’ADN.

Mutations dans les régions codantes

Mutations faux-sens

Une mutation est dite faux-sens lorsqu’elle entraîne le remplacement d’un acide aminé par un
autre sur la chaîne polypeptidique. Ce type de mutation modifie la sigification d’un codon. Si
le codon muté fait partie des 61 codons signifiants, il peut en résulter un changement d’acide
aminé dans la protéine correspondante. Les conséquences de ce changement vont dépendre de
la nature du changement et de son en emplacement sur la chaîne polypeptidique : les effets de
la mutation vont se répercuter sur la fonction et/ou la stabilité de la protéine. La mutation peut
au contraire n’avoir aucun effet ; on parle alors de mutations neutres. Dans un grand nombre
de maladies, telles que les hémoglobinopathies, la grande majorité de mutations détectées sont
des mutations faux sens.

Mutations non-sens

Normalement la traduction de l’ARNm cesse lorsqu’un codon stop est atteint. Une mutation
qui crée un codon stop cause un arrêt prématuré de la traduction, tandis qu’une mutation qui
détruit un codon stop permet à la traduction de se poursuivre jusqu’à ce qu’un autre codon
stop soit atteint. Une mutation qui crée un des trois codons stop est appelée une mutation non-
sens et le produit tronqué qui en dérive peut-être grossièrement anormal dans sa forme ou dans
sa fonction, tellement instable qu’il peut être rapidement dégradé dans la cellule. Un exemple
de mutation non-sens est la neurofibromatose (NF1), une maladie autosomique dominante
fréquente du système nerveux. L’expression clinique de la maladie est présente chez
pratiquement chacun des individus porteurs du gène.

Toutefois il existe une très grande variabilité dans l’expression de telle sorte que même à
l’intérieur d’une même famille certains individus atteints de NF1 sont gravement, tandis que
d’autres n’ont que des symptômes mineurs. Environ 50% des individus atteints de NF1 le sont
par néomutation. Le gène de NF1 a été localisé et cloné et sauf en cas de néomutation, la
maladie peut être détectée de façon présymptomatique ou même de façon prénatale par une
analyse moléculaire. C’est le cas par exemple de la mutation globine β39stop, responsable de la
thalassémie fréquente dans le bassin méditerranéen.
125
Mutations morphologiques

Morph signifie forme. Il s’agit des mutations qui modifient les propriétés visibles d’un
organisme, comme sa forme, sa couleur ou sa taille. C’est le cas par exemple des ascospores
albinos de neurospora, des ailes recourbées de Drosophila, du nanisme des plants de pois.

Mutations létales

Un allèle nouveau se reconnaît par son effet sur l’organisme. L’effet peut être létal. Parfois la
cause primaire de la mort est facile à identifier. C’est le cas par exemple de certaines
anomalies sanguines. Parfois le gène muté ne se reconnaît qu’à son effet sur la viabilité de
l’individu qui le porte.

Mutations conditionnelles

Les allèles mutants de cette classe ne s’expriment que dans certaines conditions dites
restrictives. Ils expriment un phénotype normal dans d’autres conditions dites permissives.
Dans cette classe, les mutants thermosensibles ont été très utilisés. C’est le cas par exemple
d’une classe de mutants de Drosophila connue sous le non de létaux thermosensibles
dominants. Les hétérozygotes de cette classe (H+/H) sont normaux à 20°C, température
permissive, mais meurent lorsque la température s’élève à 30°C, température restrictive.
Onagre, (synomyme des Oenotheracées) est une plante de la famille des plantes à fleurs, de
l’ordre des Myrtales, aux fleurs groupées en épis, aux fruits en capsules telles que l’Oenothère
ou anagre, le fuchsia, la macre. Onagre produit des fleurs rouges quand elle pousse à 23°C et
des fleurs blanches quand elle pousse à 18°C. Un autre exemple de mutation thermosensible
concerne les chats siamois et les lapins de l’Himalaya. Les chats siamois et les lapins de
l’Himalaya portent un pelage foncé sur certaines parties de leurs corps de température
corporelle légerement plus faible et notamment au niveau du nez, des oreilles et des pattes.

Ces zones sont dues à un allèle thermosensible qui code une enzyme permettant la production
de pigments aux extrémités de températire basse, mais restant inactive quand la température
est un peu plus élevée. L’enzyme de type sauvage responsable de la production de pigment est
fonctionnelle aux plus basses températures que l’on trouve dans les extrémités, mais perd sa
fonction catalutique partout ailleurs dans le corps, où les températures sont légèrement plus
élevées.

Des cas de mutations thermosensible sont également connus chez les virus, les bactéries et les
champignons. Dans les cas extrêmes, un organisme porteur d’un allèle mutant peut exprimer
un phénotype quand il est cultivé à une température et exprimer le phénotype de type sauvage
quand il est cultivé à une autre température. L’utilisation des mutants thermosensibles,
induites ou isolées, a contribué de façon considérable à l’étude de la génétique.
126
Mutations nutritionnelles

Chez les cellules en culture, l’altération d’une fonction biochimique provoque un arrêt de
croissance. Les mutants nutritionnels ont été abondamment exploités chez les
microorganismes. De nombreux microorganismes sont prototrophes. Ils sont autonomes du
point de vue nutritionnel et peuvent subsister sur un milieu dit minimum, c’est-à-dire composé
de simples sels inorganiques et d’une source de carbone et d’énergie. Les mutants
nutritionnels sont souvent auxotrophes. Pour pousser, ils requièrent un milieu contenant une
substance déterminée.

C’est le cas d’une classe de mutants biochimiques de champignons qui ne peut pousser qu’en
présence d’adénine. C’est aussi le cas de la moisissure de pain, Neurospora. Si Neurospora ne
peut plus synthétiser l’acide aminé leucine, il ne peut plus y avoir synthèse protéique. Mais si
de la leucine est présente dans le milieu de croissance, l’effet néfaste est surmonté. Les
mutations nutritionnelles ont joué un rôle crucial dans les études génétiques chez les bactéries.
Elles ont aussi permis l’hypothèse selon laquelle un gène fonctionne pour produire une
enzyme.

Plusieurs affections héréditaires chez l’homme sont précisément des mutations nutritionnelles.
On parle alors de désordres métaboliques héréditaires. Il s’agit des mutations qui empêchent
l’individu de métaboliser certaines substances habituellement présentes dans un régime
alimentaire normal. C’est le cas de la phénylcétonurie dont les individus porteurs sont devenus
incapables de métaboliser l’acide aminé phénylalanine et de la galactosémie due à l’incapacité
à métaboliser le galactose. C’est aussi le cas de l’intolérance au lactose. En effet, le lactose
représente 7% du lait humain et 4% de lait de la vache. Dans l’espèce humaine, le lactose est
métabolisé par une enzyme, la lactase qui clive le lactose en glucose et galactose. Au cours de
toutes premières années de vie, des quantités apporpiées de lactase sont produites. Chez de
nomnreux individus cependant, le niveau de cette enzyme décroît rapidement de façon nette.
Devenus adultes, ces personnes deviennent intolérantes au lait. Cette anomalie se rencontre
particulièrement chez les Eskimos, les Africains, les Asiatiques et les Américains originaires
de l’un de ces groupes.

Mutations à effets quantitatifs

Certaines mutations perturbent quantitativement l’expression du transcrit primaire et/ou sa


maturation en ARNm mature. C’est le cas des mutations localisées dans la région promotrice,
dans le codon d’initiation de la trascription, dans les sites consensus d’épissage, dans le site de
polyadénylation. Un exemple est celui de la mutation détectée dans la région 5’ non traduite
du gène du facteur IX chez des patients non apparentés atteints d’hémophilie B, une maladie
de la coagulation du sang liée au chromosome X. Les garçons atteints ne possèdent
qu’environ un tiers de la quantité normale de l’activité anticoagulante, ce qui suggère que la
paire de bases modifiée par la mutation est importante pour l’expression du gène du facteur IX
à un niveau normal. Des études ont montré que cette mutation empêche la liaison d’un facteur
de transcription qui active normalement le promoteur du facteur IX. Un autre exemple
concerne des mutations dans la région du promoteur 5’ ou dans la région 3’ non traduite du
127
gène de la β-globine conduisant à une diminution dans la quantité d’ARNm transcrit à partir
du gène de la β-globine.

Mutations affectant la stabilité des ARNm

Il existe des mutations dont les effets perturbent la longévité des ARNm, soit en l’augmentant
comme dans le cas de l’oncogène c-myc, soit en la diminuant.

Mutations silencieuses

De nombreuses mutations n’entraînent aucun effet sur l’expression des gènes. C’est le cas de
la plupart des mutations au niveau des introns (sauf la mutation perturbe l’épissage du transcrit
primaire). C’est aussi le cas des mutations qui se produisent hors des gènes et des séquences
qui en contrôlent l’expression. Cependant les mutations silencieuses sont parfois responsables
de polymorphismes de restriction intra- ou extra-géniques.

Mutations de l’épissage de l’ARN

Le mécanisme normal par lequel les introns sont éliminés de l’ARN natif et les exons sont
épissés pour former un ARNm mature dépend de la présence des séquences nucléotides
particulières aux charnières intron-exon (sites récepteurs) et exon-intron (sites donneurs). En
fait, il existe deux classes de mutations d’épissage : les mutations qui modifient les bases au
niveau du site d’épissage donneur ou récepteur et celles qui interfèrent avec (et dans certains
cas abolissent) l’épissage normal de l’ARN au niveau de ces sites.

Un exemple du premier cas est la substitution d’une paire de bases dans un site donneur du
gène de l’hexosaminidase A, retrouvée dans une proportion importante de patients juifs
ashkénases atteints de la maladie de Tay-Sachs. La mutation G→C survient au niveau du
dinucléotide normalement invariant GT requis pour un épissage approprié. L’ARNm de
l’hexosaminidase A détecté chez ces patients contient un intron non épissé entre l’exon 12 et
l’exon 13, ce qui concorde avec une mutation supprimant l’épissage normal au niveau de ce
site. Des mutations semblables du site d’épissage ont été observées dans d’autres maladies
génétiques, comme par exemple la phénylcétonurie, l’hémophilie B et les thalassémies. Un
deuxième type de mutations d’épissage implique des substitutions de bases dans les introns,
qui n’affectent pas les séquences des sites donneurs ou récepteurs eux-mêmes. De telles
mutations peuvent créer des sites donneurs ou récepteurs alternatifs qui entrent en compétition
avec les sites normaux aux cours de la maturation de l’ARN.

En effet, une portion de l’ARNm mature dans de tels cas peut contenir des séquences d’introns
épissés de manière inappropriée. Une substitution de G→A dans la paire de bases 110 de
l’intron1, par exemple, active le site cryptique accepteur en créant un dinucléotide AG et en
augmentant l’homologie du site et de la séquence consensus. Un codon stop est ainsi introduit
dans l’ARNm de la globine formé. Il en résulte un phénotype de β- thalassémie.

Les mutations de l’épissage du transcrit primaire peuvent être localisées dans une séquence
consensus (site donneur donneur en début d’intron ou site accepteur en fin d’intron), ce qui
128
entraîne une abolition de l’épissage ou dans une séquence cryptique puisqu’elle resemble à
une séquence consensus à une base près, dans un intron ou dans un exon. Elle entraîne un
épissage intempestif, produisant un messager tronqué dans sa partie codante, ou au contraire
encombréde séquences introniques. Dans presque tous les cas, le messager anormal est
rapidement détruit et aucune synthèse protéique n’est possible.

4.2.3 SELON LES CONSEQUENCES DES MUTATIONS


SUR LES PRODUITS DES GENES

Les propriétés physiques et chimiques de chaque protéine sont déterminées par la séquence
d’acides aminés de telle sorte que le changement d’un seul acide aminé est capable d’inactiver
une protéine. Considérons une protéine dont la structure tridimensionnelle est déterminée par
l’établissement d’une liaison ionique entre un acide aminé chargé positivement comme la
lysine et un acide aminé chargé négativement comme l’acide aspartique. La substitution de la
lysine par une méthionine, qui est un acide aminé non chargé, devrait déstabiliser la structure
tridimensionnelle. Toutefois une substitution de bases ne conduit pas toujours à un phénotype
mutant. En effet, à cause de la redondance du code génétique, certains changements ne
modifient pas la séquence d’acides aminés et certains changements d’acides aminés sont sans
conséquence significative sur la structure de la protéine. De tels changements sont dits
silencieux.

En fait, la forme d’une protéine est déterminée par une variété d’interactions que la
substitution d’un seul acide aminé ne perturbe pas toujours la structure et le fonctionnement de
la protéine. Ainsi la substitution d’une leucine par une isoleucine devrait pouvoir être réalisée
sans dommage important, alors que son remplacement par un acide aminé plus volumineux
comme la phénylalanine doit entraîner de subtiles perturbations stéréochimiques, bien que les
liaisons hydrogène soient réservées. Ceci pourrait entraîner la diminution, voire la disparition
de l’activité d’une enzyme. C’est le cas de la substitution de : a- un acide aminé polaire par
un acide aminé non polaire ; b- un acide aminé non polaire par un acide aminé polaire ; c- un
acide aminé chargé positivement par un acide aminé chargé négativement ; d- un acide
aminé à petit radical par un acide aminé à radical volumineux ; e- un acide aminé à fonction
SH par un autre type d’acide aminé.

Il existe des mutations supprimant totalement l’activité d’une protéine. C’est le cas des
délétions entraînant la perte d’un ou plusieurs acides aminés et de décalages du cadre de
lecture dans lesquels tous les acides aminés situés après le site muté sont modifiés ainsi que
des mutations non-sens dans lesquelles la synthèse d’une protéine est prématurément
interrompue.

4.3 MUTAGENESE

Les changements dans la séquence nucléotidique de la molécule d’ADN peuvent se produire


spontanément lors d’erreurs de réplication ou être provoqués. Ils peuvent provenir de : a-
l’absence d’excision d’une base incorrecte insérée ; b- l’insertion d’une base possédant des
formes tautomériques qui conduit à une substitution lors des réplications ultérieures ; c-
l’insertion d’une base modifiée chimiquement ayant une spécificité d’appariement différente
129
par rapport à la base occupant normalement cette position ; d- l’insertion d’une ou plusieurs
bases pendant le processus de réplication ; e- la délétion.

4.3.1 MUTAGENESE PAR LES ANALOGUES DES BASES

Par analogue de bases, on entend des molécules autres que les bases composant les acides
nucléiques, mais qui peuvent être insérées dans les molécules d’ADN lors du processus de
réplication. De telles substances doivent être capables de s’apparier avec la base localisée sur
le brin complémentaire servant de matrice. Si cette molécule est capable de former des
tautomères ou si elle a deux possibilités pour établir des liaisons hydrogènes, elle sera
potentiellement mutagène.

C’est le cas de la 5-bromo-uracile (5-BU), qui est un analogue de la thymine. L’atome de


brome a le même rayon de Van der waals que le groupement méthyle de la thymine. Lors des
cycles successifs de réplication, la 5-BU se comporte comme la thymine et s’apparie
essentiellement avec l’adénine. La thymine peut quelquefois prendre une forme énol qui est
alors capable de s’apparier avec la guanine. Cette conversion conduit occasionnellement à des
mutations au moment de la réplication. L’activité mutagène de la 5-BU résulte du
déplacement de l’équilibre céto-énol dû à la présence de l’atome de brome.

Cet équilibre est fortement déplacé vers la forme énol dans le cas de 5-BU par rapport à la
thymine. Ainsi, si la 5-BU remplace une thymine, lors des réplications ultérieures, la 5-BU
peut s’apparier avec une adénine ou avec une guanine. Dans ce dernier cas, à la réplication
suivante, cette guanine s’appariera avec une cytosine ; ce qui conduira au remplacement d’une
paire A – T par une paire G – C. La 5-BU est également mutagène par un autre mécanisme.
La concentration des nucléosides triphosphates est, dans la plupart de cellules, régulée par la
concentration en thymidine triphosphate (TTP). Cette régulation conduit à ce que les quantités
relatives de quatre nucléosides triphosphates soient appropriées à la synthèse d’ADN. Une
partie de ce processus de régulation repose sur l’inhibition de la synthèse de désoxy cytidine
triphosphate (dCTP) par des excès de TTP.

La 5-BU nucléoside triphosphate inhibe également la production de dCTP. Lorsqu’on ajoute la


5-BU au milieu de croissance, le TTP continue à être synthétisé par la cellule à un taux
normal, tandis que la synthèse de dCTP diminue de façon significative. Le rapport de TTP
sur dCTP devient assez élevé et la fréquence des incorporations incorrectes d’un T face à un G
augmente. La polymérase et le système de réparation de mauvais appariements sont capables
d’ôter des thymines incorrectement incorporées, mais on observe qu’en présence de 5-BU, le
taux de mauvaises incorporations peut dépasser le taux de correction.

Une thymine mal incorporée non corrigée s’appariera avec une adénine au cycle suivant de
réplication, conduisant à une transition G – C vers A – T dans une des molécules filles. Ainsi
la 5-BU induit des transitions dans les deux sens : A–T vers G–C par le processus de
tautomérisation et G–C vers A–T à cause de mauvaises incorporations. Aussi il est possible
d’obtenir la réversion des mutations induites par la 5-BU par un second traitement à la 5-BU.
Les deux changements de paires de bases induits par la 5-BU maintiennent l’orientation
originale purine –pyrimidine.
130

La 5-Bromo-uracile

Ainsi les paires de bases originales et altérées ont l’orientation Pu – Py à savoir A – T et G –


C. Si la paire originale était A – T, la paire altérée devrait être G – C. Un changement de
bases qui ne modifie pas l’orientation Pu – Py est appelé une transition. Les mutations
générées par les analogues de bases sont toujours des transitions. Des changements Pu – Py en
Py – Pu et des changements Py – Pu en Pu – Py sont appelés des transversions.

4.3.2 MUTAGENESE PAR LES MUTAGENES CHIMIQUES

Toute molécule chimique capable d’altérer une base intégrée dans une molécule d’ADN et
d’en modifier la spécificité d’appariement est mutagène. Les trois plus puissants agents
mutagènes chimiques sont l’acide nitreux (HNO2), l’hydroxylamine (HO-NH2) et l’éthyl
méthyl sulfonate (SO2 [OCH3] C2H3). L’acide nitreux convertit les groupements aminés en
groupement cétone par désamination oxydative. Ainsi la cytosine, l’adénine, la guanine sont
respectivement converties en uracile (U), hypoxanthine (H) et xanthine (X). Ces bases peuvent
former les appariements suivants : U . A, H . C et X . C.

Lorsque la cytosine et l’adénine sont désaminées, on obtient les changements suivants : G .


C→ A. T et A . T → G . C. Puisque G et X peuvent tous les deux s’apparier avec C, le
changement ne devrait pas être directement mutagène. Toutefois, les transitions G . C → A . T
ont été observées chez les phages à ADN simple brin au niveau d’une guanine. Ce qui suggère
que la xanthine a probablement une forme tautomérique inconnue, capable de s’apparier avec
la thymine.

L’hydroxylamine réagit spécifiquement avec la cytosine en convertissant celle-ci en une base


modifiée capable de s’apparier avec l’adénine. Ainsi une paire G – C devient une paire A – T.
Le processus chimique d’altération est complexe. L’éthyl méthyl sulfonate (EMS) ainsi
qu’une substance apparentée l’éthyl éthane sulfonate (EES) sont des agents alkylants, très
réactifs chez les eucaryotes. De nombreux sites dans l’ADN sont alkylés par ces agents.
131
L’addition d’un groupement alkyl (méthyl ou éthyl, par exemple) sur l’oxygène de la guanine
et de la thymine impliqué dans la formation des liaisons hydrogènes est d’une importance
capitale pour l’induction des mutations. Ces alkylations provoquent de mauvais appariements
d’un G avec un T qui conduisent à des transitions A . T → G . C et G . C → A . T. Un
second mécanisme de mutagenèse par des agents alkylants est l’induction des systèmes
générateurs d’erreurs tels que le système de réparation SOS. Ce mécanisme est une source de
transitions.

4.3.3 MUTAGENESE PAR LES RAYONS ULTRAVIOLETS

La lumière ultraviolette est un puissant agent mutagène. Cette mutagenèse passe par la
formation de dimères de thymine et des dimères d’autres pyrimidines. Chez E. coli, le nombre
de mutations induites par les ultraviolets peut être diminué par une exposition à la lumière
visible (photoréactivation). De plus, les rayons ultraviolets ne sont pas mutagènes chez des
mutants bactériens qui ont perdu la capacité de déclencher le système de réparation SOS.

4.3.4 MUTAGENESE PAR L’ACTION DES AGENTS INTERCALANTS

L’acridine orange, la proflavine et l’acriflavine sont des molécules planes composées de 3


cycles dont les dimensions sont approximativement du même ordre de grandeur que celles des
paires de purines-pyrimidines. Dans des solutions aqueuses, ces substances forment des
empilements et sont capables de s’insérer entre deux paires de bases d’une molécule d’ADN.
Ce processus est appelé intercalation.

Structure de deux dérivés d’acridine

Intercalation

Puisque l’épaisseur d’une molécule d’acridine orange est pratiquement identique à celle d’une
paire de bases et comme les deux bases sont normalement en contact, l’intercalation d’une
molécule d’acridine orange entraîne le décalage des paires de bases adjacentes d’une distance
égale à l’épaisseur d’une paire de bases. Ceci modifie le déroulement de la réplication, sans
que l’on en connaisse le mécanisme. Lorsqu’un ADN contenant des molécules d’acridine est
répliqué, il apparaît dans sa séquence des bases additionnelles. Le plus fréquent consiste en
l’addition d’une seule base, bien qu’occasionnellement deux bases peuvent être ajoutées. Il
132
peut également se produire des délétions d’une seule base, mais cet événement est beaucoup
moins fréquent que l’événement d’addition. Les mutations de ce type sont appelées décalage
de cadre de lecture ou mutations framshift. La lecture de la séquence nucléotidique se faisant
par groupe de trois bases, l’addition d’une base modifie le cadre de lecture.

4.3.5 MUTAGENESE DIRIGEE

La mutagenèse dirigée in vitro est une technique utilisée actuellement de manière courante.
Elle offre la possibilité d’agir sur la relation entre la séquence d’un gène et la fonction de la
protéine qu’il code. Elle peut être schématisée en trois étapes principales : a- une étape de
modification de la séquence ; b- une étape de transformation et c- une étape de sélection des
cellules mutantes. On peut distinguer la mutagenèse aléatoire et la mutagenèse dirigée. La
mutagenèse aléatoire produit des mutations à des emplacements non déterminés d’un vecteur.
Elle permet de réaliser une première investigation sur les fonctions codées par telles ou telles
partie d’un gène. L’une des méthodes consiste à linéariser le vecteur au niveau d’un site de
restriction unique se situant dans la séquence du gène à muter. A l’aide d’une nucléase qui
élimine les extrémités monocaténaires, on réalise une délétion de quelques nucléotides.

Une mutation par addition peut également être réalisée en provoquant la synthèse des
séquences complémentaires des extrémités monobrins ou en insérant un fragment d’ADN
étranger. Une autre technique de mutagenèse aléatoire consiste à modifier chimiquement la
séquence nucléotidique. La mutagenèse dirigée concerne un endroit précis sur l’ADN. Elle
permet de modifier la séquence d’un gène de manière prédétermisée. Noter que les techniques
de mutagenèse dirigée sont devenues simples et rapides depuis que des oligonucléotides de
synthèse sont disponibles. Lorsque la région à muter porte des sites de restriction uniques, il
est possible d’enlever un fragment d’ADN du gène sauvage et de le remplacer par un autre
fragment constitué d’oligonucléotides mutés. Ce processus est appelé mutagenèse par cassette.
Une autre méthode de mutagenèse dirigée peut être utlisée même lorsque le gène à muter ne
porte pas de sites de restriction.

Cette méthode consiste à : 1- préparer de l’ADN monoaténaire à partir de cellules transfectées


par un phage ou un phagemide (hybride de phage et de plasmide) ; 2- hybrider un
oligonucléotide portant une mutation sur une base (substitution, insertion, délétion). Pour une
bonne efficacité de l’hybridation, la mutation est placée au milieu de la séquence de
l’oligonucléotide ; 3- produire le brin complémentaire en utilisant l’oligonucléotide muté
comme amorce ; 4- ligaturer l’hétéroduplex (un brin muté, un brin sauvage) ; 5- transformer
une souche bactérienne ; 6- sélectionner les bactéries portant la mutation. La cellule ne
contient généralement qu’un seul type de plasmide ; ainsi lors de la réplication, l’un ou l’autre
des deux plasmides issus de la réplication (plasmide sauvage et plasmide muté) sera conservé
par la cellule alors que l’autre sera détruit.

Pour augmenter la proportion des clones portant la mutation et réduire par conséquent les
expériences de criblage, on peut faire répliquer l’ADN matrice dans une souche ung-
déficiente en uracile déglycosydase de manière à introduire des résidus uracile à la place de
thymine (ici il n’y a pas de possibilité de réparation à cause de la mutation ung-). L’ADN
monobrin servira de matrice comme précédemment. La transformation est faite dans une
133
souche ung+ qui va détruire le brin uracilé et copier le brin muté. D’autres méthodes plus
récentes peuvent être réalisées directement sur les vecteurs de clonage ou d’expression sans
préparation d’ADN simple brin. Elles sont toutes basées sur l’hybridation d’un oligonucléotide
muté et son allongement in vitro. L’enrichissement en plasmides mutés est réalisé par
digestion avec une endonucléase, Dpn1, qui ne dégréde que les brins parentaux méthylés.

4.3.6 GENES MUTATEURS

Chez E. coli, il existe des gènes qui, lorsqu’ils sont mutés, causent des mutations dans les
gènes localisés n’importe où dans le génome. On les appelle des gènes mutateurs. Dans leur
état normal, ces gènes sont impliqués dans le maintien de l’intégrité du matériel génétique.
Parmi les gènes dont l’altération entraîne l’apparition d’un phénotype mutateur, on peut citer :
a- le gène de l’ADN polymérase dont certaines mutations diminuent ou suppriment
l’activité 3’→ 5’ exonucléasique de l’ADN polymérse ; b- le gène dam responsable de la
méthylation permettant au système de réparation de distinguer le brin parental du brin
néoformé ; c- Le gène codant pour l’enzyme responsable de l’excision des bases mal
appariées ; d- Les gènes de contrôle du système de réparation d’erreurs SOS.

4.3.7 POINTS CHAUDS DES MUTATIONS

Lorsque plusieurs mutations touchant un seul gène sont cartographiées, elles se répartissent
dans l’ensemble du gène. Toutefois, les mutations sont fréquentes à certains sites (jusqu’à 100
fois plus). Ces sites sont appelés des points chauds. Environ 5 % des cytosines d’une molécule
d’ADN typique sont sous une forme méthylée, la 5-méthyl cytosine (MeC). Le rôle de MeC et
d’autres bases méthylées n’est pas clairement compris dans la plupart des cas. La présence de
MeC ne perturbe pas la réplication de l’ADN. Cependant les MeC sont susceptibles de subir
des désaminations spontanées. Lorsque la cytosine est désaminée, il se forme une uracile qui
sera éliminée par l’uracile N-glycosylase.

Toutefois, lorsque la MeC est désaminée, il se forme une 5-méthyluracile, qui est l’autre nom
de la thymine. Ainsi une paire G . MeC devient une paire A . T. Les désaminations spontanées
peuvent se produire sur des molécules d’ADN ne se répliquant pas (cellules en repos) et les
deux brins seront également méthylés par le système de méthylation A. Ainsi le système de
réparation de mauvais appariements ne reçoit aucun signal lui indiquant que la paire correcte
est la paire G . C. Il faut donc convertir la paire G . T en paire A. T. Ainsi la fréquence des
mutations peut être élevée à un site MeC. Une transition G – C vers A – T ne produira un
mutant que si ce changement conduit à une substitution d’un acide aminé affectant l’activité
du produit du gène. De tels sites MeC sont assez rares, ainsi les points chauds ne devraient pas
être particulièrement fréquents.

4.3. MUTAGENESE INSERTIONNELLE


DES SOURIS TRANSGENIQUES
134

Il s’agit d’une intégration génomique d’une séquence d’ADN cloné. L’ADN exogène nu peut
être introduit soit par micro-injection dans le pronucleus d’un ovocyte fécondé, soit par
transfection ou électroporation dans des cellules embryonnaires. L’ADN exogène peut
également faire partie d’un rétrovirus recombiné utilisé pour infecter un embryon à différents
stades. Dans les deux cas, le pourcentage d’insertion est de 5%. Cependant le type
d’intégration dépend du procédé utilisé. La micro-injection entraîne l’intégration de plusieurs
copies en tandem, en un site chromosomique unique, mais variable selon le cas. En général
l’intégration s’accompagne de perturbations importantes dans le génome de la cellule hôte :
délétions, duplications, réarrangements plus ou moins complexes.

L’infection rétrovirale entraîne l’intégration d’une copie unique de l’ADN exogène. Elle
perturbe peu ou pas l’ADN hôte au site d’intégration. Elle détermine une intégration
préférentielle au niveau des sites d’hypersensibilité à la DNase 1. Ces sites se retrouevent
fréquemment à l’extrémité 5’ des gènes actifs. L’intégration est aléatoire et peut toucher
n’importe quel gène (dont le fonctionnement sera perturbé). La lésion génétique est récessive
chez les souris transgéniques directs qui sont hétérozygotes et produisent des gamètes portant
l’anomalie dans leur lignée germinale. Par croisement on peut obtenir des homozygotes. Si la
pathologie est létale, la souche est maintenue par les hétérozygotes. En 1983, Jaenisch a
montré que l’infection d’un embryon de souris de 8 jours par le virus murin de Moloney (M-
MuLV) pouvait produire une mutation insertionnelle bien tolérée à l’état hétérozygote, mais
létale à l’état homozygote.

Une mutagenèse ciblée consiste à cibler le site de la mutagenèse insertionnelle en introduisant


une séquence homologue au gène que l’on veut léser. La séquence homologue reconnaît
électivement le gène endogène et provoque une recombinaison homologue responsable soit
d’une insertion par addition, soit d’une insertion par remplacement selon la construction
utilisée. Il en résulte une inactivation du gène cible. Par rapport à la mutagenèse insertionnelle
aveugle, ce procédé représente un progrès considérable parce qu’il est dirigé. Son rendement
est cependant de l’ordre de 1 cellule sur 1000.
4.4 REVERSION

La mutation réverse ou réversion consiste au passage du phénotype mutant au phénotype


sauvage. Dans certains cas, la réversion ne recrée pas parfaitement la séquence nucléotidique
du type sauvage. Ainsi l’événement de réversion ne se passe pas au niveau du site de la
mutation, mais entraîne l’apparition d’une seconde mutation à un nouveau site. De telles
mutations sont appelées réversion à un second site ou mutation suppressive. Dans d’autres
cas, la mutation réverse ne se produit pas dans le gène muté. Ce qui permet de distinguer deux
types de réversions : la réversion intragénique et la réversion extragénique.

Réversion
135

Réversion intragenique

Considérons une protéine hypothétique contenant 97 acides aminés et dont la structure tertiaire
est déterminée par une interaction ionique entre un acide aminé chargé positivement (+) situé à
la position 18 et un acide aminé chargé négativement (–), situé à la position 64. Le
remplacement de l’acide aminé (+) par un acide aminé (–) conduira à une protéine inactive.
Trois types d’événements de réversion peuvent restaurer l’activité de la protéine : 1° le retour
à la position 18 de l’acide aminé (+) originel ; 2° le remplacement à la position 18 de l’acide
aminé (–) par un acide aminé différent de celui d’origine (+) ; 3° le remplacement d’un acide
aminé (–) situé à la position 64 par un acide aminé (+). Si la substitution d’un acide aminé A
par un acide aminé X, qui conduit à un phénotype mutant, peut être compensée par la
substitution d’un acide aminé B par un acide aminé Y, alors A et B sont voisins dans la
structure tridimensionnelle ou sont compris dans les régions interagissantes.

Réversion extragenique

Il s’agit des changements mutationnels touchant un second gène qui éliminent le phénotype
mutant. Le premier type de réversion extragénique ne peut se produire que si deux protéines
interagissent : une mutation touchant le site de fixation de la protéine A empêche l’interaction
avec la protéine B. Une seconde mutation peut altérer le site de fixation de la protéine B de
sorte que l’interaction entre A et B est restaurée. L’obtention de telles réversions
extragéniques est en général une bonne indication de l’existence d’interaction entre deux
protéines et présente un exemple des informations qui peuvent être obtenues à partir des
résultats génétiques sur la structure moléculaire d’une protéine.

Un second type de réversion extragénique correspond à des mutations intervenant à un second


site qui ont la propriété de supprimer non seulement les effets de la première mutation, mais
également de supprimer des mutations localisées dans d’autres gènes. Ce type de réversion est
obtenu par la mutation de certaines molécules d’ARNt ou de certaines aminoacyl synthétases.
Prenons le cas d’une mutation non-sens. Par exemple, un seul changement de base dans
n’importe lequel des codons AAG, CAG, GAG, UCG, UUG, UGG, UAC, UAU peut conduire
à l’apparition d’un codon non-sens UAG. Si de telles mutations se produisent à l’intérieur
d’un gène, il en résultera la production d’une protéine mutante, et ce parce qu’il n’existe pas
naturellement d’ARNt dont l’anticodon soit complémentaire du codon non-sens UAG.
136
Ainsi la présence d’un tel codon non-sens dans la phase codante du gène conduira à une
terminaison prématurée lors de la traduction de l’ARNm correspondant et à la synthèse d’une
protéine mutante plus petite que la protéine sauvage. En général, ce type de protéine mutante
n’est pas fonctionnel, sauf si la mutation est proche de l’extrémité carboxyle terminale de la
protéine. Il peut exister dans une bactérie, dite mutant suppresseur, des molécules d’ARNt
mutées capables de s’apparier avec un codon stop particulier.

De telles molécules d’ARNt sont appelées ARNt suppresseurs et les mutations sur lesquelles
ils peuvent agir sont dites suppressibles. Les ARNt suppresseurs sont issus de mutations
touchant les gènes codant pour ces ARNt. Comme le changement d’une base dans
l’anticodon est suffisant pour modifier la complémentarité d’un codon et d’un anticodon, il
existe 8 ARNt différents qui par le changement d’une seule base de l’anticodon peuvent
reconnaître un codon UAG. Ainsi les acides aminés suivants pourront être insérés au niveau
d’un codon non-sens : Lys (AAG), Gln (CAG), Glu (GAG), Ser (UCG), Trp (UGG), Leu
(UUG), Tyr (UAC et UAU).

Les principales caractéristiques des suppresseurs des mutations non-sens sont : a- un


suppresseur d’UAG n’est pas capable de redonner une protéine fonctionnelle à chaque
événement de suppression ; b- la suppression peut ne pas être totale pour deux raisons : 1° la
protéine mutante obtenue par la suppression du codon non-sens peut ne pas avoir la même
activité que la protéine sauvage et 2° le codon non-sens n’est pas systématiquement
supprimé ; c- une cellule ne peut survivre à la présence d’un ARNt suppresseurs qu’à
condition de posséder au moins deux copies du gène codant pour l’ARNt muté.

Les suppressions dérivent souvent de la mutation d’une copie d’un ARNt appartenant à une
famille d’ARNt redondants, c’est-à-dire dont le gène existe en plusieurs copies. De cette
façon, il y aura dans la cellule, en plus de l’ARNt suppresseur, un ARNt capable de
reconnaître l’ancien codon. Il existe dans la cellule des facteurs de terminaison de la
traduction capables de reconnaître un codon d’arrêt même si celui-ci est occupé par un ARNt
suppresseur.

La conséquence de cette reconnaissance est que la suppression est faible. Souvent les arrêts de
traduction sont réalisés par des paires de codons stop distincts tels que UAG–UAA. Ainsi
l’existence d’un suppresseur d’UAG ne devrait pas empêcher la fin normale de la traduction
d’une protéine. Il existe également des suppresseurs des mutations faux-sens. La suppression
faux-sens doit être nécessairement un processus inefficace. Ainsi les suppressions faux-sens se
font généralement à une fréquence d’environ 1 %.

4.5 MUTATIONS PAR DELETION, TRANSPOSITIONS OU INVERSIONS

Ce sont des mutations qui couvrent des segments entiers des chromosomes. Elles ne réversent
jamais au type sauvage, elles ne présentent jamais de recombinaison avec une mutation
ponctuelle située dans la région sur laquelle elles s’étendent. Des délétions correspondant à la
perte physique d’un fragment du matériel génétique sont obtenues par action des
rayonnements ionisants, de l’acide nitreux ou spontanément. Certaines délétions peuvent
représenter jusqu’à 1% du chromosome. Il a été observé que des segments de chromosome
137
étaient absents de leur localisation habituelle et avaient été insérés ailleurs à la suite d’un
traitement d’E. coli par des rayons X ou par l’ypérite azotée. Ces transpositions sont détectées
lorsqu’elles ont lieu sur des mâles Hfr de E. coli K12, grâce à la technique de l’appariement
interrompu qui détecte toute anomalie dans l’ordre de transfert des caractères.

ELEMENTS GENETIQUES TRANSPOSABLES

Il est bien établi que les gènes sont localisés en position fixe sur les chromosomes. Cette image
semble être mise en question par l’existence d’éléments chromosomiques capables de se
mettre en mouvement et de se déplacer vers un autre locus. De nos jours, on s’est rendu
compte que ces éléments transposables sont très répendus dans la nature. Toute une série de
noms évocateurs ont été appliqués à ces éléments : éléments de contrôle, gènes sauteurs,
cassettes, gènes mobiles, éléments génétiques mobiles et transposons. Le terme le plus correct
et qui embrasse tous les éléments de ce type est « éléments génétiques transposables ».

Le terme transposition a été longtemps utilisé pour décrire le transfert de segments de


chromosome d’une position vers une autre au cours des réarrangements structuraux majeurs.
Les éléments génétiques transposables semblent pouvoir se déplacer au sein d’un même
chromosome ou même vers d’autres chromosomes. Il s’agit de longs segments d’ADN
(quelques centaines à quelques milliers de paires de bases) qui sont mobiles. Les éléments
transposables se répliquent par un mécanisme complexe : l’une des deux copies reste au site
d’insertion originel et l’autre copie va s’insérer dans une autre région du chromosome. Ce
processus d’insertion est appelé transposition.

Lors des événements de transposition, un élément transposable peut s’insérer dans un gène,
rendant de ce fait le gène inactif. Quelques éléments transposables contiennent des sites de
terminaison de la transcription. Si de tels éléments s’insèrent entre deux gènes transcrits en un
ARNm polycistronique ou dans la région du promoteur, tous les gènes situés en aval de
l’insertion ne seront plus transcrits. De telles mutations appartiennent à la classe des mutations
polaires. On ne sait pas vraiment quel est le rôle génétique qu’ils jouent. Ils se détectent par
les anomalies qu’ils produisent dans la structure et la fonction des gènes localisés aux abords
des sites où ils s’installent. Ils ont été détectés dans des phages, des bactéries, des
champignons, des plantes supérieures, des virus et des insectes. Bien que les éléments
transposables aient été découverts chez les eucaryotes, leur nature moléculaire a été comprise
d’abord chez les bactéries et les phages.

Séquences d’insertion

Les séquences d’insetion ou éléments IS sont des segments d’ADN qui peuvent se déplacer
d’une position vers une autre, soit sur un même chromosome, soit sur un autre chromosome.
Lorsqu’ils s’introduisent au sein d’un gène, ils en interrompent la séquence codante et de ce
fait l’inactive. S’ils sont localisés en aval du promoteur dans un opéron, les éléments IS, à
cause de leur taille et parce qu’ils contiennent des signaux de terminaison de la transcription et
de la traduction, bloquent égalemnt l’expression des autres gènes de l’opéron. C’est en partie
grâce à cette propriété qu’ils furent découverts. A l’origine, ils ont été découverts chez E. coli,
138
plus précisément dans l’opéron gal. Les trois gènes adjacents E (épimérase), T (transférase) et
K (kinase) sont transcrits ensemble à partir du même promoteur.

Mutations polaires

Les IS ont été décelés chez des mutants sélectionnés pour leur déficience dans l’activité de la
galactokinase. On pouvait s’attendre à ce que ces mutations se localisent dans le gène gal K
lui-même. En fait, elles se retrouvent en divers sites de l’opéron. Certaines mutations
localisées dans le gène de la transférase n’expriment pas la kinase, mais synthétisent
normalement l’épimérase. Des mutations de ce type affectent donc l’expression des gènes
localisés en aval dans l’opéron. On connaissait déjà des mutations montrant cette
directionalité ou polarité. Elles avaient été baptisées du terme approprié de mutations polaires.
Certaines mutations non-sens ont un effet polaire. Mais les mutations dont il est question ici
ont des propriétés nouvelles. Bien qu’elles puissent réverser, (il ne s’agit donc pas de
délétions), leur fréquence de réversion n’est augmentée par aucun mutagène. Il ne s’agit donc
ni de mutations non-sens, ni de mutations de phase, ni de mutations ponctuelles d’aucune
sorte. C’est dans les années 60 que l’on a compris qu’il s’agissait d’insertion des segments
d’ADN.
Identification de différents éléments IS

La question qu’il convient de se poser est de savoir si ces insertions représentent un segment
d’ADN aléatoire ou une séquence bien définie. Des expériences d’hybridation ont révélé que
les mutations d’insertion sont dues à un petit nombre de sséquences. Ces expériences
requièrent l’isolement des phages λdgal qui portent l’une ou l’autre mutation polaire. On en
extrait alors l’ADN qui est ensuite utilisé pour préparer in vitro de l’ARN radioactif. Certains
des fragments de cet ARN s’hybrident à l’ADN des phages mutants, mais pas à celui des
phages sauvages, ce qui confirme la présence d’une séquence additionnelle chez le mutant. On
peut ensuite utiliser ces fragments particuliers pour tester l’ADN d’autres phages mutants.
Cette nouvelle expérience réévèle que le même segment d’ADN se retrouve chez d’autres
mutants mais qu’il est localisé en des endroits différents.

Les mutants d’insertion sont classés en fonction de leur profil d’hybridation. La première
séquence IS qui fut découverte dans l’opéron gal mesure 800 pb et s’appelle IS1. Une autre
sauvage E. coli – K12 contient de nombreux IS. On y trouve 8 copies de l’élément IS1, 5
copies de l’élément IS2 et des copies d’autres IS. Le fait que l’on puisse trouver une séquence
IS dans n’importe quel gène que l’on étudie montre que ces éléments sont doués de mobilité et
se transposent au sein du gnénome de leur hôte. Mais l’insertion ne provoque une mutation ou
un autre type d’altération détectable d’une fonction cellulaire que lorsqu’elle se produit en
certaines positions particulières du génome, par exemple au sein du génome. Les séquences IS
sont aussi présentes sur certains plasmides et certains phages. Le génome bactérien contient
des segments d’ADN appelés IS qui peuvent de déplacer d’une position vers une autre sur le
chromosome ou vers un autre chromosome.
139
Orientation des IS

Les deux fibres d’ADN du phage λdgal ont des densités de flottaison différentes parce qu’elles
contiennent des séquences de bases différentes. Après dénaturation, elles peuvent être séparées
par ultracentrifugation. Dans certains cas, les mêmes fibres des deux mutants différents
peuvent former une molécule hybride qui, sous le microscope électronique, présente un aspect
caractéristique : un court segment double-brin se terminant par 4 longues queues simple – brin.
Cette structure s’explique si l’on suppose que l’IS est inséré dans des orientations opposées
chez les deux mutants.

Transposons

Des souches de la bactérie Shigella isolées des patients soignés dans les hôpitaux japonais
dans les années 50 se révélèrent résistantes à toute une série d'antibiotiques, dont la pénicilline,
la tétracycline, les sulfamides, la streptomycine et le chloremphénicol. Cette résistance
multiple se comportait comme une entité transmissible en une fois à la descendance
bctérienne, mais aussi à d’autres souches de Shigella sensibles et même à d’autres espèces
bactériennes apparentées. Les structures qui véhiculent ces résistances, de bactérie en
bactérie, sont des plasmides qui ressemblent au facteur F appelés plasmides R (pour
résistance). Ces plasmides R sont transférés rapidement de cellule à cellule par conjugaison
comme l’épisome F chez E. coli. Ces plasmides n’étaient que les premiers d’une grande
famille de structures semblables à F qui ont été identifiés depuis lors. Ils peuvent porter de
nombreux gènes différents.

Structure physique des transposons

Lorsqu’on isole l’ADN d’un plasmide qui confère par exemple la résistance à la kanamycine
qu’on le dénature et qu’on permet ensuite à l’ADN simple – brin ainsi obtenu de se renaturer
lentemment, l’observation au microscope électronique révèle la formation des structures
particulières : certaines fibres se présentent sous la forme d’un cercle auquel est appendue une
structure en forme de décapsuleur. Le manche en est formé d’ADN double – brin qui résulte
de l’appariement de deux séquences répétées inverses (IR) présentes sur le plasmide. Des
études ultérieures ont révélé que, dans de nombreux cas, les séquences IR sont en fait
constituées par une paire de séquences IS. Deux séquences IS10, par exemple, forment les
extrémités d’un élément qui code pour la résistance à la tétracycline. Mais dans d’autres cas,
ces séquences sont nettement plus courtes.

Les gènes qui codent pour la résistance aux antibiotiques ou pour d’autres déterminants
génétiques portés par certains plasmides, sont localisés entre les séquences IR et consituent la
boucle du décapsuleur. C’est l’ensemble des séquences IR et des gènes qu’elles encadrent
qu’on appelle transposon(Tn). Les transposons sont donc plus longs que les éléments IS
puisqu’ils contiennent d’autres séqunces en supplément. Le reste du plasmide qui contient les
gènes qui assurent son transfert d’une bactérie à l’autre est appelé région RTF (pour fonctions
de transfert des résistances.
140
Mouvement des transposons

Un transposon peut sauter d’un plasmide vers un autre plasmide ou d’un plasmide vers un
chromosome. Un grand plasmide d’E. coli, R64-1, par exemple contient un transposon (Tn3)
qui code pour la résistance à l’ampicilline (ampR). Les transposons ont été découverts en tant
qu’éléments génétiques mobiles qui confèrent la résistance aux antibiotiques. Nombre d’entre
eux sont constitués d’éléments IS qui flanquent un ou plusieurs gènes déterminant la résistance
aux drogues. Les IS et les transposons sont maintenant regroupés sous le seul vocable
« éléments transposables ».

Phages Mu

Le phage Mu partage avec les IS certaines propriétés caractéristiques. Son étude fournit les
premiers indices sur les mécanismes moléculaires de la transposition chez les procaryotes. La
double hélice d’ADN de Mu est constituée de 36000 pb et est donc bien plus longue que celle
d’un IS. Mais comme les IS, l’ADN du phage s’insère n’importe où et dans l’une ou l’autre
orientation dans les génomes bactériens et plasmidiques. Comme eux, il provoque une
mutation en son site d’insertion (Mu est une abréviation de mutateur). Ces mutations ne
réversent pas sinon à la suite de certains traitements particuliers. Lorsque de telles réversions
se produisent, le gène récupéré n’est pas différent du gène sauvage.

L’ADN du phage contenu dans les particules virales de Mu est linéaire et contient à ses
extrémités de petites séquences qui proviennent du chromosome de la bactérie sur laquelle le
phage s’est multiplié. Chaque génome viral contient des séquences différentes. Pour cette
raison, elles sont appelées extrémités viables. Elles sont là parce que l’ADN présent dans la
particule virale est emballé directement à partir des copies de l’ADN viral intégrées en
différents endroits du chromosome bactérien.

Le phage Mu peut jouer un rôle que l’on peut qualifier « d’agrafe génétique » en mobilisant et
en fusionnant au hasard deux segments d’ADN totalement dépourvus d’homologie. Il peut par
exemple fusionner le phage λ ou l’épisome F avec le chromosome bactérien. Le chromosome
résultant d’une telle fusion contient l’ADN transporté en sandwich entre deux copies de Mu
dans la même orientation. Le phage Mu peut aussi transférer des marqueurs bactériens sur un
plasmide. Ici encore l’ADN transféré est en sandwich entre deux copies de Mu. Enfin le phage
Mu peut provoquer divers réarrangements chromosomiques.

4.6 UTILISATION DES MUTATIONS DANS L’ELEVAGE

Une manière d’obtenir une variété plus performante de plantes de culture consiste à isoler un
hybride et de sélectionner le recombinant désiré au sein de la descendance. Cette approche tire
profit de la variation naturelle qui existe parmi les variétés déjà isolées ou qui poussent dans la
nature. Mais on peut également induire la variabilité par traitement mutagène. On parle alors
d’une variabilité produite par intervention humaine. On peut procéder de diverses manières :
141
1- mutagéniser le pollen avant pollinisation : les mutations dominantes apparaîtront à la
génération suivante. Les mutations récessives pourront être mises en évidence par
autofécondation ; 2- mutagéniser les graines : une cellule de l’embryon qu’elles renferment
peut-être atteinte et devenir partie, soit d’un tissu germinal, soit d’un tissu somatique. Dans le
dernier cas, toute mutation dominante se manifestera dans la plante dérivée de cette graine,
mais ce sera la fin du voyage pour toute mutation. Par contre, une mutation dans un tissus
germinal se manifestera au sein des générations suivantes ; ce qui permettra de sélectionner les
mutants désirés.

4.7 UN CAS DE MUTATION CHEZ L’HOMME : LE CANCER

Il est établi aujourd’hui que le cancer est une maladie génétique. Les causes en sont multiples,
mais toutes agissent sur une classe de gènes particuliers, les proto-oncogènes. Normalement
les proto-oncogènes exercent des fonctions fondamentales dans la vie cellulaire, se rapportant
généralement au contrôle de la division. Plusieurs types d’effets peuvent modifier l’état
fonctionnel d’un proto-oncogène et en faire un oncogène, ce qui entraîne la cellule dans les
deux comportements cancéreux typiques : la division non contrôlée conduisant à la formation
de tumeur et la dispersion des foyers tumoraux secondaires (envahissement par métastases).
L’un des principaux mécanismes par lesquels les proto-oncogènes peuvent être transformés en
oncogènes et provoquer le cancer est la mutation.

Des mutations spontanées ou dues à un facteur de l’environnement surviennent dans un proto-


oncogène et la cellule où il se trouve se divise anormalement et forme une tumeur. Etant donné
toutes les cellules de la tumeur contiennent le même oncogène muté, on peut dire que la
tumeur est en fait un clone mutant. Ceci constitue une première raison pour considérer le
cancer comme une maladie génétique. Le génome peut également être impliqué dans la
prédisposition au cancer. Des études généalogiques montrent que certains types de cancer se
manifestent fréquemment dans certaines familles. Il existe en fait des cas où la possession de
certains allèles est virtuellement la garantie d’un cancer. De nombreuses mutations favorisant
la croissance de tumeurs peuvent se produire.

Ces mutations sont apparentées sur le plan de mécanismes mis en jeu et peuvent être
comprises en termes de fonctions cellulaires. Dans certains cas comme celui du cancer du
côlon, on peut identifier une série de mutations indépendantes qui contribuent à la
progression de la cellule de l’état normal à celui d’une tumeur bénigne et ensuite à celui d’un
état réellement cancéreux.

Même parmi les tumeurs malignes, les vitesses de prolifération et les aptitudes à envahir
d’autres tissus, c’est-à-dire à créer des métastases, sont très différentes. Même lorsque l’état
tumoral est atteint, d’autres mutations qui facilitent la prolifération et l’envahissement
s’accumulent dans les cellules de la tumeur. Ainsi donc, certaines mutations récessives qui
contribuent à la formation de tumeurs inactivent des gènes suppresseurs de tumeurs dont la
fonction normale est d’inhiber la prolifération cellulaire.

Deux exemples permettent de clarifier ces deux concepts, l’un concerne un allèle récessif et
l’autre un allèle dominant. Le premier est celui de xeroderma pigmentosum, une
142
prédisposition autosomique récessive au cancer de la peau. Chez les individus qui en souffrent,
la peau se couvre de lésions cancéreuses. Cette prédisposition met en cause un élément du
système de réparation de l’ADN. Des modifications de l’ADN susceptibles de conduire à des
mutations se produisent constamment, chez tout le monde, à la suite de ratés biochimiques,
mais les cellules disposent d’enzymes de réparation qui éliminent ces modifications de l’ADN
de sorte que fort peu de mutations apparaissent. Les cancers qui apparaissent chez des
individus normaux représentent des cas où les lésions ont par hasard échappé au système de
réparation.

Dans l’affection xeroderma pigmentosum, c’est le système enzymatique qui normalement


répare les lésions potentiellement mutagènes causées par les rayons ultraviolets (UV) qui est
déficient. Les cellules cutanées sont particulièrement enclines à subir les effets des UV,
puisque ceux-ci sont une composante de la lumière solaire. Par conséquent, en l’absence d’un
système de réparation efficace, de nombreuses lésions cancéreuses se développent. Cette
prédisposition est due à un allèle récessif ; dans un hétérozygote, l’allèle normal apporte le
potentiel de réparation nécessaire.

Le deuxième exemple est le rétinoblastome, un cancer de la rétine. Le rétinoblastome peut


apparaître de deux manières : soit sporadiquement, sans antécédents familiaux (la tumeur
n’affecte généralement qu’un œil, elle est dite unilatérale), soit la manifestation d’une
prédisposition héréditaire que l’analyse de la généalogie fait apparaître comme un allèle
autosomique dominant. Dans ce type de rétinoblastome, les deux yeux sont fréquemment
touchés, on parle de tumeur bilatérale.

Les deux types s’expliquent par le même mécanisme. Tous les deux cas de rétinoblastome
sont dus à des mutations dans un gène, appelé R. Les allèles mutés – r – sont tous récessifs.
Dans le rétinoblastome héréditaire, le déterminant transmis est un allèle r, de sorte que toutes
les personnes qui développent le cancer sont nées avec le génotype Rr. Ceci semble à
première vue contradictoire avec le caractère dominant de cette affection. Le cancer survient
dans des cellules qui sont devenues rr. Dans 30 % des cas environ, le deuxième allèle sera le
produit d’une mutation au hasard et dans les 70 % restants, d’un crossing-over mitotique. En
fait, lorsque c’est une mutation qui intervient c’est un nouvel allèle qui apparaît, de sorte que
le génotype réel est rr’. Dans le cas de crossing-over mitotique, c’est l’allèle original qui
devient homozygote, rr.

A quel moment intervient la prédisposition ? Si l’on hérite d’un allèle mutant, le seul autre
allèle doit muter pour que la maladie se déclenche. Ceci explique aussi pourquoi les deux
yeux sont souvent affectés ; la probabilité du deuxième événement r est élevée parce que
chaque rétine est composée de millions de cellules. Une personne qui développe un
rétinoblastome de type sporadique hérite du génotype RR. Pour qu’une tumeur se développe,
deux allèles rr doivent apparaître, soit rr’ par deux mutations indépendantes, soit d’abord par
une mutation vers un état Rr suivie par un crossing-over mitotique. Comme deux événements
sont nécessaires, le cancer ne survient généralement que dans un œil. Le produit du gène R est
très probablement un répresseur d’une protéine du cycle cellulaire. La mutation inactive le
répresseur, ce qui déclenche la division. Ces exemples montrent comment plusieurs principes
143
génétiques peuvent être mis en cause pour comprendre un seul problème particulier, dans le
cas présent, un cancer.

Résumé

Les mutations géniques peuvent apparaître, soit dans les cellules somatiques, soit dans les
cellules germinales. Dans les deux catégories, on trouve différents types de mutations, y
compris des mutations morphologiques, létales, conditionnelles, biochimiques et de résistance
à divers agents. Les mutations peuvent être utilisées pour étudier le mécanisme de la
mutagenèse ou pour disséquer génétiquement l’une ou l’autre fonction biologique.

Pour mener à bien de telles études, il faut disposer d’un système de détection des allèles
mutants au niveau phénotypique. Dans les diploïdes, les mutations dominantes sont facilement
décelables. Par contre, les mutations récessives ne se manifestent pas au niveau phénotypique.
C’est la raison pour laquelle les systèmes de détection sont beaucoup plus aisés à mettre au
point pour les organismes haploïdes où la question de dominance ne se pose pas.

Comme les mutations spontanées sont rares, on fait appel à des systèmes de sélection ou à des
mutagènes pour obtenir les mutants désirés. Les systèmes de sélection permettent de distinguer
immédiatement un mutant d’un non mutant. Les mutagènes sont précieux pour l’étude des
mécanismes d’apparition des mutations, mais également pour induire les mutations nécessaires
aux analyses génétiques. Les mutations sont enfin souvent utilisées dans les sélections de
plantes de culture.

Chapitre 5

ADN DE QUELQUES VIRUS PARTICULIERS

La principale caractéristique des virus est de ne pouvoir se multiplier qu’à l’intérieur d’une
cellule dont la machinerie est utilisée pour la synthèse des protéines virales. Leur structure se
réduit généralement en une molécule d’acide nucléique, constituant leur génome, de quelques
protéines, d’une capside et pour certains d’une enveloppe. L’acide nucléique qui constitue le
génome est, selon le cas, de l’ADN ou de l’ARN simple ou double-brin. Ce génome est le plus
souvent court, mais l’information y est très concentrée ; une séquence d’ADN pouvant coder
plusieurs protéines. Toutefois, les grandes lignes de la structure et de la régulation du génome
des virus sont très proches de celles des cellules eucaryotes. A cet égard, ils constituent des
modèles très utiles. Ainsi les séquences stimulatrices ont d’abord été découvertes chez les
virus SV40.

Le cycle normal de vie d’un virus est : infection de la cellule, réplication du génome viral,
fabrication des protéines nécessaires par la machinerie cellulaire à partir de l’information
virale, constitution des virions à partir de tous ces éléments. Ce qui a souvent pour effet
d’entraîner une lyse cellulaire, les virus libérés infectant de nouvelles cellules, etc. Une
particularité biologique fondamentale de certains virus est de pouvoir s’intégrer dans le
144
génome de la cellule hôte et sont transmis d’une génération à l’autre comme n’importe quel
gène cellulaire, on les appelle des virus endogènes.

Il est établi aujourd’hui que les virus existent sous toutes les latitudes et dans tous les milieux.
Environ 1000 fois plus petits que les bactéries, les virus sont constitués d’une seule molécule
d’acide nucléique (ADN ou ARN), comme support de l’information génétique, protégée par
une capside de nature protéique, et parfois d’une enveloppe lipidique. A l’inverse de la plupart
des bactéries, les virus sont des parasites obligatoires : ils ne peuvent se multiplier qu’au sein
d’une cellule hôte. En fait, les virus sont certes capables de parasiter un organisme vivant,
mais semblent dénués de vie lorsqu’ils sont à l’extérieur d’une cellule. De plus, ils ne peuvent
croître hors du contexte cellulaire. Ils n’ont aucun métabolisme propre, toute l’énergie
nécessaire à leur multiplication est fournie par l’hôte.

Cependant et malgré le fait qu’ils sont fondamentalement constitués de mêmes constituants de


base, le monde des virus est extraordinairement hétérogène. En effet les virus présentent une
lultitude de tailles, de génomes, de cycles réplicatifs différents. Les virus sont susceptibles de
variabilité génétique (cela explique le fait que certains médicaments deviennent inefficaces) et
par conséquent peuvent évoluer. Les virus eraient ainsi porteurs des potentialités qui
s’expriment seulement lorsque les conditions sont favorables, tout comme une graine qui peut
suspendre son métabolisme pendant des milliers d’années, pour reprendre vie lorsque les
conditions s’y prêtent.

5.1 TRANSFERT D’ADN CHEZ LES PHAGES

5.1.1 CROISEMENT DES PHAGES

En raison de la nature parasitaire des phages, l’union entre deux génomes phagiques distincts
doit se faire à l’intérieur d’une cellule bactérienne. Un croisement entre phages doit donc être
réalisé sous la forme d’une infection simultanée d’une cellule bactérienne par les deux types
de phages. La procédure peut être illustrée par un croisement des phages T2. Les génotypes
de deux souches parentales sont h- r+ et h+ r-. Les allèles correspondent aux phénotypes
suivants : h peut infecter deux souches différentes d’E. coli (les souches 1 et 2) ; h+ peut
-

infecter une seule souche (la souche 1) ; r- lyse rapidement les cellules, produisant ainsi de
grandes plages, tandis que r+ lyse lentement les cellules, produisant de petites plages.

Dans le croisement, la souche 1 d’E. coli est infectée par les deux génotypes des phages T2
parentaux, dans un rapport phages : bactéries suffisamment élevé pour garantir un fort
pourcentage de cellules infectées simultanément par les deux types de phages. Le lysat des
phages (les descendants phagiques) est ensuite analysé en l’étalant sur un tapis bactérien
composé d’un mélange des souches 1 et 2 d’E. coli. On peut alors distinguer quatre types de
phages. Ces 4 génotypes peuvent être classés en types parentaux (h- r+ et h+ r-) et
recombinants. On peut ainsi calculer la fréquence de recombinaison de la manière suivante :

(h+ r+) + (h- r-)


FR =
Nombre total de phages
145

L’analyse des croisements des phages présente néanmoins quelques complications. D’abord,
plusieurs occasions d’échange peuvent se produire à l’intérieur de l’hôte : un recombinant
formé peu après l’infection peut subir d’autres échanges par la suite. En second lieu, la
recombinaison peut avoir lieu aussi bien entre des phages génétiquement identiques qu’entre
des phages de génotypes différents. Si P1 et P2 représentent les génotypes des phages
parentaux, alors des croisements de types P1 x P1 et P2 x P2 se reproduisent en plus du
croisement informatif P1 x P2. Pour ces deux raisons, les recombinants issus des croisements
entre phages doivent être considérés comme une conséquence d’événements multiples et non
d’un événement unique ayant lieu à un moment déterminé du cycle. Toutefois, toutes autres
choses étant égales, le calcul de la FR est un indice valide de la distance génétique chez les
phages.

5.1.2 LYSOGENIE

Les phages peuvent être classés en deux catégories : les phages virulents, toujours lytiques, qui
infectent et lysent la cellule hôte, produisant des descendants phagiques et les phages tempérés
qui, le plus souvent, s’intègrent dans le chromosome bactérien. Le phage inséré est alors
répliqué en même temps que le chromosome bactérien. Dans ces conditions, le phage est
appelé un prophage et l’hôte bactérien est dit lysogénique.

Une bactérie lysogène ou lysogénique est résistante à toute infection ultérieure par les phages
de même type ; la présence du prophage lui assure une immunité. L’état lysogénique peut être
transmis génétiquement pendant de nombreuses générations bactériennes. Cependant, un
prophage peut, à l’occasion, s’exciser du chromosome bactérien et s’engager dans un cycle
lytique, conduisant à la lyse de la cellule hôte et à la production d’un grand nombre de phages
descendants, appelés un lysat. Ces phages peuvent infecter n’importe quelle cellule non
lysogène présente dans la culture et la lyser.

Après induction, le prophage est ainsi capable de commander la synthèse de phages matures.
Ce qui indique que tout le génome phagique doit être présent dans le prophage. L’exemple
classique de phages tempérés est celui du phage lambda () de E. coli. Par le plus grand des
hasards, la souche originale d’E. coli utilisée par Lederberg et Tatum s’avéra être lysogène
pour un phage tempéré appelé lambda (). Lambda est alors devenu le phage le plus
intensément étudié et le mieux caractérisé de tous les virus bactériens.

Les premiers croisements F+ x F- impliquant un partenaire lysogène donnèrent des résultats


asymétriques : des croisements F+ x F- () produisaient des cellules réceptrices lysogènes
recombinantes, alors que les croisements réciproques F+ () x F- n’en produisaient presque
jamais. Ces résultats ne devinrent compréhensibles qu’après la découverte des souches Hfr.
Lors d’un croisement Hfr x F- (), l’obtention d’exconjugants F- lysogènes contenant des
allèles provenant du Hfr ne présentait aucune difficulté. Mais si, dans le croisement réciproque
Hfr () x F- , les marqueurs proximaux du Hfr étaient retrouvés dans les exconjugants, il n’en
allait pas de même pour les marqueurs plus distaux (transférés tardivement dans le
croisement). En outre, ces croisements réciproques ne produisaient presque jamais
146
d’exconjugants lysogènes. Ces observations prenaient un sens si l’on considérait que le
prophage de  se comportait comme un locus génétique de la bactérie.

Dans une expérience de croisement interrompu avec un Hfr déterminé, le prophage de 


pénètre toujours dans la cellule F- à un moment précis et en liaison étroite avec le locus gal.
On peut donc attribuer un locus spécifique au prophage de , à côté du locus gal. Dans un
croisement entre un donneur Hfr lysogène et un récepteur F- non lysogène, l’entrée du
prophage  dans la cellule non immune engage immédiatement le prophage dans un cycle
lytique. Cet événement est appelé induction zygotique. Mais dans le croisement Hfr () x F-
(), lorsque deux souches lysogènes sont croisées entre elles, la conjugaison se déroule
normalement, il n’y a pas de lyse et les recombinants bactériens sont rapidement détectés. Il
n’y a donc pas d’induction zygotique suivie d’une lyse. Le cytoplasme de la cellule F- semble
exister dans deux états distincts, selon que la cellule contienne ou non un prophage .

On sait maintenant que le prophage spécifie la synthèse d’un facteur cytoplasmique qui
réprime la multiplication des virus. La pénétration du prophage dans un environnement non
lysogène diluerait immédiatement ce facteur de répression ; ce qui entraînerait la
multiplication du virus. Mais si le virus spécifie la synthèse d’un répresseur de sa
multiplication, pourquoi ne se réprime-t-il pas lui-même à nouveau ? Il le fait puisqu’une
fraction des cellules infectées devient elle-même lysogène. Il y a compétition entre les signaux
des gènes de  spécifiant la multiplication du phage et ceux qui l’inhibent.

Le modèle d’un répresseur cytoplasmique sous le contrôle du phage explique bien l’immunité
des bactéries lysogènes : tout phage surinfectant rencontrerait immédiatement un répresseur et
serait inactivé. Le phénomène de lysogénie est, pour les phages tempérés, un moyen d’éviter
de détruire eux-mêmes leur gîte et leur couvert. Les cellules lysogéniques peuvent se
reproduire et transporter les phages de façon relativement inoffensive.

Intégration des phages

C’est Allan Campbell qui, en 1962, proposa que le phage  s’attache au chromosome
bactérien par un crossing-over entre son chromosome qui à cette étape est circulaire et le
chromosome d’E. coli, également circulaire. Un crossing-over réciproque se produit au niveau
d’un site spécifique du chromosome de  , appelé site d’attachement de  et un site du
chromosome bactérien situé entre les loci gal et bio. Ce qui conduit à l’intégration du phage
dans le chromosome de la bactérie. Cette intégration du phage, qui le transforme en prophage,
augmente la distance génétique entre les marqueurs bactériens qui l’encadrent. L’intégration
est le fait des gènes du phage et non du système de recombinaison de la bactérie.
147
5.1.3 TRANSDUCTION VIRALE

Certains phages sont capables de transporter des gènes bactériens d’une bactérie à une autre
par un processus appelé transduction. Il existe deux types de transduction : la transduction
généralisée et la transduction spécialisée. Dans la transduction généralisée, les phages peuvent
transporter n’importe quelle région du génome, alors que dans la transduction spécialisée, les
phages transportent des parties bien spécifiques du chromosome bactérien. Le phénomène de
transduction a été découvert par J. Lederberg et N. Zinder. Ils ont utilisé deux souches
différentes de la bactérie Salmonella typhimurium, l’une était phe-, trp-, tyr-- et l’autre met, his-
. Lorsque l’une ou l’autre de ces souches était étalée sur un milieu minimum, aucune cellule
de type sauvage n’apparaissait.

Mais s’ils étalaient un mélange de deux souches, des recombinants sauvages apparaissaient
avec une fréquence de 1 sur 100. 000. Lederberg et Zinder ont également obtenu des
recombinants lors d’une expérience dans un tube en U, dans laquelle le contact entre cellules
de deux souches (et donc la conjugaison) était rendu impossible par la présence d’un filtre.
En faisant varier le diamètre des pores du filtre séparant les deux branches du tube, ils
établirent que l’agent responsable de la recombinaison avait une taille équivalente à celle du
virus P22, l’un des phages tempérés de Salmonella dont on connaissait l’existence. Ils
relevèrent d’autres indices que le vecteur de recombinaison était bien le virus P22.

L’agent filtrant et P22 étaient identiques en taille, présentaient la même sensibilité à un


antisérum et la même immunité vis-à-vis des enzymes hydrolytiques. Ainsi, au lieu d’établir
l’existence du phénomène de la conjugaison chez Salmonella, Lederberg et Zinder
découvrirent un nouveau mode de transfert génétique effectué par un virus et qu’ils appelèrent
transduction. Au cours de ce cycle lytique, certaines particules virales emportent des gènes
bactériens qu’elles transfèrent à d’autres bactéries lorsqu’elles les infectent, c’est le
phénomène appelé transduction, phénomène très répandu chez les phages tant virulents que
tempérés.

Transduction généralisée

K. Ikenda et J. Tomizawa ont réalisé, en 1965, une série d’expériences sur le phage tempéré P1
de E. cioli. Lorsqu’une cellule donneuse non lysogène est lysée par P1, le chromosome est
dégradé en petits fragments. Ils observèrent que les particules virales en formation
incorporaient, parfois par erreur, un fragment d’ADN bactérien. Un processus semblable peut
être observé lorsque le prophage est induit. De tels virus ou particules transductrices peuvent
s’attacher à une cellule bactérienne et y injecter l’ADN qu’elles contiennent et qui, en
l’occurrence, se trouve contenir des gènes de la bactérie donneuse. Un mérodiploïde est ainsi
formé dans lequel les gènes transduits peuvent être incorporés dans le chromosome par
recombinaison. Tout marqueur de la bactérie hôte donneuse peut se trouver transduit de la
sorte. C’est pourquoi ce type de transduction est qualifié de généralisée. Les phages P1 et P22
présentent tous deux un mode de transduction généralisée.

Ces phages tempérés ont cependant des comportements différents dans la cellule : P22 s’insère
dans le chromosome de l’hôte sous la forme d’un prophage, alors que P1 reste libre, sous la
148
forme d’un grand plasmide. Ils se comportent tous deux comme des phages à transduction
généralisée puisque, au cours de la lyse, l’ADN bactérien est accidentellement introduit dans
la tête du phage. A l’intérieur de la cellule receveuse, les fragments transducteurs s’intègrent
par un double crossing-over en utilisant le système de recombinaison de l’hôte.

Transduction specialisée

Le phage lambda () est un bon exemple de transducteur spécialisé. Le prophage  s’intègre
toujours entre la région gal et la région bio du chromosome d’E. coli. Dans le mécanisme de la
transduction par  , la recombinaison entre les régions homologues de  et de la bactérie est
catalysée par un système enzymatique spécifique. Les régions d’intégration du phage et de la
bactérie ne sont pas complètement identiques, de sorte que l’intégration de  produit deux
sites hybrides. L’excision normale du prophage reconstitue le site d’intégration du phage.
Cependant, de très rares cas d’excision anomale produiront des phages qui emporteront les
gènes gal. De telles particules sont déficientes parce que certains gènes de  sont restés dans
le chromosome de l’hôte ; on les désigne dès lors dgal ( - déficient gal). Une particule dgal
possède une enveloppe de phage  et peut infecter des bactéries, mais elle est déficiente aussi
au niveau de son site d’intégration.

Le site d’intégration hybride présent dans dgal constitue un très mauvais substrat pour le
système enzymatique spécifique du phage qui permet à la recombinaison entre sites
d’intégration phagique et bactérien de se produire. Dès lors, l’intégration de dgal est très peu
efficace lorsqu’il infecte seul E. coli. Toutefois, la co-infection avec un  sauvage permet une
intégration efficace de dgal. Le phage co-infectant est souvent appelé phage auxiliaire. De
façon générale, on appelle auxiliaires les phages qui fournissent les fonctions phagiques qui
manquent aux phages transducteurs. Si le lysat de  original est utilisé pour infecter une
culture de bactéries gal- non lysogènes pour  , et que les cellules infectées sont étalées sur
un milieu où seuls les transduits gal+ peuvent croître, des rares colonies apparaîtront.

Une minorité de ces transduits provient de la recombinaison entre les régions gal du dgal et
du chromosome de l’hôte. La majorité des transduits est constituée de doubles lysogènes. Si
un double lysogène est mis en culture, puis induit à lyser et que le lysat est utilisé pour
transduire gal+, la fréquence de transduction sera cette fois très élevée. Un tel lysat est appelé
un lysat à haute fréquence de transduction (HFT). Ces lysats HFT contiennent une proportion
importante de phages transducteurs spécialisés (dans le cas présent, de dgal), puisque chaque
lysogène contenait un prophage transducteur, et que leur induction a entraîné l’excision et la
propagation spontanées du phage défectif transducteur et du phage auxiliaire. Ceci contraste
avec l’induction du lysogène initial qui n’a produit des phages dgal qu’avec une fréquence
très faible.

La transduction spécialisée ne mobilise que les courtes régions du génome bactérien qui
flanquent le prophage. La transduction par  peut mobiliser les gènes gal ou bio. Ainsi la
transduction spécialisée est utile pour transférer des gènes spécifiques d’une souche dans une
autre. Ainsi, la transduction est considérée comme la conséquence de l’incorporation fortuite
149
des gènes de l’hôte bactérien dans les particules phagiques en cours d’assemblage et de leur
transfert dans d’autres cellules bactériennes. Dans le cas de la transduction généralisée, lors
de l’empaquetage de l’ADN dans les têtes des phages en formation, les particules
transductrices incorporent un fragment du chromosome bactérien. Ce phénomène se produit
au cours du cycle lytique de certains phages virulents ou tempérés, ou lors de l’induction de
certains phages lysogéniques.

La transduction spécialisée débute toujours par l’induction d’un prophage. Elle est une
conséquence de l’excision fautive du prophage et la particule transductrice contient à la fois
des gènes bactériens et phagiques. Le phage transducteur spécialisé ne transduit que quelques
gènes spécifiques de l’hôte, puisque le prophage d’un phage tempéré s’insère normalement à
un site précis du chromosome bactérien.

5.1.4 LES PHAGES ET LE TRANSFERT D’ADN CHEZ LES BACTERIES

Le transfert des gènes entre bactéries s’effectue par conjugaison, par transformation et par
transduction virale. Le transfert par conjugaison du facteur F’ porteur des gènes bactériens et
la transduction généralisée de certains gènes présentent certaines similitudes : dans chacun de
deux phénomènes un nombre limité de gènes bactériens déterminés est introcduit de façon
efficace dans une cellule réceptrice. De plus leur acquisition héréditaire ne requiert pas de
recombinaison normale comme pour l’acquisition de simples fragments d’ADN. Après son
transfert, le facteur F’ est répliqué de façon autonome dans le cytoplasme de la souche
réceptrice alors que l’ADN du phage transducteur spécialisé s’intègre dans le chromosome
bactérien grâce au système de recombinaison qui lui est ptopre. Dans les deux cas, un diploïde
partiel (mérodiploïde) est formé, chacun des phénomènes permettant à la souche réceptrice
d’hériter des gènes transférés tout à conservant les allèles qui lui étaient propres.

Le transfert des gènes peut être utilisé pour dresser une carte du chromosome. Des croisements
avec des Hfr permettent d’abord de localiser une mutation dans une région du chromosome.
La transduction généralisée sert ensuite à localiser finement la mutation. L’acquisition des
marqueurs génétiques, quelque soit le mode de transfert, conjugaison avec une souche Hfr,
transformation par un fragment de chromosome d’une souche donneuse ou par transduction
généralisée, dépend toujours de la réalisation d’une étape critique : le fragment d’ADN
introduit dans une cellule réceptrice doit être incorporé dans le génome de celle-ci, le plus
souvent à la suite d’un double crossing-over, pour être acquis de façon héréditaire. Les
fragments non oncorporés ne sont pas répliqués et sont perdus par dilution dans la population
des cellules filles.

5.2 CARACTERISTIQUES PARTICULIERES DE L’ADN


DE CERTAINS PHAGES

Les phages ont joué un rôle important dans le développement de la biologie moléculaire.
Actuellement, les phages font partie des organismes les mieux connus. En raison de leur
complexité inférieure à celle des bactéries ou des cellules eucaryotes et du grand nombre de
mutants disponibles, les phages ont permis d’étudier les processus de base du fonctionnement
cellulaire, tels que la réplication, la transcription ou la régulation. La plupart de phages
150
possèdent des gènes codant pour différentes protéines. Pourtant, tous les phages utilisent les
ribosomes, les acides aminés et les systèmes générateurs d’énergie de la cellule hôte
bactérienne. Chaque phage doit disposer d’un nombre minimal de fonctions pour survivre
notamment : - la protection de son acide nucléique contre des agents chimiques dans
l’nevironnement ; b- le transfert de son ADN à l’intérieur de la bactérie ; c- la transformation
de la bactérie infectée en un système de production des phages capable de générer un très
grand nombre de particules virales filles ; d- la libération des phages produits dans la bactérie
infectée. Ces fonctions sont remplies de diverses manières par différentes espèces de phages.

D’une espèce à l’autre, les particules virales diffèrent par leurs structures physiques. Bien
souvent, ces structures sont en liaison avec certaines caractéristiques de leur cycle de
reproduction. Les phages ayant les acides nucléiques les plus grands ont un cycle de
reproduction plus complexe qui dépend assez peu des enzymes de réplication bactériennes.
Une caractéristique inhabituelle de ces phages consiste en la présence, dans leurs molécules
d’ADN, des bases autres que A, G, T, C. C’est le cas de l’ADN du pahge T4, contenant une 5-
hydroxyméthylcytosile glycosylée à la place de la cytosine. C’est aussi le cas du phage SPO1,
contenant une hydroxyméthyluracile à la place de la thymine. L’une des classes de phages les
mieux étudiés, les phages T, est constituée d’un groupe de phages qui a fait l’objet d’études
systématiques et dont les membres sont désignés : T1, T2, T3, etc.

Au cours de l’infection, un phage s’attache à une bactérie et injecte son matériel génétique
dans le cytoplasme bactérien. Le matériel génétique du phage s’empare de la machinerie
(équipement enzymatique) de la cellule bactérienne et détourne à son profit la capacité de
synthèse de la bactérie pour la production des composants phagiques. De nombreux phages
descendants du phage infectant sont enfin libérés à la suite de la lyse de la paroi bactérienne.

Le cycle d’un phage peut être soit lytique, soit lysogénique. Un phage ayant un cycle lytique
transforme la cellule infectée en une usine à produire des phages, conduisant à la formation
d’un très grand nombre de particules phagiques. Un phage qui n’est capable de se reproduire
que selon un cycle lyque est appelé virulent. Le cycle lysogénique, qui n’a été observé
qu’avec des phages contenant un ADN double-brin, ne correspond pas à une production des
particules virales. Dans ce cas, l’ADN du phage est, en général, intégré dans le chromosome
bactérien. Un phage capable de ce type de reproduction est appelé tempéré.

Il existe de nombreuses variations dans le cycle de différents phages virulents. Cependant un


cycle de base peut être défini comme suit : – Adsorption du phage sur les récepteurs
spécifiques situés sur la surface externe de la bactérie. Ces récepteurs sont de nature variableet
ont d’autres fonctions que la fixation des phages ; – Transfert de l’ADN du phage dans la
bactérie à travers la paroi bactérienne. Certains pahges à queue utilisent un système d’injection
dans la bactérie ; – Conversion de la bactérie infectée en une cellule reproductrice des
pahges.

Noter qu’après infection par un phage, une bactérie devient incapable de répliquer ou de
transcrire son ADN. Le plus osuvent elle perd ces deux fonctions. Suivant l’espèce de phage,
cet arrêt de la synthèse des ADN et ARN bactériens est réalisé de manière différente ; –
Synthèse des acides nucléiques et des protéines du phage. Le phage contrôle la synthèse et la
151
mise en place d’un système de réplication spécifique de l’ADN phagique. Cette
programmation est réalisée soit par la synthèse des polymérases spécifiques du phage, soit par
l’addition d’éléments capables de mocifier la spécificité des enzymes bactériennes.

La transcription est presque toujours initiée par une ARN polymérase bactérienne, mais après
les premières étapes de la transcription, soit la polymérase est modifiée afin de ne reconnaître
que les promoteurs du phage, soit une ARN polymérse spécifique du phage est synthétisée et
prend le relais de la polymérase bactérienne. La transcription est régulée et les protéines du
phage sont synthétisées en séquence au cours du cycle en fonction des besoins du phage.
Plusieurs classes d’ARNm sont synthétisées après l’infection dont les principales sont les
ARNm précoces et les ARNm tardifs. Les ARNm précoces codent pour des enzymes
nécessaires à la prise de contrôle de la bactérie par le phage, ainsi qu’à la réplication de l’ADN
phagique et à la synthèse des ARNm tardifs.

Les ARNm tardifs codent pour les différentes protéines constituant les particules virales, les
protéines nécessaires à l’empaquetage de l’acide nucléique dans les particules virales ainsi que
les enzymes permettant la lyse de la bactérie et la libération des phages. Les phages plus
complexes synthétisent plusieurs classes d’ARNm précoces qui sont produits en ordre
particulier ; – Assemblage des particules virales. Ce processus est appelé morphogenèse du
phage. Deux types de protéines sont nécessaires à cet assemblage : des protéines de structure
présentes dans la particule virale et des protéines catalytiques qui participent à l’assemblage
mais ne sont pas incorporées dans la particule virale ; – Libération des phages nouvellement
synthétisés. Dans la plupart des cas, une protéine du phage appelée lysozyme ou endolysine,
est synthétisée à la fin du cyle infectieux. Cette protéine dégrade la paroi bactérienne.

D’autres protéines appelées membranases dégradent les membranes cellulaires et leur action,
conjuguée avec celle des lysozymes, conduit à une destruction totale de la cellule bactérienne,
ce qui permet la libération des phages dans le milieu. Ce processus destructif est appelé la
lyse. Ces événements se déroulent selon un ordre précis. Ainsi le cycle du phage T4 est
composé des étapes suivantes (le temps en minutes pour un cycle réalisé en 37°C) :

t = 0 adsorption du phage sur la pâroi bactérienne. L’injection de l’ADN du phage est réalisée
dans les secondes qui suivent l’adsorption ;
t = 1 inhibition d’ADN, d’ARN et des protines bactériennes ;
t = 2 transcription de premiers ARNm du phage ;
t = 3 dégradation de l’ADN bactérien ;
t = 5 démarrage de la réplication de l’ADN du phage ;
t = 9 transcription des ARNm tardifs ;
t = 12 apparition de premières têtes et queues complètes ;
t = 15 apparition de premières particules virales.
t = 22 lyse de la bactérie. Environ 200 à 300 phages sont libérés par bactérie infectée.

Un phage est une forme de vie relativement simple en comparaison aux autres organismes
vivants. Cependant les phages sont suffisamment complexes pour qu’il n’existe pas ceux où
tous les détails du cycle soient connus au niveau moléculaire. Les progès majeurs ont été
obtenus avec un petit nombre de pahges infectant E. coli, bacillus subtilis et Salmonella
152
typhimurium. Les particularités de chaque phage ont été utilisées pour réaliser une étude
approfondie d’une partie de macanismes de l’infection.

Ainsi la régulation de la transcription est mieux comprise chez les phages λ et T7, l’étude de la
morphogenèse a été plus approfonie chez les phages λ et T4, les phages P1 et P22 ont perms
de comprendre le phénomène de transduction, le phage T5 a permis d’accumuler le plus
d’informations sur le mécanisme d’injection de l’ADN et les phages T4 et T7 ont permis de
montrer comment un phage prend le contrôle de la bactérie infectée. Seront examinées dans
cette section, certaines caractéristiques de la biologie des phages ainsi que leurs stratégies de
reproduction à travers la description d’étapes particulières du cycle de certains phages
particuliers.

5.2.1 PHAGE T4 D’E. COLI

Le phage T4 de E. coli a été parmi les plus étudiés. Il possède un ADN inhabituel qui ne
contient pas de cytosine mais une forme modifiée, la 5- hydroxyméthylecytosine (HMC),
capable de s’apparier avec la guanine. De plus cette base est glycosyllée par addition d’un
sucre sur le groupement OH de l’HMC. Cette caractéristique a pour conséquence de rendre
l’ADN du phage T4 résistant à un certain nombre de nucléases bactériennes ou phagiques.
L’HMC a une fonction importante dans le cycle du phage T4. En effet ce phage se multiplie
très vite, produisant en 22 minutes environ 300 phages par cellule infectée. Cette synthèse
d’ADN est accélérée dans la cellule infectée par rapport à la cellule saine par deux méthodes :

T4 hydoxyméthylase
dCMP dHMP

HM kinase
dHMP dHDP

a. Le nombre d’enzymes nécessaires à la synthèse des nucléosides triphosphates,


précursseurs de l’ADN, est augmenté grâce à la synthèse d’enzymes spécifiques du phage et b.
l’ADN d’E. coli est dégradé par les nucléases codées par le phage en mononucléotides qui
sont convertis en nucléosides triphosphates. Les nucléases du phage ne sont pas capables de
dégrader l’ADN phagique puisque la présence de l’HMC les rend résistants à ces enzymes. La
synthèse des HMC est réalisée par deux enzymes qui convertissent le dCMP en dHDP.

Le phage T4 et les virus apparentés sont constitués d’une tête remplie par une seule molécule
d’ADN et qui apparaît hexagonale au microscope électronique et d’une queue complexe par
laqualle le virus se fixe à la paroi cellulaire (de E coli). Le bactériophage T4 est l’un des virus
les plus utilisés pour l’étabissement des cartes fines des gènes. Après qu’un phage T4 s’est
fixé sur un colibacille, sa molécule d’ADN pénètre dans la cellule et détourne la machinerie
celluilaire pour fabriquer environ 100 copies du virus complet. Chaque copie est formée
d’ADN et d’au moins 6 constituants protéiques différents. Pour fabriquer ces constituants,
l’ADN injecté détermine la formation d’une série d’enzymes spéciales. Le proccecssus entier
153
est commandé par la batterie de gènes qui constitue l’ADN. L’ADN du phage T4 contient
quelques 200.000 pb. Plusieurs unités polypeptidiques peuvent être nécessaires pour former
une protéine complexe.

5.2.2 PHAGE T7 D’E. COLI

Le phage T7 est un phage de taille intermédiaire. Son ADN a un poids moléculaire d’environ
26. 1 000 000 daltons et contient en quantité égale les quatre bases (A , T , G , C). Ses
extrémités possèdent des terminaisons redondantes de 160 pares de bases. Sa molécule d’ADN
est contenue dans une tête à laquelle est fixée une petite queue. Il possède un nombre limité de
gènes (55). La plupart des produits de ces gènes ont été identifiés par électrophorèse sur gel.
La séquence nucléotidique complète de son ADN, large de 39936 pb a été déterminée. Les
modalités de régulation de la transcription du phage T7 sont très remarquables. Le cycle du
phage T7 peut être divisé en trois étapes transcriptionnelles. Au cours du temps, la
transcription de différents gènes est régulée suivant un ordre particulier. C’est le transcrit I qui
est synthétisé le premier grâce à l’ARN polymérase de la bactérie. Il n’existe pas d’autres
enzymes disponibles.

Carte simplifiée de la transcritpion chez le phage T7

Une des protéines codées par le transcrit I est une protéine kinase capable de phosphoryler
l’ARN polymérase de la bactérie et ainsi de l’inactiver. Ceci constitue la première étape dans
la prise de contrôle de la bactérie par le phage. Le transcrit I code également pour une ARN
polymérase essentielle à la transcription d’autres gènes. Elle est la seule qui est capable de
reconnaître les promoteurs des unités de transcription II et III, qui ne sont pas reconnus par
l’ARN polymérase de la bactérie. Le transcrit II code pour les protéines nécessaires à la
réplication du phage, la protéine majeure de la tête du phage et un second inhibiteur de l’ARN
polymérase bactérienne. La synthèse de cette dernière protéine assure un contrôle complet de
la bactérie. Le site de terminaison du transcrit II entraîne un arrêt de la transcription avec une
efficacité de 90 %.

Cela veut dire que 10 % des transcriptions continuent jusqu’à l’extrémité de la molécule
d’ADN. Cette région terminale correspond aux gènes des protéines de la queue du phage.
Etant donné que la queue est très courte, la quantité de protéines nécessaire à la formation des
queues est inférieure à celle nécessaire à la formation des têtes. Seul un transcrit II sur 10
s’étend jusqu’à la zone comportant les gènes impliqués dans la synthèse des protéines de la
queue. Les protéines nécessaires à la lyse de la bactérie sont également localisées dans cette
région située en aval du site de terminaison du transcrit II.
154
Le transcrit III, synthétisé à la fin du cycle infectieux code pour toutes les protéines de la
structure de la particule virale ainsi que pour les enzymes de lyse. Deux mécanismes sont à la
base de la réduction de la synthèse du transcrit II et de l’initiation de la synthèse du transcrit
III : la synthèse d’un inhibiteur général de la transcription et l’injection progressive de l’ADN
du phage. Une des protéines codées par le transcrit II provoque une réduction de toutes les
transcriptions.

La plupart des espèces de phages injectent leur ADN environ 30 secondes après l’adsorption,
alors que pour le phage T7, ce processus prend 10 minutes. Ainsi, la partie de la molécule
d’ADN du phage qui contient le promoteur pIII ne pénètre dans la bactérie que 7 minutes
après l’infection ; ce qui retarde la synthèse du transcrit III. En résumé, les trois transcrits
sont synthétisés suivant un ordre précis. En premier lieu, l’ARN polymérase de E. coli
synthétise le transcrit I. Ensuite, un inhibiteur, traduit à partir du transcrit I évite toute synthèse
ultérieure de ce transcrit.

L’ARN polymérase du phage T7, traduite à partir du transcrit I, permet la synthèse du transcrit
II. Un inhibiteur, traduit à partir du transcrit II, empêche toute synthèse ultérieure de ce
transcrit. L’injection progressive de l’ADN du phage retarde l’entrée du promoteur pIII dans
la cellule. Dès que le promoteur III est accessible, il y a synthèse du transcrit III. Cette
cascade de transcriptions correspond globalement à une synthèse précoce des protéines
impliquées dans la réplication de l’ADN et à une synthèse tardive des protéines de structure de
la particule du phage.

5.2.3 PHAGE X174 D’E. COLI

Ce phage est le premier organisme chez qui a été mis en évidence un ADN simple brin
circulaire. Cet ADN a été le premier à pouvoir être répliqué in vitro en donnant un ADN
biologiquement actif. L’étude de son mode de réplication a conduit à l’élaboration du modèle
de réplication en cercle roulant. Le phage X174 est le plus petit connu. Il contient 11 gènes
et possède un cycle très simple. Chaque particule contient un ADN simple-brin circulaire de
5386 nucléotides, dont la séquence est entièrement déterminée et qui est appelé brin (+). Le
mode de réplication de son ADN est très différent de celui d’un ADN double-brin. La
réplication du phage X174 passe par la synthèse d’ADN simple-brin, appelé brin (-), dont la
séquence est complémentaire du brin (+). Une telle molécule peut être produite de deux
façons : 1. le brin complémentaire (-) est synthétisé et se détache du brin (+) au fur et à mesure
de sa synthèse. 2. le simple-brin peut être converti en un double-brin circulaire. Le phage 
X174 utilise le deuxième mécanisme, d’autres phages utilisent le premier.

L’entrée du phage X174 dans une cellule d’E. coli permet d’initier la première phase de sa
réplication. Première phase qui consiste en la synthèse d’une molécule d’ADN double-brin
superenroulé à partir du simple-brin infectieux (+) grâce au système de réplication de la
bactérie. Cet intermédiaire superenroulé est appelé ADN RFI. La formation de cette
molécule est réalisée en quatre étapes : 1- la synthèse d’une amorce d’ARN, 2- L’élongation,
à partir de cette amorce, d’un brin d’ADN par l’ADN polymérase III jusqu’à la synthèse
complète du brin (-) complémentaire, 3- La dégradation de l’amorce d’ARN et son
155
remplacement par un fragment d’ADN grâce à l’ADN polymérase I, 4- La liaison de ce
fragment au brin (-) réalisée par l’ADN ligase. Dans la deuxième phase de la réplication du
phage, l’ADN RFI se réplique plusieurs fois ; ce qui conduit à environ 60 molécules d’ADN
circulaire double-brin par cellule.

Réplication de l’ADN du phage X174

Dans la troisième phase, de nombreuses molécules d’ADN simple-brin (+) sont synthétisées,
puis empaquentées dans l’enveloppe protéique du phage. Le phage utilise également une
variante de ce type de réplication, appelée réplication en cercle roulant en boucle, qui lui
permet de synthétiser une série d’ADN simple-brin circulaire à partir d’une matrice double-
brin circulaire. Dans le cas du phage x174, cette réplication est réalisée de la manière
suivante : une protéine du phage, appelée protéine du gène A, provoque une coupure simple-
brin au niveau de l’origine de réplication et s’attache de manière covalente à l’extrémité 5’-P
de la coupure.

La synthèse du brin d’ADN est initiée à partir de l’extrémité 3’-OH de cette coupure, à l’aide
des protéines de E. coli, Rep, SSB et de l’ADN poly III ; ce qui conduit à un déplacement du
brin parental coupé (brin (+)). Ce brin est recouvert des protéines SSB et n’est plus répliqué.
La synthèse du nouveau brin (+) se poursuit jusqu’à l’origine de réplication. A cette étape, la
protéine du gène A se fixe sur l’extrémité 3’-OH du brin (+) et avec l’énergie accumulée lors
de la coupure initiale, elle réalise la jonction entre les extrémités 3’-OH et 5’-P du brin (+).

Ensuite cette protéine se dissocie du brin (+) circularisé et d’attache au nouveau brin
synthétisé ; ce qui permet l’initiation d’un nouveau cycle de synthèse d’un brin (+). Ce
processus peut continuer indéfiniment et générer un grand nombre de brins (+) circulaires.
Dans la réplication en cercle roulant en boucle, le brin déplacé n’a jamais une longueur
supérieure à celle du cercle. Toute la transcription de l’ADN du phage x174 est réalisée à
partir du brin (-). Ceci ne peut se faire qu’après la formation de l’ADN RFI. Ainsi, la synthèse
de l’ADN RFI doit utiliser les enzymes de la bactérie hôte.

5.2.4 PHAGE  D’E. COLI

Le phage  d’E. coli possède un ADN double-brin. Il est l’un des phages les mieux connus,
particulièrement au niveau des mécanismes de régulation de sa transcription. L’étude du phage
 a conduit à des découvertes majeures sur les mécanismes moléculaires du fonctionnement
des gènes. C’est notamment le cas de la réplication bidirectionnelle, la terminaison de la
156
transcription, les protéines d’antiterminaison, l’ADN gyrase, l’ADN ligase, les molécules
d’ADN circulaires, la recombinaison génétique par cassure et jonction, le système de
réparation SOS. Le phage  peut aussi bien accomplir un cycle lytique, conduisant à la
production de phages, qu’un cycle lysogènique, dans lequel l’ADN du phage est intégré dans
le chromosome bactérien.
Cycle lytique

L’ADN du phage  est un ADN double-brin de 48518 nucléotides dont la séquence est
entièrement connue. L’extrémité 5’-P de chaque brin est prolongée par un fragment simple-
brin de 12 nucléotides. Les deux fragments simple-brin ont des séquences complémentaires et
sont appelés extrémités cohésives. Peu après l’injection de l’ADN du phage dans la bactérie,
ces extrémités cohésives s’apparient ; ce qui permet la formation d’ADN circulaire. Ensuite,
les groupements 5’-P et 3’-OH de chaque extrémité sont liés par une ADN ligase. Comme
c’est le cas de nombreux phages, les gènes qui ont des fonctions proches sont regroupés.

C’est, par exemple, les gènes codant pour les protéines de la tête et celles de la queue, ceux
contrôlant la réplication et la recombinaison forment quatre groupes différents. De
nombreuses protéines du phage , comme les protéines régulatrices et les protéines nécessaires
à la synthèse de l’ADN agissent au niveau des sites particuliers de l’ADN. En général, les
gènes de ces protéines sont situés à côté de leur site d’action. L’origine de réplication de
l’ADN est située dans la séquence du gène O, qui code pour une protéine d’initiation de la
réplication de l’ADN.

La transcription de l’ADN du phage  est réalisée en plusieurs étapes. Le regroupement des


gènes permet leur transcription au moment approprié. Le phage  synthétise plusieurs types
d’ARN au cours de son cycle. Il existe un ARNm précoce qui code pour des protéines de
régulation et les enzymes de réplication de l’ADN et un ARNm tardif qui code pour les
protéines de structure de la particule du phage. Au contraire du phage T7, le phage  utilise
l’ARN polymérase d’E. coli pour l’ensemble de sa transcription. Pour la plupart des phages,
la transcription est régulée grâce à la sélectivité de certains promoteurs. L’ARNm précoce du
phage T7, par exemple, est synthétisé par l’ARN polymérase d’E. coli, qui ne reconnaît pas les
promoteurs des gènes tardifs du phage. A l’inverse, l’ARN polymérase du phage T7 reconnaît
les promoteurs des gènes tardifs du phage, mais pas ceux des gènes précoces. D’autres
phages, comme le phage T4, utilisent la polymérase de l’hôte pendant tout leur cycle, mais
modifient l’enzyme par l’addition des molécules lui permettant de reconnaître les différents
promoteurs du phage.

Pendant son cycle lysogénique, le phage  utilise également la sélectivité de ses promoteurs et
terminateurs pour contrôler la transcription de ses gènes ; ce qui n’est pas le cas durant son
cycle lytique, où il utilise un tout autre système de régulation. Il a été noté que l’ADN du
phage  se circularise peu de temps après l’infection grâce à l’appariement de ses extrémités
cohésives formant la région double-brin cos. A un moment donné du cycle du phage, les
extrémités simple-brin doivent être reconstituées, puisque l’ADN encapsidé est linéaire. Ceci
est réalisé par un système de coupure, appelé terminase (ou Ter) qui coupe les molécules
157
d’ADN produites au cours de la réplication du phage, au niveau de la région cos. Partant, les
coupures ne sont pas faites dans une série de molécules d’ADN filles circulaires.

Au contraire, la réplication de l’ADN et la coupure sont coordonnées d’une manière qui se


retrouve fréquemment chez les phages. Dans la première phase de la réplication de l’ADN du
phage  , la synthèse de l’ADN est réalisée suivant un mode bidirectionnel. Les molécules
d’ADN circulaires issues de ce mécanisme adoptent pour leur réplication, le modèle en cercle
roulant ; ce qui conduit à une longue molécule linéaire. Il convient de remarquer que cette
molécule contient plusieurs sites cos, alors qu’une molécule d’ADN circulaire ne contient
qu’un seul site. Les molécules d’ADN filles proviennent de la coupure, par la terminase, de la
longue molécule d’ADN produite par le cercle roulant, au niveau des sites cos. La partie
circulaire du cercle roulant n’est pas clivée, puisque la terminase a besoin, pour induire un
clivage, des deux sites cos ou d’un site cos et d’une extrémité simple-brin. Ainsi, la formation
des unités du phage  a lieu par clivage séquentiel à partir de l’extrémité libre de la molécule
d’ADN issue du cercle roulant.

Cycle lysogénique

Le cycle lysogénique le plus commun et dont le phage  est le représentant est réalisé suivant
les étapes suivantes : a. une molécule d’ADN est injectée dans une bactérie. b. après une
courte période de transcription, nécessaire pour synthétiser l’enzyme d’intégration, la
transcription est arrêtée sous l’action d’un répresseur. c. une molécule d’ADN du phage 
s’insère dans l’ADN de la bactérie formant un prophage. d. la bactérie se multiplie et l’ADN
du phage est répliqué comme n’importe auel élément du chromosome bactérien. Le second
type de cycle lysogénique (le moins fréquent) est celui du phage P1. Ce cycle diffère du
précédent par le fait qu’il n’y a pas de système d’intégration et que le phage se comporte plutôt
comme un plasmide que comme un fragment du chromosome bactérien. Seul le premier type
sera considéré ici. Le phage  contient un système opérateur-répresseur. Le gène du
répresseur, appelé cI, code pour une protéine qui se fixe sur les deux opérateurs oL et oR, qui
sont adjacents aux promoteurs pL et pR.

Intégration du phage  (Modèle de Campbell)


158
Dans un phage lysogène, le répresseur est synthétisé constitutivement et en excès par rapport
aux opérateurs. Les molécules du répresseur sont donc fixées sur les deux sites oL et oR ; ce
qui bloque la transcription des gènes. Ainsi dans un phage lysogène, la transcription des gènes
précoces n’est pas possible ; ce qui permet au phage lysogène de se multiplier indéfiniment,
intégré dans le chromosome bactérien. Lors de l’infection d’une bactérie normale par un
phage , les deux opérateurs oL et oR du phage sont sans répresseur, puisque ces protéines ne
sont pas encore été synthétisées ; ce qui permet la transcription des gènes du phage et le
déroulement du cycle lytique. Mais si un phage pénètre dans une bactérie ayant déjà intégré un
phage de même type, l’excès de répresseur présent dans la bactérie se fixera sur les deux
opérateurs du phage infectant avant qu’une ARN polymérase ne puisse se fixer sur les sites pL
et pR. Cette fixation du répresseur, synthétisé constitutivement sur l’opérateur empêche le
phage de devenir lytique.

L’induction du cycle lytique dépend aussi d’interaction entre répresseur et opérateur. Si, pour
une raison quelconque, le répresseur d’une cellule lysogène est inactivé, les opérateurs de 
seront libres et la transcription pourra commencer. A ce stade, une nouvelle enzyme,
l’excisionase, réalise l’excision de l’ADN du prophage du chromosome bactérien, sous forme
d’un ADN circulaire. Ainsi l’ADN du phage  se trouve être dans le même état qu’au début
d’un cycle lytique. Le signal initial de l’induction semble être un dommage au niveau d’une
molécule d’ADN, en particulier l’existence d’ADN simple-brin. Si l’ADN de la bactérie est
endommagé, cela peut induire la mort de la cellule hôte. Il est donc avantageux pour le phage
de sortir de la bactérie infectée.

Les mécanismes par lesquels l’ADN endommagé active la protéase qui clive le répresseur ne
sont pas encore bien connus. Le rayonnement UV est un très bon inducteur, puisqu’il peut
causer de nombreux dommages à l’ADN. Lorsque l’ADN du phage  s’intègre, il est inséré
à un site préférentiel du chromosome bactérien. Ce site est situé entre l’opéron galactose (gal)
et l’opéron biotine (bio). L’intégration de l’ADN du phage  s’effectue suivant le modèle de
Campbell. Dans ce modèle, l’ADN du phage est d’abord circularisé, puis inséré à partir d’une
cassure de l’ADN bactérien par une jonction entre les deux ADN. Cela veut dire entre le site
d’attachement de  sur le chromosome bactérien et le site d’attachement du phage, qui est
localisé dans la région médiane de la molécule d’ADN du phage.

Une protéine du phage, l’intégrase (produit du gène int), reconnaît l’ADN du phage et celui de
la bactérie et catalyse l’échange entre les deux molécules. Puisque le prophage est encadré par
deux sites d’attachement, pourquoi l’intégrase ne l’excise-t-elle pas peu de temps après son
intégration ? Une explication de la non-excision du prophage est que les sites d’attachement
du phage et de la bactérie ne sont pas strictement identiques, et que la recombinaison entre les
deux sites, lors de l’intégration, conduisait à la production des sites d’attachement différents,
spécifiques du prophage, qui ne sont pas reconnus par l’intégrase. Le résultat de l’intégration
est que l’ADN du phage  est inséré linéairement entre les loci gal et bio. Ainsi : a- l’ordre
linéaire des gènes est permuté dans le prophage ; b- il existait une liaison génétique entre les
gènes gal et les gènes situés à droite du site d’attachement du phage ; c- Il existait une liaison
génétique entre les gènes bio et les gènes situés à gauche du site d’attachement du phage ; d-
159
La distance entre les gènes gal et bio est plus importante chez les bactéries lysogènes que chez
les bactéries non lysogènes.

5.2.5 PHAGES TRANSDUCTEURS

Les phages transducteurs sont capables d’encapsider de l’ADN bactérien aussi bien que de
l’ADN du phage. Les particules virales contenant de l’ADN bactérien sont appelées particules
transductrices. Elles se forment aléatoirement et elles ne constituent qu’une petite fraction de
la population des phages issus d’une bactérie infectée. Ces particules peuvent se former de
deux manières : soit par excision aberrante du prophage, soit par encapsidation des fragments
d’ADN bactérien. Ce premier mécanisme de formation des particules transductrices
représente la formation des phages transducteurs de type galactose et biotine appelés λgal et
λbio. Après induction de l’excision d’un prophage, la sortie de l’ADN phagique hors de
l’ADN bactérien se déroule suivant une séquence d’événements extrêmement précise. Dans le
cas du phage λ, cette excision résulte de l’action combinée des gènes int et xis qui agissent sur
les sites d’attachement gauche et droit du prophage.

Une erreur d’excision peut avoir lieu dans environ une cellule sur 106 à 107cellules. Dans ce
cas, les deux coupures incorrectes ont lieu l’une dans l’ADN bactérien et l’autre au milieu de
l’ADN du prophage. Cette paire de coupures anormales ne conduit pas toujours à un fragment
d’ADN d’une longueur incompatible avec l’encapsidation dans la tête du phage ; il peut être
trop petit ou trop grand. Cependant si l’espacement entre les coupures produit une molécule
qui a entre 79 et 106 % de la taile du phage λ normal, l’encapsidation peut avoir lieu. Puisque
le prophage est situé entre les gènes gal et bio d’E. coli et puisque les coupures anormales dans
l’ADN de l’hôte peuvent avoir lieu soit à doite, soit à gauche du prophage, les particules
transductrices peuvent contenir soit les gènes bio (coupure à droite), soit les gènes gal
(coupure à gauche).

La formation des particules transductrices λbio et λgal implique la perte des gènes du phage λ.
Les particules λgal ne possèdent pas les gènes des protéines de la queue, qui sont localisés à
l’extrémité droite du prophage. Les particules λbio ne possèdent pas les gènes int et xis qui
sont situés à l’extrémité gauche du prophage. Le nombre exact manquants dépend de la
position de coupure qui génère la particule, ce nombre est correlé avec la quantité d’ADN
bactérien présent dans la particule. Les gènes du phage qui manquent sont situés aux
extrémités du prophage, mais à cause de la permutation dans l’ordre des gènes entre le
prophage et l’ADN libre du phage, les gènes délétés correspondent à la zone centrale de
l’ADN du phage libre. Puisque ces pahges transductrues ont perdu certains de leurs gènes, on
s’attend à ce qu’ils ne soient pas viables. Ceci est bien le cas des phages de type λgal qui n’ont
plus les gènes essentiels à la synthèse de la queue du phage et dans le cas de délétions plus
importantes, les gènes de la tête du phage. Ainsi ces particules ne sont plus capables de
former des descendants viables. Elles sont dites défectives et représentées par le symbole d
(pour défectif). Une particule de gène λgal est appelée λdgal. La particule λdgal contient les
extrémités cohésives et toute l’information nécessaire à la réplication et à la transcription de
l’ADN du phage. Elle peut donc poursuivre un cycle normal et lyser la cellule infectée. Si les
gènes de la tête du phage ne sont pas délétés, les ADN produits par le cycle de réplication
roulant sont clivés par le système Ter. Cependant puisque les queues ne sont pas ajoutées aux
160
têtes remplies d’ADN, aucune particule viable, capable de former des plages de lyse sur un
tapis bactérien, n’est produite dans le lysat.

Il existe ainsi un décalage entre la formation d’une particule virale et sa capacité à être
infectieuse et à continuer à se reproduire par des infections successives. Une particule λdgal
n’est pas infectieuse puisqu’il lui manque une queue ainsi que les gènes capables de
synthétiser cette queue, mais une telle particule provient d’un prophage qui possède
l’ensemble de gènes nécessaires à la production de particules viables. La situation est assez
différente dans le cas des phages transducteurs λdbio, puisque ces particules n’ontperdu aucun
des gènes essentiels au déroulement du cyle lytique. Ils ont perdu les gènes int et xis. Ces
gènes ne sont necessaires que pendant le cycle lysogénique. Ainsi ces particules sont capables
de se répliquer et d’infecter des bactéries. Ces phages sont synmbolisés par la lettre p (pour
formation des plages de lyse), ce qui conduit à l’écritue suivante λpbio.

Les phages transducteurs qui sont capables de former des particules transductrices contenant
des gènes bactériens des régions choisies du chromosome bactérienn sont appelés des phages
transducteur spécialisés. D’autres phages sont capables d’empaqueter des fragments d’ADN
bactérien de n’importe quelle partie du chromosome bactérien. Ils sont appelés des phages
transducteurs généralisés. Les phages transducteurs spécialisés ne produisent des particules
transductrices qu’à partir d’uen bactérie lysogène. Au contraire, les phages transducteurs
généralisés produisent des particules transductrices au cours d’une infection de type lytique.

Le mécanisme par lequel ces particules sont formées est plus direct. Certaines espèces de
phages, parmi lesquelles le phage T4, dégradent complètement l’ADN bactérien au début de
l’infection. Dans d’autres espècesdont le phage P1 d’E. coli et le phage P22 de Salmonella
typhimurium, il existe toujours des fragments de chromosome bactérien de même taille que
l’ADN du phage au moment de l’empaquetage de l’ADN du phage. Le système
d’empaquetage du phage λ est site-spécifique et nécessite la présence de site cos. Cependant
certains phages, comme le phage T4, remplissent simplement la tête du phage, ou comme les
phages P1 et P22, sont capables d’encapsider des fragments de taille très différente. Ces
derniers phages ne sont capables de faire la distinction entre l’ADN du phage et l’ADN
bactérien et quelque fois ils encapsident en fragment d’ADN bactérien. Dans une popppulation
de phages P1, environ 1% de particules phagiques contiennent un fragment d’ADN bactérien.
Les phages transducteurs sont très utiles pour réaliser des expériences de génétique. Ils
peuvent par exemple être utilisés pour transférer un gène bactérien d’une cellule à l’autre. Ils
ont aussi été utilisés pour isoler des fragments particuliers du chromosome bactérien.

5.3 CARACTERISTIQUES PARTICULIERES DE L’ADN


DE CERTAINS VIRUS EUCARYOTES

Généralement, le cycle de vie des virus ne peut s’effectuer dans n’importe quelle cellule. Un
virus ne peut se propager qu’au sein d’une espèce donnée. Chaque virus a donc son ou ses
hôtes propres. Ces cellules sont dites permissives ; par opposition, les autres types de cellules
sont dits non permissifs. C’est ce qui explique que les virus humains ne sont en général pas
infectieux chez les autres animaux et vice versa. Il convient cependant de rappeler que la
notion de permissivité ne concerne que la reproduction du virus et de la lyse cellulaire. Un
161
virus peut pénétrer dans une cellule non permissive, voire même s’intégrer dans son génome,
mais il ne se reproduira pas. De cette intégration au sein du génome de l’hôte peut résulter un
phénomène appelé transformation, c’est-à-dire acquisition des caractères de malignité. Ne
seront décrits ici qu’un petit nombre de virus exemplaires par leur intérêt médical,
principalement oncologique.

5.3.1 SV40 et POLYOME

SV40 et Polyome sont des papovirus à pouvoir transformant. Les papovirus sont de petits
virus à ADN circulaire double-brin sans enveloppe. Deux virus de cette famille, le SV40
(Semia virus n°40) et le Polyome (ainsi désigné à cause de la variété des tumeurs qu’il induit),
sont susceptibles de posséder un fort pouvoir transformant chez certains animaux, mais pas
chez l’homme. Ces deux virus sont très proches l’un de l’autre. Le SV40 a comme hôte le
singe rhésus. Il induit des tumeurs lorsqu’il est injecté à des rongeurs nouveau-nés (hôtes non
permissifs) et transforme les cellules fibroblastiques humaines en culture. Cependant, il
n’induit jamais de tumeurs chez l’homme. Cette dernière donnée résulte d’une
expérimentation involontaire en grande échelle. En effet, le vaccin de première génération
contre la polyomyélite a été obtenu à partir des cultures de cellules de rein du singe rhésus (fin
des années 50).

Comme ce singe est l’hôte naturel de virus SV40, (ce que l’on ne savait pas à l’époque), les
cultures cellulaires, utilisées pour la production du virus de la polyomyélite et la fabrication du
vaccin, et par voie de conséquence le vaccin, étaient infectées. Le virus a donc été injecté à des
milliers d’enfants lors des vaccinations ; ce qui fut fort heureusement sans conséquence et
démontra l’innocuité de ce virus chez l’homme. Le génome de ce virus a été entièrement
séquencé. Il est constitué de 5243 paires de bases qui codent pour 6 protéines. Les gènes se
répartissent en deux unités de transcription de sens opposés. La région précoce code pour les
protéines grand T et petit T, alors que la région tardive code pour les protéines de capside vp1,
vp2, vp3 et pour la protéine agno de fonction inconnue. Ces protéines sont obtenues par
épissage différentiel des deux transcrits.

Les régions promotrices de ces deux unités de transcription se superposent d’une part entre
elles et d’autre part avec l’origine de réplication. C’est à son niveau que s’effectuent toutes les
régulations. On y trouve des éléments de régulation observés chez les eucaryotes : enhancer
(cis-régulation), sites de fixation des facteurs trans-régulateurs que sont la protéine grand T et
la protéine Sp1. Lorsque le virus entre dans la cellule, son ADN migre vers le noyau, les
histones cellulaires s’associent et forment des nucléosomes, sauf au niveau de la séquence
régulatrice. Le tout constitue ce qu’on appelle le minichromosome. L’ARN correspondant à la
partie précoce est transcrit puis traduit en protéine petit T et grand T. Cette dernière se
comporte comme un facteur trans-activateur de la région précoce et participe au
déclenchement de la réplication du génome viral par les molécules d’ADN polymérase
cellulaire.

Les régions promotrices de ces deux unités de transcription se superposent d’une part entre
elles et d’autre part avec l’origine de réplication. C’est à son niveau que s’effectuent toutes les
régulations. On y trouve des éléments de régulation observés chez les eucaryotes : enhancer
162
(cis-régulation), sites de fixation des facteurs trans-régulateurs que sont la protéine grand T et
la protéine Sp1. Lorsque le virus entre dans la cellule, son ADN migre vers le noyau, les
histones cellulaires s’associent et forment des nucléosomes, sauf au niveau de la région
régulatrice. Le tout constitue ce qu’on appelle le minichromosome. L’ARN correspondant à la
partie précoce est transcrit puis traduit en protéine petit T et grand T. Cette dernière se
comporte comme un facteur trans-activateur de la région précoce et participe au
déclenchement de la réplication du génome viral par les molécules d’ADN polymérase
cellulaire.

Le mécanisme par lequel l’antigène grand T induit la réplication est encore mal connu. Il
semble qu’il agisse comme facteur trans-activateur de la transcription de l’ensemble des gènes
impliqués dans la réplication de l’ADN. Ce n’est qu’après réplication que sera transcrite la
région tardive. L’épissage différentiel et la traduction des ARNm ainsi produits donnent les
trois protéines de capside et la protéine agno permettant la formation de capsides virales
complètes. La principale différence entre le virus du polyome et le virus SV40 concerne la
région précoce qui code, chez le polyome, pour trois protéines, les protéines grand T, moyen T
et petit T. L’hôte naturel du virus du polyome est la souris. Le pouvoir transformant de ces
virus réside dans la région précoce et résulte de l’action des protéines T (T pour tumeur). Le
pouvoir transformant des protéines T a été démontré à la fois par des expériences de délétion
dans le génome viral et par l’utilisation des mutants thermo-sensibles.

Le rôle respectif de chacune des protéines T n’est pas parfaitement défini. Ceci résulte du fait
que les gènes de ces protéines se superposent. Les mutations ont donc des effets sur les deux
protéines en même temps, et il est difficile de préciser la responsabilité exacte de chacune.
Les données disponibles concernent surtout la protéine grand T. Il s’agit d’une protéine de 90
kDa dont la localisation est nucléaire et s’associe à une protéine cellulaire p53 en la stabilisant.
La protéine grand T, sans doute complexée à cette p53, induit l’expression de l’ensemble des
gènes des protéines impliquées dans le phénomène de la réplication de l’ADN, qu’il soit
génomique ou viral, et ce même dans des cellules qui sont en phase G0, c’est-à-dire bloquées.
Il en résulte un déclenchement de la division cellulaire. Cet effet est mimé par la seule
injection de la protéine grand T purifiée dans les cellules non permissives.

Dans les cellules transformées, il est possible de trouver jusqu’à une vingtaine de copies du
génome viral intégré dans le génome cellulaire. Ces intégrations sont indispensables pour une
transformation stable. Elles se font au hasard dans le génome de la cellule hôte. Elles
impliquent une linéarisation du génome viral, donc une coupure. L’intégrité de la région
précoce doit être respectée pour obtenir un effet transformant. Le modèle du polyome est
légèrement différent. La protéine grand T (100kDa) est une phosphoprotéine dont seuls 40 %
C terminaux sont nécessaires pour l’effet de transformation. Chez le polyome, la protéine
grand T n’est pas transformante mais simplement immortalisante. Le pouvoir transformant
réside dans la protéine moyen T, qui est une phosphoprotéine de 56 kDa. Ce schéma de
mécanisme de transformation ressemble à celui des oncogènes du virus de l’érythroleucémie
aviaire (ALV) où l’oncogène v-erbA est immortalisant et l’oncogène v-erbB est transformant.
163
5.3.2 ADENOVIRUS

Les adénovirus sont des virus à ADN double-brin linéaire d’une longueur de 36 Kb, donc
beaucoup plus long que SV40. L’homme est l’hôte naturel de certains adénovirus. A ses
extrémités, l’adénovirus possède une séquence inversée répétée d’une centaine de paires de
bases ; ce qui permet aux formes simple-brin de se circulariser. Son cycle de vie est le même
que celui de SV40. Il possède lui aussi des gènes à expression précoce et des gènes à
expression tardive. En revanche, les histones cellulaires ne s’associent pas à l’ADN viral. Une
protéine virale de 55 kDa est fixée de manière covalente à l’extrémité 5’ des brins et joue un
rôle majeur dans la constitution du complexe d’initiation lors de la réplication.

La réplication de ce virus est tout à fait particulière, puisque l’un des brins est répliqué en
totalité avant que l’autre ne soit. Elle s’effectue donc de manière continue sur les deux brins
(pas de fragments d’Okasaki). L’organisation des gènes est très complexe. Il est cependant
intéressant de noter que toutes les possibilités d’utilisation du génome sont ici utilisées à
plein : épissage différentiel, choix du promoteur, choix des sites de polyadénylation, cadres de
lecture chevauchants, utilisation de deux brins, etc. Les gènes de la région précoce sont
appelés E (pour early), ceux de la région tardive sont appelés L (pour late). Contrairement au
SV40, ces régions ne sont pas séparées, mais imbriquées.

L’un des gènes les plus importants est le gène E1a. Son produit est un peu l’équivalent de la
protéine grand T de SV40 et du polyome. Le produit du gène E1a est une protéine trans-
activatrice d’autres gènes viraux, mais aussi de toute une série de gènes non viraux.
L’adénovirus peut être transformant dans des cellules permissives, comme les cellules de rat.
Le virus s’intègre au hasard, le plus souvent sous forme de copies partielles. La zone
indispensable à la transformation ressemble à celle du polyome. D’une manière schématique,
E1a possède un pouvoir immortalisant et E1b possède un pouvoir transformant des cellules
déjà immortalisées. Les cellules immortalisées par E1a peuvent ultérieurement être
transformées aussi bien par E1b que par la protéine moyen T du polyome.

5.3.3 RETROVIRUS

Généralement l’information génétique passe de l’ADN, où elle est stockée, à l’ARN, qui sert
d’intermédiaire, puis aux protéines, qui sont les molécules fonctionnelles de la cellule. Il existe
cependant un groupe d’objets biologiques dont le fonctionnement génétique s’effectue en sens
inverse. Dans les rétrovirus en effet, le matériel génétique est l’ARN, qu’une enzyme transcrit
en ADN. Ce dernier s’intègre dans les chromosomes de la cellule infectée et assure
ultérieurement la réplication du virus. Les rétrovirus sont des virus eucaryotes dont le
génome est constitué par un ARN simple-brin de faible longueur. Ils possèdent tous une
organisation similaire. Leur cycle de vie est tout à fait particulier, puisque l’ARN viral doit
être intégré, sous forme d’ADN, dans le génome de la cellule hôte. Ce virus intégré porte le
nom de provirus. Sa transcription par l’ARN polymérase II cellulaire fournit des copies dont
certaines serviront de génome pour de nouveaux virus, alors que d’autres seront maturées et
traduites pour former les protéines virales. L’ARN doit donc être transformé en ADN double-
brin immédiatement après l’infection. Cette transcription réverse est assurée par une
polymérase particulière, la transcriptase réverse, qui est codée par le gène pol du virus. Cette
164
enzyme est tout à fait particulière, puisqu’elle possède quatre activités différentes qui vont lui
permettre à elle seule de synthétiser la copie ADN double-brin de l’ARN viral.

Ces activités sont : a. l’activité transcriptase réverse proprement dite. b. une activité de type
Rnase H, c’est-à-dire une activité de type RN asique vis-à-vis des ARN hybridés à de
l’ADN. c. une activité d’ADN polymérase ADN dépendante. d. elle assure enfin la
réalisation d’une cassure spécifique à l’extrémité 5’ de la séquence U3. Cette étape de
rétro-transcription, qui est très complexe, entraîne aussi la création de séquences particulières,
les LTR (long terminal repeat) aux extrémités du virus. Ces LTR sont indispensables pour
l’intégration dans l’ADN génomique de la cellule hôte. Ultérieurement, ce seront les LTR qui
assureront la totalité de régulation de l’expression du virus et fourniront les séquences
nécessaires à la polyadénylation. La rétrotranscription suit un mécanisme très complexe et
aboutit à la création des LTR. En effet, la rétrotranscription est effectuée dans le cytoplasme
de la cellule hôte. Comme pratiquement toutes les polymérases d’acides nucléiques, la
transcriptase réverse a besoin d’une amorce pour initier son travail. Cette amorce est fournie
par un ARNt cellulaire qui s’hybride avec la séquence PB, localisée immédiatement après la
séquence U5 du virus.

Cycle de vie des rétrovirus


ARN

Rétrotranscription

ADN

Circularisation et intégration

Transcription

Fraction des ARN utilisés Fraction des ARN utilisés


comme génomes viraux comme ARNm

Nouvelles particules Maturation de l’ARN


virales et traduction
165
Ceci permet de synthétiser un court fragment d’ADN complémentaire jusqu’à l’extrémité 5’
du virus (séquence R). La partie ARN de cet hybride ARN-ADN est alors détruite par
l’activité de type RnaseH de la transcriptase réverse. Ceci va permettre à l’extrémité 3’ du
virus, qui contient aussi une séquence R de venir s’hybrider avec la petite portion d’ADN néo-
synthétisée. Il en résulte une circularisation du génome viral. La rétrotranscription peut alors
reprendre et se continuer jusqu’à ce que la totalité de l’ARN viral soit rétrotranscrite. L’ADNc
simple-brin synthétisé est donc constitué, de 5’ vers 3’, des séquences suivantes : U5, R, U3,
env, gag, (onc), PB. Le second brin doit ensuite être synthétisé. Pour cela, une coupure est
pratiquée sur l’ARN au début de U3 par la transcriptase réverse et les séquences virales U3 et
R sont détruites. La transcriptase réverse synthétise à partir de ce point le début du second
brin et s’arrête au niveau de l’ARNt, faute de matrice pour continuer. L’ARNt est alors
détruit ; ce qui permet aux deux séquences PB de s’hybrider et aux deux brins d’être achevés.
De ce mécanisme particulier, il résulte que les deux extrémités de l’ADN synthétisé sont
identiques : U3–R - U5, alors que le virus possédait lui la séquence R-U5 en 5’ et U3– R en 3’.

Les LTR permettent l’insertion dans l’ADN génomique. En effet, la copie ADN est
transportée dans le noyau où elle est circularisée. Son intégration dans le génome de la cellule
hôte nécessite une endonucléase, l’intégrase, qui, comme la transcriptase réverse, est codée par
le gène pol. Le mécanisme d’intégration est, semble-t-il identique à celui de la transposition.
Cette intégration se traduit par la perte de deux bases à chaque extrémité du virus et par la
duplication d’une séquence de 6 bases du génome de l’hôte dont une copie est retrouvée de
chaque côté du virus intégré.

Elles correspondent aux répétitions directes des transposons, et le mécanisme de leur


génération au cours de l’intégration est identique. En outre, les LTR contiennent les
séquences nécessaires à la transcription du provirus. Une fois intégré dans le génome de la
cellule hôte, les gènes viraux sont entourés par les LTR. Bien que ces séquences soient
identiques, elles ne jouent pas le même rôle à l’extrémité 5’ et à l’extrémité 3’ du provirus. Au
niveau de l’extrémité 5’, le LTR joue un rôle de promoteur fort de transcription. On y
trouve : une CAAT box, une TATA box, le site d’initiation de la transcription et un enhancer,
proche de celui du virus SV40, constitué de deux séquences identiques de 70 paires de bases
environ. A partir de ce promoteur, le génome proviral sera transcrit en un unique ARN par
l’ARN polymérase II cellulaire. Cet ARN est activement transcrit, puisqu’il peut représenter
jusqu’à 10 % des ARN cellulaires.

Les LTR permettent l’insertion dans l’ADN génomique. En effet, la copie ADN est
transportée dans le noyau où elle est circularisée. Son intégration dans le génome de la cellule
hôte nécessite une endonucléase, l’intégrase, qui, comme la transcriptase réverse, est codée par
le gène pol. Le mécanisme d’intégration est, semble-t-il identique à celui de la transposition.
Cette intégration se traduit par la perte de deux bases à chaque extrémité du virus et par la
duplication d’une séquence de 6 bases du génome de l’hôte dont une copie est retrouvée de
chaque côté du virus intégré. Elles correspondent aux répétitions directes des transposons, et
le mécanisme de leur génération au cours de l’intégration est identique. En outre, les LTR
contiennent les séquences nécessaires à la transcription du provirus.
166
Une fois intégré dans le génome de la cellule hôte, les gènes viraux sont entourés par les LTR.
Bien que ces séquences soient identiques, elles ne jouent pas le même rôle à l’extrémité 5’ et à
l’extrémité 3’ du provirus. Au niveau de l’extrémité 5’, le LTR joue un rôle de promoteur fort
de transcription. On y trouve : une CAAT box, une TATA box, le site d’initiation de la
transcription et un enhancer, proche de celui du virus SV40, constitué de deux séquences
identiques de 70 paires de bases environ. A partir de ce promoteur, le génome proviral sera
transcrit en un unique ARN par l’ARN polymérase II cellulaire. Cet ARN est activement
transcrit, puisqu’il peut représenter jusqu’à 10 % des ARN cellulaires.

Le LTR situé à l’extrémité 3’ fournit la séquence AATAA, qui est le signal pour la coupure
qui précède la polyadénylation. Ce LTR est un promoteur non spécifique susceptible d’activer
tout gène, endommagé ou non, situé à proximité. Aussi cette structure est-elle très utilisée dans
les constructions de vecteurs d’expression eucaryotes.

Une partie des ARN transcrits à partir du provirus serviront de messagers pour la synthèse des
protéines virales. Le schéma est variable suivant le rétrovirus. Une caractéristique générale est
l’absence d’introns. D’une manière schématique, l’ARN précurseur est clivé en ARN plus
petits qui servent de matrice pour la synthèse de protéines (polyprotéines), qui seront elles-
mêmes clivées pour donner l’ensemble de protéines virales. Le gène gag fournit ainsi une
série de protéines virales variables suivant le virus ; le gène pol fournit la transcriptase réverse,
l’intégrase et une protéase ; le gène env fournit les glycoprotéines d’enveloppe. Le gène
facultatif onc est tout à fait particulier. Il n’est pas indispensable au virus. Les expériences de
délétion et l’isolement de mutants conditionnels thermosensibles ont montré qu’il était
responsable du pouvoir transformant des virus qui le possèdent. Cette donnée majeure est la
base de la compréhension des mécanismes de la cancérisation.
Rétrotranscription des rétrovirus
167
168
Rétrovirus humains, modèle du virus HIV

Si les rétrovirus ont été initialement découverts et très étudiés dans des espèces animales
(oiseaux, rongeurs), les rétrovirus susceptibles d’infecter l’homme sont encore peu nombreux.
Il s’agit des HTLV I et II (Human T cell Leukemia Virus) responsables d’une pathologie des
lymphocytes T, d’où leur nom, et du HIV (Human Immuno deficiency Virus), qui est
responsable du SIDA (Syndome d’Immuno-Déficience Acquise). Son génome est d’environ
10 Kb ; ce qui est plus long que la plupart des autres rétrovirus.

Chaque virus en possède deux copies identiques. Il possède, comme les autres, les trois gènes
gag, pol et env. S’y ajoutent 5 autres gènes : tat, rev, nef et vif, dont les produits ont tous pour
effet d’augmenter le taux de réplication et d’expression du virus, et enfin vpr qui code pour
une protéine à rôle inconnu. Ce virus, qui appartient à la catégorie des lentivirus (comme le
virus Visma du mouton, le virus d’immuno-déficience félin, le virus de l’anémie infectieuse
du cheval), provoque une pathologie à progression lente dont l’issue est semble-t-il toujours
fatale à partir du moment où la maladie est déclarée.

Il possède une affinité pour la protéine CD4 (récepteur T4) qui est un récepteur localisé à la
surface d’une sous-classe des lymphocytes T, les lymphocytes T4. Après interaction avec
CD4, le virus est internalisé et son ARN génomique libéré. Après rétrotranscription, la forme
provirale résultante est intégrée dans le génome de la cellule hôte comme c’est le cas de tous
les rétrovirus. Cependant, il persiste dans la cellule de nombreuses copies non intégrées ; ce
qui est, semble-t-il, une caractéristique propre à ce rétrovirus.

Structure du provirus HIV

L’intégration est suivie d’une longue période de latence, pendant laquelle le provirus reste
muet. Une fois l’activation effectuée, par un mécanisme inconnu, le provirus intégré est
transcrit en ARN, qui servira d’une part de génome pour de nouveaux virions et d’autre part de
messager pour la synthèse des protéines virales. Le tout permet la formation d’un virus
complet qui est relâché par exocytose. Une des caractéristiques de ce virus est d’évoluer
rapidement, faisant apparaître de nouvelles souches, et contrariant la mise au point d’un
vaccin. Le SIDA et le cancer (leucémie) ont des effets opposés : alors que le cancer provoque
une prolifération anarchique des lymphocytes T, le SIDA entraîne au contraire la mort de ces
lymhocytes et la déterioration du système immunitaire.

Les rétrovirus endogènes sont des virus dont le matériel génétique est présent dans les
chromosomes de nombreuses espèces animales, sans doute en raison d’une infection ancienne.
Dans certaines conditions, ces séquences endogènes d’ADN produisent des particules virales
infectieuses et fonctionnelles. Cependant toutes les maladies que l’on sait être dues à des
rétrovirus sont provoquées par des virus exogènes. Lorsqu’un rétrovirus infecte une cellule, la
transcriptase inverse synthétise une molécule d’ADN correspondant au code porté par l’ARN
169
viral. L’ADN produit migre vers le noyau et s’intègre dans les gènes de la cellule infectée.
Ultérieurement, en interagissant avec les propres gènes de la cellule, le provirus peut induire
une tumeur et, comme l’ADN viral contient l’information nécessaire à la synthèse des
composants du virus, une activation peut produire la synthèse de nouvelles particules virales.

Dans le cas du virus du SIDA, les cellules infectées sont souvent les lymphocytes T4, c’est-à-
dire les globules qui jouent un rôle prépondérant dans la régulation du système immunitaire.
Une fois intégré dans le matériel génétique du lymhocytes T4, le virus du SIDA peut rester
latent jusqu’à ce que le lymphocyte soit stimulé par une seconde infection. Le virus sort alors
de sa latence et se reproduit si rapidement que les très nombreuses particules virales formées,
quand elles quittent la cellule, percent la membrane cellulaire de multiples trous qui tuent le
lymhocyte. La diminution des lymhocytes T4 dans l’organisme rend les malades sensibles à
des infections opportunistes, c’est-à-dire à des agents tolérés par les individus en bonne santé.

Pour isoler le virus, on procède de la manière suivante : a- cultiver le virus dans des
lymphocytes T stimulés par le facteur de croissance : interleukine 2 ; b- détecter sa présence
par des tests sensibles à transcriptase inverse. Il semble que l’infection puisse être déclenchée
par le virus libre ou par des virus portés par des cellules infectées. Une fois que le virus a
pénétré dans l’organisme, il s’attaque à toute cellule dont la membrane externe comporte la
molécule T4, cette molécule qui définit la catégorie des lymhocytes T4, mais on la trouve aussi
sur la membrane des monocytes et des macrophages, deux types de cellules immunitairesqui
semblent parmi les premières cibles du virus lors de l’infection.

Les monocytes et les macrophages se forment à partir des mêmes précursseurs de la moelle
osseuses que les lymhocytes, mais ils jouent des rôles différents dans la réponse immunitaire.
Les macrophages notamment, stimulent les lymhocytes T4 et les rendent capables d’accomplir
leur tâche. Certaines des interactions entre les macrophages et les lymhocytes T4 se
produisent dans les ganglions lymphatiques. On pense que de nombreux lymhocytes T4 sont
infectés par contact avec les macrophages dans les ganglions lymphatiques. Après un temps
de latence variable, les lymphocytes infectés meurent lorsque les particules virales s’en
échappent.

La diminution des lymphocytes T4 est donc due à la mort des cellules infectées et au fait que
les lymphocytes ne prolifèrent plus comme lors des réponses immunitaires normales. En effet,
lors de leurs interactions avec les macrophages, les lymphocytes T4 acquièrent la capacité de
reconnaître une protéine particulière, mais ils sont aussi activés : des facteurs de croissance
sécrétés déclenchent la prolifération des lymphocytes, de sorte que l’organisme se retrouve
doté d’un clone de lymphocytes identiques (chaque cellule engendre environ 1000
descendants) tous programmés pour répondre au même antigène.

Par la suite, les descendants du lymphocyte activé circulent dans le sang et, lorsqu’ils
recontrent l’antigène, ils provoquent la maturation des cellules des cellules appelées
lymphocytes B et lymphocytes T8, qui attaquent directement les agents pathogènes. De cette
manière, le clone des cellules mémoire assure à l’organisme une immunité durable. Lorsqu’un
lymphocyte T4 est infecté par un virus du SIDA, son activation entraîne un résultat différent :
les lymphocytes T infectés au lieu de donner des clones de quelques 1000 cellules, prolifèrent
170
peu et n’engendre que des clones réduits d’une dizaine de cellules seulement. En outre lorsque
ces 10 cellules circulent dans le sang et sont stimulées par les antigènes, elles se mettent à
produire le virus et meurent. La destruction directe des lymphocytes infectés et le trop faible
développement des clones mémoire sont les principaux mécanismes responsables de la
disparition des lymphocytes T4 chez les victimes du SIDA.

Protéine T4

La molécule T4 joue un rôle prépondérant lors de l’infection par le virus du SIDA. Elle
interagit avec l’enveloppe externe du virus permettant au virus de pénétrer dans les cecllules.
L’enveloppe virale est une membrabe garnie de glycoprotéines, chaque glycoprotéine
comportant 2 sous – unités : gp41 et gp120. Quand le virus du SIDA s’approche d’une cellule
cible, les sous – unités gp120 semblent interagir avec les molécules T4 de la membrane
cellulaire. La membrane cellulaire forme alors une vésicule qui attire le virus dans la cellule
(endocytose). Le virus du SIDA s’attaque aussi aux monocytes et aux macrophages portant la
molécule T4, mais les monocytes et les macrophages meurent plus difficilement que les
lymphocytes T4. Il semble que les monocytes et les macrophages comportent peu de molécules
T4 à leur surface et qu’il faille une quantité de molécules T4 supérieure à un certain seuil pour
que les cellules meurent. On pense que la vitesse de destruction cellulaire serait même
proportionnelle à la concentration en molécules T4 à la surface des cellules infectées.

Réplication virale

La réplication virale semble être assurée par un groupe de gènes de régulation qui font que le
génome du virus du SIDA est plus complexe que celui des autres rétrovirus. En effet le
génome de nombreux rétrovirus comporte principalement 3 gènes codant les composants de la
particule virale : le gène env, qui code les protéines de l’enveloppe, le gène gag, qui code le
cœur contenant l’ARN et le gène pol, qui code la transcriptase inverse. Ces trois gènes sont
flanqués d’éléments appelés longues répétitions terminales (LTR), où des séquences d’ADN
participent à la commande de l’expression des gènes viraux. Le virus du SIDA comporte au
moins 4 autres gènes : les gènes tat, trs, sor et 3’ orf. Ces qautre gènes supplémentaires ne
codent pas des composants viraux, mais de petites protéines qui régulent l’expression des
gènes.

Le gène tat assure 2 fonctions : a- comme ses analogues de HTLV-I et HTLV-II, le gène tat
semble réguler la transcription de l’ARNm à partir des gènes viraux ; b- la protéine tat
intervient également dans les événements postérieurs à la transcription, lors de la traduction de
l’ARNm par exemple. Le gène trs semble commander l’équilibre entre les diverses formes
d’ARNm viraux. Les fonctions des gènes sors et 3’ orf sont encore inconnues. Les signaux
chimiques qui activent les lymphocytes activent simultanément les séquences LTR. On peuse
que les petites protéines régulatrices interagissent avec le provirus pour stimuler la synthèse
des composants viraux. Ces composants s’assemblent de façon autonome et les particules
virales tuent la cellule en bourgeonnant vers l’extérieur.
171
Viroïdes

Les viroïdes sont de petits agents connus responsables des maladies infectieuses. Ils se
présentent sous la forme de courts brins d’ARN. Ils provoquent plusieurs maladies chez les
plantes et sont peut–être responsables d’affections énigmatiques chez l’homme et chez les
animaux. Alors qu’un virus typique se compose de matériel génétique (ADN ou ARN)
entouré par une enveloppe protéique, le viroïde n’est qu’un très court brin d’ARN, beaucoup
plus petit et beaucoup plus simple que le virus. On a actuellement identifié des viroïdes dans
une dizaine de maladies affectant toutes des plantes supérieures, mais d’après certains
indicces, ils pourraient provoquer également des maladies chez les animaux et peut-être
quelques rares affections nerveuses chez l’homme.

La démonstration irréfutable par L. Pasteur, Robert Koch et d’autres de la responsabilité des


microorganismes, en particulier des bactéries dans nombre de maladies infectieuses, a fait
naître vers 1890 l’hypothèse que toutes les maladies infectieuses devaient être provoquées par
des microorganismes. En étudiant une maladie des plantes, la mosaîque de tabac, Dimitri
Ivanovski et Martinus Beijerinck ont découvert que l’agent causal était capable de passer à
travers des filtres dont les pores étaient suffisamment petits pour retenir les bactéries. D’où le
concept de virus – filtants, qui a permis l’identification des particules virales et la
compréhension de leur rôle pathogène.

Un exemple des maladies provoquées par les viroïdes concerne la maladie des tubercules
fusiformes de la pomme de terre. Cette maladie provoque la formation des tubercules allongés,
noueux dont la surface est parfois découpée par des profondes crevasses. La purification des
viroïdes consiste à soumettre un extrait infectieux (broyat des feuilles de tomates infectées, par
exemple, dans une solution de phosphate) à des centrifugations à des vitesses relativement
modérées et très élevées. La centrifugation à 10.000 tours permet la sédimentation des
impuretés alors que les particules virales restent en suspension dans le liquide surnageant.
Après ultracentrifugation du surnageant à 100.000 tours ou plus, la plupart des particules de
virus sédimentent et forment un culot. Ensuite on remet le culot en suspension, on centrifuge à
nouveau pour enlever un peu plus d’impuretés.

On ultracentrifuge à nouveau pour que les virus se rassemblent dans le culot. Le résultat fut
que la plus grande partie du matériel infectieux restait dans le liquide surnageant, même après
ultracentrifugation à 100.000 tours pendant 4 heures. Une explication plausible était que
l’agent infectieux était très petit. Plus tard on découvrit que l’agent infectieux sédimentait non
seulement à une vitesse inférieure à celle de la plupart des particules virales étudiées, mais
également plus lentement que le composant acide nucléique de ces particules. D’où
l’hypothèse : « l’agent infectieux était constitué seulement d’ADN ou d’ARN ». Le
traitement du matériel infectieux par la ribonucéase inactivait l’agent infectieux alors que le
traitement par des enzymes qui hydrolysent l’ADN ou les protéines n’exerçait aucun effet sur
le pouvoir infectieux de l’agent, ni sur son comportement lors de la sédimentation.

L’élément essentiel de l’infection devait donc être l’ARN et qu’il n’y avait probablement pas
de protéines. Ainsi donc l’ARN infectieux n’est pas encapsidé dans une coque protéique
comme il l’est chez les virus. A l’état natif, les viroïdes sont des molécules monocaténaires
172
recombinées en épingle de cheveux, avec des régions étendues où les bases sont appariées. Un
viroïde est en fait une molécule d’ARN monocaténaire ayant des appariementa intracaténaires
si étendues qu’il présente certaines caractéristiques d’ARN bicaténaire. Pour déterminer la
composition chimique des viroïdes, on utilise la méthode des empreintes consistant à : 1- faire
digérer l’ARN par une enzyme qui ne coupe la chaîne des nucléotides qu’en certains sites, 2-
séparer par électrophorèse et par chromatographie les fragments obtenus (qui contiennent de
un à douze nucléotides). Il existe bien dans les cellules non infectées de nombreuses espèces
végétales dont la tomate, des enzymes capables de répliquer l’ARN à partir d’une matrice
d’ARN.

Ces enzymes pourraient évidemment contrôler la synthèse d’un nouvel ARN viroïdique (mais
cela reste à prouver). Il est alors probable que la réplication des viroïdes repose entièrement
sur les systèmes enzymatiques de l’hôte végétal. Les mécanismes moléculaires de réplication
des viroïdes sont encore mal connus. On trouve cependant des viroïdes dans les noyaux des
cellules infectées, là où s’opèrent la régulation des gènes, la mise en route ou l’arrêt de leur
transcription. Il est possible que les viroïdes fonctionnent comme des molécules régulatrices
anormales qui empêchent, d’une façon ou d’une autre, le contrôle des gènes codant pour des
hormones particulières. La plupart des symptômes des maladies produites par les viroïdes
consistent en des troubles de la croissance. Ils peuvent donc résulter d’un désiquilibre de
l’activité des hormones de croissance.

5.3.4 VIRUS DE L’HEPATITE B (HBV)

HBV est responsable de l’hépatite B virale, susceptible dans certains cas d’évoluer vers un
hépatocarcinome. Il fait partie de la famille des Hepadna viridae. Son génome est constitué
d’un ADN circulaire partiellement double-brin. Aucun des brins n’est fermé, et le cercle du
génome viral se ferme par hybridation, la fermeture étant due au chevauchement de ses
extrémités cohésives. Le brin le plus long est appelé L(-) (pour long), sa longueur est de
3300 bases environ. Son extrémité 5’, qui est localisée à la position 1826, est associée à une
protéine qui lui est liée par une liaison covalente. Le second brin, appelé S(+) (pour small)
n’a pas une longueur fixe. Elle est comprise entre 50 et 100 % de celle du brin L(-). Son
extrémité 5’ est localisée à la position 1601.

La région qui se situe entre 1601 et 1826 correspond donc à la position cohésive déjà évoquée
qui permet la circularisation du virus. Cette séquence est limitée de part et d’autre par les
séquences DR1 et DR2 qui correspondent à une répétition directe de 11 bases (5’-
TTCACCTCTGC3’). Le brin S(+) semble dépourvu des gènes codants. Le brin L(-) contient
4 phases de lecture ouvertes (ORF) appelées respectivement S, C, X et P. Cette dernière se
superposant aux précédentes. La première phase de lecture ouverte, la région S, code pour les
protéines d’enveloppe du virion. Elle est divisée en 3 régions : la région pré S1, la région pré
S2 et le gène S.

Le gène C code pour une protéine de 22 kDa, la protéine p22 c qui constitue le corps du virion.
Elle est phosphorylable et contient à son extrémité C-terminale une séquence riche en arginine
qui semble interagir avec l’ADN viral. La région X code pour une protéine de 15 kDa dont le
rôle n’est pas encore connu. Le gène P code pour une protéine de 90 kDa qui est l’ADN
173
polymérase du virus. Elle possède une activité de type transcriptase réverse. Deux types de
messagers seulement sont transcrits et le seul brin L(-) est utilisé comme matrice. Le plus long
des transcrits a une longueur de 3,5 Kb ; il est donc plus long que le génome viral ; ce qui
implique que l’ARNm possède à ses extrémités la même séquence qui a été transcrite deux
fois. L’origine de transcription de ce messager est localisée à la position 1818, donc tout au
début de la courte région pré C. Le second messager possède une longueur de 2,1 Kb. Son
site d’initiation est situé entre les régions pré S1 et pré S2 à la position 3155. Aucun des deux
messagers ne subit d’épissage.

Réplication de HBV

La réplication de HBV ressemble à celle des rétrovirus. En fait, bien que constitué d’un ADN
partiellement double-brin, la réplication du génome viral ressemble à celle des rétrovirus.
Après infection, le génome viral migre au niveau du noyau où il est linéarisé, complété et
superenroulé. L’ARN polymérase de la cellule infectée transcrit un grand nombre de copies
du brin L(-) auxquelles s’associe la protéine liée à l’extrémité 5’ du brin L(-) du virus. Ces
ARN sont encapsidés avec des molécules de polymérase virale (produit de gène P). Ils
portent le nom de prégénomes. Au sein de la particule virale, la polymérase rétro-transcrit
l’ARN en un brin d’ADN L(-).

L’initiation de cette transcription est assurée par une protéine fixée à l’extrémité de l’ARN.
L’ARN matrice est ensuite détruit par l’activité RnaseH de la polymérase virale, sauf sur une
courte distance (environ 20 pb) au niveau de la région DR2. Ce reste d’ARN sert d’amorce
pour la synthèse du second brin toujours par la polymérase virale. La synthèse du second brin
s’arrête de manière aléatoire en 3’ ; ce qui explique pourquoi le génome viral n’est que
partiellement double-brin et pourquoi sa longueur varie d’un virus à l’autre. Une autre
ressemblance avec les rétrovirus est qu’il peut s’intégrer dans le génome des cellules infectées.

Virus de l’hépatite B et la sérologie

Lorsqu’une personne est infectée par le virus, des particules virales sont détectables dans le
sang. La multiplication du virus s’effectue dans les cellules hépatiques. Durant cette phase, les
particules retrouvées dans le sang sont principalement des virus complets (particules de Dane).
Ultérieurement, les particules retrouvées dans le sang correspondent à des virus vides. Chez
les sujets infectés, trois types majeurs d’antigènes sont détectables : les antigènes HBs
(antigène australia), HBc et Hbe. L’antigène HBs correspond à une structure qui dérive des
protéines d’enveloppe. L’enveloppe virale est constituée de trois types de protéines : les
protéines majeure, moyenne et grande. Ces protéines sont codées par la région S du génome
viral. La dimérisation de deux protéines de type majeur via un pont disulfure constitue
l’antigène HBs. L’antigène HBc correspond à la protéine p22c de la nucléocapside codée par
la région C du génome viral. L’antigène Hbe correspond à un épitope cryptique qui émerge
lors de la dislocation de la capside.
174
Virus de l’hépatite B et l’hépatocarcinome

Très tôt, des études épidémiologiques avaient permis d’établir un lien entre l’hépatite B et
l’hépatocarcinome. Le problème était de déterminer quel était le mécanisme en cause, puisque
le virus ne contient apparemment pas d’oncogènes. Ce sont les études sur le site d’intégration
du virus dans le génome des cellules cancéreuses qui ont apporté les premiers éléments de
réponse. Bien qu’à l’évidence, le site d’intégration ne soit pas unique, la stratégie a consisté à
cloner, dans les cellules d’hépatocarcinome, la région d’intégration du virus et, dans un second
temps, à cloner la séquence correspondante dans les hématocytes normaux. Dans les
hépatomes, un site préférentiel d’intégration est à proximité d’un gène présentant de très fortes
homologies avec le récepteur des glucocortcoïdes et l’oncogène viral v-erbA. Ce gène, situé
sur le chromosome 3 et appelé hap, code pour un récepteur de l’acide rétinoïque. Le virus
s’intègre immédiatement après ce gène ; ce qui a pour effet d’en augmenter la transcription,
puisque les messagers correspondants, qui ne sont pas détectables dans les hématocytes
adultes et fœtaux, sont retrouvés à un taux élevé dans les hématomes. L’hypothèse est donc
que le gène hap est un oncogène cellulaire dont la transcription est augmentée du fait de
l’intégration à son contact du virus de l’hépatite B ; ce qui serait au moins l’une des causes de
la transformation.

5.4 COMPLEXITE DU MONDE VIRAL

Dotés à la fois des caractéristiques du vivant et du non vivant, les virus ont toujours été placés
à la frontière entre les deux mondes, dans une sorte de no man’s land qui contente tous les
belligérants. Ce sont des parasites obligatoires des cellules. Ils n’ont de vie qu’à l’intérieur de
la cellule ; en dehors de la cellule, ce sont des particules inertes. Certains scientifiques les
considèrent comme des structures complexes constituées des molécules organiques, mais
totalement dénuées de vie, alors que d’autres affirment que les virus sont des organismes
vivants.

En effet, certains faits plaident pour placer les virus dans le monde vivant : - comme les
organismes vivants, les virus sont classés en ordres, familles, sous-familles, genres et espèces ;
- le parasitisme obligatoire des virus que l’on pensait être l’apanage des virus existe aussi chez
les bactéries. En effet de nombreuses bactéries telles les rickettsies sont totalement
dépendantes de leurs cellules hôtes ; - certains virus contiennent des ARN et des ADN ; -
certains virus changent de forme en dehors de tout contexte cellulaire. Deux exemples
permettent d’appuyer ces affirmations : celui d’un virus infectant une amibe, appelé Mimivirus
(pour Mimicking Microbe Virus ou Virus imitant les microbes) et celui du virus ATV (pour
Acidianus Two-tailed Virus).

MIMIVIRUS

Mimivirus est un gros virus à ADN dont la taille est plus proche de celle d’une bactérie que
celle d’un virus. C’est un virus géant avec une structure icosaédrique typique. Son diamètre
est de 400 nm, 2,5 fois plus grand que le diamètre des plus gros virus connus, les Iridovirus. Il
est constitué d’une capside renfermant un ADN double-brin ; mais aussi de l’ARN et plusieurs
centaines de protéines (une dizaine de protéines au maximum pour la plupart de virus). Il est
175
visible au microscope et peut être coloré par la coloration de Gram (méthode de coloration
spécifique des bactéries), d’où son nom. En effet Mimivirus est une contraction de Mimiking
microbe virus, c’est-à-dire virus imitant les bactéries. Cependant Mimivirus est incapable de
division ; son cycle vital inclut une éclipse typique des virus : le virus entier pénètre dans une
cellule, il disparaît ensuite et réapparaît en de nombreuses copies. C’est un parasite
intracellulaire strict. De plus aucun gène codant des enzymes requises pour la production
d’énergie n’y a été trouvé.

Le génome de Mimivirus a été séquencé, il contient environ 1,2 million de paires de bases, le
double de plus gros virus connus. Ce génome contiendrait plus de 1200 gènes dont plus de 200
sont reconnaissables. Nombre de ces gènes ont été trouvés pour la première fois dans un virus.
C’est notamment le cas d’environ une trantaine de gènes qui n’ont été identifiés jusque là que
dans les organismes cellulaires, comme par exemple les gènes qui codent des protéines de
réparation, des protéines d’aide au repliement des protéines et des enzymes du métabolisme,
jamais mises en évidence chez un virus.

Au départ les êtres vivants étaient divisés en Procaryotes (toujours unicellulaires et dépourvus
de noyau) et Eucaryotes qui sont pourvus de noyau (unicellulaires ou multicellulaires). Les
procaryotes ont ensuite été répartis en deux groupes : les Bactéries et les Archae. Ces derniers
étant des microorganismes vivant dans des conditions extrêmes, morphologiquement
semblables aux bactéries, mais génétiquement différents de bactéries. Le séquençage des
bactéries, des Archae et des eucaryotes a permis de montrer qu’il existe un ensemble de 63
gènes qui sont communs à tous les organismes vivants. Mimivirus contient 7 de ces gènes. En
outre Mimivirus comporte un certain nombre de gènes dits orphelins, c’est-à-dire des gènes
codant des protéines encore inconnues qui constituent 80% de son génome. Par alleurs et
contrairement au dogme selon lequel un virus ne peut avoir qu’un seul type d’acide nucléique
(ADN ou ARN), Mimivirus contient de l’ADN et de l’ARN. Ainsi en plus des 3 branches de
l’arbre phylogénique, Mimivirus ferait des virus la 4e branche.

VIRUS ATV (Acidianus Two-tailed Virus)

ATV est un virus qui infecte une archébactérie, Acidianus convivator, des sources
hydrothermales acides et qui peut croître en dehors de la cellule. Il se présente sous la forme
de citron lorsqu’il bourgeonne de la cellule. Lorsque la température est comprise entre 75 et 90
°C, un bras pousse à chaque extrémité. ATV change de forme selon un processus actif, en
dehors de tout contexte cellulaire. En effet, il a la forme d’un citron qui s’allonge à chaque
extrémité lorsque la température atteint environ 80 °C. Il convient de noter que ces
modifications morphologiques faciliteraient l’infection de son hôte qui vit à proximité des
sources hydrothermales où les températures sont de l’ordre de 80°C. ATV remet ainsi en
cause un des dogmes de la virologie selon lequel un virus ne peut se modifier en dehors d’une
cellule.

Toutes ces obsevations non seulement mettent en évidence le caractère complexe du monde
viral, mais aussi remettent en cause certains dogmes en biologie. C’est ce qui a conduit de
nombreux biologistes à proposer la création dans l’arbre phylogénique, en plus de trois
176
branches connues (Eucaryotes, Procaryotes et Archébactéries), d’une quatrième branche, celle
des Girus (pour Giant Virus), un groupe des virus géants.

Chapitre 6

GENIE GENETIQUE

INTRODUCTION

Génie génétique, recombinaisons génétiques in vitro, ingénierie génétique ou manipulations


génétiques in vitro désignent une seule et même chose. Il s’agit d’un ensemble de techniques
issues de la biologie moléculaire, permettant de modifier le matériel génétique d’une cellule
par la manipulation des gènes in vitro. Fondamentalement ces techniques permettent de
repérer un gène, de l’isoler au milieu des centaines, voire des milliers d’autres gènes de
l’organisme, de l’intégrer dans une cellule hôte et de modifier, à sa guise, son expression.
Actuellement, le génie génétique est pratiqué dans plusieurs centaines de laboratoires de part
le monde et constitue la pierre angulaire d’une science en pleine expansion.

Les premières expériences sur les recombinaisons des gènes remontent des années soixante-
dix. Très rapidement les scientifiques comprirent la puissance de ces nouvelles techniques,
leur permettant d’aborder les problèmes qui paraissaient totalement insolubles jusque là,
comme l’analyse du génome des organismes. L’évolution prodigieuse des ces techniques fit
rapidement apparaître un intérêt considérable pour l’industrie, car en effet à la faculté
d’analyser les gènes s’est ajoutée la capacité d’agir sur leur expression. Il devenait ainsi
possible de faire synthétiser par des microorganismes, en grande quantité et à des prix très bas,
des substances que l’on ne pouvait posséder jusque là qu’en petites quantités et dont le prix de
revient était très élevé.

Essentiellement, le génie génétique se fonde sur les opérations suivantes : 1. découpage de


l’ADN en fragments bien définis au moyen des enzymes, 2. raccordement des fragments
d’ADN d’origines diverses, 3. Introduction des molécules d’ADN recombinantes dans des
cellules réceptrices et 4. Analyse et modification de la séquence du gène. Le génie génétique
utilise des outils moléculaires, en particulier les enzymes et les vecteurs qui sont maintenant
largement commercialisés. Il fait appel à des techniques telles que l’électrophorèse et
l’hybridation devenues d’usage courant. L’ordinateur joue également un rôle capital en génie
génétique. Il permet d’analyser très facilement et très rapidement de nombreuses séquences de
nucléotides. Il constitue un outil central et indispensable de tout laboratoire de génie
génétique. Les applications du génie génétique intéressent plusieurs domaines.

a. En recherche fondamentale, le génie génétique a permis un développement considérable


des études sur la structure et la régulation de l’expression des gènes eucaryotes ; b. En
médecine, il a permis de caractériser les gènes responsables des maladies génétiques avec la
possibilité du diagnostic prénatal de ces maladies. Les tendances actuelles se focalisent sur la
thérapie génique par correction stable du génome. Son champ d’application s’étend jusqu’à la
177
médecine légale et à l’anthropologie ; c. Dans l’industrie pharmaceutique, le génie génétique
permet de produire, par des microorganismes recombinants, des protéines eucaryotes difficiles
à obtenir par d’autres méthodes, telles que l’hormone de croissance, l’insuline, les interférons,
etc. Le génie génétique permet la fabrication de nouveaux types de vaccins par la production
en masse des protéines vaccinantes. Il a également permis la mise au point des vaccins vivants
recombinants ou atténués par mutagenèse dirigée. Il offre de nouvelles possibilités
d’amélioration génétique des souches microbiennes productrices utilisées dans diverses
industries, comme l’industrie agro-alimentaire mais également dans la lutte contre la
pollution ; d. En agronomie, le génie génétique offre des perspectives d’amélioration
génétique des espèces animales et végétales.

6.1 HISTORIQUE

C’est depuis juillet 1974 que le génie génétique est connu du grand public. En effet dans un
texte appelé « Lettre de Berg » d’après le nom du premier signataire, onze biologistes
américains, spécialistes de la génétique moléculaire, appelaient leurs confrères de tous les pays
à arrêter des recherches portant sur des expériences dites de manipulations génétiques. Il
s’agissait des expériences baptisées du nom populaire de manipulations génétiques, mais que
les scientifiques appelaient dans ce texte « des recombinaisons génétiques in vitro », c’est-à-
dire l’extraction de l’ADN des cellules d’origines diverses, du découpage de ces molécules en
fragments variés au moyen d’enzymes et du raccordement en éprouvette, toujours au moyen
d’enzymes, des fragments d’origines différentes pour former des molécules d’ADN totalement
nouvelles.

Le raccordement des fragments d’ADN de crapaud avec des fragments d’ADN des bactéries
par exemple, ou le raccordement des fragments d’ADN des mouches avec des fragments
d’ADN des bactéries. C’est donc le raccordement des gènes de crapaud avec des gènes des
bactéries. En d’autres termes, il s’agit de l’hybridation des patrimoines génétiques d’espèces
d’êtres vivants très différents. En théorie cela voulait dire que de telles manipulations
biochimiques pouvaient conduire à la création d’êtres hybrides totalement inédits, dignes des
mytologies antiques comme des cheveaux dotés des ailes, des lions à tête de serpent, etc.

Craintes des épidémies de cancer

Les premières manipulations génétiques se bornaient à raccrorder une fraction infime de


l’ADN total d’un crapaud ou d’une mouche (drosophile) avec des gènes des bactéries et
introduire des molécules d’ADN recombinées dans des bactéries telles que le colibacille. La
bactérie E. coli était donc le premier être vivant à être reprogrammé génétiquement par
introduction des gènes tout à fait différents dans son patrimoine génétique. Ce qui inquiétait
les signataires de la lettre de Berg était que l’introduction d’ADN d’espèces très éloignées des
bactéries dans le colibacille pouvait peut-être conférer à celui-ci des propriétés inattendues. En
particulier le cas était envisagé de l’introduction des gènes des virus cancérogènes dans E.
coli.

Comme E. coli vit normalement dans les intestins des êtres humains, il existait un risque de
déclencher des épidémies de cancer au cas où de telles bactéries manipulées s’échapperaient
178
des laboratoires, soit des chercheurs ou des techniciens de laboratoire étaient atteints au cours
de leur travail et propageraient l’infection à leur entourage, soit des cultures des bactéries
manipulées jettées à l’évier par négligence ou par erreur, se trouveraient répendues dans la
nature par le biais des égoûts et pourraient atteindre des êtres humains. Les signataires de la
lettre savaient aussi que l’ADN des animaux renfermait des portions d’ADN représentant des
patrimoines génétiques des virus cancérogènes (en permanence présents à l’état dormant, dans
les chromosomes des animaux). Or certaines expériences consistaient à découper, au moyen
des enzymes, l’ADN total des cellules animales en des milliers de fragments et à les
recombiner au hasard, en éprouvette, avec de l’ADN bactérien, puis à introduire ces molécules
dans E. coli.

Parmi ces fragments, il pouvait fort bien figurer, par hasard et sans que les chercheurs s’en
doutent, de tels virus endormis, en plus des gènes commandant la synthèse des protéines.
Qu’allait-il se passer lorsque le patrimoine génétique de ce type de virus dormants allait se
retrouver dans un environnement inhabituel, c’est-à-dire la cellule bactérienne hôte. N’y a-t-il
pas le risque qu’il se réveille et confère à la bactérie hôte une capacité à provoquer un cancer ?
D’autres controverses ont porté sur le danger de bouleversement de l’équilibre écologique
planétaire par suite de la création de nouvelles espèces d’êtres vivants, ou sur le danger d’un
glissement vers les manipulations génétiques de l’espèce humaine.

Bref les craintes des opposants aux recombinaisons génétiques in vitro étaient de trois ordres :
1. ces expériences, par la création éventuelle de microbes pathogènes, faisaient courir des
risques de santé aux travailleurs de la recherche scientifique, pas seulement les chercheurs
mais aussi les techniciens et autres personnels des laboratoires et aux populations habitant
dans le voisionage des instituts de recherche.

2. l’introduction des gènes d’animaux ou des plantes dans le patrimoine génétique des
bactéries, qui allaient éventuellement être relâchées volontairement dans la nature, allait
perturber l’équilibre écologique des espèces vivant à la surface du globe, indépendamment de
l’éclosion éventuelle et immédiate de nouvelles maladies. En d’autres termes, à l’état naturel,
bactéries et animaux (ou plantes) ne mêlent jamais leurs gènes. Plus généralement, la théorie
de l’évolution nous enseigne que les espèces animales, végétales ou microbiennes se
définissent comme des communautés fermées. Seuls les individus appartenant à la même
espèce peuvent donner des descendants fertiles. Il semble donc y avoir une limite à cette
recombinaison naturelle des gènes. Cette limite permet à une espèce de garder son identité.
Les recombinaisons génétiques in vitro, en forçant des gènes d’origines diverses à coexister,
allaient à l’évidence contre cette sagesse de la nature. En d’autres termes, en faisant ces
manipulations génétiques, les biologistes allaient s’immiscer dans le dessein de Dieu, c’est-à-
dire le réarranger à leur guise.

3. les manipulations génétiques in vitro préparaient la voie aux manipulations génétiques de


l’espèce humaine. Des expériences de ce genre sont déjà en projet. La manipulation des
embryons des animaux et finalement des hommes risque de devenir un jour une réalité, tout
cela pour améliorer soi-disant la condition humaine. Ici il faut citer un article publié en 1971
aux USA avant même l’acte de naissance des recombinaisons génétiques in vitro (1973) qui
179
dit ceci : « les travaux des microbiologistes qui déchiffrent les molécules d’ADN laissent
espérer le traitement génétique d’une grande variété de maux apparaissant à la naissance ».

Il n’est pas déraisonnable de s’attendre à ce qu’un jour, cette recherche conduise à une
ingénierie génétique capable d’engendrer des sous populations variées, qui pourront utiliser
ceux qui détiennent le contrôle technologique. Ces sous populations pourraient comprendre
des soldats particulièrement combatifs pour une armée de métier, des ouvriers dociles et
résistants pour exercer les tâches physiques pénibles ou des philosophes rois à qui seraient
transmis héréditairement le pouvoir.

Les manipulations génétiques et le nazisme

Un rapprochement a été établi entre les manipulations génétiques in vitro et le nazisme. Il


semble en effet que le régime hitlérien avait réellement mis en pratique un programme visant à
modifier le patrimoine génétique collectif des populations humaines. En effet outre les
castrations des prisonniers, des déviants sociaux et des malades, l’extermination des juifs et
des Tsiganes avait bien pour but l’extinction des variétés génétiques dont sont porteurs ses
populations. Ce massacre a reçu le nom de génocide, c’est-à-dire l’acte de tuer les gènes. Par
ailleurs de jeunes filles polonaises, cencées représenter l’archétype de la race aryenne, furent
enlevées et placées dans des camps pour être engrossées par les SS aux cheveux blonds et aux
yeux bleux.

En 1971, à l’annonce de la réussite de la première fécondation in vitro humaine, J. Watson


déclarait : « Tôt ou tard, cette expérience ouvrait la voie au clonage humain, c’est-à-dire la
reproduction asexuée d’êtres humains. Celle-ci consiste à faire des duplicata exacts des
géniteurs grâce à l’insertion de leurs patrimoines génétiques dans des œufs humains servant de
simples récepteurs, c’est-à-dire dont le propre patrimoine génétique aurait été éliminé ». Mais
en 1978, le climat commença à changer. Il convient de noter que l’abréviation SS vient de
l’allemand Schutz – staffel, police militaire nazie qui surveillait les camps de concentration et
les territoires occupés par les troupes allemandes de 1939 à 1945. Cela signifie également
membre de cette police. Tsigane ou tzigane signifie peuple originaire du nord de l’Inde. Ses
déplacements l’ont amené en Europe (Balkans, Hongrie, Slovaquie, Espagne du Sud, etc). Les
tziganes mènent une existence des nomades, vivant de petits métiers. Dans l’antiquité, le terme
aryen représentait les populations du bassin oriental de la Méditerranée qui envahirent le nord
de l’Inde. Le terme fut repris par le racisme hitlérien pour désigner les européens d’origine
germanique.

Les microbes génétiquement manipulés sont-ils vraiment dangereux ?

Concernant les dangers à long terme sur la biosphère des mélanges des gènes d’espèces fort
éloignées. L’expérience faite par S. Cohen montrait que des bactéries pouvaient absorber des
fragments d’ADN d’animaux si on ajoutait ceux-ci à leur milieu. En outre ces bactéries
recombinaient spontanément ces fragments avec leur propre ADN, pour peu qu’on ait choisi
des souches dotées naturellemnt dans leur cytoplasme de l’équipement adéquat en enzymes de
restriction. En d’autres termes, ces bactéries faisaient naturellement au sein de leur cytoplasme
ce que les expérimetateurs faisaient in vitro. On ne pouvait donc pas dire que les molécules
180
d’ADN recombinant étaient quelque chose d’inédit dans la nature. On peut d’ailleurs penser
que dans la mesure où les mammifères contiennent dans leurs intestins des milliards de
bactéries, il était presque certain que ce genre d’événement devait se produire de temps en
autre. A peu près à cette époque, d’autres expériences ont confirmé qu’il existait effectivement
des échanges des gènes dans la nature entre bactéries et animaux (ou plantes).

En 1977, on se rendit compte que Agrobacterium tumefaciens, bactérie responsable des


tumeurs sur le tronc d’arbres fruitiers injecte effectivement certains de ses gènes dans les
cellules végétales. Ces gènes vont s’intégrer dans l’ADN de ces cellules. En 1978, on a signalé
le cas d’une bactérie, Photobacter leiognati qui, seule parmi toutes les espèces de bactéries,
possédait une enzyme particulière, la superoxyde dismutase, caractéristique des cellules
animales. Comme cette bactérie a pour particularité de vivre en symbiose avec un poisson, on
pense que la bactérie ait capté le gène commandant la synthèse de cette enzyme. Au début des
années 1980, on observa que des bactéries vivant en symbiose avec une petite cigale
échangeaient aussi des gènes avec leur hôte. On peut donc dire que des transferts des gènes se
produisent de temps en temps entre espèces fort éloignées.

Deux cas peuvent cependant donner une idée des risques encourus à cause des gènes
d’animaux transplantés dans les bactéries : celui des gènes commandant la synthèse
d’hormone comme l’insuline et celui des gènes commandant la synthèse des protéines
importantes du corps comme la myosine. Dans le premier cas, on peut imaginer que des
colibacilles dotés du gène de l’insuline colonisent l’intestin des êtres humains. Il y aurait ainsi
un flot d’insuline sécrétée en permance par des millions de bactéries manipulées hérgées dans
le tube digestif. Or un excès d’insuline provoque toutes sortes de graves inconvénients pour
l’organisme. Ce scénario peut être appliqué à n’importe quelle hormone sécrétée par une
bactérie génétiquement manipulée pour la produire.

Dans le second cas, on peut craindre des réactions d’auto – immunité. On sait en effet que les
réactions immunitaires consistent en la fabrication d’anticorps en réponse à la pénétration dans
l’organisme des substances étrangères. Ces anticorps reconnaissent très spécifiquement ces
substances et les neutralisent. Mais il arrive parfois que le système immunitaire déraille et, par
erreur, se mette à fabriquer des anticorps contre les substances présentes normalement dans le
corps. La myasténie par exemple est une maladie qui se traduit par un affaiblissement
musculaire et une paralysie progressive. L’organisme fabrique des anticorps contre une
protéine qui permet à l’influx nerveux de déclencher la contraction musculaire.

Supposons que les bactéries génétiquement manipulées soient dotées du gène commandant la
synthèse de la myosine de souris. Cette protéine fondamentale des muscles de la souris est de
structure chimique très voisine de la myosine humaine. Si ces bactéries s’établissaient dans
l’intestin humain et y sécrétaient la myosine de la souris, l’orgnaisme réagirait en détruisant
celle-ci par des anticorps. Mais étant donné la parenté chimique de la myosine de la souris
avec la myosine humaine, il ne serait pas impossible que l’organisme se mette à attaquer en
même temps et à détruire sa propre myosine avec ces mêmes anticorps. L’individu ainsi
soumis à une telle réaction auto-immunitaire verrait ses muscles fondre progresssivement.
181
De la survie des bactéries manipulées dans l’intestin

Diverses expériences ont été réalisées pour répondre à la question de savoir si les colibacilles
manipulés peuvent survivre hors du laboratoire. Il s’agit d’examiner la capacité des
colibacilles utilisés pour les recombinaisons génétiques à survivre dans l’intestin humain et à
le coloniser. Noter que les E. coli utilisés pour les recombinaisons génétiques in vitro sont des
variétés spéciales : E. coli K12 et E. coli χ1776. Les premières expériences sur la survie de E.
coli K12 dans l’intestin humain conclurent en 1977 à l’impossibilité pour E. coli K12 de
coloniser l’intestin. Mais des expériences ultérieures montrèrent en 1979 que E. coli K12
pouvait coloniser l’intestin d’une souris si on avait préalablement traité celles-ci avec des
antibiotiques. En effet les antibiotiques détruisaient une grande partie de bactéries présentes
dans l’intestin, laissant la place libre à de nouveaux envahisseurs bactériens.

Les premières expériences sur E. coli χ1776 trouvèrent qu’elle était apparemment bien
incapable de survivre hors du laboratoire. Mais des observations faites en 1979 – 80
montrèrent que cette souche pouvait néanmopins survivre quelque temps, si on lui adjoignait
des plasmides et dans le cas précis, il s’agissait de plasmide pBR322, très couramment utilisé.
Ainsi donc, E. coli K12 et même E. coli χ1776 peuvent survivre quelques jours dans l’intestin.
E. coli K12 peut dans certaines conditions le coloniser. Il importe alors de savoir si pendant la
brève période de leur survie dans l’intestin, ces bactéries manipulées n’auraient pas le temps
de transmettre leurs molécules d’ADN recombiné aux colibacilles habitant normalement le
tube digestif.

Rappelons que couramment les bactéries échangent des plasmides au moment de conjugaison.
Ainsi donc en théorie, une bactérie dotée des plasmides porteurs d’ADN recombiné peut les
communiquer aux bactéries avec lesquelles elle copule. Heureusement il existe de
nombreuses variétés de plasmides et toutes ne sont pas aptes à être transmises lors de la
conjugaison. Dans ces conditions, il est souhaitable de ne pratiquer des recombinaisons
génétiques qu’avec des variétés de plasmides non transférables entre bactéries. Des études ont
été faites pour voir si, dans les selles des personnes travaillant dans les laboratoires où se
pratiquent des manipulations génétiques, on trouvait des bactéries porteuses des plasmides
utilisés pour les recombinaisons des molécules d’ADN. « On a jamais trouvé des bactéries
ayant capté des plasmides recombinés chez les chercheurs ou techniciens observés pendant un
à deux ans dans trois laboratoires différents ».

Ce résultat a pesé d’un très grand poids pour assurer la victoire du camp des scientifiques qui
voulaient abolir toute réglementation, car si les bactéries manipulées ne pouvaient transmettre
leurs plasmides à d’autres bactéries dans l’intestin humain, alors quel que soit le degré de
danger présumé des molécules recombinées, il n’y a rien à craindre. On ne pouvait jamais
assister à la naissance de nouvelles maladies propagées par le colibacille. Cela implique
toutefois que les laboratoires pratiquant des recombinaisons génétiques emploient bien des
souches d’E. coli convenables, c’est-à-dire dotées de plasmides non transférables.

D’autres expériences ont été réalisées pour savoir si des bactéries manipulées jettées à l’évier
par des chercheurs étourdis ou négligeants ne pouvaient pas survivre dans les égoûts et
transférer leurs plasmides à des bactéries sauvages qui pourraient alors diffuser dans la nature
182
des molécules d’ADN recombiné. Les résultats obtenus ont montré que les souches d’E. coli
utilisées pour les manipulations génétiques ne survivent que peu de temps (moins de 24
heures) dans les égouts. Quant aux transferts de plasmides aux bactéries vivant dans les
égouts, il a été trouvé en 1981 qu’ils étaient possibles durant le bref laps de temps de survie de
colibacilles servant aux manipulations. Il est donc important de noter que les expérimentateurs
doivent impérativement faire leurs recombinaisons génétiques à partir des souches d’E. coli
dotées de plasmides non transférables. C’est en principe ce que prescrivent les réglementations
en vigueur aujourd’hui.

Ces bactéries manipulées peuvent – elles provoquer le cancer ?

Les militaires américains avaient essayé, depuis de nombreuses années, de rendre E. coli
pathogène par des hybridations réalisées au moyen de la sexualité normale des bactéries. Ils
avaient éssayé de transférer à E. coli des gènes contrôlant la virulence d’une bactérie appelée
shighella, responsable des diarrhées. Selon ces experts, il était certain que les caractères de
pathogénicité d’un microbe résultent de nombreux gènes indépendants et il n’était donc guère
evisageable que la recombinaison au hasard d’ADN étranger avec ccelui d’E. coli apporte
d’un seul coup l’ensemble de tels gènes. Des expériences ultérieures ont montré que pour
rendre E. coli mortel, il fallait lui conférer simultanémnt plusieurs gènes contrôlant la
pathogénicité et qu’il n’était donc pas possible de créer par hasard, d’un seul coup, un
colibacille pathogène.

Une autre série d’expérience a été réalisée pour voir si en implantant (par recombinaison
génétique) un virus cancérogène dans E. coli, on obtiendrait des colibacilles capables de
propager le cancer. Ces expériences ont consisté notamment à recombiner le patrimoine
génétique du virus cancérogène, le polyome, avec un plasmide bactérien et à insérer cette
molécule d’ADN recombinée dans une souche d’E. coli χ1776. Le polyome est un virus
cancérogène pour le hamster, mammifère rongeur d’Europe centrale et orientale, un peu plus
petit que le cobaye. Les bactéries manipulées ont été injectées à des bébés hamsters (ils sont
plus sensibles au polyome que les adultes), pour voir si ces animaux traités développaient des
tumeurs. Les résultats obtenus montrèrent que les bébés hamsters n’attrapèrent pas le cancer.

En ce qui concerne les virus cancérogènes endormis au sein des patrimoines génétiques des
animaux, il a été observé dans les chromosomes de la souris un virus cancérogène à l’état
dormant, intégré à ces chromosomes. Ce virus est appelé « Moloney Murine Leukemia Virus
(MMLV). Or des études ont montré qu’un virus dormant pouvait se réveiller lorsqu’il se
trouve transplanté dans le colibacille et devenir infectieux, c’est-à-dire capable de se propager.
Dans ces conditions, pourquoi ne pourrait-il pas aussi manifester sa cancérigénicité ?

Le clonage à la mode libérale

Dans son livre « A mon image », le romancier américain David Rorvick dit ceci : un
milliardaire américain avait payé des biologistes pour qu’ils travaillent en sercret à mettre au
point le clonage humain, puisqu’il voualit l’appliquer à lui-même et obtenir ainsi un enfant qui
serait son propre jumeau. La tenattive avait réussi et le premier enfant cloné du monde était né.
183
Les scientifiques expliquèrent en 1978 que le clonage d’un être humain n’était alors pas
faisable et que le livre de Rorvick contenait des invraisemblablances et des erreurs grossières.
Par exemple le clonage avait été effectué par la greffe d’un noyau d’un globule rouge dans un
ovule. Or il est bien connu que chez l’homme comme chez tous les mammifères, les globules
rouges sont les seules cellules à être dépourvues de noyau. Il était donc plus que vraisemblable
que le récit de Rorvickn’était qu’une fable (l’éditeur l’avouera par la suite). Cependant il était
toujours impossible à ce moment de réaliser le rêve fou du milliardaire de Rorvick, c’est-à-dire
de faire un enfant qui soit la copie conforme d’un adulte qui a donné un noyau cellulaire.
Evidemment il est impossible de savoir si l’on y arrivera pas un jour chez les mammifères.

La motivation du milliardaire de Rorvick est de faire un enfant dont l’hérédité ne doive rien au
hasard. En effet dans la reproduction sexuae normale, le patrimoine génétique d’un nouvel être
est le résultat d’une recombinaison au hasard des chromosomes des deux parents. L’enfant
n’est génétiquement identique ni à l’un ni à l’autre des deux parents, ni à ses frères et sœurs.
Ainsi donc au sens strict la reproduction n’existe pas. Cependant si la reproduction sexuée ne
reproduit pas les individus, elle reproduit bel et bien l’espèce.

Une autre éventualité d’un clonage individuel concerne un couple infécond par suite d’une
stérilité du mari et qui ne souhaiterait pas recourir à l’inséminationartificielle par doneur. Le
clonage de l’un ou de l’autre partenaire permettrait la naissance d’un enfant qui serait
biologiquement le leur. L’enfant serait le jumeau de son père ou de sa mère. Le jour où la
greffe des gènes aurait été mise au point pour soigner les nains, on ne pourra pas s’opposer à
ce que l’on greffe aussi le gène de l’hormone de croissance à des enfants, parce que leurs
parents vourdraient en faire des superchampions.

En guise de conclusion

Il est d’abord erroné d’affirmer que ces expériences ne présentent aucun risque. Il existe
beaucoup de zones d’ombre, que ce soit en matière de virus cancérogènes ou de protéines
humaines produites par les colibacilles. La seule certitude relative, c’est que les bactéries E.
coli K12 et E. coli χ1776 (ou les souches équivalentes) ne survivent pas très longtemps dans
l’intestin et ne le colonisent pas, sauf circonstance exceptionnelle comme un traitement
préalable aux antibiotiques. De plus elles ne confèrent pas leurs plasmides recombinés, si on
a pris soins de les choisir parmi ceux qui n’ont pas cette propriété. Cependant il est reconnu
aujourd’hui que les bénéfices attendus du génie génétique dépassent les risques. Les
manipulations génétiques sur les microbes pratiquées à travers le monde ont permis de
remarquables découvertes en biologie :

1. Elles ont permis d’isoler et d’identifier les gènes oncogènes qui, au sein des cellules
normales d’animaux ou d’hommes, peuvent déterminer leur transformation cancéreuse dans
certaines circonstances ; 2. Les manipulations génétiques ont déjà et vont encore aider à la
compréhension des mécanismes intimes qui président à l’éclosion des cancers ; 3. Les
manipulations génétiques ont aussi permis l’analyse des substances fabriquées naturellement
par l’organisme, telles que l’interféron. Le gène gouvernant la synthèse de l’interféron fut isolé
grâce aux manipulations génétiques sur les microbes. En effet parallèlement aux techniques de
génie génétique, des méthodes ont été mises au point pour identifier rapidement la
184
composition en nucléotides de n’importe quel gène ou fragment d’ADN, c’est-à-dire le
séquençage de l’ADN. Grâce au génie génétique et au séquençage de l’ADN, il est possible
aujourd’hui de déterminer rapidement la composition chimique de toute substance de nature
protéique repérée dans l’organisme. Il suffit d’en isoler le gène et d’en établir la séquence des
nucléotides ;

4. Les manipulations génétiques permettent aujourd’hui de connaître la nature et le


fonctionnement des gènes d’animaux et de plantes et notamment au cours du développement
embryonnaire. En particulier l’identification de ces fameux gènes homéotiques qui
sélectionnent les destins des cellules au cours du développement ; 5. Les manipulations
génétiques sont en train de contribuer à l’émergence de toute une gamme de produits
pharmaceutiques à des fins économiques.

Terminons avec le Sénateur Edwrd akennedy lorsqu’il dit ceci : « l’impact des progrès
technologiques doit être évalué au plus tôt au cours des délibérations publiques, impliquant la
participation des secteurs les plus divers de la société. Les recherches sur l’ADN recombinant
représentent le prototype des problèmes que notre sonciété devra affronter de plus en plus
souvent à mesure que la technologie progressera. Les questions posées dépassent de loin celles
de la sécurité, d’une certaine façon faciles à résoudre.

6.2 NATURE ET FONCTIONS DU GENE

Avant de parler des manipulations génétiques, il est nécessaire de donner un aperçu minimal
sur la nature du gène et son fonctionnement, le gène étant l’élément de base fondamental, la
matière première, des manipulations génétiques. En effet ce terme de gène est lié au très
célèbre nom de Mendel, le père fondateur de la génétique formelle, la génétique classique
appelée aussi génétique mendelienne. Mendel était le premier à postuler que les caractères
transmis héréditairement doivent être déterminés par des facteurs et que ces facteurs doivent
être physiquement présents dans les cellules sexuelles assurant la fécondation. De plus,
toujours selon Mendel, ces facteurs devraient agir progressivement au cours du développement
de l’embryon, puis du jeune et de l’adulte pour que le caractère se manifeste.

En fait ces facteurs de Mendel ne sont rien d’autre que ce que nous appelons gènes. Et Moragn
de définir les gènes comme étant des entités figurant sur les chromosomes, ces derniers étant
des corpuscules en forme de bâtonnets qui se trouvent dans les noyaux de toutes les cellules du
corps. On sait maintenant que les gènes sont des portions définies des chromosomes, de
longueur définie, dotées d’une composition chimique particulière. Leur propriété
fondamentale est de se recopier, identiques en eux-mêmes. Car si les caractères des parents
réapparaissent chez leurs enfants, c’est parce que ceux-ci ont reçu des copies des gènes
déterminant les caractères chez les parents au moment de leur conception. Quelle est la nature
des molécules constituant les gènes et comment fonctionnent-elles ?

Comme l’était l’atome dans sa conception primaire, le gène était d’abord défini comme l’unité
indivisible de la transmission héréditaire des caractères. Ce fut l’époque de la génétique
classique. L’époque de la génétique moléculaire s’est ouverte par la compréhension de la
structure de l’ADN. Il a alors été établi que l’unité fondamentale de l’hérédité était le
185
nucléotide et que le gène est un agrégat de nucléotides. En fait les gènes consistent en des
molécules d’acide désoxyribonucléique (ADN). Une molécule d’ADN est formée de deux
chaînes complémentaires, l’une par rapport à l’autre et enroulées en hélice. Chaque chaîne de
la double hélice est constituée d’une succession d’unités appelées nucléotides. Dans la double
hélice, les nucléotides d’une chaîne s’apparient avec les nucléotides de l’autre chaîne selon le
principe de la complémentarité entre leurs bases.

Un chromosome n’est rien d’autre qu’une très longue molécule d’ADN formée d’un
enchaînement de nucléotides. Un gène étant une portion d’un chromosome, il s’agit d’une
séquence bien définie de nucléotides qui détermine l’apparition d’un caractère spécifique. Le
gène est ainsi défini comme l’unité fondamentale de l’ADN. Son action se manifeste dans
l’organisme par l’apparition des molécules appelées protéines. Les protéines servent soit à
l’édification de la charpente des cellules, soit pour contrôler les activités des cellules. C’est
donc à travers les protéines que les gènes contrôlent les caractères héréditaires. Les protéines
sont formées d’enchaînements d’unités appelées acides aminés. L’ordre d’enchaînement
d’acides aminés d’une protéine est dicté par l’ordre d’enchaînement des nucléotides du gène
qui commande spécifiquement l’apparition de cette protéine dans la cellule. Cependant les
gènes sont d’abord recopiés sous forme d’une autre espèce d’acide nucléique, l’acide
ribonucléique (ARN), constitué d’une seule chaîne de nucléotides. Et le décodage du message,
c’est-à-dire la traduction du langage des nucléotides en lagage des acides aminés, s’effectue à
partir de cette chaîne d’ARN.

Les êtres vivants sont ainsi considérés comme des machines biochimiques dont la molécule
d’ADN constitue le cœur. Et grâce aux progrès de la biologie moléculaire, les gènes ont cessé
d’être des entités abstraites ; ce sont désormains des entités matérielles que l’on peut saisir
dans des cellules avec des outils adéquats, modifier et remettre dans d’autres cellules. Les
gènes sont donc devenus manupilables à volonté. L’une des méthodes d’étude de la structure
du gène consiste à :

1. Réaliser de nombreux croisements sur une grande population et mesurer la fréquence avec
laquelle différents gènes vont se recombiner, puis dresser une carte indiquant l’agencement
linéaire exact de ces gènes. En partant du principe que 2 points d’un même chromosome
auront d’autant plus de chance de se recombiner qu’ils sont plus éloignés. Mais cette
technique n’est pas utilisée pour localiser les mutations à l’intérieur du gène, parce que
différents points d’un même gène sont si proches les uns des autres que la probabilité de
détecter une recombinaison entre eux est extrêmement faible. La drosophile a été l’organisme
le plus utilisé pour cette technique. On peut disposer de quelques milliers d’individus et
chaque génération dure 20 jours.

2. En utilisant un microorganisme tel qu’une bactérie ou un bactériophage, il est possible non


seulement de diviser un gène, mais aussi d’en dresser la carte génétique dans ses moindres
détails jusqu’aux limites moléculaires de sa structure. En effet avec une bactérie ou un
bactériophage, on peut disposer de milliards d’individus et une génération s’effectue en
quelques minutes seulement. De plus avec ces microorganismes, on peut mettre au point des
astuces permettant de sélectionner les individus intéressants dans une population d’un milliard
d’individus.
186

6.3 CLONAGE DES GENES

Le clonage d’un fragment d’ADN ou clonage moléculaire consiste à isoler physiquement ce


fragment et à amplifier le nombre de copies. Pour cela ce fragment est inséré dans un ADN
vecteur, puis le vecteur recombinant est introduit dans une cellule hôte qui, par division, va
donner naissance à un clone, c’est-à-dire une population de cellules identiques et donc
hébergeant toutes le fragment d’ADN recherché, inséré dans le vecteur. Il est alors possible,
après extraction du vecteur, par digestion puis par électrophorèse préparative, de disposer d’un
grand nombre d’exemplaires du fragment d’intérêt ou fragment recherché. Si le fragment à
cloner est un gène codant généralement pour une protéine, il est possible, dans certains cas, en
utilisant un vecteur d’expression, d’obtenir une synthèse de la protéine codée dans la cellule
hôte.

6.3.1 SYSTEMES D’EXPRESSION

Les principales étapes du génie génétique se déroulent dans des cellules vivantes. La cellule
hôte la plus couramment utilisée est Escherichia coli communément appelée colibacille. C’est
une bactérie en forme de bacille, vivant normalement dans l’intestin des animaux. Toutefois,
les souches d’E. coli utilisées en génie génétique sont des souches spéciales, conçues pour être
utilisées uniquement au laboratoire. Il s’agit des souches E. coli K12 et E. coli χ1776. Pour
dissiper le doute d’une éventuelle contamination du personnel de laboratoire ou des eaux des
égouts, ces deux souches ont été créées pour permettre de réaliser des recombinaisons
génétiques avec la certitude qu’elles ne peuvent pas survivre hors du laboratoire et surtout pas
dans l’intestin humain. En fait, sauf circonstances exceptionnelle (comme par exemple le
traitement aux antibiotiques pour K12 et addition de certains plasmides pour χ1776), les
souches d’E. coli utilisées en génie génétique ne survivent que très peu de temps (moins de 24
heures) dans les égouts.

Au début les expériences sur les manipulations des gènes in vitro étaient réalisées uniquement
sur les microorganismes et plus particulièrement sur les bactéries. La tendance actuelle est de
cloner les gènes des eucaryotes dans les cellules eucaryotes. Trois catégories d’eucaryotes
ont principalement été les cibles des expériences sur les manipulations des gènes in vitro : les
levures, les plantes et les animaux. En fait, les systèmes d’expresssion les plus utilisés en
génie génétique sont les bactéries Escherichia coli et Bacillus subtilis, les levures et les
cellules d’insectes et des mammifères.

6.3.2 VECTEURS DE CLONAGE

Le clonage d’un gène consiste à transplanter un gène d’un organisme (animal ou végétal) dans
une bactérie qui, dès lors, se multiplie et forme une colonie dont les membres possèdent une
copie du gène en question. Toutefois, il ne suffit pas d’implanter un gène étranger dans une
cellule hôte, encore faut-il que ce gène étranger puisse fonctionner. Pour introduire un gène
étranger dans une cellule hôte et de le faire fonctionner, le génie génétique utilise des vecteurs.
187
Un vecteur de clonage est une molécule d’ADN capable de se répliquer de manière autonome
une fois à l’intérieur de la cellule hôte.

Pour utiliser un vecteur de clonage, il faut disposer d’un système de transformation permettant
d’introduire le vecteur dans la cellule hôte, que le vecteur dispose d’une origine de réplication
pour lui permettre de se répliquer de manière autonome dans la cellule hôte et que les
transformants, c’est-à-dire les cellules contenant le vecteur recombinant puissent être
sélectionnés par leur capacité à se développer sur un milieu sélectif. Les vecteurs les plus
couramment utilisés en génie génétique sont les plasmides bactériens et les bactériophages.
L’ADN des rétrovirus a servi de base à la construction des vecteurs utilisés pour la
transformation des cellules des mammifères.

Puisqu’il n’existe pas de vecteur universel, le choix d’un vecteur dépend des objectifs
poursuivis et de la taille de l’acide nucléique à manipuler. Cependant les vecteurs sont
principalement utilisés dans : a- le clonage et l’amplification d’une séquence d’ADN ; b-
l’étude des mécanismes de l’expression d’une séquence d’ADN ; c- l’introduction de gène (s)
dans des cellules ou des organismes ; d- la production des protéines codées par des gènes (à
l’échelle industrielle). Il faut également noter que toute la puissance d’un vecteur résulte de sa
construction, c’est-à-dire des séquences qui lui sont apportées et qui lui confèrent des
propriétés particulières.

Dans les années 1970, les vecteurs naturels ont été utilisés pour le clonage ; par la suite des
progrès considérales ont été réalisés dans la construction des vecteurs, de telle sorte que les
vecteurs utilisés actuellement sont tous artificiels et de plus en plus ingénieux et performants.
Les principales propriétés d’un vecteur sont les suivantes : a- Un vecteur doit se répliquer
activement dans la cellule hôte, indépendamment de l’ADN de la cellule hôte et en général de
façon épisomale ; b- Sa taille doit être la plus petite possible, ce qui permet d’insérer une plus
grande quantité d’ADN, de manipuler plus facilement les recombinants et d’obtenir
rapidement une plus grande quantité de copies par cellule hôte ; c- Un vecteur doit posséder
des propriétés permettant de sélectionner de manière simple les cellules qui l’ont incorporé ;
d- Sa présence doit perturber le moins possible la cellule hôte ; e- Il doit être maintenu dans
l’hôte sans y être modifié quel que soit le nombre de générations ; f- Il doit posséder le plus
possible de sites uniques de coupure par des enzymes de restriction pour faciliter les
constructions. De plus il est souhaitable que certains de ces sites soient localisés dans les gènes
de sélection pour que l’intégration de l’ADN étranger facilite l’isolement du recombinant ; g-
Un vecteur doit être facile à isoler sous forme absolument pure.

L’utilisation d’un vecteur se base sur des principes suivants : la préparation du vecteur, la
préparation de l’ADN à insérer, la réalisation du recombinant et l’incorporation à l’hôte. La
préparation du vecteur consiste à ce qu’avant sont utilisation le vecteur doit être coupé à
l’endroit exact où l’on désir insérer la séquence à emplifier, purifier ou étudier. En général
cette coupure est effectuée par une enzyme de restriction. Les extrémités ainsi libérées devront
être traitées (généralement avec une phosphatase alcaline) de telle sorte que le vecteur ne
puisse plus se refermer sur lui-même, seul l’ADN à insérer permettant le raboutage.
188
La préparation de l’ADN à insérer consiste à ce que sa taille et dans certains cas ses extrémités
doivent être rendues compatibles avec ce que le vecteur est capable d’accepter. Ainsi les ADN
trop longs ou trop courts doivent être éliminés ou modifiés. Leurs extrémités doivent être
compatibles avec celles du vecteur où ils seront insérés. La réalisation du recombinant
consiste à mélanger les deux préparations, c’est-à-dire le vecteur et l’ADN à insérer, dans des
proportions définies pour chaque type de recombinaison, en présence d’une ligase permettant
la ligation entre les extrémités du vecteur et celles de l’ADN à insérer. Le recombinant ainsi
obtenu est putifié par extraction et précipitation. Pour se répliquer le vecteur doit être
incorporé dans une cellule hôte. La procédure est spécifique de chaque type de vecteur. Une
étape intermédiaire comme l’empaquetage (packaging) dans une capside de bactériophage
peut être nécessaire.

Le choix de l’hôte dépend principalement du type de vecteur utilisé. Il existe deux catégories
de cellules hôtes : les hôtes bactériens et les hôtes eucaryotes. En général on utilise toujours le
même type de cellules, sauf cas particulier où l’on a intérêt à utiliser un hôte spécial (comme
une cellule défective pour la fonction du produit du gène à cloner). Les hôtes bactériens
présentent plusieurs avantages : ils se multiplient rapidement (temps de génération 20 à 30
minutes), ils sont faciles à manier et peu onéreux. Les bactéries utlisées sont non pathogènes
et affaiblies pour diminuer les risques de dissémination accidemtelle.

Escherichia coli est la bactérie la plus couramment utilisée et sauf exception, des souches d’E.
coli utilisées sont res (-), c’est-à-dire restrictions négatives afin que l’ADN inséré ne soit pas
détruit par les enzymes de restriction bactériennes. Pour éviter tout phénomène de
recombinaison au sein de l’ADN inséré ou entre l’ADN inséré et l’ADN bactérien, on utilise
des souches recA (-).

Certaines expériences exigent des souches lac-, comme par exemple JM 101 à JM 109,
lesquelles doivent être conservées sur un milieu spécial (milieu minimum) pour diminuer
l’apparition des révertants lac.. Exceptionnellement on fait appel à des vecteurs particuliers
qui ne peuvent pas se propager dans E. coli. Dans ce cas, on fait appel à d’autres espèces
bactériennes dont les plus utilisées sont Pseudomonas (gram-) et Bacillus subtilis (gram+)). Il
existe trois catégories d’hôtes eucaryotes : les cellules animales en culture, les levures et les
plantes.

Les hôtes eucaryotes présentent cependant certains inconvénients : leur maniement est
complexe et coûteux. Ils ne sont donc utilisés qu’en cas d’absolue nécessité, c’est-à-dire
notamment lorsqu’on travaille avec des vecteurs ayant une origine de réplication eucaryotique,
lorsqu’on veut étudier une régulation in vivo d’un gène eucaryote ou lorsqu’on veut faire
exprimer une protéine qui doit, pour être fonctionnelle, subir des modifications post-
fonctionnelles comme des glycosylations que les bactéries sont incapables de réaliser.

6.3.2.1 PLASMIDES

On appelle plasmides de petites molécules d’ADN bicaténaires circulaires et


extrachromosomiques, présentes dans le cytoplasme de nombreuses bactéries. Leur réplication
est complètement indépendante de celle du chromosome bactérien. Une bactérie peut en
189
contenir un très grand nombre de copies (plusieurs centaines). Ils sont transférables d’une
bactérie à l’autre lors de la conjugaison. Leur taille est comprise entre 2 et 5 kb. Un vecteur
plasmidique peut recevoir jusqu’à 8 ou 9 kb d’ADN exogène. En général, plus un plasmide est
petit, plus il se réplique vite et plus la bactérie peut en posséder un nombre élevé.

La plupart des plasmides naturels contiennent des gènes supplémentaires, non essentiels, qui
confèrent des avantages sélectifs à la cellule hôte dans des conditions particulières comme la
résistance aux antibiotiques et aux métaux lourds, la production des toxines ou la production
des antibiotiques. Dans le passé, les plasmides naturels, dits de première génération, ont été
utilisés comme vecteurs de clonage. Les plasmides utilisés actuellement sont tous artificiels et
sont obtenus par recombinaison de plasmides naturels. Ils sont tous de petite taille pour
permettre l’insertion d’une quantité importante d’ADN étranger tout en maintenant une bonne
efficacité de transformation.

Ils possèdent une origine de réplication, leur nombre de copies par cellule est important. Ils
possèdent en plus un gène de résistance à un antibiotique auquel la cellule hôte est sensible, un
second gène marqueur phénotypique, un ou plusieurs sites uniques de coupure par des
endonucléases de restriction. Ces sites doivent se trouver dans le gène marqueur de repérage
des clones recombinants. Enfin, ils ne possèdent ni gène de transfert, ni gène de recombinaison
et ne peuvent être transférés par le processus naturel de conjugaison.

Le plasmide pBR322 par exemple, dont la taille est de 4363 paires de bases, est un plasmide
de deuxième génération le plus couramment utilisé. Le nombre de copies par cellule est de 15
à 20. Comme marqueurs phénotypiques, il possède les gènes de résistance à l’ampicilline et à
la tétracycline et quelques sites uniques de restriction. Le plasmide pUC18, l’un des éléments
de la série UC et dont la taille est de 2686, fait partie de la famille des plasmides de troisième
génération. Le nombre de copies par cellule est d’environ 500. Il possède, comme marqueurs
phénotypiques inactivables par inserrtion, un gène de résistance à l’ampicilline, la séquence
lacZ’ soit la région promoteur et la partie N-terminale du gène lacZ de E. coli qui code pour la
β-galactosidase et 13 sites uniques de restriction situés sur un polylinker, un segment de
clonage multiple.

Caractéristiques des plasmides naturels

Taille

La taille des plasmides est très variable : de 1 à 300 kb. Cependant elle reste toujours très
faible par rapport à celle du chromosome bactérien (4700 kb chez E. coli).

Réplication

La réplication des plasmides est sous la dépendance d’un segment d’ADN où se trouve
localisée l’origine de réplication reconnue par le système de réplication de la bactérie. Ainsi la
réplication des plasmides est elle indépendante de celle du chromosome bactérien. De plus
chaque type de plasmide est maintenu à un nombre de copies caractéristique par cellule hôte.
Certains plasmides sont présents à un petit nombre de copies par cellule (1 à 5). Leur
190
réplication est coordonnée à celle du chromosome bactérien. On dit qu’ils ont un mode de
réplication du type strict. D’autres plasmides sont présents en grand nombre de copies (15 ou
plus). Ils ont un mode de réplication du type relâché. Leur réplication a lieu même lorsqu’on
stoppe la synthèse des protéines et la réplication du chromosome de l’hôte par addition de
chloramphénicol en cours de culture. De tels plasmides peuvent donc être amplifiés par le
chloramphénicol, ainsi on peut obtenir plusieurs centaines de copies par cellule hôte. D’une
manière générale, le nombre de copies d’un plasmide par cellule est d’autant plus élevé que sa
taille est faible. De plus le nombre de copies diminue fortement dans un milieu limité en
éléments nutritifs.

Ségrégation

Les plasmides naturels possèdent un fragment d’ADN, le locus par, qui contrôle la répartition
précise des plasmides lors des divisions cellulaires. Il convient de noter que, dans le souci de
réduire la taille des plasmides utilisés en génie génétique, on a le plus souvent éliminé ce
locus. Dans ce cas, les plasmides sont maintenus dans la population par sélection continue. En
absence de sélection, les plasmides sont lentemment perdus dans la population en culture.

Incompatibilité

Les observations ont montré que certains plasmides ne peuvent coexister de façon stable dans
une même cellule bactérienne : on dit qu’ils sont incompatibles ou qu’ils font partie du même
groupe d’incompatibilité. En effet les plasmides du même groupe, évolutivement proches,
entrent en compétition pour la réplication et la répartition entre cellules filles. Des plasmides
appartenant à des groupes d’incompatibilité différents peuvent co-exister.

Transfert des plasmides

Certains plasmides de grande taille (> 30 kb) sont des plasmides de conjugaison. Ils
comportent un ensemble de gènes leur permettant de s’intégrer dans le chromosome et
d’assurer leur transfert d’une cellule à une autre par conjugaison. L’exemple classique de ce
type de plasmide est le facteur F d’E. coli. D’autres plasmides de petite taille ne possèdent pas
de gènes de transfert, mais peuvent s’intégrer dans un plasmide de conjugaison. On dit qu’ils
sont mobilisables. Les plasmides ubiquistes sont ceux qui peuvent être transférés et maintenus
de façon stable dans un grand nombre d’espèces bactériennes. Les plasmides utilisés en génie
génétique ne posssèdent ne gènes de transfert, ni site de mobilisation. Ils ne peuvent donc pas
être transférés par le processus naturel de conjugaison. Ils sont introduits dans une cellule hôte
par une technique artificielle : la transformation.

ADN plasmidique

Tous les plasmides connus sont des molécules d’ADN circulaires superenroulées à une seule
exception, le plasmide killer de levure qui est composé d’une molécule d’ARN. On peut
isloler les plasmides des bactéries de la manière suivante : D’abord les bactéries contenant un
plasmide sont lysées en présence d’un détergent, puis ce lysat est centrifugé. En raison de sa
taille et de sa compacité, le complexe chromosomique bactérien, qui contient des protéines et
191
des molécules d’ARN, va être entraîné rapidement vers le fond du tube et former un culot. Les
molécules plasmidiques, plus petites, restent dans le surnageant. Ensuite, du cholrure de
césium et un colorant fluorescent spcifique de l’ADN, le bromure d’éthidium, sont ajoutés au
surnageant. La solution est centrifugée à haute vitesse jusqu’à l’équilibre. Le chlorure de
césium forme un gradient de densité.

En présence de bromure d’éthidium, les molécules d’ADN surenroulées ont une densité plus
grande que les fragments linéaires du chromosome bactérien (celui-ci ayant été brisé en
fragments plus petits lors de l’extraction. Ainsi à l’équilibre, les molécules d’ADN circulaires
superenroulées et les molécules d’ADN linéaires sont localisées à 2 endroits différents du tube
de centrifugation. Les 2 régions sont facilement visualisées grâce à la fluorescence de bromure
d’éthidium fixé sur les molécules d’ADN. La bande correspondant à l’ADN plasmidique peut
être aisément répérée et prélevée. La découverte des plasmides, qui sont des molécules
d’ADN circulaires autoréplicatives, est l’une des bases du développement du génie génétique.

TYPES DE PLASMIDES

Les plasmides naturels dits de première génération ont été utilisés pour les toutes premières
expériences de génie génétique. Très tôt les chercheurs ont compris les limites de ces
plasmides comme vecteurs dans la résolution de problèmes complexes de clonage. Ils se sont
alors tournés vers la construction de nouveaux plasmides artificiels, en rassemblant en un
plasmide chimère les éléments intéressants de chaque plasmide naturel et en augmentant le
nombre de sites uniques de coupure par les enzymes de restriction. Il existe ainsi deux types de
plasmides : les plasmides spontanément rencontrés dans la nature utilisés dans le passé et les
plasmides artificiels actuels.

Plasmides de première génération

Ce sont des plasmides naturels. Il s’agit des plasmides Col E1, RSF 2124 et pSC 101.
Historiquement pSC 101 fut le premier plasmide à être utilisé chez les eucaryotes pour le
clonage des gènes codant pour l’ARN des ribosomes de Xenopus laevis en 1974.

Plasmides de seconde génération

Ce sont tous des constructions à partir de divers éléments intéressants des plasmides naturels.
La série la plus célèbre de cette génération est la série pBR 312 à pBR 328. Le plasmide
pBR322 dont la taille est de 4363 paires de bases (dont la séquence nucléotidique est
entièrement connue), est le plasmide de deuxième génération le plus couramment utilisé. Le
nombre de copies par cellule est de 15 à 20. Comme marqueurs phénotypiques, il possède les
gènes de résistance à l’ampicilline (ApR) et à la tétracycline (TcR) et 20 sites uniques de
coupure pour des enzymes de restriction. Noter que seuls 10 sites correspondent à des
enzymes couramment commercialisées et parmi ces sites uniques, 11 sont localisés dans les
gènes de résistance aux antibiotiques. Il s’agit de : - EcoR V, BamHI, Ph I, Sal I, Xma I et Nru
I dans le gène TcR ; - Cla I et Hind III dans le promoteur de TcR ; - Pst I, Pvu I et Sca I dans le
gène ApR. Le site Pst I est le plus utilisé.
192

Plasmides de troisième génération

Des plasmides aux performances de plus en plus croissantes ont été construits par de
nombreux laboratoires. A titre d’exemple nous citerons la famille pUC, la famille pSP et le
plasmide BlueScript R.

La famille pUC

Il s’agit des plasmides, développés par Messing et coll. Leur ADN de taille de 2600 pb
environ contient le gène de résistance à l’ampicilline de pBR 322 et une partie du gène lacZ.
Au sein de gène lacZ a été inséré un polylinker (une séquence polynucléotidique synthétique
correspondant à toute une série de sites uniques, successifs, de coupure par des enzymes de
restriction). Noter que les polylinker de cette série sont identiques à ceux du phage M13. Les
différents membres de la série pUC (8,9, ……., 19) ne diffèrent que par la longueur et
l’orientation du polylinker. Noter également que la présence du polylinker ne modifie pas
l’activité de la β-galactosidase (colonies bieues), ce qui préserve le pouvoir de distinction des
recombinants et des non-recombinants. Et pour profiter de cette possibilité de sélection, il est
nécessaire d’utiliser des bactéries lac- (JM 101 à JM 109). Ces plasmides présentent certains
avantages notamment : - leur petite taille permettant une réplication très rapide et la formation
d’un très grand nombre de copies par bactérie (plusieurs milliers). De ce fait les rendements
sont très élevés (quelques mg par litre de culture bactérienne) ; - le polylinker permet
l’insertion facile de n’importe quelle séquence quelle que soit la stratégie employée. Les sous-
clonages sont également facilitées ; - la présence du gène lacZ facilite considérablement la
sélection de vrais recombinants par simple examen de la couleur des colonies.

La famille pSP et Gemini

La taille de ces plasmides est comprise entre 2900 et 300 pb. Ils comportent un gène de
résistance à l’ampicilline et un polylinker pour faciliter les insertions. Mais ils ne possèdent
pas le gène lacZ. Les plasmides pSP 64 et 65 possèdent, immédiatement adjacent au
polylinker, un promoteur pour l’ARN polymérase SP6 provenant de S. typhimurium. GeminiR
1 à 4 proviennent des deux précédents. Ils possèdent en plus sur le brin complémentaire, de
l’autre côté du polylinker, un promoteur pour l’ARN polymérase du phage T7. Comme pour la
série pUC, les différents Gemini diffèrent par la longueur et l’orientation du polylinker.

Les plasmides de la famille pSP présentent certains avantages : ils présentent l’avantage
majeur de permettre de transcrire en ARN la séquence qui a été insérée. Les plasmides de type
Gemini apportent un maximum de puissance puisque chaque brin peut être transcrit
spécifiquement suivant le type de polymérase utilisé. Il devient donc possible d’obtenir de
grandes quantités d’ARN complémentaire de chacun des brins de l’ADN cloné (orientation +
et -). Cet ARN peut être utilisé comme sonde (ribosonde) à haute activité spécifique et pou des
recherches sur les produits du gène : structure second-tertiaire de l’ARN, protéine synthétisée,
etc. Avec ces plasmides, il est aussi possible de séquencer directement les deux brins de
l’ADN inséré sans sous-clonage en phage M13.
193
Le plasmide BlueScript

C’est le plus complexe et le plus performant qui est commercialisé à ce jour. Il combine tous
les avantages des vecteurs précédents plus de nouveaux. Ce plasmide a comme base un
plasmide de type Gemini dans lequel le promoteur SP6 a été remplacé par un promoteur de
type T3. La même fraction du gène lacZ que celle des plasmides pUC a été ajoutée, permettant
une sélection des recombinants par la couleur des colonies et d’exprimer la protéine codée par
l’ADN inséré puisqu’elle se trouve, de par la construction, sous le contrôle du promoteur du
gène lacZ. Ainsi il est possible de cribler une banque constituée de ce type de vecteur avec un
anticorps pour rechercher le clone correspondant au gène de la protéine que l’on veut cloner.
Une séquence provenant d’un phage monobrin est enfin ajoutée, permettant, avec l’aide d’un
phage helper, de récupérer l’un des deux brins du plasmide recombinant sous forme de phage
monobrin et cela sans sous-clonage, ce qui facilite considérablement les déterminations des
séquences.

6.3.2.2 BACTERIOPHAGES

Depuis ses débuts, le génie génétique utilise abondamment les bactériophages : ils se
multiplient rapidement, leur nombre de copies par cellule est considérable, leur système de
pénétration dans la bactérie est très efficace. Une fois dans la bactérie, ils se multiplient de
façon autonome. La taille de l’ADN inséré, qui dépend de la stratégie d’introduction, est
beaucoup plus grande que ce qu’il est possible d’insérer dans les plasmides. Le rendement
d’une infection par un phage est très largement supérieur à ce qu’il est obtenu lors de la
transformation de la bactérie par les plasmides, néanmoins leur maniement est légèrement plus
complexe. Deux phages d’E. coli ont été largement utilisés en génie génétique : le phage
lambda (λ) et le phage M13. Le génie génétique utilise actuellement les rétrovirus et autres
virus eucaryotes.

Phage lambda (λ)

Le phage  d’E. coli est l’un des phages les mieux connus. Les gènes du phage (λ) peuvent
être répartis en trois groupes : les gènes précoces qui codent pour les protéines impliquées
dans l’immunité et dans la réplication de l’ADN du phage, les gènes tardifs codant pour les
protéines de la capside et de la queue du phage et les protéines de la lyse de la bactérie et les
gènes de la lysogénie qui ne sont pas nécessaires pour le cycle lytique du phage. Les gènes de
la lysogénie sont en outre situés dans la région non essentielle qui occupe le tiers central de
l’ADN du phage. Ces gènes de la lysogénie ont été supprimés dans les phages (λ) utilisés en
génie génétique. Ce sont donc les phages dérivés des phages sauvages qui sont utilisés comme
vecteurs.

Les dérivés du phage (λ) ne comportent plus qu’un ou deux sites de restriction pour différentes
endonucléases de restriction. Ces sites se trouvent dans la partie non essentielle de l’ADN du
phage. C’est dans cette région où est inséré l’ADN étranger. Il existe deux types de vecteurs
dérivés du phage λ : les vecteurs d’insertion et les vescteurs de remplacement. Les vecteurs
d’insertion possèdent un site unique de restriction dans la région non essentielle, dont une
194
partie a été éliminée par délétion. Compte tenu de la délétion et de la tolérance de taille pour
l’encapsidation, un fragment d’ADN étranger d’une taille allant jusqu’à 12 kb peut ainsi être
inséré.

Les trois groupes de gènes du phage lambda

Les vecteurs de remplacement possèdent 2 sites de restriction pour une même endonucléase de
part et d’autre de la région non essentielle. Celle-ci peut donc être remplacée par un fragment
d’ADN étranger dont la taille peut atteindre 22 kb. Le choix du type de vecteur dépend de la
taille du fragment d’ADN étranger à cloner. Avec l’ADN de λ recombiné par insertion ou par
substitution, on forme des particules virales par encapsidation in vitro en ajoutant les protéines
de capside et de queue sous forme de deux lysats des phages mutants différents qui se
complémentent in vitro. Les particules virales ainsi formées permettent une introduction
efficace de l’ADN recombinant dans la cellule hôte E. coli par infection phagique.

Les virions se reproduisent ensuite par cycle lytique, ce qui permet une bonne amplification de
l’ADN recombinant. L’isolement des clones est obtenu en réalisant l’infection en milieu semi-
solide. Chaque particule virale donne alors naissance à un clone sous forme d’une plage de
lyse dans le tapis bactérien. Les phages obtenus au niveau des plages de lyse sont élués de la
gélose puis précipités par le polyéthylène glycol (PEG). L’ADN phagique dans les virions est
stable et peut être conservé longtemps sous cette forme. Il peut être extrait en éliminant la
capside par déprotéinisation (traitement à la protéinase k et au SDS, extraction au phénol),
puis par déprécipitation à l’éthanol.

Phage M13

Le phage M13 de E. coli comporte une molécule d’ADN circulaire monocaténaire notée brin
(+). Il infecte uniquement les souches F+ d’E. coli.

Réplication de l’ADN du phage M13


195
Sa multiplication intracellulaire fait intervenir la forme réplicative bicaténaire (RF) constituée
d’un brin (+) et d’un brin- complémentaire noté brin (-). En fait, le phage M13 utilise le
mode de réplication en cercle roulant qui lui permet de synthétiser une série d’ADN simple
brin circulaire à partir d’un double brin circulaire. Les phages M13 utilisés comme vecteurs
sont des dérivés des phages sauvages. Ils sont fréquemment utilisés dans la synthèse des
sondes nucléiques, dans le séquençage de l’ADN et dans certaines techniques de mutagenèse
in vitro. L’ADN simple brin est justement le substrat nécessaire pour la technique de
séquençage aux didésoxynucléotides de Sanger couramment utilisée en génie génétique.

Réplication in vitro d’un insert dans un dérivé de M13

Le phage M13 a été modifié : de manière à pouvoir introduire un ADN étranger dans la forme
réplicative au niveau d’un site unique de restriction. La forme réplicative recombinée peut
ensuite être introduite dans une cellule hôte par transformation, comme le plasmide ; de
manière à disposer sur le brin+ d’une séquence connue au voisinage de l’insert. Sur cette
séquence, on pourra hybrider un oligonucléotide de synthèse qui servira d’amorce à l’ADN
polymérase.

Types de phages utilisés en biologie moléculaire

Les phages de première génération

Le phage λ (lambda) représente la première génération des phages utilisés en génie génétique
et la plupart des phages à ADN double-brin utilisés au laboratoire dérivent du phage λ. Il est
constitué d’un ADN double-brin linéaire de 48502 pb dont la séquence est entièrement
connue. Escherichia coli est l’hôte naturel du phage λ. Chaque extrémité de l’ADN du phage
λ, appelée cos, est constituée de l’ADN sous forme simple-brin sur une longueur de 12 bases.
Les deux simple-brins sont complémentaires, produisant ainsi des extrémités cohésives qui
permettent au phage de se circulariser immédiatement après son injection dans la bactérie.
C’est sous cette forme circulaire que le phage λ est concaténé. Enfin le phage λ peut être
utilisé aussi bien avec la stratégie de l’insertion simple qu’avec la stratégie de la délétion-
remplacement.
196
Les phages de deuxième génération

Les phages EMBL 3 et 4

Les phages EMBL 3 et 4 sont des dérivés du phage λ. Ils sont caractérisés par l’addition d’un
polylinker aux deux extrémités de la zone de l’ADN qui sera délétée pour être remplacée par
l’ADN à cloner. Les deux phages ne diffèrent que par l’orientation du polylinker. Ils peuvent
introduire des fragments d’ADN de 15 à 20 kb (phages de choix pour la constitution des
banques génomiques), néanmoins ils ne peuvent être utilisés qu’en délétion-remplacement. La
présence du polylinker fait qu’il n’est plus nécessaire d’éliminer la partie centrale du phage
par centrifugation. En fait, après la double digestion par les enzymes de restriction BamHI et
EcoRI, seuls les bras du phage se terminent par un bout cohésif de type BAMHI. Ce bout
pourra s’hybrider avec les extrémités cohésives de l’ADN génomique, qui est partiellement
coupé par l’enzyme Mbo I dont le site de reconnaissance est compris dans celui de BAMHI.

Les extrémités du fragment central se terminent par des bouts cohésifs de type EcoRI, qui ne
pourront s’hybrider ni avec les bras du phage ni avec les fragments de de l’ADN génomique.
Et comme les extrémités de ce fragment ne possèdent pas de sites cos, leurs concatémères ne
seront pas empaquetés et seront de ce fait naturellement élimiés. La minuscule partie centrale
du polylinker libérée par la double digestion BamHI-EcoRI est éliminée lors de la
précipitation des bras par l’alcool isopropylique. Cette astuce technique permet d’économiser
deux jours de travail et le rendement final est largement supérieur.

Le phage λgt11

C’est aussi un dérivé du phage λ qui ne peut être utilisé que par la stratégie de l’insertion
simple. Il sert principalement au clonage des ADNc dont la longueur peut atteindre 6 à 8 kb.
Le phage λgt est utilisé comme vecteur d’expression, ainsi la séquence insérée peut être
exprimée dans la bactérie sous forme de protéine. Cela permet la recherche du recombinant
désiré à l’aide d’un anticorps de la protéine à cloner. L’ADN est inséré au site EcoRI qui suit
immédiatement le début du gène lacZ (il s’agit du même fragment du gène que celui des
plasmides pUC et BleuscriptR). L’addition de l’IPTG comme inducteur permet l’expression
du complexe lacZ/ADNc.

La protéine chimère, appelée aussi protéine de fusion, synthétisée de cette manière comporte
l’extrémité N terminale de la β-galactosidase. Cette extrémité se continue par la séquence
correspondant au gène cloné. Il y a 1 chance sur 6 pour que la séquence insérée soit dans le
bon sens et en phase. Cette protéine chimère est dépourvue d’activité β-galactosidasique, ce
qui permet de détecter les vrais recombinants grâce à l’indicateur coloré Xgal). Cette protéine
synthétisée peut enfin être repérée par un anticorps si l’insertion s’est faite dans la bone phase
de lecture.

Le phage monobrin M13

Le phage M13, dont l’hôte naturel est la bactérie Escherichia coli, est un phage à ADN
circulaire monocaténaire de 6,4 kb. Puisque sa pénétration dans la cellule bactérienne implique
197
une interaction de la capside phagique avec les F-pili bactériens, seules les bactéries mâles
(F+) peuvent être infectées. Les bactéries femelles (F-) peuvent être infectées par
transformation bactérienne classique, bien que le rendement soit bien moins bon. Une fois
dans la bactérie, l’ADN du phage (noté brin+) sert de matrice pour la synthèse du brin
complémentaire (noté brin-), donnant lieu à un ADN double-brin (+/-) appelé forme réplicative
(RF). Ensuite 50 à 200 copies de cette forme réplicative sont produites, puis le brin
complémentaire (brin-) va servir de matrice pour la synthèse en continu de centaines de brin+,
qui seront encapsidés et relâchés dans le milieu.

Le phage M13 utilisé en biologie moléculaire a été modifié par Messing et coll. in vitro.
Notamment par l’addition d’un polylinker pour faciliter l’insertion des séquences dans le
phage. La zone qui lui est immédiatement adjacente en 5’ est utilisée pour la méthode
d’extension d’amorces (primer universel M13) et pour la technique de séquençage avec les di-
désoxynucléotides (Sanger). C’est aussi par l’addition d’une partie du gène lacZ pour
permettre la sélection des recombinants (système de bactéries blanches et bleues en présence
d’IPTG et d’Xgal). Comme pour les plasmides, il existe toute une série de ces vecteurs
modifiés : M13mpI à M13mp19 (exactement comme pour les plamsides de la série pUC).

Les différences portent essentiellement sur la complexité et l’orientation des polylinkers. La


propriété d’être constitué d’un ADN simple-brin fait du phage M13 un vecteur
universellement utilisé pour la détermination des séquences par la méthode de Sanger aux di-
désoxynucléotides. La zone adjacente au polylinker (primer M1 l3) sert de site d’hybridation
pour l’oligonucléotide servant d’amorce à l’ADN polymérase. Le phage M13 est également
utilisé pour la création des mutations ponctuelles au sein d’une séquence clonée (on parle de
mutagenèse dirigée in vitro).

Autres types de vecteurs

Les cosmides

Ce sont des vecteurs artificiels hybrides. Ils sont formés d’un plamside classique auquel on a
ajouté les séquences cos du phage λ. Ces séqunces cos permettent l’empaquetage d’un
recombinant d’environ 50 kb dans la tête des phages λ. La taille des fragments clonés dans les
cosmides est d’environ 45 kb. Ces vecteurs possèdent donc les propriétés des plamsides et
celles des phages. Leur technique d’utilisation est hybride entre celle des plamsides et celles
des phages. Pour se faire, le cosmide est ouvert par une enzyme de restriction, puis les
extrémités sont phosphatasées. Les fragments d’ADN à insérer sont sélectionnés de telle
sorte que leur taille soit comprise entre 35 et 45 kb (il s’agit ici d’une certaine tolérance à
l’encapsidation).

Après ligation, l’ADN recombinant est empaqueté dans les têtes des phages exactement
comme s’il s’agissait de phages (grâce à la présence des sites cos). Ces pseudo-phages seront
utilisés pour infecter des bactéries, cela permet d’obtenir des rendements d’intégration
infiniment supérieurs par rapport à la transformation bactérienne par un plasmide. Une fois
dans la bactérie, le pseudo-phage se comporte comme un plasmide et contrairement aux vrais
198
phages, il ne détruit pas la cellule bactérienne infectée. On obtiendra alors des colonies
bactériennes et non des plages de lyse (comme pour les vrais phages).

Cependant à cause de leur grande taille les consmides présentent deux inconvénients majeurs :
la réplication du cosmide recombinant dure plus longtemps que celle d’un plasmide et le
nombre de copies par cellule est plus faible et puis les systèmes de recombinaison de la bctérie
peuvent remanier les ADN insérés. Ainsi donc si les bactéries ne sont pas recA- ou s’il se
produit une réversion, les séquences répétitives de l’ADN inséré seront progressivement
éliminées. A cause de cette instabilité des recombinants, il est déconseillé d’amplifier une
banque de cosmides. Il est plutôt recommandé de contrôler au cours du temps que la carte de
restriction du cosmide ne se modifie pas et la longueur de l’ADN inséré ne diminue pas. Noter
que les cosmides sont exclusivement utilisés pour la confection des banques génomiques.

Les vecteurs navettes

Il s’agit des vecteurs artificiels utilisés aussi bien chez les procaryotes que chez les eucaryotes.
Ils sont constitués au minimum : d’un gène permettant la sélection des recombinants chez les
bactéries comme par exemple un gène de résistance aux antibiotiques, d’un gène permettant la
sélection chez les eucaryotes, d’un promoteur eucaryote fort avec éventuellement un enhancer.
Des séquences toxiques pour les bactéries ou les cellules eucaryotes doivent être excisées pour
assurer la double compatibilité.

En effet un vecteur navette doit posséder une origine de réplication procaryote (ori) et une
origine de réplication eucaryote, par exemple l’origine de réplication du plasmide 2μ de
Saccharomyces cerevisiae pour un vecteur navette E. coli – levure. Pour les vecteurs E. coli –
cellule de mammifère, on utilise généralement une séquence du virus SV40. Le virus SV40 est
un virus qui se reproduit seulement dans les cellules dites permissives du singe rhésus. Son
ADN circulaire possède une séquence servant à la fois de promoteur des gènes précoces et
d’origine de réplication lui permettant de se répliquer dans d’autres types de cellules.

Comme cellules hôtes on utilise des cellules COS. Il s’agit des cellules de singe qui ont intégré
dans leur génome la région précoce de l’ADN de SV40 et synthétisent une protéine virale
nécessaire à sa réplication (la protéine grand T). Noter que tout ADN circulaire contenant
l’origine de réplication de SV40 sera activement répliqué et se comportera comme un
plasmide eucaryote. Le vecteur naveteur doit également posséder un gène marqueur de
sélection des bactéries transformées, souvent le gène AmpR codant pour une β-lactamase et si
possible un gène marqueur de sélection des cellules eucaryotes transfectées. Pour les vecteurs
navettes E. coli – levure, le marqueur de sélection eucaryote peut être le gène ura3 codant pour
une enzyme intervenant dans la synthèse de l’uracile, gène déficient dans la cellule hôte.

Le milieu sélectif devra donc être un milieu minimum déficient en uracile. Pour les vecteurs
navettes E. coli – cellule de mammifère, les marqueurs de sélection eucaryotes les plus utilisés
sont : le gène neo, conférant la résistance à la néomycine et le gène tk, codant pour la
thymidine kinase. La thymidine kinase permet à une cecllule dont la voie principale de
synthèse est inhibée par l’aminoptérine de synthétiser de la thymidine monophosphate à partir
de thymidine fournie dans le milieu. Les cellules hôtes TK ne peuvent se développer en
199
milieu HAT (hypoxantine aminoptérine thymidine) et les cellules transfectées sont
sélectionnées parce que dévenues TK+.

Les vecteurs navettes peuvent également être des vecteurs d’expression eucaryotes et apporter
à la cellule transfectée un gène nouveau qui s’exprimera s’il est sous contrôle d’un promoteur
reconnu par celle-ci. Pour étudier l’effet sur la transcription d’une séquence régulatrice ou
d’un facteur (inducteur hormonal par exemple), on fait souvent appel à un gène reporter.
Absent de la cellule hôte, ce gène code pour une enzyme dont l’activité peut être facilement
mise en évidence. La quantification du produit de l’enzyme dans les cellules transfectées
informe sur le taux d’expression du gène reporter et donc sur l’efficacité dans les conditions
choisies du promoteur, sous le contrôle duquel il a été inséré sur le vecteur.

Les vecteurs viraux eucaryotes

Les vecteurs viraux eucaryotes sont d’utilisation plus complexe : l’hôte doit être une cellule
eucaryote, il n’y a pas de vecteur viral type (comme pBR322 pour les plasmides ou λ pour les
phages), chaque vecteur est un cas d’espèce, construit pour répondre à une question
spécifique. Les plus couramment utilisés sont : SV40, l’adénovirus, les virus de type Herpès et
la vaccine ou encore des rétrovirus (comme le virus du SIDA).

Les retrovirus

En général, les rétrovirus sont constitués d’une molécule d’ARN entourée d’une enveloppe
protéique. Leur cycle est inhabituel. En effet, les rétrovirus disposent d’une enzyme
particulière, la transcriptase réverse, capable de synthétiser une copie d’ADN double brin à
partir de l’ARN viral. Cette copie d’ADN double brin peut s’intégrer dans l’ADN de la cellule
hôte, au niveau des sites préférentiels d’intégration. La transcription de l’ADN démarre
immédiatement après son intégration et conduit à la formation de nouvelles particules virales.
Dans certains cas, la cellule infectée peut survivre à l’infection, mais conserve l’ADN du virus
intégré dans son génome. Cette situation peut provoquer des perturbations dans le
fonctionnement de la cellule hôte, comme une prolifération non contrôlée conduisant à la
formation des tumeurs. C’est le cas par exemple du virus du Sarcome de Roux (Roux Sarcoma
Virus ou RSV) qui provoque la formation de tumeur chez le poulet. L’ADN de ces rétrovirus
a servi de base à la construction des vecteurs utilisés pour la transformation des cellules des
mammifères.
YAC

Les chromosomes artificiels de levure, YAC (pour Yeast Artificial Chromosome) sont des
vecteurs construits à partir des centromères et des télomères de levure. Par rapport aux
vecteurs classiques, les YAC sont capables de porter de grandes quantités d’ADN génomique
du donneur. Ils peuvent incorporer des inserts d’ADN étranger pouvant atteindre 100 Kb.
Grâce à leur très grande capacité de charge, les YAC sont utilisés pour le clonage des
chromosomes eucaryotes, voire même des génomes entiers. Les chromosomes artificiels de
levure servent de vecteurs de clonage dans les cellules de levure.
200
BAC

Les chromosomes bactériens artificiels, BAC (pour Bacterial Artificial Chromosome) sont des
vecteurs dérivés du facteur F utilisés pour le clonage de grands fragments d’ADN. Leur
construction a comme base le facteur F de 7 Kb de E. coli. En fait, comme le facteur F peut
contenir de grands fragments d’ADN de E. coli sous forme de dérivés F’, les BAC peuvent
incorporer des inserts d’ADN étranger pouvant atteindre 300 Kb. Par rapport aux YAC, les
BAC présentent deux avantages : 1. ils peuvent être utilisés et manipulés sur base de la
technologie des plasmides bactériens et 2. ils forment moins d’inserts hybrides que les YAC.
Les plasmides, les phages λ et M13, les cosmides et les chromosomes bactériens artificiels
dérivés du facteur F sont des vecteurs disponibles pour le clonage dans les cellules hôtes
bactériennes.
Les vecteurs d’expression

Il convient de rappeler qu’en général, les gènes eucaryotes sont pourvus de nombreux introns
et que les bactéries ne disposent pas de système enzymatique capable d’exciser les introns. Or
le gène étranger à insérer dans le vecteur est le plus souvent un gène eucaryote. Pour
contourner cet obstacle, le génie génétique utilise l’ADN complémentaire (ADNc). En effet,
l’ADNc est un ADN synthétique obtenu à partir de l’ARN messager grâce à une enzyme
spéciale, la transcriptase inverse, initialement isolée des rétrovirus. Cette enzyme utilise
l’ARNm comme matrice pour la synthèse d’une molécule d’ADN simple-brin. A son tour,
l’ADN simple-brin synthétisé va servir de matrice pour la synthèse d’une molécule d’ADN
double-brin. C’est cet ADN double-brin, dépourvu d’introns et des séquences régulatrices en
amont et en aval du gène, qu’on appelle ADNc et qui peut être inséré dans un vecteur de
clonage.

Le gène cloné sous forme d’ADNc peut être traduit en protéine fonctionnelle dans une cellule
bactérienne. Cela signifie que l’ADNc des eucaryotes peut être traduit en protéine
fonctionnelle dans des bactéries, une propriété manifestement importante lorsqu’il s’agit de
cloner et de manipuler des gènes eucaryotes dans des hôtes bactériens. Il existe des vecteurs
particuliers conçus pour que le gène étranger soit transcrit et traduit en protéine fonctionnelle.
Dans ces vecteurs, le gène cloné est inséré à proximité des signaux de régulation de la
transcription. Dans certains cas, des sites de restriction sont placés à côté de la région
régulatrice de l’opéron lactose (lac) de la bactérie insérée dans le vecteur. Ces sites de
restriction servent à mettre l’expression du gène cloné sous contrôle du système de régulation
de l’opéron lac. De ce fait, le gène étranger peut être transcrit et traduit en protéine dans une
cellule bactérienne.

La banque d’ADN

Une banque d’ADN est une collection de clones obtenus à partir d’un échantillon d’ADN
comme par exemple un échantillon d’ADN génomique d’un eucaryote. On parle de clonage à
l’aveugle lorsqu’on clone un grand nombre de fragments d’ADN dans l’espoir que l’un des
clones contiendra le gène recherché. Les différentes catégories de banques se distinguent
selon le vecteur utilisé et la source d’ADN. Ainsi selon la taille du génome, on utilise les
plasmides et les phages pour de petites quantités d’ADN, les cosmides et les YAC sont utilisés
201
pour de grandes quantités d’ADN. Le choix du vecteur dépend aussi de la facilité de
manipulation. Une banque de phage est une suspension de phages, une banque de cosmides
ou de plasmides est une suspension de bactéries ou un ensemble de cultures bactériennes en
tubes ou en boîtes de culture, tandis qu’une banque de YAC est une collection de souches de
levure. Selon la source d’ADN, on peut distinguer une banque génomique et une banque
d’ADNc.

Le choix d’une source dépend du problème traité. Basée sur les régions du génome qui sont
transcrites, la banque d’ADNc est forcément plus réduite qu’une banque génomique qui
contient tout le génome. Cependant les banques génomiques présentent l’avantage de contenir
les gènes sous leur forme native. Le processus de construction d’une banque commence par
un échantillon d’ADN. Les chromosomes sont isolés en fonction de leurs tailles. Les
chromosomes individuels sont ensuite découpés et utilisés pour construire une banque. On
peut estimer le nombre approximatif de clones dans une banque simplement en prenant la
taille totale du génome divisée par la taille moyenne des inserts portés par le vecteur utilisé.

6.3.3 LES ENZYMES UTILISEES EN GENIE GENETIQUE

6.3.3.1 ENDONUCLEASES DE RESTRICTION

Les cellules bactériennes contiennent des endonucléases spécifiques qui reconnaissent et


détruisent l’ADN d’espèces étrangères. Impliquées dans la défense des bactéries contre
l’ADN des phages, ces enzymes reconnaissent des sites spécifiques et coupent l’ADN au
niveau de chaque brin. La coupure est réalisée par l’hydrolyse d’une liaison phosphodiester
dans chaque brin, en une position précise dans le site reconnu. Pour toutes ces raisons elles
sont appelées « endonucléases de restriction ». Trois faits caractérisent les endonucléases de
restriction : a- elles réalisent des coupures au niveau des séquences spécifiques qui sont
symétriques et palindromiques, b- généralement les coupures de chaque brin sont décalées, c-
en général, les coupures génèrent des fragments d’ADN avec des extrémités complémentaires.

Il faut toutefois noter que la plupart des enzymes de restriction ne reconnaissent qu’une seule
séquence et les extrémités générées sont les mêmes quel que soit l’origine de l’ADN. Cette
propriété est une des bases du génie génétique. Il faut également noter que plusieurs enzymes
de restriction sont actuellement disponibles dans le commerce. Les endonucléases de
restriction reconnaissent l’ADN d’espèces étrangères et réalisent la coupure au niveau des
séquences cibles spécifiques dans l’ADN. L’enzyme EcoRI, par exemple, reconnaît la
séquence bicaténaire suivante :

5’ – G⁄AATTC – 3’
3’– CTTAA⁄G – 5’

En fait, comme par hasard, toute molécule d’ADN, du virus à l’homme, est pourvue de sites
cibles permettant aux enzymes de restriction de couper l’ADN en fragments bien définis.
Curieusement, ces sites de restriction ne jouent aucun rôle particulier connu à l’intérieur des
202
cellules. Il faut toutefois noter que la plupart d’organismes ne possèdent pas d’enzymes de
restriction. Selon la nomenclature de Smith et Mathan, les endonucléases de restriction sont
désignées par un code faisant référence à la bactérie dans laquelle elles ont été découvertes.

Dans cette nomenclature, la première lettre, majuscule, désigne l’initial du genre de la


bactérie, les deux lettres suivantes désignent l’espèce de la bactérie, la quatrième lettre,
facultative, désigne la souche de la bactérie, enfin un chiffre romain permet de distinguer les
enzymes d’une même souche dans l’ordre de leurs découvertes. Pour EcoRI, par exemple, E
représente le genre Escherichia, co représentent l’espèce coli, R représente la souche RY13 et
I indique qu’il s’agit de la première endonucléase isolée. Pour Hind III, H représente le genre
Haemophilus, in représente l’espèce influenzae, d représente la souche Rd et III indique que
c’est la troisième endonucléase isolée.

Il existe trois types d’endonucléases diffférant par le mode de fonctionnement après


reconnaissance de la séquence nucléotidique : Type I : la séquence étant reconnue, l’enzyme
se déplace sur l’ADN et coupe de manière aléatoire 1000 à 4000 pb plus loin ; Type II :
l’enzyme coupe l’ADN au niveau de la séquence reconnue ou à proximité ; Type III :
l’enzyme reconnaît la séquence et coupe l’ADN 20 à 25 pb plus loin. Seules les enzymes de
type II sont utilisées en génie génétique parce qu’on contrôle parfaitement le site de coupure.
Ces enzymes constituent un outil idéal pour fractionner l’ADN de manière définie. En effet
elles présentent deux caractéristiques : la spécificité de la séquence reconnue et des liaisons
hydrolysées et leur grande diversité, chacune reconnaissant une séquence particulière.

Mécanisme d’action

Une endonucléase de restriction se lie à une courte séquence spécifique reconnue sur l’ADN
appelée site de restriction. Ensuite, elle catalyse un clivage sur les deux brins au niveau des
liaisons phosphodiesters spécifiques à l’intérieur de la séquence reconnue. L’hydrolyse d’une
liaison phosphodiester entre le groupe 3 –OH et le phosphate génère un 5’- Phosphomonoester
d’un côté de la coupure et un groupe 3’ – OH de l’autre. Généralement, la coupure génère des
extrémités débordantes ou sortantes.

Les extrémités débordantes résultant d’une coupure décalée sont complémentaires entre elles
et peuvent se réapparier spontanément. On parle alors d’extrémités cohésives ou bouts
collants. Ces endonucléases de restriction sont très utilisées pour fabriquer de l’ADN
recombinant puisque les fragments issus d’ADN différents, coupés par la même enzyme de
restriction, peuvent s’associer par leurs extrémités cohésives. Les fragments associés sont
enfin soudés par l’ADN ligase. La plupart d’endonucléases de restriction reconnaissent des
sites de 4 ou 6 nucléotides. Un petit nombre reconnaissent des séqunces plus complexes.

5’–GAATTC–3’ 5’–G–3’ 5’–AATTC–3’


3’–CTTAAG–5’ → 3’–CTTAA–5’ + 3’–G–5’

Les séquences de restriction présentent généralement une symétrie par rapport au centre.
Généralement, les séquences de restriction présentent une symétrie par rapport au centre. On
203
les appelle les séquences palindromiques par analogie aux palindromes, mots ou phrases
pouvant se lire dans les deux sens, comme RADAR. En fait on observe que l’on a, sur les
deux brins, la même séquence mais en sens inverse. De ce fait, la coupure se produit sur
chaque brin. Ces coupures sont pratiquement simultanées, puisqu’il s’avère que les enzymes
de restriction se lient à l’ADN sous forme de dimère, chaque monomère agissant sur un brin.
Selon la localisation des coupures dans le site, on peut distinguer : - Une coupure décalée :
l’enzyme coupe de façon excentrée par rapport au centre de symétrie du site. Il se produit 2
coupures décalées l’une par rapport à l’autre. Il existe deux types de coupures décalées :
coupure décalée côté 5’ (exemple EcoRI) et coupure décalée côté 3’ (exempe Pst I).

Coupre décalée côté 5’ (exemple EcoRI) :

5’- NNNG/AATTCNNN – 3’ 5’-NNNG – 3’ 5’– AATTCNNN – 3’


3’- NNNCTTAA/GNNN – 5’ 3’-NNNCTTAA – 5’ + 3’-GNNN – 5’

La coupure génère des extrémités 5’ – P débordantes ou sortantes.

Coupure décalée côté 3’ (exemple Pst I) :

5’ – NNNCTGCA/GNNN – 3’ 5’–NNNCTGCA – 3’ 5’ – GNNN – 3’


3’ – NNNG/ACGTCNNN – 5’ 3’– NNNG – 5’ + 3’ – ACGTCNNN – 5’

La coupure génère des extrémités 3’ – OH débordantes ou sortantes.

- Une coupure franche :

L’enzyme coupe les 2 brins au niveau du centre de symétrie. Exemple Hae II.

5’ – NNNGG/CCNNN – 3’ 5’ – NNNGG – 3’ 5’ – CCNNN – 3’


3’ – NNNCC/GGNNN – 5’ 3’ – NNNCC – 5’ + 3’ – GGNNN – 5’

Dans ce cas, l’association sera possible quelle que soit l’enzyme ayant généré la coupure
franche puisqu’il n’y a pas de complémentarité. Cependant la ligature est moins efficace.

Isoschizomères

On parle d’isoschizomères lorsqu’il s’agit de 2 enzymes qui reconnaissent le même site de


restriction. Exemple

MspI 5’ – NNNC/GGGNNN – 3’ Hpa II 5’ – NNNC/GGGNNN – 3’


3’ – NNNGCC/CNNN – 5’ 3’ – NNNGCC/CNNN – 5’

Enzymes compatibles
204
Deux enzymes sont compatibles lorsqu’elles ont des sites de restriction différents, mais
donnent naissance aux mêmes extrémités cohésives. C’est le cas par exemple pour une
enzyme ayant un site de 4 nucléotides avec une enzyme ayant un site de 6 nucléotides incluant
le précédent. Exemple BamHI et Sau3AI

BamHI 5’ – NNNG/GATCCNNN – 3’ Sau3AI 5’ – NNN/GATCNNN – 3’


3’ – NNNCCTAG/GNNN – 5’ 3’ – NNNCTAG/NNN – 5’

BamHI donne les mêmes extrémités cohésives que Sau3AI avec qui elle est compatible. Dans
la fabrication d’ADN recombinants, on peut ligaturer des fragments obtenus par coupure avec
l’une quelconque de ces 2 enzymes.

L’hydrolyse d’un ADN par une endonucléase de restriction produit une série de fragments,
appelés fragments de restriction dont la longueur est déterminée par la distance séparant les
séquences de restriction spécifiques reconnues par cette endonucléase. La technique la plus
couramment utilisée pour l’analyse des fragments d’ADN (taille et nombre) est
l’électrophorèse sur gel d’agarose généralement ou en gel de polyacrylamide.

Sites à 4 bases inclus dans les sites à 6 bases

Prenons par exemple la séquence GATC correspondant au site reconnu par Sau 3A1
(isoschizomère de Mbo 1). Ce même site est inclus dans GGATC, le site de reconnaissance de
Bam HI. Ainsi le premier ADN coupé par l’enzyme Sau 3A1 pourra s’associer et être ligaturé
avec le second ADN coupé par l’enzyme Bam HI. Dans ce cas, le recombinant ne sera plus
clivable par l’enzyme Bam HI sauf si la base Nx du premier ADN était une guanine. Cette
propiété est couramment utilisée dans les recombinaisons in vitro.

Cartes de restriction

Une carte de restriction est une séquence de sites de restriction séparés par des distances
précises sur l’ADN et mesurées en paires de bases (pb) si elles sont courtes ou en kilopaires de
bases (kpb) si elles sont longues. Diverses techniques permettent d’obtenir de telles cartes.
Elles passent toutes par la digestion de l’ADN à analyser. L’analyse par double digestion est
l’une d’elles. L’ADN est digéré séparément par 2 enzymes A et B. On obtient un certain
nombre de fragments pour chaque enzyme, analysés par électrophorèse. Chaque fragment
produit par A est ensuite élué du gel et digéré par B et inversément. La confrontation des
différents résultats permet de situer les sites de coupure les uns par rapport aux autres.

Méthylases de l’ADN bactérien

Chez les bactéries, l’ADN est méthylé sur le carbone 5 de quelques cytosines et sur le carbone
6 de quelques adénines par une catégorie d’enzymes appelées méthylases. Ces enzymes
reconnaissent les mêmes sites que les enzymes de restriction. Leur nomenclature consiste à
faire précéder le nom de l’enzyme de restriction correspondante d’un M comme par exemple
M. EcoRI correspondant à l’enzyme de restriction EcoRI. Ainsi la séquence GAATTC,
méthylée par M. EciRI ne peut plus être coupée par EcoRI, puisqu’en effet la méthylation au
205
niveau du site de restriction empêche la coupure par l’enzyme de restriction homologue. Il
convient de noter qu’à toutes les enzymes de restriction ne correspond pas une méthylase
hologue. Il convient également de noter qu’il existe des isoschizomères dont l’un est sensible
aux méthylations et l’autre non, comme par exemple Msp I et Hpa II.

Chez les eucaryotes, les méthylations de l’ADN portent sur les cytosines suivies d’une
guanine. Les enzymes Msp I et Hpa II par exemple reconnaissent la même séquence CCGG,
cependant la coupure pa l’enzyme Hpa II ne peut se produire que si la deuxième cytosine du
site est méthylée, alors que l’enzyme Msp I est insensible à cette méthylation. Ainsi les
fragments libérés par les deux enzymes n’ont pa la même taille. Seules les cytosines méthylées
présentes dans les sites de restriction pour des couples d’enzymes de ce type sont détectables.
Noter que de telles méthylations peuvent être à l’oridine de profondes modifications.

6.3.3.2 AUTRES ENZYMES D’USAGE COURANT


EN BIOLOGIE MOLECULAIRE

La construction des recombinants de plus en plus complexes ainsi que celle des vecteurs de
plus plus puissants ne sont possibles que grâce à une panoplie d’enzymes disponibles dans le
commerce. On peut citer :

Les polymérases d’acides nucléiques

La transcriptase réverse

En fait, avec les enzymes de restriction, la trnascriptase réverse représente historiquement la


base technologique de la biologie moléculaire des eucaryotes. Son action consiste à transcrire
l’ARN en ADN complémentaire (ADNc). Comme toutes les polymérases connues, la
transcriptase réverse travaille dans le sens 5’ vers 3’. Son démarrage nécessite une extrémité
3’-OH libre sur laquelle elle peut fixer un désoxynucléotide par son extrémité 5’, avec création
d’une liaison phosphodiester entre les deux désoxynucléotides. La transcriptase réverse
possède également une activité de type RNase H. Elle peut aussi synthétiser le second brin en
utilisant de l’ADN comme matricce. Noter que la fidélité de transcription de cette enzyme peut
ne pas être absolue.

La transcriptase réverse est une protéine codée par le gène pol des rétrovirus. C’est elle qui
permet aux virus de répliquer leur ARN génomique. L’enzyme utilisée au laboratoire provient
des cellules infectées par l’AMV (avian myeloblastosis virus). Une autre transcriptase extraite
des cellules infectées par le virus de Moloney vient d’être mise sur le marché à un prix assez
bas. Cependant son activité et sa stabilité semblent plus grandes. La transcriptase réverse est
utilisée chaque fois qu’une copie d’ARNm sous forme d’ADN est nécessaire. Les deux
principales applications sont : la construction des banques d’ADN complémentaires (ADNc) et
la détermination de la séquence des acides nucléiques par la méthode des di-
désoxynucléotides.
206
L’ADN polymérase I

L’ADN polymérse I possède 3 activités : une activité ADN polymérasique dans le sens 5’ – 3’
à partir d’une amorce 3’-OH (la matrice peut être un ARN). Un ADN simple brin, comme
matrice est indisspensable. Dans ce cas, l’ADN synthétisé est strictement complémentaire de
la matrice ; une activité exonucléasique dans le sens 3’- 5’ ; une activité exonucléasique dans
le sens 5’ -3’. L’ADN polymérase I est une enzyme bactérienne qui joue un rôle annexe dans
la réplication de l’ADN et un rôle majeur dans la réparation. Sa forme commerciale est
extraite d’E. coli. Elle est utilisée toutes les fois qu’il est nécessaire de synthétiser un ADN à
partir d’une matrice. Le problème de l’amorce devra être résolu préalablement (le plus souvent
on utilise des amorces synthétiques). Ses principales applications sont : - la détermination de
la séquence d’un ADN par la méthode des di-désoxynucléotides ; - la synthèse des sondes très
radioactives ; - la transformation des extrémités cohésives en bouts francs ; - la construction
des vecteurs à partir d’ADN simple brin.

Le fragment de Klenow de l’ADN polymérase I

En fait, le plus souvent, ce n’est pas l’ADN polymérse I qui est utilisée, mais un de ses
fragments obtenus par protéolyse ménagée. Le fragment de Klenow, qui est débarrassé de
l’activité 5’ – 3’ exonucléasique, conserve l’activité polymérasique et l’activité
exonucléasique 3’ – 5’.

La T4 ADN polymérase

Il s’agit d’une enzyme, produite par les bactéries infectées par le phage T4, qui possède les
mêmes activités enzymatiques que le fragment de Klenow. Son utilisation en biologie
moléculaire est la même.

La terminale transférase

La terminale transférase est une enzyme extraite du thymus de veau, qui catalyse l’addition
des désoxynucléotides, sans matrice, à l’extrémité 3’- OH libre de l’ADN. L’incorporation
des nucléotides se fait au hasard et le polynucléotide synthétisé possède ainsi une composition
en bases proportionnelle aux concentrations respectives des bases dans le milieu d’incubation.
Cette enzyme est utilisée pour ajouter une queue (tailing) en vue de créer des extrémités
cohésives qui sont utilisées pour intégrer l’ADN dans un vecteur et pour marquer l’extrémité
3’-OH des ADN en vue de la détermination de leur séquence par la méthode de Maxam et
Gilbert.

La polynucléotide phosphorylase

Il s’agit d’une enzyme qui synthétise des ARN, sans matrice, à partir des ribonucléotides
diphosphates en présence de Mg++ :

nXDP – (XMP)n – n(P) OH


207
Les nucléotides sont incorporés au hasard dans le polynucléotide en quantités proportionnelles
à leur concentration dans le milieu réactionnel. Cette enzyme est peu spécifique, ce qui lui
permet d’incorporer des nucléotides modifiés dans les polynucléotides. Cette propriété se
manifeste surtout lorsque les ions Mg++ sont remplacés par des Mn++. La polynucléotide
phosphorylase possède également deux activités : une activité nucléolytique, qui permet de
libérer des nucléotides monophosphates et une activité d’échange de phosphate en position β
sur les ribonucléotides diphosphates, ce qui permet un marquage facile et spécifique.

La polynucléotide phosphorylase est une enzyme d’origine bactérienne dont les formes
commerciales sont extraites soit de E. coli ou soit de M. luteus. Elle a été utilisée avant l’ère
de la biologie moléculaire actuelle pour synthétiser les polynucléotides qui ont permis de
déchiffrer le code génétique. Actuellement elle est très peu utilisée. Ses applications sont : - la
synthèse des polynucléotides froids et radioactifs ; - la dégradation de la queue poly A des
messagers eucaryotes ; - le marquage intense de l’extrémité 3’-OH des polynucléotides ; - le
marquage sur le phosphore en β des ribonucléotides diphosphates.

La polyA polymérase

C’est une enzyme qui catalyse la formation du polyA à l’extrémité 3’-OH des ARNm
eucaryotes. Elle utlise exclusivement l’ATP comme donneur de ribonucléotides. Son
utilisation est la même que celle de la polynucléotide phosphorylase.

Les ARN polymérases

Ce sont des enzymes qui transcrivent un ADN en ARN. Cette synthèse d’effectue sans amorce
et nécessite des ribonucléotides triphosphates et du Mg++. Comme pour toutes les
polymérases, la syntèse s’effectue dans le sens 5’ – 3’, c’est-à-dire par estérification d’un
hydroxyle 3’ par le phosphate en α d’un ribonucléotide triphosphate. L’ARN polymérase est
presque universellement distribuée. Il en existe de nombreuses sortes, de spécificités
différentes. En biologie moléculaire, trois d’entre elles sont particulièrement utilisées : la SP6
ARN polymérase extraite de Salmonella typhimurium LT2, la T7 ARN polymérase extraite de
E. coli infectées par le phage T7 et la T3 ARN polymérase extraite de E. coli infectées par le
phage T3. Seules SP6, T7 et T3 ARN polymérases sont utilisées de manière courante au
laboratoire.

Leurs principales utilisations sont : - la synthèse de sondes hautement marquées, soit par un
nucléotide radioactif soit par un nucléotide biotinylé (marquage froid) ; - la détermination de
la séquence d’un ADN cloné dans un vecteur possédant, devant l’ADN cloné, l’un quelconque
des promoteurs SP6, T7 ou T3 (RiboprobeR, GeminiR, ScriptR). ; - toute étude sur les versions
ARN d’un ADN cloné. Ces polymérases y sont particulièrement précieuses parce que les
ARN sont des molécules hautement instables et pratiquement impossibles à obtenir à l’état pur
par les techniques classiques. Elles permettent de produire, à partir d’un gène cloné, les
quantités d’ARN nécessaires pour l’étude de sa structure, ses régulations, ses interactions.
208
L’ADN ligase d’E. coli

Les ligases sont des enzymes qui assurent la formation des liaisons phosphodiesters entre une
extrémité 3’–OH et une extrémité 5’ phosphate de deux nucléotides incorporés dans un acide
nucléique. L’enzyme d’E. coli ne peut agir que si les deux ADN sont associés par des
extrémités cohésives. L’enzyme utilise le NAD+ comme cofacteur. Elle est utilisée pour la
ligation des extrémités cohésives de l’ADN lors de la construction des vecteurs.

La T4 ADN ligase

Il s’agit d’une enzyme extraite des bactéries infectées par le phage T4. Elle assure la même
fonction que la ligase d’E. coli. Par rapport à la ligase d’E. coli, la T4 ADN ligase utilise de
l’ATP qui est hydrolysé en AMP et pyrophosphate au lieu d’utiliser du NAD. Contrairement à
l’ADN ligase d’E. coli, elle est capable d’effectuer des ligations entre deux ADN présentant
des bouts francs. La réaction au laboraroire est favorisée par l’adjonction de 12 à 16%% de
polyéthylène glycol dans le milieu réactionnel. Elle est utilisée dans toutes les opérations où
une ligation est nécessaire, que les bouts soient francs ou cohésifs.

L’ARN ligase

L’ARN ligase est une enzyme extraite des bactéries infectées par le phage T4. Elle réalise la
ligation de deux ARN en créant entre eux une liaison phosphodiester entre l’extrémité 3’-OH
libre de l’un et l’extrémité 5’ phosphate libre de l’autre. Une molécule d’ATP (qui sera
hydrolysée en AMP et pyrophosphate) est nécessaire. Cette enzyme est utilisée dans le
marquage de l’extrémité des ARN et construction de liaisons inter- ou intra- ARN.

La DNase 1

La DNase 1 est une endonucléase extraite du pancréas. Elle coupe préferentiellement après
une pyrimidine en libérant une extrémité 3’-OH et une extrémité 5’ phosphate libres. L’ADN
peut être aussi bien sous forme simple que double brin. Dans ce dernier cas, la coupure peut se
faire sur un seul brin aussi bien que sur les deux brins. Dans des conditions douces (faible
concentration et faible température) et si la chromatine est dans son état natif (noyau entier ou
extrait brut de noyaux), la DNase 1 détruit préférentiellement les gènes actifs ou qui l’ont été.
Dans des conditions encore plus douces, seuls quelques sites particuliers sont atteints. Il s’agit
des sites hyper sensibles localisés dans la partie de l’ADN activement transcrits de la
chromatine. La DNase 1 est utilisée dans : - l’analyse des gènes actifs de la chromatine ; -
l’élimination de l’ADN contaminant des extraits de protéines ou d’ARN et dans la création des
cassures (nicks) pour le marquage des ADN par nicktranslation.

La nucléase S1

C’est une enzyme qui dégrade spécifiquement les acides nucléiques simple-brin. Les ADN
bicaténaires et les hybrides ADN – ARN ne sont pas attaqués par la nucléase 1, seules leurs
209
parties simple – brin sont détruites. Cette enzyme est utilisée dans : - l’étude des hybrides
ADN – ARN ; - l’élimination des extrémités simple – brin d’un ADN double – brin (par
exemple après coupure par une enzyme de restriction produisant des bouts cohésifs) ; - la
suppression des boucles dans les synthèses d’ADNc ; - la détermination des origines de
transcription (S1 mapping) ; - la RNase de B cereus spécifique de CU.

L’exonucléase III

Il s’agit d’une enzyme qui catalyse l’hydrolyse séquentielle des nucléotides d’un ADN dans le
sens 3’ – 5’ à partir d’une extrémité 3’ – OH libre. En plus elle possède une activité 3’
phosphatase. Elle est utilisée dans la formation d’ADN simple – brin à partir d’une de ses
extrémités. Elle permet en conjugaison avec la nucléase 1 d’effectuer des délétions à des sites
définis dans un ADN. La Bal31 est une autre exonucléase ayant une double activité
exonucléasique 5’ – 3’ et 3’ – 5’. Elle produit des bouts francs et permet sans utilisation de la
nucléase S1 d’obtenir des délétions en des sites spécifiques.

Les RNases

Il existe deux types de RNases : la Rnase A et la RNase H. La RNase A est une enzyme très
active, ubiquitaire et particulièrement résistante. En effet cette enzyme n’est pas détruite par
un traitement d’une heure à 90°C. Elle hydrolyse les liaisons phosphodiesters qui unissent les
ribonucléotides des ARN. La coupure se fait spécifiquement après des pyrimidines seulement
si l’ARN est simple – brin. Cette enzyme est utilisée dans l’élimination des ARN dans les
préparations d’ADN ou de protéines et la détection des mismatches dans les hybrides ADN –
ARN.

La RNase H est une enzyme qui détruit l’ARN dans les hybrides ADN – ARN. Elle est utilisée
dans la destruction de l’ARN après transcription réverse en vue de la synthèse du second brin
d’ADNc et la détection des hybrides ADN – ARN. Parfois on utilise d’autres nucléases
comme : - RNase V1 et RNase III qui coupent des ARN double – brin ; - RNase T1 qui est
spécifique de G ; - RNase T2 qui est spécifique de AGCU ; - RNase U2 qui est spécifique de
A ; - RNase CL3 qui est spécifique de C ; - RNase Phy 1 qui est spécifique de AGU ; -
RNase Phy M qui est spécifique de AU ; - RNase de B. cereus qui est spécifique de CU.

La T4 polynucléotide kinase

C’est une enzyme extraite des bactéries infectées apr le phage T4. Elle transfère le phosphate
en ϓ d’un ATP sur le phosphate en 5’ d’un polynucléotide. Dans certaines conditions
expérimentales, la réaction peut être réversible, ce qui permet un échange de phosphate entre
le phosphate en ϓ d’un ATP et le phosphate en 5’ d’un polynucléotide, permettant ainsi
d’éviter l’étape de traitement du polynucléotide par la phosphatase. Cette enzyme est utilisée
dans le marquage en 5’ des polynucléotides en vue de déterminer la séquence d’un ADN (par
la méthode de Maxam et Gilbert), dans le criblage d’une banque avec un oligonucléotide et
dans l’hybridation avec une sonde oligonucléotidique.
210
La phosphatase alcaline

La phosphatase alcaline est une enzyme, extraite soit des bactéries soit de la muquese
intestinale des bovins. Elle retire le phosphate en 5’ sur les ADN, les ARN et les nucléotides
libres. L’hydolyse libère un phosphate inorganique et une extrémité 5’– OH. Elle est utilisée
dans l’émimination des phosphates en 5’ sur les acides nucléiques, ce qui empêche toute
action ultérieure de ligase. Ainsi lors d’un clonage, un vecteur ouvert par une enzyme de
restriction puis phosphatsé, ne pourra plus se refermer sur lui – même. Dans ce cas la
fermeture ne sera possible qu’en intégrant un ADN étranger qui aportera les extrémités 5’
phosphates nécessaires à l’action de la ligase.

6.3.4 INSERTION D’UN FRAGMENT D’ADN DANS UN VECTEUR

On part du principe selon lequel les fragments d’ADN d’origines différentes peuvent être
assemblés s’ils ont été obtenus par l’action d’une même endonucléase de restriction, générant
des extrémités cohésives complémentaires. De plus, le vecteur utilisé ne doit avoir qu’un seul
site de coupure pour la même endonucléase. Cela permet d’obtenir un mélange du fragment
d’ADN à insérer et du vecteur (coupé). Dans ce mélange, on trouve deux types de molécules :
les molécules du vecteur reconstitué (les deux fragments se sont réassociés) et les molécules
du vecteur recombinant, c’est-à-dire ayant inséré le fragment d’ADN étranger.

Les autres types de molécules sont appelés à disparaître, n’ayant pas une origine de
réplication. Le fragment d’ADN à insérer est obtenu par la digestion de l’ADN donneur au
moyen d’une endonucléase de restriction. De même, le vecteur ayant de préférence un seul
site de coupure est également digéré par la même endonucléase de restriction, générant des
extrémités cohésives complémentaires. Les deux types de molécules, c’est-à-dire le fragment
d’ADN du donneur et le vecteur linéarisé, sont ensuite mélangés dans un tube à essai. Une
ADN ligase est enfin ajoutée pour pouvoir établir des liaisons phosphodiesters au niveau des
jonctions entre fragments.

Lorsqu’un vecteur et un fragment d’ADN ayant des extrémités complémentaires sont


mélangés et liés par une ADN ligase, plusieurs types de molécules peuvent se former : a- des
fragments d’ADN liés entre eux, b- le vecteur circularisé et c- le vecteur ayant inséré un
fragment d’ADN, appelé vecteur recombinant. Les molécules du premier type ne sont pas
capables de se répliquer dans une bactérie puisqu’elles ne possèdent ni origine de réplication
ni gènes de la réplication. Les molécules des deux autres types peuvent bien se répliquer dans
une cellule bactérienne.

6.3.5 INTRODUCTION D’UN ADN VECTEUR


DANS UNE CELLULE HOTE

La manière d’introduire l’ADN du vecteur dans une cellule dépend de la nature du vecteur. Un
vecteur viral, par exemple, peut être introduit en utilisant sa capacité biologique d’infecter une
cellule hôte, c’est-à-dire par ce qu’on appelle injection virale, l’ADN recombinant d’un phage
dérivé du phage lambda par exemple peut être introduit dans une cellule hôte d’E. coli après
encapsidation in vitro lors de l’infection phagique. Un vecteur plasmidique, constitué d’un
211
ADN nu, est introduit dans une cellule hôte par transformation chimique. En fait, la
transformation bactérienne est un processus naturel qui se déroule dans certaines espèces de
bactéries Gram positives et qui consiste en une modification des caractères héréditaires suite à
l’incorporation d’un ADN exogène.

La transformation d’E. coli, bactérie Gram négative ou la transfection par un ADN nu, est au
contraire une méthode utilisée au laboratoire qui consiste à rendre les cellules compétentes
artificiellement, c’est-à-dire aptes à laisser pénétrer de l’ADN plasmidique. L’opération se
déroule en trois étapes : préparation des cellules compétentes, transformation des cellules
compétentes par le plasmide et sélection des transformants, c’est-à-dire les cellules ayant
incorporé un plasmide recombinant. Néanmoins, pour la réussite de l’opération, il faut se
rassurer au préalable que le vecteur plasmidique comporte un gène de résistance à
l’antibiotique utilisé comme marqueur de sélection des cellules transformées et que la souche
bactérienne utilisée soit sensible à cet antibiotique.

De plus, cette souche doit être déficiente en endonucléases de restriction et en système de


recombinaison. Le traitement classique pour rendre les cellules compétentes consiste à faire
séjourner les cellules dans une solution concentrée de chlorure de calcium à 4°C. Dans ces
conditions, les ions calcium altèrent les structures membranaires en créant des
microperforations dans la double couche phospholipidique, ce qui facilite la pénétration de
l’ADN plasmidique dans les cellules. Toutefois, pour un meilleur rendement de l’opération, il
est préférable d’utiliser les cellules en phase exponentielle de croissance, puisque dans les
cellules en division, les membranes en cours d’allongement sont plus fragiles.

La transformation consiste à ce que les cellules devenues compétentes sont laissées en contact
avec les molécules de plasmide à 4°C, puis à appliquer un choc thermique par une brève
incubation (1minute 30’ à 2 minutes) à 42°C, ce qui accentue la déstabilisation des couches
lipidiques et stimule la pénétration de l’ADN plasmidique. Pour une meilleure efficacité de
transformation, il est conseillé de prendre des vecteurs avec un minimum de cassures
mécaniques et d’utiliser de préférence des plasmides petits et compacts.

En outre, lors du séjour au chlorure de calcium et du choc thermique, la majorité de cellules


meurent ; seul un petit nombre de cellules restent viables. Dans cette suspension, les cellules
peuvent être réparties en trois groupes distincts : a- les cellules qui n’ont pas incorporé le
plasmide (non transformées), b- les cellules transformées par un plasmide natif et c- les
cellules transformées par le plasmide recombinant.

La sélection des cellules transformées consiste d’abord à incuber les cellules de 30 minutes à
une heure dans un milieu nutritif non sélectif. Pendant cette période, les cellules en phase de
latence ne se divisent pas, mais réparent leurs membranes. C’est à ce moment que les cellules
transformées commencent à synthétiser l’enzyme de résistance à l’antibiotique dont le gène se
trouve dans l’ADN plasmidique qui commence à se répliquer. Ensuite, des parties aliquots de
la suspension sont étalées sur un milieu gélosé additionné de l’antibiotique de manière à
inhiber la croissance des cellules non transformées (majoritaires en général) et à sélectionner
les clones transformants. Il est conseillé de maintenir la pression de sélection par
l’antibiotique pour éviter une perte progressive du plasmide au cours des divisions ultérieures.
212
En outre, les cellules compétentes peuvent être congelées en présence de glycérol ou de
DMSO.

Insertion d’un ADN étranger dans un vecteur

Elles peuvent être conservèes pendant trois mois à – 20°C ou un an à – 70°C sans diminution
importante de l’efficacité de transformation. Il convient de noter que des firmes spécialisées
commercialisent des cellules compétentes et que l’électrotransformation se substitue
progressivement à la transformation chimique dans les laboratoires. C’est une technique qui
permet d’obtenir une plus grande efficacité de transformation sans avoir à préparer des cellules
compétentes.

De nombreuses améliorations ont été apportées à la technique notamment : Plusieurs


modifications du protocole pour obtenir les cellules compétentes ont été proposées dans le but
d’augmenter l’efficacité de transfection -prolongation du temps de séjour en Ca Cl2 ;
- substitution au CaCl2 (ou l’addition) de combinaisons de différents cations divalents (Mg ,
++

Mn++, Rb++) ; - addition de chlorure d’hexaminecobalt ; - utilisation de DMSO


(diméthylsulfosyde). Les cellules compétentes peuvent être congelées en présence de glycérol
ou de DMSO.

L’efficacité de transformation dépend de plusieurs facteurs dont la nature de la souche, le


protocole pour obtenir les cellules compétentes, la taille et la conformation du vecteur
plasmidique. Ainsi avec certaines souches, en utilisant une combinaison d’ions divalents dont
RbCl2 ou DMSO, on peut obtenir jusqu’à 108 transformants par μg de pBR322 surenroulé.
Une entrée notable de l’ADN dans les cellules nécessite que celui-ci ne soit pas trop gros.
C’est pourquoi l’efficacité de transformation est d’autant plus grande que le plasmide est petit
et compact. Ainsi la forme relâchée du plasmide, moins compacte que la forme surenroulée,
pénètre plus difficilement dans les cellules. Il est important de disposer de vecteur avec un
minimum de cassures mécaniques pour obtenir une bonne efficacité de transformation. Avec
de gros plasmides, de taille supérieure à 15 kb, l’efficacité de transformation devient trop
faible.

L’avantage de la transformation réside dans son extrême simplicité de mise en œuvre. La


longueur de la manipulation d’obtention des cellules compétentes ne constitue plus un
handicap puisque ces cellules peuvent être congeléées. Certaines firmes spécialisées
213
commercialisent de telles cellules. L’inconvénient de la transformation tient à sa faible
efficacité. En fait, lors d’un clonage, on dispose généralement de très peu d’ADN source et
donc de très peu de vecteur recombinant. Or il faut obtenir un grand nombre de clones
transformants pour espérer pouvoir y détecter le clone hébergeant le vecteur recombiné avec le
fragment d’ADN recherché. C’est l’électrotransformation, en permettant d’obtenir une plus
grande efficacité de transformation sans avoir à préparer des cellules compétentes qui se
substitue progressivement à la transformation chimique au laboratoire.

6.3.6 DETECTION DE L’ADN RECOMBINANT

Les cellules transformées par le vecteur natif et celles transformées par le vecteur recombinant
peuvent être sélectionnées grâce aux marqueurs portés par le vecteur. En fait, les plasmides
comportent en général un ou plusieurs gènes de résistance aux antibiotiques. Le plasmide
pB322, par exemple, comporte un gène de résistance à la tétracycline (tetr) et un gène de
résistance à l’ampiciline (ampr). Il possède des sites de restriction BamHI et SalI situés sur le
gène tetr. Ce gène peut être inactivé par l’insertion d’un fragment d’ADN dans un de ces sites.
Les cellules contenant le vecteur recombinant dont le gène tet r est inactivé sont résistantes à
l’ampiciline mais sensibles à la tétracycline. C’est ce qu’on appelle inactivation par par
insertion. L’opération consiste d’abord à transformer des cellules compétentes par un mélange
des vecteurs natifs et des vecteurs recombinants ayant un fragment d’ADN inséré dans le site
BamHI du gène tetr. Ensuite ces cellules sont étalées sur un milieu contenant de l’ampiciline
pour sélectionner les cellules contenant le plasmide.

Plusieurs méthodes permettent de sélectionner les cellules contenant le vecteur recombinant.


L’une d’elles consiste à cultiver (étaler) les cellules transformées sur un milieu liquide
contenant de l’ampiciline, de la tétracycline et de la cyclosérine. En effet, la cyclosérine a la
propriété de tuer toutes les cellules en croissance. De ce fait, les cellules tet r et ampr, qui
commencent à se multiplier sur ce milieu sont tuées par la cyclosérine. Les cellules tets et
ampr, incapables de se multiplier sur ce milieu, sont épargnées de l’action de la cyclosérine et
pourront plus tard donner naissance à des colonies ampr une fois étalées sur un milieu ne
contenant que de l’ampiciline. En pratique, la transformation est utilisée seulement avec des
plasmides recombinants ne dépassant pas 15 Kb. En fait, les plasmides utilisés pour le
clonage ont des tailles de 2 à 5 Kb ; ce qui permet d’insérer un fragment d’ADN de 10 Kb.

La méthode est donc limitée au clonage des gènes procaryotes et de petits ADN
complémentaires eucaryotes. Pour des gros ADN, ont utilise généralement des vecteurs
phagiques et pour les gènes eucaryotes, on utilise des cosmides, comportant le site cos de
lambda (λ). L’ADN recombinant est alors introduit dans les cellules par injection après
adsorption du virus. Par la suite, l’ADN phagique entame un cycle lytique, tandis que le
cosmide se réplique comme un plasmide dans les cellules. Pour d’autres types de vecteurs,
l’identification des recombinants repose sur l’inactivation du gène de la β–galactosidase par
l’insertion d’un fragment d’ADN dans la phase codante du gène. Cette activité enzymatique
est facilement détectée en utilisant, à la place du substrat naturel qui est le lactose, un substrat
modifié qui se colore en bleu lorsqu’il est clivé par l’enzyme.
214
Il est donc facile de différencier les phénotypes lac+ (β–galactosidase active, colonies bleues)
et les phénotypes lac- (β–galactosidase inactive, colonies blanches). D’autres méthodes sont
utilisées pour contre sélectionner les plasmides non recombinants, comme par exemple
l’utilisation des queues d’homopolymères qui ne permettent pas la recircularisation du
plasmide. Dans ce cas en effet les 2 extrémités du plasmide possèdent les mêmes
homopolymères. Dans le cas des vecteurs de clonage dérivés du phage λ, la sélection des
clones recombinants repose sur une des propriétés fondamentales du système d’encapsidation
du phage. En effet, le système d’encapsidation n’est capable d’enpaqueter que des molécules
d’ADN dont la taille est proche ou égale à celle du phage sauvage, c’est-à-dire 50 kb. Cette
propriété a pu être utilisée pour construire des vecteurs de clonage grâce au fait que certains
gènes non essentiels au déroulement du cycle lytique sont regroupés dans la partie centrale de
la molécule d’ADN du phage. Cette partie centrale de l’ADN du phage peut donc être enlevée
et remplacée par un fragment d’ADN étranger de taille voisine, sans que le phage recombinant
ne perde sa capacité à infecter une bactérie et à s’y multiplier. La taille de la molécule
d’ADN recombinant doit seulement être voisine de celle du phage normal pour pouvoir être
encapsidée. Ces vecteurs sont appelés vecteurs de remplacement.

En pratique, l’ADN phagique utilisé n’est pas celui d’un phage λ sauvage, mais celui d’un
phage dont l’ADN a été modifié in vitro. Dans ces phages, la partie centrale est encadrée par le
(ou les) même site de restriction, comme EcoRI par exepmle. Noter que ce site n’existe pas
dans le reste de la molécule. La digestion totale de cet ADN par l’enzyme de restriction
EcoRI produit 3 fragments : un fragment correspondant à la partie centrale non essentielle et 2
fragments appelés les bras. Ces 3 fragments sont de tailles différentes, ils peuvent être séparés
par électrophorèse en gel d’agarose, ce qui permet de purifier les bras.

Ces bras sont ensuite mis en présence de fragments d’ADN obtenus par digestion par
l’enzyme EcoRI et le mélange est soumis à l’action de l’ADN ligase. Enfin ce mélange de
ligation est utilisé pour transformer les bactéries réceptrices. Au cours de cette ligation, il peut
se former 2 types de molécules : a- les 2 bras peuvent s’être réassociés sans insertion de
l’ADN à cloner, b- les 2 bras se sont associés à un fragment d’ADN à cloner pour former un
phage recombinant. Les molécules d’ADN de la première catégorie seront trop petites pour
pouvoir être encapsidées, elles ne donneront pas des phages infectieux. Le second type de
molécules aura une taille variable suivant la longueur du fragment d’ADN étrénger inséré.

Si cet ADN a une taille comprise entre 20 et 30% de la longueur totale de la molécule d’ADN
du vecteur (insertion de 10 à 20 kb dans le cas des vecteurs les plus courants), la molécule
recombinante pourra être encapsidée et donner naissance à des phages infectieux capables de
former des plages de lyse. Ainsi seules les molécules d’ADN recombinantes conduiront à la
formation des plages de lyse. Actuellement, les ADN phagiques recombinants ne sont plus
introduits dans les bactéries par transformation, mais ils sont encapsidés in vitro à l’aide des
protéines de capside purifiées et les particules phagiques ainsi obtenues sont utilisées pour
infecter des bactéries. Cette méthode est beaucoup plus efficace.
215
6.3.7 AMPLIFICATION DE L’ADN RECOMBINANT

Il convient de rappeler qu’une fois à l’intérieur de la cellule, le plasmide se réplique de façon


autonome puisqu’il possède une origine de réplication et que l’ADN du donneur porté par le
plasmide se réplique en même temps que le plasmide. A l’intérieur de la cellule, chaque
plasmide recombinant produira de nombreuses copies de lui-même. La cellule bactérienne
transformée subira de nombreux cycles de division cellulaire et chacune des cellules filles
portera un grand nombre de copies du plasmide recombinant. La colonie résultante contiendra
des milliards de copies de l’insert d’ADN donneur du départ. Cet ensemble de copies
amplifiées du fragment unique d’ADN donneur porte le nom de clone d’ADN.

6.3.8 CLONAGE D’UN GENE PAR COMPLEMENTATION


FONCTIONNELLE OU PAR EXPRESSION

Le plus souvent, le gragment d’ADN que l’on souhaite cloner n’est pas disponible sous une
forme purifiée. Ce fragment peut être contenu dans une population de fragments issus de la
digestion d’un ADN génomique. Il est néanmoins possible d’insérer ces différents fragments
dans un vesteur. Il faut ensuite disposer d’un crible de sélection permettant d’isoler le vecteur
portant le fragment que l’on souhaite cloner. La complémentation fonctionnelle d’une souche
mutante par un fragment d’ADN portant le gène fonctionnel correspondant a permis de cloner
un grand nombre de gènes. Le clonage du gène Leu, l’un des gènes bactériens impliqués dans
la voie de biosynthèse de la leucine par exemple. La première étape consiste à constituer une
collection de plasmides recombinants portant les différents fragments d’ADN d’une souche
bactérienne Leu+ (cette collection constitue une banque génomique). Ces plasmides sont
ensuite utilisés pour trnasformer une souche réceptrice Leu-. Les bactéries transformées sont
étalées sur un milieu sélectif dépourvu de leucine.

Sur ce milieu seules les bactéries ayant ayant un plasmide portant le gène Leu+ pourront se
multiplier et former des colonies. Ce type de sélection repose sur la complémentation
fonctionnelle d’une souche réceptrice mutante par un gène fonctionnel. Il est quelquefois
possible de complémenter des mutants bactériens par les gènes eucaryotes correspondants.
Ainsi un gène de biosynthèse de l’histidine de levure a pu être cloné pa complémentation des
mutants bactériens His-. Dans d’autres cas, ce type de sélection ne peut être utilisé, car le gène
qui devrait complémenter la souche mutante ne peut pas s’exprimer dans la cellule réceptrice.

D’autres méthodes peuvent être utilisées pour cloner un gène. Par exemple le gène que l’on
souhaite cloner peut- être portén par un fragment dont la taile est connue et qui peut être
facilement séparé des autres fragments par électrophorèse en gel d’agarose. Cette stratégie
n’est envisageable que si le nombre de fragments différents est très faible. De plus il est assez
rare de connaître avec précision l’emplacement d’un gène sur une molécule d’ADN. Un autre
type de sélection consiste à transformer un organisme par une banque génomique préparée à
partir d’un second organisme et à rechercher parmi les transformants ceux qui expriment une
fonction n’existant pas dans l’organisme transformé. Cette méthode a été utilisée pour cloner
un grand nombre de gènes eucaryotes.
216
Le plus souvent il n’est pas possible d’utiliser directement une banque génomique d’un
eucaryote pour transformer des bactéries, car les gènes eucaryotes sont assez rarement
capables de s’exprimer dans les bactéries. Ceci peut être dû à deux causes principales : soit ces
gènes ne sont pas transcrits, soit ils ne sont pas traduits en protéines fonctionnelles. Il faut
donc pouvoir placer la phase codante du gène à exprimer dans un contexte permettant son
expression dans la bactérie. C’est le cas par exemple du gène de l’ovalbumine du poulet, qui
ne s’exprime pas dans les bactéries, parce qu’il contient des introns que la bactérie n’est pas
capable d’épisser. Il faut donc débarrasser le gène de ses introns. Ce résultat peut être obtenu
en réalisant une copie ADN de l’ARNm de l’ovalbumine maturé (sans introns).

L’ARNm de l’ovalbumine représente la majeure partie des ARNm des cellules de poulet
spécialisées dans la production de l’ovalbumine. Ces ARNm peuvent servir de matrice pour la
synthèse d’un gène sans introns. La copie d’un ARNm en ADN est réalisée par une
transcriptase réverse qui est capable d’utiliser pour cette synthèse une matrice d’ARN simple
brin. Cette synthèse est réalisée en deux étapes : 1- la transcriptase réverse réalise une copie
de l’ARNm en une molécule d’ADN simple brin ; 2- l’ARNm est ensuite dégradé et l’ADN
simple brin restant est utilisé comme matrice pour synthétiser un second brin d’ADN
complémentaire à l’aide d’une ADN polymérase.

Cet ADN double brin, copie de l’ARNm, est appelé ADN complémentaire (ADN). Les ADNc
(qui ont des bouts francs) peuvent être insérer dans un vecteur de clonage à l’aide des
séquences de liaison. Le vecteur doit pouvoir à l’ADNc inséré, des séquences de type
promoteur et terminateur de transcription capables de fonctionner dans l’organisme qui
recevra le vecteur. Les bactéries transformées avec cette construction sont étalées sur un
milieu permettant de sélectionner les bactéries ayant reçu un plasmide. Les colonies
bactériennes pourront ensuite être testées pour leur capacité à produire l’ovalbumine.

6.3.9 CLONAGE D’UN GENE PAR HYBRIDATION MOLECULAIRE


OU PAR DETECTION IMMUNOLOGIQUE

La sélection d’un gène particulier n’est pas toujours possible par complémentation
fonctionnelle ou par la détection de son produit. Cette situation est souvent rencontrée lors du
clonage des gènes des eucaryotes, car ceux-ci ne s’expriment que faiblement ou pas du tout
dans les bactéries. De plus il est souvent assez difficile de purifier l’ARN ou le produit des
gènes eucaryotes. Par la suite, des systèmes de transformation d’écaryotes inférieurs (levures
ou champignons filamenteux) ont été développés, rendant possible le clonage des gènes
eucaryote directement chez un eucaryote. Néanmoins ces systèmes ne permettent pas encore
de résoudre tous les problèmes posés par l’expression des gènes eucaryotes. Cette technique
repose sur l’hybridation moléculaire et est appelée hybridation sur colonies ou hybridation in
situ. Pour utiliser cette technique, il est nécessaire de disposer d’un fragment d’ADN ou
d’ARN capable de s’apparier avec la séquence du gène que l’on cherche à cloner. Un tel
fragment d’acide nucléique est appelé une sonde moléculaire. Cette sonde peut être l’ARNm
correspondant au gène que l’on souhaite cloner. Ce peut être également un fragment de ce
gène permettant d’isoler un fragment d’ADN plus grand portant la totalité de la séquence du
gène.
217
En pratique les colonies issues de la transformation des bactéries par les plasmides
recombinants composant une banque génomique sont transférées sur une membrane en
nitrocellulose. Quelques bactéries restent à l’emplacement de chaque colonie sur la boîte. Les
bactéries fixées sur la membrane sont lysées et leur ADN dénaturé par un traitement à la soude
(NaOH). L’ADN dénaturé est ensuite fixé sur la membrane et ccelle-ci est mise en contact
avec la sonde moléculaire marquée radioactivement. Considérons un exemple où la sonde
moléculaire est un ARNm. L’ensemble est placé dans des conditions permettant la formation
d’hybrides ADN – ARN. Ensuite la membrane est lévée plusieurs fois pour enlever les ARN
non hybridés, puis elle est soumise à une autoradiographie. Les ARN radioactifs fixés vont
donner un signal positif d’hybridation permettant de localiser les colonies contenant le gène
recherché. Le même protocole expérimental peut être utilisé avec des phages recombinants.

La deuxième technique utilise un protocole expérimental dont les premières étapes sont très
proches de celui décrit précédemment. En effet il est possible de détecter imminologiquement
le produit du gène que l’on cherche à cloner dans des colonies bactériennes ou dans des plages
phagiques. Dans un premier temps, les colonies ou les plages de lyse sont transférées sur une
membrane permettant la fixation des protéines. Si le gène est traduit pendant la croissance
bactérienne ou pendant l’infection phagique, les protéines correspondantes pourront être fixées
sur la membrane, en mélange avec les protéines bactériennes. La présence du produit du gène
peut être révélée à l’aide d’anticorps marqués spécifiques de la protéine recherchée, ce qui
permettra d’identifier les colonies produisant cette protéine, c’est-à-dire celles qui contiennent
le gène que l’on souhaite cloner.

6.4 APPLICATIONS DE L’ADN RECOMBINANT

Au cours des années 1970 une nouvelle époque s’est ouverte pour la génétique : celle de la
recombinaison génétique in vitro appelée aussi ingénierie génétique ou génie génétique. Elle
permet de produire de nouvelles formes de vie inconnues dans la nature. Grâce à ces
techniques, on a pu transférer des gènes des mammifères dans les bactéries, lesquelles sont
ainsi devenues de minuscules usines pour la production, en quantités relativement importantes,
des protéines d’intérêt économique, des hormones ou des interférons. Ces protéines sont
produites chez l’homme en si faibles quantités que le coût de leur extraction des tissus et de
leur purification était très élevé, ce qui constitue un obstacle majeur pour leur usage médical
dans la prévention et le traitement des maladies. Les techniques du génie génétique fournissent
divers facteurs de coagulation du sang et d’autres substancces permettant par exemple de
corriger des déficiences génétiques et de traiter les affections qui en résultent.

Parmi les applications les plus prometteuses en biotechnologie on peut citer l'amélioration des
espèces animales et végétales, la production des protéines alimentaires et des carburants,
l'amélioration de l'environnement par bio-dégradation des substances toxiques, etc. Une firme
américaine a déjà mis sur le marché un nouveau microbe capable de dégrader le pétrole, qui
pourrait être utilisé pour le néttoyage biologique des déchets et des épandages pétrolièrs,
accidentels ou non, qui souillent et endommagent l’environnement.

Le génie génétique a également permis de construire des souches de bactéries capables de


synthétiser, à grande échelle et à moindre coût, des substances chimiques importantes
218
industriellement, comme l’alcool éthylique, des antibiotiques ou de protéines importantes
médicalement qu’il était impossible d’obstenir en grande quantités auparavant, comme
l’insuline humaine commercialisée qui est produite par des bctéries recombinées. On espère
également pouvoir insérer un jour dans le génome des céréales des gènes provenant des
bactéries fixatrices d’azote, ce qui permettrait à ces plantes d’utiliser directement les sources
illimitées d’azote atmosphérique et diminuerait considérablement la forte consommation
d’engrais azotés par l’agriculture moderne.

A l’heure actuelle, les principales utilisations du génie génétique sont les suivantes : 1. la
production des protéines d’intérêt médical et industriel ; 2. la création des souches
bactériennes capables de produire des molacules importantes économiquement ; 3. la
détermination des séquences primaires de nombreux gènes ainsi que leurs séquences de
régulation ; 4. la modification du patrimoine génétique des plantes ou d’animaux ; 5.
l’identificcation d’individus ou d’espèces par l’analyse de leur ADN ainsi que le diagnostic
d’agents infectieux ; 6. la correction des défauts génétiques chez les animaux.

6.4.1 UTILISATIONS EN RECHERCHE FONDAMENTALE

Les technologies du génie génétique se sont avérées être extrêmement utiles en recherche
fondamentale. Les techniques pour la construction des souches mutantes particulières ont
facilité l’obtention des mutations dans des gènes particuliers. Auparavant les mutants étaient
obtenus, soit spontanément et avec une faible fréquence, soit après une mutagenèse avec une
fréquence élevée. Ce type d’expérience est souvent assez laborieux, surtout si l’on ne dispose
pas de crible de sélection positif ou de méthode d’identification rapide des mutants. La
construction des souches possédant plusieurs mutations pouvait être réalisée par des
mutagenèses successives ou par recombinaison.

Les mutagenèses successives peuvent conduire à l’apparition des mutations délétères. De plus
la recombinaison n’est pas toujours possible, soit parce que les mutations que l’on souhaite
associer sont situées dans des régions où les événements de recombinaison sont rares, soit
parce qu’elles sont liées physiquement. Les techniques du génie génétique peuvent simplifier
la construction de telles souches. En effet il est possible d’introduire, dans une souche
réceptrice sélectionnée, un gène muté obtenu soit par clonage, soit par la modification in vitro
d’un gène sauvage cloné. Ces techniques sont regroupées sous le terme de mutagenèse dirigée.

Le génie génétique a permis le développement des études sur la structure et la régulation des
gènes eucaryotes. Ainsi il a été posssible de modifier in vitro des séquences de régulation d’un
certain nombre de gènes eucaryotes puis d’étudier l’effet de ces mutations sur l’expression du
gène in vivo, comme cela avait déjà été réalisé chez les bactéries à l’aide des techniques du
génie génétique. Il a également été possible de mesurer le niveau de transcription d’un gène
donné dans différentes conditions de culture, grâce aux techniques d’hybridation moléculaire
sur les ARNm intracellulaires. De telles expériences nécessitent le clonage du gène que l’on
souhaite étudier.

Ces techniques permettent d’étudier la régulation de la transcription d’un gène ainsi que de
mesurer la cinétique d’apparition de ses ARNm. La sonde moléculaire utilisée est en général
219
un plasmide portant la totalité ou un fragment du gène étudié. Le vecteur seul, composé le plus
souvent des séquences d’ADN procaryotiques, ne s’apparie en général pas avec les ARNm des
cellules eucaryotes. L’hybridation du vecteur recombinant sera donc spécifique du gène
introduit dans le vecteur.

6.4.2 APPLICATIONS INDUSTRIELLES DES


MANIPULATIONS GENETIQUES

Les bactéries dans leur ensemble sont capables de réaliser une grande variété de réactions
chimiques, cependant chaque espèce individuellement n’en réalise qu’un nombre assez limité.
Le génie génétique permet de créer des souches combinant les caractéristiques de plusieurs
espèces bactériennes. Il a par exemple été possible de construire in vitro un plasmide portant
des gènes issus de plusieurs bactéries conférant à la bactérie qui le porte la capacité de
métaboliser le pétrole. Ce plasmide a été introduit dans une espèce de bactérie marine qui a été
utilisée dans des opérations de nettoyage des mers polluées. Le génie génétique a également
permis de construire des souches bactériennes capables de synthétiser, à grande échelle et à
moindre coût, des substances chimiques importantes industriellement, comme l’alcool
éthylique, des antibiotiques ou des protéines importantes médicalement qu’il était impossible
d’obtenir en grande quantité auparavant. L’insuline humaine commercialisée par exemple est
produite par les bactéries recombinées.

Les plantes peuvent également être modifiées génétiquement par l’introduction des gènes
d’autres organimes grâce à la bactérie Agrobacterium tumefaciens ou par la transformation des
protoplastes par des vecteurs recombinants. Ces applications sont encore à leurs balbutiements
mais elles ont déjà permis d’introduire dans un certain nombre d’espèces végétales comme le
tabac, la tomate, la betterave, etc, des gènes de résistance à des herbicides capables de protéger
la plante transgénique lors des traitements des cultures par ces produits. Il a également été
possible d’introduire le gène de la protéine insecticide de la bactérie Bacillus thurigiensis chez
le tabac, ce qui l’a rendu résistant à certaines chenilles d’insectes. La recherche des plantes
résistantes aux virus semble commencer à porter des fruits, tout au moins chez le tabac et la
tomate.

La première expérience pratique de génie génétique a été réalisée en 1977 par Herbert Boyer
sous les auspices d’une entreprise commerciale dénommée « Genentech » (Genetic
Engineering Technology). Elle consistait à doter les bactéries d’un gène humain, celui d’une
hormone, la somatostatine. Cette hormone est normalement sécrétée par l’hypothalamus et
inhibe la libération de l’hormone de croissance par l’hypophyse. La somatostatine peut être
utile pour certaines personnes souffrant d’acromégalie, c’est-à-dire d’une grande taille et d’un
développement excessif des mâchoires, des pieds et des mains, par suite d’un excès
pathologique de sécrétion d’hormone de croissance ainsi que certains diabétiques chez qui un
excès d’hormone de croissance constitue un facteur aggravant.

Genentech pouvait ainsi obtenir dans des cultures des bactéries manipulées quelques
milligrammes de somatostatine humaine en peu de temps, alors qu’il a fallu à Roger
Guillemin, le découvreur de cette hormone chez le mouton, plus de 500.000 cervelles de
mouton pour extraire la même quantité. En effet une bactérie comme E. coli peut se
220
reproduire au bout de 20 minutes. Même si un seul individu a, au départ, intégré le gène de la
somatostatine dans son patrimoins génétique, au bout d’une dizaine d’heures, il a donné
naissance à plus d’un milliard de descendants, chacun hébergeant le gène en question et
produisant quelques molécules de l’hormone. Ainsi le nombre de bactéries porteuses du gène
greffé devient astonomique et on conçoit que même avec des volumes pas très importants, il
est possible de récupérer quelques milligrammes de somatostatine.

A fortiori on pouvait imaginer que les cultures bactériennes développées à l’échelle


industrielle dans de grands récipients appelés fermenteurs (1000 à 100.000 litres), comme le
fait l’industrie pharmaceutique pour la production des antibiotiques par exemple, pouvaient
facilement être la source d’une production en masse de l’hormone. En 1978, Genentech obtint
la production de l’insuline humaine par les bactéries manipulées pour soigner le diabète. En
1979, elle obtint la production de l’hormone de croissance humaine, utilisée pour soigner le
nanisme. En janvier 1980, la firme Biogen obtint la production d’interféron par des bactéries
manipulées. L’interféron est une substance protéique qui apparaît dans les cellules au cours
des infections virales et qui s’oppose au développement de virus très divers.

Deux mois plutôt, une équipe japonaise, conduite par T. Taniguchi, avait annoncé être
parvenue aussi à isoler et cloner le gène de l’interféron dans les colibacilles. Au milieu des
années 1980, il y a plus d’une centaine de firmes biotechnologiques autonomes aux USA. Si
l’on compte, outre ces firmes nouvelles, les grandes firmes oeuvrant depuis longtemps dans les
domaines divers, comme la chimie, le pétrole, etc, et qui ce sont dotées d’un département de
génie génétique, alors c’est plus de 300 firmes aus USA et plus de 500 dans le monde qui
s’appuient à présent sur les méthodes modernes de biotechnologie.

En théorie le génie génétique peut conduire à une plétore de nouveaux médicaments par une
stratégie très simple : toute substance biologiquement active (et de nature protéique) fabriquée
naturellement par les cellules du corps peut être produite par des bactéries, dès lors qu’on est
en mesure de leur greffer le gène correspondant. Parmi les produits à potentialités
pharmaceutiques actuellement obtenus par génie génétique, on peut distinguer 2 catégories de
substances : les unes sont destinées à suppléer un manque chez les individus atteints de
maladies. C’est le cas de l’insuline, hormone dont l’absence provoque le diabète ou de
l’hormone de coissance dont l’absence chez les enfants conduit au nanisme. Les autres font
partie des défenses naturelles du corps et tout individu en produit de petites quantités dans ses
cellules.

Jusqu’ici l’insuline administrée aux diabétiques était extraite de pancréas de porc. Or l’insuline
de porc et de bœuf ne sont pas exactement identiques à l’insuline humaine. Quoique
généralement bien tolérées elles suscitent des réactions immunitaires gênantes chez un petit
nombre de patients à qui on les injecte. L’insuline de bœuf diffère de l’insuline humaine au
niveau de 3 acides aminés dans sa formule chimique, tandis que l’insuline de porc diffère de
l’insuline humaine par un seula acide aminé. La capacité d’une molécule à susciter une
réaction immunologique dépend du degré auquel elle paraît étrangère à l’organisme.

Les hormones de croissance animales n’ont tout simplement pas d’effets chez les humains.
Pour cette raison, l’hormone de croissance utilisée pour soigner les enfants atteints de nanisme
221
provenait jusqu’ici d’hypophyses prélevées sur des cadavres humains. Pour soigner un enfant,
il faut à peu près une hypophyse par semaine, pendant 10 ans. Dans ces conditions, disposer
d’une source d’hormone de croissance était particulièrement intéressant. C’est ce qu’offrait le
génie génétique. Ainsi après l’insuline, l’hormone de croissance humaine fut le 2e produit issu
du génie génétique à être mis sur le marché.

Parmi les substances biologiques dont manquent certains malades, il y a ce qu’on appelle les
facteurs de coagulation du sang. En effet lors d’une blessure, du sang s’échappe des vaisseaux
lésés, mais la brèche faite aux parois des vaisseaux est normalement colmatée en quelques
minutes par un callot. Celui–ci se forme à partir des protéines fibreuses contenues dans le sang
et qui s’agglomèrent sous l’action des substances protéiniques contenues aussi dans le sang,
les facteurs de coagulation. Il en existe une douzaine de variétés différentes, chacune d’elles
est nécessaire au processus de coagulation. Certains individus, par suite d’un déficit
héréditaire, ne fabriquent pas les facteurs n° VIII ou n° IX. Ils sont donc hémophiles. Ils ne
sont pratiquement pas capables de faire un caillot et la moindre blessure, la moindre lésion
représente pour eux un danger d’hémorragie sévère. On peut les soigner par des transfusions
répétéées de sang, leur apportant ainsi le facteur dont ils manquent ou leur administer
directement les facteurs purifiés extraits des dons de sang. Mais ceux-ci sont parfois
contaminés par des virus tels que ceux de l’hépatite B ou même du SIDA. La production du
facteur VIII par génie génétique a eu lieu aux USA en 1983 par Genentech et celle du facteur
IX en 1984 pa Trasgène en France. Le gène de l’α – antitrypsine a été isolé en 1979 par
transgenèse pour la production en masse de cette protéine par génie génétique.

L’α– antitrypsine est une enzyme circulant normalement dans le sang et qui inhibe une autre
enzyme, l’élastase. Celle-ci, sécrétée dans certaines circonstances par les globules blancs a
pour propriétés d’attaquer et de dégrader les tissus conjonctifs et notamment ceux des
poumons. Certains individus présentent une anomalie héréditaire, de sorte que leur α –
antitrypsine est non fonctionnelle. Leur élastase n’est donc pas inhibée et par suite, ils sont
atteints d’emphysème pulmonaire, une maladie caractérisée par des alvéoles pulmonaires
agrandies, entraînant une insuffisance respiratoire. L’emphysème consiste à un gonflement
produit par une infiltration anormale d’un gaz dans le tissu cellulaire (surtout du poumon).

Jusqu’alors la mise au point des médicaments dans l’industrie pharmaceutique avait souvent
pour point de départ des substances provenant du règne végétal. Dans beaucoupc de cas, ces
substances avaient tiré l’attention des médecins, des chimistes, des fabricants, car elles étaient
à la base d’anciens remèdes de bonnes femmes ou des guérisseurs. A présent, sur base des
découvertes de la biologie moléculaire, il est possible de prendre comme source de
médicaments non plus le règne végétal, mais les défenses et les réparations naturelles du corps
elles – mêmes. En effet on s’aperçoit finalement que l’organisme dispose potentiellement des
moyens de surmonter la plupart des agressions et de se réparer lui- même.

Ces moyens sont tout simplement des substances sécrétées par tel ou tel groupe de cellules à
des moments déterminés. La stratégie de cette nouvelle pharmacologie consiste dans un
premier temps à repérer quelles sont les substancces fabriquées naturellement par l’organisme
pour se défendre et se réparer. Dans un deuxième temps, il s’agit d’isoler le gène
222
correspondant à l’une de ces substances et de le cloner. On le transplante ensuite dans des
colonies bacériennes (ou de levure) pour leur faire produire en masse la substance en question.

Interféron

On sait que les virus agressent un organisme en pénétrant au sein de ses cellules. En
détournant à leur profit le métabolisme cellulaire, ils se multiplient en détruisant les cellules
parasitées. Mais auparavant ces cellules auront synthétisé de l’interféron. Elles – mêmes ne
seront pas sauvées mais l’interféron diffusera vers les cellules voisines. Celles – ci se
trouveront alors capables de résister à l’attaque du virus, cherchant à se propager à de
nouvelles cellules. C’est de cette façon que l’infection virale peut être rayée, mais ceci ne se
produit que dans le meilleur des cas. On peut succomber à l’attaque d’un virus dès lors qu’on a
pas produit assez d’interférons. L’interféron peut aussi être utile en thérapeutique
anticancéreuse. Il a été observé que l’administration de l’interféron à des souris atteintes de
divserses sortes de cancer prolongeait nettement leur survie.

Diverses équipes avaient réussi à faire produire des quantités notables par des cultures
cellulaires de globules blancs ou des fibroblastes. Mais les préparations d’interféron ainsi
obtenues restaient extrêmement impures (environ 1% d’interféron et 99% d’impureté) et fort
coûteuses (+/- 50 millions de dollars le gramme). D’où la nécessité de mettre au point une
nouvelle méthode de production d’interférons. Ce qui fut fait en 1979 – 1980, la production de
l’interféron par génie génétique par la firme Biogen, puis par Genentech et par des chercheurs
japonais. Il existe plusieurs classes d’interféron dénommées alpha, bêta et gamma. La classe
alpha comptant au moins une douzaine de sous-types. A part les cas de quelques cancers,
l’interféron alpha peut être utilisé dans le traitement des infections à virus comme l’hépatite
virale ou les éruptions cutanées provoquées par les virus herpès, rhume, ….

Interleukine – 2

C’est une substance normalement sécrétée par certaines cellules du système immunitaire. On
sait que les macrophages détruisent les microbes par phagocytose, que les lymphocytes B
sécrètent des anticorps, qu’il existe diverses catégories de lymphocytes T dont les lymphocytes
T tueurs, c’est-à-dire capables de tuer directement les cellules infectées par un virus à la suite
d’une sorte d’accolade meurtrière (le baiser tueur) entre les lymphocytes T tueurs et la cellule
cible. Une autre catégorie de lymphocytes, les lymphocytes T auxiliaires, sécrètent
l’interleukine–2. Celle – ci stimule la multiplication en grand nombre de lymphocytes T
tueurs. Le gène de l’interleukine – 2 a été cloné en 1983 par l’équipe japonaise de T.
Tanigushi d’abord et par les autres firmes après.

Facteur de nécrose des tumeurs

Ce facteur est sécrété par les macrophages et les cellules souches de lymphocytes. Il a été
découvert en 1975 et cloné en 1985 par les firmes Genentech, Cetus, Biogen et la firme
chimique japonaise Asahi. Le facteur de nécrose des tumeurs s’est révélé très efficace contre
les tumeurs sous-cutanées chez la souris. Par ailleurs, l’interféron gamma paraît augmenter
notablement l’action de cette substance, comme celle de l’interleukine – 2. A part le cancer,
223
d’autres maladies vont pouvoir bénéficier de nouvelles thérapeutiques grâce à l’indentification
des substances naturellement produites par l’organisme. C’est le cas : 1- de l’activateur
tissulaire du plasmogène (substance produite naturellement par l’organisme pour dissoudre les
caillots sanguins), utilisé lors des crises cardiaques (infarctus) ; 2- du facteur de croissance de
lymphocytes B ; 3- des facteurs des stimulations des colonies des substances qui stimulent les
macrophages) ; etc.

Utilisation des virus animaux

Il existe de nombreux rétrovirus dont certains sont capables de se multiplier dans les cellules
humaines, comme HIV, hépatite viral, certains rétrovirus de souris. Ces organismes, s’ils ne
sont pas pathogènes, peuvent servir de vecteurs pour introduire un gène dans les cellules
humaines. Deux aspects de ce problème sont à considérer : 1. Les rétrovirus peuvent contenir
un gène (gène tumoral provenant généralement de la cellule hôte) susceptible d’induire une
multiplication non contrôlée des cellules hôtes ; 2. Les rétrovirus peuvent également activer
un gène cellulaire contrôlant la division cellulaire en s’insérant à sa proximité. Dans les 2 cas,
cela entraîne l’apparition des tumeurs. Il est donc nécessaire d’enlever, dans le premier cas, les
gènes tumoraux et dans le second cas, les séquences capables d’activer les gènes situés à
proximité du site d’intégration avant d’utiliser ces rétrovirus comme vecteurs de clonage.

Les vecteurs dérivés des rétrovirus sont construits à partir de l’ADNc (obtenu par la copie de
l’ARN viral) dans lequel le gène étudié est intégré. Puis cet ADN recombiné est introduit par
transformation dans des cellules animales. L’ADN viral s’intègre, avec une certaine fréquence,
de manière stable dans les chromosomes des cellules. Des expériences de ce type ont été
réalisées en culture avec des cellules humaines. Des cellules prélevées sur un patient atteint
du syndrome de Lesch – nyhan, c’est-à-dire des cellules incapables de synthétiser les purines,
ont été transformées par un mélange d’ADN recombinant. Des lignées cellulaires transformées
ont été sélectionnées par leur capacité à synthétiser des purines.

Cette technique pourrait, en théorie, être appliquée à des cellules prélevées chez des individus
porteurs d’autres maladies héréditaires comme le diabète (restauration de la production
d’insuline). Cette stratégie est appelée thérapie génique. La thérapie génique pose encore de
nombreux problèmes pratiques et déontologiques comme l’assurance que le rétrovirus modifié
ne pourra pas redevenir pathogène après recombinaison avec des rétrovirus non infectieux
présents dans le génome des cellules. De plus le site d’intégration du vecteur rétroviral dans le
génome de la cellule n’est pas encore totalement contrôlé. Une mauvaise intégration pourrait
conduire, chez les cellules transformées, à l’apparition des désordres plus importants que ceux
provoqués par l’anomalie génétique que l’on tante de corriger.

L’influence du contexte génétique sur la régulation et les niveaux d’expression du gène inséré
n’est pas encore maîtrisée. Il est également possible de faire produire à des cellules animales
de grandes quantités d’une protéine animale en augmentant par transformation le nombre de
copies du gène correspondant. Le gène de la β – globine du lapin, par exemple, a été introduit
dans le virus SV40, qui se développe dans les cellules du singe et produit un très grand
nombre d’ADN viral au cours de son cycle infectieux. L’ADN hybride SV40/β–globine a été
224
introduit dans les cellules rénales de singes. Celles-ci sont devenues capables de produire de
grandes quantités de β – globine.

Les virus animaux peuvent aussi être utilisés pour créer des vaccins artificiels. Ainsi le virus
de la vaccine, peu pathogène pour l’homme et déjà utilisé avec succès pour la vaccination
contre la variole, a été modifié afin de pouvoir y introduire les gènes des protéines
d’enveloppes d’autres virus pathogènes, comme celui de l’hépatite virale. Dans ce cas le
virus recombinant permet la production des protéines du second virus dans les cellules
infectées. Les individus vaccinés par ce virus recombinant ont été simultanément immunisés
contre le virus de la variole et contre celui de l’hépatite. Cette nouvelle technique de
production des veccins est en cours de développement dans de nombreux laboratoires
pharmaceutiques.

Production des proteines eucaryotes

La production à grandes quantités des protéines particulières, difficiles à obtenir, est une de
plus importantes applications du génie génétique. Le gène codant pour la protéine désirée doit
d’abord être cloné et placé sous le contrôle d’un promoteur bactérien. Deux types de vecteurs
sont utilisés : des plasmides à grand nombre de copies et des phages hautement réplicatifs.
Dans les deux cas, les cellules recombinantes contiennent un grand nombre de copies du gène,
ce qui doit permettre d’obtenir un niveau de production tel que la protéine désirée peut
représenter 1 à 5% des protéines totales. En pratique, la production d’une protéine procaryote
ne pose aucun problème, mais la production des protéines eucaryotes est plus délicate. En effet
plusieurs problèmes peuvent se présenter :

1. Les promoteurs eucaryotes ne sont pas reconnus par les ARN polymérases bactériennes ; 2.
Les ARN eucaryotes ne sont pas toujours traduits par les ribosomes bactériens et de plus, ils
contiennent souvent des introns ; 3. Les protéines eucaryotes doivent souvent être modifiées
après leur synthèse, ce que la bactérie n’est pas capable de faire ; 4. Les protéines eucaryotes
peuvent être reconnues comme des corps étrangers par les protéases de la bactérie et être
dégradées. Plusieurs approches sont possibles pour résoudre chacun de ces problèmes. L’une
d’elles consiste à utiliser comme cellule réceptrice, une cellule eucaryote susceptible d’être
multipliée industiellement comme la levure ou certains champignons filamenteux. La levure
semble être un bon candidat car cet organisme est unicellulaire et peut se multiplier très
facilement. De plus les techniques du génie génétique ont été développées chez cet organisme
depuis longtemps et avec succès.

Une autre approche consiste à utiliser un plasmide portant un fragment du gène lac Z composé
du promoteur et d’une partie de la phase codante. Celle-ci se termine par un ou plusieurs sites
pour les enzymes de restriction. Le gène codant pour la protéine désirée doit être débarrassé,
avant son intégration dans le vecteur, des séquences promotrices et de ses introns. A cette fin il
est possible d’utiliser un ADNc ou un ADN synthétique dans le cas de petits peptides. Ce type
de construction conduit à la synthèse d’une protéine hybride possédant l’extrémité NH2
terminale de la β – galactosidase qui pourra être clivée afin de libérer la protéine eucaryote.
Cette stratégie a été utilisée avec succès pour la production d’une hormone polypeptidique de
225
14 acides aminés, la somatostatine, qui est normalement synthétisée dans l’hypothalamus des
mammifères.

Production des proteines humaines à but therapeutique

L'expression phénotypique biologique des maladies héréditaires est la perte de fonction ou


l'absence d'une protéine. Le plus souvent le traitement ne peut être que substitutif, ce qui
implique de disposer de grandes quantités de la protéine de remplacement. Dans tous les cas il
est préférable d'administrer une protéine d'origine humaine, ce qui pose à la fois des problèmes
de disponibilité et de contamination. L'exemple de l'hémophilie A est très significatif. Les
quantités de sang nécessaires à la préparation du facteur VIII sont considérables et peuvent
parfois dépasser la disponibilité momentanée. Les firmes multinationales sont contraintes de
se procurer le sang par prélèvement rétribué, principalement dans les populations les plus
défavorisées, ce qui ne manque pas de poser des problèmes moraux et augmente les risques de
contamination virale des dérivés sanguins produits. La production du facteur VIII nécessite le
regroupement de centaines voire de milliers de prélèvements, ce qui augmente de manière
considérable le risque de contamination virale, même si le virus est très peu répandu. C'est ce
qui explique que les hémophiles ont été les principales victimes de l'hépatite B et qu’ils sont
maintenant plus de 50 % à être séro-positifs pour le HIV (virus du SIDA).

Depuis octobre 1985 cepedant, on procède à une inactivation du HIV par traitement
thermique. Un autre exemple de contamination par un virus humain est celui des préparations
d'hormone de croissance à partir d'hypophyses humaines qui ont été responsables de maladie
de Creutzfeldt-Jakob. Pour d'autres maladies comme le diabète, les problèmes ne viennent
pas de la contamination mais de l'impossibilité d'obtenir des préparations de la protéine de
substitution d'origine humaine. L'injection de protéines hétérologues est toujours
potentiellement immunogène. Tant que la génothérapie ne sera pas une réalité, la
thérapeutique substitutive gardera une place prépondérante. La production par les techniques
du génie génétique est la solution idéale puisque les problèmes de disponibilité sont supprimés
et les risques de contamination considérablement diminués.

Production des vaccins

Le principe de la vaccination est d'injecter à l'individu l'agent pathogène soit tué, soit
complètement atténué. Il en résulte une réaction immunitaire qui ultérieurement protégera
l'individu contre toute infection par l'agent pathogène correspondant. Dans la majorité des cas,
les vaccinations ne posent pas de problèmes et sont sans risques. Lorsque l'agent pathogène
atténué est instable ou peu immunogène, ou lorsqu'il n'existe pas d'autre hôte que l'homme
(hépatite B, SIDA), la biologie moléculaire peut, en théorie, apporter une solution
satisfaisante. La stratégie est fondée sur le fait que la réaction immunitaire ne nécessite pas la
présence du virus complet mais simplement d'antigènes viraux, qui sont le plus souvent des
antigènes de surface (capside, enveloppe). La solution consiste à produire par les techniques
du génie génétique les seules protéines ou fractions de protéines virales nécessaires à
l'induction d'une réaction immunitaire.

Pour certains virus comme le virus du SIDA, le problème est plus complexe. Cela est du au
226
fait qu'une des caractéristiques des virus, et surtout des rétrovirus, est d'évoluer à une très
grande vitesse, rendant par là complètement inefficaces les tentatives d'immunisation. La
solution consiste à choisir de produire un antigène à la fois suffisamment accessible pour être
reconnu par le système immunitaire et suffisamment indispensable au virus pour que le gène
soit stable (séquences conservées). Dans d'autres cas la manipulation du gène de l'antigène
permettra de produire des molécules plus immunogènes, pour lesquelles la variation dans le
temps peut être éventuellement prévue (synthèse d'une série d'antigènes possédant chacun
l'une des mutations prévisibles). Compte tenu de sa souplesse, de sa puissance et de sa
spécificité, le génie génétique est le seul moyen d'aborder ces problèmes qui seraient demeurés
insurmontables avec les moyens classiques.

Production des bio-réactifs

Les bio-réactifs (enzymes, protéines, etc,) sont de plus en plus utilisés et sont devenus le poste
principal dans le prix de revient des dosages classiques de routine, et à fortiori dans les
analyses par les techniques de biologie moléculaire. En ce qui concerne la production des
protéines, qu'elles soient enzymatiques ou non, le clonage de leurs gènes et leur production
massive par des micro-organismes est la solution indiquée. Les enzymes de restriction et les
enzymes de modification du DNA sont l'un des exemples les plus frappants, leur production
après clonage s'étant traduite par une diminution spectaculaire du prix de vente.

Production par les bactéries

Les premières stratégies de production de protéines humaines par les techniques du génie
génétique ont fait appel aux vecteurs d'expression, avec comme hôte les bactéries. Cette voie
d'approche a permis de produire un certain nombre de protéines. Les stratégies employées
étant le plus souvent spécifiques de la protéine produite, seulement le principe général utilisé
sera décrit. La première étape consiste à construire un vecteur d'expression bactérien. Il est
constitué à la base d'un plasmide à reproduction la plus rapide possible et susceptible de se
maintenir en un très grand nombre de copies dans la bactérie. On lui ajoute un promoteur.
Trois promoteurs ont été principalement utilisés : les promoteurs des gènes lacZ (β-
galactosidase), trp (opéron tryptophane) et β- lactamase (gène de résistance à l'ampicilline).

Pour pouvoir être utilisé le promoteur lac doit être muté (mutation UV5) afin que la répression
catabolique ne puisse s'exercer. Pour des raisons stratégiques, le début de la partie codante de
la protéine naturellement associée au promoteur est conservé. Le gène de la protéine à
produire est ligaturé à ce promoteur. On utilise pour cela des linkers qui permettent d'insérer le
gène dans les trois phases de lecture possibles. Il peut enfin être ajoutées des séquences qui
amélioreront le rendement, dont la nature précise est jalousement tenue secrète par les
compagnies.

Dans une deuxième étape, le vecteur est intégré dans les bactéries. Celles qui synthétisent
correctement la protéine sont sélectionnées. Ces « bonnes » bactéries sont cultivées en
fermenteur à grande échelle. La protéine est enfin purifiée à partir du surnageant de culture s'il
s'agit d'une protéine sécrétée, ou à partir des bactéries dans le cas contraire. Cette stratégie
227
simple ne va pas sans poser des problèmes. L'un d'entre eux est celui de l'efficacité de la
production par la bactérie. Pour l'améliorer, il est possible de jouer sur le promoteur, les
séquences non traduites en amont et en aval ainsi que sur la nature des codons utilisés dans la
partie codante. La force des promoteurs bactériens naturels est relativement faible. Une série
de mutations, mais surtout de petites délétions au sein du promoteur ont permis dans certains
cas d'obtenir une efficacité de transcription augmentée d'un facteur qui peut atteindre dix.

Les parties non codantes du mRNA synthétisé peuvent s'avérer inhibitrices (phénomène de
type atténuation). Des délétions ou des ajouts de séquences dans les parties non codantes
peuvent parfois améliorer les rendements de production. Enfin la vitesse de traduction est
fonction des codons utilisés. Le code génétique étant dégénéré, un même acide aminé peut
être codé par plusieurs codons, mais les concentrations dans le cytoplasme des tRNA
correspondants ne sont pas identiques et peuvent devenir un facteur limitant dans la vitesse de
traduction. Pour y pallier, lorsque la protéine n'est pas trop grande, un gène synthétique est
utilisé à la place du gène naturel. Les codons choisis sont ceux pour lesquels la bactérie
possède le plus de tRNA, optimisant par là la vitesse de traduction. Le second problème est
celui des réactions de la bactérie vis-à-vis de la protéine synthétisée qui est hétérologue. En
effet la plupart des protéines étrangères que l'on fait synthétiser par la bactérie sont
protéolysées très rapidement (en 2 minutes pour l'insuline par exemple). Deux solutions ont
été apportées à ce problème :

a. la première consiste à produire non pas la protéine elle-même, mais une protéine de fusion,
qui est constituée de la protéine désirée et de l'extrémité N terminale de la protéine bactérienne
correspondant au promoteur utilisé. Cet artifice a pour effet d'augmenter considérablement la
durée de vie du produit synthétisé. L'inconvénient majeur de cette technique est que la portion
bactérienne de la protéine de fusion doit être excisée, ce qui est le plus souvent assez difficile ;
b. la seconde solution consiste à utiliser des bactéries mutantes qui ne possèdent plus l'activité
protéolytique responsable de la dégradation rapide des produits de traduction hétérologues.
Mais les problèmes peuvent aussi provenir de la protéine elle-même. Par exemple si la
traduction est très efficace et que la protéine n'est pas sécrétée, les quantités qui s'accumulent
dans la bactérie peuvent être telles que la protéine synthétisée précipite ou cristallise entraînant
la mort de la bactérie.

Une dernière difficulté concerne la récupération de la protéine produite qui n'est en général
jamais spontanément sécrétée. En dehors des problèmes de précipitation intra-bactérienne
déjà évoqués, l'inconvénient majeur est que les rendements sont de toutes manières très faibles
puisque la bactérie ne peut pas produire plus de protéines qu'elle ne peut en contenir, ce qui
représente un volume très faible par rapport à ce qu'il serait si la protéine était sécrétée. La
solution consiste à ajouter en 5' de la partie codante une courte séquence qui permettra au
produit de traduction d'être reconnu par la bactérie comme devant être sécrété (équivalent du
peptide signal). L'inconvénient de cette technique est encore une fois la nécessité d'exciser
cette séquence une fois la protéine récupérée.
228
Production par les cellules eucaryotes

La stratégie de production par les bactéries qui vient d'être décrite n'est envisageable que pour
les protéines qui ne doivent pas être modifiées après traduction pour être actives
(glycosylation, γ-carboxylation",…), puisque les bactéries ne possèdent pas l'arsenal
enzymatique nécessaire à ces transformations. Dans le cas contraire il faut avoir recours à la
production par les cellules eucaryotes, ce qui est infiniment plus complexe et coûteux. De
manière schématique, la stratégie classique consiste à construire un vecteur susceptible de se
propager en un grand nombre de copies chez les eucaryotes. Il doit être construit de telle sorte
que le taux de transcription soit maximal. En dehors du gène à exprimer il doit donc contenir
au minimum un promoteur fort et une séquence stimulatrice de transcription (enhancer).

Le gène à exprimer peut aussi être optimisé. Pour cela les séquences non indispensables à la
fonction de la protéine sont excisées. Ainsi pour le facteur VIII, il a été démontré que la
délétion du domaine B presque entier était sans aucun retentissement sur l'activité de la
protéine produite. Ceci a permis de réduire de quelques kba le cDNA utilisé pour la
production et d'obtenir par là de meilleurs rendements. Les séquences qui pourraient être
responsables d’une éventuelle instabilité de la protéine doivent aussi être extraites.
Inversement les séquences qui permettent d'améliorer soit le taux de production, soit l’activité
spécifique de la protéine peuvent être ajoutées.

Comme c’était le cas avec les bactéries, toutes les étapes doivent être optimisées, tout doit être
fait pour que la protéine soit sécrétée dans le milieu de culture. Mais le problème majeur est
celui de la nature de la cellule utilisée pour la production. En effet si l'on a recours aux
cellules eucaryotes en culture, c'est parce qu'elles sont capables d'effectuer les modifications
post-traductionnelles nécessaires à l'activité de la protéine produite. Ces systèmes de
modification ont parfois une spécificité tissulaire. Les γ-carboxylations de certains acides
glutamiques du facteur IX de coagulation ne peuvent par exemple être effectuées que par le
foie. Or l’une des caractéristiques fréquentes des cellules eucaryotes différenciées est de ne
pouvoir être cultivées.

La prolifération n'est en général possible que si la cellule est transformée, cette transformation
étant en général obtenue par infection virale. Ceci pose deux problèmes. Le premier est que
lors de la transformation, la cellule peut perdre les activités enzymatiques nécessaires aux
modifications souhaitées. Le second est un problème de santé publique, les protéines qui
seront produites étant destinées à être administrées à l'homme, le plus souvent par injection. Il
convient donc d'être absolument certain que la nature transformée des cellules utilisées pour la
production ne comporte aucun risque intrinsèque pour l'administration à l'homme de la
protéine fabriquée.

Des précédents existent, comme celui déjà évoqué du vaccin contre la poliomyélite de
première génération, préparé sur cellules de rein de singe dont on s'est aperçu plus tard qu'elles
étaient infectées par le virus SV40. Les différentes instances responsables des visas de
commercialisation des produits sont extrêmement vigilantes sur ce point. La plupart des
cellules donnant des rendements appréciables sont actuellement interdites par les principaux
organismes comme la FDA (Food and Drug Administration) américaine. De grands progrès
229
restent à effectuer en ce domaine. Mais l'avenir est peut-être à d'autres systèmes. Deux
commencent à acquérir une certaine faveur (d'un point de vue théorique) : les plantes et les
animaux transgéniques. Les premiers résultats expérimentaux obtenus chez la chèvre sont très
prometteurs. L'idée est de faire exprimer le gène de la protéine que l'on désire obtenir dans la
glande mammaire (grâce à un promoteur conditionnel adéquat), dans le but de récupérer la
protéine produite dans le lait de l'animal.

6.4.3 APPLICATIONS MEDICALES

- Prévenir et guérir les maladies héréditaires humaines

Les tentatives sérieuses de manipulations génétiques sur l’homme ont commencé en 1986. Il
s’agit de remédier aux maladies héréditaires humaines, c’est-à-dire de réparer les gènes
défectueux grâce aux manipulations génétiques.

Malformations congénitales et anomalies chromosomiques

Les maladies héréditaires font partie des troubles qui frappent les enfants à la naissance avec
les malformations congénitales (environ 3% des naissances), touchant les membres, le
cerveau, le cœur, etc, et les anomalies chromosomiques comme le mongolisme. L’ensemble de
malformations congénitales graves représente environ 1% des naissances. D’autres
malformations sont bénignes mais inesthétiques, comme le bec-de-lièvre, le pied-bot, la
polydactylie, etc. Elles sont d’ailleurs souvent accessibles à un traitement chirurgical. Le
déterminisme génétique des malformations conganitales est le plus souvent complexe. Il faut
retenir que lorsqu’un couple a déjà eu un enfant malformé, son risque d’en avoir un second est
plus élevé que pour la moyenne des couples de la population générale. Les anomalies
chromosomiques consistent en des altérations du patrimoine génétique touchant au nombre ou
à la constitution des chromosomes. Elles concernent environ 0,5% des naissances. Le
mongholisme appelé aussi la trisomie 21, est l’affection la plus répendue, touchant un enfant
sur 700 à la naissance.

Maladies héréditaires

On a recencé plus de 3000 maladies héréditaires. Elles sont extrêmement variées dans leurs
manifestations, consistant souvent en un trouble métabolique. Elles sont souvent très graves,
extrêmement invalidantes ou mortelles à plus ou moins brève échéance. La plus répandue
(dans les populations européennes) est la mucoviscidose (caractérisée par des sécrétions
muqueuses excessives conduisant à d’importants troubles digestifs et pulmonaires) touchant
un bébé sur 2000 environ. On peut citer l’hémophilie (troubles de la coagulation sanguine), la
myopathie (paralysie musculaire), …… A l’échelle mondiale, ce sont les maladies héréditaires
du sang qui concernent le plus grand nombre de personnes (environ 200.000). Elles consistent
en des dysfonctionnements de l’hémoglobine. Les 2 grands types de maladies héréditaires du
sang sont la drépanocytose et la thalassémie.

La drépanocytose, appelée aussi anémie à globules rouges en forme de faux (ou anémie
falciforme) est provoquée par une formule chimique anormale de la molécule d’hémoglobine :
230
un seul acide aminé dans l’une de ses chaînes protéiques (la bêta – globine) étant changé par
un autre. La thalassémie (α et β) est une maladie héréditaire due à une mutation génétique
frappant le gène de la globine. Il en résulte une absence plus ou moins complète de synthèse
des chaînes protéiques de l’hémoglobine dans les globules rouges. Les sujets atteints souffrent
d’une anémie plus ou moins sévère en fonction de l’ampleur du déficit en hémoglobine.

La thalassémie peut se soigner plus ou moins bien par des transfusions de sang répétées. Bien
qu’à la longue la répétition des transfusions sanguines peut engendrer d’autres troubles comme
par exemple l’accumulation de fer dans le tissu cardiaque conduisant à l’infarctus. Il existe
d’autres maladies héréditaires comme : La phénylcétonurie (PCU), due à une mutation
génétique qui met hors de fonctionnement le gène gouvernant la synthèse d’une enzyme
particulière, la phénylalanine hydroxylase, conduisant à l’accumulation de la phénylalanine, ce
qui altère le développement des facultés mentales et conduit également à une dépigmentation
de la peau.

L’hypothyroïde, qui consiste à un fonctionnement insuffisant de la glande thyroïde. Non


soignée, elle conduit au nanisme et à une profonde arriération mentale. Le traitement consiste
à administrer à l’enfant les hormones thyroïdiennes qui lui manquent. On peut donc dire que
la médecine est à peu près impuissante devant la plupart des maladies héréditaires et des
malformations congénitales graves. Il est donc apparu sensé de se tourner vers le dépistage
prénatal de ces anomalies dès que cela a été techniquement possible.
Dépistage prénatal des maladies héréditaires

Dépistage des malformations congénitales

Le dépistage des malformations congénitales au moyen de l’échograpgie est une technique


permettant de visualiser le fœtus dans les derniers mois de la grossesse et de voir s’il ne
présente pas des troubles importants de la morphologie du système nerveux, du cœur, des
membres, du tube digestif, etc.

Dépistage par amniocentèse

Le dépistage par amniocentèse consiste à prélever, au moyen d’une piqûre faite à travers la
paroi abdominale de la femme enceinte à 18 semaines, un peu de liquide dit amniotique
figurant dans les envelopppes entourant le fœtus. Dans le liquide amniotique flottent un petit
nombre de cellules détachées de la peau du fœtus. Ces cellules peuvent être prélevées et mises
en culture de façon à les multiplier en nombre suffisant pour être examinées. On peut alors
observer les chromosomes et en détecter éventuellement les anomalies de nombre et de
morphologie. On peut aussi repérer, par des tests biochimiques, si telle ou telle fonction du
métabolisme est altérée dans les cellules fœtales prélevées. Le test de dépistage prénatal de la
mucoviscidose, par exemple, consiste à mesurer le taux d’une enzyme, la phosphatase
alcaline, dans le liquide amniotique. Si le fœtus est atteint de la mucoviscidose, le taux de
l’enzyme est faible.
231
Dépistage par génie génétique :

- Cas de la drépanocytose

Sur le plan de principe, cette technique consiste à extraire l’ADN des cellules fœtales
prélevées par amniocentèse et à en examiner la séquence en nucléotides. Dans le cas précis de
la drépanocytose, il s’agit de faire cet examen de l’ADN au voisinage des gènes de β –
globine. Dès lors que l’on disposait du gène cloné, il était possible de préparer une sonde
permettant de détecter le gène de la β – globine dans l’ADN total représentant le patrimoine
génétique contenu dans le noyau d’une cellule humaine. On pouvait se servir d’une telle
sonde pour dépister la drépanocytose. La technique consiste à soumettre l’ADN des cellules
fœtales à l’action d’une enzyme de restriction. Lorsqu’on soumet la totalité du patrimoine
génétique humain extrait d’une cellule quelconque à l’action d’une enzyme de restriction,
celle-ci coupe l’ADN contenu dans le noyau au niveau des millions de sites de coupure et il en
résulte des millions de fragments d’ADN.

Si l’on dispose d’une sonde d’ADN pour le gène de la β – globine, il est alors possible de
repérer quel est le fragment d’ADN qui présente le gène de la β – globine. En effet la sonde
d’ADN s’accroche tout simplement au gène figurant sur le fragment de restriction et comme
elle a été rendue radioactive, on peut la visualiser et le fragment de restriction avec elle. Cette
technique permet de montrer que chez les sujets atteints de drépanocytose, les 2 gènes de la β
– globine provenant de la paire de chromosomes n°11 figurent chacun sur un fragment de
restriction comprenant 13000 nucléotides (lorsqu’on utilise l’enzyme Hpa I). Au contraire
chez les sujets normaux homozygotes, présentant 2 gènes normaux de la β – globine, ceux-ci
figurent chacun sur un fragment comprenant 7600 nucléotides. Chez des sujets anormaux mais
hétérozygotes, les 2 gènes de la β – globine figurent, l’un sur un fragment de 7600 nucléotides
et l’autre sur un fragment 13000 nucléotides.

Ces résultats signifiaient que si on réalise que l’enzyme de restriction HpaI trouve chez les
sujets homozygotes normaux des sites de coupure distants l’un de l’autre de 7600 nucléotides
sur chacun des chromosomes 11 et situés de par et d’autre du gène normal de la β – globine.
Par contre chez les sujets atteints de drépanocytose, les sites de coupure pour cette enzyme sur
chaque chromosome 11 sont situés à 13000 nucléotides l’un de l’autre. On peut bien penser
que le changement de position des sites de coupure de l’enzyme HpaI sur les chromosomes
des sujets drépanocytaires provient directement de ce changement dans les chaînes des
nucléotides. Il n’en est en fait rien et l’on ne sait à vrai dire pas très bien pourquoi la position
des sites de coupure de l’enzyme HpaI est changée chez les sujets drépanocytaires.

Mais ce qui est intéressant, est que ce changement soit lié de manière constante à la présence
du gène anormal entraînant la drépanocytose. C’est cela qui permet de le repérer, donc de faire
le dépistage prénatal de cette maladie. Cela peut aussi permettre de détecter si un sujet adulte
est hétérozygote. En principe on utilise l’ADN contenu dans les globules blancs, lesquels sont
obtenus par une simple prise de sang. Il existe d’autres enzymes de restriction incluant dans
leur site de coupure le nucléotide frappé par la mutation qui provoque la drépanocytose.
232
- Cas des thalassémies

Pour les thalassémies, le problème est complexe parce qu’elles sont dues à plus de 40 sortes de
mutations différentes.

Sondes d’ADN spécifiques des mutations

Il s’agit de courts fragments d’ADN, synthétisés chimiquement en éprouvette, consistant en


une séquence de 16 à 19 nucléotides qui sont la copie exacte de la partie d’un gène où figure la
mutation. Le test de dépistage prénatal consiste à mettre en présence l’ADN extrait des
cellules fœtales avec cette sonde spécifique de la mutation. S’il contient le gène muté, la sonde
va se coller en vertu de la loi d’association des nucléotides, exactement sur la portion du gène
dont elle est la copie. Si le gène est normal, la sonde ne sy collera pas. En théorie cette
méthode est donc capable de détecter 100% des gènes mutés. Cependant les maladies
héréditaires affectant un seul gène sont souvent provoquées par de nombreuses mutations
différentes. Il faut donc disposer généralement de plusieurs sondes pour dépister
prénatalement tous les sujets atteints par une maladie donnée. L’avantage du diagnostic
prénatal par sonde d’ADN (ou par enzyme de restriction) réside dans le fait que les analyses
peuvent être faites sur des cellules extraites du liquide amniotique. Dans le cas des maladies
du sang, il n’est donc pas besoin de disposer des globules blancs du fœtus. Or l’amniocentèse
est beaucoup moins dangéreux pour le fœtus que le prélèvement du sang fœtal. En outre
l’amniocentèse se pratique à la 17e ou 18e semaine de grossesse, soit un peu plus tôt que le
prélèvement de sang fœtal (20e semaine).

6.4.4 ANIMAUX TRANSGENIQUES

Au début les expériences sur les manipulations des gènes in vitro étaient réalisées uniquement
sur les microorganismes et plus particulièrement sur les bactéries. Actuellement, les
champignons, les plantes et les animaux sont également utilisés pour manipuler les gènes.
Trois catégories d’eucaryotes ont principalement été les cibles des expériences sur les
manipulations des gènes in vitro : les levures, les plantes et les animaux. L’objectif de départ
des pères des manipulations des gènes était de démonter pièce par pièce le génome des
organismes supérieurs en vue d’en comprendre le fonctionnement, c’est-à-dire extraire des
gènes individuels, puis de les transplanter dans des bactéries en vue d’étudier de manière
appropriée. On cherchait à comprendre comment le fonctionnement des gènes des organismes
supérieurs est contrôlé, orchestré de manière à aboutir à un développement harmonieux et
progressif d’un individu.

En fait, à l’époque on savait notamment que les portions d’ADN adjacentes à un gène sur le
chromosome bactérien jouaient le rôle de commutateurs puisque, selon quelle reçoive certains
messages chimiques ou non, une région commutatrice permet ou non au gène adjacent qu’elle
contrôle de gouverner la synthèse de la protéine correspondante. C’est dans les années quatre-
vingts que se multiplièrent les expériences de clonage des gènes d’organismes supérieurs non
pas dans les bactéries, mais dans les cellules animales. On s’est en fait rendu compte
notamment que les messages chimiques qui gouvernent la commutation des gènes chez un
organisme (entier) ne sont pas présents dans des cellules animales en culture.
233

Il s’agit de ces signaux qui ont pour but de mettre en fonction tel gène dans telle catégorie de
cellules de l’organisme ou d’inhiber ce même gène dans une autre catégorie de cellules. De
cela est née l’idée de greffer des gènes d’organismes eucaryotes à d’autres organismes
supérieurs. Il est alors supposé que le gène greffé est bien connu et de ce fait facilement
repérable parmi des milliers de gènes des organismes supérieurs. Et pour obtenir un meilleur
rendement, il est préférable d’effectuer la greffe tout au début du développement
embryonnaire, c’est-à-dire au moment où l’œuf vient juste d’être fécondé et d’utiliser une
micropipette pour introduire l’ADN dans les cellules. D’autres techniques existent. C’est
notamment le cas de l’infection d’un embryon par un rétrovirus recombiné avec le gène
d’intérêt. De plus, le gène d’intérêt est sous la forme de solution contenant plusieurs dizains de
milliers de copies de ce gène.

Le traitement habituel consiste à remplir la micropipette, puis injecter l’ADN dans la cellule.
En général, la plupart des œufs sont endommagés par le traitement à la micro-injection. Dans
les œufs qui survivent au traitement, seules quelques copies du gène arrivent à s’intégrer dans
les chromosomes de la cellule. La greffe consiste ici à introduire un gène dans un œuf fécondé
par micro-injection. Une fois à l’intérieur de la cellule, le gène peut s’intégrer dans un
chromosome et se comporter comme les autres gènes de la cellule. Ainsi, le gène greffé sera
présent dans toutes les cellules d’un individu dont l’œuf fécondé portait ce gène. La première
expérience de ce type a été réalisée sur des souris en 1980 par F. Ruddle et ses collaborateurs.

En 1981, Th. Wagner injecta le gène de la β- globine du lapin dans des œufs de souris. La β-
globine est une protéine entrant dans la composition de l’hémoglobine. D’après ses résultats,
l’hémoglobine comprenait de la β-globine du lapin chez un sur dix souriceaux obtenus. Il a
alors conclu que le gène étranger était non seulement greffé, mais il a bien fonctionné. Il
convient de remarquer que les souris de Wagner étaient les premiers animaux génétiquement
manipulés. L’hormone de croissance humaine était injectée aux œufs de souris. Les résultats
obtenus montrèrent que chez 25% des souriceaux obtenus, le gène étranger était intégré au
génome des souris. Chez certains de ces souriceaux, le gène étranger se mis à fonctionner de
manière excessive de telle sorte que certains se mirent à grandir de manière exagérée.

Brinster et Palmiter ont construit un gène artificiel à partir du gène de l’hormone de croissance
humaine et de la portion d’ADN qui, dans les chromosomes du rat, se trouve flanqué en amont
le gène de l’élastase qui a été injecté à des œufs fécondés de souris. Alors que chez l’homme,
le gène de l’hormone de croissance ne fonctionne que dans des cellules glandulaires du
pancréas, la mise en fonction du gène de l’hormone de croissance humaine est dans ce cas
commandée par la séquence d’ADN adjacente au gène de l’élastase. Il suffisait maintenant
d’adjoindre au gène de l’hormone de croissance humaine une séquence de contrôle prélevée au
voisinage immédiat d’un gène de la vache gouvernant la synthèse d’une protéine se trouvant
habituellement dans le lait (comme la caséine) pour obtenir du lait contenant de grandes
quantités de cette hormone.
234
Clonage des animaux

Le clonage ou production en série d’êtres génétiquement identiques est une technique


développée en 1981 permettant d’accroître artificiellement le nombre d’animaux
génétiquement sélectionnés. Il existe deux variantes de cette technique. La première consiste
à couper un embryon précoce en deux et en éprouvette, puis de replacer chacune des moitiés
dans un utérus. Chaque moitié se développera et donnera un embryon entier. Dans certains
cas, on peut aller jusqu’à couper l’embryon en quatre, permettant d’obtenir des clones de
quatre membres. De ce fait, puisque les vrais jumeaux sont issus d’une division spontanée de
l’œuf fécondé ou de l’embryon précoce, cette technique reproduit artificiellement ce qui se
passe dans la nature. Le clonage par scission de l’embryon précoce, mis au point en 1984, est
très couramment utilisé dans des centres commerciaux de sélection animale.

La seconde variante consiste à prélever, au moyen d’une micropipette, un noyau d’une cellule
quelconque du corps d’un animal, puis de le transplanter dans un ovule avant la fécondation
ou dans un œuf juste fécondé duquel on a retiré le noyau. Le principe de base de cette
technique est que le noyau de n’importe quelle cellule du corps contient la totalité du
programme génétique d’un organisme. De ce fait, c’est le patrimoine génétique contenu dans
le noyau greffé qui va diriger le développement de l’embryon à la place du noyau expulsé.
L’individu produit sera par conséquent génétiquement identique à celui qui a donné le noyau.
En fait, les noyaux utilisés proviennent en règle générale d’un embryon et de préférence d’un
embryon précoce. Au-delà du stade blastula, les chances de réussir un clonage diminuent
sensiblement.

Le taux de réussite d’un clonage tombe à 50% dès que l’on commence à utiliser des embryons
un peu plus âgés comme source de noyaux, même s’ils ne sont pas encore différenciés (stade
blastula). Il convient de rappeler à cet effet que si toutes les cellules d’un organisme adulte
contiennent bien la totalité du répertoire des gènes, seuls certains gènes sont actifs et ce ne
sont pas les mêmes selon les catégories cellulaires et le stade de développement de
l’organisme. La tendance générale est de chercher à activer les gènes qui sont devenus inactifs
au cours de développement.

Chez les mammifères, la technique la plus couramment utilisée est une technique relevant de
la fusion cellulaire mise au point en 1986 par S. Willadsen. Cette technique consiste à faire
fusionner entre elles et en culture des cellules de provenances diverses. Willadsen avait réussi
la fusion d’une cellule prélevée sur un embryon précoce de brebis, au stade huit cellules, avec
un ovule de brebis non fécondé, débarrassé de son noyau. Par la suite, il a obtenu la naissance
de trois agneaux dont deux étaient de vrais jumeaux parce qu’ils provenaient des noyaux
prélevés sur le même embryon.

Pour avoir une idée sur l’effet multiplicateur de cette technique, considérons un embryon au
stade huit cellules résultant d’une fusion cellulaire comme donneur de cellules pouvant
fusionner avec des ovules non fécondés. Imaginons que chacune des huit cellules a fusionné
avec un ovule non fécondé. On obtient ainsi huit nouveaux embryons génétiquement
identiques. Arrivé au stade huit cellules, chaque embryon va servir de donneur de cellules et
ainsi de suite. En recommençant plusieurs fois l’opération et en laissant se développer les
235
derniers embryons, on obtiendra de nombreux individus (ici des agneaux) tous identiques entre
eux et à l’embryon initial. Le plus souvent, seulement un petit nombre d’embryons d’un
clone arrivent à maturité. Le reste des embryons est conservé à l’azote liquide pour être utilisé
à temps opportun.

Il convient cependant de signaler les risques liés au clonage du bétail et des animaux
domestiques. En effet, les défenses immunitaires sont sous le contrôle du patrimoine
génétique et aucun individu n’est capable de résister à toute la gamme de maladies
infectieuses. Il a été montré que la résistance aux agents infectieux dépend de la composition
en gènes des parties ou génome qui contrôle le système immunitaire. De ce fait, lorsque de
nombreux individus présentent la même composition en gènes, la probabilité pour qu’ils
présentent les mêmes lacunes immunitaires de mêmes microbes est élevée. Il est connu
aujourd’hui que chez les animaux chaque type cellulaire allume un nombre restreint de gènes
et éteint tous les autres de façon différentielle à différents stades de développement alors que
toutes les cellules de l’organisme résultent de la division d’une cellule unique, le zygote : seuls
les globules rouges synthétisent l’hémoglobine, seules les cellules β des îlots de Langerhans
du pancréas synthétisent l’insuline, seules les cellules hépatiques synthétisent l’albumine.

Lorsqu’un noyau d’une cellule différenciée d’un tétard d’un crapaud ou d’une cellule
intestinale par exemple est prélevé et injecté dans un ovocyte énucléé de la même espèce, cet
ovocyte s’active et peut se développer en un tétard normal formé ainsi d’un très grand nombre
de cellules appartenant à tous les types cellulaires différenciés. Cela démontre que le noyau de
la cellule différenciée peut être déprogrammé et retrouver sa totipotentialité à condition d’être
placé dans un cytoplasme jeune, celui de l’ovocyte. Ce qui signifie que le noyau a conservé
tous ses gènes bien qu’il n’en exprimait qu’un nombre limité. Cette technique de
transplantation nucléaire permettait donc d’envisager un véritable clonage de mammifères.

En 1980, il fut réalisée et réussie pour la première fois une transplantation nucléaire sur l’œuf
de souris, avec cependant des résultats fort décevants. On sait aujourd’hui que chez la souris,
les noyaux sont reprogrammés génétiquement dès le stade 2 blastomères et que cette
reprogrammation semble être irréversible. Les succès enregistrés ont alors permis
d’envisager la production des clones de porcs, moutons et bêtes bovines. Par ailleurs, l’espoir
d’obtenir une réserve théoriquement illimitée de noyaux totipotents naquit de l’établissement
en culture de lignées cellulaires issues d’amas embryonnaires, les cellules ES (Embryonic
Stem) et des cellules souches des cellules reproductrices qui se forment dans les gonades du
fœtus, les cellules EG (Embryonic Germ Cells).

En 1997, Campbell et al.ont obtenu des agneaux par transfert de noyaux prélevés sur des
cellules ES, des cellules fœtales et même des cellules des glandes mammaires d’une brebis
adulte. Toutes les techniques dont il a été question jusqu’ici ne relèvent à proprement parler
du génie génétique. En effet, le clonage revêt un caractère génétique dans la mesure où il
permet, à plus ou moins longue échéance, d’amplifier artificiellement une des innombrables
combinaisons génétiques préexistant au sein d’une population naturellement hétéromorphe.

Il convient cependant de rappeler qu’une telle sélection eugénique se pratique depuis que
l’homme s’adonne à la culture et à l’élevage en favorisant la multiplication de seuls individus
236
qui sont utiles et que les laboratoires regorgent des races pures de souris obtenues par
croisements consanguins. Toutes ces variétés, toutes ces races résultent d’un événement initial
imprévisible, une mutation spontanée ou provoquée par des agents mutagènes dont le seul
hasard fait émerger un caractère nouveau intéressant. Tout au contraire, les techniques du
génie génétique permettent des transformations génétiques préméditées.

Après les microorganismes et les cellules en culture, ce sont aujourd’hui les plantes et les
animaux qui peuvent être modifiés génétiquement par l’insertion stable des gènes étrangers.
L’obtention des lignées stables d’organismes transgéniques dépend donc de l’intégration, dans
une première génération, du transgène dans les cellules de la lignée germinale qui assurent sa
transmission aux générations suivantes. Chez les mammifères, le transgène est introduit au
stade le plus précoce possible du développement de l’embryon, soit par microinjection directe
dans le zygote, soit par infection d’œufs en division par un rétrovirus défectif dans le génome
duquel le transgène a été préalablement intégré.

Le génome des animaux transgéniques s’enrichit ainsi du transgène et on parle de transgenèse


additive. Cela permet d’étudier l’expression contrôlée du transgène dans le temps et dans
l’espace, les conséquences de sa surexpression ou encore l’effet mutagène éventuel de son
insertion dans un gène endogène. Une autre méthode de créer des lignées d’animaux
transgéniques consiste à transformer génétiquement des cellules embryonnaires souches mises
en culture (cellule ES) par les méthodes classiques de transfection cellulaire. Cette méthode
requiert un nombre important de manipulations délicates, mais offre un avantage considérable
de pouvoir procéder à une transgenèse substitutive. Elle permet en effet de remplacer un gène
d’intérêt par son homologue muté (mutagenèse dirigée) ou au contraire un gène muté par son
homologue normal (thérapie génique).

La technique de la microinjection directe du gène est de loin la plus simple et la plus


couramment utilisée pour la transgenèse additive. Plusieurs centaines de copies du gène choisi
sont introduites dans le noyau mâle. Les œufs sont ensuite cultivés pendant quelques heures
avant d’être placés dans les oviductes d’une femelle pseudo-gestante. La présence du
transgène dans le génome des souriceaux ainsi obtenus est vérifiée dans l’ADN extrait
d’environ 0,5 ml de leur sang. Les souris positives sont alors les fondatrices des lignées
transgéniques. Les premières souris transgéniques, obtenues en 1980, étaient porteuses d’un
gène viral, celui de la thymilate kinase du virus d’herpès. Ce succès représentait un moyen
nouveau et performant de progresser dans l’étude du contrôle temporel et histospécifique de
l’expression des gènes au cours du développement. Il était possible de déterminer avec
précision le moment et le site d’apparition du produit du gène quel qu’il soit.

Ce type d’approche confirma largement que les deux systèmes de contrôle sont assurés par la
présence des séquences de régulation en amont de la séquence codante. Un gène cloné et
microinjecté n’est opérationnel que s’il est complet. Il est alors soumis au même contrôle
d’expression que le gène endogène correspondant. C’est ainsi que le gène naturel de la
transférrine de poulet est, comme chez ce dernier, exprimé dans le foie des souris
transgéniques, que l’élastase de rat n’est sécrétée que par les cellules exocrines du pancréas de
la souris transgénique et de même que l’insuline humaine n’est sécrétée que par les cellules β
des îlots de Langerhans de cette glande.
237

Cela permet de conclure que le lieu et le moment de la synthèse d’une protéine donnée
dépendent exclusivement de la nature des régions de contrôle du gène. L’intégration d’un
transgène hybride formé des régions de contrôle d’un gène ne s’exprimant que dans un seul
type cellulaire et de la partie codante du gène d’une toxine (toxine diphtérique, par exemple)
provoque la destruction ciblée de type cellulaire visé. La transgenèse additive suscite les
espoirs de corriger une déficience génétique préexistante par l’adjonction d’allèles sauvages
(normaux) aux allèles mutés. Certaines déficiences héréditaires de la réponse immunitaire
ainsi que l’hypogondisme ont en effet été corrigés par transgenèse additive chez la souris. Il
faut cependant signaler que seuls 10 à 40 œufs microinjectés sur 100 intègrent le transgène et
qu’un pourcentage aussi faible de ceux-ci l’exprime. Ceci est essentiellement dû au fait que
rien aujourd’hui ne permet de contrôler précisément le site d’insertion, ce qui entraîne le
risque de perturber l’expression d’autres gènes pouvant conduire à la létalité. La transgenèse
additive est actuellement très utilisée en recherche fondamentale. Elle permet aussi de
transformer des animaux d’élevage comme les chèvres, moutons, porcs ou bêtes bovines par
l’introduction des gènes humains afin de leur faire produire des protéines thérapeutiques.

La construction des gènes hybrides dont les régions promotrices sont positivement contrôlées
dans les seules cellules exocrines des glandes mammaires a depuis lors permis d’engendrer des
brebis productrices du facteur IX de coagulation, des chèvres productrices d’antithrombine III
et des truies productrices de la protéine C. Il est maintenant possible de remplacer de
volumineux et coûteux bioréacteurs par un cheptel transgénique. Pourtant, puisque l’insertion
peut se faire à n’importe quel endroit du génome, la transgenèse additive permet difficilement
de contrôler le nombre de copies du transgène qui s’insèrent dans le génome de l’hôte, elle ne
permet pas non plus le remplacement d’un gène endogène par un de ses allèles. Dans ce cas,
la recombinaison génétique est dite hétérologue.

Il convient cependant de rappeler que les cellules des mammifères sont pourvues de systèmes
enzymatiques capables d’assurer l’intégration par recombinaison homologue à condition que
le gène introduit soit l’homologue d’un gène endogène. Dans ce cas le gène endogène peut
être remplacé par le transgène. La fréquence de cet événement est 1000 à 10.000 fois moins
que son intégration aléatoire (recombinaison hétérologue). Par conséquent, il est très peu
probable d’obtenir une souris génétiquement ciblée de la sorte par la méthode d’injection
d’ADN ou l’emploi des vecteurs viraux.

Cet obstacle est contourné en utilisant des lignées de cellules issues de l’amas embryogène et
qui conservent le caractère pluripotent de celui-ci à partir des blastocystes mis en culture. Ces
cellules ES sont soumises aux méthodes classiques de la transfection par addition dans leur
milieu de culture du transgène qu’elles internalisent. Les cellules qui ont subi une
recombinaison homologue sont par la suite sélectionnées grâce à la méthode développée par
Cappechi en 1989 et mises en culture. Cela permet de disposer en quantité illimitée de
cellules pluripotentes porteuses d’une transformation génétique ciblée qui peuvent être à
l’origine d’une ou plusieurs lignées transgéniques. Les souris knock-out résultant de
l’inactivation ciblée de l’un des gènes qui est remplacé par un allèle inactivé in vitro
constituent d’excellents modèles de maladies humaines comme les cancers, les maladies
238
génétiques et métaboliques. C’est le cas par exemple de la mucoviscidose, de la maladie de
Parkinson, de la maladie d’Alzheimer, de l’hypercholestérolémie, etc.

Cas de la brebis Dolly

Le clonage est une technique qui permet de multiplier les animaux considérés comme
précieux, soit pour leurs performances économiques, soit par leur rareté. L’exemple classique
du clonage des animaux est celui de la naissance de la brebis Dolly en Ecosse en 1996. Ian
Wilmut et son équipe ont en effet réussi le clonage d’une brebis par la greffe du noyau dans un
ovocyte. La nouvelle fut largement répandue dans les médias en 1997. Sur 277 essais, 29
embryons clonés des cellules mammaires ont été obtenus. Ces embryons clonés, transplantés
dans l’utérus d’une brebis porteuse, ont aboutit à une unique agnelle. Dolly fut ainsi le
premier mammifère cloné à partir d’une cellule adulte.

6.4.5 LEVURES TRANSGENIQUES

Saccharomyces servisiae est la levure la plus couramment utilisée en génie génétique chez les
eucaryotes. On la compare à Escherichia coli chez les bactéries. Sa génétique est très bien
développée. De plus, la levure contient un plasmide circulaire naturel appelé plasmide 2
microns (2μ) par référence à sa circonférence. Lors des croisements entre cellules, le plasmide
2μ se transmet normalement. On le retrouve également dans tous les produits de la méiose. Il
est intéressant de noter que ce plasmide 2μ a servi de base pour la construction de nombreux
vecteurs de levure très sophistiqués.

Vecteurs de levure

Il existe plusieurs types de vecteurs de levure. Les plus simples sont des chimères dérivés des
plasmides bactériens dans lesquels un fragment d’ADN de levure a été inséré. Comme les
plasmides bactériens ne peuvent se répliquer dans les cellules de levure, ils doivent s’intégrer
dans l’ADN de levure pour produire un phénotype transgénique stable. En fait, une fois à
l’intérieur de la cellule, ces plasmides sont capables de s’intégrer dans les chromosomes de
levure par recombinaison homologue, soit après un seul crossing-over, auquel cas le plasmide
entier est inséré dans le chromosome ou soit après deux crossing-over, dans ce cas un allèle du
plasmide remplace un allèle de la cellule. Plusieurs vecteurs de levure sont construits à partir
du plasmide 2 μ auquel on a attaché des fragments d’ADN de la bactérie et de la levure.

Ces vecteurs composites confèrent deux avantages particuliers : 1. la capacité de réplication


autonome dans la levure (l’obstacle de l’intégration est ainsi contourné) grâce à la partie 2 μ.
2. la possibilité d’introduire des gènes dans la levure, y étudier les effets sur le phénotype,
puis de retransférer le plasmide dans E. coli pour y manipuler le gène de levure à condition
que le gène en question dispose d’une origine de réplication bactérienne et un marqueur
sélectionnable dans la bactérie. Ces vecteurs sont aussi appelés vecteurs navettes. Ils sont
d’usage courant pour le clonage et la manipulation des gènes de levures. Puisque la
distribution des plasmides entre les cellules filles est essentiellement aléatoire, une méthode a
été développée pour assurer une répartition efficace des plasmides (entre les cellules filles) au
moment de la division cellulaire.
239

Cette méthode consiste à ce qu’un fragment d’ADN de levure contenant un centromère soit
incorporé au plasmide. Pendant la division de la cellule, le fuseau mitotique qui pilote la
ségrégation équitable et équilibrée des chromosomes va manipuler le plasmide de la même
manière que les chromosomes de la cellule. Ceci a constitué une base à la construction d’un
chromosome artificiel de levure. En fait, les chromosomes artificiels de levure ou YAC (pour
Yeast Artificial Chromosomes) sont construits à partir d’un plasmide contenant un centromère
linéarisé auquel on ajoute des télomères à ses extrémités et des origines de réplication de
levure. Il s’agit des séquences de réplication autonome ou ARS (pour Autonomously
Replicating Sequences). Les YAC se comportent donc comme de petits chromosomes de
levure. Un autre type de vecteur de levure, les plasmides d’intégration de levure, appelés
aussi YIP (pour Yeast Integrative Plasmid) est également d’usage courant. Les YIP
permettent l’intégration d’un gène porté par le vecteur plasmidique dans le chromosome de
levure après deux crossing-over successifs. De ce fait, le gène étranger remplace le gène
sauvage occupant un locus normal sur un chromosome.

La méthode peut être schématisée de la manière suivante : le gène muté et les régions qui le
flanquent sont portés par un plasmide d’intégration. Cela fournit une région d’homologie avec
le génome (de levure). Un crossing-over se produit au niveau de cette région d’homologie et
entraîne l’intégration du plasmide tout entier dans un des chromosomes au locus désiré. Il
existe maintenant deux exemplaires de ce même gène, le gène muté et le gène sauvage. Un
second crossing-over va entraîner l’excision du plasmide (qui apporte le gène sauvage) et le
remplacement du gène sauvage par le gène muté au locus chromosomique normal.

Les chromosomes artificiels de levure sont des vecteurs de très grande capacité
d’emmagasinage. Ils sont très largement utilisés pour le clonage de grands fragments de
génomes de mammifères qui sont de très grande taille. De plus, le fait que les chromosomes
des levures et des champignons sont relativement petits favorise leur séparation par
électrophorèse en champs alternés par rapport aux chromosomes des autres eucaryotes de
taille énorme, nécessitant l’utilisation des enzymes de restriction pour produire des fragments
de tailles compatibles avec l’électrophorèse.

6.4.6 VEGETAUX TRANSGENIQUES

Certains arbres fruitiers hébergent une bactérie du nom d’Agrobacterium tumefaciens


responsable de volumineuses excroissances (des tumeurs) généralement localisées à la base de
la feuille et qui entraînent une maladie des plantes appelée gale de collet. La tumeur est
provoquée par un grand plasmide circulaire de 200 Kb présent dans la bactérie appelé
plasmide Ti (pour Tumor inducing). En fait, une partie de l’ADN du plasmide Ti appelée
ADN-T ou région-T est transférée de la bactérie à la cellule hôte, s’insère plus ou moins au
hasard dans le génome de la cellule et commande la transformation des cellules vers un état
cancéreux. Cette manipulation génétique, réalisée spontanément et couramment dans la
nature a servi de base pour les manipulations des gènes in vitro chez les plantes puisque tout
fragment d’ADN cloné au sein de l’ADN-T peut bien s’intégrer de manière stable dans un
chromosome et par la suite se comporter comme faisant partie du génome de la plante.
240
L’ADN-T contient plusieurs gènes dont certains codent pour des hormones de croissance
végétales (phytohormones : auxines et cytokinines) responsables de la production des
tumeurs ; d’autres codent pour des enzymes qui catalysent la synthèse des opines dont la
nopaline et l’octopaline, des substances utilisées par la bactérie pour son développement. Les
premières expériences réussies ont été réalisées en 1983 avec le gène de résistance aux
antibiotiques. L’opération consistait à insérer le gène étranger dans le plasmide Ti
d’Agrobacterium tumefaciens. Le vecteur recombinant est ensuite introduit dans une bactérie.
Les bactéries manipulées sont enfin mises en culture avec les cellules des feuilles. En général,
les cellules hôtes utilisées à cet effet sont de préférence les protoplastes. Il s’agit des cellules
végétales nues, c’est-à-dire débarrassées de leur paroi externe pour une meilleure efficacité de
transformation.

Il convient de remarquer que, traité convenablement, n’importe quel protoplaste est capable de
conduire à un développement intégral. Les plasmides utilisés dans ces expériences sont des
dérivés construits à partir des plasmides sauvages. Débarrassés des gènes néfastes, ils sont
petits et de plus des séquences d’ADN choisies servant de régions commutatrices sont
raccordées aux gènes de résistance aux antibiotiques pour permettre aux gènes de fonctionner.
L’un des dérivés est un petit vecteur portant deux segments d’ADN-T, un gène marqueur de
sélection bactérien de résistance à la spectinomycine (spcR) et un autre gène marqueur de
sélection bactérien de résistance à la kanamycine (kanR) manipulés pour pouvoir s’exprimer
dans la plante, un site de clonage formé par une succession de sites de reconnaissance pour
différentes enzymes de restriction où l’ADN étranger est inséré.

L’un des deux segments contient les gènes de synthèse de la nopaline et l’extrémité droite ®
de l’ADN-T, l’autre segment comporte une région proche de l’extrémité gauche (L) de
l’ADN-T, fournissant une zone d’homologie pour la recombinaison. Ce vecteur dit
intermédiaire s’utilise avec un second plasmide Ti plus grand, débarrassé de toute sa région
droite, c’est-à-dire les gènes inducteurs de tumeurs, les gènes de synthèse de la nopaline et
l’extrémité droite, mais conserve l’extrémité gauche de l’ADN-T. Ce plasmide ne peut plus
s’intégrer dans le génome de la plante, ni provoquer l’apparition des tumeurs.

Plasmide Ti

On sait que la bactérie du genre Agrobacterium est responsable de l’apparition des tumeurs
dans la région du collet, c’est-à-dire la zone de liaison entre la racine et la tige chez un certain
nombre de dicotylédones, en particulier chez les choux (Brassica). Cette tumeur est
généralement envahissante, entraînant une nécrose de la partie aérienne de la plante et
finalement sa mort. Une coupe anatomique de la tumeur montre une multiplication intense des
cellules de tous les tissus présents au niveau du collet, très étroitement liée à une prolifération
bactérienne considérable. Cette prolifération bactérienne est soutenue grâce à la production,
par les cellules de la tumeur, des molécules nouvelles, les opines.

Ces opines servent de substances nutritives pour les agrobactéries et activent leur
multiplication. La synthèse de ces produits détourne certaines voies du métabolisme normal de
la plante. Ce sont les agrobactéries et les grands plasmides de 200.000 pb environ qu’elles
abritent qui sont responsables de cette déviation du métabolisme. Il existe plusieurs souches
241
d’agrobactéries dont les plus connues sont Agrobacterium tumefaciens qui héberge le
plasmide Ti, responsable de la galle du collet et Agrobacterium rhizogenes, qui possède le
plasmide Ri (pour root inducing) et provoque, chez la plante qu’il parasite, le chevelu
racinaire, marqué par un développement anormal à la fois sur le plan quantitatif (nombreuses
racines et qualitatif (racines grêles) de l’appareil racinaire. Il s’agit des bactéries gram –
négatif appartenant aux Eubactéries.

Cartographie du plasmide Ti

Les plasmides circulaires d’ADN bicaténaire et de grande taille sont présents sous forme de
plusieurs exemplaires identiques. Ils comprennent plusieurs régions dont trois sont
particulièrement importantes : 1. une région contenant l’origine de réplication ; 2. une région
correspondant à l’ADN de transfert ou l’ADN–T, limitée par 2 bordures dites droite et gauche
et contenant les oncogènes responsables de la tumeur ; 3. une région Vir contenant divers
gènes influant sur la propriété de virulence de la bactérie, c’est-à-dire sa capacité à reconnaître
les cellules végétales, à les infecter, à y piloter le transfert de l’ADN–T jusqu’au noyau et
intégrer cet ADN au génome de la cellule végétale. L’intégration de l’ADN – T au génome
de la cellule végétale est à l’origine des modifications du métabolisme cellulaire, de la perte de
son contrôle sur l’orientation et les mécanismes mitotiques, d’où la formation de la tumeur et
la sécrétion des opines. Les opines constituent toute une famille de molécules comprenant
généralement un acide aminé lié à un sucre.

Ces deux composants peuvent varier d’une souche à l’autre, ce qui a conduit à établir trois
classes de plasmides selon la nature de l’opine : 1. les plasmides à octopine dont le sucre est le
pyruvate et l’acide aminé soit l’arginine, l’ornitine, la lysine ou l’histidine ; 2. les plasmides à
agropine dont l’acide aminé est la glutamine généralement associée au mannose ; 3. les
plasmides à nopaline dont l’arginine ou l’ornitine se trouve lée à l’acéto-glutarate. Les cellules
végétales qui ont été reprogrammées par les bactéries pour réaliser ces synthèses ne sont pas
capables d’utiliser de telles molécules. Par contre, les agrobactéries possèdent des gènes situés
précisément sur ces plasmides Ti dont les produits de traduction sont capables de dégrader ces
molécules et utiliser ces produits de dégradation comme nutriments.

L’ADN–T contient également des gènes qui codent la synthèse d’enzymes impliquées dans la
synthèse d’hormones. Les gènes iaaM et iaaH codent des protéines enzymatiques à l’origine
de la synthèse d’une auxine. Le gène iptZ code pour la synthèse d’une cytokinine. Ces deux
types d’hormones intervenant dans la prolifération cellulaire de la plante receveuse. Cet ADN–
T est bordé par des séquences répétées d’une vingtaine de paires de bases qui constituent les
bordures correspondant à des régions d’excision et qui participent ainsi à la libération de l’un
des brins. Les coupures s’effectuant au niveau de la bordure droite dans un premier temps,
puis de la bordure gauche dans un second temps. Le transfert concerne donc un ADN simple
brin qui va se comporter un peu comme un élément transposable mobile, capable de s’intégrer
au génome de la plante hôte. Ce transfert nécessite le contact direct de la bactérie avec la
cellule végétale et réalise un processus original de conjugaison entre une cellule eucaryote
végétale et une cellule procaryote. Les gènes Vir situés sur le plasmide mais en dehors de la
région de l’ADN–T sont indispensables au transfert. Il existe plusieurs gènes vir, au moins six,
242
situés linéairement sur le plasmide, dans une région voisine de l’origine de réplication et
affectés, pour les identifier, des premières lettres de l’alphabet.

Ainsi : 1. le gène vir A coderait la synthèse d’un récepteur du signal de blessure, récepteur
sensible à des molécules libérées lors d’une blessure accidentelle de la plante ; 2. le gène vir
B coderait la synthèse d’une protéine membranaire intervenant dans la formation du canal par
lequel doit transiter la molécule d’ADN–T lors de son passage de la bactérie dans la cellule
végétale ; 3. le gène vir C dirigerait la synthèse d’une protéine capable de diriger le transfert
de l’ADN – T en se plaçant en tête de la molécule ; 4. le gène vir D serait responsable de la
synthèse d’une endonucléase agissant au niveau des bordures et participant à la libération de
l’ADN–T. On a parfois décrit 2 gènes vir D (D1 et D2) ; 5. le gène vir E coderait la synthèse
des protéines de protection de l’ADN–T qui viendraient progressivement emballer cette
molécule durant son transfert jusqu’au noyau de la cellule végétale, la protégeant de l’attaque
probable des nucléases ; 6. le gène vir G a également été décrit comme responsable de la
synthèse d’un facteur de virulence.

L’expression des gènes de virulence est généralement déclenchée par des molécules libérées
par les cellules et les tissus lors d’une blessure fortuite (gel, traumatisme, piétinement) ou
programmée (scarification, découpe de parenchyme foliaire). Les polyphénols souvent libérés
par blessures sont de bons candidats pour représenter des intermédiaires. Il a été démontré que
l’introduction d’une copie supplémentaire de l’un des gènes vir dans une agrobactérie activait
la transformation. Une 3e région du plasmide Ti qui, comme la région vir n’est jamais
transférée, est occupée par les gènes de synthèse des opines et octopines ainsi que par des
gènes intervenant dans la conjugaison entre bactéries, propriété qui serait exploitée en
transgenèse. Il existe également des gènes, situés sur le chromosome bactérien et non plus sur
le plasmide, qui interviennent dans les processus de reconnaissance bactérie / plante et
participent alors à la fixation de l’agrobactérie à la cellule végétale. Aussitôt après transfert, le
plasmide Ti réplique le brin d’ADN manquant, le brin d’ADN demeuré en place lui servant de
matrice.

Modalités de transformation des cellules végétales

Il existe 2 principales modalités de transformation des cellules végétales : la transformation


indirecte faisant intervenir des vecteurs biologiques, les agrobactéries et la transformation
directe, sans intermédiaire, qui fait le plus souvent appel à des techniques physiques quelque
peu violentes pour introduire l’ADN porteur des gènes à transférer dans la cellule végétale.

• Transformation indirecte

Transformation via Agrobacterium

La mise au point d’une méthodologie de transformation indirecte des cellules végétales et par
conséquent des plantes issues de leur régénération a été inspirée par la maladie de la galle du
collet.
243
a. Technique de la co-intégration

La première technique utilisée a été celle de la co-intégration. Cette méthodologie devait


répondre à 2 impératifs : 1. Réduire la taille des plasmides à manipuler par rapport au plasmide
Ti du départ, 2. Supprimer les oncogènes afin d’annuler les effets désastreux de ce plasmide
sur l’avenir de la plante. Pour répondre au premier impératif, la solution a été d’intégrer
l’ADN–T dans un vecteur standard de clonage chez E. coli puis d’insérer à proximité, dans ce
même vecteur, le fragment d’ADN à transférer. Le vecteur est ensuite introduit dans
l’agrobactérie contenant ses propres plasmides Ti. Avec un peu de chance, il se produit alors
chez l’agrobactérie une recombinaison homologue, ce qui a comme conséquence de transférer
la construction réalisée dans un plasmide Ti sauvage. Cette agrobactérie reprogrammée est
alors à même de transférer à son tour son plasmide Ti recombinant à la plante. Répondre
favorablement au second impératif revient à provoquer la délétion de la partie onc du plasmide
Ti. Lorsque l’opération est menée avec succès, on parle de Ti désarmé.

b. Méthode de vecteur binaire

Aujourd’hui on préfère la technique dite du vecteur binaire qui correspond à la coexistence


dans la cellule de 2 types de vecteurs : l’un est un Ti désarmé mais possédant ses gènes de
virulence et l’autre, un vecteur portant l’ADN à transférer inséré entre les 2 bordures typiques
d’un plasmide Ti. Cette disposition a été conçue dès lors qu’il a été démontré que le transfert
résultait d’activités indépendantes, bien que complémentaires de l’ADN–T et du reste du
plasmide Ti. L’efficacité d’un tel système a été très largement vérifiée chez un grand nombre
de dicotylédones. La quantité d’ADN transférable par cette technique est limitée mais
suffisante pour pouvoir contenir plusieurs gènes les uns à la suite des autres. Par contre, on ne
peut pas envisager le transfert de gros fragments d’ADN tels que les YAC ou les fragments
issus de l’électrophorèse en champs pulsés.

L’excision des oncogènes laisse une place suffisante pour être occupée par l’ADN exogène
représentant les gènes à transférer. Il s’agit dans la majorité des cas de 2 gènes, l’un étant le
gène d’intérêt et l’autre, placé en tandem avec le premier, étant un gène de repérage ou gène
marqueur ou encore gène reporter. Ce second gène sert d’étiquette au premier parce qu’il est
relativement plus facile à identifier par l’une des propriétés de son expression : gène de
résistance à un antibiotique, gène codant la synthèse d’une enzyme intervenant dans une
réaction dont le produit final est coloré (comme le gène GUS ou gène de la β – glucuronidase
provenant de E. coli et donnant une réaction de couleur bleue) ou entraînant une réaction de
fluorescence (luciférase du ver luisant par exemple).

Le choix de la résistance à un antibiotique est la solution la plus fréquemment retenue parce


qu’elle autorise un système de sélection très efficace. La résistance choisie est assez souvent la
résistance à la kanamycine ou néomycine phosphotranférase (APH III) dont le gène provient
d’un transposon bactérien (résistance bactérienne) ou encore insertion de la région codante du
gène de l’aminoglycoside transférase de type II (NPT II) provenant également d’un transposon
bactérien mais conférant une résistance aux cellules végétales. Ces gènes de résistance sont
insérés entre les séquences régulatrices du gène de la nopaline synthétase. Des résistances à
d’autres antibiotiques sont également utilisées (ampicilline) ainsi que des résistances à des
244
produits utilisés en agriculture comme le basta ou le glyphosate. Ces gènes marqueurs sont
placés entre des séquences de bordure et sont donc transférés dans les cellules de la plante.

Les gènes marqueurs sont très utiles pour sélectionner les cellules réellement transformées
parmi toutes celles soumises à une opération de transformation tandis que les gènes reporters
servent le plus souvent à suivre l’activité d’un promoteur aussi bien sur le plan de sa
localisation que de son niveau d’expression. Parmi les plasmides les plus souvent utilisés, on
peut citer le Bin 19 et le Bin plus. Le gène d’intérêt est celui dont le transfert devra conférer
la nouvelle propriété souhaitée à la plante. Cela peut être une propriété que ne possède pas le
végétal en général (gène bactérien, viral, animal) mais aussi une propriété que la plante
possède mais à un niveau considéré comme insuffisant et ne convenant pas.

Dans le premier cas, la propriété acquise sera relativement facile à repérer. Prenons par
exemple le gène de la luciférase du ver luisant inséré dans une plante. Son identification
pourra se faire en ajoutant au milieu de culture de la luciférine et de l’ATP. Une réaction
d’oxydation assurée par l’enzyme et consommatrice d’énergie, c’est-à-dire production
concomitante d’AMP, sera accompagnée d’une émission de photons. Un contact avec une
surface ou une pellicule photosensible permet de localiser avec une grande précision les lieux
d’émission de photons et par conséquent la présence des cellules transformées. La localisation
du gène n’altère en rien l’intégrité des cellules comme ce n’est pas toujours le cas avec
d’autres gènes reporters.

Si le gène est déjà présent mais que l’on juge son niveau d’expression trop faible, il est
possible de surexprimer en plaçant la partie codante sous un promoteur fort, c’est-à-dire un
promoteur qui n’est sensible à aucun des signaux de contrôle venant du génome de la plante.
Il en est ainsi du promoteur d’un gène codant pour un ARN du virus de la mosaïque du chou-
fleur (Cauliflor mosaic virus ou CaMV) qui est capable d’assurer la transcription, à un haut
niveau, du gène placé en aval si celui-ci est inséré en phase, c’est-à-dire à une distance
convenable, exprimée en nombre de paires de bases. Ce promoteur, appelé CaMV 35S est le
plus souvent utilisé mais il en existe bien d’autres comme le promoteur du gène de nopaline
synthétase ou encore ceux qui proviennent des gènes des protéines de choc thermique.

Si l’on veut, au contraire, diminuer ou même annuler l’activité transcriptionnelle d’un gène, on
a le plus souvent recours à l’insertion d’un gène antisens. La partie codante du gène dont il
convient de réduire l’exploitation est placée en position inversée sous le contrôle d’un
promoteur fort, ce qui entraîne la formation d’ARN–messagers qui se trouvent être
complémentaires des messagers formés par le gène correctement orienté. Il est généralement
admis que les 2 ARNm, orientés dans les deux sens complémentaires, peuvent s’apparier et
former des molécules dimériques inexplicables par le système de traduction de la cellule.
Aucune protéine correspondant à ces gènes ne peut être ainsi produite.

Un faible niveau d’expression peut s’expliquer par un appariement incomplet des messagers si
la classe des antisens est produite en plus faible quantité que l’autre. Les transferts des gènes
ne peuvent être considérés comme des succès que si l’on dispose d’un certain nombre de
témoins ou de contrôles. La présence d’un témoin est nécessaire pour une interprétation
correcte des résultats enregistrés. La résistance à l’antibiotique est une première indication
245
sérieuse sur la présence du gène mais elle doit être complétée par des contrôles de présence du
fragment d’ADN contenant le gène en utilisant par exemple des amorces en amont et en aval
et en recherchant sur gel la présence d’ADN de la masse moléculaire attendue.

On a recours à un Southern blot et la migration électrophorétique de l’ADN se fait


parallèlement avec celle des témoins de masses moléculaires connues. Ce Southern est suivi
par la recherche des ARN – messagers pour pouvoir confirmer l’activité de transcription du
gène (northern blot). La dernière opération consiste à identifier les protéines traduites par
western blot ou par confirmation d’une activité catalytique attendue s’il s’agit, comme c’est
souvent le cas, d’une protéine enzymatique. Parmi les autres témoins indispensables figure la
présence des plantes identiques, transformées avec le vecteur dépourvu du gène d’intérêt, mais
garni du gène de résistance à l’antibiotique. Les différences enregistrées seront plus sûrement
celles introduites par le gène que découlant des techniques de transformation. D’autres
témoins seront des plantes identiques ayant subi toutes les opérations de transformation mais
pour lesquelles le milieu de transformation était rigoureusement dépourvu d’agrobactéries
(témoins eau distillée).

• Autres transformations indirectes

On sait que le système de transformation indirecte par Agrobacterium ne fonctionne pas chez
toutes les plantes, en particulier chez la grande majorité des monocotylédones. On s’est alors
tourné vers les virus. Les géminivirus sont des virus à ADN, mais dont les 2 chaînes ne
s’apparient pas. L’une porte le caractère infectieux et l’autre est capable de se répliquer dans
les cellules végétales. La présence simultanée de 2 molécules est cependant indispensable à
leur activité. Il est possible de détecter une partie de la molécule d’ADN codant pour des
protéines de l’enveloppe et la remplacer par le transgène. Il faut que celui-ci soit de petite
taille pour espérer aboutir à la transformation de la cellule hôte. Cette technique a donné peu
de résultats et a été dans quelques cas avantagieusement remplacée par les méthodes de
transfert direct.

• Méthodes directes de transformation génétique

L’importance des graminées et autres monocotylédones et la difficulté de les transformer par


les méthodes indirectes ont été à l’origine du développement des méthodes de transfert direct,
c’est-à-dire des méthodes qui ne font pas appel à un intermédiaire sous la forme d’un
organisme vivant. Parmi ces méthodes on peut citer :

La technique de fusion des protoplastes avec des liposomes grâce


au polyéthylène glycol en solution dans le milieu de culture.

Ces liposomes peuvent contenir des fragments d’ADN suffisamment grands pour renfermer un
ou plusieurs gènes. La probabilité de transfert de cet ADN dans le noyau de la cellule végétale
est cependant extrêmement faible compte tenu de la présence, dans le cytoplasme de la cellule
hôte, de nombreuses nucléaises et l’absence d’adressage nucléaire du transgène. Il faut ajouter
246
à cela la très grande difficulté de régénérer les plantes à partir de protoplastes, en particulier
chez les plantes cultivées. Aussi cette technique n’a – t – elle pas connue de développement.

La microinjection

Cette technique utilise un micromanipulateur associé à un microscope photonique inversé, le


tout placé sous une hotte à flux laminaire car des conditions rigoureuses d’asepsie durant toute
la manipulation est indispensable. La microinjection doit être conduite sur des protoplastes en
culture et ceci de façon individuelle pour chaque protoplaste à transformer. On comprendra
que le rendement ne peut être que très faible et surtout très peu en rapport avec l’attention et
l’investissement considérable en travail technique. En pratique, un protoplaste est prélevé au
sein d’une culture, placé dans une micro–chambre stérile et maintenu à l’extrémité d’une
canule de verre dont le diamètre est bien inférieur à celui du protoplaste.

Ce maintien est obtenu grâce à une légère dépression imposée dans la canule par le recul
micrométrique du piston d’une seringue reliée à la canule par un petit cathéter. Une fixation
est considérée comme particulièrement favorable lorsque le noyau du protoplaste se trouve à
l’opposé du point de fixation. En effet, il faudra amener au contact du protoplaste, dans la
région voisine du noyau, grâce à un système micrométrique de déplacement, l’extrémité d’une
micro – aiguille de verre, qui est en fait une micro – électrode, contenant l’ADN à injecter.
Cette micro – aiguille est reliée par un cathéter à une seconde seringue dont l’avancée
micrométrique du piston impose une légère surpression destinée à libérer le contenu de la
micro – aiguille dans le noyau du protoplaste. Ce dernier est alors libéré, remis en culture et
suivi jusqu’à la régénération de la plante. Cette technique, particulièrement délicate, a été mise
au point par un américain, Miss Croshaw.

L’électroporation

Cette technique est aujourd’hui largement utilisée dans les laboratoires travaillant sur les
microorganismes, bactéries et levures. Il s’agit d’une adaptation des paramètres essentiels,
durée et intensité de choc électrique, aux caractéristiques des cellules eucaryotes et plus
particulièrement pour les végétaux, des protoplastes. Les protoplastes peuvent ainsi être
transformés en plaçant la culture en présence d’une solution concentrée d’ADN plasmidique
contenant l’insert dans une chambre munie d’électrodes entre lesquelles est créé un champ
électrique (de 200 à presque 1000v par centimètre et d’une durée de quelques micro à milli –
secondes). Les fabricants d’électroporateurs ont prévu ces extensions mais la diffusion de ces
appareils a été freinée soit par le prix élevé de l’installation, soit par les faibles performances
des appareils financièrement abordables. Des initiatives artisanales heureuses, relevant parfois
plus de bricolage, se sont développées dans certains laboratoires et ont donné de remarquables
résultats.

La biolistique

Cette technique est particulièrement développée dans le secteur des biotechnologies végétales.
Il s’agit d’une technique de bombardement des cellules ou des tissus végétaux à l’aide des
microbilles de métal enrobées d’ADN et projetées par canon. Ce canon était autrefois (vers les
247
années 1986-87) un fusil de chasse de calibre 22 LR et les cartouches chargées de poudre et de
microbilles de tungstène de l’ordre du micromètre de diamètre. L’ADN est collé à la
microbille par une solution de spermidine. La cible était une feuille du végétal étalée sur un
papier filtre. Le coup de fusil transmettait une énergie cinétique aux microbilles alors animées
d’une vitesse de l’ordre de 400 à 500 m par seconde, ce qui entraînait la mort des cellules
touchées de plein fouet par les microbilles. Cependant, à la périphérie de l’impact, des
cellules appartenant à l’épiderme ou au parenchyme palissadique sous – jacent pouvaient
recevoir quelques projectiles sans être tuées.

Parmi ces cellules survivantes, certaines avaient reçu des projectiles dans les chloroplastes,
d’autres dans le noyau et il a été montré que des gènes étrangers avaient ainsi pu pénétrer et
s’exprimer. La technique a évolué et le fusil est remplacé par une bouteille de gaz sous
pression, comme de l’hélium liquide par exemple. Ce gaz comprimé de l’ordre de 200
atmosphères est ramené à une pression de 5 à 8 bars par un détendeur réglable qui permet de
remplir un petit sac, sorte de petite chambre fermée à sa partie inférieure par une électrovanne,
dont on peut commander et même régler la durée d’ouverture.

Cette électrovanne donne directement sur un dispositif analogue à un porte – filtre muni d’une
grille métallique sur laquelle on dépose les microbilles de tungstène enrobées de l’ADN à
transférer. L’hélium ainsi brutalement libéré, projette les microbilles vers la cible constituée
par une boîte de Pétri contenant le matériel végétal (feuilles, fragments des feuilles, disques
foliaires, cellules en suspension, graines, etc). Le dispositif porteur des microbilles et la cible
sont placés dans une enceinte vitrée, étanche, dans laquelle on réalise un vide partiel, ce qui
facilite la trajectoire des billes et contribue efficacement au maintien des conditions de
stérilité. L’ensemble de l’appareillage est d’ailleurs disposé dans une hotte à flux laminaire à
cet effet. Les paramètres que l’on peut faire varier sont : la pression de sortie du détendeur, la
quantité des projectiles, la concentration de l’ADN et la distance de la cible par rapport à la
vanne.

Quelques exemples de plantes transgéniques

1. Le gène de résistance au glyphosate, un herbicide prélevé chez une bactérie du genre


Salmonella, a été intégré et fonctionné dans les plants de tabac.

2. Des plantes génétiquement manipulées pour résister aux virus et aux bactéries. C’est le cas
des plants de tabactransgéniques renus résistants à la maladie provoquée par le virus de la
mosaïque du tabac. Les chercheurs ont greffé un gène du virus de la mosaîque du tabac à des
plantes de cette espèce, de façon que la protéine synthétisée sous l’action de ce gène déclenche
le mécanisme de protection contre l’infection par le virus entier. Ils ont choisi le gène de
l’enveloppe du virus ; ce gène n’ayant aucun caractère infectieux. On s’est en effet basé sur le
principe de la vaccination. Le plasmide Ti d’Agrobacterium tumefaciens a été utilisé pour
greffer le gène viral à des cellules de tabac en culture.
248
3. Le gène de la bactérie Bacillus thurigiensis qui gouverne la synthèse d’une toxine mortelle
pour les insectes ou leurs larves, mais inoffensive pour les animaux a été greffé à des cellules
de tabac. Exposés pendant plusieurs jours en serre à des chenilles, les plants transgéniques ont
gardé leurs feuilles quasiment intactes alors que les insectes mourraient en masse.

4. Le projet de créer des céréales directement fixatrices d’azote atmosphérique. Il s’agit de


l’introduction des gènes responsables de la capacité de fixer l’azote atmosphérique (gènes Nif)
dans d’autres espèces de plantes au moyen du plasmide Ti bricolé. Ces gènes pourraient être
transférés de Rhizobium à d’autres types de cellules. Ce grandiose projet parraît encore loin
d’aboutir. Cette exparience a cependant échoué chez la levure de la biere.

5. Le projet de faire vivre Rhizobium en symbiose avec des plants de céréales. Il s’agit de
modifier génétiquement le Rhizobium, mais aussi les céréales. En fait Rhizobium et les
légumineuses échangent des messages chimiques. C’est à la suite de ces échanges que les
cellules des racines commencent à former des nodules. La léghémoglobine (fournie par les
légumineues) est indispensable au bon fonctionnement de la nitrogénase, enzyme clef dans la
conversion de l’azote atmosphérique en NH3. Il faudrait en greffer le gène dans les céréales.

6- Les plantes génétiquement modifiées pour résister aux virus et aux bactéries : des plants de
tabac transgéniques rendus résistants à la maladie provoquée par le virus de la mosaïque de
tabac. Les chercheurs ont greffé un gène du virus de la mosaïque de tabac à des plants de cette
zspèce de façon que la protéine synthétisée sous l’action de ce gène déclenche le mécanisme
de protection contre l’infection par le virus entier. Ils ont en effet choisi le gène de l’enveloppe
du virus ; ce gène n’ayant aucun caractère infectieux (le principe de la vaccination). Le
plasmide Ti a été utilisé pour gefer le gène viral à des cellules de tabac en culture.

7- Les plantes qui tuent les insectes : il s’agit des plants de coton qui tuent les insectes. Un
gène prélevé chez la bactérie, Bacillus thuringiensis, a été greffé à des plants de tabac et de
coton. Ce gène gouverne la synthèse d’une toxine mortelle pour les insectes ou leurs larves
mais inoffensive pour les animaux. Les chercheurs ont réussi à faire fonctionner le gène en
question dans les cellules de tabac manipulées.

8- Ce gène de Bacillus turingiensis qui gouverne la synthèse d’une toxine mortelle pour les
insectes a été greffé à Pseudomonas fluorescens, bactérie vivant habituellement au contact des
racines des céréales et autres plantes cultivées. Dans ce cas les cibles de la toxine des
Pseudomonas fluorescens étaient les chenilles vivant dans le sol et dévoreuses des racines.

Risques écologiques

Les manipulations génétiques des plantes avaient pratiquement toutes pour objectif de protéger
les récoltes, soit contre les virus et les bactéries, soit contre les insectes ravageurs de cultures
ou soit contre les déserbants chimiques employés par les agriculteurs pour débarrassser leurs
champs de mauvaises herbes. Ces manipulations présentent cependant de nombreux risques :
a- Les effets sur la santé de nombreux herbicides : la plupart de ces herbicides semblent
persister longtemps dans l’environnement et se retrouver dans les eaux souterraines et
249
finalement dans les eaux de boisson. b- transfert éventuel des céréales aux herbes du gène de
résistance aux herbicides ; ce qui peut conduire à une production des herbes résistantes (à ces
herbicides).

Clonage des végétaux

Le clonage consiste à une multiplication en série d’êtres génétiquement identiques. En fait les
végétaux pratiquent ce type de multiplication dans la nature. On parle alors de la multiplicative
comme le bourgeonnement, c’est-à-dire sans passer par les mécanismes de ma sexualité. C’est
le clonage naturel. Le clonage artificiel chez les végétaux se fait par les méthodes de
micropropagation, d’organogénèse et d’embrogénèse somatique.

La méthode de micropropagation consiste à prélèver un bourgeon sur une plante adulte et de le


cultiver en éprouvette de manière à ce qu’il prolifère et donne naissance à 3 ou 8 nouveaux
bourgeons accolés. Ceux-ci sont à leur tour isolés et cultivés en éprouvette, régénérant de
nouveaux multiples bourgeons accolés qui à leur tour…….. chacun de nouveaux bourgeons
peut être induit par des taitement appropriés à régénérer une plnate complète. On peut ainsi
obtenir en un an, 200.000 400.000 plants tous identiques au plant du départ.

Le principe de la méthode d’organogénèse est que les cellules des tissus végétaux, si on les
soumet à certains traitements en éprouvette, peuvent se différencier assez facilement et
proliférer pour former un agrégat de cellules appelé cal. D’autres traitements, avec des
hormones végétales, sont capables d’inciter des cellules d’un cal à former de nombreux
bourgeons. Ceux-ci peuvent se développer en petites pousses accolées que l’on peut séparer et
faire prendre racines, régénérant ainsi un plant complet. On peut de cette manière partir d’un
morceau de feuille prélèvé sur un plant initial pour arriver à obtenir de multiples répliques de
ce plant.

Dans la méthode d’embryogénèse somatique, un morceau de feuille quelconque est prélèvé sur
un plant initial. On le remet en culture et il va produire un cal de cellules indifférenciées. Le
cal est ensuite soumis aux conditions telles par exemple la culture en milieu liquide. Les
cellules du cal vont produire ce qu’on appelle des embryons somatiques. Il s’agit de petits
plants à l’état embryonnaire (avec de minuscules tiges, racines et bourgeons terminaux), tout à
fait semblables aux embryons des plants que l’on trouve à l’intérieur des graines issues de la
reproductionsexuée chez les plantes à fleurs.

Les eembryons somatiques poussant sur les cals peuvent être très nombreux et
s’automultiplier, tout en restant accolés. Chacun de ces embryons, une fois séparé, peut
régénérer un plant identique à celui qui a fourni le morceau de tissu à l’origine du cal. Si on
laisse se multiplier assez longtemps les embryons, on peut atteindre plusieurs centaines de
millions de répliques du plant initial.
250
6.5 THERAPIE GENIQUE

La thérapie génique est une méthode thérapeutique, pour l’heure expérimentale, qui se base
sur un principe suivant : l’absence ou la structure défectueuse d’un gène peut modifier la
composition des protéines produites par la cellule, provoquant des anomalies génétiques. De
ce fait, si un gène est responsable d’une maladie, il suffit de remplacer le gène défectueux par
le gène intact pour guérir la maladie. C’est une nouvelle approche de traitement ou de
prévention des maladies qui utilise les gènes comme médicaments ou pour modifier un
comportement cellulaire. Il s’agit d’une stratégie thérapeutique consistant à faire pénétrer des
gènes dans les cellules ou les tissus d'un individu pour traiter une maladie. Elle vise à
remplacer ou complémenter un allèle mutant défectif par un allèle fonctionnel ou à
surexprimer une protéine dont l'activité aurait un impact thérapeutique.

Alors que le concept de thérapie génique est né sur l'idée de traiter des pathologies
héréditaires, il s'est rapidement orienté vers le traitement de toutes les affections, héréditaires
ou non, dans lesquelles il était possible d'imaginer que certains gènes étaient défectueux ou
qu'il était possible d'envisager un rôle pour de nouveaux gènes : les cancers, les infections
virales, la douleur, les affections cardiaques, les atteintes traumatiques du système nerveux, ...
La notion de thérapie génique est aujourd’hui davantage un principe général plutôt qu’une
technique précise, car les méthodes utilisées sont extrêmement diverses, selon que le
traitement a pour but la production d’une protéine active remplaçant une protéine manquante
ou inactive ou de lutter contre les maladies comme le cancer ou le Sida.

Il existe deux grandes formes de thérapie génique : germinale et somatique. La première


modifie le génome des cellules germinales (le caractère ajouté peut donc être transmis de
génération en génération), la seconde modifie le génome des cellules somatiques (le caractère
ajouté n’est peut donc pas être transmis à la descendance. Aujourd’hui seule la thérapie
génique somatique est autorisée sur les humains. La correction d’un défaut génétique par une
intervention sur l’ADN peut se concevoir à deux niveaux : - soit comme une thérapie des
gènes, c’est-à-dire une correction du génotype par réparation de l’anomalie génique ; - soit
comme une thérapie par des gènes, c’est-à-dire comme une correction du phénotype par greffe
en un site quelconque du génome d’une version normale du gène, assurant la suppléance du
gène défectueux laissé en place.

La première opération est idéale car la correction a lieu in situ, le gène réparé restant dans son
environnement génomique naturel et demeurant soumis à ses mécanismes de régulation
normaux. C’est pour l’instant un objectif techniquement hors d’attente, car on ne sait pas
encore réparer spécifiquement une lésion donnée dans un gène donné. La seconde opération
consiste à apporter un gène fonctionnel en laissant en place le gène muté. Le gène greffé est
inséré de manière aléatoire et il a perdu sa régulation, sauf si on peut le flanquer de ses
séquences régulatrices. Si la correction est effectuée dans une cellule germinale ou dans une
cellule de l’embryon précoce, elle est transmissible à la descendance. C’est la génothérapie
germinale, une manipulation du génome constitutionnel. Elle apporte une correction
phénotypique à un groupe cellulaire déterminé et à sa descendance sans affecter le patrimoine
génétique constitutionnel de l’individu (génothérapie somatique).
251
La génothérapie germinale est inapplicable à l’homme, pour des raisons à la fois techniques et
éthiques. En revanche, elle constitue chez l’animal un précieux modèle expérimental. La
génothérapie somatique appliquée à l’homme ne soulève pas plus de problèmes éthiques que
n’importe quelle greffe ou transplantation et constitue la seule stratégie envisagée à des fins
médicales. Quelle que soit la stratégie envisagée, on essaie toujours de rester aussi près que
possible des conditions physiologiques. Idéalement il faudrait que le gène réparé ou greffé
soit exprimé normalement et de façon régulée, c’est-à-dire au bon endroit (dans un type de
cellule approprié), au bon moment (à un stade approprié du développement ou de la
différenciation) et en quantité normale et adaptée aux besoins. De plus, la correction ou la
greffe doit être stable indéfiniment. Mais, bien qu’elle apparaisse comme quasi miraculeuse,
la thérapie génique est encore à un niveau expérimental. Les tentatives de thérapie génique
sur les humains ont donné des résultats plus ou moins concluants. Cependant, de nombreuses
recherches sont en cours et laissent présager un avenir prometteur pour les générations à venir.

6.5.1 MATERIEL GENETIQUE A TRANSFERER

On utilise des constructions comportant : le gène à greffer muni de séquences annexes assurant
un bon niveau d’expression (promoteur fort, …) auquel on adjoint éventuellement un gène
auxiliaire conférant un avantage sélectif (gène neo, conférant la résistance à l’antibiotique
G41B ; gène dhfr, conférant la résistance au méthotrexate). Ces constructions sont effectuées
soit dans un vecteur plasmidique, soit dans un vecteur viral. Le gène à greffer est toujours une
séquence clonée. Le plus souvent, on utilise un ADNc qui représente une forme compactée de
l’information génétique ; on se prive toutefois des séquences régulatrices endogènes. Lorsque
le gène est petit, on peut envisager de transplanter l’ADN génomique muni de ses séquences
régulatrices proches.

6.5.2 CELLULE CIBLE

Le transfert des gènes peut se faire soit dans les cellules somatiques ou soit dans les cellules
germinales. Le transfert dans les cellules somatiques offre de nombreux avantages : les
problèmes éthiques, le risque d’expression ectopique et les difficultés liées au rendement
aléatoire sont simplement éliminés. Dans un premier temps, les gènes sont transférés dans des
cellules en culture et dans un deuxième temps, les cellules effectivement greffées sont
réintroduites dans l’animal. Les cellules hématopoïétiques ont au départ été utilisées. Les
fibroblastes, les kératinocytes et les hépatocytes sont également utilisés comme cellules cibles.
Par la suite, les cellules où la greffe a réussi sont réintroduites dans l’animal dont les cellules
sont originaires. Ceci élimine le risque de réaction immunologique immédiate, bien que la
protéine fabriquée par le gène exogène peut à la longue déclencher la production d’anticorps
chez l’animal receveur. Dans les expériences de transfert dans les cellules germinales, le gène
apporté est en principe présent à l’état intégré dans l’ADN de chaque cellule de l’organisme
transgénique. Lorsqu’elle a lieu dans le tissu convenable, elle risque de ne pas être soumise
aux mécanismes de régulation spécifiques du gène endogène.
252
6.5.3 MODE DE TRANSFERT

Le mode de transfert varie en fonction de deux critères principaux : le type de cellule cible et
l’efficacité recherchée. Pour les expériences de génothérapie germinale, on recourt soit à la
micro-injection dans le pronucléus mâle d’un ovocyte fécondé (en général de souris) de
quelques centaines de copies d’une séquence d’ADN, soit au transfert par électroporation ou
par vecteur rétroviral dans des cellules embryonnaires pluripotentes (cellules ES). Pour les
expériences portant sur les cellules somatiques, on cherche à obtenir une efficacité maximale.
C’est pourquoi l’utilisation des vecteurs viraux, qui offre une efficacité proche de 100 % a
supplanté les autres procédés (transfert par électroporation, transfection sous forme de
précipité de phosphate de calcium, fusion de protoplastes ou de liposomes).

6.5.4 VECTEURS

Vecteurs viraux

L'utilisation de virus modifiés pour transporter un gène thérapeutique repose sur le constat
d'efficacité des virus pour transférer leur propre matériel génétique dans les cellules humaines.
En fait, la thérapie génique utilise des virus modifiés génétiquement, dits sécurisés. Le
principe consiste à éliminer les séquences du virus qui codent des protéines, notamment celles
associées à un éventuel comportement pathogène du virus, et à ne conserver que celles qui
sont utilisées pour construire la particule virale et assurer le cycle d'infection. Le génome du
virus est reconstruit pour porter les séquences du gène thérapeutique. Les protéines virales qui
potentiellement manqueraient à la formation des particules virales thérapeutiques sont fournies
par des cellules dites productrices ou d'encapsidation lors de la phase de production des
vecteurs.

Un bon vecteur doit être sûr, efficace, capable de fonctionner dans les cellules qui ne se
divisent pas et d’assurer la stabilité de l’expression du gène thérapeutique. De plus, sa
production industrielle doit être fiable et rentable. De ce point de vue, les vecteurs les plus
utilisés pour le transfert des gènes sont les vecteurs viraux. Il suffit d’éliminer la séquence
responsable de la pathogénicité du virus et d’insérer le gène thérapeutique à son génome,
certaines propriétés du virus assureront le transfert du gène vers le noyau de la cellule ciblée ;
la manipulation des virus pose cependant de nombreux problèmes.

Actuellement on utilise plusieurs types de vecteurs viraux : les rétrovirus (les plus couranrts),
l’adénovirus, le virus AAV (Adeno-Associated Virus) et le virus de l’herpès. Les vecteurs
viraux utilisés conservent les séquences indispensables comme les LTR pour le contrôle de la
transcription et de l’intégration, la séquence ψ nécessaire pour l’encapsidation ainsi que les
séquences PB nécessaires pour la réplication virale alors que les gènes viraux gag, pol, env
sont délétés et remplacés par le gène à greffer, placé en principe sous son propre promoteur ou
sous un promoteur jugé plus puissant (celui du virus SV40 par exemple) et éventuellement
accompagné d’un autre gène servant de marqueur de sélection.

Les constructions les plus récentes sont : a- les poxvirus (Carnarypox virus), qui ont une forte
capacité d’infection des cellules avec ou sans division. Il n’y a pas d’intégration dans l’ADN.
253
L’importance de leur génome permet de larges insertions génétiques. En outre, ils présentent
une faible toxicité pour le patient et l’environnement ; b- les lentivirus, qui sont des dérivées
d’une autre famille rétrovirus, capables de transduire des cellules qui ne se divisent pas. La
possibilité d’obtenir la formation accidentelle de particules infectieuses (HIV) est exclue.

Vecteurs adénoviraux

L’adénovirus est un virus à ADN. Il présente la caractéristique de faire pénétrer son matériel
génétique dans la cellule cible sans attendre la mitose et sans insérer la nouvelle information
génétique dans le génome de la cellule cible. Bien que très utilisés dans de nombreux essais
cliniques, les chercheurs n’arrivent toujours pas à ce jour à le débarrasser complètement de ses
gènes, maintenant ainsi un caractère potentiellement pathogène au vecteur construit.

Vecteurs rétroviraux

Les rétrovirus sont utilisés comme vecteur en thérapie génique car ils permettent d'insérer la
nouvelle information génétique dans le génome de la cellule cible. Le nouveau gène se
transmet alors de cellules mères en cellules filles de manière égale sans "dilution" de
l'information génétique dans le temps. Les rétrovirus possèdent de l'ARN comme matériel
génétique, et non de l'ADN comme les adénovirus. L'ARN est une molécule d'expression de
l'ADN, qui comporte la partie de séquence correspondant à une protéine. Cette molécule est
synthétisée dans le noyau et transite dans le cytoplasme, où le code qu'elle porte de la protéine
est lu lors de la synthèse de la protéine. L'infection par un rétrovirus implique une étape de
rétrotranscription de l'ARN en un fragment d'ADN qui sera intégré aux chromosomes après
transduction dans le noyau cellulaire.

Une combinaison de protéines virales et de protéines de la cellule cible assure cette étape de
transfert des molécules d'ADN du cytoplasme cellulaire vers le noyau et l'intégration dans le
génome de l'hôte. Si la plupart des essais cliniques ont été réalisés avec des vecteurs dérivés
de rétrovirus de souris, certains essais cliniques sont actuellement en cours utilisant des
vecteurs dérivés du virus HIV (traitement de l'adrenoleucodystrophie par l'équipe Aubourg à
Paris depuis 2007, traitement de l'infection à VIH aux États-Unis depuis 2000). Ce dernier
type de vecteur, dit vecteur lentiviral, dérivé d'un virus humain mais totalement sécurisé est un
vecteur particulièrement en vogue. En effet, il est capable de modifier génétiquement des
cellules au repos, ouvrant ainsi des possibilités de manipuler des neurones, des cellules
hépatiques,... toute une gamme de populations cellulaires inaccessible aux vecteurs rétroviraux
dérivés de virus murins.

Vecteurs dérivés de l’AAV

Les vecteurs de type AAV (Adeno Associated Virus) sont dérivés de virus dits associés aux
adénovirus. Ces virus ont la particularité de favoriser une intégration de leur génome toujours
au même endroit dans le chromosome 19. Une insertion non contrôlée pouvant entraîner
d'importants désordres dans la fonction cellulaire, ces vecteurs ont été fortement développés
pour leur potentiel sécuritaire bien qu’ils ne soient capables que de transférer de petits gènes.
254
Bien que la construction du vecteur à partir du virus élimine cette propriété de ciblage de
l'insertion, les virus dérivés des AAV ont été beaucoup utilisés au niveau clinique. Longtemps
considérés comme innofensifs, à l'inverse des vecteurs adénoviraux et rétroviraux, leur
développement a été favorisé depuis quelques années. Mais, le décès récent au cours de l'été
2007 d'un patient dans un essai clinique de traitement de la polyarthrite rhumatoïde par des
vecteurs dérivés de l'AAV permet aussi désormais aux détracteurs de cette stratégie de pointer
le doigt sur ce type de vecteur.

Vecteurs dérivés d’autres virus

Au-delà de ces vecteurs fréquemment utilisés en clinique, de nombreuses tentatives


d’utilisation de vecteurs à partir de virus sont décrits dans la littérature. On relèvera de
nombreux travaux concernant l’utilisation du virus Herpes Simplex (HSV), des poxvirus
(actuellement en développement clinique), de virus animaux apparentés à HIV, du virus de la
grippe, …. Ces diverses tentatives témoignent d'une part de l'inexistence d'un vecteur viral
universel poussant les scientifiques à tester de nouvelles voies, et d'autre part de la volonté
pour certains industriels de se positionner dans le domaine avec des brevets propriétaires.

Vecteurs non viraux

Différentes stratégies ont été élaborées pour ne pas recourir aux virus et utiliser directement la
molécule d'ADN. Ces stratégies reposent sur la combinaison de molécules chimiques
(polycations, ...) avec la molécule d'ADN afin de faciliter la traversée de la membrane des
cellules et la rentrée des molécules d'ADN. Ces vecteurs produits par des bactéries, facilement
purifiables, sont des particules inertes et n'ont pas les caractères potentiellement pathogènes
des virus qui sont à l'origine des vecteurs viraux. A l'inverse des vecteurs viraux, ils sont plus
faciles à produire, à manipuler et à stocker et sont caractérisables comme des produits
pharmaceutiques classiques.

Cependant, leur efficacité est bien moindre que celle des virus pour transférer une information
génétique dans une grande population de cellules, rendant difficile leur utilisation dans
certains cas (modification d'une grande partie des cellules d'une tumeur par exemple).
En outre, ils n'ont qu'une capacité très réduite à intégrer l'information génétique dans le
génome, les rendant ainsi inutiles pour des modifications génétiques pérennes de populations
cellulaires en prolifération active. Cette technologie peut être cependant parfaitement adaptée
à certaines stratégies thérapeutiques reposant sur le déclenchement d'une cascade
d'évènements à partir de quelques cellules modifiées génétiquement comme par exemple
l’activation du système immunitaire.

Vecteurs plasmidiques

Les plasmides offrent certains avantages par rapport aux virus : facilité de manipulation,
capacité d’insertion de séquences importantes, faibles immunogénicité. Les plasmides sont
introduits dans les cellules par électrotransfert appelé aussi électroporation ou
électroperméabilisation. Il s’agit d’une technique consistant à soumettre les cellules à des
255
impulsions électriques pour y faire pénétrer les séquences d’ADN. L’efficacité de transfert est
cependant faible.

6.5.5 METHODES DE TRANSFERT

La thérapie génique repose sur la recherche fondamentale. Les mécanismes biologiques mis en
évidence et leurs origines génétiques sous-jacentes permettent d’imaginer des stratégies de
réparation ou de supplémentation. La réussite de ces stratégies dépend donc autant des
capacités à mettre en place des techniques adéquates (transfert de gène efficace, expression
cohérente du gène, …) que de la justesse avec laquelle sont appréhendés les mécanismes en
cause. Leur limite ne dépend que de l’imagination de la communauté scientifique et médicale.

Aujourd’hui trois méthodes sont utilisées pour introduire des gènes : a- la méthode de thérapie
génique ex-vivo, qui consiste à extraire des cellules du patient et d’y insérer, à l’aide des
vecteurs, les gènes modifiés pour ensuite réintroduire les cellules dans l’organisme ; b- la
méthode de thérapie génique in vivo, consistant à injecter le vecteur portant le gène
thérapeutique directement dans la circulation sanguine ; le gène thérapeutique devant atteindre
spécifiquement les cellules cibles ; c- la méthode de thérapie génique in situ, qui consiste à ce
que le vecteur de transfert soit directement placé au sein du tissu cible. C’est le cas par
exemple de l’introduction des vecteurs adénoviraux dans la tranchée et les bronches des
patients atteints de mucoviscidose. L’évolution de la thérapie génique a permis le
développement des variantes de ces méthodes notamment.

D’autres méthodes sont également utilisées : d- la méthode consistant à soumettre les cellules
à un choc électrique pour assurer la pénétration du gène dans la cellule ; e- la méthode
consistant à fabriquer des organoïdes (petits organes). Ce sont des néo-organes formés des
cellules traitées par génie génétique que l’on implante en petits amas à l’intérieur du péritoine
recouvrant les organes digestifs. Peu à peu, les cellules implantées se multiplient et fabriquent
la protéine manquante, qui passe ensuite dans la circulation sanguine et exerce ses effets à
distance ; f- dans le traitement de cancers, on utilise des techniques suicides qui bloquent la
multiplication des cellules tumorales en les détruisant ou des méthodes qui tendent à stimuler
les défenses de l’organisme contre le cancer. Il s’agit de transférer des gènes rendant les
cellules cibles sensibles à une drogue.

L’objectif est d’activer une pro-drogue non toxique en une drogue cytotoxique uniquement au
sein des cellules tumorales. Le principe est de transférer in vivo, dans les cellules tumorales,
un gène codant pour une enzyme normalement absente du patrimoine des cellules. Cette
enzyme a la capacité de transformer la pro-drogue non toxique en un métabolite toxique.
C’est le cas par exemple de la thymidine kinase du virus de l’herpès (HSV) de type 1 qui agit
comme pro-drogue sur le ganciclovir, normalement inoffensif. Seul le ganciclovir
triphosphate est actif, la première phosphorylation se faisant par la thymidine kinase virale. L’
anciclovir – thymidine kinase est un analogue nucléoside de la guanosine qui s’incorpore aux
chaînes d’ADN en élongation et induit l’apoptose.

A l’heure actuelle, le cancer est considéré comme une maladie importante pour les recherches
sur la thérapie génique. La stratégie de thérapie génique la plus commune pour traiter le
256
cancer est d’administrer des gènes thérapeutiques qui peuvent induire l’apoptose ou mort
programmée dans les cellules tumorales. Le gène qui est livré dans la majorité des cas est un
gène qui produit du p53, un suppresseur de tumeurs identifié qui est muté ou supprimé dans de
nombreux cas de cancer chez l’homme. Le rôle de p53 est de contrôler le cycle cellulaire. Si
quelque chose endommage l’ADN d’une cellule, la protéine p53 bloque le cycle cellulaire
pour permettre la réparation de l’ADN ou si les dommages ne sont pas réparables, elle induit
l’apoptose. Si le gène p53 est muté ou ne fonctionne plus, l’ADN ainsi que les cellules
endommagées peuvent disparaître sans contrôle.

Dans le cas de cancer, des tumeurs peuvent se développer. De nombreuses thérapies géniques
pour lutter contre les cancers sont axées sur la réparation ou l’ajout du gène producteur de p53
dans les cellules cancéreuses afin d’induire l’apoptose. Un médicament sur base du gène p53
est actuellement aux dernières étapes des essais cliniques. De nombreuses stratégies de
blocage biologique ont vu le jour dans les années 1990 essentiellement pour contrer l’infection
par le virus HIV : expression de protéines virales mutées (leurre) interférant avec les protéines
naturelles du virus, expression d’ARN anti-sens capables d’inhiber la traduction de protéines
virales, expression de molécules de protection naturelle de la cellule (interférons, protéines de
déclenchement de l’apoptose, …), …

Toutes ces stratégies reposent sur une interférence entre les diverses phases du cycle de
multiplication du virus et une protéine ou un ARN dont la production est assurée par un
vecteur exogène transféré dans les lymphocytes T du patient. Dans un autre domaine, de
nombreux groupes travaillent sur l’expression de protéines impliquées dans les mécanismes
immunitaires pour bloquer les rejets de greffe (production d’inhibiteur du complément, de
cytokines immunosuppressives dérégulant le mécanisme de réponse immunitaire, d’inhibiteurs
des interactions entre greffon et cellule immunitaires, …). Bien que peu développées certaines
approches s’intéressent également à l’inhibition de la douleur par l’expression de Pre-
proenkephaline. Des approches récentes se sont portées sur l’expression de protéines
impliquées dans le développement embryonnaire (protéine NeuroD ou protéine PDX1) pour
modifier le statut des cellules hépatiques et les transformer quasiment en cellules
pancréatiques afin de redonner au patient diabétiques des cellules capables de produire de
manière régulé de l’insuline.

6.5.6 PREMIERS RESULTATS EXPERIMENTAUX

La plupart de travaux sur la thérapie génique ont essentiellement porté sur la recherche d’une
expression stable, abondante et surtout spécifique du tissu, dans les cellules non déficientes.
Dans un petit nombre de cas cependant, un véritable effet thérapeutique a été recherché et
parfois obtenu. Un exemple de premiers résultats expérimentaux de la génothérapie germinale
concerne la correction du déficit en ornithine carbamyl transférase (OCT) par transgenèse chez
des souris spf-ash par Cavard et al. en 1988. L’OCT est une maladie héréditaire liée au
chromosome X. Chez l’homme, elle est la cause la plus fréquente des hyper-ammoniémies
néonatales héréditaires. Normalement l’enzyme est exprimée au niveau des mitochondries
hépatiques et intestinales, mais elle est codée par un gène nucléaire porté par le chromosome
X. Il existe deux formes de la maladie de gravité différente. La forme la plus sévère, avec
257
absence complète ou quasi complète d’OCT fonctionnelle, entraîne la mort dans les premiers
jours ou les premières semaines de la vie.

L’autre forme, moins sévère et plus tardive, se manifeste par une activité d’OCT résiduelle
comprise entre 5 et 35 %. Il existe deux lignées de souris produisant ces deux formes
cliniques : la lignée spf (sparse fur) pour la première et la lignée spf-ash (sparse-fur wish
abnormal skin and hair) pour la seconde forme. Elles constituent d’excellents modèles
animaux de la maladie humaine et des modèles privilégiés pour les expériences de thérapie
génique. Chez la souris spf-ash, outre les signes biologiques observés chez l’homme, le
phénotype est caractérisé par une absence de pelage et une hypotrophie marquée jusqu’au
sevrage. Une thérapie génique a été réalisée par micro-injection dans des embryons mâles
atteints de la mutation spf-ash d’une construction plasmidique (50 copies) comportant un
ADNc codant pour l’OCT de rat attaché au promoteur précoce du virus SV40. Les
souriceaux porteurs de transgène OCT ont un phénotype normal.

Biologiquement, la correction phénotypique s’accompagne d’une disparition de l’élimination


urinaire d’acide orotique, stigmate majeur de la maladie. Chez les animaux transgéniques,
l’OCT de rat transférée est majoritairement exprimé dans le foie et de faible façon dans le
poumon et la rate. Cette expression ectopique n’entraîne pas de phénomène pathologique chez
l’animal. Les principaux obstacles rencontrés dans ces expériences concernent le caractère
aveugle de l’intégration, la difficulté d’obtenir une expression suffisante et régulée dans le bon
tissu, le caractère aléatoire et imprévisible des résultats. En ce qui concerne la génothérapie
somatique, les cellules les plus communément utilisées comme cibles ont été les cellules de la
moelle osseuse. Elles ont l’avantage de pouvoir être cultivées facilement.

De plus, les souches de la moelle osseuse sont pluripotentes à grande capacité de


renouvellement pouvant être facilement réimplantées chez l’animal. Et si la réimplantation est
effectuée chez un animal rendu aplasique par irradiation, on obtient un enrichissement
considérable. C’est enrichissement peut aussi être amélioré par une sélection préalable des
cellules greffées, si la construction comporte un gène directement sélectionnable. En
pratique, si la greffe est en général obtenue dans les cellules en culture (ex-vivo), elle est
rarement efficace après réimplantation dans l’animal entier (in vivo). La perte de l’expression
du greffon est due à des causes mal élucidées et probablement multiples.

La principale cause semble être liée au phénomène de différenciation terminale des cellules
hématopoïétiques. Idéalement il faut pouvoir infecter exclusivement les cellules souches
pluripotentes, qui représentent 0,01 % de la population des cellules médullaires, ce que l’on ne
sait pas encore faire. On a aussi pensé à l’inefficacité transcriptionnelle des séquences virales
intégrées ou leur inactivation (méthylation). Outre sa faible efficacité, cette stratégie
comporte un autre inconvénient : le matériel greffé et éventuellement réimplanté n’est pas
homogène. En effet, l’utilisation d’un vecteur rétroviral entraîne l’infection de nombreuses
cellules où l’intégration s’effectue chaque fois de manière aléatoire et différente.
258
6.5.7 THERAPIE GENIQUE HUMAINE

Au départ les considérations éthiques constituaient un facteur limitant aux expériences sur la
thérapie génique humaine. A présent, il existe un consensus sur ce qui est considéré comme
licite et sur la nécessité d’un contrôle strict des protocoles par les agences scientifiques avant
toute application à l’homme. Il convient cependant de souligner que seuls sont prises en
considération les tentatives de thérapie génique somatique. Elle est assimilée à une greffe
moléculaire et sa signification biologique n’est pas fondamentalement différente d’une simple
greffe de tissu ou d’organe. Une réflexion approfondie sur les aspects scientifiques,
techniques, médicaux et éthiques de futures applications à l’homme des protocoles de thérapie
génique a été menée en 1984 par un comité des scientifiques américains. Depuis lors les
éléments de cette réflexion constituent une sorte de charte sur laquelle la communauté
scientifique s’est tacitement accordée. Cette charte stipule que, avant toute tentative de
thérapie génique sur l’homme, les exigences suivantes doivent être satisfaites :

- le gène défectueux ne doit pas être dominant par rapport au gène normal que l’on
pourrait greffer (sinon la greffe sera inopérante) ;

- si le produit du gène à greffer est spécifique d’un tissu, le greffon génique doit être
exprimé dans la bonne cellule et à un taux adéquat. En fait, pour les protéines
exportées, comme les facteurs de coagulation du sang ou d’autres facteurs sériques
(α1-antitrypsine), le site de synthèse ne devrait pas être critique, à condition que la
maturation post-traductionnelle ainsi que l’éventuelle production d’autres molécules
dont la coopération est nécessaire aient lieu dans le type cellulaire où la greffe pourrait
être effectuée. De même, une greffe ectopique peut être efficace si elle permet d’agir
efficacement sur des substrats diffusibles (déficit en adénosine désaminase, etc) ;

- la transplantation doit être efficace et concerner toutes les cellules cibles. Une
efficacité de 100 % peut être obtenue à l’aide des rétrovirus. Ceux-ci doivent être
rigoureusement défectifs pour empêcher toute multiplication et tout risque de
formation des révertants doit être écarté. L’intégration par voie rétrovirale étant
polyclonale et aléatoire d’une cellule à l’autre, il faudra chaque fois que possible
procéder à un clonage des cellules receveuses, pour disposer d’un matériel homogène ;

- le greffon doit être intégré et exprimé de façon stable, ce que l’on peut vérifier par
culture prolongée ;

- les cellules greffées doivent se maintenir après transplantation in vivo. Ceci est sans
doute l’une des exigences les plus difficiles à satisfaire, en dehors d’un système
conférant aux cellules un avantage sélectif. Dans cette dernière hypothèse, la
procédure peut être d’une lourdeur extrême si elle consiste à irradier la moelle du
receveur, puis à la repeupler par des cellules hématopoïétiques ayant co-intégré un
gène sélectionnable comme celui de la dihydrofolate réductase, ce qui impose en
principe un traitement permanent par la méthotrexate ;
259
- l’efficacité thérapeutique de la greffe génique envisagée doit avoir été vérifiée
préalablement par expérimentation animale et la reproductibilité du protocole
expérimental doit être assurée. Ces exigences sont également difficiles à satisfaire car
les modèles animaux sont rares ;

- le procédé doit offrir des garanties de sécurité, non seulement à court terme mais aussi
à long terme, en particulier vis-à-vis du risque d’interférence avec la lignée germinale
et du risque de cancérogenèse. Cette dernière préoccupation est justifiée par le
caractère aléatoire du site d’intégration du greffon dans le génome et par l’utilisation
des vecteurs rétroviraux. C’est elle qui empêche d’utiliser comme cible pour la greffe
génique toute souche cellulaire préalablement immortalisée par un virus cancérigène ;

- l’application à l’homme des méthodes de thérapie génique n’est envisageable que pour
des maladies très graves, non curables par d’autres moyens ;

- tout projet d’essai thérapeutique humain devra être soumis à l’approbation d’un comité
ad hoc, qui statuera sur les aspects médicaux, techniques et éthiques du dossier.

Le premier cas réussi de thérapie génique chez l’homme a été réalisé en 1999 par A. Fischer
sur deux enfants atteints d'une maladie génétique orpheline, l'adrénoleucodystrophie (ALD),
maladie des enfants-bulle. Les cellules souches du sang des deux enfants ont reçu in vitro le
gène médicament qui leur faisait défaut, puis ont été réintroduites pour reconstituer l'ensemble
des cellules sanguines des jeunes patients. Respectivement six et douze mois après, toutes les
cellules du sang de deux patients exprimaient bien le gène introduit. La maladie des enfants-
bulle est une maladie très rare : cinq cas sur près de huit cent mille naissances chaque année en
France. Elle se manifeste par un déficit immunitaire sévère, qui condamne les jeunes malades
à vivre à l'abri des germes dans une atmosphère stérile, d'abord à l'intérieur d'une bulle de
plastique, puis d'un local spécialisé (et d'un scaphandre pour leurs sorties).

Dans sa variante la plus connue, ce déficit est dû à la présence sur le chromosome X d'une
version mutée d'un gène codant pour une protéine participant à la constitution du récepteur de
l'interleukine 2 (la sous-unité gamma-c) sur la membrane de certains globules blancs.
L'absence du récepteur complet rend impossible l'orchestration entre eux des globules blancs
lymphocytes T (LT), lymphocytes B (LB) et lymphocytes Natural Killer (NK) au moyen de
l'interleukine 2. Les garçons, qui ne disposent que d'un seul chromosome X, deviennent ainsi
sujets à toutes les infections. La maladie des enfants-bulle est en fait, dans sa variante la plus
connue, la maladie des garçons-bulle ou "déficit immunitaire combiné sévère lié au
chromosome X". Le déficit immunitaire combiné sévère lié au chromosome X concerne la
sous-unité gamma-c qui intervient dans la constitution de différents récepteurs aux
interleukines. La mutation du gène codant pour cette sous-unité empêche la mise en place de
ces récepteurs.

L’absence de récepteur fonctionnel pour l’interleukine 2 a pour conséquence une absence de


différenciation des cellules souches lymphoïdes en lymphocytes, la transduction du signal ne
pouvant s’effectuer. Les seules perspectives de soin pour ces petits garçons sont soit une
greffe de moelle osseuse, tissu qui est à la source des globules blancs, soit une thérapie
260
génique qui apporte le gène non muté. En 1999, les premiers essais de thérapie génique
conduits par l’équipe de A. Fischer aboutirent à un résultat concluant : dix enfants étaient
traités et guéris.

Les cellules souches de leurs globules blancs avaient été prélevées dans leur moelle osseuse et
traitées in vitro par un rétrovirus désactivé qui ajoutait la version non mutée du gène à leur
génome porteur du gène muté. Ainsi complétées, ces cellules souches avaient alors été
réinjectées dans la circulation sanguine des petits malades. Mais voici qu'en octobre 2002,
deux d'entre eux, qui avaient été traités avant l'âge de trois mois, deviennent leucémiques. L'un
guérira, mais l'autre finira par en mourir. Dans les deux cas, le gène correcteur s'est inséré au
voisinage du même gène LMO-2 prédisposant au cancer. Les protocoles sont alors révisés :
le début du traitement repoussé après l'âge de six mois, recours à des doses plus faibles de
cellules modifiées. Et les essais thérapeutiques sont de nouveau autorisés en mai 2004.
Hélas, un troisième cas de leucémie se déclare en janvier 2005 chez un enfant traité à l'âge de
neuf mois. Le gène médicament s'est à nouveau inséré auprès d'un oncogène (qui n'est pas le
LMO-2).

Une seconde approche de thérapie génique a été expérimentée. Elle opère par remplacement
et non par addition, c'est à dire que la portion mutée du gène a été précisément remplacée par
la version non mutée, sans toucher au reste du génome. Dans le processus antérieur, la version
non mutée du gène était ajoutée à un génome qui demeurait porteur de la version mutée
d'origine. Pour effectuer cette substitution, les chercheurs ont opéré sur les lymphocytes T
prélevés chez les malades et ont réussi in vitro l’enchaînement suivant :

1. Détection du site précis de la mutation par des protéines en doigts de zinc. Les doigts de
zinc sont des structures de reconnaissance de l'ADN. Chaque doigt de zinc reconnaît trois
nucléotides spécifiques. Une protéine comportant trois doigts de zinc en tandem permet donc
de reconnaître une séquence spécifique de neuf nucléotides. A ce domaine de reconnaissance,
on a couplé le domaine endonucléasique de l'enzyme Fok I. En fonction de la nature des
acides aminés qui les composent (hors les cystéines et histidines liant l'atome de zinc), une
séquence spécifique d'ADN de trois nucléotides sera reconnue.

En utilisant deux protéines comportant chacune trois doigts de zinc pouvant être
individuellement choisis, la reconnaissance s'effectue sur une séquence spécifique de dix-huit
nucléotides. Un rapide calcul de probabilité établit qu'une séquence aléatoire de dix-huit
nucléotides n'a pratiquement aucune chance d'exister à plus d'un exemplaire dans un génome
de cinq milliards de nucléotides correspondant au génome humain. En conséquence, par cette
méthode on peut cibler de manière spécifique et unique une séquence d'intérêt connue (par
exemple un gène muté...) ;

2. Coupure de l'ADN ciblé par une enzyme (une endonucléase) préalablement liée à deux
protéines en doigts de zinc. L'endonucléase utilisée (domaine endonucléasique de l'enzyme
Fok I) est non spécifique et agit sous forme dimérique. On utilise donc deux protéines
comportant chacune trois structures en doigt de zinc reconnaissant des séquences éloignées de
quelques nucléotides. La liaison des deux protéines en doigts de zinc sur leurs séquences
261
respectives rapproche les deux endonucléases qui leur sont associées. Ce rapprochement
permet leur dimérisation et par suite la coupure de la molécule d'ADN ;

3. Exploitation du mécanisme naturel de recombinaison homologue pour remplacer la portion


du gène muté par la portion équivalente du gène non-muté. La courte molécule d'ADN non
mutée, susceptible de remplacer la fraction mutée à l'origine de la maladie, est ajoutée aux
deux molécules protéiques précédentes. Si le phénomène de recombinaison homologue
(largement utilisée dans la technique d'inactivation de gène, plus connue sous le nom de knok
out) ne nécessite pas une coupure préalable de l'ADN par endonucléase, son efficacité dans ces
conditions est très faible. Couper l'ADN permet d'augmenter considérablement le taux de
recombinaison homologue. Dans près de 20% des cas - un taux énorme pour une
recombinaison homologue et un taux suffisant pour soigner plus tard les malades - la portion
d'ADN mutée des LT a été remplacée par sa version non mutée. Le gène corrigé s'exprime
sous forme d'ARNm, puis de la protéine gamma-c permettant la bonne mise en place du
récepteur de l'interleukine 2.

La correction s'effectue de façon rapide et se maintient de façon durable. Ultérieurement, ce


ne sont pas les LT, LB ou NK que les chercheurs corrigeront in vitro par cette méthode, mais
leurs cellules souches progénitrices logées dans la moelle osseuse qui bénéficient d'une longue
durée de vie. Une fois traitées, elles seront réinjectées dans la circulation des petits patients
pour pouvoir coloniser leur moëlle osseuse.

6.5.8 THERAPIE GENIQUE ET SOCIETE

Alors que la thérapie génique fonctionne bien dans le modèle animal (souris, chiens, ...), elle
est le plus souvent inefficace chez l'homme en raison de la combinaison de plusieurs
paramètres: l'inefficacité des vecteurs à transduire un pourcentage important de cellules, la
difficulté de créer des vecteurs qui permettent de reproduire les cinétiques complexes
d'expression des gènes, parfois l'utilisation de gènes thérapeutiques inadéquats en raison
d'erreurs conceptuelles concernant les mécanismes de la maladie, l'état de santé de certains
patients pour lesquels la thérapie génique ne pourrait de toute façon rien apporter, ...

Cette inefficacité rend plus aigüe les considérations éthiques, sociologiques et sécuritaires.
Les problèmes liés au risque de diffusion du virus vecteur dans la population, ainsi que celui
d'une transmission germinale (qui conduirait à transmettre à l'enfant du malade les nouveaux
gènes lors de la fécondation) sont actuellement pratiquement inexistants, et les effets
secondaires, s'ils restent dramatiques au niveau humain, sont globalement très rares et ne
justifient pas un arrêt des expériences.

Les diverses instances impliquées dans le contrôle des essais en thérapie génique commencent
à adopter des cadres réglementaires permettant une protection optimale du patient et de son
entourage, et on peut considérer aujourd'hui que la thérapie génique n'est "pas plus risquée"
que les autres approches thérapeutiques expérimentales. Un problème sociologique et
éthique, classique de toute approche médicale reposant sur la biotechnologie, est celui du coût
et de l'effort financier que la société consent au développement de la thérapie génique. Encore
262
inexistant d'un point de vue commercial, le coût de la thérapie génique est actuellement assuré
par les organismes publics caritatifs ou gouvernementaux, et surtout par l'industrie.

Considérée comme une thérapeutique de pays riches, ne pouvant pas faire état d'un bilan très
positif ni médicalement ni commercialement, et face aux difficultés de financement de la
recherche scientifique, de nombreuses voix s'élèvent pour demander une redistribution de
l'argent alloué à la thérapie génique, et arrêter les investigations. Le contexte n'est dans les
faits pas aussi manichéen que l'on pourrait imaginer. Par exemple, si le développement de la
thérapie génique est le fait de pays riches, il est à noter que certaines études basent leur
concept sur l'utilisation de vecteurs de type ADN nu (non viraux) qui pourraient être
facilement produits, stockés, envoyés et de coût relativement bas, permettant ainsi à des pays
pauvres d'accéder à des traitements qui aujourd'hui reposent sur des approches
médicamenteuses lourdes au niveau financier.

6.5.9 TESTS GENETIQUES

Un test génétique, également appelé test de gène ou test d’ADN, implique l’examen de l’ADN
d’un individu. L’ADN est la formule des gènes qui déterminent les caractéristiques des
organismes vivants. Les tests génétiques détectent la présence, l’absence ou le changement
d’un gène particulier, d’un chromosome ou d’une protéine en utilisant une variété d’outils de
laboratoire. Aujourd'hui, les tests génétiques sont utilisés dans plusieurs circonstances. De ce
fait, ils sont classifiés dans le domaine de la santé selon leur but.

Criblage génétique : - ces tests sont effectués sur des populations pour identifier les individus
qui sont en danger de développer des troubles spécifiques. Le criblage est effectué de telle
façon que d'autres tests plus approfondis puissent être entrepris. Par exemple, des femmes
peuvent être examinées pour le BRCA1&2 - un gène lié au cancer du sein, de sorte que des
mesures préventives et des premières interventions puissent être considérées ;

Test du porteur : - ces tests sont souvent effectués pour déterminer si un individu est « porteur
» d'un gène occasionnant des troubles génétiques récessifs. Par exemple, des couples subissent
ces tests pour déterminer s'ils sont porteurs de maladies telles que la maladie de Tay-Sachs et
pour les aider à prendre la décision d'avoir des enfants ;

Test de diagnostic prénatal : - ces tests sont effectués avant la naissance pour déterminer si un
foetus est affecté ou en danger d'avoir des troubles génétiques. Le syndrome de Down est la
maladie génétique la plus commune criblée par cette méthode ;

Criblage des nouveaux-nés : - ces tests sont axés sur l'identification des troubles métaboliques
chez les nouveaux-nés. La détection et le traitement précoce peuvent être cruciaux de réduire
la progression de telles maladies. Un exemple est le criblage des nouveaux-nés pour la
phénylcétonurie (PCU) ;

Test pré-symptomatique : - ces tests sont effectués sur des individus en bonne santé pour
déterminer s'ils portent une mutation génétique qui augmentera leur probabilité de développer
263
des maladies et des troubles plus tard dans leur vie. Les exemples incluent la maladie de
Huntington et la maladie d'Alzheimer ;

Test de susceptibilité : - ces tests sont effectués pour identifier des individus ayant des
mutations génétiques qui les renderont plus susceptibles de développer une maladie une fois
exposées à certains éléments de l'environnement. Ce type de test est souvent utilisé pour
identifier les travailleurs susceptibles d'incapacités en raison des substances toxiques
auxquelles ils sont exposés dans leur lieu de travail ;

Test de diagnostic : - ces tests sont effectués sur des individus pour confirmer un diagnostic
déjà prononcé par d'autres méthodes. Par exemple, le test génétique est souvent utilisé pour
confirmer que le diagnostic de certaines formes de fibrose cystique (FC) ;

Test d'identité et d'examen juridique : - ces tests sont effectués pour découvrir des liens
génétiques dans les investigations criminelles entre les suspects et pour prouver l'évidence ou
entre les enfants et leurs parents.

Dans les tests génétiques, les scientifiques analysent les échantillons (sang, fluide amniotique,
etc…) des individus pour détecter la présence d'un gène particulier ou des irrégularités de
gènes. Ces dernières incluent les mutations de séquences géniques, des anomalies
chromosomiques, des niveaux atypiques de métabolite et des niveaux exceptionnellement
élevés ou bas de protéines. Les gènes et les irrégularités géniques sont détectés, mesurés et
analysés selon plusieurs différentes techniques de laboratoire. Les techniques varient
considérablement et s'échelonnent de la coloration des chromosomes entiers à l'utilisation
d'ADN complémentaire ou d'anticorps pour détecter des séquences distinctes de gène qui sont
associés à une maladie ou à une condition spécifique. Certaines de ces techniques incluent :
l’électrophorèse en gel, le caryotypage, les sondes d'ADN, les sondes radioactives, le transfert
de Southern, la technique Northern, la technique Western, l’autoradiographie, la réaction en
chaîne de la polymérase (PCR).

Les caryotypes par exemple sont des images de tout notre ADN, qui contient 100 000 gènes.
Ils montrent les chromosomes de métaphase d'une cellule individuelle, disposés en paires et
classifiés selon leur taille. Il existe 22 paires de chromosomes asexuées et une paire de
chromosomes sexuée. Un caryotype fournit les informations suivantes : a- le nombre de
chromosomes par cellule ; b- la composition du sexe du chromosome ; c- l'identification de
toutes anomalies du chromosome.

Les caryotypes sont souvent exécutés pendant une amniocentèse qui fournit des informations
génétiques au sujet d'un foetus en gestation. Ce criblage diagnostique prénatal peut être utilisé
pour détecter des anomalies fœtales telles que le syndrome de Down et le syndrome de Turner.
Le développement de l'expertise en laboratoire des tests génétiques avance à grand pas. Cette
situation est en grande partie due au décodage du génome humain et à la découverte des
séquences des gènes et de leur relation avec certaines maladies.

Les tests génétiques actuels utilisent certaines techniques biochimiques de laboratoire qui ont
été utilisées dans l'étude de la biologie pendant de nombreuses années, particulièrement dans
264
des secteurs spécialisés tels que la biochimie et la biologie moléculaire. Des tests génétiques,
tels que les tests sur la phénylcétonurie (PCU) par exemple, ont été utilisés régulièrement en
Amérique du Nord depuis les années 60, permettant ainsi une intervention et une prévention
précoce de la PCU.

Ces tests sont réalisés dans les 24 heures qui suivent la naissance. Ils impliquent la prise d'un
échantillon de sang provenant d'un nouveau-né et d'effectuer le test de Guthrie. Ce dernier
déterminera le niveau de phénylalanine dans le sang. Des niveaux élevés indiquent que le
nouveau-né est atteint de la PCU. Les enfants atteints de la PCU n'ont pas l'enzyme qui
décompose la phénylalanine, un acide aminé que l'on retrouve dans divers aliments. Des
niveaux excessifs de phénylalanine dans le corps provoquent une déficience mentale, qui peut
être évitée en suivant un régime alimentaire sérieux. La détection précoce se traduit par une
diminution considérable de déficience mentale causée par la PCU. Aujourd'hui, les nombreux
tests génétiques pour différentes maladies sont disponibles. Le tableau suivant indique des
exemples de maladies pour lesquelles des tests génétiques sont disponibles.

6.6 EMPREINTES GENETIQUES

C’est en 1981 que A. Jeffrey trouva que l’ADN d’un individu peut apparaître sous forme
d’une image « code » qui est unique pour chacun de nous. Il utilisa l’empreinte génétique
pour identifier un meurtrier ayant laissé du sperme sur une scène de crime. Depuis lors cette
puissante arme biologique est devenue un complément indispensable des techniques classiques
d’enquête. La variabilité de l’ADN a été mise en évidence et sert de preuve pour identifier les
auteurs des crimes. La technique des empreintes génétiques consiste à faire agir des enzymes
de restriction pour couper les séquences d’ADN répété en une série de segments, les fragments
des deux individus sont ensuite hybridés de manière à mettre en évidence les différences et les
similitudes. Si les mutations sont apparues au niveau où les enzymes doivent agir,
l’hybridation de l’ADN des deux individus sera altérée et révélera la différence qui les
distingue.

6.6.1 EMPREINTE GENOMIQUE PARENTALE (imprinting)

Il s’agit de l’expression phénotypique variant uniquement en fonction de l’origine parentale du


chromosome portant le gène d’intérêt. Chez certaines espèces, certaines régions de
chromosomes et les gènes qui s’y trouvent conservent la mémoire ou l’empreinte de leur
origine parentale, laquelle influence l’expression des gènes spécifiques qui seront soit
exprimés, soit génétiquement silencieux, c’est-à-dire non exprmés. Un exemple classique de
l’empreinte génomique parentale est l’inactivation de l’un des 2 chromosomes X des
mammifères femelles.

6.6.2 POLYMORPHISMES DE RESTRICTION

On appelle polymorphisme de restriction des variations individuelles de la séquence d’ADN


révélées par des variations de la carte de restriction. Celles-ci sont mises en évidence par la
méthode de Southern qui montre des différences individuelles dans la taille des fragments de
restriction obtenus avec une enzyme donnée et une sonde donnée. C’est de là que provient le
265
nom de Restriction Fragment Length Polymorphism, en abrégé RFLP, sigle universellement
adopté. Un RFLP correspond à un emplacement strictement défini sur le génome, c’est-à-dire
un locus génétique.

Il se caractérise par sa variabilité d’un individu à l’autre et sa transmission mendélienne : c’est


un marqueur génétique. Il est défini par un couple sonde/enzyme. Les différentes versions
correspondant à un même emplacement sur le génome (locus) sont exclusives les une les
autres sur un même chromosome : ce sont des allèles. Chez un hétérozygote, les deux allèles
sont visibles : ce sont des marqueurs codominants. Chaque système allélique de restriction
définit un locus polymorphe. Les RFLP peuvent être intragéniques ou extragéniques.

Une classe spéciale de polymorphismes par insertion/délétion, décrite par Wyman et White en
1980, consiste en une série de fragments alléliques de longueurs variables, formés par un
nombre variable d’une séquence d’ADN répétée en tandem (VNTR) et située dans l’intervalle
entre deux sites de restriction. Cette classe de RFLP a été appelée « hypervariable » puisque
de tels loci sont caractérisés par un grand nombre d’allèles. Les marqueurs les plus
informatifs ont jusqu’à plusieurs douzaines ou plus d’allèles, de telle sorte que deux individus
non apparentés partagent très rarement les mêmes allèles.

Les marqueurs VNTR sont très informatifs pour les analyses de liaisons génétiques, de même
que pour l’identification des individus en médecine légale ou pour des tests de paternité. Les
RFLP bi-alléliques et les VNTR ont augmenté le nombre de marqueurs polymorphes
permettant d’examiner la diversité génétique existant entre les individus et de suivre la
ségrégation de différentes portions du génome dans les familles. Plusieurs milliers de ces
polymorphismes d’ADN localisés sur l’ensemble de chromosomes ont maintenant été décrits.

En 1985, Jeffreys a découvert que des séquences répétées retrouvées dans un grand nombre de
polymorphismes de types VNTR étaient suffisamment semblables pour permettre la détection
simultanée d’un grand nombre de loci. En utilisant comme sonde une séquence répétée
commune à différents polymorphismes VNTR, on peut montrer que chaque patron
d’hybridation obtenu pour un individu est unique et peut servir d’empreinte digitale de l’ADN.
Seuls les jumeaux monozygotes ont un patron totalement identique. L’étude du profil de
l’ADN a des applications importantes en médecine légale pour permettre l’identification des
individus.

6.6.3 ADN ET FILIATION MOLECULAIRE

Les molécules d’ADN peuvent être retracées par l’analyse et la comparaison des séquences
nucléotidiques ou plus des RFLP. Cela permet d’aborder sans exception tous les aspects de la
filiation moléculaire. Les principaux aspects abordés sont : a- filiation entre cellules pour
résoudre les problèmes de génétique somatique ; b- filiation entre individus d’une même
famille pour résoudre les problèmes de pathologie génétique (maladies héréditaires) ou de
médecine légale ; c- filiation entre individus appartenant à des populations différentes pour
donner une assise moléculaire à la génétique des populations et à l’anthropologie ; d- filiation
entre espèces différentes : l’anatomie comparée des génomes donne accès à une véritable
phylogenèse moléculaire.
266

En comparant les séquences de plusieurs protéines dans de nombreuses espèces, on a constaté


qu’elles divergeaient à une vitesse différente et en comparant les différents domaines
protéiques, on constate que les régions les mieux conservées, c’est-à-dire possédant le plus
grand degré de similitude entre espèces très éloignées, sont celles qui ont un rôle fonctionnel
bien défini.

Pour une protéine et plus encore pour un domaine protéique donné, on admet que les
comparaisons inter-spécifiques des séquences d’acides aminés fournissent un moyen de
reconstituer des arbres phylétiques. Le principe utilisé pour cette reconstitution est celui de la
parcimonie, qui consiste à choisir parmi les différents points d’embranchement possibles ceux
qui correspondent au nombre minimal de différences. On admet que deux organismes sont
d’autant plus éloignés dans le temps de l’évolution que leurs divergences sont plus grandes.
D’où la notion de distance génétique employée dans son acception phylogénétique, c’est-à-
dire temporelle et non cartographique.

6.6.4 ADN NUCLEAIRE ET ADN MITOCHONDRIAL

Il est apparu que la vitesse d’évolution diffère grandement selon que l’on se trouve dans une
séquence d’ADN codante ou non codante. La séquence des exons est en général beaucoup
plus conservée que celle des introns. Inversément les pseudogènes divergent beaucoup plus
vite que les gènes proprement dits. L’évolution des distances génétiques par analyse
comparative de l’ADN nucléaire repose exclusivement sur le taux de mutations, car elles sont
aussi conditionnées par les recombinaisons, la dérive génétique, l’avantage sélectif de certains
allèles. Il n’en est pas de même pour l’ADN mitochondrial, qui présente les particularités
suivantes : a- c’est un petit ADN (16.500 nucléotides chez l’homme) ; b- il n’est pas sujet à
recombinaison ; c- il est soumis à une transmission purement maternelle (un ovocyte contient
400 à 200.000 mitochondries alors qu’un spermatozoïde en contient très peu) ; d- il est l’objet
d’un taux de mutation 10 fois supérieur à celui de l’ADN nucléaire. Ces caractéristiques en
font un matériel privilégié pour étudier l’évolution moléculaire, en particulier sur des périodes
relativement brèves. Cependant si l’ADN mitochondrial permet de retracer une filiation, il ne
renseigne pas sur l’ADN nucléaire qui évolue indépendamment.

6.6.5 ADN ET MEDECINE LEGALE

Jusqu’il y a peu, l’identité biologique des individus était établie à l’aide des marqueurs
phénotypiques, tels que les groupes sanguins (A1, A2, B, O, MNS, Rh, P, Kell, F), les groupes
sériques (Hp, Gc, Tf, Gm), les enzymes érythrocytaires (AK, AcP, PGM), le système HLA.
Pris individuellement, ces marqueurs ont une informativité limitée, à l’exception du système
HLA, qui à lui seul permet de résoudre 94 % des problèmes d’exclusion de paternité. Au prix
d’une multiplication de marqueurs phénotypiques, il est possible d’atteindre une fiabilité
supérieure à 99 %.

La méthode est utilisable pour des affaires d’exclusion de paternité ou pour disculper un
criminel ayant laissé des traces biologiques analysables. En revanche, ces marqueurs ne
permettent pas de procéder à une identification véritable, c’est-à-dire à une incrimination car
267
la probabilité de coïncidence entre deux individus non apparentés n’est pas négligeable. Parmi
les marqueurs génotypiques que sont les RFLP, il existe une catégorie de polymorphismes de
répétition particulièrement informatifs, correspondant à des régions hypervariables du génome,
les minisatellites. Ceux-ci se caractérisent par un remarquable polyallélisme, chacun des
allèles étant présent avec une faible fréquence dans la population.

On les explore avec deux types de sondes : - soit à l’aide des sondes multi-locus de Jeffreys,
sondes 33.6 et 33.15, contenant de courtes séquences matrices (core sequences) de 10 à 16
paires de bases, partagées de nombreux minisatellites présents sur tous les autosomes ; - soit à
laide des sondes mono-locus capables de discriminer des minisatellites siégeant en un locus
particulier. L’utilisation des sondes multi-locus de Jeffreys permet de visualiser d’un seul
coup chez un même individu au moins 60 locus hyperpolymorphes différents. En pratique,
en raison des limites du pouvoir de discrimination de la méthode de Southern, 30 à 40 bandes
sont visibles simultanément. L’image obtenue est pour chaque individu d’une extraordinaire
simplicité. En effet, la probabilité de coïncidence du profil pour deux individus non
apparentés est de 3x10 – 11 avec la sonde 33.15 et de l’ordre de 10-20 en combinant les deux
sondes. Il s’agit de véritables empreintes génétiques capables de résoudre les nombreux
problèmes d’identification qui se posent en médecine légale.

Les sondes minisatellites mono-locus sont moins discriminatives car elles explorent un seul
locus à la fois. Elles fournissent en revanche des images d’une parfaite lisibilité. Leur
pouvoir discriminateur dépend du nombre d’allèles possibles. Ainsi, la sonde explorant le
locus D5S43, avec ses 9 allèles, comporte un risque de coïncidence de 2 %, alors que le risque
est 100 fois plus faible pour le locus D7S21. Prises isolément, ces sondes ne permettent donc
pas d’établir une véritable empreinte génétique. Cependant en les associant, on peut atteindre
un pouvoir discriminateur cumulé équivalent à celui des sondes multi-locus.

Exclusion et inclusion

Si on utilise une sonde multi-locus le profil obtenu chez chaque individu est une empreinte
génétique. Dans le profil complexe obtenu, il est impossible de reconnaître les bandes
alléliques au même locus. Cependant, la transmission des allèles est mendélienne et un
individu donné fournit une image composite correspondant à un assortiment des bandes
parentales à l’exclusion de toute autre. Cette méthode permet donc de distinguer les vrais
jumaux, qui ont des empreintes identiques et les jumaux di-zygotiques, qui n’ont en commun
que certaines bandes. L’exclusion de paternité est facile à réalisée par cette méthode. C’est
un acte de médecine légale pratiqué à la requête de l’autorité judiciaire pour résoudre un
problème familial.

La vérification de la paternité, obtenue par les mêmes procédés, est parfois nécessaire pour
valider une enquête familiale effectuée en vue d’un diagnostique génotypique indirect. Cet
acte est pratiqué à l’initiative du laboratoire de génétique moléculaire, sous couvert du secret
médical le plus absolu. Il permet d’éviter de graves erreurs de diagnostic. L’identification
positive, autrement dit l’inclusion de paternité et de maternité, est un problème de société. Il
concerne les litiges opposant les autorités d’immigration et des familles soupçonnées de
substitution de personnes. Ce genre de problème est impossible à distinguer les allèles
268
parentaux. Ceci impose le recours aux minisatellites mono-locus. La méthode est non
seulement très performante, mais aussi très fiable en raison du très faible taux de néo-
mutations.

• Discrimination et incrimination

En matière de criminologie, l’étude de polymorphismes génotypiques représente un apport


décisif. En effet la méthode des empreintes génétiques permet d’effectuer non seulement une
discrimination, c’est-à-dire une disculpation d’un suspect, mais aussi une incrimination par
identification de l’ADN d’un suspect et de traces d’ADN laissées sur les lieux du crime. Une
originalité intéressante de la méthode tient au fait que l’ADN est un matériel biologique très
résistant. En effet, la remarquable stabilité de l’ADN atteint plusieurs années si l’échantillon
est maintenu à l’état sec. Ceci contraste avec la fragilité des protéines qui se dégradent
rapidement hors de l’organisme ou après la mort. Pour pouvoir être soumis à une analyse par
empreinte génétique, les échantillons criminologiques doivent satisfaire plusieurs conditions :

1.être dans un état de conservation convenant à l’analyse multi-locus, c’est-à-dire contenir de


l’ADN de haut poids moléculaire. Cette condition est remplie pour les taches de sang, les
taches de sperme, les racines de cheveux (où sont concentrés les noyaux cellulaires) ; 2.
fournir une quantité suffisante d’ADN pour l’exploration par la méthode de Southern. Il faut
au minimum 1μg d’ADN (100 000 copies de la cible), soit environ 60 μg de sang ou 5 μl de
sperme ou 5 racines de cheveux. Pour des quantités moindres, il faut recourir à l’analyse
mono-locus, qui réclame 10 fois moins de matériel et qui peut à elle seule s’avérer très
informative ; 3. permettre la distinction entre la victime et l’agresseur. L’ADN de la victime
est facile à obtenir à partir du sang prélevé dans les 24 heures après la mort ou même après un
délai plus long à partir des racines de cheveux. En cas de viol, il est possible de séparer par
lyse différentielle les cellules vaginales des spermatozoïdes et d’analyser séparément leur
ADN.

6.6.6 METHODE PCR ET IDENTIFICATION GENOTYPIQUE

La révolution technologique apportée par la possibilité d’amplifier électivement l’ADN in


vitro par la méthode PCR concerne aussi les applications médico-légales. Elle est destinée à
rendre les plus grands services dans deux types de situations : lorsque l’ADN est trop dégradé
pour qu’une exploration des minisatellites soit possible et lorsque l’ADN est en trop faible
quantité. L’amplification in vitro par la méthode PCR ne permet pas l’étude des
polymorphismes de répétition, c’est-à-dire des minisatellites, mais elle se prête
remarquablement à l’étude des polymorphismes de séquences. Il suffit alors de connaître
précisément la séquence nucléotidique dans la région polymorphe pour construire les amorces
qui permettront l’amplification élective du segment comportant le polymorphisme.

La séquence à amplifier peut- être très courte, de l’ordre de 100 nucléotides, ce qui résout le
problème des ADN dégradés. L’analyse des variations alléliques peut se faire par la méthode
des minismatches à l’aide d’oligonucléotides spécifiques d’allèles. Dans ce cas, la quantité de
cible amplifiée est telle que l’on peut marquer les sondes par un procédé non réactif (sondes
269
froides). La sensibilité est remarquable, car on a pu amplifier et analyser avec succès 1 ng
d’ADN, soit 100 copies de la cible.

Cette quantité d’ADN, indétectable par les méthodes de dosage chimique, correspond à
environ 1/5e de la quantité présente dans une seule tige de cheveu dépourvu de sa racine. Il est
donc possible de caractériser individuellement l’ADN dans chaque cheveu retrouvé sur la
scène d’un crime. Le procédé se prête aussi à l’analyse directe de la séquence nucléotidique
que l’on amplifie et où l’on peut identifier le polymorphisme. Ce dernier procédé est très
certainement appelé à de très grands développements en raison de ses possibilités
d’automation. La puissance de la méthode est illimitée si l’on considère qu’il sera bientôt
possible d’amplifier simultanément de nombreuses séquences et de les analyser séparément.

6.6.7 EMPREINTES GENETIQUES PAR ANALYSE


DE L’ADN NUCLEAIRE

Dans les premières années seul l’ADN nucléaire était utilisé pour l’identification génétique.
Aujourd’hui encore il reste l’élément le plus fiable de l’expertise en dépit de l’apport
indéniable de l’analyse de l’ADN mitochondriale. Agissant par comparaison entre
prélèvements de question (dont l’origine est inconnue et que l’enquête pour charge
d’identifier) trouvés sur la scène d’un crime et des prélèvements de référence (ADN
d’individus identifiés), l’utilisation de la méthode des empreintes génétiques repose sur trois
principes : a. le caractère unique du génome individuel (seuls les jumeaux monozygotes ont
strictement le même ADN) ; b. l’unicité de sa composition au sein de toutes les cellules du
corps (ce qui permet de comparer l’ADN contenu dans du sperme avec celui du sang ou d’un
cheveu) ; c. la ségrégation allélique des séquences homologues des gènes comme des
polymorphismes moléculaires lors de la transmission à la descendance (permettant les
recherches de paternité).

● Bases moléculaires

Régions variables de type VNTR ou microsatellites : la technologie employée pour la


révélation des empreintes génétiques étudie les variabilités de l’ADN de type VNTR (Variable
Numbre of Tadem Repeat). Les régions d’ADN analysées possèdent un élément de base
répété en nombre variable. Les loci étudiés sont localisés sur les autosomes, l’ADN de chaque
individu étant caractérisé (en théorie) au maximum par deux allèles. L’unité de séquence
épétée en tandem peut être plus ou moins longue et on parlera de STR (Short Tandem Repeat)
lorsqu’elle est composée de moins de six nucléotides. En médecine légale, les répétitions
microsatellites de trois (trinucléotides) ou de quatre (tétranucléotides) sont les plus utilisées,
alors que la carte du génome utilise des répétitions de deux nucléotides (dinucléotides)
beaucoup plus difficile à interpréter. Selon la taille de l’unité de base et le nombre de
répétitions, la taille des allèles variera de quelques dizaines à plusieurs milliers de nucléotides.
La technique devra donc s’adapter aux régions à révéler.
270
Choix d’une région variable pour une utilisation médico-légale

Au cours des années passées, de nombreux systèmes ont été évalués. Certains ont perduré,
d’autres ont disparu. Les critères de choix sont basés sur les nécessités de l’analyse. Pour les
recherches en paternité, les loci privilégiés ont un faible taux de néomutation, alors que pour
les applications pénales, on privilégie des régions courtes (permettant la révélation du
génotype même à partir de l’ADN partiellement dégradé, car amplifiable par PCR), et surtout
montrant une variabilité interindividuelle importante, c’est-à-dire un grand nombre d’allèles
possibles répartis le plus également possible dans la population. Car un allèle VNTR n’est pas
unique ; il peut être rencontré dans l’ADN d’un grand nombre d’individus, faisant varier sa
fréquence de quelques fractions de pourcentage à plus de 25 % pour les plus fréquents. Ce
phénomène explique la nécessité d’analyser un grand nombre de loci pour identifier un
individu donné par un génotypage le plus spécifique possible.

Détermination du génotype relatif à une région variable

La technique ancestrale de Southern (utilisant la digestion enzymatique, le transfert,


l’hybridation avec une sonde marquée et l’autoradiographie ou la révélation) a été
progressivement remplacée par la technique d’amplification. En quelques années, la PCR a
révolutionné les empreintes génétiques faisant gagner un facteur mille en sensibilité et
ramenant les temps d’analyse à quelques heures (contre quelques jours par la technique de
Southern). Toutefois, l’amplification est sujette aux risques de contamination et des
procédures d’assurance-qualité très strictes ont dû être mises en place pour s’assurer de la
validité des résultats. L’étape d’extraction est la plus critique et nécessite une compétence
particulière. L’ADN d’un cadavre putréfié n’est pas extrait par les mêmes techniques que
celles qui sont utilisées pour un tube de sang de 5 ml prélevés fraîchement et stérilement.

Une étape de quantification est nécessaire ensuite pour apporter la quantité idéale d’ADN dans
l’amplification. La PCR est la plupart du temps réalisée grâce à des kits commerciaux,
parfaitement optimisés, caractérisant jusqu’à 16 loci (VNTR ou STR) au cours d’une même
réaction. La révélation de tels complexes n’est plus possible par les techniques classiques de
séparation et de coloration et seule l’utilisation des séquenceurs automatiques (en gel de
polyacrylamide ou par électrophorèse capillaire) avec lecteur laser permet de différencier les
régions amplifiées.

La transformation du signal lumineux en taille d’allèles nécessite des programmes


informatiques extrêmement spécifiques. De plus, si beaucoup de ces étapes sont
automatisables, l’interprétation est du domaine de l’humain. Il est impératif de se fixer des
règle d’analyses conformes aux recommandations du fabricant et relevant la plupart du temps
du simple bon sens. Car comment admettre que pour un échantillon de référence, c’est-à-dire
de très bonne qualité, un déséquilibre d’intensité soit observé entre des allèles, alors qu’il
s’agit simplement d’adapter la quantité de départ d’ADN.
271
6.6.8 NOMENCLATURE INTERNATIONALE

A l’heure actuelle, une uniformisation des systèmes d’analyse par les STR révélés par
amplification a été mise en place. La nomenclature internationale est basée sur le nombre de
répétitions composant l’allèle : ainsi pour le système TH01, l’allèle appelé dans la
nomenclature 6 est composé de six unités de base. Au cours des analyses, afin d’identifier les
allèles de l’ADN à caractériser, des marqueurs sont introduits dans les expériences. Ils sont
composés d’un mélange de principaux allèles possibles et sont analysés en parallèle. La
comparaison de différents échantillons à ces références permet l’attribution aux ADN
inconnus d’un code reconnu dans le monde entier.

6.6.9 APPLICATION AU DOMAINE MEDICO–LEGAL

Dans la pratique quotidienne, l’empreinte génétique doit répondre à une question précise : à
qui appartient le tissu biologique trouvé sur la scène de crime ? Pour répondre à cette
interrogation, il est procédé par comparaison entre des pièces de question (prélèvements
réalisés sur les lieux du crime et d’origine inconnue) et des pièces de référence (prélèvements
dont l’origine est parfaitement identifiée : mis en examen, victime, témoins, etc), afin de
savoir s’il y a identité ou non-identité entre une pièce de question et une pièce de référence.
Le déroulement de l’analyse peut être schématisé en trois étapes. La première consiste à
visualiser et à identifier les allèles des ADN extraits des prélèvements. Il s’agit d’une étape
essentielle, mais qui peut être sujet à des difficultés ou qui peut entraîner des erreurs. Au
cours de la deuxième étape, on réalise la comparaison entre les ADN provenant des sources
différentes pour répondre à l’identité ou à la non-identité des prélèvements. Si la réponse est
positive (une identité est trouvée entre une pièce de question et une pièce de référence), la
troisième étape permettra de pondérer l’affirmation d’identité des deux pièces par le calcul
d’un risque d’erreur statistique.

● Applications

En recherche en paternité

En général, la recherche en paternité est le domaine de choix de l’empreinte génétique, car le


matériel y est abondant et de bonne qualité. Dans cette application, la biologie moléculaire a
révolutionné les habitudes. Il y a encore dix ans, les experts, avec les groupes et sous-groupes
sanguins, excluaient les paternités mais n’osaient pas les affirmer. A l’exception de quelques
dinosaures fossilisés, l’ensemble de la communauté s’est tourné vers la magie de l’ADN : on
peut affirmer la paternité. En effet, le patrimoine génétique est hérité de chacun de nos
parents : nous recevons la moitié de notre ADN de notre mère et la moitié de notre père
biologiques. Par comparaison de l’ADN maternel avec celui de l’enfant, on peut identifier
l’allèle maternel et déduire l’allèle du père biologique.

Il suffira d’examiner l’ADN du père présumé pour déterminer la présence ou l’absence de cet
allèle. Si l’exclusion est formelle, l’affirmation de paternité se complète d’un calcul donnant
un index et une probabilité de paternité exprimée en pourcentage. Elle est généralement
supérieure à 99, 999 %. Il convient de noter enfin la possibilité d’utiliser cette démarche pour
272
des recherches en maternité ou des identifications des cadavres par l’intermédiaire d’une sœur
ou d’un frère. La recherche en paternité soulève des interrogations éthiques. Il s’agit d’un
moment douloureux pour ces familles qui s’entre-déchirent et l’expert représente la science
toute puissante qui tranche définitivement. En a-t-il le droit ? Le vrai père est-il toujours le
géniteur ou n’est-il pas plutôt celui qui aime ?

En criminologie

– Cas de viol

C’est dans les agressions sexuelles que l’empreinte génétique a le plus apporté d’aide à la
justice. Avant la mise en œuvre de cette technique, le biologiste répondait par la présence ou
l’absence de spermatozoïdes et arrivait quelques fois à déterminer le groupe sanguin. Quand
on sait que plus de 40 % de la population est du groupe sanguin A et plus de 40 % du groupe
sanguin O, on comprend la précision du résultat ! Le support de choix pour l’analyse est
l’écouvillon. Les techniques utilisées permettent de séparer les cellules de la victime (cellules
épithéliales mortes provenant de la paroi vaginale, anale ou buccale) des spermatozoïdes en
jouant sur la résistance plus élevée de ces derniers. La mise en évidence de l’empreinte
génétique de la victime dans la fraction enrichie en cellules épithéliales est un excellent témoin
interne, permettant de valider à la fois l’expérience, mais aussi la bonne origine du
prélèvement.

Pour les viols, outre l’écouvillon, tout élément portant du sperme est utilisable : le slip est un
excellent matériel s’il est resté bien sec et conservé à l’abri de la lumière (un tel matériel a
permis de caractériser, après plusieurs années, l’empreinte génétique d’un auteur de viols en
série), les lames utilisées par les biologistes pour la recherche de sperme, les mouchoirs, les
vêtements. La quantité minimale de spermatozoïdes qui peut être mise en évidence est de 100
à 200. Ce seuil de détection a été volontairement fixé assez haut. La lecture de certaines
publications montre que des équipes travaillent sur une seule cellule. Elles se situent dans un
contexte particulier où les conditions de stérilité peuvent être contrôlées du début à la fin des
manipulations.

En médecine légale, il n’y a aucune maîtrise des opérations en amont (prélèvement sur la
victime) et de nombreuses contaminations peuvent être introduites. L’abaissement du seuil de
sensibilité obligerait à augmenter le nombre de cycle de la PCR et multiplierait les risques
d’amplification d’ADN étranger au prélèvement initial (ADN apporté par l’enquêteur ou
introduit au cours des manipulations dans le laboratoire), ce qui conduirait à rendre un résultat
sans cependant pouvoir certifier de son exactitude. Le préservatif est un excellent support
pourvu que son utilisateur veille bien l’abandonner sur le lieu du crime. Cet objet présente un
avantage énorme, outre qu’il protège la victime de toutes maladies sexuellement
transmissibles, il va apporter une double information : à l’intérieur se trouvent les
spermatozoïdes de l’agresseur et à l’extérieur, il est possible de mettre en évidence l’ADN de
la victime. Ainsi certains violeurs prétendant avoir utilisé le préservatif avec une de leurs
amies de rencontre ont été confondus par l’ADN de la victime présent sur la face externe. Il
convient de remarquer que l’empreinte génétique ne peut qu’identifier le sperme d’un individu
et affirmer une relation sexuelle. La notion de consentement n’est pas de ce domaine.
273

– Autres crimes

Toute trace biologique est analysable pourvu que les cellules soient en nombre suffisant :
microtaches de sang, salive sur des mégots de cigarette, des verres ou des goulots de bouteille,
écoulement nasal sur des cagoules, prélèvement sur des volants de voiture. La liste n’est pas
limitative et le seuil de sensibilité sera encore une fois déterminant. Il s’agit de trouver un
équilibre entre sensibilité maximale et validité des résultats.

Applications hospitalières

– Suivi de greffe de la moelle osseuse

Dans certains types de leucémies, les médecins sont amenés à greffer les cellules de la moelle
osseuse. Le choix du donneur est conditionné par la compatibilité des cellules du receveur et
du donneur, élément important en ce qui concerne le rejet de greffe. Les individus les plus
proches sont les frères et sœurs ou éventuellement les parents. Si ce choix du donneur est le
plus satisfaisant pour le souci de compatibilité, il soulève le problème de suivi de
l’intervention. En effet, après une irradiation qui va détruire les cellules souches sanguines du
receveur, les cellules du donneur sont injectées. Les praticiens vont devoir diagnostiquer un
éventuel rejet.

Par les systèmes classiques (HLA en particulier), il est difficile de différencier deux individus
de la même famille (donneur et receveur ont été choisis en particulier pour la compatibilité de
leurs systèmes HLA !). L’empreinte génétique vient alors au secours du clinicien permettant
de distinguer facilement l’ADN de frères et sœurs et de déterminer si la greffe est stable (ADN
du donneur uniquement), s’il y a une rechute avec la présence d’un chimérisme, c’est-à-dire
un mélange de l’ADN du donneur et du receveur, ou s’il y a un rejet complet de la greffe
(ADN du receveur uniquement).

– Empreintes génétiques et diagnostic prénatal

Lors des analyses de diagnostic prénatal de maladies génétiques, des cellules fœtales
(trophoblastes ou cellules du liquide amniotiques) sont prélevées par l’obstétricien. Il est
difficile de contrôler visuellement la qualité du prélèvement et d’affirmer l’absence totale de
tissu maternel parmi les cellules fœtales. Un mélange peut aboutir à un résultat erroné et
entraîner une erreur de diagnostic. La détermination de l’empreinte génétique permet de
différencier l’ADN de la mère et l’ADN du fœtus et de s’assurer de la pureté du prélèvement.
Cette étape est devenue une obligation dans le protocole d’assurance-qualité pour le diagnostic
prénatal. Le diagnostic par empreintes génétiques de vrais ou faux jumeaux (jumeaux mono-
ou dizygotes) et important dans le cadre de maladies ou malformations in utero, puisqu’il
conditionne la décision thérapeutique du clinicien.
274
– Empreintes génétiques et mutations spontanées

Dans le cas d’une survenue brutale, sans antécédents, d’une maladie génétique, le biologiste
recherchera dans les chromosomes ou dans l’ADN l’anomalie responsable de la maladie. Si
cette anomalie n’est retrouvée ni chez la mère, ni chez le père, on évoquera une mutation de
novo. Encore faut-il exclure, par empreinte génétique, une fausse paternité, événement aussi
ou peut-être plus probable qu’une mutation spontanée.

Un cas particulier : les séquences du chromosome Y

De même que l’ADN mitochondrial est spécifique d’une transmission maternelle, le


chromosome Y est une marque spécifique du genre masculin. Il permet de suivre la lignée
paternelle : tout garçon reçoit son chromosome Y de son père biologique. Et comme les
autosomes, le chromosome Y possède des régions variables qui montrent beaucoup moins de
variabilité interindividuelle ou allélique. L’analyse de ces régions variables ne peut être
envisagée qu’en appoint des régions variables des autosomes. Leur faible pouvoir discriminant
ne permet par leur utilisation isolée en affirmation d’identité. Elles peuvent cependant être
utiles dans quelques situations particulières :

a. Dans les viols multiples, l’analyse des régions variables du chromosome Y permet de
dénombrer le nombre d’individus ayant eu un rapport sexuel avec la victime : l’ADN féminin
n’apparaîtra pas et les ADN masculins ne seront caractérisés que par un seul allèle ; b. Dans
les recherches au sein de l’entourage familial quand l’ADN d’un individu suspect présente des
caractères proches de ceux de l’ADN de l’agresseur, qu’il est possible d’exclure formellement
le mis en cause, mais qu’il est probable que l’agresseur pourrait être un parent proche. Dans
une telle situation, si l’analyse de l’ADN mitochondrial doit permettre d’identifier un éventuel
lien maternel, alors l’analyse des régions variables du chromosome Y renseignera sur un lien
paternel.

Ces indications sont précieuses pour les enquêteurs, leur permettant de limiter leurs
investigations aux personnes désignées par le biologiste ; c. Dans les recherches en paternités
complexes (comparaison avec des apparentés éloignés), l’analyse des régions variables de
l’ADN du chromosome Y peut apporter un élément essentiel en terme d’exclusion. Il est
indispensable d’avoir dans sa palette de technologies l’analyse des régions variables du
chromosome Y, tout en sachant qu’il ne s’agit que d’une technique de complément nécessitant
une interprétation prudente.

6.6.10 EMPREINTES GENETIQUES SUR L’ADN MITOCHONDRIAL

C’est en 1981 qu’Anderson publia la séquence complète de l’ADN mitochondrial. Cet ADN ne
possède aucun lien avec l’ADN du noyau. Bien que moins discriminant que l’analyse des STR
de l’ADN nucléaire, la caractérisation des régions variables de l’ADN mitochondrial représente
un progrès important dans l’identification notamment en médecine légale. En fait, l’ADN
nucléaire présente certes un grand pouvoir discriminant, mais il existe un certain nombre de cas
où l’ADN nucléaire n’est plus accessible ou l’est en quantité tellement faible qu’il est très délicat
275
de le caractériser (identification de cadavre, caractérisation d’excréments ou de cheveux). Les
caractéristiques particulières de l’ADN mitochondrial sont :

a- Le génome mitochondrial est complètement différent de l’ADN nucléaire. Aux 2 fois trois
milliards de nucléotides assemblés sous forme de 23 paires de molécules linéaires contenues dans
le noyau, la mitochondrie oppose un ADN monomoléculaire et circulaire de seulement 16569
nucléotides ; b- Dans la cellule où l’ADN nucléaire est représenté en un unique exemplaire (ou
deux pour les cellules diploïdes), la mitochondrie existe à plusieurs dizaines, voire plusieurs
centaines de copies. Un enrichissement s’effectue donc naturellement et favorisera les
amplifications ultérieures ; c- La mitochondrie est un organite extrêmement solide, pouvant
résister dans des conditions extrêmes, alors que le noyau a été détruit ; d- La mitochondrie
possède des zones de variabilité qui sont des points de mutation portant sur un ou plusieurs
nucléotides. Les variations sont cependant moins discriminantes que celles observées dans
l’ADN nucléaire ; e- La mitochondrie étant transmise par les femmes, il sera aisé d’identifier un
cadavre par rapport à n’importe quel apparenté, pourvu qu’il y ait un lien maternel (mère, sœur,
etc).

Au contraire, un ADN inconnu trouvé sur une scène du crime impliquera tous les individus issus
de la même lignée maternelle (frères, cousins, par les mères, etc). Il convient de remarquer que la
totalité de l’ADN mitochondrial n’est pas étudiée, seule une région d’environ 600 nucléotides est
séquencée, la région contrôle qui présente un taux de mutations spontanées suffisamment élevé
(une mutation spontanée toutes les 30 générations environ) pour montrer une hétrérogénéité
interindividuelle au sein d’une population. Comme dans l’analyse de l’ADN nucléaire, l’étude de
l’ADN mitochondrial comporte trois étapes : définition du mitotype, comparaison des mitotypes
et détermination du risque d’erreur en cas de conclusion d’identité.

Définition du mitotype

Cette étape est en grande partie automatisée et ne pose de problème que lorsque l’ADN est de
mauvaise qualité ou en faible quantité. Le séquençage utilisant les techniques d’amplification, il
est encore indispensable d’insister sur les risques encourus lors de cette manipulation par les
problèmes de contamination. La comparaison de la séquence obtenue à la séquence de référence
dite d’Anderson permet de définir le mitotype qui est constitué par les points de différence
observés entre ces deux séquences.
Comparaison des mitotypes

La comparaison des mitotypes des pièces de question (prélèvements effectués sur la scène du
crime) et des pièces de référence (individus identifiés) est réalisée de la même manière que
lorsqu’on compare les profils génétiques pour l’ADN nucléaire. Si les mitotypes des éléments
de question et de référence sont différents, l’identité sera exclue. Par contre, s’ils sont
identiques, la conclusion d’identité est assortie d’une certaine incertitude estimable sous forme
d’un risque d’erreur.
276
Détermination du risque d’erreur en cas de conclusion d’identité

La caractérisation de l’ADN mitochondrial en est à ses balbutiements et le problème est plus


complexe que pour l’ADN nucléaire. Les mutations observées portant sur une même région
de taille assez faible, il serait hasardeux de considérer qu’il n’existe aucun déséquilibre de
liaison. On peut en effet penser que certains polymorphismes sont préférentiellement associés
entre eux (déséquilibre de liaison) de sorte que la fréquence de deux polymorphismes de la
région contrôle ne serait plus le produit de la fréquence de chacun d’eux. Dans un tel cas, il
serait scientifiquement incorrect de calculer la fréquence d’un mitotype comme le produit de la
fréquence de chaque mutation (ou allèle) comme cela est fait pour les STR qui sont en
équilibre gamétique.

C’est pourquoi l’idée qui, sur le plan international, a prévalu a été de se reporter à un ensemble
d’ADN : une banque a été constituée aux Etats-Unis dans un laboratoire de l’armée américaine
et constitue la référence. Commencée avec 742 individus, elle est composée en 2002 de 4360
mitotypes provenant d’individus non apparentés et d’origines ethniques différentes
(Caucasiens, Asiatiques, Noirs). La fréquence du mitotype caractérisé est donnée par
comparaison avec cette banque, allant de 2,6 % (le plus fréquent) à moins de 0,02 % (aucun
individu trouvé sur la banque).

La conclusion de la comparaison entre des prélèvements de question et des prélèvements de


référence sera donc : a. soit une exclusion ; soit une affirmation d’identité, avec comme
corollaire la fréquence du mitotype dans la banque de données et surtout l’indication que ce
mitotype peut être trouvé chez tout individu de la même lignée maternelle. Il existe quelques
cas où cette technique d’empreinte sur ADN mitochondrial est mise en échec, comme la
différence d’un seul nucléotide entre l’ADN d’un cadavre à identifier et son apparenté. En
effet, toute interprétation est impossible puisqu’il est impossible de savoir si les deux ADN
proviennent de deux personnes non apparentées (un seul nucléotide de différence par le fait du
hasard) ou si les deux personnes sont apparentées et qu’il y a eu une néomutation lors de la
transmission de l’ADN mitochondrial vers l’une d’elles.

Hétéroplasmie

Les mutations sont assez fréquentes dans l’ADN mitochondrial pour que, parfois, un même
individu puisse contenir deux populations de mitochondries (hétéroplasmie). En position
16069, le nucléotide décrit dans la séquence d’Anderson est un C. Pour un individu Y, une
superposition de deux nucléotides pourra apparaître : un T et un C. En fait deux types de
mitochondries coexistent chez l’individu : celles où un T est présent en position 16069 et
celles où un C est présent à la même position. Des techniques de clonage sont nécessaires
pour pouvoir séparer les deux populations. Certaines parties de l’ADN mitochondrial (région
309 et 315) sont particulièrement sensibles à ce phénomène et notre système capillaire est un
laboratoire extraordinaire pour observer le phénomène. Le cheveu est clonal (chaque cheveu
provenant d’une lignée cellulaire unique) alors que le sang montre une polyclonalité
(l’ensemble de lignées cellulaires est apparenté). Pour l’individu qui montre une
hétéroplasmie, l’une ou l’autre des situations (homoplasmie ou hétéroplasmie) sera mise en
évidence, selon les cheveux analysés.
277
Application à l’identification des cadavres

Si l’ADN nucléaire d’un cadavre « frais » est intègre, plus le temps passe, plus les
phénomènes de destruction cellulaire sont importants. En conditions extrêmes, la chair aura
totalement disparue et seuls les ossements seront accessibles. Il est quelquefois possible de
caractériser l’ADN nucléaire à partir d’ossements anciens (identification des restes du tsar ou
de sa famille, etc), mais il s’agit d’un exercice difficile et l’obtention d’un résultat est
aléatoire. D’autre part, il n’est pas toujours possible d’avoir accès à des parents très proches
(parents, enfants) pour la comparaison, alors que la plupart du temps, un apparenté par la
lignée maternelle reste plus facile à trouver (cousins, tantes, etc). En général, les cadavres
soumis à une étude d’identification par empreinte génétique ont pu être identifiés par la
technique sur l’ADN mitochondrial.

Un exemple classique est l’identification des restes du tsar. Lors de la Révolution russe, le
tsar, la tsarine, leurs enfants et un certain nombre de leurs familiers ont été exécutés par les
bolcheviques, puis enterrés au cours de la nuit du 16 août 1918. Une incertitude régnait sur la
localisation exacte de l’inhumation et en 1991, une équipe de médecins et d’anthropologues
soviétiques mirent au jour des ossements humains dans la région d’Ekaterinbourg, dont on
disait qu’ils pourraient être ceux de la famille impériale. Une équipe anglo-russe se chargea
de l’étude. Neuf corps purent être reconstitués (quatre hommes et cinq femmes). L’examen
de l’ADN fut immédiatement envisagé après l’étude anthropologique et les descendants par
les femmes furent recherchés du côté de la famille du tsar et du côté de la famille de la tsarine.

Les analyses montrèrent que la tombe contenait effectivement les restes du tsar, de la tsarine et
celles de deux de leurs enfants. Deux enfants manquaient, le tsarévich et Anastasia. Or depuis
de nombreuses années, une femme aux Etats-Unis affirmait être la princesse. Cette prétendue
Anastasia était hélas décédée et incinérée depuis quelques années. Cependant un fragment de
son intestin (prélevé lors d’une biopsie) avait par chance été conservé. L’analyse menée par
deux laboratoires indépendants montra que l’ADN mitochondrial était différent de celui de la
tsarine. Anastasia était en fait un imposteur. Son identité fut définitivement établie par
comparaison avec un habitant de Pomérénie dont on disait qu’il pouvait être le neveu de cette
femme.
Application à l’identification des cheveux

Le cheveu est largement retrouvé dans les délits et crimes liés au vol (vols simples, vols à
main armée, prise d’otage) et au terrorisme. Les cagoules, les vêtements et objets divers sont
les dépositaires de ces éléments pileux. Le cheveu comporte deux parties : a. le bulbe,
responsable de la croissance de l’élément pileux, contient des cellules refermant à la fois de
l’ADN nucléaire et de l’ADN mitochondrial. Pourtant le cheveu retrouvé sur le lieu du crime
est généralement tombé naturellement (on en perdrait jusqu’à 50 par jour !), c’est-à-dire que
son bulbe est mort.

La quantité d’ADN nucléaire extraite est souvent insuffisante pour pouvoir utiliser la
caractérisation par les STR nucléaires. La plupart du temps, seul l’ADN mitochondrial reste
accessible ; b. La tige est composée de chératine, mais a conservé de très nombreuses
mitochondries. Ce cheveu va ainsi focaliser l’attention de tout enquêteur avisé.
278
Malheureusement des limitations vont exister : la quantité d’ADN qui ne permettra pas
d’obtenir un résultat dans tous les cas, le faible pouvoir discriminant (fréquence élevée de
certains mitotypes), et la possible implication (sans discrimination possible) de tout individu
de la même lignée maternelle.

Application à la discrimination entre homme et animal ou entre animaux

Comme le gène du cytochrome b, situé dans l’ADN mitochondrial, montre une spécificité liée
au genre animal, il est possible, par analyse de cette région (différente de la région contrôle),
de déterminer s’il s’agit d’ADN humain ou, en cas contraire, de déterminer l’animal dont il
provient. La technique est tellement puissante que l’on peut différencier ainsi le saumon du
Pacifique de celui de l’Atlantique. Cette technologie est mise en œuvre principalement dans
le domaine agroalimentaire pour les recherches de falsification (présence de viande de volaille
dans un produit certifié pur bœuf, présence de porc dans une nourriture destinée au pays
musulman, etc).

Conclusion

Malgré une automatisation importante, l’analyse de l’ADN mitochondrial reste longue et


coûteuse. Son pouvoir discriminant n’atteindra jamais celui de l’ADN nucléaire. Cependant,
sa détermination apporte des indications précieuses sur des éléments qu’il était impossible
d’analyser jusqu’alors comme les cheveux et les ossements. L’interprétation des résultats doit
être extrêmement prudente et les limites de l’analyse doivent être expliquées au magistrat.

6.7 FECONDATION IN VITRO HUMAINE

La fécondation in vitro ou FIV est une méthode permettant de manipuler, en dehors de


l’organisme, les deux types de gamètes, l’œuf fécondé et les premiers stades du
développement embryonnaire de l’espèce humaine. Il convient cependant de rappeler que
contrairement à ce que tendent à faire croire certaines média, la FIV humaine n’est pas
synonyme de manipulations génétiques. C’est une méthode de procréation assistée qui reste
avant tout un traitement de la stérilité. En général, les méthodes de procréation assistée
trouvent avant tout leur application chez certains couples stériles auxquels ne s’offre quasi
aucune alternance.

Lorsqu’elles font recours aux gamètes étrangers, ces techniques peuvent être utilisées pour
éviter la transmission d’une anomalie génétique dont l’un ou les deux partenaires d’un couple
seraient porteur. Le principe général de la FIV est de prélever des ovules ou des ovocytes, de
les inséminer et de les cultiver en dehors de l’organisme pendant quelques dizaines d’heures.
A l’état d’embryons de quelques cellules, ils sont réimplantés dans l’utérus avec l’espoir que
l’un deux au moins parviendra à s’implanter. Les meilleurs taux de succès en termes de
grossesses produisant des bébés bien portants oscillent entre 15 et 20 % par tentative de
traitement.

On peut obtenir des taux de grossesses globaux allant jusqu’à 25 – 30 %. Il convient


cependant de signaler qu’une proportion importante de gestations, aussi bien en FIV qu’après
279
fécondation naturelle, se termine par une fausse–couche plus au moins précoce. Au départ un
seul ovocyte était recueilli au cours des cycles menstruels naturels. Il a été démontré par la
suite que de bien meilleurs taux de succès peuvent être obtenus en stimulant artificiellement la
croissance de plusieurs follicules ovariens à la fois, permettant de recueillir plusieurs ovocytes
et ainsi de replacer plusieurs embryons en même temps dans l’utérus de manière à augmenter
les chances de grossesse.

En général, deux ou trois embryons au maximum sont replacés dans l’utérus pour éviter les
risques inhérents aux grossesses multiples, triples ou quadruples. Cela permet également
d’obtenir d’éventuels embryons surnuméraires qui pourront être utilisés notamment dans le
traitement de l’infertilité du couple dont les embryons sont issus, dans la préservation des
embryons aux fins de dons d’embryons, dans l’expérimentation à partir d’embryons humains.
A l’origine, la FIV était appliquée dans des cas de stérilité par lésion ou absence des trompes
de Follope. Par la suite ses applications se sont étendues à bien d’autres problèmes tels que la
l’infertilité masculine, la stérilité associée à l’endométriose ou due à des anticorps
antispermatiques ou simplement d’origine inexpliquée (idiopathique). D’autre part, plusieurs
méthodes de procréation assistée sont d’usage courant notamment :

a. Don de gamètes (facilité par la congélation du sperme), applicable dans : 1- insémination


artificielle par le sperme du donneur (IAD) dans le cas de l’infertilité masculine et d’anomalie
génétique chez l’homme et 2- don d’ovocytes dans le cas d’absence d’ovocytes ou d’anomalie
génétique chez la femme. Il existe deux variantes de cette technique : a- collecte d’ovocytes
chez une donneuse, suivie de la fécondation in vitro puis de transfert d’embryons chez la
donneuse et b- insémination artificielle de la donneuse, suivie du lavage de l’utérus puis du
transfert d’embryon chez la donneuse ; b. Fécondation in vitro suivie de transfert d’embryon
(FIV/ET), applicable dans divers types de stérilité féminine et/ou masculine. Elle peut être
combinée au don de sperme ou à la maternité utérine de substitution. Elle peut également être
nécessaire dans le don d’ovocyte ou d’embryon.

Il existe une variante de cette technique : GIFT (Gamete Intrafallopian Transfrer) consistant à
un transfert direct dans la trompe d’ovocytes prélevés et des spermatozoïdes, sans attendre la
fécondation in vitro. La technique nécessite au moins une trompe intacte ; c. Don
d’embryons, applicable dans le cas de stérilité féminine associée à une stérilité masculine ou
d’anomalie génétique chez les deux partenaires du couple, avec utérus fonctionnel ; d.
Maternité de substitution, indiquée dans le cas de stérilité féminine par absence d’utérus, de
maladie grave incompatible avec la grossesse, de but cosmétique ou de convenance
personnelle.

6.8 ARMES BIOLOGIQUES

Toute substance chimique employée en raison de ses effets toxiques sur l’homme, les animaux
et les plantes est considérée comme arme chimique (ONU, 1969, OMS, 1970). Il en existe
plusieurs que l’on peut distinguer selon leurs effets spécifiques : les vésicants, les asphyxiants
au niveau de poumons et des échanges d’oxygène dans les cellules comme l’oxyde de carbone
et le cyanure, les neurotoxiques et les psychotropes, les lacrymogènes.
280
Ces effets peuvent être létaux ou incapacitants dont certains peuvent devenir mortels dans des
lieux confinés ou chez des individus affaiblis tels que les enfants, les vieillards ou les malades.
On parle des armes biologiques lorsqu’il s’agit d’agents dont les effets dépendent de leurs
aptitudes à se multiplier dans l’organisme attaqué, à provoquer la mort ou la maladie chez
l’homme, les animaux ou les plantes. C’est le cas des bactéries qui sécrètent des toxines
comme la toxine botulinique dont quelques grammes suffisent pour détruire toute la terre. Est
considéré ici comme agent biologique, toute créature capable de nuire à l’homme et à son
environnement. Il peut s’agir de virus, de bactéries, de moisissures et d’autres parasites.

Peu encombrant, bon marché et faciles à disséminer malgré les aléas, les armes biologiques
peuvent faire l’affaire des pays pauvres. Des études ont montré que des zones décimées
peuvent être considérables pour des attaques chimiques ou biologiques et que les victimes
peuvent être estimées à des millions dans des populations victimes dépourvues de protection.
C’est pourquoi, comme les armes nucléaires, les armes chimiques et biologiques sont
qualifiées d’armes à destruction massive. A cet effet, une convention sur les armes
biologiques a été mise en place. Selon cette convention, la mise au point, la production et le
stockage d’agents biologiques ou toxiques sont interdits, quelque soit leur origine et leur mode
de production. Des difficultés subsistent cependant dans le contrôle et dans la distinction à
faire entre les armes biologiques offensives et défensives.

En effet, la construction de laboratoires dotés de mesures de protection maximum pour la


production des armes biologiques défensives peut être autorisée. C’est ainsi qu’il existe des
laboratoires disposant de la sécurité maximum pour réaliser des essais notamment sur des
agents pathogènes dangereux, y compris les organismes génétiquement manipulés ou pour
étudier l’efficacité de protection des vêtements, des filtres et pour mettre au point des
méthodes sensibles de protection en cas d’attaque. L’un des exemples est celui de
Bacteridium anthracis, bactérie responsable du charbon et dont les spores se conservent très
longtemps dans les sols. Cette bactérie secrète une toxine (anthracis toxin) composée de trois
protéines inactives isolément : la protéine A responsable des réactions immunitaires de
l’organisme infecté et sert à fixer aux cellules les deux autres protéines, la protéine B
responsable de la mort par un mécanisme inconnu et la protéine C produisant un œdème de la
peau. Seules les combinaisons AB, AC ou ABC sont pathogènes mais faiblement.

Une étude a par ailleurs montré que l’acide polyglutamique de l’enveloppe augmente l’activité
de la toxine par un facteur cent mille. Le génie génétique peut ainsi aider à modifier la façon
dont se développe la maladie en recherchant par exemple les sites actifs des protéines et
récepteurs impliqués et le rôle de l’enveloppe ou en synthétisant des protéines plus toxiques ou
encore des anticorps plus efficaces devant permettre de mieux combattre la maladie en cas de
contamination. Imaginons le cas d’une bactérie A-, dépourvue d’une enzyme catalysant l’un
des étapes dans la synthèse de la protéine A. Prenons le cas d’une bactérie produisant
naturellement une toxine, la toxine A, qui de ce fait la rend pathogène. Il peut exister dans la
population des bactéries A--, dépourvues d’une enzyme catalysant l’une des étapes de la
synthèse de A. Les bactéries qui ne produisent pas l’enzyme A sont devenues inoffensives.
Cette fonction peut toutefois être rétablie en introduisant le gène codant pour cette enzyme
dans une bactérie A- au moyen d’un vecteur viral par exemple.
281
En ce qui concerne les armes biologiques, virus et bactéries sont préparés dans des laboratoires
différents et ne sont mélangés qu’au dernier moment, réduisant ainsi les risques pour le camp
qui possède l’arme. Dans le cas où le camp adverse disposerait d’un vaccin, on peut diminuer
l’efficacité de ce vaccin en modifiant la structure de la protéine responsable de la réaction
immunitaire. Mais on peut par contre préparer un vaccin approprié pour ses troupes et pour
les populations. Le principe est donc de préparer virus et bactéries inoffensifs lorsqu’ils sont
séparés, mais pathogènes une fois réunis. C’est également le cas des armes chimiques binaires
constituées de deux agents chimiques peu toxiques séparés dans un même projectile et qui se
mélangent automatiquement au cours du tir pour donner instantanément un poison
neurotoxique puissant. Le sarin en est un exemple.

6.9 BIOLOGIE MOLECULAIRE ET ETHIQUE MEDICALE

La biologie des organismes supérieurs bénéficie depuis une vingtaine d’années des progrès
spectaculaires, tant dans le domaine des connaissances pures que dans celui des technologies.
Ces progrès conduisent à des possibilités nouvelles et à de nouvelles maîtrises qui, lorsqu’elles
s’appliquent à la madecine, peuvent poser des problèmes d’ordre éthique. Ne seront envisagés
ici que ceux qui sont engendrés par l’essor soudain de la biologie moléculaire, en laissant de
côté ceux qui n’en dérivent pas directement, comme exemple la fécondation in vitro et
l’expérimentation sur les embryons humains. Il convient cependant de se rappeler le contexte
dans lequel la « Nouvelle Génétique » a fait son apparition. La perspective d’accéder au
patrimoine génétique humain, pour l’étudier et éventuellement le modifier, a été d’abord
perçue comme fondamentalement attentatoire à la personnalité génétique de l’individu et de
l’espèce, comme potentiellement dangereuse et comme une porte ouverte à l’eugénisme.

Ces craintes étaient contemporaines de la période initiale (1972 – 1978), où la communauté


scientifique d’abord, l’ensemble du corps social ensuite, s’interrogeaient sur les risques de
tous ordres que pouvaient comporter les « manipulations génétiques ». On sait ce qu’il en est
advenu en ce qui concerne les risques expérimentaux qui, la réflexion et l’espérience aidant,
ont été jugés inexistants. Il reste des problèmes éthiques, en particulier d’ordre médical. Avec
le recul du temps et vu l’état de l’art, il est possible de mieux les appréhender. On peut les
regrouper en 2 catégories, selon que l’accès aux gènes humains constitue seulement une
interrogation, ou qu’il comporte une intervention, c’est-à-dire un acte thérapeutique.

DNA ET MEDECINE PREDICTIVE

Les problèmes éthiques engendrés par l’extraordinaire puissance prédictive du diagnostic


génotypique sont multiples. Les uns sont d’ordre strictement médical, les autres sont de
véritables problèmes de société. Pour la première fois en effet ce n’est plus seulement
l’homme malade qui est en cause, mais chaque individu, dont on pourra prédire l’avenir
pathologique, pour lui-même et pour la descendance.

Au fur et à mesure des progrès du déchiffrage de la carte génétique humaine, un nombre


croissant de locus vont devenir accessibles à l’analyse génotypique, permettant de déchiffrer
chez chaque individu un nombre croissant de maladies, de suscessibilités, de prédispositions.
Les porteus sains des anomalies génomiques récessives les plus fraquentes pourront être
282
identifiés, non seulement dans les familles à risque, mais aussi dans la population générale.
Les problèmes éthiques ainsi posés se ramènent au diagnostic prénatal et au diagnostic
présymptomatique. Ces deux types de diagnostic sont des actes de médecine prédictive.

Cette dernière consiste à refuser la fatalité, ce qui est le fondement de l’attitude médicale face
à la maladie. Lorsque la fatalité est d’ordre génétique faut-il s’opposer ou au contraire s’y
regner ? Le problème n’est pas strictement d’ordre religieux. Le diagnostic prénatal, assorti
d’une interruption de grossesse, est largement admis et pratiqué pour un grand nombre de
handicaps graves et incurables. Se pose dès lors le problème de la définition du handicap. Le
refus du handicap est un fait de société, encouragé par les progrès de la médecine portés à la
connaissance du public. C’est en définitive au couple, convenablement éclairé par le
généticien, qu’appartient la décision d’interrompre ou de poursuivre une grossesse. Mais un
problème éthique se pose si l’exigence de qualité du produit de conception pousse les parents à
refuser le moindre handicap. Jusqu’à présent c’était le médecin qui en conscience fixait les
limites d’acceptabilité de cette exigence.

Devant l’accroissement du pouvoir prédictif, il ne lui est plus possible de prendre seul la
responsabilité de tracer les frontières entre l’acceptable et l’inacceptable. C’est aux comités
d’éthique qu’appartient de plus en plus cette responsabilité. C’est une tâche difficile, à cause
de l’évolution rapide des connaissances, des savoi-faire et mœurs. Dès maintenant un
problème se pose pour la prévention des handicaps à manifestation tardive dans le cours de la
vie, s’opposant ainsi au cas relativement simple des handicaps de l’enfant. Les polykystoses
rénales en sont un exemple. Au moins 2 locus sont en cause, l’un pour la forme dominante de
l’adulte, il s’agit su locuq PKD1 sur le chromosome 16, l’autre pour la forme récessive
infantile, non encore localisé. Le diagnostic prénatal de cettte dernière, très sévère, à
manifestation précoce et non curable, parait justifié. Cela n’est pas encore possible, le gène
n’étant pas encore localisé.

Le diagnostic prénatal de la forme dominatnte de l’adulte est en revanche possible grâce à des
RFLP proches du locus PKD1. Un tel diagnostic pose un problème éthique puisque
l’insuffisance rénale de la forme évoluée de la polykystose est justiciable d’une épuration
extra-corporelle longtemps efficace. D’autre part si le diagnostic génotypique fœtal est porté
aujourd’hui, la maladie ne se développera que dans une quarantaine d’années, à un moment où
on peut espérer que des progrès thérapeutiques seront intervenus. Ceci pose plus généralement
le problème du diagnostic présymptomatique des maladies graves à manifestation tardive et
non encore justiciables d’une thérapeutique.

La chorée de Hantington en est l’exemple le plus typique. C’est une maladie


neurodégénérative grave, apparaissant en général après la quarantaine, sans aucun symptôme
clinique ou biologique avant-coureur, évoluant en plusieurs années vers la déchéance mentale
et la mort, sans aucun recours thérapeutique. Le gène responsable de cette maladie dominante
a été localisé à l’extrémité du bras court du chromosome 4. Ce gène n’est pas encore été
identifié, mais il existe des RFLP proches permettant d’effectuer un diagnostic indirect avec
une fiabilité de l’ordre de 96%. Pour le moment le diagnostic génotypique de la chorée de
Hintington ne peut avoir qu’un seul objectif, celui de permettre aux sujets en âge de procréer
d’avoir une descendance normale.
283

Cette interruption de la chaîne fatale ne peut se faire qu’au prix de de l’identification


prémorbide des sujets porteurs du gène normal. Si chez les sujets déclarés indemnes le
soulagement est considérable, la révélation de la vérité aux sujets atteints représente un verdict
lourd de conséquences, puisqu’aucun traitement ne peut leur être proposé. Les individus à
risque (le risque est de ½ chez chaque enfant de sujet ayant développé la maladie) ont-il le
droit de savoir, le droit de ne pas savoir, le devoir de savoir ? qu’en est-il du conjoint ?

Ces graves problèmes d’éthique individuelle et familiale sont tellement importants quu’ils ont
empêché toute banalisation du dignostc génotypique de la chorée de Hintington. Des études de
faisabilité psychologique ont conclu à la nécessité d’une préparation soigneuse des familles et
d’une véritable assistance à la décision. Celle-ci doit comporter un accompagnement médical
et psychologique très soigneux chez les sujets qui réclament le test. Seuls de rares centres
multi-disciplinaires spécialisés sont à mesure de fournir ces services.

BIOLOGIE MOLECULAIRE ET SOCIETE

Les activités médicales recouvertes par la bioéthique réclament une réflexion approfondie de
la part de la société toute entière, immédiatement informée des moindres possibilités
d’innovation. Si l’impact médical de la génothérapie somatique peut-être objectivement
considéré comme quantitativement modeste, la vision beaucoup plus objective qu’ont de ces
problèmes les philosophes, les autorités religieuses, les sociologues, les journalistes, et
finalement le public est toute différente. Ces derniers sont extrêmement vigilants, et attentifs à
tout ce qui touche les applications médicales du génie génétique. La possibilité de déchiffrer le
génome humain, d’identifier les gènes morbides responsables du lourd tribut payé aux
maladies génétique et, en attendant de les comprendre et de les soigner, la possibilité de les
diagnostiquer par une analyse génotypique, ont un impact considérable sur les familles
concernées.

Il faut souligner le rôle de plus en plus important que jouent les asssociations des malades qui
regroupent les malades et leurs familles affectés par une pathologie génétique déterminée. Ces
associations jouent un rôle déterminant, d’une part en répertoriant, en informant, en mobilisant
et en motivant les familles, d’autre part, en favorisant des enquêtes familiailes menées à
l’échellon national, de plus en plus nécessaire pour la localisation des gènes inconnus. Leur
impact sur le grand public et sur les pouvoirs publics est un important fait de société. Chez les
enfants ce tribut est particulièrement lourd : les maladies génétiques sont responsables d’un
tiers des admissions en pédiatrie et de la moitié de la mortalité infantile.
La possibilité de déterminer le sexe du fœtus, et celui des embryons, voire des spermatozoïdes
(par détection des séquences du chromosome Y après amplification par PCR) conduit à la
maîtrise de la détermination du sexe dans l’espèce humaine. Cette maîtrise potentielle
représente, quelle que soit l’autorité qui se l’arroge parentale ou étatique) un très sérieux
problème éthique. Un autre problème concerne la sauvegarde et l’utilisation de l’information
génotypique. Si celle-cccci a été obtenue chez un malade avant sa mort, elle peut à son tour
être indispensable pour permettre d’effectuer dans la même famille un diagnostic de
transmettrice de maladie liée au chromosome X, un diagnostic de gène morbide dominant, un
diagnostic prénatal.
284

Il est probable que la nécessité de recueillir et de stocker ce genre d’information, dans les
familles à risque pour les maladies génétiques graves, se fera de plus en plus sentir, imposant
le recours à l’informatique. L’établissement des régistres génétiques pose un problème de
confidentialité, celle-ci étant imposée par la double nécessité de respecter le secret médical et
de se conformer à la loi Informatique et Libertés. Comme il devient possible d’explorer le
génome de chaque individu de manière de plus en plus approfondie, il n’est pas absurde
d’imaginer qu’on puisse un jour établir pour chacun une carte d’identité génétique où tous les
secrets de la personnalité physique, biologique, et même psychique seraient consignés.

Au point de vue strictement médical, le bénéfice de ce stade avancé de la médecine prédictive


ne paraît pas discutable si à la prédiction s’attache une possibilité de prévention, par des
mesures diététiques ou environnementales appropriées. On peut l’imaginer par exemple pour
l’hypertension artérielle, l’arthérosclérose, certains cancers. Par ailleurs si l’avenir biologique
de chacun peut être lu dès sons plus jeune âge, à qui cette information peut-elle être dévoilée ?
A l’individu mui-même ? A sa famille ? A une autorité médicale désintéressée et tutélaire ?

D’autre part de nombreux organismes privés, voire publics, peuvent avoir intérêt à lire dans
l’avenir médical des individus, pour des raisons professionnelles ou actuarielles. La médecine
prédictive fondée sur l’information génotypique est donc une arme à double tranchant : - elle
vise à libérer l’homme du fardeau génétique, - elle risque de restreindre la liberté de l’individu
en exposant ses faiblesses constitutionnelles.

a- Ethique et thérapie génique

Inacceptabilité et absurdité de la génothérapie germinale : La génothérapie germinale n’est


pas véritablement à la source de problèmes, puisqu'’lle unanimement rejetée, par les experts
scientifiques comme par les autres représentants du corps social appelés à réfléchir sur les
problèmes éthiques (philosophes, religieux, juristes, simples citoyens). Ce rejet est fondé avant
tout sur des considérations morales considérant le patrimoine génétique humain transmissible
comme inaliénable. Chez les généticiens moléculaires s’y ajoutent des considérations
scientifiques : actuellement la génothérapie humaine est techniquement impraticable, d’un
rendement très faible chez la souris (de l’ordre de 1% des ovocytes micro-injectés) et d’un
résultat totalement imprévisible.

Le risque de mutagenèse insetionnelle, d’activation d’un prorooncogène, et surtout l’absence


complète de garantie thérapeutique représentent des obstacles médicaux rédhibitoires. On doit
y ajouter une objection de pure logique. Elle concerne le fait qu’il paraît absurde de tenter un
geste irréparable et définitif engageant les générations ultérieures alors que, grâce au
diagnostic prénatal déjà en vigueur, il est possible d’assurer aux parents une descendance
normale. La génothérapie germinale ne peut s’adresser qu’à un embryon dont on est certain
qu’il est normal. Or le risque est de 1 sur 4 pour les maladies autosomiques récessives, et de 1
sur 2 pour les maladies liées au sexe et les maladies dominantes. Il faudrait donc pouvoir
effectuer un criblage préalable, ce que l’on ne sait pas faire. Si un tel tri devenait possible, et
toutes considérations éthiques mises à part, il serait plus logique de conserver l’embryon
normal. En raison des progrès de la technologie, qui permettent d’envisager à brève échéance
285
le typage génétique d’une celle cellule par la méthode PCR, on peut même imaginer de tester
les gamètes individuellement. Cette possibilité de tri gamétique préconceptionnel rendrait
cadique toute idée de génothérapie germinale.

La génothérapie somatique : Si aucune tentative n’a encore été effectuée chez l’homme, c’est
faute d’un savoir-faire et non pas pour des raisons d’éthique. Seuls les embryons conçus par 2
parents homozygotes pour une maladie récessive, par exemple la mucoviscidose ou la
phénylcétonurie, ont 100% de risques d’être anormaux. Au point de vue éthique, les points
essentiels sont les suivants : 1- la maladie choisie devra être grave et incurable par tout autre
moyen en vigueur ; 2- le système biologique sera complètement caractérisé et l’efficacité
démontrée par un stde d’expérimentation préclinique chez l’animal ; 3- le bénéfice escompté
et les risques supposés seront soigneusement pesés ; 4- la qualification des chercheurs et les
moyens logistiques seront adéquats ; 5- le choix des patients sera soigneusement déterminé ;
6- on aura recours à la procédure de consentement éclairé ; 7- on assurera la confidentialité de
l’expérience et on préservera l’anonymat des patients face à la curiosité des médias. En
pratique otus ces points seront vérifiés par des comités d’experts exxaminant tous les aspects
médicaux et éthiques.

b- Les comités déthique (des garde-fous)

Tous les problèmes éthiques envisagés sont désormais du ressor des comités d’éthique. Ils sont
en dernière analyse examinés par le Comité national consultatif d’éthique. Cette structure de
réflexion rassemble des médecins, des biolgistes fondamentaux, des juristes, des philosophes,
des représentants des divers courants de pensée religieuse et laïque, des usagés représentés par
les associations des malades. Elle a à connaître des problèmes éthiques que soulèvent les
onovations médicales, dont l’accès au gène ne représente qu’un des aspects.
286
Chapitre 7

TECHNIQUES GENERALES UTILISEES EN


BIOLOGIE MOLECULAIRE

7.1 ANALYSE GENETIQUE DES MUTANTS

7.1.1 RECOMBINAISON GENETIQUE ET CARTOGRAPHIE GENETIQUE

La recombinaison génétique inclut une variété de phénomènes permettant le réarrangement


des gènes comme le processus permettant à deux gènes ou à deux mutations, localisées
initialement sur deux chromosomes différents d’être réassociés sur un même chromosome.
Pour ce faire, il suffit de se référer au mécanisme de couper-coller. Ce modèle postule que
dans un premier temps, deux chromosomes s’alignent l’un par rapport à l’autre. Puis une
coupure a lieu au hasard, mais de manière symétrique sur les deux chromosomes. Ensuite, les
quatre fragments issus de ces coupures sont recollés pour former de nouvelles combinaisons
des gènes. Il s’agit d’un modèle naïf et incorrect. Il permet néanmoins de rendre compte des
caractéristiques des échanges génétiques. Le processus se déroule comme suit : deux
chromosomes possédant les génotypes a+b- et a-b+ s’apparient, sont clivés et sont ensuite
assemblés pour former deux chromosomes recombinants dont les génotypes sont a+ b+ (type
sauvage) et a- b- (double mutant).

A+ b- c-
x
- +
a b c+

a+ b- échange et collage a+ -------------- b+ Type sauvage


__ _ _ _ _ _ _ _ _ _ _ __ __ _ _ _ _ ___ ___

a- b+ a- b- double mutant
(cassure) recombinant
Parent

Dans la cartographie génétique, la distance sur le chromosome entre deux loci recombinants
(ou deux mutations) détermine la fréquence de recombinaison. Tant que les deux loci ne sont
pas très proches l’un de l’autre et que les coupures se font au hasard, la fréquence de
recombinaison est proportionnelle à la distance. Ainsi, dans le croisement suivant, les
génotypes des chromosomes sont a+ b- c- et a- b+ c+, les gènes sont placés par ordre
alphabétique et équidistants : il apparaît deux fois plus de recombinants a+c+ que de
recombinants a+b+ du fait que le locus a est deux fois plus éloigné du locus c que du locus b.
Etant donné que la fréquence de recombinaison est proportionnelle à la distance, elle peut être
utilisée pour déterminer l’ordre des gènes sur le chromosome. L’ordre des gènes et leurs
distances relatives constituent une carte génétique. N’importe quel gène peut être cartographié
par cette méthode.
287
7.1.2 COMPLEMENTATION

Un phénotype particulier est fréquemment le résultat de l’activité d’un grand nombre de


gènes. Lors d’une étude génétique, il est important de connaître le nombre de gènes et
d’éléments de régulation constituant ce système. Ce dénombrement est réalisé par le test de
complémentation. Pour réaliser la complémentation, il faut que les deux copies de l’unité
génétique que l’on veut tester soient présentes dans la même cellule. Chez les bactéries, il
faut construire un diploïde partiel, ce qui équivaut à construire une cellule possédant un lot de
gènes et un certain nombre de ces gènes en double. Le génotype d’un diploïde partiel est
représenté par le génotype de chacun des ensembles de gènes de chaque côté d’une ligne
diagonale.

Par exemple, b+c+d+ / a+b-c-d-e+… z+ indique qu’un fragment chromosomique contenant les
gènes b, c et d est présent dans la cellule dont le chromosome porte les gènes a, b, c, ….., z .
Ordinairement, seuls les gènes dupliqués sont indiqués, ainsi ce diploïde partiel serait noté
b+c+d+/b-c-d-. Les tests de complémentation sont couramment utilisés lors de la
caractérisation initiale d’un système génétique. En effet, à partir d’une collection de mutants, il
est possible de réaliser tous les tests de complémentation entre ces mutants. Cette analyse, qui
peut être longue, est néanmoins la plus directe. La règle de base est la suivante : Règle I : si
les mutants x1- et x2- se complémentent, leurs mutations respectives sont situées dans des
gènes différents. La réciproque qui est que si deux mutations ne complémentent pas, elles sont
dans le même gène, n’est pas toujours vérifiée.

Un manque de complémentation entre deux mutations a trois explications qui sont énoncées
dans la règle suivante. Règle II : si des mutations x1- et x2- ne se complémentent pas, une des
explications suivantes est vraies : 1- elles sont dans le même gène ; 2- une de ces mutations est
dominante soit parce qu’elle est localisée dans un site de régulation pour l’autre gène, soit 3-
parce qu’elle produit un inhibiteur. Le concept de complémentation est également applicable
aux phages et c’est une méthode courante que d’assigner par complémentation des mutations
portées par des phages à des gènes particuliers. La construction d’un équivalent du diploïde
partiel bactérien est réalisée par l’infection d’une même bactérie par deux phages mutants, ne
pouvant ni l’un ni l’autre se développer isolément. Si les deux mutants se complémentent, des
phages sont produits par les cellules doublement infectées.

Ce test est couramment réalisé avec des mutants conditionnels. Considérons deux mutations
thermosensibles a-(ts) et b-(ts), situés respectivement dans les gènes a et b de deux phages.
Aucun des produits de ces gènes n’est actif à 42°C, aussi les mutants ne peuvent se développer
à cette température. La production de ces phages dépendra de la complémentation éventuelle
des deux mutations ts. L’adsorption des phages sur un hôte bactérien est réalisée à 42°C et les
cellules infectées sont ensuite incubées à cette température. Dans les cas où une bactérie n’a
été infectée que par le phage a (ts) ou b (ts), aucun phage ne sera produit. Si les deux ont
adsorbé la même bactérie et si les mutations ts- sont dans deux gènes différents, la cellule
infectée contiendra une bonne quantité du produit A et une bonne quantité du produit B. Il y a
complémentation, ce qui permettra la production des phages. En plus des deux types parentaux
a- (Ts) et b- (Ts), il existera dans le lysat final quelques phages recombinants sauvages et
doubles mutants a- (Ts) et b- (Ts).
288

7.2 PREPARATION EN ROUTINE DE L’ADN

- A partir du sang total

Les leucocytes sanguins représentent la source majeure d’ADN pour les études de routine en
médecine. A partir des prélèvements de 10 à 30 ml de sang recueillis sur anticoagulant, de
préférence de l'EDTA, il est possible d'obtenir quelques centaines de microgrammes d’ADN
sous forme de fragments d'une taille supérieure à 20 kb, ce qui est suffisant aussi bien en
quantité qu'en qualité pour les études envisageables. Les échantillons de sang total
anticoagulé peuvent voyager par la poste à température ambiante ; il est possible ensuite de les
conserver congelés à - 20°C pendant plusieurs mois. Il est cependant primordial que
l'ensemble des opérations soit effectué stérilement et que la décongélation ait lieu juste avant
l'extraction. Le sang fraîchement recueilli ou décongelé est vigoureusement mélangé à une
solution hypotonique pour faire éclater les globules rouges.

Les globules blancs sont récupérés par centrifugation puis lavés avec la même solution. Ils
sont ensuite traités par un mélange de détergent (SDS ou sarcosyl) et d'une protéinase très
active, la protéinase K. Ce qui a pour effet de libérer l’ADN nucléaire dans le milieu et de
digérer les protéines qui lui étaient associées. L’ADN subit ensuite une série d'extractions
(phénol, chloroforme), puis est précipité par l'alcool éthylique absolu froid (-20°C) à haute
force ionique. Il précipite sous forme de filaments, visibles à 1'œil nu, qui sont récupérés par
enroulement sur une fine baguette de verre. L’DNA est enfin repris par une solution de
tampon TE (Tris 10 mM, EDTA 0,1 à 1 mM).

Il peut être conservé ainsi plus d'un an à 4°C (la concentration d'EDTA peut être augmentée
pour diminuer les risques de digestion par les nucléases contaminantes, mais dans ce cas il
sera nécessaire de s'en débarrasser avant d'utiliser l’ADN, les enzymes étant inhibées par
l'EDTA). Il est préférable de ne pas congeler l’ADN génomique car la prise en glace et la
décongélation provoquent des contraintes mécaniques qui se traduisent par de nombreuses
cassures de la molécule. Une évolution actuelle des techniques tend vers la simplification en
supprimant l'étape phénolique, les protéines étant simplement éliminées par hydrolyse
enzymatique. Enfin il existe des appareils automatisés permettant d'extraire le DNA à partir
de sang total en quelques heures et de traiter plusieurs échantillons simultanément.

- A partir de tissus ou de cellules en culture

Les sources cellulaires, lors des analyses de routine, peuvent être des biopsies (par exemple
des biopsies de villosités choriales lors d'un diagnostic prénatal) ou des cultures de cellules
(amniocytes, lignées lymphoblastoïdes…). Les cellules sont homogénéisées en présence de
détergent avec un petit appareil de Potter. Le reste de la technique est identique à celle décrite
pour le sang total. Il est possible de récupérer quelques dizaines de microgrammes d’ADN à
partir d'une biopsie de quelques milligrammes.
289
- A partir des organes

L’ADN est préparé de la même manière que pour les analyses de routine, sauf pour les
organes trop durs pour être broyés dans un appareil de Potter. Ceux-ci sont congelés dans
l'azote liquide, puis broyés dans un mortier rempli d'azote liquide. Cette méthode est la moins
traumatisante pour les constituants cellulaires ; les polysomes par exemple ne sont pas altérés.
La poudre obtenue par ce broyage est traitée comme décrit pour les cellules en culture.

- Préparation des RNA totaux

Les ARN sont plus difficiles à étudier que l’ADN parce qu'ils sont très vulnérables vis-à-vis
de la ribonucléase (RNase A). Celle-ci est ubiquitaire (les doigts par exemple en sont
couverts), extrêmement active et très résistante à toutes les agressions habituellement néfastes
pour toutes les enzymes ; par exemple un traitement à 90°C pendant une heure n'altère pas
son activité. Tout travail sur les ARN doit donc être effectué le plus stérilement possible à
cause des RNases microbiennes. Les milieux (eau, tampons) et matériels doivent être
autoclavés ; les pièces qui ne peuvent pas subir un tel traitement (pièces de plastique par
exemple) doivent être lavées à l'acide iodoacétique 10 mM puis rincées à l'eau distillée
autoclavée.

Les tissus ou cellules sont homogénéisés dans un tampon contenant un détergent puissant à
haute concentration (SDS ou sarcosyl), un agent dissociant (chlorure ou thiocyanate de
guanidine), une solution tampon (acétate) et un agent réducteur à haute concentration (2-
mercaptoéthanol ou DTT). La composition de ce tampon a été ainsi choisie pour répondre à
deux impératifs : - inhiber les RNases endogènes et - dénaturer les acides nucléiques et
dissocier les protéines qui pourraient y être fixées. Les débris cellulaires sont éliminés par
centrifugation. Les ARN sont ensuite extraits. Une technique procurant des ARN
relativement purs avec un très bon rendement repose sur la précipitabilité différentielle de
l’ARN et de l’ADN selon le pH et la concentration d’éthanol. Une technique plus
sophistiquée repose sur le fait que la densité de l’ARN est très supérieure à celle de l’ADN.
Dans cette technique l'extrait cellulaire est centrifugé sur un coussin de chlorure de césium 5,7
M pendant une vingtaine d'heures. Seul l’ARN est capable de traverser un tel coussin ; il
est récupéré au fond du tube, après centrifugation, sous forme d'un petit cristal très pur. Quelle
que soit la technique utilisée, l’ARN doit ensuite être lavé par de l'acétate de sodium 3M pH 5
et précipité à l'éthanol. Les ARN peuvent être conservés plus d'un an, soit sous forme
précipitée dans l'éthanol, soit sous forme congelée à -70° C dans de l'eau contenant de la
RNasine (inhibiteur de RNase extrait de placenta humain).

- Préparation des ARN poly A+

La très grande majorité des ARN messagers eucaryotes possèdent une queue constituée d'une
longue séquence polyadénylique qui peut dépasser 100 A consécutifs. Cette caractéristique est
mise à profit pour les purifier par affinité. Pour cela les ARN totaux sont passés sur colonne
d'oligo dT-cellulose ou de poly U-Sépharose. La séquence poly A des messagers s'hybride
avec le poly U ou l'oligo dT et ceux-ci sont de ce fait fortement fixés à la colonne. Après
lavage, qui élimine les ARN non fixés, les ARN poly A+ sont élués par abaissement de la
290
force ionique. Ils sont récupérés de l'éluat par précipitation par l'alcool éthylique absolu froid
(-20°C).

7.3 EXTRACTIONS

Les extractions sont utilisées chaque fois que l'on souhaite éliminer des substances
indésirables comme des protéines ou du bromure d'éthidium.

Principe et réalisation

Utilisation de la solubilité différentielle des molécules (acides nucléiques / contaminants) entre


deux phases non miscibles. La solution d'acides nucléiques est vigoureusement mélangée à
une phase non miscible pendant quelques minutes. La phase aqueuse, qui contient les acides
nucléiques, est récupérée délicatement à la pipette après centrifugation.

Principales extractions

a-Extraction phénolique : le phénol est un déprotéinisant puissant dans lequel les acides
nucléiques ne sont pas solubles. La qualité du phénol est une donnée majeure ; il doit être
parfaitement pur et non oxydé (distillé). L'extraction phénolique est utilisée chaque fois que
les acides nucléiques doivent être débarrassés des protéines : purification de l’ADN ou de
l’ARN à partir de cellules, extraction des enzymes (comme les enzymes de restriction) après
qu'elles aient agi ; b- Extraction au chloroforme ou à l'éther : ce type d'extraction complète
toujours une extraction phénolique ; elle permet d'éliminer les traces de phénol qui auraient pu
être emportées avec la phase aqueuse ; c- Extraction à l'isobutanol : cette extraction a deux
effets : - extraire les molécules organiques comme le bromure d'éthidium et - concentrer de 10
% environ une solution d'acides nucléiques. Un facteur de concentration supérieur peut être
obtenu en multipliant les extractions successives

7.4 PRÉCIPITATIONS

Les précipitations ont pour but de récupérer les acides nucléiques sous forme solide, ce qui
permet d'une part de les protéger, d'autre part, après séchage, de les resolubiliser à la
concentration souhaitée. Dans le même temps, les sels peuvent être éliminés. Les principales
précipitations sont : a-Précipitation à l'alcool éthylique : elle doit être effectuée à haute force
ionique. L'éthanol doit aussi être à haute concentration (2,5 volumes d'éthanol à 95° par
volume d'échantillon). Dans ces conditions les acides nucléiques sont presque totalement
précipités. Pour les faibles concentrations d’ADN et d’ARN (< 50μg/ml), les temps de
précipitation doivent être très longs (> 10 heures). Quand cela est possible, la présence d'un
entraîneur comme de l’ARNt est souhaitable. Les précipitations sont accélérées par le froid (-
20 à -70°C). Le précipité est récupéré par centrifugation. b- Précipitation à l'isopropanol : le
principe est le même. Deux caractéristiques majeures la différencient de la précipitation
éthanolique : 1- le sel n'est pas nécessaire et 2- les très petits fragments d’ADN même à haute
concentration ne sont pas précipités, ce qui permet de les éliminer. La précipitation à
l'isopropanol se fait volume à volume. Dans tous les cas le précipité doit être lavé avec de
l'éthanol à 70 % pour se débarrasser des sels ou des traces d'isopropanol et séché.
291

7.5 DOSAGE DES ACIDES NUCLElQUES

Il est rarement nécessaire d'effectuer un dosage très précis et dans la pratique une simple
estimation de la concentration est suffisante. Elle est effectuée par photométrie, les bases
puriques et pyrimidiques absorbant fortement dans l'ultraviolet à 260 nm. Une unité de
densité optique à 260 nm correspond à : 1- une solution d’ADN double brin à 50 μg/ml ; 2-
une solution d’ARN ou d’ADN simple brin à 25 μg/ml. Ces valeurs s'appliquant à des acides
nucléiques parfaitement purs et en solution homogène, certains contrôles doivent être
effectués. Il convient de rechercher : a- une éventuelle contamination protéique (les
protéines absorbent non seulement à 280 nm mais aussi a 260 nm). Pour cela on effectue une
seconde mesure de DO à 280 nm. Un ADN pur doit avoir un rapport DO260/DO28O compris
entre 1,8 et 2,0 ; b- une éventuelle contamination par du phénol peut être recherchée en
mesurant l'absorption à 270 nm.

Ces contaminations entraînent une surestimation de la concentration réelle de l’ADN, elles


risquent d'inactiver ou de gêner les enzymes qui seront utilisées ultérieurement. Enfin l’ADN
ne doit pas être trop concentré car de telles solutions sont extrêmement visqueuses, ce qui
entraîne d'énormes erreurs de volume lors du pipetage. L’ADN peut aussi être dosé avec plus
de sensibilité et de spécificité par fluorimétrie après coloration par un produit spécifique
(Hoechst 33258).

7.6 SÉPARATION ANALYTIQUE ET PRÉPARATIVE DE L’ADN


ET DES PROTEINES

7.6.1 ELECTROPHORESE

L’électrophorèse est une technique couramment utilisée en biologie moléculaire. Elle est très
sensible, rapide et facile à mettre en œuvre et consiste soit à séparer et identifier des fragments
d’ADN en vue de déterminer leur taille et estimer leur quantité, soit à purifier un fragment
d’ADN de taille connue. En fait, les fragments d’ADN sont facilement détectés au moyen
d’un colorant fluorescent, le bromure d’éthidium (BET). Par la suite, de très faibles quantités
d’ADN (de l’ordre de 5 à 10 ng) sont visualisées en lumière UV. A titre de rappel,
l’électrophorèse sépare les molécules dans un champ électrique sur base de leur charge, de leur
taille et de leur forme. Lorsqu’on place un mélange de molécules linéaires d’ADN dans un
puits creusé dans un gel d’agarose à proximité de la cathode d’un champ électrique, les
molécules vont migrer à travers le gel vers l’anode à des vitesses dépendant de leurs tailles.

Les différentes classes de tailles dans le mélange vont former des bandes distinctes dans le gel.
Ces bandes sont ensuite visualisées en colorant l’ADN au bromure d’éthidium qui provoque la
fluorescence de l’ADN en lumière UV. Lorsque les bandes sont bien séparées, on peut
découper les bandes individuelles et extraire un échantillon d’ADN purifié de chaque bande.
Après la séparation des fragments d’ADN sur gel d’électrophorèse, on dépose une membrane
absorbante sur le gel et les bandes d’ADN sont transférées sur la membrane par capillarité. Au
cours de ce transfert, les bandes d’ADN restent aux mêmes positions que sur gel. Ensuite on
292
plonge la membrane dans une solution de sonde marquée et la position des bandes qui sont
homologues de la sonde est révélée par autoradiographie.

L’ADN d’un eucaryote, digéré par des enzymes de restriction, produit un grand nombre de
fragments. Dans ce mélange de fragments, une sonde permet d’identifier un fragment d’ADN
grâce à la technique appelée transfert de Southern (Southern blotting) développée par E.M.
Southern, couramment utilisée dans l’analyse des gènes et des génomes. Les molécules
d’ARN spécifiques dans une population d’ARN séparés sur gel peuvent également être
détectées par une technique semblable appelée transfert de Northern (Northern blotting) pour
marquer la différence avec la technique de Southern pour l’ADN. Une autre technique
similaire, appelée transfert de Western (Western blotting) consiste à transférer les protéines
d’un gel. Les protéines spécifiques sont ensuite visualisées au moyen des anticorps.

La plupart des macromolécules sont chargées électriquement et peuvent ainsi se déplacer dans
un champ électrique. Si les bornes d’une batterie, par exemple, sont connectées aux extrémités
opposées d’un tube horizontal contenant une solution de molécules protéiques chargées
positivement, ces molécules se déplacent de l’extrémité du tube chargée positivement vers
l’extrémité chargée négativement. La direction du mouvement ne dépend que du signe de la
charge portée par la molécule, mais l’importance du mouvement dépend de l’intensité de la
charge et, comme dans les expériences de sédimentation, de la forme de la molécule (à cause
de la résistance due aux frictions). La masse de la molécule ne joue aucun rôle direct dans la
vitesse de migration (par opposition avec les expériences de sédimentation). Elle n’intervient
que de façon indirecte à travers le volume de la molécule, qui est fonction de la masse et de la
densité de la molécule. En effet, le volume de la macromolécule affecte son coefficient de
friction.

Le type le plus courant d’électrophorèse utilisé en biologie moléculaire est une électrophorèse
zonale à travers un gel ou électrophorèse en gel. Ce procédé peut être utilisé de telle façon que
le mouvement (ou la mobilité électrophorétique) ne dépende que du poids moléculaire de la
molécule. Un gel mince d’agarose ou de polyacrylamide est préparé en ménageant de petites
fentes (puits) dans lesquelles seront déposés les échantillons. Un champ électrique est appliqué
et les molécules d’ADN chargées négativement pénètrent et se déplacent dans l’agarose. Un
gel est constitué d’un réseau complexe de molécules et les macromolécules migrantes doivent
passer à travers des mailles resserrés et tortueuses.

Le résultat est que les plus petites molécules migrent plus vite. Ainsi la vitesse de migration
augmente lorsque le poids moléculaire, M, diminue. Pour des raisons inconnues, la distance
parcourue, D, dépend logarithmiquement de M, obéissant à l’équation : D = a – b log M dans
laquelle a et b sont empiriquement déterminés comme des constantes ne dépendant que du
tampon, de la densité du gel et de la température. Les gels de l’électrophorèse des protéines
sont réalisés en principe de la même manière. Toutefois, les protéines peuvent être chargées
soit positivement, soit négativement et un échantillon contenant des protéines différentes doit
être déposé dans un puit placé au centre de telle façon que la migration puisse s’effectuer dans
les deux directions. La charge par unité de masse, qui est petite puisque la plupart des acides
aminés ne sont pas chargés, varie d’une protéine à l’autre (par opposition aux ADN et ARN
qui ont une charge négative par nucléotide).
293

De plus, les protéines se déplacent dans des formes variées. Il n’est donc pas simple de
prédire la mobilité électrophorétique. L’emploi de l’électrophorèse est quotidien, aussi bien à
des fins analytiques que préparatives. Les acides nucléiques sont des macromolécules
polyanioniques uniformément chargées. On peut donc les faire migrer dans un champ
électrique. La charge relative étant constante, le système de discrimination utilisé est l'effet de
filtration du gel. Suivant les théories de l'électrophorèse la mobilité u dans un champ
électrique au sein d'un gel doué de pouvoir de filtration est :

Log u = Log uo – KrC

Log uo étant la mobilité de la molécule en milieu liquide, Kr étant le coefficient de


retardement dû au gel, qui lui-même est une fonction de la masse moléculaire de la molécule,
C étant la concentration du gel. Il résulte de cette équation que la vitesse de migration d'une
molécule d'acide nucléique sera fonction de deux paramètres : - sa masse moléculaire, donc le
nombre de bases ou de paires de bases, et - la concentration d'acrylamide ou d'agarose du gel.
Le choix de la nature et de la concentration du support de l'électrophorèse est fonction de la
taille moyenne des fragments à séparer :

a. Le gel de polyacrylamide : il est utilisé pour la séparation de petits fragments c'est-à-dire de


moins de 1.000 paires de bases. Ses trois applications majeures sont : 1- la purification des
oligonucléotides de synthèse et l'élimination des nucléotides libres après leur marquage
radioactif ; 2- la détermination des séquences d’ADN. Pour cette application, des gradients
d'épaisseur qui induisent des gradients de champ électrique sont souvent utilisés ; 3- la
séparation de petits fragments d’ADN dont la longueur est inférieure à 500 paires de bases. Le
gel est coulé entre deux plaques de verre à l'abri de l'oxygène ; la migration est verticale ;

b. Le gel d'agarose : c'est le support le plus utilisé. Dans la pratique les concentrations
d'agarose sont comprises entre 0,6 et 1,5 %. Les tailles des fragments qu'il est possible de
séparer, sauf conditions expérimentales particulières, sont comprises entre 0,5 et 20 kb. Les
gels sont coulés à l'horizontale dans des appareils transparents aux UV de manière à pouvoir
suivre périodiquement la migration. Quand la force ionique est très faible, une circulation de
tampon entre les deux bacs doit être assurée afin de diminuer les variations de pH de chaque
bac qui résultent de la décomposition par électrolyse ;

c. Electrophorèse en champ pulsé (Pulse Field Gel) : ce type d'électrophorèse, qui utilise
l'agarose à une concentration d'environ 1 % comme support, permet de séparer des ADN d'une
taille comprise entre 50 kb et quelques mégabases, donc quelques centimorgans. Il n'est donc
pas possible d'utiliser des échantillons d’ADN purifié par les moyens classiques quicassent
l’ADN en fragments de taille inférieure à 100 kb. Les cellules, dont on souhaite analyser
l’ADN, sont incluses dans un bloc d'agarose et la digestion par les enzymes de restriction à
très faible fréquence de coupure est effectuée in situ. Ce bloc constitue l'échantillon.

Dans ce type d'électrophorèse l'orientation et la polarité du vecteur champ électrique changent


alternativement au cours du temps d'une manière programmable. La maille d'agarose n'étant
pas symétrique, la molécule d’ADN s'oriente dans le champ électrique à une vitesse qui est
294
fonction de sa taille, à chaque changement de polarité la molécule doit se réorienter. Il en
résulte un retardement proportionnel à sa taille. A l'origine les appareils ne possédaient que
deux électrodes perpendiculaires, le courant étant appliqué alternativement aux différentes
électrodes. Il fut montré que la résolution était augmentée lorsque l'angle des vecteurs champs
électriques alternativement appliqués était obtu. Actuellement les appareils sont constitués de
multiples électrodes disposées circulairement ; leur alimentation en courant est gérée par un
microordinateur, ce qui permet de programmer à tout moment l'électrode, l'intensité et la durée
d'application du courant.

Il existe une relation grossièrement linéaire entre la taille où la résolution est optimale et le
temps d'établissement du courant aux électrodes avant renversement du champ ou changement
de son orientation. Plusieurs types d'électrophorèses en champ pulsé, éventuellement
combinés, peuvent être réalisés : inversion du courant, champs orthogonaux, angles obtus,
angles multiples. Enfin la résolution peut être améliorée en utilisant des gradients de champ
électrique obtenus par des gradients d'épaisseur, la résistivité étant inversement proportionnelle
à l'épaisseur du gel.

Révélation et étalonnage des gels d’agarose

Le bromure d'éthidium est une drogue intercalante (donc présentant un risque cancérigène) qui
se glisse entre les bases des acides nucléiques. Cette molécule, spontanément non fluorescente,
présente une fluorescence orange lorsqu'elle est intercalée entre les bases des acides
nucléiques. Dans la pratique cette molécule est introduite dans l'agarose avant que le gel ne
soit coulé. Après migration, sous illumination par des UV des courts, vers 300 nm, l’ADN est
visualisé sous forme de bandes oranges.

Cuve d’électrophorèse horizontale

Il est alors possible de prendre des photographies avec un film très sensible. La migration est
inversement proportionnelle au logarithme du nombre de paires de bases du fragment. Chaque
gel doit être étalonné avec des marqueurs de taille connue ; par exemple du phage lambda
coupé par Hind III en électrophorèse classique et des concatémères de phages lambda ou des
chromosomes de levure pour l'électrophorèse en champ pulsé.

Électrophorèse préparative

Les principes et conditions techniques sont identiques à ceux de l'électrophorèse analytique.


Après migration les bandes correspondant à l'acide nucléique à purifier sont repérées. Deux
procédés de récupération de l'échantillon sont possibles : - procédé 1 : la bande est découpée
295
et l'acide nucléique est obtenu après diffusion dans un tampon adéquat ; - procédé 2 : un petit
puits est découpé en avant de la bande d’ADN à purifier. Ce puits est rempli de tampon et le
courant est rebranché. L’ADN migre dans le puits. Il est récupéré à la pipette. Dans les deux
cas le bromure d'éthidium doit être éliminé par trois ou quatre extractions à l'isobutanol. Les
purifications peuvent aussi être effectuées avec des appareils spécialement conçus pour
l'électrophorèse préparative.

7.6.2 ULTRACENTRIFUGATIONS

L’ultracentrifugation utilise des centrifugeuses à régime de rotation extrêmement élevé


(ultracentrifugeuse), de l’ordre de 60 000 tours par minute. On peut distinguer :

1. l’ultracentrifugation en gradient continu de chlorure de césium. Il s'agit d'une


centrifugation isopycnique (en gradient de densité). Les solutions concentrées de chlorure de
césium ont comme caractéristique de créer spontanément un gradient de densité lorsqu'elles
sont soumises à un champ gravitationnel intense. La résolution de tels gradients atteint le
centième d'unité de densité, ce qui permet de séparer deux molécules identiques dont l'une est
marquée par un isotope lourd. Ce type d'ultracentrifugation est très résolutif mais d'un
maniement délicat. L'utilisation majeure de ce type d'ultracentrifugation est la préparation de
plasmides et de phages ;

2. l’ultracentrifugation sur coussin (gradient discontinu) de chlorure de césium : ce type de


centrifugation permet de séparer rapidement et facilement des acides nucléiques ou des
mélanges d'acides nucléiques dont les densités sont différentes, homogènes et connues. Le
mélange est déposé sur le coussin. Seules les molécules dont la densité est supérieure à la
densité du coussin de chlorure de césium pourront le traverser. Souvent plusieurs coussins de
densités croissantes sont superposés. La fraction est récupérée à l'interface entre deux
coussins. L'utilisation majeure des coussins multiples est la préparation rapide et à grande
échelle des phages ;

3. l’ultracentrifugation en gradient de saccharose : ce type de centrifugation correspond à la


classique centrifugation de zone. Elle est utilisée pour séparer grossièrement l'ensemble des
fragments dont les tailles se répartissent sur quelques kilobases (kb). Ce type de centrifugation
est principalement utilisé pour purifier les bras des phages et la sélection des fragments dADN
de tailles correctes compte tenu du vecteur utilisé lors de la constitution des banques
génomiques.

7.6.3 CHROMATOGRAPHIE

Différents types de chromatographies sont utilisés en biologie moléculaire : a. la


chromatographie d'affinité : sur poly U-Sépharose ou sur oligo- dT-cellulose pour purifier les
ARN messagers ; b. la gel-filtration pour séparer les acides nucléiques des nucléotides libres
qui n'ont pas été incorporés lors d'un marquage ; c. l'échange d'ions en micro-colonnes pour
récupérer de très petites quantités d’ADN, après purification d'insert par exemple ; d. la
HPLC (High Performance Liquid Chromatography) : son introduction dans ce domaine est
récente. Elle est utilisée pour la purification d'oligonucléotides de synthèse (résolution : 1
296
base), la préparation de plasmides, la séparation de fragments d’ADN.

7.7 UTILISATION DES PLASMIDES ET DES PHAGES


EN GENIE GENETIQUE

7.7.1 UTILISATION DES PLASMIDES

Amplification

Il s’agit dobtenir une grande quantité de plasmides. Cette technique est utilisée aussi bien pour
produire une grande quantité de plasmides avant recombinaison que pour obtenir un
recombinant cloné. A cet effet les bactéries contenant le plasmide sont cultivées dans un grand
volume (500 ml à 2 l). Lorsque la densité des bactéries atteint environ 2,5 x 100.000.000
bactéries/ml (0,6 DO600), on ajoute du chloremphénicol pour bloquer la croissance bactérienne
sans affecter la réplication de l’ADN plasmidique. Pour séparer les ARN et le plasmide de
l’ADN chromosomique, la paroi bactérienne est perméabilisée par un traitement au lysosome
suivi par un traitement avec un détergent (Triton x 100 ou SDS) en milieu alcalin (soude).
Après ce traitement les ARN et le plasmide passent en solution (le lysat clair) alors que l’ADN
chromosomique reste emprisonné dans les restes bactériens.

Suivant le degré de pureté requis, il existe plusieurs techniques de purification dont la plus
simple consiste à détruire les ARN avec de la RNase A, ensuite l’enzyme et les protéines
bactériennes sont éliminées par extension phénolique. Enfin le plasmide est récupéré par
précipitation éthanolique et repris dans du tampon TE (tris-EDTA). Deux techniques
permettent d’obtenir un plasmide beaucoup pur : l’ultracentrifugation et la HPLC.
L’ultracentrifugation est effectuée en gradient de chlorure ou de sulfate de césium en présence
de bromure d’éthidium. Dans ce cas le plasmide sédimente sous forme d’une bande localisée
vers le milieu du tube que l’on peut visualiser par des UV. Les l’ADN bactérien sont
rassemblés en une bande qui sédimente moins vite. Le plasmide est récupéré par ponction à
l’es de la paroi du tube. Les sels de sésium et le brumure d’éthidium sont enfin éliminés par
dialyse et une série d’extractions.

La chromatographie se pratique en présence d’urée 5M ou de formamide à 50%. Des colones


échangeuses d’ions (Nucleogen DEAE 4000), très performantes et utlisables en HPLC sont
disponibles. On obtient l’élution par gradient salin et le plasmide est récupéré par précipitation
à l’isoporpanol, puis resolubilisé dans du tampon TE. Quel que soit la technique utilisée, s’il
n’y a aucune incompatibilité entre la bactérie et le plasmide, le rendement est d’environ 500
μg à 2 mg de plasmide par litre de culture.

Une microamplification : les mini-oreo

Le principe de la technique des mini-prep ressemble à celui de la technique à la RNase,


seulement on part de petites quantités de culture (20 ml). En effet lors d’un cloage ou d’un
sous-clonage, des dizaines de clones sont étudiés. Pour cela quelques µg de plasmide de
chaque cloe recombinantdont la qualité n’a pas besoin d’être parfaite suffisent.il est donc
préférable d’utiliser des mini-prep à la place des techniques assez lourdes comme décrit ci-
297
haut. Le rendement est d’environ 1µg à 10 µg par ml de culture bactérienne. Le dosage de
l’ADN à la fin de la préparation ne peut être effectué par spectrophotométrie, compte tenu de
faibles quantités obtenues et de la présence des contaminants, principalement de type ARN. La
concentration peut être estimée par électrphorèse en comparant l’intensité des bandes à celles
des témoins de concentration connue.

Préparation du plasmide pour la recombinaison et constitution de l’hybride

Le plasmide est une molécule d’ADN bicaténaire circulaire. Il faut donc ouvrir le plasmide
pour y insérer une séquence d’ADN. Pour réaliser l’ouverture, on incube le plasmide avec une
enzyme de restriction. De ce fait l’enzyme ne doit posséder qu’un seul site de coupure au sein
du plasmide, le choix de l’enzyme étant fonction de l’ADN à insérer et de la stratégie choisie.
Cependant avant de pouvoir être utilisés, les plasmides linéarisés doivent être traités de telle
sorte que la fermeturesur eux-mêmes soit impossible, et donc qu’ils ne puissent se refermer
qu’en insérant un ADN étranger.

Pour ce faire, les plasmides sont traités à la phosphatase alcline qui déphosphoryle en 5’. Les
liasons entre un 3’-OH de l’ADN à insérer et le 5’-OH du plasmide ne peuvent s’établir in
vitro ; elles seront réalisées par la bactérie lorsque le vecteur recombiné y aura été introduit.
Au vercteur linéarisé et phopshatasé, on ajoute l’ADN à inserer et de la ligase. L’incubation
est conduite à basse température, permettant ainsi aux extrémités cohésives de s’hybrider.
L’ADN à insérer 8 à 9 kb au maximum) doit être apporté en faible concentration par rapport
au plasmide, favorisant ainsi les associations ADN à insérer/plasmide et minimisant l’auto-
association ADN à insérer/ADN à insérer.

Introduction du plasmide recombiné dans la bactérie

A cette étape, les bactéries sont cultivéés en milieu liquide de manière classique. Elles sont
ensuite rendues perméables aux ADN étrangers, c’est ce que l’on appelle transformation
bactérienne. Les bactéries sont rendues perméables par simple incubation à 0°C en présence de
chlorure de calcium 50 mM. Après une heure d’incubation au froid, les bactéries sont
devenues compétentes, c’est-à-dire capables d’incorporer un ADN étranger. Les bactéries
compétentes sont ensuite mises en contact avec les plasmides, puis la culture est relancée et
enfin étalée sur boîtes. Noter que les techniques où le sel de Ca++ est remplacé par des
solutions complexes à base de cobalt et de rubidiumsont proposées. Ces techniques permettent
une augmentation notable de l’efficacité de transfection. Noter que de telles bactéries rendues
compétentes par cette technique sont disponibles sur le marché. Noter également que le
rendement de la transformation est très faible : 1 bactérie sur 100.000 à 10.000.000 par μg de
plasmide recombinant.

Sélection des bactéries ayant incorporé le plasmide recombiné

Cette étape consiste à sélectionner les quelques bactéries recombinantes parmi les milliards
des bactéries qui n’ont rien incorporé. La sélection est réalisée par culture sur un milieu
sélectif : on utilise la ou les propiété(s) apportée(s) par le plasmide comme moyen de
sélection ; on parle de marquer de sélection. Il s’agit presque toujours, dans la pratique, d’une
298
résistance à un antibiotique. Ainsi, grâce au gène de résistance du plasmide, les bactéries ayant
incorporé le plasmide recombinant deviennent résistantes à l’antibiotique, alors que toutes sont
tuées par l’antibiotique. La suite de cela c’est que les clones bactériens retrouvés sur la boîte
de culture correspondent chacun à une bactérie ayant incorporé un recombinant et qui s’est
multiplié.

Noter que cette technique ne permet de sélectionner que les bactéries qui ont incorporé un
plasmide. En effet elle ne permet pas de distinguer les bactéries qui ont incorporé un plasmide
recombinant de celles qui ont incorporé un pasmide natif, c’est-à-dire sans le gène étranger.
Cela nécessite l’utilisation, directement ou dans un second temps, d’un second marqueur de
sélection. Dans la pratique deux systèmes sont couramment utilisés : le système du second
gène de résistancec aux antibiotiques et le système de l’opéron lactose. Dans le système du
second gène de résistance aux antibiotiques, l’ADN étranger est inséré au sein de ce second
gène de résistance pour un antibiotique. Cette insertion a comme conséquence l’inactivation de
ce gène et donc la perte de la résistance à cet antibiotique. Ainsi les bactéries ayant incorporé
un plasmide recombinant (contenant un ADN inséré) seront résistantes au premier
antibiotique, mais sensibles au second alors que les bactéries ayant incorporé un plasmide sans
ADN inséré seront résistantes aux deux antibiotiques. Le plus souvent on utilise comme
mrqueurs les gènes de résistance à l’ampicilline et à la tétracycline.

Le principe du système de l’opéron lactose est que la transformation des bactéries lac- par un
plasmide contenant un gène lac Z confère à cette bactérie le phénotype lac+ qui peut être
caractérisé directement au niveau des clones bactériens en utilisant un substrat chromogène.
Pour ce faire, on ajoute dans le milieu ce culture des bactéries de l’IPTG (inducteur non
métabolisable de l’opéron lactose) et le Xgal, un galactoside dont la couleur passe de
l’incolore au bleu lorsqu’il est clivé par la β galactosidasetose, l’enzyme qui clive le lactose en
glucose et galactose.

Sur un tel milieu de culture, les bactéries lac+ seront colorées en bleu (puisqu’elles sont
induites et qu’elles métabolisent le Xgal) alors que les bactéries lac- auront une coloration
blanchâtre légèrement translucide, qui est la couleur habituelle des colonies bactériennes.
Cela montre qu’en fait l’insertion d’un ADN étranger au sein du gène lac Z l’inactive et les
colonies correspondantes restent blanches. Dans la pratique une seule partie du gène lacZ est
introduite dans le plasmide ; il s’agit du promoteur et de la partie N-terminale du peptide α de
la β-galactosidase, ce qui est suffisant pour complémenter les bactéries lac-.

7.7.2 UTILISATION DES BACTERIOPHAGES

Obtention d’une grande quantité de phages

Il est recommandé de partir d’une plus grande quantité de bactéries (jusqu’à une densité de 4 x
100.000.000 phages par ml) que lors de la transformation par un plasmide. Les bactéries sont
cultivées et récupérées par centrifugation. Elles sont ensuite remises en suspension dans un
milieu neuf contenant du MgCl2 (10 mM). Enfin le phage à amplifier est ajouté (environ 5 x
10.000.000 phages par ml de bactéries). Environ 5 minutes à 37°C après adsorption du phage
299
par les bactéries, une culture à grande échelle (1 litre) est lancée. Une fois dans la bactérie, le
phage se multiplie activement et provoque fianlement l’éclatement des bactéries hôtes. Les
débris bactériens sont ensuite éliminés par centrifugation après addition de chloroforme et de
NaCl. Les phages sont précipités par le polyéthylèneglycol (PEG 6000), puis purifiés par
ultracentrifugation en grandient ou sur coussins multiples de chlorure de césium.

Au cours de cette centrifugation, les phages migrent en un anneau de 2 à 3 mm d’épaisseur.


Cet anneau de phages est récupéré par ponction à la seringue au travers de la paroi du tube de
centrifugation. On obtient ainsi environ 1.000.000.000 à 10.000.000.000 phages par ml de
milieu de culture. Il est préférable de conserver les phages en les maintenant tels quels dans le
chlorure de césium à 4°C. Dans ces conditions le phage peut se conserver quelques années.
Etant donné que l’ADN du phage est enfermé dans une capside, l’extraction de l’ADN des
phages nécessite la destruction des protéines de la capside par une incubation en présence de
pronase, d’EDTA ou de protéinase K en présence de SDS. L’ADN est extrait au phénol et
précipité à l’alcool.

Titration des phages

Titrer les phages suppose connaître leur concentration approximative. Pour se faire, des
dilutions croissantes du phage sont ajoutées à des solutions de bactéries. Après adsorption du
phage, chacune des dilutions est coulée en gélose molle, sur une boîte de culture bactérienne.
Après incubation à 37°C, le nombre de plages de lyse est déterminé dans chaque boîte où cela
est possible. Il s’agit des boonfluentes. Le titre du phage est déduit en fonction de la dilution
de départ correspondant à la boîte lue. Le résultat s’exprime en pfu/ml de solution de phage
(pfu : plaque forming unit).

Préparation d’un phage pour la construction d’un recombinant

En fonction de la taille de l’ADN à introduire, deux méthodes sont utilisées pour la


construction d’un recombinant : la méthode de l’insertion simple et la méthode de la délétion-
remplacement. Cependant certains phages ne peuvent être utilisés qu’en insertion.

Insertion simple

Comme pour les plasmides, dans la stratégie de l’insertion, le phage est coupé par une enzyme
de restriction en un site unique (où l’ADN à cloner est inséré). Les extrémités libérées sont
phosphatasées pour empêcher la religation du phage sur lui-même lors de la construction du
recombinant. Le plus souvent l’ADN à cloner est inséré dans la partie centrale de l’ADN du
phage correspondant à la région de la lysogénie, non indispensable au cycle de vie du phage.
Rappelons que la taille de l’ADN à insérer par cette technique peut aller jusqu’à 12 kb.

Délétion – remplacement

Cette méthode consiste à ce que la partie centrale de l’ADN du phage, non indispensable à son
cycle de vie, est délétée et remplacée par l’ADN à cloner. Cela permet l’insertion d’un ADN
étranger de 8 à 22 kb. Cependant la réalisation pratique de cette méthode est plus complexe :
300
extraction préalable de la partie centrale, la fraction à extraire ayant à peu près la même taille
que les bras à récupérer. Dans la statégie de la délétion-remplacement les phages sont
ligaturés l’un derrière l’autre en longs concatémères grâce à l’action d’une ligase. Les longs
concatémères sont ensuite séparés des produits de réaction incomplète par ultracentrifugation
puis digérés par une enzyme de restriction coupant aux frontières de la zone à déléter.

Noter que pour augmenter le rendement de la ligation, une phosphorylation des extrémités 5’
des phages peut préalablement être effctuée avec de la T4 polynucléotide kinase. Les bras
droits et gauches sont séparés de la zone à déléter par centrifugation en gradient de saccharose.
En fait la séparation par centrifugation est maintenant possible puisque les bras droits et
gauches, assocés par ligation, ont une taille d’environ le double de la zone à déléter. Les
extrémités des brassont enfin phosphataséespour éviter toute ligature des bras entre eux lors de
la construction de l’hybride.

Préparation de l’ADN à introduire et construction de l’hybride

Quelle que soient la stratégie utilisée, l’ADN à introduire doit au préalable être coupé par une
enzyme de restrction, produisant des bouts cohésifs identiques à ceux des bras du phage. Dans
le cas où la coupure ne génère pas des extrémités cohésives, les bouts francs sont rendus
compatibles, notamment en utilisant des linkers qui fourniront l’extrémité cohésive souhaitée.
D’autre part, l’ADN à introduire doit avoir une taille acceptable pour le phage, soit de 0 à 12
kb pour la stratégie de l’insertion simple et de 8 à 22 kb pour la stratégie de la délétion-
remplacement. Pour avoir une longueur compatible, l’ADN à introduire est partiellement
digéré par une enzyme de restriction, dans des conditions qui produisent de grands fragments.
Noter que ces conditions sont déterminées par des digestions d’aliquotes de l’ADN avec des
concentrations croissantes d’enzymes et les résultats de la digestion sont analysés par
électrophorèse. Après digestion, les fragments de taille adéquate sont purifiés par
centrifugation préparative en grandient de saccharose et les recombinants sont ensuite obtenus
en incubant l’ADN ainsi préparé avec les bras de phages phosphatasés en présence de ligase.
Cette opération donne enfin lieu à un long concatémère de recombinants, c’est la forme
nécessaire à l’encapsidation in vitro (pakckaging).

Encapsidation in vitro

L’encapsidation in vitro (packaging) consiste à reformer un virus infectieux, capable de se


propager chez la bactérie comme un phage naturel à partir de l’ADN phagique concaténé et
d’extrait protéique. Le principe de cette opération est la suivant : l’ensemble de protéines
nécessaires à la constitution du phage est extrait de deux souches d’E. coli lysogènes pour le
phage λ. Il s’agit de la souche BHB 2688 et la souche BHB2690. Dans chacune de ces
souches, le phage λ est intégré dans le chromosome bactérien λ sous forme de prophage et
dans les deux cas, les prophages sont mutés, donc défectifs, mais complémentaires. Il en
résulte que dans chacune de ces bactéries, lors de l’induction, les protéines phagiques seront
synthétisées mais que le phage ne sera jamais completement construit. Ces mutants sont des
mutants conditionnels : le propahge n’est pas induit à 30°C, mais l’est à 42°C.
301
Comme les mutations sont différentes dans les deux souches, leurs extraits respectifsvont
pouvoir se complémenter in vitro. Il en résultera la formation d’un phage complet et infectieux
si un ADN phagique est ajouté. Le mode opératoire à suivre est le suivant : les 2 souches
bactériennes sont cultivées à 42°C, qui est la température permettant le passage en phase de
lyse. Cela provoque la synthèse des protéines phagiques. Ces protéines sont extraites et
mélangées à l’ADN phagique en présence de spermine et d’ATP. Les phages sont s’assembler
et l’ADN recombinant sera empaquetté dans les têtes. Des bactéries seront infectées et étalées,
en gélose molle, sur boîte d’agar. Chaque plaque de lyse correspond à un phage recombinant.

7.8 BANQUES GENOMIQUES ET BANQUES D’ADNc

7.8.1 BANQUES GENOMIQUES

Une banque correctement établit contient, sous forme morcelée, l’ensemble de l’information
génétique d’un individu telle qu’elle existe dans son génome. Sa construction consiste à
fragmenter l’ADN et à introduire chaque fragment dans un vecteur, puis dans un hôte
approprié. L’ADN de n’importe quelle cellule peut constituer le matériel de départ, sauf si on
s’intéresse à des gènes subissant des réarrangements somatiques spécifiques comme les gènes
de l’immunité. Ce type de banque est particulièrement utilisé pour le clonage des gènes dont
on cherche à déchiffrer l’information sur le génome (alternance introns-exons) et pour le
clonage des fragments d’ADN adjacents aux gènes, non transcrts, qui jouent un rôle majeur
dans la régulation de l’expression des gènes.

Etablissement de la banque

Les grands génomes des mammifères contiennent des gènes de tailles diverses : de plus petits
aux plus grands. On sait maintenant que les longs fragments présentent deux inconvénients
majeurs : - leur réplication au sein de l’hôte prend d’autant plus de temps qu’ils sont plus
longs, ce qui pose de multiples problèmes et qui se traduit à terme, lors de l’amplification, par
une disparition des séquences les plus longs ; - l’ADN des eucaryotes possède de nombreuses
séquences répétitives. Même en utilisant des bactéries recA (-), le risque de recombinaison
intra-fragment avec perte de matériel augmente considérablement avec la longueur de l’insert.
Dans la pratique les longueurs des fragments sont comprises entre 10 et 45 kb. D’où
l’importance du choix des vecteurs à utiliser. Selon la quantité d’ADN disponible, trois cas
peuvent se présenter :

- Lorsqu’on ne dispose que de quelques nanogrammes d’ADN, comme par exemple lors de
la construction d’une banque de chromosome isolé par trieur de cellules (FACS), on réalise
une digestion complète de l’ADN par une enzyme de restrictin, puis on utilise un phage en
choisissant la stratégie de l’insertion simple. Les fragments peuvent avoir une taille inférieure
à 12 kb.

- Lorsqu’on possède beaucoup d’ADN, quelques centaines de microgrammes (ce qu’on peut
obtenir à partir par exemple à partir de 30 ml de sang) ; de plus le gène est petit ou qu’on ne
souhaite pas l’avoir en entier. Il faut dans ce cas : -effectuer une digestion partielle de l’ADN
(moins de 0,5 U d’enzyme par microgramme d’ADN) et purifier les fragments d’une taille
302
comprise entre 10 et 20 kb ; - utiliser un phage en coisissant la statégie de la délétion-
remplacement.

- Lorsqu’on dispose de la même quantité d’ADN que dans le 2e cas et que l’on désire avoir
la plus grande quantité possible de gène dans chaque insert, voire satotalité ou que l’on veut
« marcher sur le chromosome ». Il faut alors effectuer une digestion partielle comme dans le
2e cas et purifier les fragments d’une taille comprise entre 35 et 45 kb ; on utilise un cosmide
comme vecteur clonage.

Pour être réprésentative, une banque doit contenir au moins une fois l’ensemble des séquences
du génome. Ainsi donc plus les inserts sont longs, plus faible sera le nombre de clones
nécessaires. Une formule statistique, dérivée de la loi de Poisson, permet de déteminer le
nombre de clones nécessaires d’après la longueur des inserts.

Log(1 – P)
N=
Log (1 – 1/n)

Où P = probabilité de présence d’une séquence donnée et N = longueur du génome/ longueur


moyenne des fragments insérés.

Amplification de la banque

Pour servir à plusieurs clonages, la banque doit être amplifiée, c’est-à-dire multiplier le
nombre de copies de chaque gène. Pour se faire, il est recommandé de travailler avec des
phages plutôt qu’avec les cosmides. Ces derniers sont responsables de la perte de
représentativité rapide de la banque. Pour amplifier une banque gébomique, on l’étale sur boîte
(100 à 150 phages/cm2). Après culture les plages de lyse sont récupérées et les phages en sont
extraits.

7.8.2 BANQUE D’ADN COMPLEMENTAIRE

L’ADN complémentaire (ADNc) est une copie bicaténaire d’un ARNm mature eucaryote,
constituée uniquement de la séquence codante d’un gène, sans introns, sans les signaux de
transcription. Une banque d’ADNc représentative contient l’information correspondant à
l’ensemble des ARNm d’une cellule donnée, à un stade de développement et dans les
conditions physiologiques données. Elle contient donc les parties codantes des gènes
exprimés par cette cellule au moment de l’extraction de l’ARN et par conséquent ne reflète pas
l’ensemble du génome d’une cellule.

Du fait que seule une partie des gènes s'exprime dans une cellule eucaryote différenciée, une
banque d’ADNc est beaucoup moins complexe et donc plus facile à obtenir que la banque
génomique correspondante. Les ADNc ne contenant pas les séquences d’introns sont plus
courts que les gènes correspondants et sont plus faciles à cloner. Les ADNc représentant
uniquement la séquence codante du gène peuvent être exprimés dans une cellule hôte
procaryote comme E. coli, ce qui permet un criblage par expression et peut conduire à une
303
synthèse industrielle de l’enzyme.

Tout cela a comme corollaire qu’une protéine présente en faible quantité, mais à durée de vie
très courte, peut avoir plus de messagers codant pour elle dans une cellule qu’une protéine à
très longue durée de vie. De même il peut exister dans une cellule des messagers qui sont
présents, mais non traduits en protéines. Enfin les quantités relatives de différents messagers
et leur traductibilité peuvent varier dans des proportions considérables lorsque la physiologie
cellulaire est modifiée (stimulation, prolifération, …..). Ainsi donc la composition d’une
banque d’ADNc est une donnée très difficileà apprécier et peut être la source de nombreux
problèmes d’interprétation. Une méthode de synthèse in vitro d’un ADNc à partir d’un
ARNm consiste à :

Etape 1 : Synthèse d’une amorce et du 1er brin : Les ARNm matures possèdent une extrémité
3’polyA (d’environ 200 bases) sur laquelle on peut fixer une séquence poly dT qui sert
d’amorce pour la transcriptase réverse. Cette enzyme dont le gène est présent chez les
rétrovirus, peut effectuer la synthèse d’un brin d’ADN en utilisant l’ARNm comme matrice.

Etape 2 : Synthèse du second brin : L’action ménagée de la RNase H, l’enzyme hydrolysant


exclusivenent l’ARN, permet de provoquer des cassures dans le brin d’ARN et génère ainsi
des extrémités 3’- OH qui servent d’amorce à l’ADN polymérase. Celle-ci synthétise le
second brin d’ADN dans le sens 5'→3’. L’holoenzyme est utilisée et digère l’ARN au fur et à
mesure grâce à son activité exonucléasique.

Etape 3 : Synthèse du second brin (suite) : L’ADN polymérase du phage T4, en supprimant
les quelques extrémités 3’- OH restantes, permet de former un second brin parfaitement
continu. Pour obtenir une banque d’ADNc, on récupère d’abord l’ensemble des ARN
cellulaires par précipitation et extraction sélectives selon une technologien voisine de celle de
la préparation de l’ADN, mais en prenant de grandes précautions (asepsie, utilisation
d’inhibiteurs) pour éviter la présence des RNases (ubiquitaires et thermorésistantes). Sauf
exception du fait que les ARNm matures sont polyA+, c’est-à-dire qu’ils possèdent une queue
polyA, on peut les isoler de l’ensemble des ARN par chromatographie d’affinité, par exemple
sur colonne d’oligo-dT. Si l’ARNm pour lequel on cherche à obtenir l’ADNc correspondant
est minoritaire, on peut fractionner les ARN selon leur taille par ultracentrifugation et isoler
les fractions correspondant à des ARN de taille voisine de celui recherché (ce qui suppose que
l’ordre de grandeur de cette taille soit connu).

Il est alors prudent de vérifier que l’ARNm d’intérêt est bien présent dans ces fractions
conservées en testant dans un système de traduction in vitro ou in vivo sa capacité de faire
synthétiser la protéine codée. A partir des ARN polyA+ obtenus, les ADNc sont synthétisés
puis ces derniers sont clonés en utilisant des vecteurs lambdoïdes ou plasmidiques. Une autre
technique appelée « copie entière » par addition de queues uniformes (tailing) consiste à ceci :
après synthèse du premier brin de l’ADNc par la transcriptase réverse, une queue poly dC est
créée à l’extrémité 3’ de cet ADNc grâce à l’action de la terminase-transférase. L’ARN qui a
servi de matrice est détruit. Un poly dG synthétique est apporté. Il s’hybride sur la queue poly
dC et sert d’amorce pour la synthèse du second brin. Il n’y a donc plus perte de matériel. Un
inconvénient de cette technique est qu’elle introduit de longues séquences GC qui sont, in
304
vtro, difficiles à franchir par l’ensemble des polymérases (lors du séquençage).

Une troisième technique appelée « copie entière » par cassures à la RNase H. Le début de
cette technique est identique au début de deux précédentes, mais la synthèse du premier brin,
l’ARN n’est pas détruit en totalité. On se contente d’effectuer quelques cassures à l’aide de la
RNase H. Les courts fragments d’ARN restants vont servir d’amorce pour l’ADN polymérase
I qui synthétise le brin d’ADN complémentaire par son activité polymérasique 5’ 3’ et
détruit les restes d’ARN au fur et à mesure par son activité exonucléasique 3’ 5’. Dans la
pratique, il convient de faire agir ensuite la T4 ADN polymérase. Cette enzyme, par sa double
activité (3’ 5’ exonucléasique et ADN polymérase), va permettre de parfaire la synthèse du
second brin, principalement au niveau des extrémités.

Le choix du vecteur

Puisque les tailles des ADNc (rarement >9 kb) sont compatibles avec pratiquement tous les
vecteurs utilisables, le choix du vecteur dépendra de ce que l’on veut faire après le cloange. Le
plus souvent le choix porte sur deux types de vecteurs : - les plasmides de 3e génération : les
vecteurs de type pUC, pSP, Gemini, etc, qui sont tous puissants et d’un maniement facile ; -
les vecteurs d’expression : principalement le phage λgt 11 et ses dérivés ou des plasmides de
type Blue-scriptR. Bien que d’un maniement un peu plus complexe que les précédents, ces
vecteurs ont l’avantage de permettre l’expression sous forme de protéine du fragment d’ADN
inséré, ce qui permet l’identification du clone recombinant que l’on désire en criblant la
banque avec un anticorps dirigé contre la protéine que l’on désire cloner. Rappelons le fait
que la protéine qui est synthétisée peut s’avérer toxique pour la bactérie et la tuer avant que le
plasmide ou le phage n’ait eu le temps de se répliquer. Dans un tel cas, ce type de vecteur est
inutilisable. Noter qu’il est pratiquement impossible de le prévoir à l’avance.

Introduction du vecteur dans la bactérie

(Voir utilisation des plamsides et des phages.)

7.9 LE CRIBLAGE

Il s’agit de la recherche du bon clone (c’est-à-dire le clone contenant le recombinant désiré) au


sein de la banque. Sauf cas d’espèce, deux techniques sont le plus souvent utilisées : les
oligonucléotides de synthèse et les anticorps.

Le criblage par un ADNc spécifique de l’ARNm purifié

L’ADNc est synthétisé en présence de désoxynucléotides triphosphates marqués. Il est ensuite


utilisé comme sonde pour une hybridation in situ des bactéries de la banque. Les taches à
l’autoradiographie correspondent aux clones bactériens qui possèdent le plasmide recombinant
désiré. Ceci ne peut se faire que lorsque l’on dispose de l’ARNm pur, ce qui est très rare.
305
L’hybridation et sélection

Cette technique consiste à ce que les ADN des clones recombinants soient disposés les uns à
côté des autres sur une membrane de nitrocellulose. Des ARNm totaux sont incubés avec cette
membrane dans des conditions qui permettent l’hybridation. Après lavage, la zone de
nitrocellulose correspondant à chaque clone est découpée, l’ARN déshybridé et utilisé dans un
système de traduction in vitro. Le produit de traduction radioactif est immunoprécipité, puis
analysé sur gel de polyacrylamide. Si le clone est bon, une bande, correspondant à la masse
moléculaire du polypeptide à cloner, doit être observée sur l’uatoradiographie. Une variante de
cette technique est l’arrêt de traduction par hybridation sélection. Dans cette variante, le clone
n’est pas utilisé pour pêcher l’ARNm correspondant, mais comme compétituer dans un
système de traduction de l’ARNm in vitro.

L’expression différentielle ou clonage soustractif

Certains gènes ne sont exprimés que dans quelques types de cellules, d’autres ne sont
exprimés à taux important qu’après stimulation. Cest cette expression différentielle qui est
mise à profit pour enrichir les ARNm de départ en messager que l’ondésire cloner. Cette
propriété servant aussi de test de criblage.

La complémentation d’un défaut génétiqque de l’hôte

La bactérie ou la cellule hôte utilisée doit posséder une mutation telle qu’elle ne possède pas
l’activité correspondant à celle que l’on veut cloner. Sur milieu restrictif, les seules bactéries
qui pourront pousser seront celles qui auron incorporé une séuence d’ADN dont le produit
d’expression est capable de complémenter le défaut génétique de l’hôte. Cette technique
permet de cloner le gène d’une protéine dont on ne connaît rien d’autre que sa fonction, si l’on
posède les hôtes mutés adéquats. Le vecteur à utiliser dans ce cas doit être un vecteur
d’expression.

Le criblage par oligonucléotide de synthèse

Le criblage par oligonucléotides de synthèse permet le clonage d’une protéine dont, à la limite,
on ne connaît qu’une parcelle de la séquence en acides aminés. Le principe de cette technique
est d’utiliser, dans un criblage classique, une sonde oligonucléotidique synthétisée à partir des
données obtenues par le séquençage d’une petite fraction de la protéine, le code génétique
permettant de déterminer quelles sont les séqunces possibles du gène correspondant, donc les
sondes à synthétiser. C’est la technique la plus couramment utilisée. En voici les principales
étapes :

- On détermine la séquence en acides aminés d’une petite fraction de lla protiéne par
microséquençage. Théoriquement une séquence de 5 à 8 acides aminés devrait suffir. Dans la
pratique des séquences de 15 à 20 acides aminés au minimum sont nécessaires. Les
microséquenceurs automatiques permettent d’obtenir une séquence d’une trentaine d’acides
aminés en 24 heures à partir d’une cinquantaine de picomoles d’une protéine ou d’un d’un de
ses peptides. Les facteurs limitants peuvent être la pureté et la structure de la protéine (richesse
306
en proline, acide aminé N-terminal bloqué, glycosylation, …). En général cette étape de
microséquençage est sous-traitée par des équipes spécialisées.

- Toutes les séquences qui ont pu être déterminées sont traitées par des moyens informatiques.
Noter que le transcodage parfait dans le sens protéine-acide nucléique est impossible à cause
de la dégénérescence du code génétique. Le programme informatique commence par
rechercher la région la plus longue possiblecontenant le moins d’acides aminés à code
dégénéré et ensuite par déterminer quelles sont les sondes susceptibles de donner les meilleurs
résultats, d’après la fréquence d’utilisation des codons dans l’espèce d’où provient le gène que
l’on veut cloner.

Le ou les oligonucléotides ainsi choisis sont comparés à l’ensemble des séquences connues
(consultation automatique de banque de données) pour éviter le clonage d’une séquence déjà
connue et pour éviter les hybridations croisées avec d’autres gènes. Les stratégies classiques
consistent à utiliser un pool d’oligonucléotides courts (18 à 25 bases) et/ou quelques
oligonucléotides longs (40 à 45 bases). Il faut utiliser des oligonucléotides beaucoup plus
longs, puisque les mésappariements uniques seraient sans effet sur la stabilité des hybrides
dans les condtitions expérimentales utilisées. De plus des hybridations partielles de courtes
fractions de l’oligonucléotide sont possibles. Dans les deux cas, il en résulterait des
hybridations non spécifiques qui conduiraient au clonage d’un autre gène que le gène
recherché.
- Les oligonucléotides choisis sont synthétisés à l’aide d’un appareil automatiqueles produits
de synthèse sont ensuite purifiés par électrophorèse préparative ou par HPLC pour éliminer les
produits de réaction partielle.
- Les oligonucléotides marqués sont utilisés comme sonde pour cribler, par hybridation in
situ, une banque d’ADNc ou une banque génomique.
Une attention toute particulière doit être apportée aux conditions d’hybridation et de lavage
surtout si de petits oligonucléotides sont utilisés. La température peut être éventuellement
prévue avec une marge pour les éventuels mésappariements. Les lavages ne doivent pas être
effectués à très fortes stringence pour éviter les déshybridations. Les bons clones sont enfin
repérés par autoradiographie.

Le criblage par anticorps

Le criblage par anticorps, qui ne peut se faire que sur une banque d’exoression, utilise le plus
souvent le phage λgt comme vecteur. Pour se faire, il faut disposer d’un anticorps, de
préférence polyclonal, d’excellente qualité, dirigé contre le produit protéique du gène à cloner.
Le protocole expérimental est quelque peu différent des précédents, puisqu’il faut ici révéler la
présence non plus d’un acide nucléique mais d’une protéine. La banque est étalée sur boîte de
pétri et lorsque les plages ont atteint un diamètre de 1 à 2 mm, un filtre de nitrocellulose
imbibé d’IPTG est disposé sur l’agar. Ce composé étant un inducteur de l’opéron lactose, il va
induire l’expression de l’ADNc inséré dans le vecteur, puisque l’insertion à justement été
effectué derrière le promoteur de l’opéron lactose. Il s’ensuit la production d’une protéine de
fusion. Le tout est incubé quelques heures à 42°C. Les protéines synthétisées s’adsorbent sur
le filtre de nitrocellulose. Ce dernier est ensuite incubé en présence de l’anticorps. Les
complexes antigène-anticorps sont révélés par la protéine A marquée à l’iode 125 (la protéine
307
A a pour propriété de se fixer spécifiquement au fragment Fc de certaines classes d’IgG).

L’utilisation de l’iode 125 comme marqueur permet d’obtenir une grande stabilité. Les taches
sur l’autoradiographie correspondant aux clones bactériens qui avaient été infectés par le
phage recombinant recherché. La plage de lyse correspondante est récupérée. Elle contient
environ 10.000.000 phages. Le nombre de clones reconnus comme positifs est plus faible que
dans la technique précédente de criblage par oligonucléotides puisque, pour que la protéine
soit synthétisée, il faut que l’insertion soit effectuée dans le bon sens par rapport au promoteur
(une chance sur deux) et dans la bonne phase de lecture (une chance sur trois), soit en fait une
chance sur six.

Remarque concernant les techniques de criblage : le bon clone ne peut pas être récupéré du
premier coup puisque lors de premier criblage les colonies sont rapprochées. La précision du
repérage est donc très faible. Il est absolument indispensable de réétaler les clones sélectionnés
à plus faible concentration et de renouveler le criblage. Pour les plasmides et les cosmides au
moins deux tours sont nécessaires et pour les phages il en faut trois.

La confirmation du criblage

Le fait qu’une sonde soit hybridée ou qu’un anticorps se soit fixé n’est pas une preuve absolue
qu’il s’agisse du clone recherché. Les hybridations croisées, ne serait-ce qu’avec des
pseudogènes ou avec tout autre gène apparenté, sont non seulement possibles mais aussi
fréquentes. Il faut plusieurs preuves confirmant que le gène cloné est bien celui qui est
recherhé. Il n’y a aucune méthode générale. Le cas le plus simple est celui où une partie de la
séquence primaire de la protéine est connue puisqu’il suffit alors de déterminer la séquence
nucléotidique du clone qui a été isolé.

7.10 MUTAGENESE DIRIGEE IN VITRO

Contrairement à la mutagenèse classique qui est aléatoire et dont la nature moléculaire exacte
de la mutation n’est pas connue, la mutagenèse dirigée est une méthode couramment utilisée
en génie génétique et qui permet d’effectuer une modification parfaitement définie dans un
gène. La mutation portant généralement sur la substitution d’une base par une autre dans une
position donnée. Cela permet de modifier de manière contrôlée la séquence de la protéine
codée par ce gène et d’analyser les conséquences sur la structure et l’activité biologique de la
modification. Il s’agit pour les généticiens, de programmer artificiellement des changements
dans le matériel génétique.

En effet, plusieurs techniques ont été développées et toutes ces techniques permettent de
modifier des paires de bases bien spécifiques, c’est-à-dire de créer différents types de
mutations ponctuelles, de délétions et d’insertions dans des fragments d’ADN clonés. Ensuite,
ces fragments d’ADN ou les gènes ainsi modifiés, parfois appelés des gènes « haute couture »
ou « fais sur mesure », sont introduits dans l’organisme d’origine pour observer les
conséquences phénotypiques. Deux types de mutagenèse in vitro sont d’usage courant en
génie génétique : la mutagenèse par substitution des nucléotides et la mutagenèse au moyen
d’oligonucléotides.
308
7.10.1 MUTAGENESE DIRIGEE PAR SUBSTITUTION
DES NUCLEOTIDES

La technique de mutagenèse par substitution des nucléotides consiste à cloner un segment


d’ADN dans un vecteur plasmidique, à y créer ensuite de courtes régions monocaténaires, puis
à introduire des substitutions de bases dans ce segment cloné. Les régions monocaténaires sont
produites de deux manières : soit par une digestion partielle par l’exonucléase III, après une
coupure par une endonucléase de restriction, soit par l’activité exonucléasique de l’ADN
polymérase I de E. coli. En fait, en absence de désoxyribonucléotides phosphates, cette
enzyme est capable de digérer l’un des brins des duplex d’ADN dans la direction 3’ → 5’.
Toutefois, lorsqu’un seul dNTP est disponible pour la réaction, la digestion va s’arrêter au
niveau de la base se trouvant sur l’autre brin qui est complémentaire du nucléotide fourni.
Considérons le cas où le dTTP est le seul nucléotide triphosphate disponible. Une molécule
d’ADN circulaire est soumise à un clivage, puis une digestion enzymatique qui crée un
segment monocaténaire de 4 paires de bases à une extrémité et un segment monocaténaire de 5
paires de bases à l’autre extrémité.

Il convient de signaler que la présence de cet ADN monocaténaire favorise l’action des ions
bisulfites. En effet, les ions bisulfites désaminent les cytosines qui se trouvent dans ces
régions. Une cytosine désaminée devient une uracile ; ce qui entraîne des transitions C→ T et
donc une substitution d’une paire G – C par une paire A – T. Après ce traitement aux ions
bisulfites, les plasmides sont enfin circularisés et les brèches comblées par l’ADN polymérase
I et l’ADN ligase. Un autre cas de mutagenèse par substitution des bases concerne des
substitutions par des analogues de bases. Comme dans l’exemple précédent, de courtes
régions monocaténaires sont créées sans clivage préalable du segment d’ADN bicaténaire. La
présence des régions monocaténaires dans un ADN bicaténaire crée des brèches qui sont
ensuite comblées par une forme particulière de l’ADN polymérase I en présence de trois
nucléotides triphosphates et de la N-4-hydroxycytosine à la place du dTTP.

Il est intéressant de signaler que l’hydroxycytosine existe sous deux formes tautomériques, la
forme énol et la forme cétone. Elle peut donc s’apparier soit avec une guanine ou soit avec
une adénine. L’hydroxycytosine est un analogue de la thymine, capable de s’apparier avec
une adénine ou une guanine. Au cas où elle s’apparie avec une guanine, il en résultera une
transition T→C et donc une substitution d’une paire A – T par une paire G – C.

7.10.2 MUTAGENESE DIRIGEE AU MOYEN D’OLIGONUCLEOTIDES

La mutagenèse au moyen d’oligonucléotides est une technique développée par Michael


SMITH. Elle fait appel à de petits oligonucléotides de synthèse, généralement de 15 à 25
bases. Dans un premier temps, le gène que l’on désire muter est cloné dans un vecteur dérivé
du phage M13. Ensuite un oligonucléotide synthétique est utilisé comme amorce pour la
synthèse in vitro du brin complémentaire du vecteur M13. Cette amorce synthétique peut
contenir n’importe quelle base erronée que l’on désire introduire dans la séquence du gène à
muter. Il en résultera un mauvais appariement au niveau de cette base. Il a toutefois été
démontré que lorsque l’hybridation est réalisée à basse température et à concentration saline
élevée, une ou deux bases mal appariées peuvent être tolérées dans la double hélice d’ADN.
309
Le brin complémentaire est par la suite synthétisé in vitro par l’ADN polymérase I. Il en
résultera un ADN double brin qui est alors introduit dans E. coli par transformation.

Une fois à l’intérieur de la bactérie, cet ADN va poursuivre sa réplication in vivo pour enfin
produire un grand nombre d’exemplaires de la séquence mutée que l’on désire. Dans un
deuxième temps, l’oligonucléotide de synthèse est utilisé pour distinguer l’ADN muté de
l’ADN sauvage. Le principe de base est qu’à basse température, l’ADN comportant la base
mutée est capable de s’hybrider à l’ADN sauvage aussi bien qu’à l’ologonucléotide muté alors
qu’à haute température il ne peut s’hybrider qu’avec l’oligonucléotide muté.

7.11 SYNTHESE DES OLIGONUCLEOTIDES

Compte tenu de la simplicité de sa structure, la molécule d’ADN peut être synthétisée par voie
organique sans difficulté. Pour des raisons techniques, seuls sont synthétisés des ADN simple-
brin. Lorsque cela est nécessaire (ce qui est rarissime), le deuxième brin peut être synthétisé
par voie enzymatique (ADN polymérase). Les premières synthèses d'oligonucléotides ont été
effectuées manuellement par la voie des phosphodiesters, puis ultérieurement par la voie des
phosphotriesters. Actuellement ces méthodes manuelles fastidieuses et dangereuses
(manipulation de produits hautement toxiques) sont abandonnées.

La synthèse d’un oligonucléotide s’effectue au moyen des synthétiseurs automatiques d’ADN.


Il s’agit des appareils informatisés très utilisés en génie génétique. Ils permettent d’obtenir
une quantité importante (de l’ordre du mg) d’un oligodésoxynucléotide monocaténaire de
séquence bien définie, en un temps très court et à un prix de plus en plus bas. La première base
est fixée par covalence sur des microbilles de silice et l’élongation s’effectue par addition
d’une nouvelle base à chaque cycle. Puisque l’allongement de la chaîne s’effectue dans le
sens 3’→ 5’, c’est-à-dire dans le sens inverse de l’élongation enzymatique in vivo, cette
première base est en fait la dernière dans la séquence à synthétiser.

Le nombre de cycle, les flux des réactifs et les différents monomères sont gérés par l’appareil
dans lequel on a au préalable introduit la séquence à synthétiser. Les monomères à ajouter
sont des désoxyribonucléotides comportant un OH en 5’ et un phosphate en 3’. La fixation sur
la chaîne en élongation s’effectue par ce phosphate. L’établissement d’une liaison ester-
phosphate exige que le phosphate soit activé et le contrôle des réactions effectuées impose que
toutes les fonctions réactives soient protégées. Parmi celles-ci, les fonctions amine de
l’adénine, de la cytosine et de la guanine qui sont protégées par acylation.

L’hydroxyle en 3’ est protégé par un groupement, généralement DMTr, qui n’est enlevé qu’en
fin de cycle pour permettre l’accrochage de la base suivante. Le groupement protecteur du
phosphore dépend de la méthode chimique utilisée. La méthode des phosphites mettant en jeu
un phosphore trivalent très réactif est la plus utilisée. Elle est rapide et donne un bon
rendement. Après le dernier cycle, tous ces groupements protecteurs sont et la chaîne
synthétisée est décrochée des billes de silice.

Il convient cependant de signaler que les groupements OH en 5’ doivent être bloqués pour
empêcher la fixation ultérieure d’autres bases. En conséquence, certaines chaînes n’auront pas
310
la longueur prévue et devront être éliminées par une purification ultérieure. De plus, seules de
courtes chaînes d’ADN, jusqu’à 50 bases environ, peuvent être synthétisées avec un
rendement final appréciable. Au-delà le rendement de synthèse est très faible. On passe
ensuite au contrôle de pureté pour vérifier si la séquence synthétisée possède une longueur
désirée et éventuellement pour éliminer les chaînes avortées.

Trois méthodes sont d’usage courant pour le contrôle de pureté : 1- une électrophorèse en gel
de polyacrilamide. Une bande correspondant à un oligonucléotide complet est ensuite
récupérée par élution. 2- HPLC en phase inverse. Dans ce cas, le groupement protecteur de 3-
OH de la dernière base ajoutée n’est pas enlevé. Cela permet de séparer l’oligonucléotide
complet des chaînes avortées moins hydrophobes. Le groupement DMTr étant hydrophobe. 3-
dosage par absorptiométrie UV de l’oligonucléotide qui est ensuite redissout après
précipitation à l’éthanol, à concentration désirée. Dans la pratique il suffit de charger les
réservoirs de l'appareil avec les réactifs appropriés, de taper la séquence désirée au clavier et
de récupérer l'oligonucléotide synthétisé. La voie de synthèse utilisée par ces appareils est la
voie des phosphoramidites. Les réactions s'effectuent au sein d'une petite colonne contenant
des microbilles de plastique ou de verre sur lesquelles est fixé le premier nucléotide (en 3') de
l'oligonucléotide à synthétiser. Les fonctions réactives de ce nucléotide sont bloquées.

Un cycle de réactions va permettre d'ajouter un nouveau nucléotide. Chaque cycle est


composé des étapes suivantes : 1- déblocage du phosphore en 5' ; 2- activation ; 3- fixation du
nucléotide suivant sous forme de β-cyanoéthylphosphoramidite bloqué ; 4- blocage des
produits d'avortement de la réaction, c'est-à-dire des extrémités 5' qui n'ont pas fixé le
nucléotide apporté, afin de ne plus élonger les produits non conformes à ce qui est attendu. Un
cycle a une durée de 6 minutes environ, un nucléotide est incorporé à chaque cycle. Le bon
déroulement de la réaction peut être contrôlé par simple analyse visuelle des produits d'élution
de la colonne (ils doivent avoir une couleur orange foncé). Avec les appareils actuels il est
possible de synthétiser des oligonucléotides de 100 à 120 bases. Il n'est cependant pas
raisonnable de dépasser 40 à 50 bases. En effet les rendements à chaque étape sont inférieurs
à 98 %.

La multiplication des cycles multiplie les produits d'avortement et les rendements ne


deviennent plus intéressants quand les oligonucléotides sont trop longs. Une fois synthétisé,
l'oligonucléotide doit être purifié pour éliminer les produits des réactions ayant avorté. Cette
purification est réalisée soit par l’électrophorèse préparative en gel d'acrylamide, soit par
HPLC sur colonne en phase inverse ou en échange d'ions. Des micro-colonnes manuelles
spécifiques sont maintenant commercialisées. En général, les oligonucléotides de synthèse
peuvent être utilisés comme oligosondes après marquage, comme amorces dans le séquençage,
en PCR et dans la mutagenèse dirigée, comme séquence antisens, c’est-à-dire complémentaire
et antiparallèle d’une séquence d’ARNm et enfin comme adaptateurs de jonction synthétique
sous forme bicaténaire.

7.11.1 SYNTHESE DES OLIGONUCLEOTIDES MODIFIES

La détermination automatique des séquences nécessite des oligonucléotides marqués à leur


extrémité 5' par un colorant. Les marquages non radioactifs impliquent la fixation de
311
molécules diverses aux sondes. Une stratégie simple consiste à synthétiser directement des
oligonucléotides portant des groupements réactifs sur lesquels il sera possible de fixer
spécifiquement n'importe quelle molécule. Pour les marquages en 5', la solution consiste à
utiliser comme dernier nucléotide de la synthèse un nucléotide ayant une extrémité 5' greffée
sur un groupement amine, éventuellement via un court bras aliphatique (pour supprimer les
problèmes d'encombrement stérique). Pour un marquage uniforme de l'oligonucléotide, le
plus simple est de changer de voie de synthèse et d'utiliser la voie des phosphonates. En effet
au cours de la synthèse par cette voie, l'une des valences du phosphore qui relie deux
désoxyriboses doit être oxydée pour être transformée en hydroxyle. Il est possible d'employer
à cette étape un autre atome que l'oxygène, par exemple du soufre, ce qui introduit un
groupement réactif qui pourra être utilisé ultérieurement pour greffer une molécule marqueur,
éventuellement via un bras aliphatique.

7.11.2 SYNTHESE DE LONGUES CHAINES OU DES GENES ENTIERS

Pour être rentable, la longueur des oligonucléotides synthétisés ne doit pas dépasser une
cinquantaine de bases. Quand cela est nécessaire, il est possible de synthétiser des chaînes
d’ADN bien plus longues. Pour cela, il suffit de synthétiser une série d’oligonucléotides d’une
cinquantaine de paires de bases. Les séquences de ces oligonucléotides doivent être choisies
de telle sorte qu’ils s’hybrident sur quelques bases à leurs extrémités, donc qu’ils
correspondent alternativement à chacun des brins. Les zones manquantes seront synthétisées
par voie biologique par le fragment de Klenow de la polymérase.

7.12 PCR (Polymerase Chain Reaction)

Une technique d’amplification in vitro de séquences connues. En effet, l'écueil majeur


limitant souvent les possibilités d'application des techniques de la biologie moléculaire à la
routine médicale est le problème quantitatif. La technique d'amplification (PCR) est une
révolution. Elle permet d'obtenir des dizaines, voire des centaines, de nanogrammes d'une
séquence dont on ne dispose qu'à l'état de traces. Elle consiste à effectuer de multiples
réplications in vitro de l’ADN, en utilisant comme amorce des oligonucléotides s'hybridant
avec les extrémités 3' de la portion de séquence à amplifier. Le nombre de copies croît de
manière exponentielle avec le nombre de réplications effectuées. L'utilisation de la Taq
polymérase qui est active à haute température (70° C) supprime les non-spécificités et les
structures secondo-tertiaires, dans le même temps la vitesse de réaction est augmentée.

De plus comme cette enzyme résiste à la température nécessaire à la séparation des deux brins
(90° C), il n'est pas nécessaire d'en rajouter à chaque cycle, ce qui diminue considérablement
le prix de revient. Enfin toutes les opérations se déroulent dans le même tube. Bien que les
rendements de chaque cycle soient largement inférieurs à 100 % et diminuent avec la longueur
de la séquence amplifiée, il est possible d'obtenir des centaines de nanogrammes à partir de
quelques picogrammes, voire femtogrammes, de la séquence désirée. La taille optimale des
fragments qu'il est possible d'amplifier avec un rendement satisfaisant est pour le moment de
l'ordre de 300 à 400 pb, mais les progrès observés permettent de penser que cette technique
sera applicable à des séquences plus longues (la limite actuellement atteinte se situe aux
environs de 3 kb). Cette technique se prête bien à l'automatisation (sauts successifs de
312
température) et des appareils permettent désormais d'effectuer automatiquement l'ensemble
des opérations sur un grand nombre d'échantillons simultanément.

7.13 SEQUENçAGE DE L’ADN

Il s’agit de déterminer l’ordre dans lequel les bases se succèdent sur la molécule d’ADN. Les
méthodes de séquençage de l’ADN ont comme principe général de disposer au départ d’un
fragment d’ADN marqué à une de ses extrémités, de le soumettre à un traitement qui produit
une série de sous-fragments dont chacun ne diffère du suivant que par une seule bases, de
séparer ces fragments en fonction de leur taille et enfin d’identifier leu rs bases terminales.
Cette technique fait appel à l’électrophorèse sur gel d’acrylamide ou d’agarose des molécules
d’ADN simple-brin. Deux méthodes sont principalement employées pour le séquencçage de
l’ADN, le séquençage par destruction de base et le séquençage aux didésoxynucléotides.

7.13.1 SEQUENÇAGE PAR DESTRUCTION DE BASE

La méthode de séquençage par destruction de base, développée par A. MAXAM et W.


WILBERT, fut la première méthode de séquençage à être employée de manière intensive. Elle
consiste essentiellement à ceci : l’extrémité 5’ de l’ADN à séquençer est marquée au 32P. Puis
l’ADN est coupé et les fragments obtenus sont isolés en fonction de leurs tailles. L’ADN
double-brin est ensuite dénaturé et ses brins sont séparés. On obtient ainsi une population
homogène de molécules d’ADN simple-brin marquées à l’une des extrémités. Quatre
échantillons de cet ADN sont soumis à des réactions chimiques différentes pour détruire une
ou deux bases particulières. La première réaction (1) détruit uniquement les guanines (G), la
seconde (2) détruit les adénines (A) et les guanines (G), la troisième (3) détruit les thymines
(T) seulement et la quatrième (4) détruit les cytosines (C). Il convient de noter que la perte
d’une base rend le squelette de sucres-phosphates plus fragile et ainsi plus susceptible à se
briser à cet endroit. De plus, la concentration des réactifs est ajoutée de telle sorte que
seulement une base cible sur cinquante soit détruite. C’est dire que, pour un échantillon donné,
une seule base de certains fragments est détruite et pour ces fragments, la longueur des
segments obtenus est déterminée par la distance qui sépare l’extrémité 5’ marquée du
nucléotide qui a été perdu.

Puisqu’il s’agit d’un événement aléatoire, les diverses positions de la base correspondante
produisent des segments marqués de tailles différentes pour chaque réactif. Et lorsque les
segments correspondants aux différents réactifs sont séparés dans les pistes d’un gel, ils se
disposent par ordre de taille et les bases détruites à chaque site peuvent être identifiées en
indiquant dans quelle(s) piste (s) une base est apparue. De cette manière, la séquence des bases
du fragment peut être lue sur le profil de bases obtenues sur l’autoradiogramme du gel.

7.13.2 SEQUENÇAGE AUX DIDESOXYNUCLEOTIDES

La méthode la plus couramment employée à l’heure actuelle pour le séquençage de l’ADN est
la méthode de séquençage aux didésoxynucléotides mise au point par Fred SANGER. Elle
consiste en un séquençage enzymatique par incorporation des désoxynucléotides terminateurs
de chaîne. Elle est plus facile, plus rapide et universellement adoptée. Puisque l’absence d’un
313
hydroxyle en 3’ ne permet pas la formation d’une liaison phosphodiester, l’élongation est
arrêtée à chaque fois qu’un didésoxynucléotide est incorporé dans un brin d’ADN en cours de
synthèse. Ce phénomène a été à la base de la méthode de Sanger. Il convient de signaler
qu’au préalable, l’ADN à séquencer doit être monocaténaire et qu’une amorce doit être
hybridée en aval de la région à séquencer. Les différentes étapes de la méthode de Sanger
peuvent être schématisées comme suit :

1. préparer 4 tubes contenant de l’ADN simple-brin correspondant à la séquence recherchée,


de l’ADN polymérase, un court fragment d’ADN marqué servant d’amorce et les 4 dNTP.
Ajouter ensuite dans un didésoxynucléotide différent. Par exemple, mettre une petite quantité
de ddNTP dans le tube A. La suite logique est que par réplication, un brin d’ADN
complémentaire du brin à séquencer sera synthétisé, mais la réplication est aussitôt
interrompue par l’incorporation du ddATP par exemple. En outre, si le ddATP et le dATP sont
ajoutés dans un rapport de concentration adéquat, les interruptions de réplications seront
statistiquement réparties sur toutes les occurrences de la base A dans le brin nouvellement
synthétisé ;

2. ajouter en excès les 4 dNTP pour poursuivre l’élongation des chaînes non interrompues.
Puis la réplication est interrompue en ajoutant une solution dénaturante. Chaque tube contient
à présent un mélange de chaînes de longueurs différentes. Chacune des chaînes correspond au
point où le ddNTP présent dans le tube a été incorporé et a provoqué l’arrêt de croissance de la
chaîne. Il convient de noter que ces longueurs constituent une indication précise de l’endroit
où les bases complémentaires de ddNTP sont présentes dans le brin servant de matrice ;

3. le contenu de chaque tube est ensuite analysé par électrophorèse en gel de polyacrilamide (à
6 ou 8 %), en conditions dénaturantes (en présence de l’urée). Les différents oligonucléotides
produits sont séparés selon leur taille, à la base près. Ils sont enfin visualisés par
autoradiographie après migration.

4. dans le puits A par exemple, chaque bande correspond à un oligonucléotide dont la


synthèse a été interrompue par le ddATP et qui compte ainsi la base A en position 3’
terminale. Puisque tous les oligonucléotides se terminant par A y sont présents, toutes les
positions de la base A dans le brin nouvellement synthétisé peuvent être déterminées ;

5. la comparaison des positions relatives de différentes bandes dans les quatre puits permet de
déterminer les positions relatives de différentes bases et de lire la séquence 5’→ 3’ du brin
synthétisé en partant du bas du gel. Enfin la séquence du brin matrice, qui est complémentaire
et antiparallèle à la séquence du brin néosynthétisé, peut en être déduite. Il convient de
signaler que plusieurs ADN polymérases sont disponibles dans le commerce.

Comme vecteurs de séquençage, on utilise habituellement les dérivés du phage M13. Dans ce
cas, le fragment à séquencer est inséré dans sa forme réplicative bicaténaire, mais pour le
séquençage, on utilise l’ADN monocaténaire des particules phagiques recombinantes.
Actuellement on utilise de plus en plus le même vecteur que pour le clonage. Dans ce cas, on
utilise habituellement un plasmide dont l’ADN est bicaténaire. La méthode nécessite de
dénaturer l’ADN et selon l’amorce utilisée, l’un ou l’autre brin sera répliqué et donc séquencé.
314
De plus en plus, on utilise des séquenceurs automatiques. Ce sont des appareils informatisés,
qui exploitent la technique de détection par fluorescence d’étiquettes fixées aux amorces
nucléotidiques.

Schématiquement, ces appareils procèdent comme suit : après réplication interrompue en 4


lots avec 4 ddNTP différents, on dépose les produits de réaction dans un même puits.
L’amorce utilisée dans chaque lot est marquée de manière non réactive par un fluorochrome
différent. Par la suite, l’appareil détecte en continu les 4 fluorescencesur une position du gel
pendant la migration. Chaque fluorochrome étant associé à un ddNTP particulier, la séquence
peut ainsi être déduite de l’ordre de migration de différents oligonucléotides.

7.14 SONDES NUCLEIQUES

Une sonde est généralement définie comme une séquence monocaténaire d’ADN,
complémentaire d’une partie de la séquence d’ADN recherché, appelé aussi ADN cible et
capable de reconnaître et de s’hybrider avec elle. La sonde est d’ordinaire marquée de
manière radioactive ou non. En fait, après hybridation, une sonde permet de révéler une
séquence d’ADN particulière, de la repérer et éventuellement de la quantifier. Il existe deux
types de sondes : les sondes à ADN (les plus employées) et les ribosondes. Les ribosondes
sont constituées d’ARN ; elles sont très stables par rapport aux sondes d’ADN, l’hétéroduplex
ADN-ARN étant beaucoup plus stable que l’hybride ADN-ADN équivalent. Lorsqu’une
population relativement pure de molécules d’ARN identiques peut être isolée comme de
l’ARNr ou des ARNt fractionnés, des ARN libres peuvent être marqués radioactivement et
utilisés comme sondes.

Parmi les sondes d’ADN, on peut distinguer les sondes de grande taille, constituées de
plusieurs centaines de bases et les oligosondes de synthèse, constituées de quelques dizaines
de bases. En principe, leur taille devra être suffisamment grande (environ 20 bases) pour que
la séquence cible reconnue soit unique, mais n’excède pas la cinquantaine de bases à cause de
la limitation des rendements dans les synthétiseurs d’ADN. Par rapport aux sondes de grande
taille, les oligosondes présentent l’avantage de s’hybrider beaucoup plus rapidement avec la
séquence cible. De plus, elles sont synthétisées aisément et à moindre coût. En général, le
marquage des sondes s’effectue par incorporation enzymatique des précurseurs marqués.

L’utilisation des sondes se base sur la tendance naturelle d’un simple-brin d’ADN à
reconnaître et à s’hybrider avec un autre simple-brin d’ADN ayant une séquence de bases
complémentaire. L’identification d’un clone spécifique dans une banque (qui en contient
jusqu’à plusieurs milliers) au moyen d’une sonde est un processus qui se déroule en deux
étapes principales. Dans la première étape, les colonies ou les plages de lyse de la banque sur
boîte de Pétri sont transférées sur une membrane absorbante (souvent un filtre de
nitrocellulose) qui est déposée à la surface du milieu. Ensuite la membrane est retirée et les
colonies ou les plages de lyse adhérant à la surface sont lysées in situ puis leur ADN dénaturé.

Dans la seconde étape, la membrane est trempée dans une solution de sonde marquée
spécifique de l’ADN recherché. La sonde va alors se lier à la séquence d’ADN recherchée. La
position d’un clone positif est indiquée par la position de marquage, souvent une tache sur un
315
autoradiogramme. L’ADN servant à la construction d’une sonde peut provenir de l’ADNc
d’un tissu qui exprime le gène d’intérêt ou d’un gène similaire d’un organisme apparenté.
Dans le premier cas, on se base sur le principe selon lequel l’ARN d’un gène est plus abondant
dans un tissu particulier. Si on prépare des ADNc à partir d’un tissu et qu’on les insère
individuellement dans un vecteur, beaucoup de ces inserts correspondront à ce gène. 90 % des
ARN des réticulocytes des mammifères par exemple, sont des messagers du gène de la β-
globine. Si seule la séquence transcrite est utile, le clone d’ADNc suffira à fournir
l’information nécessaire, mais si les introns et les régions régulatrices sont nécessaires, le
clone génomique est indispensable.

Dans le deuxième cas, même si l’ADN de la sonde et l’ADN du clone recherché ne sont pas
entièrement identiques, ils sont suffisamment similaires pour permettre l’hybridation, tout
dépend de la conservation des séquences au cours de l’évolution. Il existe également des
sondes pour identifier des protéines. Si une protéine, qui est le produit d’un gène, est connue
et isolée sous forme pure, elle peut être utilisée pour détecter le clone du gène correspondant
dans une banque. Un anticorps, préparé contre cette protéine, sera utilisé pour cribler une
banque d’expression. Ces dernières sont préparées au moyen des vecteurs d’expression
destinés à produire des taux élevés d’une protéine bactérienne.

Marquage des sondes nucléiques

Il s’agit d’une incorporation enzymatique des précurseurs marqués. Cette incorporation est
réalisée de manière uniforme, c’est-à-dire sur toute la longueur pour les sondes de grande taille
et en position terminale pour les oligosondes. Le marquage uniforme consiste à faire
synthétiser in vitro une copie de l’ADN de la sonde à l’aide d’une ADN polymérase à qui l’on
fournit des précurseurs marqués (pour des raisons de coût, seul l’un des 4 nucléotides est
marqué).

Le marquage classique fait appel à la radioactivité, ce qui donne lieu à des sondes chaudes.
L’opération consiste à utiliser un désoxynucléotide marqué par un isotope radioactif au niveau
de son phosphate. Après hybridation, la révélation est effectuée par autoradiographie.
Généralement on utilise l’isotope 32P dont l’énergie d’émission élevée confère à la sonde une
haute sensibilité. Il existe également des sondes froides. Il s’agit des sondes obtenues en
utilisant un précurseur non radioactif. Elles permettent ainsi d’éviter les inconvénients liés à la
manipulation dangereuse de la radioactivité. Un ligand est fixé par covalence sur le
désoxynucléotide marqué. Ce ligand sera reconnu spécifiquement après hybridation par un
conjugué protéine – enzyme et la révélation sera effectuée par le développement d’une
réaction enzymatique. Le marquage des sondes de grande taille peut se réaliser de deux
manières : 1. on réalise d’abord une digestion ménagée par la DNase I de l’ADN double brin
devant être marqué. On génère ainsi des coupures simples brins et donc des extrémités 3’ –
OH libres, au hasard dans l’ADN bicaténaire. 2. l’action de l’ADN polymérase I d’E. coli, en
présence de 4 précurseurs dont l’un est marqué, permet ensuite de remplacer certaines parties
de l’ADN, sur chaque brin, par des fragments néosynthétisés et donc marqués. En effet,
l’holoeneyme, outre son activité de polymérase 5’→ 3’, qui assure l’élongation à partir d’une
extrémité 3’ – OH libre utilisée comme amorce, possède une activité exonucléasique 5’ → 3’
qui lui permet de digérer devant elle un certain nombre de nucléotides. - Après dénaturation,
316
on obtient une collection de fragments monocaténaires par suite du déplacement des coupures
comportant chacune une partie néosynthétisée marquée. L’ensemble constitue la sonde.

Marquage par multi – amorçage aléatoire

C’est une technique qui est très utilisée à l’heure actuelle. Elle se déroule de la manière
suivante : 1. Dénaturation préalable de l’ADN bicaténaire linéarisé ; 2. Hybridation : on
ajoute un mélange d’hexanucléotides synthétiques. Ces courts fragments vont rencontrer de
l’ADN dénaturé des séquences qui leur sont complémentaires et s’hybrider. Comme le
mélange contient les 4096 combinaisons mathématiques possibles de séquences de 6 bases, on
est sûr que des hexanucléotides vont s’hybrider ; 3. Les fragments ainsi hybridés et répartis au
hasard le long de l’ADN, vont servir d’amorces pour l’ADN polymérase dont on utilise le
fragment de Klenow, c’est-à-dire l’enzyme emputée du domaine assurant l’activité
exonucléasique 5’→3’, chaque amorce est donc étendue par une séquence néosynthétisée,
marquée (l’un des 4 dNTP a été ajouté sous forme marquée) ; 4. Après dénaturation et
élimination des précurseurs non incorporés, on obtient une sonde constituée par une collection
de fragments dont l’ensemble représente, sous forme marquée, les séquences de l’un ou lautre
brin de l’ADN initial.

Marquage par des extrémités des oligosondes

Le marquage radioactif peut se faire en remplaçant le phosphate en position 5’ par un


phosphate radioactif. A cet effet, on utilise comme donneur de phosphate de l’ATP parqué au
32
P et le transfert est catalysé par la polynucléotide kinase du phage T4. Des nucléotides
marqués (radioactif ou non) peuvent également être ajoutés en 3’– OH par action de la
terminale transférase, enzyme qui catalyse une réaction non séquence dépendante.

Marquage des sondes froides

Le marquage de ce type de sonde se fait par l’incorporation enzymatique d’un


désoxynucléotide dont la base porte une petite molécule ligand fixée par covalence. Après
hybridation sur membrane, on ajoute un conjugué constitué d’une protéine reconnaissant
spécifiquement le ligand et d’une enzyme possédant un substrat chromogène : après révélation
enzymatique, la présence de l’ADN cible sera matérialisée par la présence d’une coloration
dont l’intensité dépendra de la quantité d’ADN cible déposé ou transféré sur la membrane.

Le ligand doit être fixé sur la base en une position qui n’interfère pas avec la formation des
liaisons hydrogènes lors de l’hybridation. On utilise souvent un dUTP dont l’uracile est
marquée en position 5’. Cette fixation du ligand sur la base est d’autre part réalisée au moyen
d’un bras espaceur de manière à permettre une bonne accessibilité du conjugué de détection.
Les 2 ligands les plus utilisés sont : - la biotine (précurseur de coenzyme). Dans le conjugué
de détection, on utilise de préférence la streptavidine (d’origine bactérienne) à caus de sa très
haute affinité pour la biotine ; - la digoxyganine (DIG), stéroïde d’origine végétale. Le
conjugué de détection est dans ce cas constitué d’une enzyme couplée à un anticorps dirigé
spécifiquement contre cet haptène.
317
L’enzyme utilisée est généralement la phosphatase alcaline (PAL) et le substrat le BCIP (5-
bromo, 4-chloro, 3-indolylphosphate) appelé aussi X-phosphate. Le BCI formé lors de la
réaction catalysée est oxydé par le NBT (nitrobleu de tetrazolium) ajouté ; chacun des produits
forme un précipité bleu violet. La possibilité de marquage froid de l’ADN rend possible
l’usage à grande échelle des sondes nucléiques, par des laboratoires ne disposant pas de
l’équipement nécessaire à la manipulation de la radioactivité. Un certain nombre de kits de
marquage sont maintenant commercialisés. Ils comportent tous les réactifs nécessaires au
marquage de la sonde et à la révélation enzymatique de l’hybride.

Outre le coût, l’inconvénient des sondes froides était leur manque de sensibilité par rapport
aux sondes radioactives. Mais l’apparition sur le marché des substrats chimioluminescents
avec lesquels la réaction enzymatique s’accompagne d’une émission de lumière susceptible
d’imprégner une émulsion photographique fait disparaître ce handicap. Il existe également un
marquage direct de l’ADN en utilisant des composés photoactivables : le ligand (biotine ou
digoxygénine) est lié par un bras espaceur à un groupement cyclique qui, sous l’action de la
lumière, peut se fixer de manière covalente sur la fonction amine d’une base nucléique.

7.15 HYBRIDATION

Récemment des systèmes de transformation des eucaryotes inférieurs (levures ou


champignons filamenteux) ont été développés, rendant possible le clonage des gènes
eucaryotes directement chez les eucaryotes. Néanmoins ces systèmes ne permettent pas encore
de résoudre tous les problèmes posés par l’expression des gènes eucaryotes. L’hybridation
moléculaire, appelée aussi hybridation sur colonies ou hybridation in situ est l’une des
techniques applicables quelque soit le niveau d’expression du gènerecherché dans les cellules
réceptrices du vecteur de clonage.

Le principe est d’associer 2 brins d’ADN d’origines différentes, par des liaisons hydrogènes,
au niveau de leurs séquences complémentaires. Cela conduit à la formation d’un duplex
hybride d’où le terme hybridation. Pour utiliser cette technique, il est nécessaire de disposer
d’un fragment d’ADN ou d’ARN capable de s’apparier avec les séquences du gène que l’on
cherche à cloner. Un tel fragment d’acide nucléique est appelé sonde nucléique. Cette sonde
peut être l’ARNm correspondant au gène que l’on souhaite cloner. Elle peut également être un
fragment de ce gène permettant d’isoler un fragment d’ADN plus grand portant la totalité de la
séwuence du gène.

Conditions d’hybridation

● On appelle température de fusion (Tm ou Tf), la rempérature à laquelle 2 brins d’ADN sont
associés par 50% de leurs séquences complémentaires. La Tm d’un appariement dépend d’un
certain nombre de facteurs :

1. .la longueur et le pourcentage en G – C de l’association : la Tm augmente avec la


longueur et le pourcentage en G – C de l’association. Plus le nombre de liaisons hydrogènes
mis en jeu est grand, plus l’énergie requise pour la fusion est importante. Ainsi la Tm de
l’hybridation d’une oligosonde peut être donnée approximativement par la relation :
318

Tm = (4°C. nombre de paires G – C) + (2°C. nombre de paires A – T)

2. les compétiteurs des liaisons hydrogènes : La Tm peut être diminuée artificiellement en


ajoutant un compétiteur de liaisons hydrogènes. Ceci permet de diminuer les températures de
travail lors des hybridations. Ainsi le formamide utilisé à 50% (m/v) permet d’abaisser la Tm
d’environ 30°C ; 3. le pourcentage de non appariements : La Tm diminue lorsque le
pourcentage de non appariement augmente, parce que les bases non appariées déstabilisent la
structure du duplex formé ; 4. la force ionique : la Tm varie dans le même sens que la force
ionique du milieu, parce que les ions chargés négativement stabilisent la structure du duplex.

● On appelle stringence le degré d’empêchement des hybridations non spécifiques. Elle


dépend de la force ionique et de la température du milieu d’hybridation. Ainsi à basse
stringence, (par exemple à une température égale à la Tm du duplex moins 20°C et à haute
force ionique), 2 brins d’ADN dont la complémentarité en bases n’est pas totale pourront
s’apparier. Ce qui n’est pas possible à stringence élevée. Par exemple à une température égale
à la Tm et à basse force ionique, où les bases non appariées n’autorisent pas la formation du
duplex stable.

● La vitesse de formation d’un duplex dépend de plusieurs paramètres : - Elle diminue


lorsque la longueur de l’association diminue. L’hybridation est donc plus rapide avec les
oligosondes. Ainsi avec les sondes de grande taille, pour réaliser une hybridation en un temps
suffisamment court, en général une nuit (18 heures), on ajoute un accélérateur d’hybridation,
le plus souvent le sulfate de dextran ; - elle augmente avec la concentration en sondes que
l’on ajoute toujours en large excès.

Révélation

La révélation est réalisée sur une membrane. En effet, l’ADN monocaténaire a la propriété de
s’adsorber sur des membranes poreuses de nitrocellulose ou de nylon. Après adsorption, la
fixation de l’ADN cible est rendue irréversible par chauffage (2 heures à 80°C). Pour l’ADN,
on utilise de plus en plus des membranes de nylon, moins fragiles que les membranes de
nitrocellulose et plus performantes. Actuellement des membranes de nylon chargéess
positivement sont commercialiséées. Elles possèdent une plus grande capacité de rétention et
permettent un transfert plus rapide.

L’hybridation proprement dite peut- être réalisée comme suit : a- Dénaturation : l’ADN à
analyser est au préalable rendu monocaténaire par dénaturation pour être retenu sur la
membrane et pouvoir s’hybrider ; b- Fixation : Après transfert (ou dépôt), on réalise une
fixation irréversible de l’ADN adsorbé ; c- Préhybridation : Pour éviter la rétention non
spécifique de la sonde sur la membrane par la suite, l’hybridation est toujours précédée d’une
préhybridation. La solution de préhybridation contient des composés qui vont s’adsorber sur la
membrane partout où l’ADN transféré (ou déposé) est absent. Parmi ces composés, on trouve
des composés hydrophobes comme la caséine du lait écrémé et de l’ADN commercial bon
marché (ADN du sperme de poisson) sans homologie avec l’ADN étudié. Différentes
techniques sont utilisées :
319

1. la technique originelle mise au point par Southern. Cette technique met en jeu un transfert
sur la membrane de l’ADN à révéler spécifiquement. La taille de la séquence détectée peut
ainsi être déterminée. Cette technique de Southern est particulièrement utilisée pour étudier et
diagnostiquer des maldies génétiques. Elle permet en effet d’effectuer une cartographie de
restriction au voisinage d’une séquence définie reconnue par une sonde.

2. la technique d’hybridation sur colonies (ou sur plages de lyse). C’est une méthode de
criblage très utilisée lors d’un clonage. Les celluls de colonies isolées sont lysées par la soude.
L’ADN est libéré et dénaturé. La mise en œuvre de cette technique est plus rapide que celle de
Southern, mais elle est plus grossière puisqu’elle ne permet pas de connaître la taille de la
séquence révélée.

4. les techniques par dépôt : elles consistent à déposer sur la membrane, à la pipette ou à
l’aide d’un dispositif commercialisé, des volumes définis de solutions d’ADN cible dénaturé.
Elles sont rapides et semi-quantitatives, parce qu’elles permettent d’estimer la quantité d’ADN
cible déposé.

5. autres techniques : a- - hybridation in situ est réalisée sur un tissu fixé sur une lame. Par
observation microscopique, cette technique permet de rechercher et de localiser une séquence
cible, par exemple un ADN viral ; b- -transfert d’ARN après électrophorèse en gel d’agarose
dénaturante, selon une technologie voisine de celle utilisée pour l’ADN, a été désigné (par jeu
de mot) comme technique de northern ; c- -de même le transfert des protéines, après
électrophorèse en gel de polyacrylamide est analogue dans son principe à la technique de
Southern et a été qualifié de technique de western. Après transfert de protéines sur une
membrane de nitrocellulose et saturation de celle-ci, la révélation spécifique est effectuée au
moyen d’une sonde anticorps dirigée contre la protéine d’intérêt.

Procédés de transfert

Le transfert par capillarité est le procédé le plus simple et le plus utilisé pour l’ADN. La
présence d’une grande épaisseur de papier très absorbant assure une montée par capillarité du
tampon. Le flux ascendant du tampon entraîne l’ADN qui, après sortie du gel, est retenu par la
membrane de nitrocellulose ou de nylon. Le transfert de gros fragments (taille supérieure à 10
kb) nécessite de les scinder avant leur dénaturation par traitement acide. Le procédé
d’électrotransfert consiste à entraîner l’ADN du gel vers la membrane au moyen d’un champ
électrique. Ce procédé est plus rapide et plus efficace. Il nécessite un appareillage spécifique.
Ce procédé est plutôt utilisé dans la technique de western pour transférer les complexes
protéines – SDS (chargés négativement) après une SDS – PAGE. (SDS : sodium
dodecylsulfate)

7.16 METHODES D’ANALYSE DES PROTEINES

Un grand nombre d’ap0Cproches permettant d’analyser la fonction des gènes normaux et


anormaux se font au niveau de la protéine. Dans la plupart des cas, on souhaite connaître non
320
seulement le défaut moléculaire au niveau de l’ADN, mais aussi comment ce défaut modifie la
protéine qui est codée pour produire le phénotype clinique.

7.16.1 METHODE DE WESTERN

Peu après le développement des méthodes de Southern et de Northern pour l’analyse de


l’ADN et de l’ARN, une technique proche du point de vue conceptuel a été décrite pour la
détection des protéines spécifiques, et a été baptisée analyse Western. Cette technique peut
être utilisée pour obtenir une information en ce qui concerne la taille et la quantité de la
protéine mutée dans un extrait cellulaire du patient atteint de maladie génétique. Dans cette
méthode, les protéines isolées à partir de l'extrait cellulaire sont séparées suivant leur taille
par une électrophorèse en gel de polyacrylamide, et sont alors transférées sur un filtre de
nitrocellulose. Le filtre contenant les protéines séparées est alors incubé en présence
d'anticorps qui reconnaissent de façon spécifique la protéine à analyser. L'interaction
spécifique entre l'anticorps et son antigène peut alors être détectée par un deuxième anticorps
dirigé contre le premier, et couplé à une molécule détectable par méthode histochimique,
fluorescente ou radioactive.

7.16.2 ANALYSE DE LA SEQUENCE DES ACIDES AMINES

Les techniques développées par Sanger à la fin des années 50 pour déterminer la séquence des
acides aminés des protéines purifiées sont toujours utilisées aujourd'hui. De manière générale,
une protéine purifiée est clivée en un certain nombre de fragments peptidiques au moyen de un
ou plusieurs agents de clivage chimique ou enzymatique. Les fragments peptidiques résultants
sont alors isolés, et la séquence de 15 à 30 acides aminés est lue à partir de l'extrémité amino-
terminale de chaque fragment au moyen d’équipements de séquençage automatique
disponibles dans le commerce. La séquence des acides aminés est souvent la première étape
en vue d'isoler le gène d'une protéine particulière. En effet, la connaissance de la séquence
des acides aminés d'une toute petite portion de la protéine permet de connaître la séquence
nucléotidique d'une portion du gène codant pour cette protéine. La connaissance de la
séquence nucléotidique peut alors être utilisée pour synthétiser des sondes oligonucléotidiques
pour cribler des banques génomiques ou d'ADNc à la recherche du clone d'intérêt.

7.16.3 PRODUCTION A GRANDE ECHELLE DES PROTEINES

Une des premières applications du clonage des gènes a été la capacité de produire de façon
pratiquement illimitée les protéines codées par les gènes clonés. Les ADNc clonés peuvent
être propagés aussi bien dans E. coli que dans les levures, et exprimés sous le contrôle d'un
promoteur approprié. De grandes quantités de telles protéines peuvent alors être purifiées à
partir des cultures bactériennes ou de levures de manière plus aisée et moins coûteuse qu'elles
ne peuvent l'être à partir de sources humaines.

Cette capacité a conduit à la création d'un certain nombre d'entreprises de biotechnologie qui
se sont intéressées à la production de protéines utiles du point de vue médical. Des
protéines, telles que le facteur VIII de la coagulation (pour le traitement de l'hémophilie),
321
l'insuline (pour le traitement du diabète), l'hormone de croissance (pour le traitement des
troubles de croissance), ainsi que de nombreuses autres protéines sont maintenant produites
par ces méthodes. De grandes quantités de produits géniques sont nécessaires pour étudier la
structure et la fonction des protéines elles-mêmes, dans le but de comprendre les mécanismes
moléculaires de la fonction des produits géniques.

7.17 ANALYSE INFORMATIQUE

Il serait long, ardu et fastidieux d’analyser les séquences d’ADN. C’est pourquoi, le génie
génétique fait appel à l’outil informatique. Certains faits démontrent en suffisance pourquoi le
génie génétique fait abondamment appel à l’ordinateur. En effet, l’ordinateur est capable
d’effectuer des recoupements nécessaires à l’assemblage de différentes séquences déterminées
sur gel. Et pour vérifier si les deux brins ont été séquencés, la séquence reconstituée de l’insert
peut rapidement être comparée à la séquence du brin complémentaire. De plus la séquence
obtenue peut être confrontée aux séquences connues répertoriées dans une banque de données.
Cela permet notamment de préciser le degré d’homologie entre deux exemplaires d’origines
différentes d’un même gène. La carte de restriction d’un fragment d’ADN peut être
déterminée rapidement par l’ordinateur qui a en mémoire les sites de restriction reconnus par
les différentes endonucléases de restriction. L’ADN est avant tout de l'information. Le
stockage de cette information et son exploitation ne sont envisageables que par les moyens de
l'informatique, science du traitement automatique de l'information.

Les progrès de ces dernières années tant au niveau du matériel que des logiciels ont été tels
que n'importe quel laboratoire, même le plus modeste, peut disposer des moyens informatiques
suffisants. Il n’est plus nécessaire d'être un spécialiste pour les utiliser. La plupart des
applications de l'informatique nécessitent d'une part des bases de données de séquences et
d'autre part des puissances et des vitesses de calcul qui ne sont pas à la portée des micro-
ordinateurs. Il convient donc de faire appel à de gros ordinateurs qui sont utilisés en temps
partagé via un modem et une ligne téléphonique, le micro ordinateur local servant de terminal.
Le coût d'utilisation est relativement faible. La séquence d’une protéine peut être déduite à
partir d’une séquence d’ADN correspondant à une phase codante que l’ordinateur peut
localiser. De plus, certaines caractéristiques de la protéine peuvent être déterminées comme le
Phi ou le profil d’hydrophobicité.

Enfin des séquences consensus comme les promoteurs ou les séquences régulatrices peuvent
aussi être recherchées par l’ordinateur. Comme outils logiciels, il existe des banques de
séquences internationales, régulièrement mises à jour, qui peuvent être consultées par
télématique à partir des centres serveurs qui fournissent de plus des logiciels de recherche et
d’analyse. De plus, des logiciels pour microordinateurs relativement performants sont
commercialisés. Certains peuvent travailler sur des banques de données fournies sur CD –
Room et périodiquement actualisées. Ce qui réduit sensiblement le coût de recherche. Des
logiciels plus simples permettent enfin d’effectuer des traitements courants au laboratoire.

7.17.1 AIDE AU CLONAGE

Le criblage de banque d’ADNc ou génomique par des oligonucléotides de synthèse est


322
maintenant la technique de clonage la plus utilisée. Dans cette technique le choix de la
séquence de l'oligonucléotide est une étape critique. L’informatique facilite considérablement
le travail : a- elle permet de choisir la région de la protéine où sont localisés les acides
aminés aux codons les moins dégénérés possible ; b- elle permet de choisir les meilleures
sondes en fonction de la fréquence d’utilisation de différents codons possibles dans l’espèce
considérée et de choisir les non-appariements qui perturbent la stabilité des hybrides ; c-
enfin, une fois la séquence choisie, elle permet de la comparer à toutes les séquences déjà
connues afin d'éviter toutes les hybridations croisées, sources d'échecs de clonage.

7.17.2 AIDE AU SEQUENCAGE

La lecture des gels de séquence est grandement facilitée par l'utilisation de systèmes de lecture
optique directement branchés sur un microordinateur. Le plus simple de ces dispositifs est le
crayon optique, déplacé sur l'autoradiogramme par l'expérimentateur " le plus sophistiqué, est
un appareil entièrement automatique. Le séquençage d'un gène ne peut s'effectuer que par
petits bouts (en moyenne de 300 bases). Si la séquence à déterminer est longue (>1kb),
l'alignement des multiples fragments et l'élimination des séquences appartenant au vecteur est
une tâche qui manuellement devient vite impossible ou qui prend trop de temps. Il existe des
programmes spécialisés qui assurent l'aide au séquençage en gérant les catalogues des gels, les
alignements, les recouvrements,…. Ceci facilite considérablement le travail et diminue le
risque d'erreurs. A la limite plusieurs équipes, même non localisées au même endroit, peuvent
se partager le travail sans que cela pose de problèmes de communication puisque celle-ci est
assurée par l'informatique.

7.17.3 COMPARAISON DES SEQUENCES

Une fois l’ADN cloné et sa séquence déterminée, la première chose à faire est de voir si elle
est déjà connue ou non, et si elle est compatible avec la séquence en acides aminés de la
protéine que l'on souhaitait cloner. Il existe pour cela toute une série de programmes qui
permettent de comparer par alignement n'importe quelle séquence avec celles contenues dans
les banques de données nucléiques et protéiques. Les différences entre ces différents
programmes portent sur le nombre de bases testées à chaque essai, sur l'autorisation des non
appariements ponctuels et sur les insertions-délétions de bases ou de fragments. Les
programmes les plus rapides et donc les plus économiques sont les programmes de recherche
d'homologie parfaite. L'inconvénient est alors qu'un même gène, mais d'une autre espèce, ne
sera pas reconnu comme homologue. Le système B.I.S.A. N.C.E. permet de comparer
n'importe quelle séquence à deux banques nucléiques internationales (Genebank et EMBL)
ainsi qu'à une banque protéique (NBRF) ; ces banques sont régulièrement tenues à jour.

7.17.4 AIDE A LA RECHERCHE DES SEQUENCES PARTICULIERES

Si le clonage a été effectué dans une banque génomique, la partie du clone que l'on séquence
ne correspond pas obligatoirement à une partie codante, il ne faut pas en conclure pour autant
que le clonage a échoué. Une série de programmes permet de rechercher les codons initiateurs
et les codons stop dans les trois phases de lecture. Une analyse du même type permet de
rechercher les séquences consensus : TATA box, CAAT box, séquences de polyadénylation,
323
séquences cis-régulatrices (comme des boîtes GC), etc. Il est aussi possible d'établir la carte
de restriction de la séquence en quelques secondes, l'ordinateur ayant dans sa mémoire les
séquences reconnues par toutes les enzymes de restriction connues, ce qui est très utile pour
toutes les manipulations ultérieures sur le gène.
324
TABLE DES MATIERES
INTRODUCTION ...................................................................................................................... 1
CHAPITRE I: MACROMOLECULES BIOLOGIQUES ....................................................... 9
CHAPITRE 2 : REPLICATION ET REPARATION DE L’ADN ........................................ 47
CHAPITRE 3 : EXPRESION DE L’ADN :.......................................................................... 82
CHAPITRE 4 : MUTATIONS ............................................................................................... 117
CHAPITRE 5 : ADN DE QUELQUES VIRUS PARTICULIERS ..................................... 143
CHAPITRE 6 : GENIE GENETIQUE ................................................................................ 176
CHAPITRE 7 : TECHNIQUES GENERALES UTILISEES EN BIOLOGIE
MOLECULAIRE …………………………………………………………… 286

Vous aimerez peut-être aussi