Vous êtes sur la page 1sur 19

Biologie moléculaire

Alexandre.Escargueil@inserm.fr

La biologie moléculaire est l’étude des mécanismes au niveau moléculaire, qui permettent la
constance des gènes et leur variation à travers les générations et entre les individus, et aussi leur
expression régulée.

Structure des acides nucléiques


I. Quelques expériences historiques
L’ADN a été identifié fin XIXe siècle. Quatre bases, qui ne paraissaient pas assez complexes pour être
le support de l’information génétique.
A. F. Griffith (1928)
Travail sur les bactéries responsables de pneumonies mortelles. Il a identifié différentes souches : la
première infectieuse (Smooth S) et la seconde mutante (Rough R) et non mortelle. Il s’est rendu
compte qu’en faisant chauffer une bactérie, on peut la détruire (stérilisation).
Mais ! En mélangeant la bactérie infectieuse chauffée et la bactérie mutante, il a constaté que la
souris meurt. Il est donc possible grâce à certains éléments d’une bactérie inactivée de transformer
une souche bactérienne de R à S. Cette transformation est stable et héréditaire.

B. Avery, McLeod et McCarty (1944)


Reprise de l’expérience avec les mêmes souches de bactéries, et préparation des extraits pour en
tirer les différents constituants : des lipides, des glucides, de l’ADN, des protéines et de l’ARN.
Incubation des différents types de molécules avec des bactéries afin d’essayer de les transformer.
Après injection dans les souris, l’élément chimique responsable des transformations semblait être
l’ADN. L’ADN entraine donc une modification héréditaire, qui permet de synthétiser des caractères.

C. Les lois de E. Chargaff (1950)


Après avoir isolé l’ADN de différentes espèces, il l’a hydrolysé afin d’en caractériser les différents
composants. Il a exprimé cette composition en %, et a observé que le rapport entre A/T et G/C était
égal à 1 et vrai chez toutes les espèces. Le rapport entre la somme des bases A/T et G/C était
cependant variable entre les espèces. Cela sous-entendait que l’ADN était porteur d’une information
qui distinguait les différentes espèces. Le rapport A+T/G+C est constant chez l’Homme par exemple.
D. Rosalind Franklin, Wilkins, Watson et Crick
Diffraction aux rayons X d’une fibre d’ADN, avec un travail commun mettant en évidence le modèle
en double-hélice de l’ADN. Modèle antiparallèle, diamètre de 2nm. Les bases sont au centre de la
structure avec un squelette autour.

II. Les éléments clés de la structure de l’ADN


A. Les bases azotées
Deux types de bases : purines et pyrimidine. Ce sont des hétérocycles, qui ne sont pas composés
uniquement de carbone. On peut observer des doubles liaisons, qui en font des cycles conjugués. Ils
influent sur leur absorption de la lumière et leurs propriétés physico-chimiques : ce sont des
structures hydrophobes (position au cœur de la double hélice), des hétérocycles conjugués qui
donnent lieu à l’apparition de formes totomérique (formule brute constante mais formule
développée changeante). Ici, on a des électrons délocalisables. De plus, ces structures sont presque
complètement planes (empilement des bases dans la double hélice).
Purine : on numérote en premier un azote car on essaye de minimiser les numéros des carbones
communs aux deux cycles. La liaison avec le sucre se fait au niveau de l’azote 9.
Pyrimidine : on tourne dans le sens des aiguilles d’une montre.

Il existe des dérivées des deux modèles de bases : cytosine, thymine, uracile pour la pyrimidine et
adénine et guanine pour la purine. Les substitutions sur différents carbones permettent de créer des
liaisons hydrogène entre différentes bases.
Bases puriques modifiées en analogues
La modification des bases par méthylation intervient dans la régulation de certains gènes. Chez les
bactéries, elle caractérise l’ADN bactérien (différencie le sien avec celui d’un virus par exemple).
Cette modification ne perturbe par la structure de la double hélice.
D’autres bases modifiées sont utilisées : analogues synthétiques par exemple, avec un X qui peut
prendre différentes formes halogénées.
On retrouve des bases dans notre alimentation (caféine, théine) qui jouent des rôles antagonistes. La
théobromine se trouve dans le chocolat.

B. Les nucléosides

Condensation d’une des cinq bases avec un pentose (un ribose ou un desoxyribose cyclique). Ils sont
sous forme furanique. Différence de OH sur le carbone 2. Ils ne sont alors pas plats, le carbone 2 et 3
étant exclus du plan.
C3 endo : du même côté que le carbone 5
C3 exo : à l’opposé du carbone 5
Le sucre peut avoir une autre configuration avec le C2, également endo ou exo.
On les numérote en ‘’ lorsqu’ils ont une liaison avec la base, pour ne pas les confondre avec les
sucres non reliés. Il y a une liaison N-glycosidique entre la base et le sucre.

C. Les nucléotides
C’est un nucléoside phosphorylé (base + pentose + groupements phosphates).

Nucléoside monophosphate : Le groupement phosphate sera présent sur le carbone 5’ (liaison 5’-
phosphoester). Un nucléotide à pH physiologique est chargé négativement.
Nucléoside triphosphate : liaison anhydride d’acide. Le phosphate le plus proche du carbone est dit
α, puis β, puis gamma.
On peut également avec des réactions intramoléculaires qui forment de l’ALP cyclique.
D. Le polymère d’ADN simple brin : représentations conventionnelles
Les brins d’ADN/ARN sont orientés, de 5’ vers 3’. Le lien entre deux nucléotides est entre le
phosphate et le 3’ du suivent : deux liaisons phosphoester. Elles sont appelées liaisons ou ponts
phosphodiester. On obtient ainsi une extrémité 5’phosphate et 3’OH libre. Le groupement phosphate
réagit à l’extrémité 3’.
La lecture va de 5’ phosphate à gauche vers 3’OH à droite. Dans l’ADN, il y a autant de charges
négatives que de nucléotides.

E. Les appariements de Watson et Crick


On trouve à l’extérieur les groupements phosphates et sucres qui forment le squelette de la double
hélice. Les bases, bien qu’hydrophobes, peuvent former des liaisons hydrogène.
Une guanine s’associe toujours avec une cytosine : c’est une complémentarité.
G et C : trois liaisons hydrogène, A et T : deux liaisons hydrogène
Complémentarité et symétrie des interactions qui permet une largeur constante de la double hélice.
III. La structure secondaire de l’ADN : l’hélice β vue en détail
A. Les paramètres de la double hélice β
Dans l’ADN, le sucre est forcément un C2’ endo. Cette configuration permet d’éloigner au maximum
les deux groupements phosphates chargés négativement.
Configuration anti : la liaison N-glycosidique peut tourner à 180°, ce qui entraine deux configurations
extrêmes. Si la base n’est pas au-dessus du sucre, c’est une configuration anti. Sinon, c’est une syn.
L’existence des sillons proviennent de la géométrie des bases.
Les acides nucléiques sont reliés par des ponts diester entre le C3’ et le C5’. Les deux chaines d’ADN
sont antiparallèles, chaque chaîne est orientée de 5’ vers 3’. L’appariement des bases est assuré par
des liaisons hydrogène. La succession des nucléotides est appelée séquence -> lorsque l’on connait la
séquence d’un brin, on peut en déduire celle de l’autre.
B. Les petit et grand sillons de la double hélice β
Angle de 120° entre les deux liaisons N-glycosidiques. L’axe de symétrie est au cœur de la paire de
base, donc la profondeur des sillons est égale. Leur largeur varie seulement.
2nm et 1.2 nm, donc plus grande accessibilité par le grand sillon. Cette existence a quelques
conséquences fonctionnelles :
- atomes soit donneurs soit accepteurs de liaisons hydrogène sur les arêtes supérieures et
inférieures. Des molécules capables d’interagir peuvent donc venir. La taille du grand sillon permet
d’accommoder parfaitement l’hélice α d’une protéine. La taille du petit sillon y est défavorable. S’il y
a des résidus d’acides aminés capables de former des liaisons h dans l’hélice α, la protéine peut se
fixer sur l’ADN.
Pour les bases G et C, dans l’arrête du grand sillon : deux atomes d’hydrogène donneurs, un
accepteur, un normal. Code : AADH, qui permet de reconnaitre la géométrie d’un résidu. Pour des
bases C et G, c’est donc l’inverse : HDAA.
Pour les bases A et T : ADAM, pour les bases T et A : MADA
Une protéine peut sans ouvrir la double hélice reconnaitre une séquence spécifique par sa capacité à
former une liaison hydrogène avec les différentes arrêtes d’une paire de bases.
Si on regarde du côté du petit sillon, on observe que les codes présents sont moins informatifs (on ne
distingue pas GC de CG par exemple). Le grand sillon est beaucoup plus informatif et accessible que
le petit sillon.

C. Les forces qui stabilisent la double hélice de l’ADN


Elles sont de trois grandes natures :
- Hydrogène (complémentarité des brins, avec une certaine énergie pour chaque liaison)
- Interactions ioniques et électrostatiques : présence de cations (magnésium, sodium car le squelette
est très fortement chargé négativement. Il faut donc des contre-ions pour que les charges négatives
ne se repoussent pas).
- Interactions hydrophobes et forces de Van der Waals (masquage de bases hydrophobes vis-à-vis du
solvant aqueux, empilement des plateaux de paires de bases, 0.34nm entre chaque étage. Même des
molécules hydrophobes peuvent former des dipôles infinitésimaux, qui créent des charges positives
et négatives interagissant lorsque les rayons de Van der Waals sont très proches l’un de l’autre. S’ils
se chevauchent, les atomes se repoussent, et s’ils se touchent il y a création d’une liaison faible entre
tous les atomes qui composent les étages de la double hélice).

D. Variations sur un même thème : le cas particulier des ARN


La première grande différence : l’ARN se trouve sous forme monocaténaire, et le sucre de l’ARN est
du ribose, contre du désoxyribose pour l’ADN. Conséquence de la présence de OH : l’ARN est très
sensible et instable, notamment dans les conditions alcalines. Les ions AH- arrachent l’hydrogène ce
qui ne laisse plus que l’oxygène -> réaction avec phosphate. Donc en conditions alcalines, l’ARN se
coupe et se dégrade très très vite.
Deuxième grande différence : la thymine est remplacée par l’uracile.
Troisième grande différence : on peut établir des structures secondaires de type hélice, qui
impliquent des appariements classiques (AU, GC) mais aussi des appariements bancals (GU). C’est
une question de géométrie : les angles sont constants entre E-U et G-C, mais l’angle avec G-U est
différent. L’ARN est beaucoup plus tolérant que l’ADN (distorsions du squelette car hélices seulement
partielles).
Quels types de structures secondaires ?
- des structures intra-brins : des appariements en constituant une structure anti-parallèle à l’intérieur
du même brin d’ARN, des bulles sans appariements pour les régions non complémentaires … c’est
une structure tige-boucle (ou en épingle à cheveux).
L’axe de symétrie ne passe pas par le centre des paires de bases, l’angle est beaucoup plus élevé et
un grand sillon à l’accessibilité complexe (avec les groupements phosphates qui le surplombent) et le
petit sillon beaucoup plus profond.

Les raisons : le groupement hydroxyle interagit avec le groupement phosphate. On favorise la


conformation α de la double hélice.
On a entre 2 et 5x plus d’ARN que d’ADN dans une cellule. Il y a des ARN stables (ribosomiques par
exemple), établissement de structures secondaires et tertiaires, les ARN de transfert avec une forme
en L, les ARN messagers très instables …

IV. Propriétés physico-chimiques des acides nucléiques


A. Les acides nucléiques absorbent le rayonnement UV
Propriétés très utilisées pour les caractériser en biologie moléculaire.

Loi de Beer-Lambert
Absorbance proportionnelle à la concentration des espèces de la solution et à la longueur du trajet
parcouru. Les doubles liaisons conjuguées dans les hétérocycles peuvent absorber les UV donc une
partie de la lumière incidente.
On peut suivre la concentration des acides nucléiques ou leur état en solution.
Pic d’absorption : 260nm.
Le pic d’absorption des protéines est à 280nm, il faut donc faire attention. Si le rapport d’absorbance
est inférieur à 1.8, l’ADN n’est pas pur (il l’est entre 1.8 et 2). On peut également avoir une
contamination par les ARN par l’effet hyperchrome. Le coefficient d’extinction molaire dépend de la
capacité à absorber la lumière, donc une hélice β avec des hétérocycles stabilisés a des électrons
moins excitables, donc absorbent moins. Avec un ADN simple brin, les paires de bases sont moins
empilées et les électrons moins stabilisés : ils absorbent plus de lumière. Le passage d’un ADN double
à simple fait qu’il absorbe environ 40% de plus. L’ARN a alors un profil intermédiaire avec quelques
régions d’appariement bien qu’il soit monocaténaire.
B. Le phénomène de dénaturation
On peut suivre la structure de l’ADN en fonction de son absorbance. La dénaturation est la perte de
la structure tridimensionnelle, sans perturber la structure primaire. La température, les conditions
alcalines ou certaines molécules bloqueuses de liaisons hydrogènes peuvent dénaturer l’ADN. C’est
cependant un phénomène réversible, et former une hybridation.

On obtient des plateaux à chaque extrémité de la dénaturation, avec une différence d’absorbance de
40%. On peut déterminer le Tm (température de demi-dénaturation) spécifique de la séquence
d’ADN étudiée. Il suffit de prendre le point d’inflexion pour obtenir une température de fusion ou Tm
en la divisant par deux (50% dénaturé, 50% sous forme de double hélice). C’est un processus
coopératif, qui se propage à un ensemble. La transition est alors extrêmement rapide.
Les facteurs influençant la Tm :
- le nombre de liaisons hydrogène (% en G+C). Pour 1% de G+C, on augmente le Tm de 0.4°C.
- la concentration en sel mais surtout en ion sodium Na+. En effet, ils neutralisent les charges
négatives des phosphates. Les charges négatives se repoussent alors et l’ADN se dénature.
- la taille de la molécule qui influe sur le nombre de liaisons hydrogènes. Cet effet est vrai jusqu’à 200
nucléotides.
Tm = (A+T)*2 + (G+C)*4 (pour les petits oligonucléotides)

C. Le phénomène de renaturation
Deux simples brins peuvent former un brin bicaténaire lorsqu’ils sont complémentaires l’un de
l’autre.
On peut hybrider une grande molécule d’ADN avec une petite, mais aussi des ADN humains avec des
ADN de singes. Si on dégrade un ADN, on ne peut pas revenir en arrière ! Ce n’est pas pareil que la
dénaturation.
D. Hydrolyse du squelette « sucre-phosphate » : les nucléases
Il en existe différents types qui dépendent de leur mode d’attaque, de leur spécificité (DNases,
RNases, etc).
- exonucléases : elles coupent par les extrémités. Par l’extrémité 5’ ou 3’ : elles la reconnaissent, s’y
fixent et coupent les ponts phosphodiester séquentiellement.
- endonucléases : elles coupent par l’intérieur en reconnaissant des séquences spécifiques ou en se
fixant n’importe où. Des extrémités 5’phosphate et 3’OH sont générées. On en a plusieurs types : les
enzymes de restriction spécifiques ou les DNases.

Les enzymes de restriction 


On en utilise plus de 3000. Reconnaissance d’une séquence définie de l’ADN (site de 4 à 8 paires de
bases) et hydrolyse des deux brins dans ou à proximité de cette séquence. C’est le système de
défense des bactéries, un phénomène de restriction de l’infectivité des bactéries par certains
bactériophages. L’enzyme de restriction ne reconnait par exemple pas la méthylation des bases.

On distingue trois grands types :


- Types I et III qui reconnaissent des sites dissymétriques mais spécifiques, mais coupent plus loin.
- Types II qui ont un site de reconnaissance symétrique, et reconnaissent une séquence
palindromique.
E. Les acides nucléiques sont uniformément chargés
Electrophorèse en gel d’agarose : forme un gel, comme un filet et en fonction de sa concentration
des mailles plus ou moins ouvertes. On implique du courant, et l’ADN se positionne en fonction de sa
taille. Les acides nucléiques sont donc uniformément chargés. On utilise des intercalants de l’ADN
pour le révéler et le colorer (bromure d’étydium). Ses structures peuvent être excitées (UV) et
émettent ainsi de la lumière visible. On utilise des marqueurs de poids moléculaire pour avoir un
repère.
V. Diversité des génomes
A. L’ADN, support de l’information génétique
Procaryotes : ADN double brin circulaire (nucléoïde, plasmides)
Eucaryotes : noyau (ADN double brin linéaire sous forme de chromosomes), mitochondrie (ADN
double brin circulaire), chloroplaste (ADN double brin circulaire)
Virus, bactériophages : ADN qui peut être simple ou double brin circulaire ou linéaire.

B. L’ARN support de l’information génétique


Ce n’est vrai que pour les virus et les bactériophages, et il peut prendre plusieurs formes.

C. Les plasmides
Définition et propriétés des plasmides naturels et des plasmides vecteurs
ADN double brin circulaire, extra chromosomique.
- réplication autonome dans la bactérie, possède sa propre origine de réplication et avec un nombre
de copies variable en fonction du type de plasmides.
- porteur d’au moins un gène non essentiel à la bactérie hôte mais conférant à la bactérie une
propriété particulière (ex : résistance aux antibiotiques). C’est ce pour quoi ils ont été conservés au
cours de l’évolution et sont la cause de la multirésistance aux antibiotiques (peut aller jusqu’à 10).
Peut permettre à la bactérie de s’adapter à certains milieux (utiliser les métaux lourds par exemple).
Ces plasmides passent d’une cellule à une autre par la transformation.

Historique : Dans les années 1970, ils commencent à être utilisés et modifiés. C’est grâce aux
plasmides qu’on a pu commencer à faire des clones. ADN existant naturellement dans la bactérie et
modifiables au laboratoire.
Application : utilisés comme vecteur (plasmides vecteurs) de fragments d’ADN isolé pour
l’amplification et la purification d’un caractère. On peut ainsi obtenir 15 à 20 copies du même
plasmide dans une cellule.
Sur chaque plasmide sont situés dans sites d’enzymes de restriction, qui présentent un site unique
(utilisé pour cloner). Par exemple, on peut linéariser un plasmide qui était circulaire grâce à une
enzyme de restriction aux extrémités cohésives, puis couper l’ADN d’une cellule quelconque avec la
même enzyme. On peut ainsi mélanger les fragments obtenus qui vont s’hybrider avec le plasmide
coupé. On place ensuite le plasmide modifié dans une bactérie.

Structure tertiaire des plasmides


Les plasmides natifs (dans les bactéries au naturel) sont superenroulés -> contrainte à la suite d’une
tension pour retrouver l’équilibre. Superenroulement négatif -> lorsqu’il n’y a plus assez de tension.
On trouve plus facilement cette forme dans les cellules car elle a plus de facilité à s’ouvrir
(réplication, transcription). Pour un superenroulement positif, la tension est très importante et les
brins sont difficilement séparables.
La forme superenroulée est appelée forme 1 (naturelle), alors que la forme relachée (avec une
coupure simple brin ou non grâce à une endonucléase ou DNAase 1) est appelée forme 2.
La gêne stérique de la forme 1 est inférieure à celle de la forme 2.
Forme linéaire (enzyme de restriction) qui prend la forme 3.
Les différentes formes de l’ADN plasmidique ont un encombrement différent, qui joue sur la
migration (Electrophorèse, etc). La forme I migre plus facilement, puis la forme linéaire, puis la forme
circulaire. On ne peut donc pas déduire la taille du fragment d’ADN utilisé, ou alors en utilisant un
plasmide linéarisé. Les formes intermédiaires sont appelées topoisomères.

VI. Compaction du génome eucaryote


Longueur totale d’ADN dans une cellule humaine : environ 2m.

Chromatine et chromosomes
La chromatine prend deux formes distinctes : euchromatine (claire) et hétérochromatine (très
dense). Le niveau maximum de compaction de l’ADN est le chromosome qui peut être observé en
mitose. L’ADN est donc condensé.

La chromatine est constituée de :


- ADN (1/3)
- d’une classe bien définie de protéines : les histones (1/3)
- de nombreuses autres protéines (1/3)

Le premier niveau de compaction se fait grâce aux histones pour former une structure en « collier de
perle ». Un cylindre est composé de 8 histones (H2A, H2B, H3 et H4 en double). Autour se placent
146 paires de bases. L’octamère d’histones et l’ADN enroulés forment le nucléosome (ADN chargé
négativement et les histones chargées positivement).
Niveau supplémentaire : une fibre de 30nm, un solénoide forme du nucléosome. Une autre histone
entre en jeu : l’histone H1. L’ADN forme des boucles sur la matrice nucléaire et forme une structure
tridimentionnelle qui permet une compaction plus importante. Ces boucles vont elles-mêmes
s’enrouler en superhélice qui constituant le bras du chromosome.

Vous aimerez peut-être aussi