Académique Documents
Professionnel Documents
Culture Documents
UE 2
BIOCHIMIE
FICHE DE COURS 7
Les acides nucléiques et structure des génomes
https://www.a2sup.fr/
FICHE : LES ACIDES NUCLÉIQUES ET LA STRUCTURE DES GÉNOMES
PLAN :
Conclusion
Les P1disponsables
2
I - Les éléments de base
A - Généralités
Les acides nucléiques sont composés de quatre modules élémentaires : les bases. Il existe
deux types de bases : les pyrimidines et les purines. Les bases pyrimidiques sont la cytosine
(ADN et ARN), la thymine (ADN) et l’uracile (ARN).
Nous pouvons observer que la différence entre la thymine et l’uracile consiste est d’un
groupement méthyl sur le carbone 5 du cycle pyrimidine pour la thymine. En effet lorsque ce
groupement méthyl n’est pas détecté, cela permet de conclure que l’uracile est étranger à
l’ADN.
Les bases puriques sont constituées d’un noyau pyrimidique avec un imidazole, ce sont la
guanine (ADN et ARN) et l’adénine (ADN et ARN).
Ces bases se complètent et peuvent s’apparier : c’est la complémentarité des bases. L’adénine
(A) peut s’apparier avec la thymine (T) ou l’uracile (U), tandis que la guanine (G) peut
s’apparier avec la cytosine (C). Cet appariement est communément décrit par l’expression :
“paires de base de Watson et Crick”.
2) Liaisons hydrogènes
Les bases s’associent entre elles grâce à des liaisons hydrogènes (assez fortes pour maintenir
la structure mais faibles pour pouvoir être détruites).
3
L'adénine avec la thymine ou l’uracile ne s’associent que par deux liaisons d’hydrogène :
Les liaisons C et G sont donc généralement plus difficiles à séparer que les liaisons A et T.
4
Ainsi, ces modifications peuvent avoir un impact très important sur l’ADN et l’expression des
gènes.
1) Sucre
Les acides nucléiques sont composés d’un squelette ose (= sucre). Le sucre est le pentose,
c’est un sucre à cinq carbones, sa fonction est un aldose (on rappelle que les sucres peuvent
être des aldoses ou des cétoses), ce sucre est donc le ribose, qui se cyclise par un pont oxydique
1,4 en hétérocycle furane. Contrairement aux bases dont les atomes étaient numérotés 1, 2, ...
le sucre est numéroté en « ‘ », pour éviter la confusion (1’, 2’, ...).
Au niveau de l’ARN (= Acide RiboNucléique), le sucre est ici un ribose classique, il n’est pas
désoxygéné car il y a bien un hydroxyle en 2’, et il a lui aussi un hydroxyle en 3’.
5
L’hydroxyle en 2’ (qui est présent dans l’ARN mais pas dans l’ADN) rend l’ARN plus labile,
plus fragile que l’ADN, qui est bien plus stable.
L’hydroxyle en 3’ est crucial pour la formation des acides nucléiques, sans ce -OH en 3’, on
ne pourrait pas constituer des chaînes de nucléotides, ou polymères de nucléotides.
2) Nucléoside
Les bases sont reliées à ces sucres via le carbone 1’, qui va faire une liaison N-osidique, puisque
c’est sur un azote de la base azotée que la liaison va se faire... En fonction de la base azotée, si
elle est pyrimidique ou purique, ça ne va pas être le même azote de la base : c’est l’azote en
position 1 pour les bases pyrimidiques, et c’est l’azote en position 9 pour les bases puriques.
3) Nucléotide
Les nucléosides sont liés à un acide phosphorique (H3PO4) en 5’, ce qui va constituer le
nucléotide. Il s’établit pour ce faire une liaison ester entre le sucre (l’hydroxyle en 5’ du sucre)
et l’acide phosphorique.
6
Donc un sucre, une base et un phosphaTe donnent un nucléoTide.
Cela constitue l’élément de base de l’acide nucléique, si le ribose est désoxy, vous avez de
l’ADN, si c’est un ribose simple, vous avez de l’ARN.
7
Remarque : Les nucléotides ne sont pas que les constituants des acides nucléiques. Ce sont
des constituants extrêmement importants de nombreuses molécules, notamment les nucléotides
triphosphates. On peut par exemple parler de l’ATP (coucou la biocell), ou adénosine
triphosphate, constituée d’une adénine, formant une liaison N-osidique avec le ribose, lui-
même lié par liaison ester avec l’acide phosphorique, auquel sont raccrochés deux autres
acides phosphoriques.
L’ATP est un donneur immédiat d’énergie libre, le plus important dans tous les systèmes
biologiques. Toute la richesse énergétique de cette molécule est contenue dans la liaison
anhydride d’acide liant les acides phosphoriques entre eux (on parle de liaison anhydride
phosphorique). Il s’agit de liaisons riches en énergie dont l’hydrolyse va libérer de l’énergie.
Ce n’est pas forcément une notion qu’on va demander, mais c’est bien pour votre culture et
pour mieux comprendre pourquoi et comment l’ATP donne de l’énergie.
1) Sens de l’ADN
8
en 3’, c’est lui qui permet l’accrochage d’un second nucléotide puis d’un suivant etc.…pour
former l’acide nucléique).
2) Structure de l’ADN
L’ADN est sous la forme d’une double hélice. Cette double hélice
n’est donc pas un seul polymère de nucléotides, mais un double brin
de polymères de nucléotides, les brins sont complémentaires (antiparallèles / tête-bêche),
puisque l’un des deux brins est dans le sens 5’-> 3’ de gauche à droite (on parle de brin sens),
tandis que l’autre brin est dans le sens 5’-> 3’ de droite à gauche (on parle de brin anti-sens).
La double hélice d’ADN est une double hélice droite, en spirale / en escalier. Le squelette
ose-phosphate est vers l’extérieur de l’escalier, tandis qu’à l’intérieur, au centre, ce sont les
bases (nos sucres sont timides, ils se cachent ><). Ces bases sont planes, dont elles constituent
en quelques sortes les marches de l’escalier. Ce plan des bases est quasiment perpendiculaire à
l’axe de l’hélice. C’est la structure qui a été découverte par Watson et Crick.
9
La structure de la double hélice d’ADN est parfaitement répétée, il y a 34 Angströms par
tour d’hélice, il y a 10 bases par tour, il y a 20 Angströms de diamètre de l’hélice... c’est
une structure très régulière !
C’est extrêmement bien enroulé, et ce peu importe l’appariement qui a lieu au centre (que ce
soit A-T ou G-C). Cela signifie que la place que prend chacune des bases est la même, c’est
pour ça qu’il est extrêmement important qu’il y ait toujours un A en face d’un T et un G en
face d’un C : ces appariements-là prennent exactement la bonne place pour se retrouver au
centre de l’escalier sans que les marches ne soient déplacées.
Cela génère un grand sillon et un petit sillon, ce qui est important notamment pour la
régulation de l’expression, ou pour les interactions avec certaines protéines. Ces zones (grand
sillon et petit sillon) sont donc des zones d’interaction entre ADN et protéines. L’ADN existe
sous plusieurs conformations, la principale étant la conformation B (ADN B), mais il existe
aussi une conformation A ou une conformation Z…
On voit bien sur le schéma que les carbones des bases sont au centre, cachés, constituant les
marches de l’escalier, et autour, les carbones des sucres et les phosphates des acides
phosphoriques. C’est cette structure qui permet toutes les possibilités d’appariement des bases
de l’ADN.
10
3) Rupture des liaisons hydrogènes
Comme on l'avait vu juste avant, l’ADN est lié par des liaisons hydrogènes qui sont des liaisons
faibles et réversibles, c’est une propriété cruciale. La rupture des liaisons hydrogènes permet
de séparer les deux brins, ce qui permet de faire de nombreuses choses :
● In vivo, lors de la réplication, et de la transcription : on va pouvoir utiliser chacun des
brins de l’ADN comme matrice pour faire la réplication... On parle de réplication semi-
conservative. Le fait que l’on puisse réassocier les bases comme elles doivent l’être
(un A en face d’un T, un C en face d’un G), c’est ce qui fait que l’on peut séparer la
molécule en deux, et se servir de la matrice de chacun des brins pour synthétiser un
autre brin antiparallèle parfaitement complémentaire, et donc donner naissance à
deux molécules parfaitement identiques.
● In vitro, on va pouvoir rompre ces liaisons hydrogènes par la chaleur (exemple de la
PCR où l’on chauffe nos brins et on les dénature grâce au chauffage qui dissocie les
liaisons hydrogènes), ou encore par le pH ou par des solvants organiques comme
l’urée ou le formamide.
La dissociation est importante, mais la reformation à l’identique est tout aussi cruciale, c’est
la base de la transmission de l’information génétique.
11
B - ARN = Acide RiboNucléique
L’ARN n’est jamais non structuré ou non associé à des protéines, puisqu’il est relativement
fragile, il vaut mieux qu’il soit associé à quelque chose pour le protéger.
12
Les ARN les plus abondants de l’organisme sont les ARN ribosomaux (ARNr). Il en existe
quatre types, le 5S, le 5.8S, le 18S et le 28S chez l’homme, et ils font partie intégrante des
deux sous-unités du ribosome.
Le ribosome est la structure capable de traduire le message en une protéine et les ARN
ribosomaux sont absolument indispensables à son fonctionnement. La grosse sous-unité du
ribosome contient les ARNr 5S, 5.8S et 28S, tandis que la petite sous-unité contient l’ARNr
18S.
13
Les ARN de transfert (ARNt) sont des aminoacyl-tRNA. Ils ont une structure caractéristique
en trèfle, grâce à un appariement en intra-brin, et sont des molécules adaptatrices pour la
synthèse des protéines. Le code génétique, qui se compose d’une succession de triplets (=trois)
de nucléotides constituant des codons, sera reconnu par un anticodon d’un ARN de transfert,
qui comporte également à son autre extrémité, dans la partie 3’, un site d’attachement à
l’acide aminé. L’ARNt fait donc la correspondance entre l’anticodon, qui reconnaît le codon
de l’ARNm en cours de traduction, et l’acide aminé y correspondant selon le code génétique.
On rappelle qu’un codon correspond à un acide aminé, mais que le code génétique est
dégénéré, c’est-à-dire que plusieurs codons différents (qui diffèrent par leur dernier AA)
peuvent coder pour le même acide aminé. (Vous allez le voir plus en détail dans le cours sur la
transcription/traduction)
L’ARNt, comme l’ARNr, sont donc deux exemples d’ARN qui vont être transcrits mais non
traduits, car ils ont une utilité sous leur forme ARN.
Parmi les petits ARN non codants, on trouve par exemple les microARN (miARN), qui sont
donc de petits ARN de 21 à 24 nucléotides en général, qui sont simples brins et non codants.
Ils ont une structure tige-boucle caractéristique (appariement intra-brin), et subissent une
maturation par toute une machinerie (non détaillée ici) pour en faire des régulateurs post-
transcriptionnels par appariement à un ARN messager cible. Ces petits miARN,
complémentaires à des ARNm qui codent pour des protéines, vont pouvoir inhiber la
traduction ou conduire à la dégradation de cet ARNm d’intérêt. Puisque les ARNm sont
ceux qui donnent lieu à la traduction et donc à la naissance des protéines, utiliser un miARN
complémentaire qui vient empêcher la traduction ou carrément conduire à la dégradation
de l’ARNm permet de contrôler l’expression du gène.
14
III - La structure du génome
A - Généralités
Le génome est l’ensemble des éléments génétiques codants et non codants d’une cellule ou
d’un individu. Il comprend le génome nucléaire et le génome des organelles (chez l’homme,
il y a par exemple un ADN mitochondrial d’origine maternelle, chez les végétaux, on peut par
exemple parler du génome des chloroplastes).
On distingue deux types de génomes :
● Chez les procaryotes comme E. Coli, le génome est non enveloppé, il n’y a donc pas
de noyau et de membrane nucléaire mettant de côté le génome dans un espace
cellulaire particulier.
● Chez les eucaryotes comme cerevisiae (levure) ou nous (Homo Sapiens), le génome est
enveloppé, il est dans un noyau, ce qui complexifie énormément les réplications, les
transcriptions, les traductions... tous ces mécanismes d’utilisation du génome sont
compliqués par le fait qu’il y a un noyau, une membrane, donc il va falloir traverser
éventuellement cette membrane, et avoir des processus qui vont avoir lieu dans des
compartiments cellulaires différents.
Le génome est composé d’ADN codant, c’est-à-dire à la fois d’ADN transcrit et traduit en
protéine, mais aussi d’ADN transcrit mais non traduit, et d’ADN non codant, constitué de
séquences répétées, qui représentent la majorité de notre génome, et de pseudogènes, qui sont
des gènes fossiles, des gènes qui ne sont plus actifs, plus utilisables.
Attention, la taille des génomes n’est pas corrélée à l’ADN codant ! En effet, on peut voir
sur le schéma ci-après différentes espèces, on voit que plus on va vers des espèces évoluées
(levure < vers < souris <homme...), plus la taille du génome augmente, mais on voit également
qu’en parallèle à cela, il y a proportionnellement plus d’ADN codant chez les espèces les moins
développées...
La taille du génome n’est donc pas corrélée à l’ADN codant, on voit chez l’homme que le
génome est très grand, mais il y a beaucoup de choses qui ne codent pour rien et dont le rôle
est encore méconnu...
15
Si on s’intéresse à la composition du génome humain, on voit que la partie codante qui donne
lieu à des protéines ne représente que 1,5% du génome total, tandis que les introns (c’est-à-
dire de l’ADN qui ne sera pas traduit) en représentent 26%, et puis il y a des tas d’autres choses,
des transposons, des rétrotransposons, des répétitions : des SINE, des LINE... qui sont donc de
l’ADN non codant. Ce n’est pas parce que l’on a un grand génome que l’on code beaucoup de
protéines.
Remarque : L’ADN codant pour les protéines représente une très faible partie de notre
génome, alors que les séquences régulatrices de l’expression des gènes représentent la
majorité de notre génome.
Chez l’homme, seul 1,5% de l’ADN code des protéines, alors que chez les procaryotes, 90%
du génome est codant !
16
B - Le génome eucaryote
Le génome eucaryote, qui est donc contenu dans un noyau, est une molécule linéaire de très
grande taille : si on gardait notre génome étiré, il ferait plusieurs mètres, donc c’est impossible
de le mettre dans une cellule, ce qui sous-entend que notre génome ne peut donc pas être sous
sa forme de double hélice simple, il faut trouver des artifices pour le faire rentrer... Il y a donc
une nécessité de compaction !
Chez l’homme, le génome est réparti sur plusieurs chromosomes (23 paires de
chromosomes), et pour pouvoir répliquer tout cela en un temps relativement court, il y a
plusieurs origines de réplication par chromosome, pour qu’on puisse recopier à partir de
plusieurs origines à la fois. L’organisation du génome est basée sur une entité de base qui est
le gène, la densité des gènes est non homogène sur l’ensemble du génome, il y a des zones
plus ou moins concentrées.
1) Compaction ADN
17
Entre deux nucléosomes, il y a un petit bout de molécule d’ADN, que l’on appelle un linker
d’ADN, de 50 pb. Pour stabiliser le nucléosome avec l’enroulement de l’ADN, il y a la
cinquième histone, l’histone H1, qui fait le connecteur et qui permet de maintenir le tout.
C’est pour cela qu’en microscopie électronique, on peut voir de l’ADN sous forme d’un collier
de perles, car chaque petit enroulement autour d’un octamère d’histone fait comme une boule,
comme une perle de collier, ce qui se voit en microscopie.
Le fait d’enrouler autour d’un octamère d’histone permet de compacter six fois la molécule
d’ADN, mais la compaction au sein de l’ADN est bien plus importante que cela, il faut qu’elle
soit 1000 fois plus importante que ça ! Il y a donc une compaction supplémentaire, et les
nucléosomes vont dont s’enrouler eux-mêmes en formant des super enroulements, pour
pouvoir condenser bien plus l’ADN jusqu’à sa compaction ultime qui est le fait d’isoler un
chromosome.
Les histones peuvent être modifiées, et de ce fait, elles vont aussi participer à la régulation de
l’expression des gènes, puisque quand la molécule d’ADN est compactée, il y a des zones qui
sont très peu accessibles, qui ne seront donc pas facilement disponibles pour faire de la
transcription et donc de la traduction derrière. Ainsi les histones, de par leur compaction, la
manière dont ils compactent et les régions qu’ils compactent, interviennent dans la régulation
de l’expression des gènes.
L’ensemble ADN + protéines (histones et non histones) forme ce que l’on appelle la
chromatine, que l’on peut retrouver sous deux états :
18
Hétérochromatine Euchromatine
Inactive Active
Non accessible aux interactions avec des Accessible à des interactions avec des
protéines protéines
19
Il y a de l’hétérochromatine constitutive, c’est-à-dire
des zones de molécules d’ADN qui sont constitutivement
des zones non accessibles, compactées à l’extrême et
ne contenant pas de gènes transcrits.
Il s’agit par exemple des centromères, qui sont des
séquences répétées nécessaires pour maintenir les deux
chromatides filles ensemble (tant qu’elles ont besoin
d’être ensemble). Comme autre zone d’hétérochromatine
constitutive, on peut également parler des télomères
(situés aux extrémités), qui sont des séquences répétées
nécessaires au maintien de la taille des chromosomes.
L’érosion des télomères, c’est-à-dire la diminution de la
taille des télomères au fur et à mesure des divisions, est
un signal de sénescence, de mort cellulaire, quand on
raccourcit trop nos télomères c’est un signe de vieillesse et c’est une raison pour éliminer une
cellule qui est devenue trop vieille du fait de réplications qui n’ont pas été parfaites au niveau
télomérique.
En effet, les histones possèdent des lysines (K) pouvant subir des modifications, notamment
des acétylations, grâce à des histones acétylases (HAT). Ces acétylations vont en quelque
sorte ouvrir la chromatine, et permettre le passage de l’hétérochromatine inactive et peu
acétylée à l’euchromatine active et richement acétylée, ce qui va augmenter l’accessibilité à
des facteurs de transcription et conduire à une régulation positive de l’expression des gènes
(les gènes sont plutôt éteints sous la forme hétérochromatine, et plutôt actifs sous la forme
euchromatine).
Le phénomène inverse consiste au passage de l’euchromatine, avec des histones richement
acétylées et une transcription active, qui par désacétylation des histones grâce aux histones
désacétylases (HDAC) va être fermée et conduire à une hétérochromatine inactive (zones du
génome pas ou très peu transcrites donc traduites), donc une régulation négative de
l’expression des gènes.
20
Ce schéma résume bien :
21
modulation de cette expression passe donc par le compactage et l’accessibilité de la chromatine.
La chromatine joue donc un rôle important sur l’expression des gènes !
L’unité de base d’un ADN transcrit est le gène, c’est-à-dire une séquence d’acide
désoxyribonucléique (ADN) qui code un ARN fonctionnel (pas nécessairement une protéine).
22
En conclusion :
Les acides nucléiques sont les supports de l’information génétique des individus.
Les acides nucléiques sont des polymères de nucléotides : base + ribose + phosphate.
● ADN : désoxyribose et bases ATGC, structure double hélice, molécule solide, stable
● ARN : ribose et bases AUGC, simple hélice/brin mais structures secondaires par
appariements intra-brins, molécule plus fragile, différents types d’ARN, les ARN
peuvent avoir des capacités catalytiques (ex : ribozymes = ARN avec des capacités de
catalyse enzymatique)
Grâce à l’appariement spécifique des bases, l’ADN se dissocie et se reforme à l’identique :
les deux brins sont complémentaires l’un de l’autre, ils peuvent se dissocier par rupture des
liaisons hydrogènes qui lient ensemble les bases, mais si on retrouve les bonnes conditions,
cela se réassocie comme c’était à l’origine. C’est ce qui fait que l’on peut répliquer les
molécules d’ADN, en prendre une comme matrice pour en resynthétiser une deuxième qui est
parfaitement la copie complémentaire de la première, de la matrice.
● Base de la transmission de l’information génétique
● Base de la plupart des principes de biologie moléculaire
Le génome est l’ensemble des séquences d’ADN et ils sont compactés, notamment grâce aux
octamères d’histone :
● Structures de chromatine avec des zones accessibles (euchromatine) et des zones
inaccessibles (hétérochromatine)
● Accessibilité à l’ADN variable : modulation de l’expression des gènes
● Unité de base de l’ADN transcrit = le gène (une zone promotrice et des parties qui vont
être transcrites puis maturées puis traduites)
● Un gène ne code pas forcément une protéine (importance des ARN non codants, ARNr,
ARNt, qui sont transcrits mais non traduits)
Les P1dispensables :
Rappel : cette page reprend les points à maîtriser absolument, elle se base sur les points sur
lesquels le Pr Lehmann-Che a particulièrement insisté, mais elle ne constitue en rien une liste
exhaustive des attendus de l’examen !
Éléments de base : ce sont les bases, il y en a 4, elles font partie de deux grandes familles,
purines et pyrimidines, et elles s’associent de façon spécifique, une guanine en face d’une
cytosine, une adénine en face d’une thymine, tout ça est maintenu grâce à des liaisons faibles
qui structurent l’ensemble, mais que l’on peut détruire de façon réversible, et spontanément ça
se réassociera en guanine-cytosine et adénine-thymine.
ADN : on a un pas de l’hélice qui est vertical, autour duquel tourne le squelette ose-sucre, avec
tout exposé vers l’extérieur, et puis au centre, on trouve les deux bases complémentaires qui se
font face, planes, et qui forment les marches de l’escalier. L’ADN a pour propriété cruciale de
se dénaturer mais de façon réversible, et être capable de façon spontanée de reformer l’hélice
23
telle qu’elle était à l’origine, ce qui fait qu’on peut recopier, en utilisant un brin matrice, une
molécule d’ADN parfaitement à l’identique.
ARN : l’ARN est simple brin, mais il peut y avoir, comme pour l’ADN, une complémentarité
des bases, avec possibilité de repliement pour faire des structures secondaires, possibilité
d’appariement (C avec G, A avec U).
Génome : le génome humain est de taille extrêmement importante (3.10^9 pb), cela représente
un nombre très important de nucléotides, il faut donc essayer de comprimer tout ça pour le faire
rentrer dans notre noyau, et il faut des astuces pour pouvoir le recopier de façon efficace, pour
cela il faut donc plusieurs origines de réplication par chromosomes.
L’entité de base du génome est le gène, et la densité des gènes est non homogène sur l’ensemble
du génome.
Complexes SWI/SNF : ils sont donc extrêmement importants, ils permettent le remodelage de
la chromatine, pour la rendre accessible (activation), mais parfois aussi la rendre moins
accessible (répression).
Unité de base de l’ADN transcrit : c’est le gène, qui contient une zone promotrice et une zone
exons-introns, qui vont donner lieu à de la transcription puis de la maturation, l’ARNm mature
qui sera ensuite traduit.
24
Cette fiche de cours a été réalisé et actualisé par :