Académique Documents
Professionnel Documents
Culture Documents
Intéressons-nous plus particulièrement à la transcription des gènes codant pour les chaînes
polypeptidiques chez les eucaryotes. Leur transcription se déroule en deux étapes : formation
d’un ARN prémessager puis maturation de cet ARNprémessager pour former un ou plusieurs
ARN messagers.
2.1.1. Le promoteur
Le promoteur correspond à une région non transcrite de l’ADN, généralement juste en amont
du début de la région transcrite, dont la séquence permet le recrutement de l’ARNpol II.
Certaines séquences du promoteur (surnommées “boites”) ont une importance particulière
dans ce processus, essentiellement parce que ces séquences sont reconnues spécifiquement
par différentes protéines appartenant au complexe d’initiation.
la « boite TATA » riche en thymine et adénine, la plus importante, est située vers -25 à -30
nucléotides du site de démarrage de la transcription (noté +1) ; des éléments proximaux :
la « boîte CAAT » (facultative), contenant de la cytosine, est située vers -120 à -80
nucléotides du site de démarrage de la transcription.
la « boîte GC » (facultative également), riche en guanine et cytosine, peut être présente entre
la boîte CAAT et la boîte TATA.
Signalons que si ces séquences sont souvent bien conservées, une variabilité non négligeable
peut également être observée. Ainsi, il existe des promoteurs sans « boîte TATA »
Contrairement à ce qui se passe chez les procaryotes, l’ARNpol II des eucaryotes ne reconnaît
pas seul le promoteur proximal. Elle effectue ce travail en compagnie de nombreux co-
facteurs protéiques qui se recrutent les uns les autres et qui forment avec elle un complexe
d’initiation. Ces facteurs sont notés TFIIA, TFIIB, etc. pour Transcription Factor for RNA
polymerase II. Ils correspondent aux facteurs généraux de la transcription, car ils s’assemblent
sur tous les promoteurs utilisés par l’ARNpol II. La séquence d’assemblage du complexe
d’initiation est décrite sur la figure 1.
La TBP est la première protéine qui reconnaît une séquence spécifique de l'ADN initiatrice de
la transcription (la boite TATA). Le facteur TFIIB semble impliqué dans la sélection précise
du site d'initiation (nucléotide à partir duquel se déroule la transcription). Le facteur TFIIH
comporte plusieurs activités enzymatiques dont une activité hélicase permettant l'ouverture de
la double hélice d'ADN au niveau du promoteur, et une activité kinase responsable de la
phosphorylation de la queue C-terminale de l'ARN polymérase II. Cette phosphorylation
provoque une modification de la structure tridimensionnelle de l'ARN polymérase qui
entraîne la dissociation du complexe d'initiation et le début de la transcription.
TFII = Transcription Factor for RNApolymerase II (facteurs généraux de la transcription pour
l'ARN polymérase II).
TBP = TATA box-Binding Protein (protéine de liaison à la boite TATA).
Le complexe d’initiation composé de l’ARNpol II et des différents TFII est suffisant pour
obtenir une activité transcriptionnelle in vitro mais à très faible taux. L’augmentation de cette
activité basale (ou sa répression) est sous la dépendance de facteurs spécifiques qui vont
interagir avec le complexe d’initiation. Ces protéines activatrices ou inhibitrices (éléments
trans-régulateurs) se lient à des promoteurs distaux spécifiques (séquences cis-régulatrices) de
l’ADN, appelées amplificateurs (enhancers) lorsqu’ils recrutent des cofacteurs activateurs, ou
silenceurs (silencers) lorsqu’ils recrutent des cofacteurs inhibiteurs. Ces promoteurs distaux
peuvent être situés à des milliers de nucléotides du promoteur proximal. Malgré la distance
qui sépare les promoteurs proximaux des promoteurs distaux, ces derniers agissent sur le
promoteur proximal par le jeu de courbures de l’ADN, des facteurs de transcription et du
médiateur qui maintient liés tous ces acteurs ( fig. 2).
Les amplificateurs (enhancers) sont des séquences situées parfois à plusieurs milliers de
nucléotides d'un promoteur et qui, par un jeu d'interactions protéiques, stabilisent le complexe
d'initiation, favorisant ainsi la transcription. Ces interactions sont rendues possibles par la
courbure de l'ADN qui rapproche des éléments situés à de grandes distances les uns de autres.
Cette activation est spécifique du gène et utilise une multitude de facteurs de transcription
spécifiques (les protéines activatrices) qui agissent généralement sous forme dimérique.
Une répression spécifique peut agir selon le même type de modalité.
2.2. L’élongation
L’ARN pol II est équipée de facteurs protéiques d’élongation qui facilitent sa progression au
travers d’une chromatine dont ils relâchent la structure (c’est l’un d’entre eux qui est mis hors
d’état d’agir par le poison de l’amanite phalloïde…). Un ARNpré-messager complémentaire
du brin matrice de l’ADN (brin antisens), donc identique au brin codant de l’ADN (brin sens),
aux riboses et uraciles près, commence à être synthétisé selon la direction 5'-3' (voir fig. 3).
L'ARN polymérase lit le brin patron (ou brin anti-sens), qui est complémentaire du brin
codant (ou brin sens), depuis son extrémité 3' vers son extrémité 5'. Le brin d'ARN néo-
synthétisé est donc identique au brin codant d'ADN, aux uraciles et riboses près.
2.3. La terminaison
L’ARN pol II est également équipée de facteurs protéiques de terminaison. Elle reconnaît
ainsi un ou plusieurs signaux de terminaison portés par le brin progressivement parcouru et
qui annoncent la fin de la transcription sur le brin d’ADN matrice (TTATTT par exemple,
parfois aussi plus en aval ATACAAC…). Elle arrête bientôt son travail de transcription et
libère l’ARNpm qu’elle vient d’assembler.
Le transcrit primaire n’est pas utilisé tel quel pour la synthèse protéique (la traduction). Il doit
subir des modifications qui répondent à plusieurs impératifs (augmentation de la demi-vie,
modification de la séquence). Toutes ces modifications sont réalisées au fur et à mesure de la
progression de la synthèse du préARNm dans le nucléoplasme. Il existe trois grands types de
modification, catalysées chacune par des enzymes de nature protéique ou ribonucléique.
Elle a lieu dès le début de la transcription avant que la chaîne ne compte plus de 30
nucléotides. Elle consiste en l’ajout d’un nucléotide à guanine sur l’extrémité 5' de l’ARN
suivi de sa méthylation sur l’azote 7 de la base, ainsi que de la méthylation en 2' du ribose du
premier ou des deux premiers nucléotides du transcrit primaire. La particularité de cet ajout
consiste dans le type de liaison mis en jeu (voir fig. 4). Il en résulte que l’extrémité 5' de
l’ARNm n’est pas porteuse des trois acides phosphoriques libres habituels, mais d’un GMP,
ce qui limite la réactivité de cette extrémité et sa reconnaissance par les exonucléases
(protection contre la dégradation). Cet ensemble sert de coiffe protectrice à l’extrémité 5' de
l’ARNm. Elle est également nécessaire à l’exportation de l’ARNm vers le cytoplasme et à la
liaison de ce dernier avec la petite sous-unité du ribosome, lors de l’étape d’initiation de la
traduction.
La coiffe se caractérise par l'ajout d'un nucléotide à guanine à l'extrémité 5' du brin d'ARN.
Ce nucléotide à guanine est relié à la chaîne nucléotidique par une liaison inhabituelle : au
lieu d'être reliés par une liaison ester-phosphorique entre le groupement OH porté par le
carbone 3' du ribose du nucléotide à guanine et l'acide phosphorique alpha du premier
nucléotide de l'ARN natif, les deux nucléotides sont reliés par une liaison anhydride d'acide
entre les acides phosphoriques des deux nucléotides.
Par la suite, le cycle imidazole de la guanine terminale est méthylé sur son azote 7.
Par ailleurs, le ribose du premier nucléotide de l'ARN natif est méthylé sur l'oxygène porté par
le carbone 2'. Ce peut également être le cas du nucléotide suivant.
3.2. L’excision-épissage
Chez les eucaryotes, les archéobactéries et les cyanobactéries, les gènes sont morcelés :
constitués d’une alternance d’exons (parties codantes du gène) et d’introns (parties non
codantes, bornées par des séquences de bases spécifiques : 5'GU et 3'AG), ils sont d’abord
intégralement recopiés dans l’ARNpm, puis subissent une opération d’excision des introns
(ainsi que celle parfois de petits morceaux d’exons) suivie d’un épissage (splicing), c’est-à-
dire la réunion bout à bout des exons restants qui constituent l’ARNm. Ce remaniement se
déroule au fur et à mesure de la progression de la transcription.
L’excision des introns s’opère par l’entremise d’une formation dite « en lasso » (fig. 5 et 6).
L'excision-épissage est réalisée par réaction d'un nucléotide à adénine (A) situé dans l'intron
avec un nucléotide à guanine situé en 5' de l'intron. Cela entraîne la séparation de l'intron
d'avec l'exon 1 (situé en amont) et la formation d'une structure en lasso interne à l'intron.
Ensuite, l'extrémité 3' de l'exon 1 réagit avec l'extrémité 5' de l'exon 2 permettant l'épissage
des deux exons et la libération du lasso qui sera dégradé par des ribonucléase
Le splicéosome fait appel à des facteurs spécifiques : ribonucléoprotéines contenant des petits
ARN (snRNP), ribozymes (ARN ayant des propriétés catalytiques), des enzymes spécifiques
(maturases)... La structure secondaire du transcrit met en contact trois séquences de l'intron :
la séquence du début de l'intron (extrémité 5'-GU ou site donneur), la séquence de la fin de
l'intron (extrémité 3'-AG ou site accepteur) et un nucléotide à adénine (A du branchement)
situé 40 nucléotides avant le site receveur.
Mais l’épissage n’est pas seulement constitutif : il existe également des épissages alternatifs,
dans lesquels l’élimination des introns (ou des portions d’exons) peut faire se lier entre eux
des exons différents. C’est ce mécanisme qui démultiplie les capacités codantes d’un gène
(voir un exemple d’épissage alternatif dans la fig. 7)
À partir du même préARNm peuvent être obtenus deux ARNm matures différents codant
pour deux isoformes de la troponine, une molécule impliquée dans la structure des
myofibrilles (voir l'article La contraction musculaire).
La PAP va alors ajouter environ 200 nucléotides, une poly(A) binding protein II (PABP2) qui
interagit avec la PAP se chargeant d’activer l’enzyme et de contrôler la longueur de cette
queue poly(A). Il est intéressant de noter que cette polymérase n’utilise pas de matrice ADN
pour créer cette séquence poly(A). La queue Poly(A) n’est donc pas codée par le génome.
Notons que ce n’est pas un exemple isolé, d’autres mécanismes comme l’éditing ou la
modification enzymatique de certaines bases (cytosine en uracile par exemple) étant encore
beaucoup plus intrigants. Cette queue poly(A) confère de la stabilité au futur ARNm et se
perd au fur et à mesure qu’il est traduit.
Traduction de l’ARNm
Le code génétique
L'information génétique impose les caractéristiques des protéines constitutives de chaque
organisme vivant, elles-mêmes responsables des différents phénotypes.
Un cheval construit son corps à partir des matériaux qu'il trouve dans l'herbe ou dans les
grains de céréales ; pourtant il ne ressemble ni aux végétaux qu'il a mangés, ni aux autres
animaux qui consomment des végétaux.
Quelle est la relation entre l'ordre d'enchaînement des nucléotides des gènes contenus dans
l'ADN et l'ordre d'association des acides aminés dans les chaînes polypeptidiques ? Pourquoi
le code génétique souligne-t-il l'unité du monde vivant ?
L'ordre dans lequel sont placés les nucléotides du gène dans l'ADN détermine l'ordre dans
lequel les acides aminés s'enchaînent dans la molécule polypeptidique correspondante.
Chaque acide aminé est codé par un ensemble précis de nucléotides.
Il existe seulement 4 nucléotides différents : A, T, C, G dans l'ADN (A, U, C, G dans l'ARN),
mais on trouve 20 acides aminés distincts dans le monde vivant.
b. La notion de codon
Si chaque nucléotide désignait un acide aminé précis, il n'y aurait que 4 acides aminés
identifiés par le système de codage.
Si une association de deux nucléotides désignait un acide aminé, il n'y aurait que 4 fois 4, soit
16 combinaisons possibles.
Des expériences utilisant des polynucléotides artificiels (ARN) de composition connue ont
montré que le code génétique était fondé sur la correspondance entre une succession de trois
nucléotides et un acide aminé. Chaque triplet de nucléotide codant pour un acide aminé précis
est appelé codon. Il existe 4 fois 4 fois 4, c'est-à-dire 64 codons différents.
2. Les particularités du code génétique
Le code génétique est universel : la signification des codons est la même dans toutes les
cellules de tous les organismes du monde vivant.
Le code génétique n'est pas ambigu : un codon ne peut coder qu'un seul acide aminé bien
précis parmi les vingt qui existent.
Le code génétique est dégénéré (ou redondant) : cela signifie qu'il peut exister plusieurs
codons pour désigner un même acide aminé. Il y a trois codons « non sens » ou « codons
stop » qui signalent l'arrêt de la synthèse protéique. Il reste 61 codons qui désignent
seulement 20 acides aminés. Cela permet de limiter les effets des mutations et des erreurs de
transcription de l'ARN-polymérase.
L'essentiel
Le code génétique permet de traduire un message à quatre caractères (les quatre nucléotides
de l'ADN ou de l'ARN) en un message à vingt caractères (les vingt acides aminés constitutifs
des protéines). Il est universel et non ambigu. Il est dégénéré, ce qui limite l'effet des
mutations.
Il ne faut pas confondre le code génétique et l'information génétique. Tous les êtres
vivants ont le même code génétique, mais chacun possède une information génétique
différente.
Traduction de l’ARNm
Introduction
La traduction nécessite énormément d'énergie pour la cellule. Par exemple, E.coli utilise
90% de son énergie pour la traduction !
1) La matrice (l'ARNm)
une région leader en 5' (appelée "capping" chez les eucaryotes) : elle est non
codante, donc non traduite.
un codon initiateur AUG : c'est le premier acide aminé (donc toujours
Methionine)
une région codante (suite de codons)
un codon non-sens (ou codon STOP) : détermine la fin de la traduction
une queue en 3' (polyadénylée chez les eucaryotes) : elle est non codante, donc
non traduite
Rôle : assurer le relai entre les codons de l'ARNm et les acides aminés spécifiés par ces
codons. Un ARNt doit donc avoir une double fonction de reconnaissance : pour le codon
d'une part, et de l'acide aminé correspondant à ce codon d'autre part. Ils possèdent une
organisation structurale très particulière : il en existe une 50aine différents, certains
reconnaissant plusieurs codons. Leur structure en feuille de trèfle est dûe à des
autoappareillements au sein de la molécule .Ils sont constitués de plusieurs parties :
Par convention, les différents types d'ARNt sont nommés en faisant référence à l'acide
aminé qu'ils reconnaissent.
Exemple :
Non chargés
o Leucine = ARNtLeu
o Asparagine = ARNtAsp
Chargés
o Leu - ARNtLeu
o Asp - ARNtAsp
III) Les étapes de la traduction
l'initiation
l'élongation
la terminaison
1) L'initiation de la traduction
Chez les procaryotes, la petite sous unité se place sur une séquence particulière : la
séquence de Shine et Dalgarno (séquence 16S et séquence S et D sont
complémentaires).Chez les eucaryotes, il n'y a pas de séquence comparable. On pense
que c'est la séquence de la coiffe qui est responsable de l'initiation.
2. Positionnement du 1er ARNt sur la petite sous unité ribosomique
2) La phase d'élongation
3) La phase de terminaison
Types de mutation
On peut distinguer plusieurs types de mutations :
Une mutation est dite sexuelle lorsqu'elle concerne un chromosome sexuel, par
exemple X/Y chez les mammifères.
Une mutation est dite autosomique lorsqu'elle touche un autre chromosome que
les chromosomes sexuels.
N.B : Ces deux types de mutations peuvent être ponctuels ou chromosomiques.
Mutations ponctuelles
Définition : Une mutation est dite ponctuelle quand elle touche un ou plusieurs
nucléotides d'un même gène.
1. Mutations par substitution
Mutations faux sens : Cette mutation ponctuelle se traduit par le
remplacement d'un nucléotide par un autre. Dans certains cas, cette
modification entraîne une modification de l'acide aminé codé, laquelle peut avoir ou
non une répercussion sur la fonction de la protéine produite par le gène, dans le cas
d'un gène codant, ou sur l'affinité pour un facteur de transcription, dans le cas d'une
zone promotrice de l'ADN.
Transition : On parle de mutation de transition lorsqu’il y a substitution
d’une base purique à une autre base purique (ou d’une base pyrimidique à une
autre base pyrimidique).
Transversion : une mutation de transversion est une mutation causée par le
remplacement d’une base purique par une base pyrimidique (ou d’une base
pyrimidique par une base purique).
1
Mutations silencieuses : Ce sont des mutations qui ne modifient pas la séquence
d'une protéine, à cause de la redondance du code génétique (le nouveau triplet code le
même acide aminé que le triplet original), ou parce qu'elle touche une région non codante
de l'ADN, ou un intron. Mais cette mutation peut néanmoins avoir de graves
conséquences sur le phénotype. En effet, le changement d'un seul nucléotide peut changer
le site donneur d'épissage, sans pour autant changer la séquence en acides aminés. Cela
peut donc se traduire par une délétion entière d'un exon de la séquence peptidique, l'exon
n'étant pas reconnu car le site d'épissage a été muté. Une mutation synonyme désigne une
mutation silencieuse qui touche un exon, sans changer la séquence de la protéine.
Mutation faible : cette mutation donne une protéine qui conserve au moins une
partie de son activité.
Mutations hypothétique bénéfique : le remplacement d’un acide aminé par
un autre, produit une protéine avec une activité biologique augmentée.
N.B : Il n’est pas possible de prévoir quels sont les remplacements des acides aminés
qui sont avantageux.
2. Insertions et délétions
Les insertions et les délétions sont des mutations décalantes, et sont les deux types
de mutations dites indel ou frame-shift. Une addition ou une suppression de
nucléotides non multiple de 3 provoquera un changement de cadre de lecture
du code génétique.
Au moment de la traduction, cela générera le plus souvent une protéine tronquée par
l'apparition d'un codon-stop prématuré.
N.B : Indel est utilisé en génétique et en bio-informatique pour désigner une
insertion ou une délétion dans une séquence biologique (acide nucléique ou
protéine) par rapport à une séquence de référence
Mutations chromosomiques
Cela concerne un grand nombre de nucléotides dans l'ADN de telle sorte que la
mutation est observable lorsqu'on fait un caryotype : duplication, translocation,
inversion, délétion, insertion.
Il peut s'agir aussi d'une perte ou d'un gain de
chromosomes: trisomie, monosomie, aneuploïdie.
Mutations dynamiques
Ces mutations évoluent d'une génération à l'autre, elles correspondent à des
répétitions importantes de certains triplets au niveau de l'ADN (CAG et GGG).
Elles sont rencontrées dans certaines maladies génétiques.
Les mutations naturelles sont aléatoires, mais leur fréquence d'apparition peut être augmentée
par des mutagènes, parfois qualifiés d’agents ou de facteurs mutagènes. Ces agents peuvent
être physiques (rayonnements ionisants) ou chimiques
Les radiations ultraviolettes (UV) peuvent affecter Il existe un système de réparation de l'ADN qui corrige les défauts
l'ADN des cellules en entraînant, par exemple, la d'appariement.
formation d'une liaison entre 2 thymines successives.
Ce système est constitué de plusieurs protéines (une trentaine chez
Deux thymines liées par une liaison covalente l'Homme) qui sont des enzymes.
forment alors un dimère thymine. Ces protéines ont une forme 3D qui leur permet de se fixer à
l'ADN.
Au niveau d'un dimère Thymine, la disparition des
liaisons Hydrogène provoque un défaut La réparation se déroule en 5 étapes.
d'appariement des deux brins et ainsi la déformation
de l'ADN.
Mutations
Si la réparation de l'ADN n'est pas effectuée, le défaut d'appariement entraînera la mise en place d'une autre base azotée,
ce qui créera une mutation.
Xeroderma pigmentosum
Décrit en 1870 par Moritz Kaposi, le xeroderma pigmentosum est une maladie
d'origine génétique rare. Elle se caractérise par une sensibilité excessive de
la peau au soleil, des troubles oculaires et un risque très fortement multiplié de
développer un cancer de la peau ou des yeux. Concrètement, les mécanismes
de réparation de l'ADN sont inopérants et n'arrivent pas à réparer notamment
les dimères de thymine. Plus précisément, ces patients sont déficients dans l'un des
gènes codant les protéines participant au mécanisme de réparation par excision de
nucléotides. Les mutations dues à l'environnement (surtout les ultraviolets)
s'accumulent donc au cours des mitoses successives.
Le xeroderma pigmentosum (XP) touche les deux sexes. En fonction de sa forme et de
l'âge auquel il se déclare, il réduit significativement l'espérance de vie du malade.
Il n'existe à l'heure actuelle aucun traitement. On ne peut que limiter les symptômes en
appliquant des mesures préventives drastiques et très onéreuses.
Les UV et l’ADN
Les lésions de l'ADN sous l'action des UV
Figure 1
Figure 2
La figure 1 renseigne sur les radiations absorbées par L’ADN. La figure 2 renseigne
sur les radiations qui causent des lésions dans la molécule d'ADN.
Les principales cibles sont les bases thymine et cytosine. Lorsqu’elles sont adjacentes
dans la double hélice, les photons absorbés créent une liaison covalente entre deux
thymines, deux cytosines ou entre une thymine et une cytosine. La formation de ces
dimères rompt les liaisons entre bases complémentaires des deux brins de la molécule
d’ADN ce qui crée une distorsion dans la molécule .
Figure 4
Source : En outre, des études ont montré qu’à la suite d’une exposition aux UV, les
dommages causés à l’ADN (formation de dimères de thymine) étaient présents dans
toutes les couches cellulaires de l’épiderme et dans des cellules du derme chez les
personnes à peau blanche. Chez les personnes à peau noire, elles sont restreintes aux
couches supérieures de l’épiderme.