Vous êtes sur la page 1sur 47

Evolution 

moléculaire: aspects choisis
Plasticité du génome: chromosomes et gènes

Plasticité et évolution des protéines

Evolution dirigée: exemples d'ingénierie du code génétique
Sur les échelles de temps courtes, la diversité génétique 
provient du brassage de chromosomes via reproduction sexuée

Combien avons­nous 
d'ancêtres au temps de 
Charlemagne?
Un monde sans évolution: équilibre de Hardy­Weinberg
Organismes diploides, pas de mutations ni sélection, population infinie, “panmictique”

       Femelle
A a allèle
p q fréquence

a   q Aa aa
Ces valeurs 
pq q2 Génotypes de la  sont inchangées 
Mâle

descendance et  au fil des 
A  p AA Aa leurs fréquences générations
p2 pq

En effet: fréquences dans les gamètes filles: A: p' = p2 + pq = p   a: q' = 1­p' = q

Fréquences inchangées (normal: pool de gamètes constant). Idem pour n>2 allèles

La variabilité génétique de la population reste inchangée.
Brassage de fragments chromosomaux: la synténie
Notion de “synténie”
= sur le même ruban

Synténie Homo sapiens – Mus musculus

100 Ma
Brassage de fragments chromosomaux: la synténie
Notion de “synténie”
= sur le même ruban

Chromosome II humain

Chromosomes homologues de chimpanzee

“Translocations chromosomales”

6 Ma Weinberg et al, Chrom Res (1994) 2:405
Synténie Homo sapiens – Poisson zèbre

Chromosomes humains
Des accidents cellulaires ou chromosomiques majeurs possibles: 
duplications, divisions interrompues

Duplication complète du génome de levure

Anomalies des chromosomes sexuels, 
trisomie

Nature (2004) 617:428
Recombinaison homologue (ou non)

Chromosomes 
méiotiques
(métaphase)

Chen et al, Nature Reviews 
Genetics 8, 762­775 (2007)
Co­occurrence de gènes: phylogénie
La présence/absence/localisation de gènes est caractéristique d'une espèce

Exemple: protéines présentes dans les 3 “domaines” du vivant, 
eucaryotes, eubactéries, archées: issues de LUCA?
Nombre de gènes
Protéines ribosomales 30
Traduction, Aminoacyl ARNt synthétases 15
fonctions associées Facteurs de traduction 6
Enzymes de mofification de l'ARN et des protéines 3
Consituants de la Signal Recognition Particle (sécrétion) 3
Protéine chaperone/protéase 1
Transcription Sous­unités de l'ARN polymérase 3
Réplication Facteurs de processivité des ADN polymérases 3
Réparation  Topoisomérase IA, recombinase, Rad50/Mre11 4
Métabolisme ATP synthétases 2
TOTAL 70
Co­occurrence de gènes: prédiction de fonction

Soit les gènes d'un certain sous­ensemble 
sont tous présents dans un génome,
soit ils sont tous absents : on ne trouve pas 
l'un sans les autres → lien fonctionnel

Inférer gènes liés fonctionnellement.

Exemple: reconstruction de voies 
métaboliques ou de signalisation.

De plus: la proximité génomique est 
corrélée à l'interaction physique entre les 
protéines.

Pellegrini (2001) Curr Opin Chem Biol
Éléments génétiques mobiles

La plupart des séquences “répétées” de notre 
génome proviennent d'éléments génétiques mobiles

Transposons (Barbara McClintock, prix Nobel 1983)

Retrovirus     (David Baltimore, découverte de la transcriptase inverse)

INterspersed Elements: SINE/LINE
VIH­1: un rétrovirus
­génome ARNsb diploïde
­copié par une transcriptase inverse (RT)
VIH­1: un rétrovirus
­génome ARNsb diploïde
­certains gènes sont épissés 
­recouvrement partiel de gènes
­copié par une transcriptase inverse (RT)
­la RT utilise comme amorce une ARNt
­présence dans la particule virale de protéines et 
ARN nécessaires pour démarrer son cycle de vie
­la RT est peu fidèle: mutations
­elle a trois activités: ADN polymérase, ARN 
polymérase, Rnase

http://www.hiv.lanl.gov    HIV sequence database
Transcription inverse: modèle naïf
­génome ARNsb diploïde
­copié par une transcriptase inverse (RT)
­la RT utilise comme amorce une ARNt
­la RT a trois activités:
ARN polymérase, ADN polymérase, RNase

RT
3' ARN génomique viral
ARNt(Lys)
3' ARN génomique viral
ADN complémentaire

dégradation de l'ARN
ADN

ADN double brin

Quel est le problème posé par ce modèle?
Un élément génétique mobile doit soit être toujours inséré 
près d'un promoteur endogène, soit pouvoir emporter son 
propre promoteur lors de sa transcription: comment faire?

3 regions upstream of the START site allow RNA polymerase 2 
binding and the initiation of transcription of an ORF (open reading 
frame): they form the promoter.

“­10”
“­35” sequence Purine
sequence A
Spectator strand
AATxxxxxxxGxx
xxxxTTGACAxxxxxxxxxxxxxxxxxTAT xxxxxxx
xxxxAACTGTxxxxxxxxxxxxxxxxxATA xxxxxxx
TTAxxxxxxxTxx
C Transcribed strand

Start of
Local fusion transcription
Of the DNA
Transcription inverse: modèle détaillé (Y Gaudin, Bio451, Fig 14.14)

U3 contient le promoteur. ARN
Notez la répétition de R. viral
L'ARNt sert d'amorce pour la RT

Le brin ADN­ (rouge) se dissocie et se 
réassocie côté 3' via le 2ème R (ou 
s'associe à l'autre ARN viral)

Extension ADN­ et digestion ARN+. 
PP = segment polypurine résistant, 
non­digéré à ce stade

PP sert d'amorce pour synthèse du brin 
ADN+ bleu, puis est digéré

Circularisation du brin rouge via 
PB:PB'; extension du brin bleu, 
jusqu'au bout du brin rouge
ADNdb
Après intégration dans le génome hôte, 
notez la position et le dédoublement des 
promoteurs (U3) et du LTR = “Long 
Terminal Repeat”
Structure détaillée du “Long Terminal Repeat”
Site
d'initiation
Site d'intégration (AA)
Promoteur Future coiffe
Séquence répétée Séquence répétée

– TATAAA – 
U3 R U5
– AATAAA – 
Site
d'intégration
poly­A (TT)
Signal de
polyadénylation Site de terminaison

LTR gag      pol       env
LTR

cf http://www.hiv.lanl.gov  
Que se passe­t­il si on 
perd l'activité env? 

Wikimedia Commons
Des éléments génétiques mobiles: les transposons 
Ci­dessous: un retrotransposon: Presqu'un rétrovirus; pas de gène env

gag        pol
LTR LTR

Plusieurs types; eg LINEs (Long INterspersed repetitive Elements):
­6­8 kbases
­produisent des copies d'eux­mêmes: expansion du génome
­500,000 exemplaires dans notre génome: 17% du génome
SINES (Short etc): 1,500,000 dans notre génome (11% du génome)
Transposons = 50% du génome du maïs
Mécanisme copier/coller ou couper/coller (←transposase)
Nombreuses applications en biotechnologie
Effets biologiques, eg via leur 2ème promoteur (LTR de droite): oncogènes

Ne pas confondre avec les séquences mini­ ou microsatellites
Un exemple de “Small INterspersed Element”: les séquences Alu
Un SINE de ~300 nt, qui descend d'un petit ARN ribosomal: 7SL
L'élément répété le plus abondant de notre génome (106 copies = 11%!)
Transcrit par l'ARN Polymérase III, qui utilise un promoteur interne
Ne code pour aucune protéine; utilise les protéines cellulaires

284 nt

Énorme expansion 
humaine récente; 
aujourd'hui inactif

Nature (2011) 
469:529
nématode drosophile humain
Pseudogènes  Séquences “répétées”
LINE/SINE 0.4% 5% 28%

Séquences 0% 6% 8% Éléments “dispersés” 
rétrovirales ou “interspersed”; 
origine virale
Transposons 5% 4% 3%

Total 7% 15% 39% A Bernot, Analyse de Génomes (2001)

ADN satellite dans le centromère
répétition d'une séquence courte (10­100 nt)

Minisatellites répétition d'une séquence courte (10­100 nt); ~1 kb chacun
~1000 dans notre génome; souvent télomériques

Microsatellites  motif de 1­10 nt, répété 10­100 fois; 
répartition assez uniforme → marqueurs/carte physique
polymorphisme (nb de répétitions)→génotypage, phylogénie
nématode drosophile humain
Séquences “répétées”
LINE/SINE 0.4% 5% 28%

Séquences 0% 6% 7%
rétrovirales

Transposons 5% 4% 3%

nombre
Nombre de transposons

Présence de transposons 
fraction du
génome à partir d'une certaine 
taille du génome

Taille du génome (Mb)
nématode drosophile humain
Séquences “répétées”
LINE/SINE 0.4% 5% 28%

Séquences 0% 6% 8%
rétrovirales

Transposons 5% 4% 3%
Présence/taille d'introns
Taille 
Nombre de transposons

nombre
moyenne 
(nt)

nombre 
fraction du moyen 
génome par gène

Taille du génome (Mb) Lynch, Science '03
Des accidents cellulaires ou chromosomiques majeurs possibles: 
duplications, divisions interrompues, phagocytose/endosymbiose

Duplication complète du génome de levure

Anomalies des chromosomes sexuels, 
trisomie

la mitochondrie:
endosymbiose → 
“transfert” de gènes

Nature (2004) 617:428
Arbre de la vie, ou cercle? 
Le premier eucaryote est peut­être apparu par
fusion/symbiose d'une eubactérie et d'une archébactérie.

eucaryote
eubactérie

Ancêtre
archébactérie commun

Ernst Mayr, What Evolution Is (2001) Fig 3.2
Arbre de la vie: une vue moderne
La structure hiérarchique de l'arbre
modélise les spéciations successives.
Evolution moléculaire: aspects choisis
Plasticité du génome: chromosomes et gènes

Plasticité et évolution des protéines

Evolution dirigée: l'exemple des aminoacyl­ARNt synthétases
Des peptides aléatoires peuvent se replier et être fonctionnels

Parmi une librairie de 
séquences aléatoires, 
de longueur ~80 aa, et 
principalement 
composées de R, Q, L, 
5% se replient 
(faiblement);
PNAS (1994) 91:2146

Parmi une librairie de 
1013 séquences, de 
longueur ~100 aa,
~10 fixent une protéine: 
la streptavidine;
Szostak et coll
PNAS (2001) 98:3750
Des peptides aléatoires peuvent se replier et être fonctionnels

Parmi une librairie de 
séquences aléatoires, 
de longueur ~80 aa, et 
principalement 
composées de R, Q, L, 
5% se replient 
(faiblement);
PNAS (1994) 91:2146

Une protéine artificielle
Top7

Parmi une librairie de 
1013 séquences, de 
longueur ~100 aa,
~10 fixent une protéine: 
la streptavidine;
Szostak et coll
PNAS (2001) 98:3750
Science (2003) 302:1364
Des peptides simples peuvent se replier et être fonctionnels

rms Repliement d'homopolypeptides:
génération in silico de conformations compactes qui 
établissent de nombreuses liaisons hydrogènes:
83% sont proches d'une structure de la PDB
Inversement, les structures de la PDB ont généralement 
couverture un homologue structurale chez ces homopolypetides.

La plupart des domaines naturels semblent connus.
Les plis naturels semblent émerger de considérations 
simples de compacité, hydrophobicité, et satisfaction des 
liaisons hydrogènes.                  PNAS (2006) 103:2065
L'espace des plis est discret et fini

Classe 

Classe 
Classe 

100 superfamilles
= 60% des domaines
Le domaine comme unité de l'évolution 

“SH3” domain: 
Aspartyl­ARNt found in >150 
synthétase proteins of 
d'E coli known 
structure. 23 in 
yeast alone.

Aspartyl­ARNt
synthétase
de levure
Tyrosine kinase c­Src
Un mécanisme pour ajouter/enlever un motif, gène, ou domaine

deux
chromosomes
mésappariés

recombinaison
homologue

expansion/
contraction 
du motif ou 
domaine
Les mutations ponctuelles
Altérations chimiques spontanées de l'ADN
oxidation/désamination (eg, Cyt → Ura, 100/jour/cellule)
autres dommages oxidatifs (via superoxide, peroxide)
méthylation (change les appariements; provoque G → A)

Erreurs de l'ADN polymérase
favorisées par des molécules chimiques exogènes (et mutagènes), 
eg, intercalants dans l'ADN (benzène, ...)

Rayonnements ionisants
UV, rayons X → dimérisation de pyrimidines

Systèmes de protection simples ou sophistiquées
ADNdb, diploïdie
redondance/robustesse du code génétique
systèmes de réparation de l'ADN
systèmes de protection anti­oxidants,
dont l'ADN non­codant (pouvoir réducteur)

Les mutations peuvent être délétères, neutres, ou avantageuses
The origins, determinants and consequences of human mutations
Shendure & Akey, Science 2015

60 mutations ponctuelles apparues

Nombre de mutations
dans les cellules germinales de nos 
parents et héritées par nous

1011 mutations germinales apparues dans 
la dernière génération humaine Age 
paternel
Environ 10­8 mutations par base et par génération

Mutations somatiques dans les tissus les plus prolifératives: à 60 ans, 
environ une mutation à chaque site du génome dans une cellule au moins

Mutations silencieuses ou non...  (comparer Homo sapiens/chimpanzee)

1000 Genome Project          http://browsers.1000genomes.org/index.html 
Cancer Genome Project       http://www.sanger.ac.uk/genetics/CGP
Molecular Evolution;
Page, Holmes; 1998

Taux de mutation ponctuelle
dans quelques protéines

Chave, Biodiversité, 2009
Mutations synonymes ou non, neutres, délétères, ou avantageuses

Hypothèse: 
­les mutations synonymes sont neutres
­les mutations non­synonymes servent principalement à éliminer 
des variants délétères (sélection négative)
­l'absence de mutations non­synonymes indique une contrainte 
fonctionnelle (sélection positive)

Alors: 

nombre de mutations non­synonymes indicateur de
nombre de mutations synonymes  = pression sélective

Monget p299

Sélection Pas de Sélection


négative sélection positive
L'évolution choisie:
évolution dirigée et ingénierie du code génétique
“Evolution dirigée” et extension du code génétique:
Ingénierie d'un couple ARNt­aminoacyl­ARNt synthétase

Acide
aminé
-
Aminoacyl-
ARNt synthétase

Anticodon
GUC

appariement sur le ribosome

CAG
ARNm
Evolution dirigée et extension du code génétique: création
d'un nouveau couple ARNt – aminoacyl­ARNt synthétase

Acide ARNt muté
aminé-

Aminoacyl-
ARNt synthétase mutée

Anticodon
CUA

suppression de codons STOP

TAG
ARNm

L'ARNt muté va pouvoir “supprimer” des codons STOP
L'enzyme muté ne peut interagir qu'avec cet ARNt.
Evolution dirigée et extension du code génétique

Bibliothèque de mutants aléatoires

TyrRSMj(muté) Tyr
ARNtMj(muté)

Plasmide 1 + Plasmide 2
Gène CAT(muté):
résistance au chloramphenicol

TAG

Si la TyrRS mutée est capable d'aminoacyler l'ARNt muté avec un acide 
aminé (Tyr ou autre), alors l'ARNt va pouvoir supprimer un codon STOP 
qu'on a inséré au milieu du gène CAT: possibilité de sélection.
Evolution dirigée et extension du code génétique

Bibliothèque de mutants

TyrRSMj(muté) Tyr
ARNtMj(muté) + aa X
+ antibiotique

Plasmide 1 + Plasmide 2
E. coli
Gène CAT(muté)
Evolution dirigée et extension du code génétique

Bibliothèque de mutants

TyrRSMj(muté) Tyr
ARNtMj(muté) + aa X
+ antibiotique

Plasmide 1 + Plasmide 2
E. coli
Gène CAT(muté)
Sélection des
survivants

Enzyme, ARNt
compétents pour X
OU Tyr
Evolution dirigée et extension du code génétique

Bibliothèque de mutants

TyrRSMj(muté) Tyr
ARNtMj(muté) + aa X
+ antibiotique

Plasmide 1 + Plasmide 2
E. coli
Gène CAT(muté)
Sélection des
Sélection des survivants
NON survivants

Enzyme, ARNt Enzyme, ARNt
compétents pour X E. coli compétents pour X
­ aa X
mais pas Tyr + antibiotique OU Tyr
Evolution dirigée et extension du code génétique

X peut être un acide aminé non­naturel!

Réactif: Activé par photons Atome lourd (I) 


modifications  → résolution de 
chimiques de  structures 
protéines cristallograhiques

Codage de X par un codon TAG dans un gène choisi.

Il faut ajouter à la bactérie une voie métabolique pour synthétiser X.
On peut aussi développer des ribosomes mutants spécialisés. 
Evolution dirigée et extension du code génétique
Les 20 aa habituels 
avec leur 61 codons

un codon STOP 
reconverti et utilisé 
pour coder la méthyl­
tyrosine = 21ème aa

E coli sans codon stop Ambre UAG
codon rare dans E coli
élimination de l'ARNt “suppresseur” qui le reconnait
apport de quelques gènes sur plasmide
réutilisation de UAG comme nouveau codon sens
Nucleic Acids Research (2010) 38:8188
Sequence, evolution, function. Koonin, Galperin; Kluwer, 2003
Molecular evolution. Page, Holmes; Blackwell, 1998
Fundamentals of molecular evolution. Li, Gaur; Sinauer, 1991
Biodiversité, Jérôme Chave, Ecole Polytechnique; 2009 et 2010
“Des virus ont­ils inventé l'ADN?” P Forterre, Pour la Science, 2008

“Tant va l'autruche à l'eau qu'à la fin elle se palme” (R Queneau)

Vous aimerez peut-être aussi