Académique Documents
Professionnel Documents
Culture Documents
moléculaire: aspects choisis
Plasticité du génome: chromosomes et gènes
Plasticité et évolution des protéines
Evolution dirigée: exemples d'ingénierie du code génétique
Sur les échelles de temps courtes, la diversité génétique
provient du brassage de chromosomes via reproduction sexuée
Combien avonsnous
d'ancêtres au temps de
Charlemagne?
Un monde sans évolution: équilibre de HardyWeinberg
Organismes diploides, pas de mutations ni sélection, population infinie, “panmictique”
Femelle
A a allèle
p q fréquence
a q Aa aa
Ces valeurs
pq q2 Génotypes de la sont inchangées
Mâle
descendance et au fil des
A p AA Aa leurs fréquences générations
p2 pq
En effet: fréquences dans les gamètes filles: A: p' = p2 + pq = p a: q' = 1p' = q
Fréquences inchangées (normal: pool de gamètes constant). Idem pour n>2 allèles
La variabilité génétique de la population reste inchangée.
Brassage de fragments chromosomaux: la synténie
Notion de “synténie”
= sur le même ruban
Synténie Homo sapiens – Mus musculus
100 Ma
Brassage de fragments chromosomaux: la synténie
Notion de “synténie”
= sur le même ruban
Chromosome II humain
Chromosomes homologues de chimpanzee
“Translocations chromosomales”
6 Ma Weinberg et al, Chrom Res (1994) 2:405
Synténie Homo sapiens – Poisson zèbre
Chromosomes humains
Des accidents cellulaires ou chromosomiques majeurs possibles:
duplications, divisions interrompues
Duplication complète du génome de levure
Anomalies des chromosomes sexuels,
trisomie
Nature (2004) 617:428
Recombinaison homologue (ou non)
Chromosomes
méiotiques
(métaphase)
Chen et al, Nature Reviews
Genetics 8, 762775 (2007)
Cooccurrence de gènes: phylogénie
La présence/absence/localisation de gènes est caractéristique d'une espèce
Exemple: protéines présentes dans les 3 “domaines” du vivant,
eucaryotes, eubactéries, archées: issues de LUCA?
Nombre de gènes
Protéines ribosomales 30
Traduction, Aminoacyl ARNt synthétases 15
fonctions associées Facteurs de traduction 6
Enzymes de mofification de l'ARN et des protéines 3
Consituants de la Signal Recognition Particle (sécrétion) 3
Protéine chaperone/protéase 1
Transcription Sousunités de l'ARN polymérase 3
Réplication Facteurs de processivité des ADN polymérases 3
Réparation Topoisomérase IA, recombinase, Rad50/Mre11 4
Métabolisme ATP synthétases 2
TOTAL 70
Cooccurrence de gènes: prédiction de fonction
Soit les gènes d'un certain sousensemble
sont tous présents dans un génome,
soit ils sont tous absents : on ne trouve pas
l'un sans les autres → lien fonctionnel
Inférer gènes liés fonctionnellement.
Exemple: reconstruction de voies
métaboliques ou de signalisation.
De plus: la proximité génomique est
corrélée à l'interaction physique entre les
protéines.
Pellegrini (2001) Curr Opin Chem Biol
Éléments génétiques mobiles
La plupart des séquences “répétées” de notre
génome proviennent d'éléments génétiques mobiles
Transposons (Barbara McClintock, prix Nobel 1983)
Retrovirus (David Baltimore, découverte de la transcriptase inverse)
INterspersed Elements: SINE/LINE
VIH1: un rétrovirus
génome ARNsb diploïde
copié par une transcriptase inverse (RT)
VIH1: un rétrovirus
génome ARNsb diploïde
certains gènes sont épissés
recouvrement partiel de gènes
copié par une transcriptase inverse (RT)
la RT utilise comme amorce une ARNt
présence dans la particule virale de protéines et
ARN nécessaires pour démarrer son cycle de vie
la RT est peu fidèle: mutations
elle a trois activités: ADN polymérase, ARN
polymérase, Rnase
http://www.hiv.lanl.gov HIV sequence database
Transcription inverse: modèle naïf
génome ARNsb diploïde
copié par une transcriptase inverse (RT)
la RT utilise comme amorce une ARNt
la RT a trois activités:
ARN polymérase, ADN polymérase, RNase
RT
3' ARN génomique viral
ARNt(Lys)
3' ARN génomique viral
ADN complémentaire
dégradation de l'ARN
ADN
ADN double brin
Quel est le problème posé par ce modèle?
Un élément génétique mobile doit soit être toujours inséré
près d'un promoteur endogène, soit pouvoir emporter son
propre promoteur lors de sa transcription: comment faire?
3 regions upstream of the START site allow RNA polymerase 2
binding and the initiation of transcription of an ORF (open reading
frame): they form the promoter.
“10”
“35” sequence Purine
sequence A
Spectator strand
AATxxxxxxxGxx
xxxxTTGACAxxxxxxxxxxxxxxxxxTAT xxxxxxx
xxxxAACTGTxxxxxxxxxxxxxxxxxATA xxxxxxx
TTAxxxxxxxTxx
C Transcribed strand
Start of
Local fusion transcription
Of the DNA
Transcription inverse: modèle détaillé (Y Gaudin, Bio451, Fig 14.14)
U3 contient le promoteur. ARN
Notez la répétition de R. viral
L'ARNt sert d'amorce pour la RT
Le brin ADN (rouge) se dissocie et se
réassocie côté 3' via le 2ème R (ou
s'associe à l'autre ARN viral)
Extension ADN et digestion ARN+.
PP = segment polypurine résistant,
nondigéré à ce stade
PP sert d'amorce pour synthèse du brin
ADN+ bleu, puis est digéré
Circularisation du brin rouge via
PB:PB'; extension du brin bleu,
jusqu'au bout du brin rouge
ADNdb
Après intégration dans le génome hôte,
notez la position et le dédoublement des
promoteurs (U3) et du LTR = “Long
Terminal Repeat”
Structure détaillée du “Long Terminal Repeat”
Site
d'initiation
Site d'intégration (AA)
Promoteur Future coiffe
Séquence répétée Séquence répétée
– TATAAA –
U3 R U5
– AATAAA –
Site
d'intégration
polyA (TT)
Signal de
polyadénylation Site de terminaison
LTR gag pol env
LTR
cf http://www.hiv.lanl.gov
Que se passetil si on
perd l'activité env?
Wikimedia Commons
Des éléments génétiques mobiles: les transposons
Cidessous: un retrotransposon: Presqu'un rétrovirus; pas de gène env
gag pol
LTR LTR
Plusieurs types; eg LINEs (Long INterspersed repetitive Elements):
68 kbases
produisent des copies d'euxmêmes: expansion du génome
500,000 exemplaires dans notre génome: 17% du génome
SINES (Short etc): 1,500,000 dans notre génome (11% du génome)
Transposons = 50% du génome du maïs
Mécanisme copier/coller ou couper/coller (←transposase)
Nombreuses applications en biotechnologie
Effets biologiques, eg via leur 2ème promoteur (LTR de droite): oncogènes
Ne pas confondre avec les séquences mini ou microsatellites
Un exemple de “Small INterspersed Element”: les séquences Alu
Un SINE de ~300 nt, qui descend d'un petit ARN ribosomal: 7SL
L'élément répété le plus abondant de notre génome (106 copies = 11%!)
Transcrit par l'ARN Polymérase III, qui utilise un promoteur interne
Ne code pour aucune protéine; utilise les protéines cellulaires
284 nt
Énorme expansion
humaine récente;
aujourd'hui inactif
Nature (2011)
469:529
nématode drosophile humain
Pseudogènes Séquences “répétées”
LINE/SINE 0.4% 5% 28%
Séquences 0% 6% 8% Éléments “dispersés”
rétrovirales ou “interspersed”;
origine virale
Transposons 5% 4% 3%
ADN satellite dans le centromère
répétition d'une séquence courte (10100 nt)
Minisatellites répétition d'une séquence courte (10100 nt); ~1 kb chacun
~1000 dans notre génome; souvent télomériques
Microsatellites motif de 110 nt, répété 10100 fois;
répartition assez uniforme → marqueurs/carte physique
polymorphisme (nb de répétitions)→génotypage, phylogénie
nématode drosophile humain
Séquences “répétées”
LINE/SINE 0.4% 5% 28%
Séquences 0% 6% 7%
rétrovirales
Transposons 5% 4% 3%
nombre
Nombre de transposons
Présence de transposons
fraction du
génome à partir d'une certaine
taille du génome
Taille du génome (Mb)
nématode drosophile humain
Séquences “répétées”
LINE/SINE 0.4% 5% 28%
Séquences 0% 6% 8%
rétrovirales
Transposons 5% 4% 3%
Présence/taille d'introns
Taille
Nombre de transposons
nombre
moyenne
(nt)
nombre
fraction du moyen
génome par gène
Taille du génome (Mb) Lynch, Science '03
Des accidents cellulaires ou chromosomiques majeurs possibles:
duplications, divisions interrompues, phagocytose/endosymbiose
Duplication complète du génome de levure
Anomalies des chromosomes sexuels,
trisomie
la mitochondrie:
endosymbiose →
“transfert” de gènes
Nature (2004) 617:428
Arbre de la vie, ou cercle?
Le premier eucaryote est peutêtre apparu par
fusion/symbiose d'une eubactérie et d'une archébactérie.
eucaryote
eubactérie
Ancêtre
archébactérie commun
Ernst Mayr, What Evolution Is (2001) Fig 3.2
Arbre de la vie: une vue moderne
La structure hiérarchique de l'arbre
modélise les spéciations successives.
Evolution moléculaire: aspects choisis
Plasticité du génome: chromosomes et gènes
Plasticité et évolution des protéines
Evolution dirigée: l'exemple des aminoacylARNt synthétases
Des peptides aléatoires peuvent se replier et être fonctionnels
Parmi une librairie de
séquences aléatoires,
de longueur ~80 aa, et
principalement
composées de R, Q, L,
5% se replient
(faiblement);
PNAS (1994) 91:2146
Parmi une librairie de
1013 séquences, de
longueur ~100 aa,
~10 fixent une protéine:
la streptavidine;
Szostak et coll
PNAS (2001) 98:3750
Des peptides aléatoires peuvent se replier et être fonctionnels
Parmi une librairie de
séquences aléatoires,
de longueur ~80 aa, et
principalement
composées de R, Q, L,
5% se replient
(faiblement);
PNAS (1994) 91:2146
Une protéine artificielle
Top7
Parmi une librairie de
1013 séquences, de
longueur ~100 aa,
~10 fixent une protéine:
la streptavidine;
Szostak et coll
PNAS (2001) 98:3750
Science (2003) 302:1364
Des peptides simples peuvent se replier et être fonctionnels
rms Repliement d'homopolypeptides:
génération in silico de conformations compactes qui
établissent de nombreuses liaisons hydrogènes:
83% sont proches d'une structure de la PDB
Inversement, les structures de la PDB ont généralement
couverture un homologue structurale chez ces homopolypetides.
La plupart des domaines naturels semblent connus.
Les plis naturels semblent émerger de considérations
simples de compacité, hydrophobicité, et satisfaction des
liaisons hydrogènes. PNAS (2006) 103:2065
L'espace des plis est discret et fini
Classe
Classe
Classe
100 superfamilles
= 60% des domaines
Le domaine comme unité de l'évolution
“SH3” domain:
AspartylARNt found in >150
synthétase proteins of
d'E coli known
structure. 23 in
yeast alone.
AspartylARNt
synthétase
de levure
Tyrosine kinase cSrc
Un mécanisme pour ajouter/enlever un motif, gène, ou domaine
deux
chromosomes
mésappariés
recombinaison
homologue
expansion/
contraction
du motif ou
domaine
Les mutations ponctuelles
Altérations chimiques spontanées de l'ADN
oxidation/désamination (eg, Cyt → Ura, 100/jour/cellule)
autres dommages oxidatifs (via superoxide, peroxide)
méthylation (change les appariements; provoque G → A)
Erreurs de l'ADN polymérase
favorisées par des molécules chimiques exogènes (et mutagènes),
eg, intercalants dans l'ADN (benzène, ...)
Rayonnements ionisants
UV, rayons X → dimérisation de pyrimidines
Systèmes de protection simples ou sophistiquées
ADNdb, diploïdie
redondance/robustesse du code génétique
systèmes de réparation de l'ADN
systèmes de protection antioxidants,
dont l'ADN noncodant (pouvoir réducteur)
Les mutations peuvent être délétères, neutres, ou avantageuses
The origins, determinants and consequences of human mutations
Shendure & Akey, Science 2015
60 mutations ponctuelles apparues
Nombre de mutations
dans les cellules germinales de nos
parents et héritées par nous
1011 mutations germinales apparues dans
la dernière génération humaine Age
paternel
Environ 108 mutations par base et par génération
Mutations somatiques dans les tissus les plus prolifératives: à 60 ans,
environ une mutation à chaque site du génome dans une cellule au moins
Mutations silencieuses ou non... (comparer Homo sapiens/chimpanzee)
1000 Genome Project http://browsers.1000genomes.org/index.html
Cancer Genome Project http://www.sanger.ac.uk/genetics/CGP
Molecular Evolution;
Page, Holmes; 1998
Taux de mutation ponctuelle
dans quelques protéines
Chave, Biodiversité, 2009
Mutations synonymes ou non, neutres, délétères, ou avantageuses
Hypothèse:
les mutations synonymes sont neutres
les mutations nonsynonymes servent principalement à éliminer
des variants délétères (sélection négative)
l'absence de mutations nonsynonymes indique une contrainte
fonctionnelle (sélection positive)
Alors:
nombre de mutations nonsynonymes indicateur de
nombre de mutations synonymes = pression sélective
Monget p299
Acide
aminé
-
Aminoacyl-
ARNt synthétase
Anticodon
GUC
appariement sur le ribosome
CAG
ARNm
Evolution dirigée et extension du code génétique: création
d'un nouveau couple ARNt – aminoacylARNt synthétase
Acide ARNt muté
aminé-
Aminoacyl-
ARNt synthétase mutée
Anticodon
CUA
suppression de codons STOP
TAG
ARNm
L'ARNt muté va pouvoir “supprimer” des codons STOP
L'enzyme muté ne peut interagir qu'avec cet ARNt.
Evolution dirigée et extension du code génétique
Bibliothèque de mutants aléatoires
TyrRSMj(muté) Tyr
ARNtMj(muté)
Plasmide 1 + Plasmide 2
Gène CAT(muté):
résistance au chloramphenicol
TAG
Si la TyrRS mutée est capable d'aminoacyler l'ARNt muté avec un acide
aminé (Tyr ou autre), alors l'ARNt va pouvoir supprimer un codon STOP
qu'on a inséré au milieu du gène CAT: possibilité de sélection.
Evolution dirigée et extension du code génétique
Bibliothèque de mutants
TyrRSMj(muté) Tyr
ARNtMj(muté) + aa X
+ antibiotique
Plasmide 1 + Plasmide 2
E. coli
Gène CAT(muté)
Evolution dirigée et extension du code génétique
Bibliothèque de mutants
TyrRSMj(muté) Tyr
ARNtMj(muté) + aa X
+ antibiotique
Plasmide 1 + Plasmide 2
E. coli
Gène CAT(muté)
Sélection des
survivants
Enzyme, ARNt
compétents pour X
OU Tyr
Evolution dirigée et extension du code génétique
Bibliothèque de mutants
TyrRSMj(muté) Tyr
ARNtMj(muté) + aa X
+ antibiotique
Plasmide 1 + Plasmide 2
E. coli
Gène CAT(muté)
Sélection des
Sélection des survivants
NON survivants
Enzyme, ARNt Enzyme, ARNt
compétents pour X E. coli compétents pour X
aa X
mais pas Tyr + antibiotique OU Tyr
Evolution dirigée et extension du code génétique
X peut être un acide aminé nonnaturel!
Codage de X par un codon TAG dans un gène choisi.
Il faut ajouter à la bactérie une voie métabolique pour synthétiser X.
On peut aussi développer des ribosomes mutants spécialisés.
Evolution dirigée et extension du code génétique
Les 20 aa habituels
avec leur 61 codons
+
un codon STOP
reconverti et utilisé
pour coder la méthyl
tyrosine = 21ème aa
E coli sans codon stop Ambre UAG
codon rare dans E coli
élimination de l'ARNt “suppresseur” qui le reconnait
apport de quelques gènes sur plasmide
réutilisation de UAG comme nouveau codon sens
Nucleic Acids Research (2010) 38:8188
Sequence, evolution, function. Koonin, Galperin; Kluwer, 2003
Molecular evolution. Page, Holmes; Blackwell, 1998
Fundamentals of molecular evolution. Li, Gaur; Sinauer, 1991
Biodiversité, Jérôme Chave, Ecole Polytechnique; 2009 et 2010
“Des virus ontils inventé l'ADN?” P Forterre, Pour la Science, 2008
“Tant va l'autruche à l'eau qu'à la fin elle se palme” (R Queneau)