Académique Documents
Professionnel Documents
Culture Documents
PARTIE EPIGENETIQUE
PAR
Pr TAMGUE Ousman
Contacts: tamgue2001@yahoo.fr
1
Pr Tamgue O., Année Académique 2023-2024
BMC 529 : Biostatistique et Epigénétique (6 Crédits ; Volume horaire : 60h : CM : 30h ; TD : 10h ; TP : 10h ; TPE : 10h)
Objectifs du cours:
Familiariser les étudiants avec la discipline émergente de l’épigénétique, notamment les emmener à comprendre
comment les mécanismes épigénétiques contrôlent le développement et la spécialisation cellulaire sans affecter les
séquences nucléotidiques des gènes ; les bases de l’héritabilité des modifications épigénétiques ; les conséquences du
dysfonctionnement de la machinerie épigénétique, notamment la survenue des cancers et la susceptibilité aux maladies
infectieuses, et enfin la connaissance des méthodes, plateformes et banques de données utilisées dans la recherche en
épigénétique.
Programme :
1. Introduction : Définition et historique de l’Épigénétique
2. Principaux mécanismes de régulation épigénétique de l’expression des gènes et leurs fonctions
• Méthylation de l’ADN ;
• Modification et remodelage des histones
• Régulation par les ARN non-codants
• Interrelation entre les différents mécanismes de régulation épigénétique
3. Altération du control épigénétique de l’expression des gènes, maladies et thérapies (sous forme de thématiques de
TPE rendus et exposés pendant séances de TD) NB: 2-3 personnes/thème. Délai remise TPE 03 mai 2024 à 12h. Exposés le 10 mai 2024
• Thématique 1: Mécanismes Épigénétiques impliqués dans la survenue et le développement de cancers
• Thématique 2: Mécanismes Épigénétiques impliqués dans la survenue et le développement de maladies
infectieuses
• Thématique 3: Thérapies ciblant les mécanismes épigénétiques
4. Méthodes ,plateformes et banques de données de recherche en épigénétique (sous forme de compte rendus et exposés
d’articles scientifiques pendant séances de TP)
• Interaction entre facteurs épigénétiques et ADN /ARN: Immunoprécipitation de la chromatine (CHIP et CHIRP)
• Accessibilité de la Chromatine : ATAC-seq
• Banques de données : Encode ; GEO ; ZENBU 2
Pr Tamgue O., Année Académique 2023-2024
INTRODUCTION- Définition et historique de l’Épigénétique
Questionnement ayant conduit à la mise en évidence de la régulation épigénétique:
« Si les caractères de l'individu sont déterminés par les gènes, pourquoi toutes les cellules d'un
organisme ne sont-elles pas identiques? » Thomas Morgan , 1926
Figure 1: Un seul et même œuf fécondé donne naissance à plusieurs types cellulaires différents
Image source: Blewitt M., Epigenetic control of gene expression, University of Melbourne, Australia
Qu’est ce qui explique :
- Les differences physiques et biologiques observées chez les clones naturels que sont les vrais jumeaux (monozygotes) et
même chez des animaux de laboratoire clonés?
- les possibilités d'évolution d'un même œuf en mâle ou femelle chez les tortues?
- les possibilités d'évolution d'un même œuf en reine ou ouvrière chez les abeilles?
- le polyphénisme, par exemple les changements de couleur en fonction des saisons (tel le renard polaire qui devient blanc
en hiver)?
Ces questions imposent le constat de différences possibles dans l'expression d'un même génome car les cellules d'un
même organisme (ou cellules somatiques) sont génétiquement identiques, clones les unes des autres. Sauf cas exceptionnel
de mutation spontanée ou lors du développement des lymphocytes T, les cellules issues d'une seule cellule œuf et dupliquées
par mitose partagent exactement le même patrimoine génétique. Ceci évoque la possibilité que des mécanismes peuvent lier
des facteurs environnementaux et l'expression du patrimoine génétique.
Figure 2: Le control épigénétique est important tout au long du développement cellulaire et sa perturbation entraine des pathologies
Image source: Blewitt M., Epigenetic control of gene expression, University of Melbourne, Australia
L'épigénétique (du grec ancien ἐπί, épí, « au-dessus de », et de génétique) est la discipline de la biologie qui
étudie la nature des mécanismes modifiant de manière réversible, transmissible (lors des divisions
céllulaires) et adaptative l’expréssion des genes sans en changer la séquence nucléotidique (ADN).
En d’autres termes, l’épigénétique vise à comprendre comment, à partir d'un même génome, peuvent se mettre en
place et se propager au cours de divisions cellulaires des états transcriptionnels distincts (exprimé versus non
exprimé).
Chaque gène est présent en deux exemplaires, ou allèles, l’un fourni par la mère, l’autre par le père lors de la
fécondation. Le plus souvent, ils s’expriment ensemble indifféremment, mais parfois, un seul allèle s’exprime,
l’autre, inactivé, restant silencieux. Le caractère exprimé pourra alors varier, car l’allèle maternel et l’allèle
paternel peuvent porter des marques épi- génétiques différentes.
Pr Tamgue O., Année Académique 2023-2024 5
INTRODUCTION- Définition et historique de l’Épigénétique
L’hérédité épigénétique
Certaines sont très transitoires, comme les marques qui régulent les gènes liés aux rythmes du jour et de
la nuit. "Au moins 15 % de nos gènes sont régulés d'une façon circadienne : leur activité oscille sur un
rythme de 24 heures. Il s'agit de gènes qui gouvernent notre métabolisme, assurant par exemple l'utilisation
des sucres ou des acides gras", (Paolo Sassone-Corsi). "Pour réguler tant de gènes d'une façon
harmonieuse, il faut une logique commune. Elle se fonde sur des processus épigénétiques qui impliquent
des modifications des histones."
D'autres marques ont une remarquable pérennité. "Chez un individu multicellulaire, elles peuvent être
acquises très tôt lors du développement, sous l'effet d'un signal inducteur. Elles sont ensuite transmises au fil
des divisions cellulaires jusque chez l'adulte - bien longtemps après la disparition du signal inducteur." Les
marques les plus stables sont ainsi les garantes de "l'identité" des cellules, la vie durant.
7
Pr Tamgue O., Année Académique 2023-2024
La régulation au niveau chromatinien- Rappel sur la Chromatine et le nucléosome
La chromatine est la substance chimique qui constitue les chromosomes. C’est la structure chimique au sein de
laquelle l’ADN se trouve empaqueté et compacté dans le volume limité du noyau des cellules eucaryotes.
La chromatine est constituée de fibres contenant majoritairement de l’ADN et des protéines et également une
petite quantité d'ARN.
L’ADN dans la chromatine est très étroitement associé à des protéines appelées histones, qui emballent et
organisent l’ADN en unités structurelles de base appelées nucléosomes. La particule de cœur du nucléosome
(ou noyau nucléosomique) est formée d’un cœur protéique de huit protéines histones (deux exemplaires de
chacune des histones H2A, H2B, H3, H4) autour duquel s’enroulent environ 146 paires de bases d’ADN sur 1,65
tour.
On trouve également dans la chromatine de nombreuses protéines non histones, dont certaines aident à maintenir
la structure chromosomique, et d'autres régulent l'expression de gènes spécifiques.
8
Pr Tamgue O., Année Académique 2023-2024
La régulation au niveau chromatinien- Trois grands mécanismes
Au niveau chromatinien , la régulation de expression des gènes peut se faire par 3 grands
mécanismes:
9
Pr Tamgue O., Année Académique 2023-2024
La régulation au niveau chromatinien- Modification des nucléosomes- Euchromatine, Hétérochromatine
v L'euchromatine qui correspond à une chromatine moins condensée dans laquelle les gènes, plus
accessibles, voient leur expression facilitée. En effet, l'ADN pour être exprimé doit être décompacté,
un complexe de remodelage intervient donc pour désorganiser les histones afin de permettre la
fixation de facteurs trans sur l'ADN et son expression.
v L'hétérochromatine qui correspond à une chromatine plus dense avec un ADN moins facilement
accessible. L'hétérochromatine peut à son tour se subdiviser en deux types :
• L'hétérochromatine constitutive, qui n'est globalement pas exprimée. Elle est située autour des
centromères et des télomères qui sont constitués en général par des séquences répétitives ;
10
Pr Tamgue O., Année Académique 2023-2024
La régulation au niveau chromatinien- Modification des nucléosomes- Code des Histones
Trouvées dans la chromatine de toutes les cellules eucaryotes, les histones ont des poids moléculaires compris entre 11 000 et 21
000 et sont très riches en acides aminés basiques arginine et lysine (ensemble, ils représentent environ un quart des résidus
d'acides aminés). Toutes les cellules eucaryotes ont cinq principales classes d'histones, de poids moléculaire et composition en
acides aminés différents. Les histones H3 sont presque identiques dans la séquence d'acides aminés dans tous eucaryotes, comme
le sont les histones H4, suggérant une conservation de leurs fonctions. Les Histones H1, H2A, et H2B montrent moins de similarité
de séquence entre les espèces eucaryotes.
Les extrémités amino-terminales des histones (extrémité N-terminale) se projettent à l'extérieur de la partie globulaire du
nucléosome et sont soumises à des modifications covalentes catalysées par des enzymes spécifiques (histone-acétyltransférase et
histone-déacétylase, histone-méthylase, histone demethylase, histone-kinase, ubiquitinase, etc.). Ces modifications agissent soit
en modifiant la compaction du nucléosome, soit en constituant un code signalant le recrutement spécifique de facteurs de
transcription
12
Pr Tamgue O., Année Académique 2023-2024 12
La régulation au niveau chromatinien- Methylation de l’ADN-Ilots CpG, ADN méthylases, extinction génique
Il est également possible d’inhiber des gènes en faisant intervenir une enzyme, l’ADN méthylase, qui a pour fonction
de méthyler l’ADN, généralement au niveau des séquences CpG (Cytosine-phosphate-Guanine) dans la région promotrice.
Ces îlots CpG (aussi appelés îlots CG) sont généralement associés aux promoteurs et donc à l'activité des gènes
Ø L’ADN des cellules eucaryotes est méthylé : À la suite de la réplication, les gènes codant les méthyltransférases sont activés et les enzymes
reconnaissent le brin hémiméthylé et méthylent le nouveau brin.
Ø La Méthylation de l’ADN est également un phénomène d’extinction génique: En effet la méthylation empêche la liaison des complexes
enzymatiques de la transcription ainsi que des activateurs. De plus, dans certains cas elle peut permettre la fixation de répresseurs modifiant
les histones.
Ø Les cellules cancéreuses présentent souvent des méthylations aberrantes.
Ø Chez les mammifères femelles, seul l’un des deux chromosomes X est actif. L’autre est désactivé par méthylation.
Ø Certains gènes ne s’expriment que dans certains tissus car ils sont méthylés dans les autres.
Ø La méthylation d’ADN est héréditaire
Pr Tamgue O., Année Académique 2023-2024 13
La régulation au niveau chromatinien, post-transcriptionnel et traductionnel par les les ARN non-
codants- Généralités sur les ARN non-codants
La découverte du premier gène codant pour un ARN non-codant remonte a l’année 1980, chez les procaryotes, depuis , l’intéret pour cette
classe de molécules est grandissant; aussi, de nombreuses études ont été faites sur l’une des espèces d’ARN non-codants, en l’occurrence
les microARN, au cours des 4 dernières décennies. Le projet de séquençage du génome humain (2003) et le projet ENCODE (Encyclopaedia
of DNA éléments ) (Références: Lander et al., 2001, Nature 409(6822):860-921; Consortium EP 2012, Nature 489(7414): 57-74) ont fait des
découvertes majeures qui ont permis d’accélérer la recherche sur ces espèces d’ARN. Ces études ont en effet montré que:
v Approximativement 93% de l’ADN génomique humain est transcrit en ARN
v Seulement 2% de cet ARN est traduit pour donner les 20 000 types de protéines que l’ Homme produit.
v 98% des ARN ne codent pas pour des protéines et par conséquent sont appelées ARN non-codants (ncRNAs)
De nombreuses études subséquentes ont permis d’établir que bien que ces ncRNAs ne codent pas pour des protéines, ce ne sont pas des
déchets de la transcription , ce sont des molécules fonctionnelles notamment par ce que:
v Leur expression est spécifique à certains tissus/cellules , à certains stades de développement (Atian and M.K. and Fitzgerard, 2014.
Trends Mol. Med.)
v Des mutations dans leurs gènes sont associées à des maladies (Hindorff et al, 2009. Proc.Natl.Acad. Sci)
v Ils régulent l’expression des gènes aux niveau transcriptionnel et post-transcriptionnel (Mercer et al., 2009. Nat. Rev. Gen.)
D’une façon générale, Les ARN non-codants peuvent être classés en 2 grandes
catégories:
v les ARN régulateurs qui sont les ARN non-codants au sens strict du terme et
comportent les petits ARN (siRNAs; miRNAs; piRNAs) et les longs ARN
(lncRNAs; eRNAs; lincRNAs ;NATs etc…). C’est cette catégorie qui régule
l’expression des gènes aux niveaux chromatinien, transcriptionnel et
post-transcriptionnel et feront l’objet de notre cours
Ils sont appelés petits ARN non-codants a cause de leur taille inferieure a 200 nt (limite choisie arbitrairement). On en
distingue plusieurs:
v Les miARN : 18-25 nt de long, modification post-transcriptionnelle; Interférence avec la traduction ou Dégradation des
ARNm
v Les snoRNA : 60-300 nt de long, Modifications chimique d'autres espèces d'ARN
v Les snRNA: environ 150 nt de long, jouent un rôle dans les complexes d'épissage
v Les piARN: 26-30 nt de long, silence de rétrotransposons dans les cellules germinales
v Les miRNAs régulent l’expression des gènes en se fixant généralement a des séquences situées sur la partie 3’-non-traduite
de l’ARNm (3’-UTR), ce qui va entrainer soit une déadenylation de l’ARNm et/ou sa dégradation par les RNAses H (régulation
post-transcriptionnelle), soit empêcher la fixation du complexe d’initiation de la traduction (régulation traductionnelle)
v L’action de régulation post-transcriptionnelle ou traductionnelle est déterminée d’une part par la complémentarité de base
entre la séquence noyau (seed sequence) du miRNA (une séquence conservée de 6-8 nucléotides ) et son site cible sur la
partie 3’-UTR de l’ARNm cible; et d’autre part par le complexe multiprotéique RISC qui dirige le miRNA sur sa cible. Ainsi une
complémentarité totale va entrainer la dégradation de l’ARNm et une complémentarité partielle va entrainer une inhibition
de l’initiation de la traduction de l’ARNm. La présence de la protéine Argonaute 2 dans le complexe RISC va entrainer la
dégradation de l’ARNm tandis que la présence de la protéine Argonaute 1 dans le complexe RISC va entrainer une inhibition
de l’initiation de la traduction de l’ARNm.
Ils sont ainsi appelés a cause de leur taille supérieure ou égale a 200 nt (par opposition aux petits ARN non-codants).
Ils sont classés en fonction de leur position par rapport au gène codant pour des protéines situé dans leur voisinage
Les lncRNAs exoniques partagent des exons avec un gène codant pour une protéine
Les lncRNAs introniques sont transcrits dans les introns d'un gène codant pour une protéine
Les lncRNAs intergéniques sont transcrits dans les régions entre deux gènes codant pour les protéines
Les lncRNAs antisense sont situés sur le brin opposé d'un gène codant pour une protéine.
Les lncRNAs chevauchants sont des transcrits qui contiennent un gène codant pour une protéine dans leur intron
20
Interrelation entre les mécanismes épigénétiques- Introduction
Les différentes mécanismes épigénétiques décrits dans notre cours sont interdépendantes
et peuvent à la fois se renforcer mutuellement et inhiber des fonctions opposées. Nous
pouvons notamment citer :
v L’interaction des ARN non-codants (lncRNas; piRNAs) avec des enzymes responsables des
modifications des histones (HMTs; HDMTs; HATs; HDACs) et du remodelage de la
chromatine
À cela l’on peut ajouter que l’expression des gènes qui codent pour des enzymes
responsables des modifications des histones (HMTs; HDMTs; HATs; HDACs) ; de la
méthylation directe de l’ADN (DNMTs)et du remodelage de la chromatine (HP1a etc… ) peut
être régulée par des mécanismes épigénétiques
v La protéine multi-motifs ubiquitine UHRF1 est un acteur central dans le ciblage des
marques de chromatine répressives. Il contient:
• un domaine SRA, qui se lie à l'ADN hémiméthylé;
• un domaine Tudor se liant à H3 méthylé (H3K9me3) ;
• un doigt PHD interagissant avec un résidu d'arginine non modifié dans H3 (H3R2).
v De plus, UHRF1 interagit avec les DNMT, G9a et HDAC1 et unit ainsi diverses enzymes
qui peuvent fournir un environnement de chromatine répressif. Fait intéressant, UHRF1
recrute également la H2AK5 actetyltransferase TiP60 intégrant ainsi une multitude de
signaux épigénétiques différents.
v Un autre exemple du lien entre la méthylation de l'ADN et les modifications des histones
est représenté par les protéines de liaison au méthyle C telles que MeCP2, qui
interagissent avec les complexes co-répresseurs, notamment les HDAC et les HMT.
v Il a été montré récemment que les composants de la voie piRNA sont nécessaires pour
cibler la méthylation de l'ADN de novo sur une région imprimée du génome de la
souris, ce qui implique que la méthylation sélective des régions réprimées de façon
permanente (imprinting) peut être régulée par des piRNA.
Bien que nous puissions disséquer les différentes zones génomiques fonctionnelles par leur schéma de
modification de la chromatine, nous ne comprenons toujours pas le mécanisme sous-jacent et si les
marques épigénétiques telles que les modifications post-traductionnelles des histones sont la cause ou
la conséquence des états de la chromatine.
Il est désormais connu que le ciblage des modifications épigénétiques repose entre autres sur les
ARNnc, qui fonctionnent comme des «plateformes adaptatrices» pour les interactions entre la
chromatine et les complexes de remodelage de la chromatine et sont capables de recruter et de
diriger les complexes de remodelage de la chromatine vers des locus spécifiques du génome (Fig.
2).
Les exemples les plus connus à ce jour sont les ARNnc impliqués dans l’extinction épigénétiques
(epigenetic imprinting):
• le lncRNA AIR exprimé paternellement, est nécessaire pour faire taire les gènes Igf2r /
Slc22a2 / Slc22a3 codant les protéines exprimées par la mère. Il inhibe l'expression en
ciblant l'histone H3K9 méthyltransférase G9a au promoteur Slc22a3,
le gène MEG3 ( maternellement exprimé 3 ) peut réguler la progression du cycle cellulaire en activant à la fois les voies
dépendantes de p53 et indépendantes de p53 et possède des fonctions suppressives de tumeur. Fait intéressant, il a été
démontré que le remplacement partiel de l'ARN MEG3 par des séquences non apparentées n'a pas modifié
l'activation de p53, ce qui indique que la fonction de l'ARNnc dépend largement des structures secondaires et que le
manque de conservation de séquence, qui est observé pour de nombreux ARNnc, n'affecte pas la fonctionnalité.
Les lncRNAs peuvent contenir un ou plusieurs sites de fixation des microRNAs. Par conséquent la fixation
des microRNAs au lncRNAs peut conduire à une séquestration des miRNAs loin de leur mRNA cibles. Cette
fixation peut également conduire a la dégradation du lncRNA
28
Perturbations épigénétiques identifiées dans différentes pathologies
30
Progrès dans les techniques de recherche sur la chromatine
36
Vue globale des différentes bases de données: epigenie: https://epigenie.com/epigenetic-tools-and-databases/
Il existe de nombreuses bases de données qui répertorient les différents mécanismes épigénétiques, les données publiées et
actualisées, ainsi que les outils bio-informatiques et expérimentaux utilisés pour générer ces données. Le site épigénie présente
ces différentes plateformes et contient des liens pour y accéder directement
HIstome est une base de données répertoriant les différentes protéines histones humaines, leurs modifications post-
traductionnelles ainsi que les enzymes qui les modifient
NGSmethDB présente les données du séquençage du génome après traitement au bisulfite, montrant ainsi la méthylation globale
de l’ADN dans les génomes de nombreuses espèces dans différents tissus et conditions pathologiques
miRDB comme beaucoup d’autres base de données permets d’identifier les ARN messagers (mRNA) ciblés par un microARN
donné ou alors d’identifier les microARNs ciblant un transcrit (mRNA) donné. On y trouve également des informations sur les
mécanismes cellulaires/voies métaboliques…etc impliquant les miRNAs/gènes cibles (Target ontology) La recherche ici peut
donc se faire soit en fournissant le nom du microARN soit celui du gène. Les résultats seront affichés par ordre de probabilité
décroissant sur la base d’un score calculé par l’algorithme. Les cibles les plus probables ayant un score très élevé (maximum
100) et les moins probables ayant un score plus faible.
PicTar prédit les gènes cibles des miRNAs , les miRNAs ciblant un gène particulier et les niveaux d’expression de ces
miRNAs dans différents tissus chez les mammifères, les mouches (flies) et les nématodes.
NONCODE répertorie les ARN non-codants, specialement les lncRNAs dans de nombreuses espèces , différents
tissus et conditions pathologiques
IRNdb répertorie les ARN non-codants, et leurs cibles, impliquées dans la réponse immunitaire dans de nombreuses
pathologies, notamment contre la tuberculose.