Académique Documents
Professionnel Documents
Culture Documents
12/11/15
GONCALVES Salomé L2
CR : Clémentine PAYRASTRE
Génétique médicale
Dr. Martin Khran
16 pages
Plan :
Rappels et généralités
A. Techniques courantes d'analyse de micro-lésions du génome
I. Notion de diagnostic direct et indirect
II. PCR
III. Séquençage direct
IV. Le pré-criblage
V. Diagnostic direct, stratégies
VI.Microarrays
VII. Techniques d'études de l'expression des gènes
B. La nouvelle ère de la génétique moléculaire
I. Principe et enjeux du séquençage à haut débit
Rappels et généralités :
Introduction :
L’un des objectifs majeurs dans le domaine des anomalies génétiques est de mettre en évidence ces
anomalies qui peuvent être soit causales , maladies génétiques mono-factorielles, soit à effets modificateurs
(« prédisposition génétique »), dans ce cas les maladies sont diverses on retrouve la cancérologie, les
maladies cardio-vasculaire et les maladies métaboliques. L’élément causal primaire n’est pas génétique, les
variations génomiques auront un effet soit protecteur soit aggravant sur le développement de ces pathologies.
En génétique médicale on s’intéresse surtout aux anomalies causales, responsables de la maladie.
Il n’est actuellement pas réalisable d’effectuer en routine une analyse simultanée de tous les gènes
d’un individu même si on y arrive de plus en plus. Cela va se développer dans les prochaines années.
Il faut donc choisir les techniques à utiliser en fonction de l’anomalie génétique recherchée et ceci restera
vrai même avec le séquençage à haut débit.
Il y a également des examens complémentaires à réaliser pour confirmer les hypothèses de diagnostic
qui peuvent être des analyses biologiques selon le contexte, de l'imagerie, des examens ciblés selon
l'orientation.
1/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Ex : lorsque l'on suspecte une myopathie, on va réaliser une biopsie musculaire sur laquelle on va rechercher un
certains nombre de signes spécifiques qui permettent d'orienter vers le sous types particulier de myopathies.
Le diagnostic clinique va conduire à la prescription d'une analyse génétique afin d'avoir un diagnostic de
certitude pour le patient.
Le matériel est essentiellement génomique. Il existe aussi des techniques qui s'effectuent à partir de
l'ARNm. On parle dans ce cas d'une analyse du génome à l’échelle du transcriptome. Les molécules d’ARN
sont instables, il y a donc possibilité de les rétro transcrire en cDNA par technique de PCR inverse ou reverse
transcription pour les analyser.
Les analyses biochimiques sur les protéines sont également importantes pour les conclusions d'anomalies
génétiques.
L’ADN au niveau des cellules est à priori identique, on peut donc travailler sur n’importe quel échantillon
le plus souvent sur un prélèvement sanguin et sur des lymphocytes. Au niveau du transcriptome et du
protéome, c’est différent, il y a une expression spécifique en fonction des cellules. On obtient donc des
chromosomes, de l'ADN, des ARN messagers / des cDNA.
Tout ceci doit se faire avec le consentement de l’individu.
Il est possible de travailler sur d’autres prélèvements, notamment dans le cadre du DPN (diagnostic pré
natal) : tissus embryonnaires/fœtaux ( liquide amniotique ou villosités choriales). On peut aussi par une simple
prise de sang chez la mère récupérer des informations du fœtus, grâce à de l'ADN foetal circulant dans le sang
maternel, cela diminue les risques de fausses couches.
L’objectif est d’établir un diagnostic précis par l’identification de l’anomalie génétique. Le diagnostic le
plus précis en génétique est l'identification précise de la maladie causale. L’intérêt est d'obtenir un diagnostic
certain, de permettre une prise en charge adaptée et de fournir des conseils génétiques (risque de récurrence
au niveau de la famille).
Ex : dans les myopathies il y a des centaines de sous types différents, chacune avec une évolution différente,
l'analyse génétique permet d'identifier telle ou telle myopathie. Il y a des myopathies avec atteinte cardiaque
d'autre non, en fonction du diagnostic génétique nous serons si on doit mettre en place une surveillance
cardiaque .
2/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Génétique moléculaire
L'objectif de la génétique moléculaire est l'identification d’anomalies à l‘échelle du gène. Les différentes
mutations peuvent être des substitutions d'1 nucléotide, des insertions, délétion de 1 à quelques nucléotides
ou des insertions/délétions de quelques dizaines ou quelques centaines de nucléotides.
La majorité des mutations pathogène est localisée en séquence codantes, ce qui justifie l’analyse
préférentielle des exons codons. A l'échelle d'un gène, la séquence comporte 100 à 200 000 paire de base. La
séquence codante en elle même est au alentours de 1000 à 3000 paire de base. ( il y a un facteur 10 entre le gène
et la séquence codante, il est donc préférable de regarder en priorité les exons codants).
C’est une technique centrale, souvent utilisée en association avec d’autres. Lorsque l'on cherche à
identifier une anomalie génétique on est souvent confronté au problème d'une faible quantité de matériel pour
une étude au niveau moléculaire.
L’intérêt est donc de pouvoir amplifier de manière très importante une région d’intérêt présente en faible
quantité. Il est possible d’augmenter la quantité de prélèvement pour avoir plus de matériel mais on utilise de
manière préférentielle la PCR.
Il y a trois étapes:
Tout ceci est répété un certains nombre de fois environ une 30 de fois. A
chaque cycle on aura une amplification exponentielle à partir de notre région
3/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
d’intérêt de départ.
L’analyse de la séquence consiste à regarder au niveau du gène quel est l’enchainement des nucléotides surtout
au niveau des exons codants.
4/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Le séquençage direct est basé sur la méthode de Sanger qui utilise des ddNTP (didéoxyribonucléotides),
analogues structuraux des dNTP mais incapables de réaliser une liaison phosphodiester. Cette méthode consiste en
l'incorporation au hasard de ddNTP marqués (au fluorochrome rouge, bleu, vert ou jaune) qui stoppent à chaque fois
l'élongation.
On a notre matrice (amplifiée par la PCR), de nouveau on utilise des amorces et une ADN polymérase,
avec des Déoxyribonucléotidestriphosphates des dNTP normaux et des didéoxyribonucléotides triphosphates,
des ddNTP couplés à des fluorochromes différents pour chaque base.
A chaque fois l’arrêt est marqué par le nucléotide et le fluorochrome associé.
CR :On a des molécules de tailles différentes car au hasard de l'incorporation des ddNTP, la réaction s'arrête
en différents endroits de la chaîne. 300 à 500 paires de bases peuvent être alignées au maximum avec cette
technique.
On fait migrer ces molécules par électrophorèse capillaire sur un automate : un tube très fin dans lequel il y a un
gel qui permet de ralentir la migration. Les molécules les plus petites migrent plus facilement et arrivent donc
les premières. Une par une on aura la détection de la fluorescence qui permet de reconstituer la séquence.
5/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Autre animation:
http://www.youtube.com/watch?v=lgASqWbemCc&feature=related
Exemple: recherche d’une mutation dans un gène chez un patient; par la technique du
séquençage direct
Pour chaque gène (autosome), on a pour chacun des gène, une copie hérité du père et une copie de la
mère. Au niveau de la région d’intérêt il n’y a donc pas 1 seule région d’intérêt. Il peut y avoir des mutations
héritées du père ou de la mère.
Si il n’y a pas de variations entre les 2 copies. On réalise un mélange des produits d’amplification puis on
compare à la séquence de référence, les deux séquences seront identiques.
Si il y a une variation de fréquence entre les 2 copies, on séquence le mélange des produits d’amplification
puis on compare à la séquence de référence. On va avoir un signal et donc un double pic.
CR : si l'on compare les séquences de l'allèle de la mère et de celui du père entre elles, on peut retrouver des
mutations hétérozygotes.Cependant, si la mutation est homozygote, il faudra alors comparer la séquence à
une séquence de référence, car la comparaison entre les séquences héritées des parents est inutile.
6/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Si on a la même mutation héritée de la mère et du père, on aura 1 seul pic, c’est une mutation repérée
grâce à la séquence de référence.
Séquençage complet :
Dans la démarche d’analyse de séquence d’un gène d’intérêt, il y a la possibilité la plus simple qui
consiste à analyser tous les exons. C'est la méthode la plus complète c’est pourquoi c'est une approche souvent
utilisée . De plus actuellement les coûts diminuent mais plus le gène est grand, plus cela devient fastidieux.
IV. Le pré-criblage
Pour cela, différentes techniques peuvent être utilisées: SSCP, DHPLC, HRM... Elles ont toutes le même
intérêt: obtenir une vue d’ensemble de tous les exons et déterminer quels sont les exons qui sont normaux,
quels sont les exons qui possèdent des variations de séquences.
Cette méthode détecte les exons porteurs d'une variation de séquence, mais ne précise pas quelle est
cette variation. Par la suite, seuls ces exons seront séquencés pour connaître la nature de cette variation.
L'intérêt de cette méthode apparaît surtout pour les gènes de grande taille . Il faut observer les discordances
entre les pics qui indiquent que l'exon est muté.
Tout ceci permet d’établir des stratégies, pour choisir l’examen adapté. En fonction de la suspicion de
diagnostic on va suspecter l’implication de tel ou tel gène. Si le gène est de petite taille la solution la plus
simple est le séquençage complet ou alors lorsqu’ils y a des mutations récurrentes:
ex : mutation récurrente du gène impliqué dans la drépanocytose, on séquence uniquement cette région pour
savoir si la mutation et présente ou non.
7/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Lorsqu’il s’agit d’un gène de grande taille, on parle de spectre mutationnel large (CR : c'est à dire qu'il
existe une grande diversité de mutations possibles pour ce gène) on réalise un pré-criblage mutationnel et un
séquençage ciblé des exons présentant des profils anormaux.
Pour certains gène de grandes tailles comme le gène CFTR (mucoviscidose) on peut rechercher des mutations
récurrentes par séquençage complet.
VI. Microarrays
CR : Array signifie agencement en anglais, ce qui désigne la disposition des sondes sur la lames. C'est un matériau
qui permettra la mise en place de la technique d'hybridation génomique comparative.
Les microarrays, technologie développée depuis les années 90, sont des lames de verre (ou autres matériaux)
sur lesquelles sont déposées des millions de sondes. Les sondes sont de courtes séquences de nucléotides qui se
fixent sur des régions d'intérêt.
Des échantillon d'ADN ou de cDNA (un appartenant au patient et l'autre de contrôle) sont déposés avec les
sondes marquées avec des marqueurs différents (par exemple vertes pour le patient et rouge pour le
contrôle) :marquage différentiel. Démarre alors un hybridation compétitive entre L'ADN du patient, l'ADN
contrôle mélangés et les sondes. On analyse ensuite les résultats en capturant les différents signaux fluorescents.
Le résultat dépend des sondes: en effet, certaines s'hybrident avec de nombreuses régions, d'autres
uniquement avec des séquences spécifiques.
Le nombre de sondes est limité, il faut donc choisir entre une analyse générale (peu précise) sur une grande
quantité de matériel ou une analyse précise sur peu de matériel. Plus on utilise de sondes et meilleure sera l'analyse.
Le but est de mettre en évidence une perte ou un gain de matériel :
permet une détection d'anomalies quantitatives :
- a l’échelle du génome entier (analyse simultanée de tous les chromosomes)
- a l’échelle d’une région chromosomique d’intérêt
- a l’échelle d’un GENE
Pour informations, il n'est pas nécessaire de tout retenir, les microarrays ont été développées pour :
8/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
– Si notre région d’intérêt est présente en même quantité dans les 2 échantillons, la vitesse d’hybridation
sera la même : on aura un mélange équivalent entre vert et rouge : signal jaune-orange.
– Si au niveau de la région d’intérêt, il y a une perte de signal, nous aurons un excès de fixation du
rouge : délétion
– Si on a une amplification de la région d’intérêt , les molécules marquées en vert se fixeront plus
rapidement et on aura une sur représentation de l’échantillon patient: amplification
L’objectif est de voir si il y a une équivalence ou une discordance entre les 2 signaux fluorescents et donc
entre les 2 échantillons.
CR : On peut détecter des anomalies quantitatives (gain ou perte de métériel) à l'échelle du génôe entier,
d'une région chromosomique d’intérêt, ou d'un gène.
Exemple : dans la myopathie, la dysferline présente des exons délétés qui sont difficiles à détecter avec la
méthode de Sanger, mais identifiables avec la CGH array.
9/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Les techniques de cytogénétique moléculaire sont utilisées à la fois pour la détection de microlésions et de
macro-lésions.
Exemples d’utilisation:
génétique : Analyse de gènes exprimés dans les muscles pour le diagnostic que myopathie.
Largement utilisé pour l’identification de profils d’expression spécifique pour déterminer quels sont les
messagers exprimés dans les tissus normaux ce qui permet de définir des groupes homogènes (identification de
tumeurs, classification des tumeurs en différents grades),e t, à une échelle très large de voir quels ARN messagers
sont sur ou sous exprimés par rapport à un contrôle, et donc d'identifier des facteurs pronostiques. Cela
permet donc d'établir des thérapies ciblés, c'est à dire d'agir précisément sur l'ARN sur ou sous exprimé.
Les résultats des analyses en génétique moléculaire (et cytogénétique moléculaire) permettent l'identification
de variations génomiques (par rapport à la séquence de référence). Problème: y a-t-il un effet pathogène ou est-ce un
polymorphisme?
Pour répondre à cela, il faut rechercher des informations dans des bases de données mutationnelles. C'est la
prédiction bio-informatique de pathogénicité. (Cf Cours « Mutations et Polymorphismes »).
10/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Nous sommes passés de l'ère ou le génome humain individuel a été séquencé à partir de la méthode de
Sanger dans un projet international qui a duré plus de 10 ans et qui a couté près de 3 Milliards de dollar:
Human genome Project alors que maintenant il est possible de séquencer en l'espace de 1 semaine un génome
humain pour 10 000 dollars grâce aux séquenceurs à haut débit. C'est une technique qui va être utilisée de
plus en plus en routine d'ici quelques années.
Les futurs médecins (nous) doivent connaître les bases du séquençage à haut débit, la clé : le vocabulaire.
Le séquençage de l’ADN consiste à déterminer l’ordre d’enchainement des nucléotides pour un fragment
d’ADN donné.
Le séquençage à haut débit est un terme générique, il vaut mieux utiliser de préférence: Séquençage de
nouvelle génération / NGS ou encore mieux: Séquençage massif parallèle qui reflète le grand changement de
principe de séquençage, parce que la détermination d’une base est effectuée par des lectures individuelles
répétées.
A partir du matériel de départ on va réaliser une amplification puis individualiser les millions de
molécules pour les séquencer une à une ce qui permet un gain énorme en précision.
Les machines vont générer des millions ou milliards de lectures de séquences (« reads »). En fonction
des capacités de séquençage des machines et de la taille de région d’intérêt on aura pour chacune des bases une
lecture indépendant par un certains nombre de lecture de séquence.
Plus une base de donné sera lue avec un nombre important de lecture de séquence meilleur sera la qualité
de détermination de cette base .
On considère qu'il faut au moins 20 lectures de séquence indépendantes pour avoir une qualité suffisante et
éviter les faux positif.
11/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Grâce aux nouvelles technologies de séquençage, il y a 3 principales stratégies qui se mettent en place :
Il est tout à fait possible de séquencer le génome entier mais de regarder à l’analyse que telle ou telle
région du génome.
NGS- Timeline
12/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
La méthode Sanger qui était d'abord manuelle est devenue automatisée et c'est depuis 2005 que sont apparues
les nouvelles techniques de séquençage qui étaient assez lourdes d'utilisation et liée à des problèmes de
précisions. Il existe maintenant toute une liste de techniques de séquençage à haut débit.
Les techniques actuelles sont basées sur du séquençage de molécules uniques amplifiées de manière
clonale. Il y a déjà des techniques de 3ème génération, on passe à du séquençage direct de molécules d'ADN
individuelles, ceci est associé à des miniaturisation.
– Illumina (la plus utilisée) similaire à l’approche Sanger, basé sur la détection successive de DDNTP
fluorescents. L'amplification se fait sur une lame
– Technologie ion Torrent: utilise la détection de variation de pH à chaque incorporation de nouveau
nucléotide.
13/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
On a une croissance exponentielle des capacités de séquençage depuis 10 ans associée à une diminution
des couts.
Des nouvelles techniques qui permettent de séquencer de plus en plus avec la comercialisation de
machines qui ont des capacités de séquençages d’environ 20 000 génomes par an 1000$ / génome. Certains
pays ont des projets de séquençage des populations (ex : Angleterre ).
Il y a maintenant des sociétés privées qui proposent le séquençage pour des tarifs au alentours des
2000$ . Il y a toutes les problématiques d’interprétation. ( Ceci ne se fait pas en France, lois très rigoureuses)
Les nouvelles techniques de séquençage ont 2 applications majeures: elles ont été très utilisées dans le
domaine de la recherche et ont permis d'identifier de nouveaux gènes de maladie génétique; ainsi que pour
des applications à visée diagnostique.
Le séquençage de la totalité des exons codants a été utilisée pour la 1ere fois en 2009. Une équipe
américaine a montré qu’il était possible d’identifier rapidement des gènes inconnus impliqués dans des
pathologies humaines : identification en 2011 par NGS d’un gène de myopathie.
La simplification des machines, pouvant alors être plus facilement implantées dans les laboratoires
hospitaliers a permis la vulgarisation du séquençage. En France il y a eu un plan national d'équipement des
CHU.
Dans le domaine diagnostic, il y a eu des preuves de principes de l’intérêt de ces approches. On retrouve les 3
techniques : Séquençage de panel, séquençage de l'exome, séquençage du génome entier.
Point important :
Malheureusement, même en effectuant des analyses beaucoup plus larges, le rendement de diagnostique
est loin d‘être complet,le taux de résolution actuelle globale est de 1 cas sur 4 Si on prend un patient atteint de
myopathie ou va avoir un diagnostic dans 1 cas sur 4 (avant ce rendement était d'un cas sur vingt).
Ceci est probablement lié à 2 facteurs majeurs: nous ne connaissons pas tous les gènes impliqués dans les
pathologies humaines, il y a probablement beaucoup de gène qui sont mutés que dans de très rares familles.
Probablement il y a des mutations que nous savons mal interpréter, mal détecter à ce jour, par exemple les
mutations dans les parties non codantes. Il y a également des mécanismes complexes avec des mutations
concomitantes et donc un effet cumulé responsable de la pathologie.
Cela consiste en une étape de génération des données de séquençage et une étape d'analyse des
données de séquençage.
• Tout d'abord pour la génération des données de séquençages: on retrouve les approches vu
précédemment (panels de gène, exome, séquençage complet). Il y a toujours une étape de
fragmentation de l'ADN. On réalise le séquençage plus ou moins complet. Pour un séquençage
précis, on réalise une étape d'enrichissement en régions d'interêt avec la PCR. Cette étape
consiste à ne retenir que la région d’intérêt pour l'analyse. Ensuite il y a une étape
d'amplification clonale et enfin une étape de séquençage pur permettant d'obtenir les lectures
de séquences. CR : la génération des données de séquençage se fait par la lecture de séquence.
La détermination d'un base se fait par lectures individuelles répétées.
• Une fois que les données de séquençage ont été générées. L’étape la plus importante consiste en
l'analyse des données de séquençage avec différentes étapes. Tout d'abord une étape
d'alignement: on va repositionner les séquences générées par rapport à la séquence de
14/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
référence . Une fois que toutes les lectures de séquences ont été repositionnées, il y a une étape
importante de contrôle qualité.
• Profondeur de lecture, en verticale : correspond au nombre de lectures indépendantes pour chacune des
bases par le séquenceur . Si une base a été lue 20 fois on dira qu'elle a une profondeur de 20x.
Plus on a de lectures de séquence pour une base donnée meilleure sera la qualité de détermination de la base.
On souhaite séquencer chacune des bases , si on dit que la région d’intérêt a été séquencé à 90% à 20x
cela veut dire que 90% des bases ont été lu 20 fois chacune.
On souhaite obtenir 100% de la région d’intérêt analysé par au moins 20x .
15/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Ceci est un élément clé de la technique séquençage. Cela permet de savoir si l'analyse est de qualité
suffisante. Il y aura des régions très bien séquencées et d’autres moins bien séquencées ce qui entraîne des
risques de faux négatifs.
On peut introduire la notion de seuil de détection, on peut dire qu'on détecte un signal que s'il y a eu au moins
20 lectures de séquence.
Ces techniques consistent à comparer les données de séquençage du patient par rapport à la référence et
donc avoir une liste de variations de séquence par rapport à la référence. Parmi les mutations, il faut
déterminer celles qui sont pathogènes.
L’annotation correspond à recueillir un maximum d’information, grâce aux bases de données, aux
logiciels de prédiction informatique ce qui permet de filtrer les variants et retenir ceux qui semblent pathogènes
et impliqués dans la pathologie en question.
16/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
Dédicace à tous ceux qui n'ont toujours pas récupéré du WEI … #jailacrèvedepuis1mois #fragile
17/18
GENETIQUE MEDICALE – Principe des études moléculaires en génétique médicale :
Méthode d'analyse des micro-lésions du génome
18/18