Vous êtes sur la page 1sur 17

UE 8.

10 - Outils pour les analyses -omiques


Partie 1 - Les analyses à haut débit (génome, transcriptome, protéome, interactome)

I. Définitions

Génome : Génomique :
- Ensemble du matériel génétique d’un organisme - Discipline visant à étudier le fonctionnement et la
comprenant les parties codantes et non codantes y structure d’un organisme à travers son génome
compris le matériel génétiques des organites. → génomique structurale
- Il peut être haploïdes, diploïde ou polypolïdes. → génomique fonctionnelle
L’ADN mt ou chloroplastique est nécessaire au bon
fonctionnement de l’organisme.
- On a tous le même génome à peu de chose près.

Génomique fonctionnelle :
- Etude de la régulation des gènes, de leurs fonctions et interactions. Elle peut être faite à 2 échelles :
- Transcriptome = ensemble des transcrits présents dans des cellules appartenant à un tissu donné et dans un contexte
physiologique ou environnement donné (+ facile à analyser)
- Protéome = ensemble des protéines présentes dans des cellules appartenant à un tissu donné et dans un contexte
physiologique ou environnemental donné.
- Au sein de notre organisme, normalement toutes les cellules ont le même génome, mais pas le même transcriptome et
protéome. On a des protéines qui seront produits de façon constantes.
- Des régulations peuvent se faire au niveau traduction et post-traductionnelle etc.
- Ex : plante (pas les mêmes protéines dans la tige, la feuille etc.)

Augmentation de la complexité liée au niveau d’analyse


- 21 000 gènes chez l’humain qui est diploïde
- Poisson zèbre et xénope sont tétraploïdes (2X + de gènes)
- Epissage alternatif + édition → 100 000 transcrits à partir de ces 21 000 gènes.
- Si on compte après modifications post-traductionnelles, on estime 1M de protéines différentes.
- La protéine est l’effecteur final, mais certaines sont inactives.
- On peut étudier les variabilités internes entre même organismes avec le séquençage maintenant.

 Les enzymes vont produire des produits et l’analyse de toutes les synthèses et les dégradations sont le métabolome

Métabolome Interactome
- Ensemble des produits des réactions enzymatiques - Ensemble des interactions molécules (protéines-
(métabolites) dans les cellules appartenant à un tissu protéines, ADN-protéines etc.).
donné et dans un contexte physiologique ou
environnemental donné.
- Détection de petites molécules < 1000 Da

Les omiques
- Toutes les techniques permettant d’étudier simultanément l’ensemble d’une catégorie de constituants (ARN, protéines,
métabolismes carbohydrates, glucides, lipides, …) de cellules appartenant à un tissu donné et dans un contexte
physiologique (ex : comparaison avec cellules cancéreuse) ou environnemental (ex : effet des polluant sur l’expression des
gènes) donné.

Génomique structurale 
- Séquençage systématique
- Bioinformatique (cartographie, annotation = trouver gènes, promoteurs, exons, introns et identifier des gènes)
- Techniques de localisation des gènes

Génomique fonctionnelle
- Transcriptomique : Hybridation sur des matrices (arrays) ou des puces (chips). Séquençage à haut débit
- Protéomique : Electrophorèse 2D, 2D-DIGE/ Spectrométrie de masse
Définitions
Les enzymes vont produire des produits et l’analyse de toutes les synthèses et les dégradations sont le métabolome

Métabolome
Ensemble des produits des réactions enzymatiques (métabolites) dans les cellules appartenant à un tissu donné et dans un contexte
physiologique ou environnemental donné.
Détection de petites molécules < 1000 Da

Interactome
Ensemble des interactions molécules (protéines-protéines, ADN-protéines etc.).

Les omiques
Toutes les techniques permettant d’étudier simultanément l’ensemble d’une catégorie de constituants (ARN, protéines,
métabolismes carbohydrates, glucides, lipides, …) de cellules appartenant à un tissu donné et dans un contexte physiologique (ex :
comparaison avec cellules cancéreuse) ou environnemental (ex : effet des polluant sur l’expression des gènes) donné.

Génomique structurale :
- Séquençage systématique
- Bioinformatique (cartographie, annotation = trouver gènes, promoteurs, exons, introns et identifier des gènes)
- Techniques de localisation des gènes

Génomique fonctionnelle :
- Transcriptomique : Hybridation sur des matrices (arrays) ou des puces (chips). Séquençage à haut début → ce qu’on va
faire !
- Protéomique : Electrophorèse 2D, 2D-DIGE/ Spectrométrie de masse

Définition les omiques

Métabolomique : Interactomique :
- Spectrométrie infra-rouge - Co-purification
- Spectromère de masse, - Spectrométrie de masse,
- RMN - Crible et analyse double hybride

→ Études à large échelles qui donnent des résultats globaux


→ Ces résultats servent souvent de bases à des plus études plus ciblées.
I. La transcriptomique 
1) Contrôle qualité des ARNs
- ARNms correspondent à 1-3 % des ARNs totaux extraits (ARNr représentent 80 %
des ARNs totaux, principalement le 28S, 18S)

- On fait un contrôle qualité des ARN !!! (on fait pas le rapport 260 /280 = 1,2 – 1,8 ici)
- → on voit 2 bandes, celles de 28S et 18S

- On fait une électrophorèse capillaire dans un tube.


- On a un intercalant qui permet de visualiser l’acide nucléique et on aura un pic qui va se
former.

- Ils migrent selon leur poid moléculaire (les 1er à gauche et les dernier à droite) , on a 2
gros pic pour 18S et 28S, et on a le petit pic à 5s.
- Entre, on a au dessus de la ligne de base, nos ARNm

- On va calculer des ratios entre 28S et 18S (c’est-à-dire l’aire sous le pic)
- Plus l’indice de pureté est élevé, plus l’ARN sera pure.
- À droite, on a l’ARN dégradé, on a plusieurs fragments, donc on a une grosse masse.
- Et on les transforme vite en ADN.

1) Analyse par micrro-array


Préparation des échantillons
- En générale, à partir de ces ADNc qui ont été polymériser, ils repolymérise une
molécule d’ARN car l’hybridation se fait mieux.
Ils repolymérisent un ARNc qui a une séquence complémentaire.

- Ces ARN complémentaires sont ensuite marqués.


- Pour les études de micro array, on peut étudier plusieurs échantillons en même
temps (on peut comparer 2 échantillons dans une même puce) et seront marqués
par des fluorophores différentes (cy3 en vert et cy5 en rouge)
- Les ARN complémentaires seront utilisés pour faire la puce sont marquées : ARN
provenant des tissus sain (vert) et tout ceux provenant du tissu tumoraux (rouge)

Préparation des puces


- On a les 2 échantillons marqués avec fluochromes.
- Indépendamment, on a commandé des puces (maximum taille des
lames de microscope jusqu’à 8 comparaison indépendamment)
- Donc une lame de microscope c’est 8 manip différentes.
Statistiquement, les résultats obtenues, il faut au moins 8 échantillons différents d’une
modalité pour que ce soit fiable.
- Pour ces puces, il faut au préalable, au moins le transcriptome de
l’espèce considéré est séquencée (au mieux le génome).
- Au sein même d’un seul de ces 8 carrés, on a des micro-cellules (peut avoir jsq 60k micro-cellule au sein d’un même
carré.
- Dans chacune de ces cellules, on a une sonde spécifique pour un transcrit.
- On a 21 000 gènes, 60 000 cellules, donc on pourra faire 3 comparaisons (3X la sonde 1, 3X la sonde 2 …)
- Pour des conditions particulières, des puces peuvent être commercialisées.
- Pour des études plus spécifiques, il est possible d’envoyer la liste de 21 000 amorces et designe la puce de manière que la
sonde 1 soit distribué dans toute la cellule.
- Chacune des cellules, on a une comparaison de ces 2 tissus.
- Erreur = 1M5 sonde par puce.
- Dans chaque puits sont greffé des groupements OH, par photolithographie.
- La photolithographie vont fabriquer des « masques » pour masquer certaines cellules et émettre la lumière qui va couper la
liaison OH dans les parties non masqué où on aura une extrémité OH libre.
- Puis on fait une ligation du nucléotide qu’on veut mettre et on cache le reste etc.
- Le nucléotide incorporé contient l’agent protecteur ?
- Photolithographie: minimum 25nt en amorce (général 60nt) pour une hybridation correcte pour avoir la meilleure
spécificité.
- On va alors hybrider nos 2 ARN complémentaires
- Ici, l’image représente 1 cellule (rappelle 8 par manip)
- On a nos ARN c chacun avec un fluochrome, on fait un mélange équimolaire des 2 et on la
dépose sur la cellule et on fera une hybridation.
- Plusieurs cas de figure…
- Le gène est exclusivement exprimé dans les cellules tumorales, donc hybridation des ARN
en rouge.
- Le gène est exclusivement exprimé dans les cellules saines, que hybridations des ARN c en
vert.
- Ou mélange des 2 deux (en générale).
- → Comparaison où on aura des mélange des couleurs.

Principe de la technique
- Ici, on a un robot qui va exciter d’abord le rouge, enregistrer le niveau d’intensité de fluorescence, il va scanner toute la
puce en rouge. Ensuite il scanne toute la puce en vert.
- Il va comparer les deux en ayant (soit rouge soit vert, soit orange-jaune)
- (Rem : noir = hybridation ne fonctionne plus, soit pas de présence du gène).
- Merge = superposition
- + tableaux excel avec 60 000 sondes avec 1 valeur
- 1 semaine de manip et après tout les autres mois dans l’analyse…

Comment analyser les résultats obtenus ?


- Si un gène est 2X exprimé, ça a de la valeur ? Où il faudrait 10X + ? il
faut choisir le seuil selon le contexte biologique.
- En pharmacologie, le seuil est très faible…
- Exemple : 4 gènes exprimés 10X et 10 000 gènes exprimés + de 2X,
comment fait-on ?
- Il faut au moins 6 qui marchent parfaitement, avec 8 cela nous donne de la
marge.

Comment analyse-t-on les problèmes de variabilité inter-individuelle ?


- Ex : au sein d’une même ponte, rien nous garantit que tous les ovocytes étaient homogène d’un point de vue
transcriptomique.

Est-ce que dans la cellule en haut à gauche, on a bien étaler dans la cellule en bas à droite ?
- Tout ce qui est technique quantitative, on fait une gamme étalon…
- Quand on calcule une efficacité (+ ou – 20 % par exemple), si on dérive de 20 % de cette droite, on estime qu’on est encore
sur la quantification, c’est une estimation.
- Tout ce qui est fiable, c’est noir.

Ceux qui sont proches de la ligne, pourquoi ne serait-il pas fiable ? Et celui-là pourrait être
intéressant pour nous.
- 4 puces → 32 échantillons par exemple
- On a des contrôles internes pour vérifier qu’on a mis la même quantité partout.
- Vérifier : est-ce que les gènes qui sont censés bougés ou pas ? Est-ce que les gènes qui sont censés
ne bouge pas ne bouge vraiment pas ?

Exemple / Signification des résultats


Chaque ligne = un gène
150 gène sont vert moins exprimés dans les cellules tumorales que dans les cellules saines et
2000 gènes qui sont plus exprimés dans les cellules tumorales que dans les cellules saines.
En haut → oncogène
En bas → suppresseur de tumeurs potentiel
Très fiable et 7000 euros pour 32 échantillons.

I. Le séquençage
Historique séquençage
- 1956 : ADN identifié par Watson et crick & rosaline
- 1973 : 1er séquençage chimique
- 1980 : 1er séquençage avec des polymérase par Sanger
- 1982 : 1ère banque de donnée
- 1983 : PCR
- 1987 : 1er séquenceur automatique
- 1998 : 1er génome séquencé pour la 1ère fois
- 2000 : séquence du génome humain
- Depuis 2005 jusqu’à 2012 seulement juste des amélioration (nouvelles générations de séquençage avant 10 ans →
maintenant 1 mois)

1) Premiers séquençages du génome : Shotgun sequencing


- 1er séquençage (10 ans mobilisé par 100 personnes)
- Ils ont coupé le génome en petits morceaux (100 – 1000 pb max) et ont séquencé
chacun de ces petits morceaux.
- Il faut que chaque région de l’ADN soit couverte 4X pour être sure (erreur de
séquençage à l’époque)
- 3 séquences juste sur 4 pour validé !
- Chacun de ces fragments a été cloné dans un plasmide dans une bactérie, congelé
et séquencer.
- Séquence de chacun des inserts et on assemble les séquences et on reconstitue l’ensemble du génome.
- Bioinfo → identifier les introns / exons / promoteur / codon stop …
- En 2000, les ARNnc n’étaient pas connues. Connue chez les C. elegans
- A partir de 2005, connues chez les autres espèces.

1) Séquençage à haut débit

2) Séquençage par amplification d’ADN


- On envoit les ARN
- Préparation des banques d’ADN (commune à tout le monde)

Préparation des échantillons/ des banques de données


- Selon la technique, génomique structurale → on a des fragments de 50 pb à
séquencer à chaque fois
- Quand on a le transcriptome, on fera de l’ADNc et on fera de l’ADNdb qui sera
couper en morceaux.

- Ils vont phosphoryle les extrémités 5’ de l’ADNdb et ils vont rajouter un A en 3’.
Ce A va permettre la ligation d’un adaptateur (soit en position 5’ soit en position 3’).
- Ce groupement phosphate va permettre de liguer un adaptateur.

- ADN bleu = insert

L’adaptateur c’est le reste, et on a 3 parties :


- une région complémentaire à la cellule (matrice)
- une région indexe (code barre pour savoir quelle est la séquence qu’on va
séquencer)
- une séquence qui va permettre le séquençage

Adaptateur binding
- Dans plusieurs matrices, on aura amplification des banques sur une matrice.
- La partie externe de chaque adaptateur aura une séquence complémentaire de séquences qui seront greffé sur la matrice
(hybridation).
- En bleu, on peut avoir des séquences complémentaire de la partie bleue.
- On a une séquence en vert qui sera complémentaire de l’amorce (flèche vert)
- → ici, on se base sur la PCR
- Amorce qui va permettre l’amplification du gène.
- On a une partie qui permet la liaison avec la matrice, ensuite on a le code barre, et ensuite une partie qui permet
l’amplification
- Toutes ces techniques (microarray), il faut connaître la séquence !!!
- On verra des techniques de séquençage où on n’a pas besoin de connaître la séquence

2 types de PCR :
- PCR phase solide
- PCR en émulsion

PCR en émulsion
- PCR en émulsion, sur chaque bille on aura l’amorce
complémentaire de l’adaptateur.
- L’idéale est que sur chaque bille, on ait qu’un seul
type de produit PCR qui est amplifié.
- On aura une amplification
- 1ère étape : On va avoir synthèse du brin
complémentaire attaché à la bille.
- Dans l’idéale, ces fragments vont se mettre sur la
même bille.
- Après plusieurs cycle, on aura une bille sur lesquelles
sont greffés les inserts d’intérêt.

- Chaque bille = micro-réacteur


- On évite des billes qui ont plusieurs types d’insert, on les élimine.
- On a 3000 réactions en parallèles en 1 manip donc 300 000 gènes en même
temps.
- Les codes barres vont permettre d’identifier les gènes d’intérêt.
- Sur une bille, on peut avoir plusieurs copies de millier de gènes
- → Fonctionne mais peu efficace…
- Ensuite, ils vont mettre chacune des billes individuellement dans une plaque de
verre où il y aura des alvéoles.
Une bille avec des inserts, chacun dans un puit.
- Ils vont ensuite greffés ces billes dans un milieu humide.

Amplification PCR par pont « Polony » = amplification en phase solide

- PCR avec une polonie de bactérie.

- Cette fois ci, on a une plaque, pas un micro-réacteur.


- Mêmes principes d’adaptateur, les mêmes adaptateurs, et même principe de PCR.
Sauf que cette fois-ci, on aura à un endroit des séquences complémentaires de chacun des adaptateurs.
- On met l’ADN, il reconnaît sa séquence de reconnaissance, l’ADN va s’hybrider et l’autre côté adaptateur a une séquence
complémentaire d’une autre séquence de reconnaissance de la matrice.
- On va amplifier avec PCR la séquence complémentaire et on refait un cycle.

- Il y a polymérisation et de l’autre côté l’adaptateur a une séquence complémentaire d’une séquence de la plaque, on
dénature mais un brin va rester accrocher qui va s’hybrider sur la séquence à proximité et il y a de nouveau amplification.
- On se retrouve avec une plaque de verre (taille d’une lame) et des colonies qui auront poussé à l’aide de la technique de
PCR.

- Sur chacune des plaques, on a une ligne et chaque ligne correspond à un échantillon
(donc 8 séquençage en 1 manip)

- Après séquençage, sur chacune des 8 lignes, on aura des polonies qui seront faites au
hasard.

- Il peut y avoir plusieurs millions de polonies sur une ligne

Séquençage par détection de proton


- Lorsqu’on a polymérisation d’un AN, on a ajoute d’un nt supplémentaire en 3’OH qui va
permettre la libération d’un H+ due à l’interaction entre l’oligont et l’ OH en 3’.
- Cette technique permet la détection des protons.
- Ici, on a fait une PCR en émulsion en préalable, chaque bille correspond à un ADNc et chaque bille a été mis
dans un puit.
- A chaque fois qu’ils vont mettre dans un chaque puits (ex : A) si la
polymérisation se fait parce que la matrice possède un T, détection d’un
proton.
- Si on en a plusieurs, la hauteur de pic de détection sera aussi importante qu’il y a de nucléotides.
- On a une plaque avec des puits (comme des alvéoles) → 1-2M sur une seule plaque.
- Une fois le détecteur passe tous les puits, on nettoye, on lave et on met un autre nucléotide
- Inconvénient des séquençages NGS = une la fois la plaque dans la machine, il faut entre 3 jours et une semaine pour faire la
manip, mais c’est fiable.

Pyroséquençage
- Principe de Sanger : Polymérase
- L’ADN pol incorpore un nt, ce qui entraine la libération d’un pyrophosphate qui sera détecter.
- Ce PPi est utilisé avec l’APS par la sulforylase pour donner de l’ATP+ SO4 2-
- ATP utilisé par la luciférase et on détecte la lumière.
- + on a d’ATP dans le milieu, + l’intensité de la lumière sera
important.
- 1ère grande barre rouge = 6T
- Ensuite 2 A, etc.

Séquençage par ligation (SOLID) (imprimer les diapos 42 à 62 du 1er diapo


transcriptomique)
- Seul technique qui n’utilise pas la polymérisation comme technologie

- On a la séquence d’ADN, l’adaptateur qui a une séquence connue dont une amorce s’hybride dessus.
- On a aussi des amorces aléatoires.
- On a un code couleur, pour un code couleur, on a 3 possibilités, on ne connaît pas à l’avance.
- On met l’ensemble des nucléotides.
- On va voir quels nucléotides va s’hybrider.
- La séquence en noire est inconnu et donc une amorce aléatoire va se fixer.
- Le code couleur correspond au fluochrome.
- Si fluorescence est verte, on aura les 4 couples (4 cercles verts) parmi les 16.
- On fait ça sur l’ensemble de la base.
- On a des nucléotides qui vont s’apparier (3) parfaitement mais 2 nucléotides ont 16 possibilités.
On ligue a chaque fois un fragment.

- Puis on refait un tour, mais cette fois-ci l’amorce de départ (sur l’adaptateur), on enlève un nucléotide et on connaît le 1 er
nucléotide et on refait la même chose.
- Comme on a enlever un nucléotide, on connaît le nucléotide (ici T), on reconnaît les 3 premiers nucléotides du coup → T, A,
C (amorce = A, T, G)
- On continue comme ça jusqu’au bout, il faut garder en mémoire toutes les possibilités.

- On continue en enlevant un nucléotide supplémentaire


- Ici, forcément GA (il nous reste plus que 2 nt qui nous manque)
- 3ème primer, on sait qu’on a un C, il nous faut un G
- Un dernier run
- Après plusieurs tours, au bout du 5ème run

Résultat final
- Ici, on a l’ensemble des run.
- Au 1er on a la primer n et au bout de 5 run, on
a à la séquence.
- On décale à chaque fois d’un nucléotide.
- Ici, PCR par polonie ou émulsion
Séquençage par cycles (Illumina)
- La plus récente et la plus utilisée
- Ici, PCR par polonie au préalable.
- On a nos polonie sur la plaque de vert (8 séquençages), on va mettre
une amorce complémentaire des adaptateurs et à partir de là, on
rajoute chacun des nucléotides qui sont couplés à un fluochrome.
- 4 nucléotides et 4 fluochromes et
on met l’ensemble des nucléotides
en même temps.
On a une polymérisation et le laser va détecter l’intensité du
fluochrome.

Remarque : séquençage haut débit


- Tout ce qu’on a vu, c’est le NGS (next generation sequencing)
- Des next next generation sequencing maintenant…
- La différence est que là on peut séquencer directement les ARN.
- On fait abstraction des préparations des échantillons (faire les ADNc, casser les ADNc, amplifier les ADNc,
…)

Préparation de la banque d’ADN (Hélicos)


- On prend les ARN, on les coupe en morceaux et on rajoute la queue poly A avec un ddNTP en 3’.

Séquençage par cycles


- La queue poly A va reconnaître l’adaptateur et on a une RT qui va produire un ADNc à partir de l’ARN.
- On aura des nt qui seront fluorescents, et on va émettre / lire à chaque endroit l’émission de fluorescence.
- → pas forcément de polonies au départ et détecteur de fluorescence plus important.
- Ici, ils ont modifié les cellules qui vont enregistrer la fluorescence sont beaucoup plus sensible.
- Cette fois-ci, on récupère les ARN, on les coupe en morceaux, on rajoute une queue poly A et la banque est
prête.
- Pas de PCR (plus d’erreur de PCR)
- Peu de problème de contamination car on limite les manip.
- On peut tester tous types de tissus…
- On a une quantification absolue (vrai aussi pour illumina), un spot représente un ARN.
-
I. Récapitulatif des différentes technologies
- Le plus rapide est le pyroséquençage (10h pour une manip c’est-à-dire 10 échantillons)
- Le plus long est illumina (14 jours pour une manip)
- 1 read = un seul fragment
- Plateforme ont un logiciel d’assemblage car on séquence quelques pb par quelques pb.
- Le moins chère c’est la ligation 500$ pour 8 échantillon.
- 20 000$ dollars pour 8 échantillons illumina (25 000 – 30 000 euros)

Bilan sur les méthodes transcriptomiques

Pourquoi faire de la transcriptomique ?


- Recherche de « biomarqueurs » d’une condition physiologique (maladie, pollution, contrôle qualité).
- Étude de l’effet d’un traitement.
Comment traiter les données ?
- Prendre des gènes selon des critères scientifiques et étudier plus particulièrement leur rôle, expression … dans le contexte
physiologique.
- Faire ressortir des signatures (indicateur) moléculaires d’un état physiologique.
- Comprendre les liens entre des fonctions biologiques et le contexte.

I. Analyse de Gene Ontology


- Analyse bioinformatique visant à structurer la description des
gènes indépendamment de l’espèce d’origine.
- Chaque gène est qualifié selon sa localisation intracellulaire, sa
fonction moléculaire et le processus cellulaire dans lequel il est
impliqué.
- Logiciel qui caractérise pour chaque gène identifié, recherche
toutes les fonctions biologiques identifiées à une protéine, les
assigne à une protéine et assigne chaque protéine à 1 ou plusieurs
processus.

I. Cas particuliers
- Cas particulier pour les micro-array avec des questions scientifiques
différents = Tiling Array
- → déterminer des séquences particulières dans l’ADN
- Ici, identification des bordures exons-introns, identification des brins méthylée,
CHIP
- Ici, on prend des sondes spécifiques des exons, des sondes spécifiques des
introns et des sondes exons-introns (entre les 2).
- Toutes ces sondes vont être placées sur les puces.
- On va mettre notre transcriptome (nos ARN), l’idée est de savoir le rapport entre le signal de l’exon 2 et le signal entre les
deux pour savoir si tous les ARN subissent ce lien intron-exon.
- → Proportion d’un splicing alternatif par rapport à un autre splicing alternatif
- Peu de signal, car on a l’ARN pré-messager à un instant t s’il n’y a pas eu encore d’épissage.

Les tilling arrays


- On prend des sondes qui reconnaissent
chacune des parties du gènes
- On met des ARN sur la puce et on regarde quelle sonde est la plus
exprimée.
- Normalement pas de signal sur les introns
et voir les parties qui sont
présentes sur les ARN…

- On a donc la localisation d’un gène sur le brin (5’ → 3’) ou sur l’autre
brin (3’ → 5’)
Inconvénient : très long …
UE 8.10 - Outils pour les analyses -omiques
Partie 2 – Etude du protéome et des interactions moléculaires

I. Les puces à protéines


Buts : Contraintes : Impact :
- Détecter et quantifier les protéines - Les protéines doivent rester - Nature des agents de capture
présentes dans un lysat. dans un milieu humide. (AC, aptamères, affibodies).
- Identifier des interactions inter- - Les protéines doivent rester - Attachement des molécules au
moléculaires. dans leur structure 3D optimale. support solide.
- Déterminer des cinétiques, des - Les protéines doivent rester - Détection des protéines.
affinités et des spécificités fonctionnelles.
d’interactions. - Obtenir des banques de
protéome les plus complètes
possible.

Construction d’une banque de protéome


- Lié à des bases de données de transcriptome.
- On va faire des clonages avec des ADNc, et on les fait dans
des vecteurs d’expression.
- En même temps, il faut qu’on puisse cloner toutes les
séquences d’ADNc qui peuvent correspondre au protéome
complet, y compris les ARN qui ont un splicing alternatif.
- On veut les 100k transcrits qui codent les protéines et le faire
dans un minimum de temps et à la fois tous les AN.
- On a l’ORF qui est flanquée de chaque côté de site de
recombinaison homologue et ces sites nous affranchissent des
ER pour le clonage.
- Quand on a reconnaissance de ces sites, on a recombinaison
homologue.
- On clone nos fragments d’intérêts dans un vecteur donneur (pas un vecteur d’expression), on va avoir une base de donnée
réutilisable.
- On a un gène de résistance à un antibiotique.
- Selon le type d’organisme et la technologie utilisée, il faudra un plasmide d’expression spécifique (soit procaryote soit
eucaryote → insecte / oiseaux / …).
- Par recombinaison homologue, on peut faire une 2ème recombinaison pour le mettre dans le plasmide d’intérêt.
- On transfecte et veut purifier les protéines.

- A partir de notre plasmide dans laquelle on a cloner notre séquence


d’intérêt, par recombinaison homologue on peut les remettre dans un plasmide spécifiques
(ex : GST, Tag histidine, double hybride, …)
- Pour vérifier, on a des amorces particulières pour pouvoir fabriquer nos clones.
- En violet, on a un brin sens et anti-sens = brin complémentaire de l’ORF qu’on veut
produire.
- Certains ont des sites d’initiation de transcription RBS et des sites de traductions etc.

L’attachement des molécules


On a notre protéome, on a amplifier la banque, comment faire la puce ?
Comment on attache les protéines ?
- On peut greffer des liaisons peptidiques mais on ne saura pas le sens C-ter ou N-
ter…
- La protéine pas orientée = 0 ctrl de son orientation et on ne sait pas ce qui est
greffé.
- On a aussi ensuite des ligands, en générale (avidine – biotine) → interaction forte.
- On a de l’avidine ou de la biotine sur la plaque et on fait une protéine de fusion dans laquelle la protéine d’intérêt est liée à
l’avidine ou la biotine → ici on oriente la protéine.
- On peut mettre la biotine ou l’avidine en N-ter ou C-ter…
- Avoir cette protéine de fusion peut avoir un effet sur la protéine…
Agents de capture
- On lie les protéines à la plaque de verre avec le modèle avidine – biotine.
- On peut avoir aussi des peptides qui vont reconnaître les protéines d’intérêt.
- Ces puces à protéines sont très utilisées pour la recherche d’allergie (greffe d’allergène)
- Les aptamères sont des AN qui ont des séquences qui peuvent être reconnu par des protéines.
- → facile à greffer et souvent on a les AC pour reconnaître.

Détection (molécules marquées)


- Une fois qu’on a greffé la protéine d’intérêt, comment détecter ?
- La fluorescence ne fonctionne pas bien, on ne greffe pas sur la
protéine.
- On greffe sur les AC sur la partie FC.
- Soit il greffe des nano-particules qui vont émettre + de lumière que le
fluochrome.
- Les Quantum dot : on a un AC qui va être excité, au lieu de mettre de
la lumière, émission de particules. (la prof est pas sure)
- Ou on a des amorces qui sont couplées à un fluochrome qui s’hybrident sur l’oligo et c’est l’ensemble
de fluorescence qui est détecté.

Les quantums dots : nanoparticules semi conductrices ayant des propriétés optiques et
électroniques comparables aux LEDs.
Large gamme d’émission à partir de l’exposition aux UVs.
→ augmente l’identification de plusieurs protéines en même temps

- On a aussi des détections par résonance de surface.


- L’idée est de déterminer la quantité de protéine particulière dans un échantillon.
On a des AC greffés sur une plaque fine d’or et quand on interaction entre la protéine
d’intérêt et l’AC, cette plaque d’or va bouger (on modifie la surface et donc la convexité
de la surface).
- On a un rayon lumineux qui va être refléter sur cette plaque d’or et cette réflexion aura
un angle d’incidence particulier, si on modifie la convexité de surface, on modifie
l’incidence particulier.
- → on mesure la différence des angles d’incidence.
- + l’interaction prot – AC, + on aura une modification d’angle importante
- → reflète l’affinité de la protéine avec l’AC.

Applications

- On a fait nos banques à partir de nos échantillons.


- On fait une puce (AC ou ligand ou protéine qui se lie → diversité de ligands greffé) et
on compare différents fonctions biologiques.
- Puces à protéines = questions scientifiques particulières (ex : détection de IgE spécifiques des
allergènes).
- On peut aussi identifier les récepteurs sur lesquels agissent les médicaments.
L’idée est que toutes ces puces, il faut cibler les questions scientifiques (pas
d’étude à large échelle).
- En général, il faut cibler des fonctions particulières du fait de la difficulté de faire des
plaques/puces

3 types de puces pour 3 types d’applications :


- Des puces analytiques :
o Identifier les protéines d’un mélange selon leur affinité, spécificité, niveau d’expression.
o Le plus souvent les agents de capture sont des AC.
o La spécificité d’un AC est espèce dépendante pour la plupart.
- Des puces fonctionnelles :
o Analyser la capacité des protéines à se lier à un ligand spécifique (protéine, ADN, phospholipides …) → Fonction
particulière
- Reverse Phase Protein Muicroarray (RPA) :
o Les protéines d’un lysat cellulaire sont attachés à une membrane de la nitrocellulose et la révélation est faite avec un
AC spécifique de la protéine d’intérêt. (ex : allergène)
o → ici aussi on cible la fonction biologique

Exemples
Exemple de puce fonctionnelle
- Ils ont attaché des protéines qui avaient des groupements phosphate.
- On va faire passer un lysat cellulaire.
- L’idée : si on a des kinases dans le milieu, elles vont reconnaître des groupements
qui peuvent être phosphorylés et donc on aurait interaction entre la kinase et la protéine
d’intérêt.
- Cela ne suffit pas, il faut faire en + des analyses fonctionnelles pour vérifier que
l’attachement sur une plaque est peut être différent que in vivo l’interaction donne
une fonction.

- Cette fois-ci, on a mis des protéines qui ont un domaine de liaison à l’ADN, on va faire passer des séquences d’ADN
marquées.
- L’idée : Savoir où vont être attachés les molécules d’ADN pour savoir quels facteurs de transcription ou protéines vont se lier
à quel domaines / séquences de l’ADN pour activer ou réprimer une fonction biologique.

Exemple de puce RPA

- Cette fois-ci, un lysat protéique d’intérêt qu’on va accrocher


sur les puces (dans ce cas là les puces sont des membranes de
nitrocellulose → plus grand)
- Ils font passer des AC pour savoir quelles protéines sont dans le
lysat.
- On a 2 lysats cellulaires : tumorales et saines
- Quantification et comparaison

I. Technique d’hybride
1) Double hybride
 Interaction protéine – protéine qui se fait chez la levure.
On fait 2 protéines de fusion :
- l’une qui va être entre la protéine d’intérêt et le domaine d’interaction de l’ADN d’un
facteur de transcription
- l’autre avec un gène lié au domaine BD (binding domain) et un gène lié au domaine AD (activation domain)
Si ces 2 domaines d’interactions interagissent, AD et BD sont proches et on aura transcription des
gènes.
→ utilisation du gène rapporteur.

- Appât est notre insert (faire attention au code de lecture)


- BD se trouve déjà dans le plasmide.
- On a un gène de résistance à un antibiotique.
- On a un gène tryptophane 1 (aa essentiel) Trp1 → permet à la levure de synthétiser le tryptophane.
- Et on va cultiver dans du milieu Trp1-.
- Idem pour la proie mais ici, Leu-.
- Donc on fait un milieu Trp1- et Leu- → les levures qui auront 2 plasmides survivront.
- Puis on récupère les cellules, et on rajoute du X-gal car le gène rapporteur qui doit être exprimé (ex : LacZ) et que les
colonnies deviennent bleu, alors l’interaction entre l’appât et la proie a eu lieu.

Quelles interactions sont identifiées par un test ou un crible double hybride  ?


- Interactions permanentes
- Interactions transitoires dont les interactions enzymes / substrat
(ex : 10 à 40 % des interactions kinase – substrat).

- Mais il peut aussi y avoir des interactions qui n’existent pas


physiologiquement.
- Ce sont des faux positifs.
On a aussi :
- L’appat auto-activateur
- La proie collante
-
Quelles interactions ne sont pas identifiées par un test ou un criblage double hybride  ?
Les interactions impliquant des protéines qui présentent des problèmes :
- Structuraux (repliement)
- Stabilité
- Toxicité
- Mauvaise localisation (protéines membranaires)
- Modification post-traductionnelle

Estimation : 80 à 90 % des interactions sensées exister, n’auraient pas été détectées.
Ce sont des faux négatifs

Automatisation de la technique

- Système où les levures sont censées pousser dans


un milieu leucine, tryptophane et histidine -
- Pour éviter les faux positif, on ajoute un
inhibiteur de l’enzyme.
Si les cellules meurent dans ce test, le test est bon.

1) DBH devient multi-hybride

- En bas à gauche : double hybride


- Triple hybride
- La combinaison de 2 domaines d’activation permet la
transcription

1) Technique de triple hybride – recherche de protéines se liant à l’ARN


- On cible l’ARN particulier et la protéine d’intérêt

1) Technique MYTH (split ubiquitin membrane yeast two-hybrid)


- Si on veut voir l’interaction entre 2 membranes, avec le double hybride ce n’est pas possible car les
2 domaines hydrophobes vont se coller.
- Dans ce cas là, on aura 2 protéines de fusion avec chacun des récepteurs (en violet et bleu) et on aura un lien avec un
domaine C-ter de l’ubiquitine (Cub) et un facteur de transcription et d’autre part le domaine N-ter de
l’ubiquitine (Nub) qui est lié à l’autre protéine membranaires.
- Les 2 ub vont se lier et on aura coupure par une enzyme (ici LexA-VP16) et la protéine pourra aller
vers le noyau pour activer la transcription.

I. Autres techniques
1) Etude par LC-MS
- On fait des analyses d’interaction protéine – protéine en LC-MS.
- Dans ce cas là, quand on coupe les protéines et qu’on les identifies en MS,
on peut faire des comparaisons et identification.
- Selon la complexité de l’échantillon, on peut avoir des complexes entiers qui se
lient.

1) Technique de phage display


 Expression d’une protéine de fusion chez le bactériophage filamenteux M13
- Ce sont des bactériophages (virus) qui vont infecter E.coli.
- Ils ont a la surface, des protéines de surface (autour de la
capside).
- L’idée est de modifier le génome pour qu’à la surface, ils
produisent des protéines d’intérêt (récepteur, kinase,
phosphatase, …)
- Lorsque le phage va être en contact avec une protéine qui va
interagir avec le récepteur, substrat, groupement phosphate,
… on aura interaction.
- On va mettre en contact ces phages avec un certains nombre de substrats potentielles de nos
enzymes et on va accrocher les substrats à une plaque de verre.
- La phage va être entraîner et accroché à la plaque.
- On va ensuite laver de manière à garder / éluer les substrats qui nous intéresse et donc les phages qui nous intéresse.
- On fait une élution pour récupérer les phages.
- On infecte les bactéries, les phages vont intégrer leur génome dans la bactérie, vont produire en grande quantité les
protéines d’intérêt.
- Les bactéries vont se multiplier et on aura une grande quantité d’ADN, et on récupère la séquence qui correspond aux
séquences qui ont codé des bouts de protéines qui ont pu interagir avec le substrat.

- Dans ces cas là, quand on va couper, on a des morceaux d’ADN, il faut essayer d’être dans la bonne phase
ou tester un suffisamment grand nombre d’échantillon pour que statistiquement on ait la protéine dans
les 3 phases de lectures.

Interaction protéines – protéines :


- Ligand – récepteur (recherche de médicaments)
- Réaction antigène – anticorps (test de dépistages, traitements, …)
Interaction ADN – protéines :
- Recherche de domaine d’interaction à l’ADN d’un facteur de
transcription
- Recherche de la séquence nucléique de liaison

1) Technique Tandem Affinity Purification (TAP)


- Interaction protéine – protéine ou ADN – protéine
- On a une protéine A qui peut se lier à une bille d’Immunoglobuline.
- On a un domaine qui est reconnu par un domaine de protéase (ici TEV)
- Et on a un domaine d’interaction avec notre protéine d’appât.
- Comme le GST pull-down, on fait passer un lysat cellulaire (natif) sur la colonne et toutes les protéines qui peuvent se lier
soit à la protéine d’intérêt soit aux autres protéines qui se lient.
- On peut reconstituer un complexe entier in vitro.
- On coupe le domaine reconnu par la protéase, on récupère notre cible ainsi que toutes les proies qu’il aura retenue.
- On visualise sur gel de polyacrylamide avec un bleu de coomassie.

1) Technique de FRET – Förster Resonance Energy Transfer


- Interaction Prot – Prot
- Contrairement au double hybride, pas d’apriori sur la localisation cellulaire des protéines.
- On peut mettre les cellules physiologiques particulières (ex :
cellules K dans des métastases, …)
- Inconvénient : On ne peut pas faire de banque de données.
- Il faut avoir des idées d’interactions.
- On a notre appât couplé à une CFP (protéine recombinante GFP en bleu) et on fait une autre
protéine de fusion avec la proie et une autre protéine YFP qui émet dans le jaune.
- L’idée : La longueur d’onde d’excitation de la CFP est de 450 nm et va émettre à 490 nm et la YFP est excité à 490 nm et
émet à 510 nm (dans le jaune).
- Lorsqu’il n’y a pas d’interaction, on aura une couleur bleu à 490 nm car la CFP va émettre cette couleur.
- S’il y a interaction, on va avoir excitation de YFP et on aura une coloration jaune.
- On a une idée de l’interaction dans le temps (Time Laps) et regarder les modifications de fluorescence dans le temps et
suivre la localisation potentielle de ces complexes.

1) Technique de co-immunoprécipitation (co-ip)


- IP : bille avec des AC dirigé contre une protéine d’intérêt.
- Quand la protéine d’intérêt est reconnu, interaction avec AC et
après centrifugation bille lourde dans le culot.
- Co-IP : Si on ne dénature pas le lysat cellulaire, la protéine
d’intérêt va entraîner avec elle toutes les protéines qui lui sont
liés.
Comme pour le TAP, on pourra dénaturer les complexes et
identifier les protéines indépendamment.
- Dans ce cas là, in vitro mais on peut être dans un système
physiologique particulier car on peut estimer le lysat cellulaire après
la condition physiologique (ex : avant ou après métastase)

1) Technique Isolation of protein on nacent DNA (iPOND)


- Technique qui permet d’étudier le mécanisme de réplication des cellules.
- Lorsque les cellules sont en prolifération, on va mettre dans le milieu un nt qui va remplacer T
par EdU.
- Prolifération → réplication
- Pendant la phase de prolifération, on va mettre EdU (10 sec – 1 min…) → correspond au temps
de procession de la polymérase.
- Plus c’est long, plus on ira vers la fourche de réplication.
- On stop la prolifération, la réplication et on va fixer les cellules avec la paraformaldéhyde et on
va figer les interactions physiquement.
- Cela nous donne une idée de la cinétique du complexe et ça indépendant d’Edu.
- Edu est important pour la prochaine étape…
- (Structure EdU → cf diapo suivant)
- Biotine a une affinité pour la streptavidine.
- On fait passer ces fragments d’ADN sur une colonne qui contient la streptavidine où seuls les
morceaux d’ADN contenant EdU pourront être accrochés.
- Elution puis WB.

- EdU, on a une liaison triple qui peut faire une interaction avec R1 (biotine) / R2 =
base de l’ADN
- On fait un pont physique entre R1 et R2.
- On va donc rajouter de la biotine partout.
- Exemple pour déterminer quelles histones interagissent avec l’ADN.
- On peut analyser l’ADN d’intérêt en PCR et les protéines d’int par WB.
- C’est possible pour la transcription.

1) Précipitation de la chromatine
- On a les cellules dans des conditions physiologiques particulières et on
stoppe la réaction.
- On prend un AC dirigé contre une prot qui se lie à l’ADN (histone, FT, …)
- On fixe les cellules (ponts physique entre ADN et protéine)
On coupe la chromatine en morceau, on prend un AC lié à une bille lié à
notre protéine d’intérêt.
- Il va entraîner avec lui les séquences d’ADN à laquelle elle est lié puis
séquençage, microarray, PCR.

I. Les interactions moléculaires

- Cas d’une personne qui souffre du diabète.

Diversité Fonctionnelle Diversité Dynamique


- Interactions obligatoires : - Interactions permanentes :
o Dans ce cas, les protéines ne sont pas stables o N’existent qu’au sein d’un complexe.
et/ou fonctionnelles indépendamment. o Les interactions obligatoires sont généralement
o L’interaction est nécessaire à la stabilité et à la permanentes.
fonction. - Interactions transitoires :
o Ex : Gros cplx protéiques (ADN/ARN POL, o S’associent et se dissocient in vivo.
ribosome…) o Les interactions non-obligatoires peuvent être
- Interactions non-obligatoires : transitoires ou permanentes.
o Les protéines sont stables et fonctionnelles
indépendamment.
o L’interaction est responsable d’une action.
o Ex : Complexes antigène-AC, enzyme substrat,
signalisation