Vous êtes sur la page 1sur 223

24/10/2011

Biotechnologie

Master
Master Professionnel
Expression Gnique et Protines Recombinantes
e-mail : dess.biotech@ipbs.fr / Tel : +33 (0) 5 61 17 58 59 http://www.m2p-egpr.ups-tlse.fr/

Protines

Recombinantes

Techniques et Stratgies en Biologie Molculaire Deuxime partie


Octobre 2011

Vincent Ecochard Didier Fournier Laurence Nieto Laurent Paquereau

24/10/2011

ANALYSE DE LA FONCTION DUN GENE ..................................................................................................................6 STRATEGIE BASEES SUR LHYBRIDATION DARN ...............................................................................................................6 Linterfrence dARN (RNAi) .........................................................................................................................................6 LE KNOCK-OUT OU LINVALIDATION DUN GENE PAR RECOMBINAISON HOMOLOGUE ......................................................10 La recombinaison homologue : un mcanisme lorigine de la technologie de Knock-out ........................................10 Les souris KO ...............................................................................................................................................................11 Les cellules ES .............................................................................................................................................................11 Fabrication de souris transgniques ............................................................................................................................12 Linterruption dun exon : knock-out de gne ..............................................................................................................12 Cration de mutation ponctuelle ..................................................................................................................................13 Le systme Cre/Lox ......................................................................................................................................................14 Exemple dapplication .................................................................................................................................................15 Mutation propre ...........................................................................................................................................................15 Large dltion ou translocation ...................................................................................................................................15 Les possibilits dinduction de la cre recombinase ......................................................................................................16 Le systme tet-on ..........................................................................................................................................................16 DETECTION DES MUTATIONS / POLYMORPHISMES ...........................................................................................17 I) DETECTION DES MUTATIONS .........................................................................................................................................17 Mthodes bases sur la squence .................................................................................................................................17 Mthodes bases sur lhybridation ..............................................................................................................................19 Mthodes bases sur la PCR ........................................................................................................................................24 Ligation ........................................................................................................................................................................26 RFLP ............................................................................................................................................................................27 Mthodes bases sur la conformation de lADN ..........................................................................................................28 Htroduplex sensibilit une coupure .......................................................................................................................29 II ) ANALYSE DU POLYMORPHISME ...................................................................................................................................32 Protines ......................................................................................................................................................................32 Analyse des fragments de restriction ...........................................................................................................................32 Gnotypage et cartographie gntique ........................................................................................................................34 Les micro et minisatellites ............................................................................................................................................35 MAAP (Multiple Arbitrary Amplification profiling) ....................................................................................................37 III) DETECTION D'UNE SEQUENCE .....................................................................................................................................38 EXPRESSION DES PROTEINES RECOMBINANTES ..............................................................................................39 INTRODUCTION .................................................................................................................................................................39 RAPPELS SUR LA TRADUCTION ..........................................................................................................................................39 Les vnements de la traduction ..................................................................................................................................39 Rgulation de la traduction ..........................................................................................................................................44 Compartimentalisation et modifications post-traductionelles .....................................................................................48 EXPRESSION TRANSITOIRE A PARTIR D'UN ARNM OU D'UN ARN IN VITRO (CRNA) .........................................................50 Obtention d'un cRNA....................................................................................................................................................50 Traduction en milieu cellulaire. Lovocyte de Xnope .................................................................................................54 EXPRESSION EN SYSTEME PROCARYOTE ...........................................................................................................................55 I) Escherichia coli ........................................................................................................................................................55 II) Autres bactries utilises en production de protines .............................................................................................66 EXPRESSION EN SYSTEME EUCARYOTE : LES CHAMPIGNONS .............................................................................................70 les levures.....................................................................................................................................................................70 Les champignons filamenteux ......................................................................................................................................76

24/10/2011

Dictyostelium discoideum ............................................................................................................................................76 LES CELLULES VEGETALES ...............................................................................................................................................78 LES CELLULES D'INSECTES ................................................................................................................................................80 a) Baculovirus. .............................................................................................................................................................80 b) Cellules dinsecte ayant intgr le gne dintrt dans leur gnome .......................................................................85 LES CELLULES DE VERTEBRES ...........................................................................................................................................87 1) L'ovocyte de Xnope ................................................................................................................................................87 2) Cellules de mammifre.............................................................................................................................................87 EXPRESSION DANS DES EUCARYOTES UNICELLULAIRES ..................................................................................................103 LES CAUSES D'ECHECS DE LA PRODUCTION DE PROTEINES. .............................................................................................104 1) Il ny a pas ou peu de protine...............................................................................................................................104 2) La protine est produite mais est toxique ..............................................................................................................108 3) La protine est surexprime mais est mal replie ..................................................................................................110 4) La protine est produite mais est protolyse ........................................................................................................112 5) Les maturations post-traductionelles ne sont pas correctes ..................................................................................113 6) La protine est produite mais on ne sait pas la dtecter ........................................................................................115 7) La protine est produite mais on ne sait pas la purifier ........................................................................................116 8) La protine est produite mais il existe aussi des protines proches produites par la cellule, des endognes .......117 9) Problme particulier li l'utilisation de la protine chez l'homme .....................................................................117 TAG, PROTEASES ET ACIDES AMINES MODIFIES .............................................................................................118 LES TAG ........................................................................................................................................................................118 LES PROTEASES ...............................................................................................................................................................124 INTEIN.............................................................................................................................................................................125 LES ACIDES AMINES MODIFIES ........................................................................................................................................127 PURIFICATION DES PROTEINES RECOMBINANTES ..........................................................................................129 DETERMINATION DE LA CONCENTRATION EN PROTEINE..................................................................................................129 La spectrophotomtrie UV .........................................................................................................................................129 La fluorimtrie ...........................................................................................................................................................129 Les mthodes colorimtriques ....................................................................................................................................130 SOLUBILISATION DES PROTEINES ....................................................................................................................................131 Extraction des protines cellulaires ...........................................................................................................................131 Solubilisation et renaturation des corps dinclusion..................................................................................................133 LA CONCENTRATION DES PROTEINES ..............................................................................................................................136 LES DIFFERENTES METHODES DE SEPARATION DES PROTEINES .......................................................................................137 La chromatographie ...................................................................................................................................................137 Llectrophorse ........................................................................................................................................................138 Sparation selon la taille ...........................................................................................................................................139 Sparation selon la charge.........................................................................................................................................140 Sparation selon la taille et la charge........................................................................................................................141 Sparation selon lhydrophobicit .............................................................................................................................141 Sparation selon laffinit ..........................................................................................................................................142 Sparation par des colorants .....................................................................................................................................144 EVALUATION DE LA PURETE ...........................................................................................................................................144 CARACTERISATION DES PROTEINES.................................................................................................................................145 STABILISATION DES PROTEINES ......................................................................................................................................147 Stabilisation des protines par lutilisation dadditifs. ..............................................................................................148 Stabilisation des protines par mutagense dirige ...................................................................................................149 ANALYSE DES INTERACTIONS ENTRE MACROMOLECULES ........................................................................153 INTERACTIONS ACIDES NUCLEIQUE-PROTEINE ................................................................................................................153 Criblage de banque dexpression : ......................................................................................Erreur ! Signet non dfini. Simple Hybride .....................................................................................................................Erreur ! Signet non dfini. Triple hybride .......................................................................................................................Erreur ! Signet non dfini. South-Western ......................................................................................................................Erreur ! Signet non dfini.

24/10/2011

SELEX ..................................................................................................................................Erreur ! Signet non dfini. Immunoprcipitation de chromatine ....................................................................................Erreur ! Signet non dfini. Electrophoretic Mobility Shift Assay (EMSA) - gel retard ...................................................Erreur ! Signet non dfini. Footprint empreinte sur lADN .........................................................................................Erreur ! Signet non dfini. BIAcore ................................................................................................................................Erreur ! Signet non dfini. INTERACTIONS PROTEINE - PROTEINE ..............................................................................................................................183 Introduction ................................................................................................................................................................183 Dmarche exprimentale permettant de mettre en uvre puis de caractriser une interaction protine protine .............................................................................................................................................Erreur ! Signet non dfini. Mthodes permettant sassurer que la protine appartient un complexe et de dterminer la taille de ce complexe .............................................................................................................................................Erreur ! Signet non dfini. Mthodes permettant disoler un complexe protique .........................................................Erreur ! Signet non dfini. Cross-linking (association par des agents pontants .............................................................Erreur ! Signet non dfini. Identification des protines du complexe .............................................................................Erreur ! Signet non dfini. Vrification de linteraction in vivo .....................................................................................Erreur ! Signet non dfini. Mthodes permettant didentifier un partenaire protique tout en isolant son ADNc .........Erreur ! Signet non dfini. REFERENCES ...................................................................................................................................................................212 FOURNISSEURS ............................................................................................................................................................221 INDEX ...............................................................................................................................................................................222

24/10/2011

24/10/2011

Analyse de la fonction dun gne


Plusieurs approches peuvent tre envisages pour aborder la fonction dun gne. Les techniques de biologie molculaire et de biochimie permettant par exemple de localiser lexpression dun gne ou son produit (Northern, western, hybridation in situ, immunofluorescence ), de dterminer la structure de la protine (RMN, cristallographie ) ou de trouver des partenaires protiques (double hybride, immunoprcipitation ) donnent des informations importantes sur la fonction dun gne. Dautres stratgies bases sur des modifications de lexpression dun gne ou sur une modification de lactivit de la protine permettent dapprofondir cette tude. Un gne dans une cellule ou un organisme peut tre soit surexprim soit supprim et, dans ce dernier cas, on regroupe les stratgies sous le nom dinterruption de gne. Lanalyse (difficile certaines fois) du phnotype quengendrent ces modifications devrait permettre daccder la (ou les) fonction(s) du gne.

Stratgie bases sur lhybridation dARN


Linterfrence dARN (RNAi)
Le phnomne dinterfrence dARN (RNAi) dcouvert par Fire et al. (1998) chez le nmatode Caenorhabditis elegans dsigne linhibition gnique post-transcriptionnelle induite par de lARN double brins (ARNdb). Cest dire que la prsence dans une cellule dun ARN db conduit dans certaines conditions la dgradation spcifique de lARN messager de squence identique ( lun des brins). Ce mcanisme, qui semble tre un moyen de rsistance vis--vis de virus et des transposons chez les eucaryotes (hormis la levure), est la base dune stratgie actuellement largement utilis pour cibler la dgradation dun ARNm dont on cherche la fonction. De par sa
Conservartion de linterfrence chez les eucaryotes

24/10/2011

grande spcificit daction et sa relativement bonne efficacit dinhibition la stratgie de RNAi a supplant lutilisation dARN antisens. Le RNAi est un processus en 2 tapes qui commence tre caractris. Dans la premire tape les longues molcules dARNdb sont clives par la protine Dicer (une nuclase de la famille des RNases-III) en petits fragments dARNdb de 21 25 nuclotides de long : les siRNA (small interfering RNAs). Dans la seconde tape, les siRNA sont incorpors dans un complexe ribonuclasique, le complexe RISC (RNA-induced silencing complex), qui va guider les siRNA sur lARNm de squence homologue. Le brin antisens des siRNA sapparie lARNm cible ce qui provoque son clivage (par Dicer) au milieu de la zone dappariement, et donc limpossibilit de traduire la protine.
Brin antisens du siRNA siRNA Ciblage de l ARNm Clivage de l ARNdb Complexe enzymatique Dicer

Complexe RISC Clivage de l ARNm Poly(A)

ARNm dgrad

Amplification des siRNA Chez C. elegans, il ny a besoin dune trs faible quantit de siRNA pour oberver une inhibition de la traduction dun gne. Par exemple, on peut inhiber un gne du nmatode en le nourissant avec des bactries qui expriment des RNAdb, et 2 molcules dARNdb suffisent teindre un gne fortement exprim tel que unc-22 gne codant pour une protine musculaire. Cette puissance daction est retrouve chez les plantes et le champignon Neurospora mais pas chez la drosophile ni les cellules de mammifres. Ce faible besoin en siRNA pour observer un effet, rend leur action transmissible la descendance, les siRNA se retrouve dans les cellules germinales. Pour isoler la protine responsable de lamplification des siRNA, une approche gntique a
ARNdb Dicer

t faite chez Neurospora par une une analyse de mutants dficients. Ceci a permis didentifier un gne codant pour une enzyme responsable du phnomne damplification observ. Il sagit dune RNA polymrase RNA dpendante (RdRP) prsente chez les plantes et chez le nmatode mais absente
siRNA secondaire Clivage de la cible Synthse d ARN par une RdRP RISC Complexe siRNA actif

24/10/2011

chez la drosophile ou les vertbrs. Cette enzyme est capable de synthtiser un ARN complmentaire partir dun ARN matrice et dune amorce provenant dun siRNA. Ceci entrane la production dARNdb qui sera son tour cliv par lenzyme dicer pour donner des siRNA secondaires qui eux mme pouront servir damorce une nouvelle polymrisation dARNdb. Ce systme damplification rends lutilisation dARNdb trs efficace pour inhiber un gne chez C. elegans. Les longs ARNdb sont aussi couramment utiliss aussi chez la drosophile ou dans les cellules de drosophile en culture (cellule S2). Cependant, chez les mammifres, lutilisation de longs ARNdb entrane des effets non spcifiques tels que lactivation de la production dinterferon avec linduction dune protine kinase ARN dpendante (PKR) conduisant la dgradation non spcifique de tous les ARNm, puis lapoptose des cellules. Pour remdier ce problme, le groupe de T. Tuschl en 1999, a montr que lon pouvait lutiliser directement des siRNA et non de longs ARNdb. Pratiquement, les siRNA peuvent tre obtenus de diffrentes manires : par synthse chimique par clivage in vitro de long ARNdb ( laide de lenzyme Dicer recombinante) par lutilisation de vecteurs codant des ARN tige boucle

Synthse de siRNA Les siRNA peuvent sacheter chez de nombreux fournisseurs ; il suffit de donner les squences sens et antisens. La figure montre la structure dun siRNA synthtique, compos de 21 nuclotides de longueur hybridant sur 19 nuclotides avec 2 U sortant en 3. Generallement on remplace les
3 U U 5

(N19) (N19)
5

U U

2 U par 2 T ce qui permet une meilleure stabilit des siRNA pour un coup moindre. Il a t montr de faon empirique que le choix de la squence cible tait trs important pour lefficacit de linhibition. Le siRNA doit tre choisi dans lORF (cadre ouvert de lecture) prfrentiellement au milieu de la squence codante, 100 nuclotides aprs lAUG et 100 avant le stop. Actuellement il se dveloppe des logiciels pour dessiner les siRNA partir de la squence dun ARNm. Les paramtres prendre en compte lors du choix dun siRNA - Pourcentage en GC

24/10/2011

Recherche dans les banques de donnes afin de sassurer de la spcificit dinhibition Choix dune mthode de transfection efficace en fonction du type cellulaire.

Clivage in vitro de longs ARNdb : Une stratgie utilise avec succs permet de synthtiser in vitro des siRNA en ultilisant lenzyme Dicer qui est produite par gnie gnetique (protine recombinante). Principe : lADNc du gne teindre (ou uniquement son ORF) est clon dans un vecteur comprenant deux promoteurs phagiques. Les ARN sens et antisens sont transcrits in vitro et hybrids en solution. Lenzyme Dicer est rajoute lARN puis le siRNA sont purifis et transfects. Lavantage de cette approche est que lon synthtise en quelque sorte des siRNA correspondant toute la squence de lARN.

24/10/2011

10

Le Knock-out ou linvalidation dun gne par recombinaison homologue


Le knock-out dun gne (ou K.O.) signifie la perte physique de la squence (ou dune partie de la squence) de ce gne conduisant labsence de lARN messager et donc de la protine. Le KO est donc transmissible la descendance. Attention cependant : chez les eucaryotes, le KO dun gne signifie que la squence des deux allles est affecte, la descendance respecte les lois de Mendel. Le KO revient raliser de la mutagense dirige (par dltion). Ceci est rendu possible par lexistence dun mcanisme fondamental dchange de squence dADN homologue au niveau chromosomique : la recombinaison homologue.

La recombinaison homologue : un mcanisme lorigine de la technologie de Knockout La recombinaison homologue est un change de fragments dADN entre deux molcules (dADN) au niveau des squences nuclotidiques homologues. Cest ce quil se passe lors de crossing over la miose entre les chromatides des paires de chromosomes. Le KO est bas sur de la recombinaison homologue entre de lADN exogne et de lADN gnomique. Ce mcanisme connu depuis longtemps chez la levure a t mis en vidence en 1980 chez les mammifres par injection directe dADN dans des cellules de mammifres. Lorsque de lADN (plasmidique par exemple) est transfect dans des cellules eukaryotes, il peut : - soit rester ltat pisomique (transfection transitoire) - soit sintgrer dans le gnome (transfection stable) Dans ce dernier cas, lADN sintgre au hasard (gnralement en plusieurs copies inverses), mais dans un nombre de cas rares, il peut sintgrer par recombinaison homologue (RH) si une squence identique existe dans le
Insertion au hasard Recombinaison homologue

gnome.

Les facteurs qui favorisent la recombinaison homologue : - La taille de la rgion homologue (de 4 9 kb, on multiplie par 20 la RH) - Le fort pourcentage dhomologie

24/10/2011

11

- LADN sous forme linaire (par rapport circulaire) - Le mode de transfection Il semble en revanche que ni le nombre de copies prsentes dans la cellule, ni la localisation chromosomique du gne invalider, ninflue sur la RH. En tout tat de cause, il est indispensable de slectionner les vnements de recombinaison. Les diffrents types de slection utiliss chez les eucaryotes suprieurs ( pour ltablissement de lignes stables) reposent sur lutilisation de gnes de rsistance des drogues telles que la nomycine (ou G418), la blomycine, lhygromycine, la puromycine. Dautres marqueurs de slection sont galement utiliss : Le gne codant pour la DHFR (dihydrofolate rductase) rsiste au mthotrexate. Le gne HPRT : Hypoxantine phosphoribosyl transferase. Ce gne permet une double slection, positive et ngative. Les cellules possdant ce gne poussent en milieu HAT (hypoxanthine, aminoptrine, thymidine) mais sont sensible au 6-thioguanine, inversement labsence de ce gne rend les cellules sensibles au milieu HAT et rsistantes la 6-thioguanine. Le gne HSV-TK : la thymidine kinase du virus herps simplex. Cette enzyme est capable de phosphoryler le gencyclovir qui devient ainsi toxique pour les cellules.

Les souris KO Nous venons de voir quil est possible de crer et slectionner des cellules stables dficientes pour un gne. Nous allons voir comment il est possible de crer partir de ces cellules un organisme entier KO. Ceci est devenu possible grce lisolement de cellules souches embryonnaires de souris, les cellules ES (embryonic stem cell) Les cellules ES Ce sont des cellules isoles partir dembryons de souris et possdant des proprits remarquables : - Elles sont totipotentes, cest--dire que ce sont des cellules indiffrencies possdant le potentiel de devenir nimporte quel type cellulaire - Leur croissance est illimite en culture - Elles sont facilement transfectables (et slectionnables) - Il est possible de les rimplanter (aprs modification gntique) dans un blastocyste de souris et elles pourront alors coloniser tous les types cellulaires (donc aussi la ligne germinale) et,

24/10/2011

12

dans ce cas, donneront naissance des souris chimres pouvant donner des descendants htrozygotes pour la modification gntique. Fabrication de souris transgniques Une fois les cellules ES slectionnes, elles vont tre injectes dans le blastocoele (cavit) dembryons au stade blastocyste prlev sur une femelle donneuse (dont la couleur du pelage est plus claire que la femelle donneuse de cellules ES). Quelques blastocystes ainsi modifis vont alors tre rimplants dans une femelle receveuse. Les souriceaux drivant des blastocystes modifis seront mosaques : certains tissus proviennent des cellules ES et dautres drivent du blastocyste hte. En fonction de ltendu du pelage fonc provenant des cellules ES modifies, on peut se rendre compte de limportance de la colonisation tissulaire de ces cellules, lespoir tant que les cellules modifies aient colonis la ligne germinale. Seuls ces individus seront capables de transmettre le gne invalid leur descendance. Le croisement de ces souris avec des souris sauvages donnera 50% dhtrozygotes (+/-) pour la mutation et 50% de souris sauvages (+/+) . Le croisement des htrozygotes entre eux permet dobtenir 25% dhomozygotes possdant les deux allles muts (/-) : ce sont les souris KO pour le gne considr. Les diffrentes constructions utilises Linterruption dun exon : knock-out de gne La figure ci-contre montre un exemple de construction simple aboutissant, aprs recombinaison homologue, la perte de
2

No
3 3 4

HSV-TK

Vecteur

lexpression dun gne. Le gne de


ATG

Stop

rsistance la nomycine a t introduit dans la squence de lexon 3 dun gne

Exons :

Chromosome

ATG

No

Stop

No R Ganc R

24/10/2011

13

quelconque. Le gne de la thymidine kinase du virus de lherpes est introduit en aval de la squence du gne. Les vnements de recombinaison homologue sont slectionns par la double slection : positive par le nomycine et ngative par la thymidine kinase. Les cellules recombines au niveau du gne sont nomycine rsistantes et gancyclovir rsistantes, alors que les intgrations au hasard seront nomycine rsistantes et gancyclovir sensibles. Cration de mutation ponctuelle Si maintenant le gne de rsistance la nomycine se situe dans un intron et que lon a cr une mutation dans lexon 3 du gne, la recombinaison homologue de cette construction aboutira
ATG ATG

No

HSV-TK

Stop

No

Stop

No R Ganc R

lintroduction de la mutation au niveau du gnome. La prsence de la cassette


ATG

Transcription - Epissage *
Stop

de rsistance dans un intron nempche pas la traduction ni lpissage, les modifications quentrane cette construction sont thoriquement dues uniquement la mutation. Il cependant t montr que dans certains cas la prsence dune cassette de slection dans un intron peut avoir un effet sur le niveau de transcription du gne. Ce qui a conduit le chercheurs imaginer des stratgies pour liminer le gne de slection afin daboutir des mutations propres Mutation propre par double remplacement Dans cette exemple on se base sur la proprit du gne HPRT permettant une double
ATG

hprt

1er vnement de recombinaison


Stop

slection (voir plus haut). Le premier vnement de recombinaison apporte gne hprt dans lintron (cellules HAT rsistantes et 6-thioguanine sensibles). La seconde RH amne la mutation et limine le gne hprt, les cellules deviennent HAT et 6-TG .
S R
ATG ATG

hprt

Stop

HAT R 6-TG S
2me vnement de recombinaison

Stop

HAT S 6-TG R

24/10/2011

14

Le Knock-in Cette stratgie permet de crer un KO, et en mme temps de remplacer le gne par un autre gne qui sexprimera ainsi comme le gne interrompu. Si le nouveau gne est un gne rapporteur, type LacZ ou GFP, ceci permet de localiser lexpression du gne dlt dans la souris au cours du dveloppement ou chez ladulte (ce qui nest pas toujours facile autrement). Cette stratgie peut aussi tre utilise pour montrer quun autre gne peut remplacer la fonction de celui qui est interrompu. Par exemple, la cycline E peut sauver le phnotype du KO de la cycline D.

Les systmes inductibles Il se peut que des souris KO pour un gne ne soient jamais obtenues. Cest le cas lorsque la mutation est lethale embryonnaire ; les homozygotes mutants ne sont jamais mis au monde, ou bien lexpression du gne tudi est trs large, donc le phnotype mutant trs complexe. Dans ces cas, on va vouloir contrler la mutation dans le temps et dans lespace. Le systme Cre/Lox La Cre est une recombinase (de la famille des intgrases) du bactriophage P1. Cest une protine de 38 KDa qui catalyse la recombinaison entre deux site de reconnaissance, les sites LoxP. LoxP est une squence dADN de 34 pb comprenant aux extrmits 13 nuclotides palindromiques (il est donc impossible de trouver cette squence dans un gnome eucaryote). Les deux sites peuvent tre trs loigns lun de lautre et tre quand mme recombins par la Cre. Cette recombinase fonctionne dans les cellules eucaryotes gntiquement modifies comportant deux sites loxP. En fonction de lorientation des sites loxP, il peut se produire une dltion ou une inversion. Il est noter que ce mcanisme est rversible. Dans les exemples qui suivent la RH permet dapporter les

24/10/2011

15

sites loxP sans altrer le gne tudi. La cre recombinase permettra dliminer la rgion entre les deux sites. Linduction de la cre entrane linduction de la dletion.

Exemple dapplication La dltion dexon Deux sites loxP sont insrs de part et dautre dun exon du gne invalider. On dit que lexon est flox . Cette construction peut tre utilise pour remplacer le gne sauvage par recombinaison homologue dans des cellules ES. On vrifie que des souris transgniques homozygotes (pour lexon flox) sont parfaitement saines. Ces souris peuvent alors tre croises avec des souris transgniques exprimant la Cre recombinase dans un tissu particulier (le gnome de ces souris contient le gne Cre sous la dpendance dun promoteur tissu spcifique).

Mutation propre Il a t montr que la prsence dun gne de rsistance dans un intron, par exemple dans le cas de mutations ponctuelles, pouvait influer sur la rgulation de lexpression du gne (voir plus haut). Et donc que le phnotype observ ntait pas seulement d la mutation. Dans ce cas, on peut utiliser le systme Cre/lox pour liminer le gne de rsistance. Il suffit, dans la construction, de floxer la cassette de rsistance qui sera limine par la cre.
+ Cre
ATG

No

HSV-TK

Stop

Large dltion ou translocation Certaines maladies gntiques sont dues de grandes dltions dans le gnome (ou des translocations). Il est possible de crer des souris porteuses de ce type de maladie (afin par exemple danalyser leffet de
Hyg No Puro ro Hyg No Hyg No

Puro

ro

No R

+ Cre
Hyg ro

Hygro R

24/10/2011

16

certaines thrapies). La figure montre une stratgie base sur le systme cre/lox qui t utilise avec succs. Deux vnements de recombinaison homologue sont ncessaires pour introduire les deux sites lox P et deux parties de la cassette hygromycine. Le premier vnement est slectionn par la cassette nomycine et le second par puromycine. La cre recombinase permet de rapprocher les deux parties non fonctionnelles de lhygromycine devenant ainsi fonctionnelle. Si les deux sites loxP sont sur le mme chromosome il sen suit une large dltion (plusieurs centaines de Kb). Si ils sont sur deux chromosomes diffrents cela conduit une translocation.

Les possibilits dinduction de la cre recombinase Un systme trs sophistiqu dinduction de la cre recombinase t utilis rcemment (ref). Il repose sur lexpression dune protine de fusion entre la cre et un rcepteur tronqu aux glucocorticodes. Lexpression de cette fusion peut tre contrle par un promoteur quelconque (ubiquitaire ou tissu spcifique). La cre ainsi fusionne est inactive et ne devient active quen prsence dun (et agoniste non pas de de
Squence floxe
Cre Cre

Inactive

Agoniste (tamoxifne, RU486)

Active

Cre
Domaine de fixation au ligand (rcepteur des strodes)

Cre

Injection de lagoniste un temps donn

X
Cre

Cre

glucocorticode

Cre-ind

glucorticodes endognes) comme le tamoxifne et le RU486. La figure

Cre-ind

P (ubiquitaire ou spcifique)

montre que le croisement de souris transgnique pour la cre inactive (commerciale) avec de souris flox pour un gne donn permet dobtenir des souris contenant la fois la cre inactive et un gne flox. Linjection de lagoniste dans un tissu quelconque provoquera la dltion du gne (ou dune partie du gne) au moment et au lieu choisi.

Le systme tet-on

24/10/2011

17

Dtection des mutations / polymorphismes


I) Dtection des mutations
Les mutations ponctuelles affectent un seul nuclotide et sont souvent appeles SNP (single nuclotide polymorphism). Elles peuvent tre silencieuses, mais peuvent aussi causer des mutations non-sens, modifier la squence en acide amin dune protine ou interfrer avec lpissage de lARN. Ces modifications peuvent alors tre responsables de maladies gntiques, ou modifier le phnotype du porteur.

Mthodes bases sur la squence

La mthode de squencage de Sanger permet d'identifier la mutation d'une manire sre. Toutefois cette mthode est lourde et gnre plus dinformation quil nen faut. Aussi elle n'est souvent utilise que pour la mise en vidence pour la premire fois d'une mutation. Une fois la squence connue ce n'est pas la peine de squencer toutes les pistes. Ce n'est pas non plus la peine de squencer en aval de la mutation. On peut utiliser la mthode de squenage de Sanger en utilisant uniquement trois desoxynuclotides et un didesoxynuclotide et une amorce proche de la mutation de telle sorte que la polymrisation soit plus ou moins longue en fonction de la prsence de la mutation. Les produits de la raction sont spars sur gel et la prsence d'un produit permet de connatre la prsence de la mutation.
Mutation dtecter
A NNNNNNNNTGC GCANNNNNNN G
Exemple de mise en vidence dune mutation ponctuelle par squenage

Produits de la raction en prsence de ddATP


32P 32P

NNNNNNNNNNNNNNNNNTGCAdd NNNNNNNNNNNNNNNNNTCGGGCAdd

24/10/2011

18

Cette mthode prsente un avantage, si la mutation est prsente dans une partie de la population de dpart, en quantifiant la prsence des deux produits on peut estimer sa frquence. Elle a par exemple t utilise pour estimer le taux d'dition de certains ARN messagers (Schiffer et Heinemann, 1999). On peut aussi faire une extension damorce en utilisant uniquement le nuclotide dtecter. Dans de cas le nuclotide sera marqu de faon dterminer lincorporation. On peut par exemple utiliser uniquement un didesoxynucltotide fluorescent et dtecter lincorporation par electrophorse capillaire. Dans ce cas on fait les deux ractions, avec lextension sauvage et lextension mute, et on fait migrer les produits de la raction. Pour viter la migration des nuclotides non incorpors on les dgrade laide dune phosphatase alcaline.

A Hybridation

Polymrisation en prsence de dTTP li un antigne reconnu par un anticoprs li une phosphatase alcaline de dCTP li un antigne reconnu un anticoprs li une proxidase

A T a b

G C

A T AP a HRP b

G C

La rvlation peut aussi se faire laide danticorps. Diffrentes tapes : on amplifie la rgion de la mutation, on fixe lamorce un support, on hybride le produit de lamplification avec lamorce,

24/10/2011

19

on polymrise en prsence des deux oligonucltides correspondant au type sauvage et au type mutant, on lave pour liminer les nuclotides non incorpors et on rvle le nuclotide incorpor laide dun anticorps associ une activit enzymatique.

Pour amliorer lhybridation on peut dtruire un des deux brins de lamplification en le digrant par une exonuclase, le brin hybrider sera alors protg en utilisant un oligonuclotide modifi non sensible lexonuclase. Cette mthode est commercialise par Invitrogen.

La mthode de squence en utilisant le pyrosquenage peut tre utilise pour dtecter des mutations (Ahmadian et al., 2000). Lavantage de cette mthode est de faire passer le nuclotide sauvage et mutant lun aprs lautre la hauteur relative des deux pics permet destimer la proportion de mutants dans une population.

Mthodes bases sur lhybridation Southern L'hybridation de deux chanes d'ADN est due l'appariement de bases complmentaires A-T et G-C. Elle est donc diminue lors de msappariement. Le Tm d'un oligonuclotide de 10 20 bases sera donc abaiss s'il y a un msappariement.

24/10/2011

20

La mthode de Southern (1975) est particulirement adapte pour dtecter les grandes altrations telles que les insertions, les dltions ou les rarrangements. Mais cette mthode peut aussi tre utilise pour dtecter les mutations ponctuelles si on utilise un oligonuclotide comme sonde. Il nest pas toujours ncessaire de digrer lADN par une enzyme de restriction et de sparer les fragments par electrophorse. On peut directement spotter lADN analyser sur une feuille de nitrocellulose ( dot-blot ). Dans certains cas si l'altration se retrouve dans l'ARN, un northern peut tre employ pour la dtecter. Il existe plusieurs mthodes pour dtecter lhybridation. La plus ancienne est lutilisation dun marquage radioactif. On utilise comme sonde un oligonuclotide marqu en 5' par une kinase et du -32P ATP. Comme contrle, on peut utiliser une sonde plus grande dont lhybridation nest pas sensible la prsence de la mutation (ADNc sur la figure) pour vrifier que la cible tait bien en quantit gale dans les diffrentes pistes. Lhybridation peut se faire sur puce ADN. Un premier spot contient un oligonuclotide sauvage et un deuxime spot contient un oligonuclotide mut. LADN de la rgion analyser est amplifi et marqu avec un fluorophore. Il est hybrid avec les oligonuclotides fixs la puce, sil y a hyburidation il y aura fluorescence, si la mutation diminue le Tm, il ny aura pas de fluorescence. Comme on peut disposer dautant de spots quon le dsire, on peut cribler en une seule fois la prsence de nombreuses mutations.

ADN mutant tmoin mutant tmoin

oligonuclotide sonde

cDNA

Exemple de mise en vidence dune mutation ponctuelle par Southern avec un oligonuclotide portant la mutation

24/10/2011

21

On peut suivre lhybridation en FRET en utilisant deux oligonuclotides, chacun sera porteur dun fluorophore. Lorsque loligonuclotide nest pas hybrid, on na pas de fluorescence, par contre
mission excitation

lorsquil est hybrid on obtient une fluorescence. Si on augmente peu peu la temprature, faible
ADN

temprature, loligonuclotide se fixera dune manire non spcifique et on aura pas de fluorescence. Lorsque la temprature atteindra le Tm, on observera une fluorescence. Au dessus de Tm on perdra la fluorescence. Comme la prsence dune mutation modifie le Tm, les

mutation

Principe

courbes de fluorescence en fonction de la temprature permettent de dtecter la prsence dune mutation.

Hybridation partielle
Dans cette technique on va dtecter le fait que loligonuclotide soit ou ne soit pas
O O

compltement hybrid lorsque lhybridation est totale ou lorsque lhybridation prsente un msappariement. Le fragment portant la mutation est amplifie par PCR, puis on hybride deux oligonulotides qui portent leurs extrmits des fluorophores tels que le pyrne. Un pyrne est positionn en 3' d'un oligonuclotide et un autre en 5' de l'autre oligonuclotide. Lorsque les deux pyrnes sont proches l'un de l'autre, lorsque les deux oligonuclotides s'hybrident parfaitement on obtient une mission de fluorescence (excitation 350 nm et mission 490 nm) par
cible oligonuclotides

fluorescence
P P

pas de fluorescence
P P

mission dans le rouge

fluoresceine

24/10/2011

22

contre lorsqu'il y a un msappariement, dans le cas d'une mutation, les deux pyrnes ne sont plus proches l'un de l'autre et on n'obtient pas de fluorescence (Paris et al., 1998). Comme amlioration de la mthode on a l'utilisation de d'appareil PCR permettant de suivre l'mission de la fluorescence au cours des amplifications successives. Utilisation dun anticorps On peut suivre lhybridation en utilisant un anticorps qui reconnat lADN double brin (Viazov et al., 1994) Cette mthode est souvent appele DNA enzyme immunoassay (DEIA). Dans une premire tape, une rgion contenant la mutation dtecter est amplifie par PCR. Ce produit damplification est alors hybrid un nuclotide spcifique fix sur un support solide via un pont streptavidine-biotine. Sil y a hybridation, elle est dtecte par ELISA en utilisant un anticorps se fixant sur lADN double brin.

DGGE = Denaturing Gradient Gel Electrophoresis Principe : Le Tm dpend de la squence, de la temprature, de la concentration en certaines molcules telles que l'ure ou la formamide. La dnaturation est un phnomne coopratif. La migration d'un fragment d'ADN change avec la dnaturation, un ADN double brin partiellement ouvert migre moins vite qu'un fragment double brin (Myers et coll. 1985) Dans cette technique, on fait migrer un fragment d'ADN dans un gel gradient allant de conditions natives ou l'ADN est sous forme double brin des conditions dnaturantes ou l'ADN est sous forme simple brin (7M ure, 40% formamide). La temprature est maintenue constante. L'ADN est extrait puis digr par une enzyme de restriction qui coupe souvent, tous les 200-400 pb. Le produit de la digestion est charg sur un gel gradient linaire, il migre sous la forme de double brin mais un moment il atteint son Tm, est partiellement dnatur et migre moins vite. Ainsi des fragments de squences diffrentes, mme d'une seule base sur 100 pb migrent des endroits
sauvage mutant gel sauvage mutant * *

24/10/2011

23

diffrents. Pour dtecter les bandes, L'ADN est transfr et hybrid avec une sonde spcifique d'une rgion ou on analyse des fragments de PCR aprs les avoir marqus Au lieu deffectuer un Southern, on peut amplifier la rgion de la mutation par PCR, faire migrer les deux produits de PCR dans un gel concentration croissante dun agent dnaturant. Un des problmes rencontrs avec cette technique : les fragments se sparent trop tt dans le gel. Pour remdier de problme, on effectue la PCR avec des amorces riches en GC dans la rgion 5' (non importante pour la raction de PCR). Ces extrmits GC stabilisent le duplex et permettent une meilleure sparation des homoduplex et des htroduplex.

DHPLC: Denaturing high-performance liquid chromatography Cette mthode est proche de la DGGE mais ici la dtection des htroduplex se fait par HPLC en utilisant une colonne de paire dions en phase reverse dans les condition partiellement dnaturantes (Oefner et Underhill, 1995).

24/10/2011

24

Mthodes bases sur la PCR


Les altrations du gnome peuvent tre dtectes par PCR en utilisant plusieurs amorces, ce qui permet l'amplification simultane de plusieurs rgions (multiplex PCR). Cette mthode a t employe pour la premire fois par Chamberlain et coll. (1988) pour dtecter les mutations de la dystrophine responsable de la maladie de Duchenne.

PCR oligonuclotide allle spcifique, PASA (PCR Amplification of Specific Alleles) En PCR, la polymrase ne peut polymriser que si la dernire base en 3' est stabilise par des liaisons hydrognes, si la dernire base est hybride. La plupart des polymrases ont une activit 3'5'exonuclase, mais certaines d'entre elles comme lADN polymrase Taq en est dpourvue. En prenant deux oligonuclotides, un spcifique de la mutation et un autre spcifique du tmoin (sauvage) on peut faire deux PCR l'aide d'un troisime oligonuclotide situ en 3' (en aval) environ 1 kb. On aura amplification uniquement quavec un des deux couples (Sommer. 1992) L'absence de bande ne signifie pas toujours l'absence d'hybridation en 3' mais peut rsulter d'un dfaut lors de PCR, d'une erreur de manipulation. Un tmoin peut tre ajout, c'est un oligonuclotide qui hybride sur tous les allles (connus) en amont de l'hybridation permettant de voir la mutation. On obtient donc deux bandes, une bande haute permettant de voir si la polymrisation a bien eu lieu et une bande basse permettant de voir la prsence ou non de la mutation, suivant l'oligonuclotide qui a t utilis.

amorces discriminantes amorce amont ou matrice amorce aval

Les deux ractions de PCR (entre l'amorce amont et l'amorce aval et entre l'amorce discriminante et l'amorce aval) entrent en comptition, et l'amplification la plus petite est favorise, d'une part parce

24/10/2011

25

qu'elle est plus petite et d'autre part parce que le produit de la raction la plus longue peut servir de matrice la raction la plus petite et non inversement. Aussi si la raction de PCR discriminante a lieu, l'amplification tmoin est faible.

RR RS RS RR RS RR RS RR SS SS RR RR RS SS C S R

Exemple de PASA permettant de distinguer des individus avec une mutation sur les deux allles (RR) des individus sauvages (SS) et des htrozygotes (RS)

Ce systme a un deuxime avantage. En effet, dans de rares cas, l'amplification avec l'amorce discriminante peut avoir lieu. Plus il y a de cycle de PCR, plus elle a de chance d'avoir lieu, cette erreur est due la probabilit qu'a la dernire base de l'oligonuclotide d'tre bien positionne en l'absence d'hybridation. Le fait d'utiliser une amorce amont, permet d'utiliser ds les premiers cycles les substrats (dNTP) et de fabriquer une grande quantit de matrice.

24/10/2011

26

Ligation
Les ADN ligases catalysent l'estrification entre un nuclotide 5' phosphate et un nuclotide 3' OH. Il faut toutefois que ces deux fonctions soient maintenues proches l'une de l'autre. Pour dtecter l'vnement de mutation, on peut marquer un oligonuclotide. Une mthode pour augmenter le signal consiste rpter plusieurs fois l'exprience en faisant des cycles successifs de dnaturation et de ligation. Dans ce dernier cas on utilisera de prfrence une ligase thermostable (dans ce cas l'amplification ne suit pas une progression exponentielle).
Hybridation

Ligation

Gel, conditions dnaturantes autoradiographie

24/10/2011

27

RFLP
Dans certains cas la mutation recherche concide avec un site de restriction, toutefois c'est assez rare. Dans d'autre cas, la mutation est proche d'une autre mutation qui, elle, concide avec un site de restriction. La coupure est alors dtecte par Southern ou par coupure d'un fragment de PCR. Sandwich: L'ADN cible est fix sur une membrane de nitrocellulose puis hybrid avec une sonde. Aprs formation du duplex il y a coupure avec une enzyme de restriction. S'il y a homoduplex l'enzyme coupe et l'oligonuclotide est deshybrid, s'il n'y a pas coupure l'htroduplex reste sur la membrane.

24/10/2011

28

Mthodes bases sur la conformation de lADN


SSCP (Single Strand Conformation Polymorphism) Cette mthode est base sur l'influence de la squence primaire sur la migration en gel natif de fragment d'ADN simple brin (Orita et coll., 1989). En condition non dnaturante, les brins d'ADN forment des structures secondaires en tiges/boucles qui sont uniquement dpendantes de la squence primaire, de plus il existe une structure tertiaire provenant de liaisons entre les sucres et les bases. Donc une variation dans une squence primaire s'accompagne d'une diffrence de conformation de lADN simple brin correspondant. Le fragment obtenu par PCR ou le gnome entier est coup par une enzyme de restriction. L'ADN est dnatur soit par la soude soit par la chaleur et dpos sur un gel d'acrylamide. LADN est ensuite mis dans des conditions permettant la formation de structures secondaires en abaissant la tempraturure ou en neutralisant le pH. La migration est dtecte soit par coloration l'argent
SS SS RS SS RS RS SS SS RR RS RR SS

S R

Exemple de SSCP pour determiner le gnotype des individus dune population pour une mutation confrant la rsistance : homozygote sensible (SS), homozygote resistant (RR) et htrozygotes (RS). (produit de PCR) soit par Southern (ADN gnomique), soit aprs marquage du produit PCR (radioactif ou fluorescent). Cette mthode permet de reprer des mutations dans une rgion, mme si elles ne sont pas connues.

24/10/2011

29

ddF (Dideoxyfingerprinting) Cette mthode (Sakar et coll. 1992) est un hybride entre la squence selon la mthode de squenage l'aide des dideoxynuclotides et la SSCP. Le fragment d'ADN o se trouve la mutation est amplifie puis une raction de squence est faite en employant un seul dideoxynuclotide et une amorce marque en 5'. Le produit de la raction est dnature puis charge sur un gel d'acrylamide non dnaturant.

types 11213333434

exemple de ddF (Langemeier et coll., 1994)

Htroduplex sensibilit une coupure


Dans cette technique les deux fragments d'acide nuclique sont hybrids et on dtecte les msappariements en les coupant avec des enzymes ou chimiquement. Utilisation de la nuclase S1 Cette nuclase d'Aspergillus oryzae est spcifique de l'ADN simple brin et ne digre pas l'ADN double brin. On fait une sonde ADN simple brin marqu radioactivement et on hybride avec les diffrentes populations. On fait ensuite un gel en condition dnaturante pour voir la taille. Une autre possibilit est d'amplifier la rgion portant la mutation avec des oligonuclotides portants des
digestion par une nuclase dnaturation dnaturation / hybridation ADN 1 ADN 2 PCR

fluorophores. Les fragments amplifis de l'ADN tmoin et de l'ADN test sont runis dans le mme tube, dnaturs et hybrids. La prsence d'une mutation est ensuite mise en vidence en incubant le produit de l'hybridation avec la

nuclase puis en faisant migrer les produits de la digestion sur un gel en conditions dnaturantes.

24/10/2011

30

D'autres nuclases peuvent tre employes, la nuclase P1 de Penicillium citrinum ou la mung bean nuclase de Vigna radiata ou la nuclase CEL 1 du cleri. Les trois premires nuclases sont des protines Zinc et sont principalement actives pH 5. Cette action pH acide pose quelques problmes pour les rgions riches en AT en effet ce pH on peut avoir une dnaturation partielle de l'ADN. Dans ce cas on peut utiliser une nuclase de plante comme la nuclase CEL 1 du cleri qui coupe l'ADN simple aux pH neutres (Oleykowski et coll. 1998) Certaines nuclases comme la nuclase S1 digrent trs difficilement lorsque le msappariement est limit une seule base, mais au-dessus de deux bases la vitesse de raction augmente normment. Dans ce cas, la technique n'est donc valable pour dtecter des dltions de petites tailles.

Utilisation des RNAse (Myers et coll., 1985) Les RNAse A, T1 ou T2 coupent les ARN sous forme simple brin et non lorsqu'ils sont hybrids. Lors d'une hybridation entre deux clones de deux individus diffrents, les msappariements seront digrs et seuls les rgions hybrides resteront. La technique est donc quivalente la digestion par la nuclase S1 mais ici on utilise une sonde ARN. Cependant les RNAse ne digrent pas tous les msappariements, elles digrent uniquement C-A, CC, C-T et U-T, c'est dire 4 sur les 12 possibles. Pour augmenter ce nombre on peut faire deux ARNs marqus pour les deux espces et dans ce cas on voit 60% des msappariements. Un fragment de PCR est synthtis, une des deux amorces comporte la squence du promoteur de la T7 et l'autre la squence SP6. Utilisation de la nuclase ABC Cette nuclase ne reconnat pas les msappariements moins qu'ils naient auparavant ragi avec la carbodiimide. L'htroduplex est modifi par la carbodiimide et ensuite digr par la nuclase ABC.
sauvage gel mutant coupure la RNAse A + T1 Hybridation ARN messager ARN marqu

24/10/2011

31

Cette mthode permet de voir toutes les mutations mais la nuclase ABC n'est pas actuellement disponible. Coupure par les mthodes chimiques (CCM= Chemical Cleavage of Mismatch) Les mthodes chimiques ont t dveloppes par les auteurs qui ont tudi les structures secondaires des ARN. Les produits chimiques prsentent un certain nombre d'avantage sur les enzymes, ils agissent sur une gamme de pH et de force ionique beaucoup plus large, il n'y a pas de problme d'instabilit et ils ne ncessitent pas d'avoir un acide nuclique purifi. De nombreux produits chimiques ragissent avec les bases des acides nucliques, ils produisent des lsions qui peuvent tre ensuite coupes par un traitement alcalin, c'est le principe de base de la mthode de squence de Maxam et Gilbert. Parmi ces produits l'hydroxylamine (H) ragit avec les C msapparis, le tetraoxide d'osmium ragit avec les T msapparis (OT). La combinaison des deux (HOT) permet de dtecter les C et T. (Cotton et coll., 1988).

24/10/2011

32

II ) Analyse du polymorphisme
On peut analyser le polymorphisme en analysant plusieurs mutations mais souvent on s'intresse plusieurs locus.

Protines Les premires mthodes danalyse du polymorphisme utilisaient les diffrences de migration des protines dun individu sur gel ltat natif. Quelques protines telles que les estrases taient rvles par leurs activits. Ces mthodes ont t trs utilises par les gnticiens des populations mais le nombre de variants tait assez faible et pouvait rsulter dun effet transcriptionnel.

Analyse des fragments de restriction RFLP On peut dterminer l'identit d'un plasmide en effectuant sa carte de restriction. Cette mthode peut s'appliquer tous les fragments d'ADN la condition qu'ils ne soient pas trop grand, condition que la digestion ne gnre qu'un nombre limit de fragment. Chez les eucaryotes, les petits gnomes sont reprsents par les gnomes mitochondriaux et chloroplastiques. On purifie donc les mitochondries ou les chloroplastes puis on isole leur ADN. La carte de restriction permet ainsi de les identifier et en consquence d'identifier leur porteur. Cette mthode n'ayant pas besoin d'information de dpart, elle a t une des premires utilises pour diffrentier des individus ou des populations.
RFLP sur lADN chloroplasmique de trois individus (Mariac et coll. 2000) Hae III EcoRI

On peut aussi analyser les sites de coupures par des enzymes de restriction sur lADN gnomique. Cependant la digestion donne trop de fragments pour pouvoir tre analys. Pour rfduire le nombre de fragment on peut soit faire un Southern avec un mlange de sonde, soit amplifi certaines rgions

24/10/2011

33

du gnome par PCR puis ensuite analyser le polymorphisme de restriction sur les fragments amplifis.

AFLP (Amplified Fragment Length Polymorphism) On digre l'ADN avec deux enzymes, une qui coupe rarement comme par exemple Eco RI (G/AATTC) et une qui coupe souvent comme par exemple Mse I (T/TAA). On ajoute deux adaptateurs aux deux extrmits l'aide d'une ligase. Un adapteur diffrent est utilis pour chaque site et l'enzyme de restriction ne coupe pas le produit de la ligation. Les adaptateurs sont une concentration suprieure celle des fragments d'ADN si bien que la ligation se fait prfrentiellement avec l'adaptateur. L'adaptateur de site rare (Eco RI) est li la biotine ce qui permet de slectionner les fragments EcoRI/ MseI et Eco RI / Eco RI sur une colonne de streptavidine agarose. Ces fragments sont amplifis par PCR avec des oligonuclotides spcifiques des deux adaptateurs utiliss, celui hybridant sur l'adaptateur du site rare (Eco RI) est marqu radioactivement pour ne pas voir les amplifications des fragments Mse I/ MseI qui nauraient pas t limins lors de la slection par la biotine. Le rsultat de la PCR est analys sur gel de squence par radioautographie. Sil y a trop de bandes, un site coupant plus rarement est utilis.
Adaptateur MSE I (T/TAA) TANNNNNNNNNNN NNNNNNNNNNN Adaptateur Eco RI (G/AATTC) AATTNNNNNNNNNNNNNN NNNNNNNNNNNNNN-biotine

24/10/2011

34

Gnotypage et cartographie gntique


Parmi les variations de squences entre individus, l'identification d'une mutation ponctuelle (SNP, single-Nucleotide Polymorphism) est une information utile dans de nombreux domaines et plus particulirement comme marqueur de maladie gntique. Il existe plusieurs techniques permettant de dtecter une mutation ponctuelle, mais rcemment une quipe a dvelopp une mthode qui permet de mettre en vidence des milliers de mutations ponctuelles dans le gnome humain en une seule exprience (Wang et al., 1998). Il fallait au pralable identifier les SNP, ils ont donc squenc un grand nombre de STS (SequenceTagged Site) qui sont des squences rparties au hasard sur l'ensemble du gnome. Mais cette mthode est laborieuse. Une deuxime mthode a alors t mise en uvre, l'aide de puces ADN. Des oligonuclotides correspondant des STS ou des EST ont t synthtiss sur une puce, et des oligonuclotides comportant des mutations ont t synthtises sur les spots voisins. En hybridant l'ADN d'individus diffrents sur ces puces, ils ont pu dtecter des diffrences d'hybridation et donc mette en vidence des SNP. Ils ont ainsi utilis 149 puces comportant chacune 15000 30000 oligonuclotides. Ce qui a permis de mettre en vidence environ 3000 SNP. La position des SNP sur la carte gnomique a pu ensuite tre dtermin en utilisant une srie de lignes cellulaires comportant chacune une fraction du gnome humain (radiation-hybrid mapping). Une fois les SNP dtermins et ventuellement cartographis, il a suffit de synthtiser des petits oligonuclotides variants hybridant sur un allle ou sur l'autre puis les dposer sur une puce ADN.

24/10/2011

35

Les micro et minisatellites


Les diffrentes parties du gnome sont plus ou moins variables, les parties codantes et les promoteurs prsentent des squences trs conserves par contre, les parties non codantes sont plus variables. Mais il existe des lments qui sont encore plus variables, ce sont les micro et minisatellites. Ce sont des lments hautement rpts qui forment des rptitions de 1000 ou de million de copies similaires. Leur nom vient du fait qu'au dpart ils ont t identifis parce qu'ils taient prsents dans une bande diffrentie en centrifugation isopycnique (en gradient de CsCl). Cela est du au fait que certains dentre eux avaient une composition en base diffrente de l'ADN total. Ils sont gnralement prsents dans l'htrochromatine des chromosomes, rgion ou la frquence de recombinaison est faible comme par exemple le centromre. Ils ont la proprit d'tre trs variables, ceci tant du - des mutations, comme pour le reste de l'ADN - des crossing over ingaux - un glissement de polymrase - une rplication en "rolling circle". La variabilit est fonction du satellite analys, le plus variable dans l'individu ne sera pas utilisable, un moins variable permettra de voir des diffrences entre les individus d'une mme population (utilisable par exemple en criminologie), un moins variable permettra de voir des diffrences entre les populations. Microsatellites ou STR (Short Tandem Repeat) : rptitions de 2 4 bases, ils sont trs variables, On les clone en criblant une banque gnomique avec un oligonuclotide compos de la rptition. On squence les clones pour connatre les squences adjacentes, qui elles sont prsentes en simples copies dans le gnome. On synthtise des oligonuclotides spcifiques qui hybrident de chaque cot de la rptition. On amplifie par PCR en prsence de nuclotides marqus et on fait un gel dnaturant de type squence. On peut ainsi dterminer la taille de la rptition.

24/10/2011

36

Minisatellites (ou VNTR : Variable Number Tandem Repeat) rptitions de 8-15 bases, variabilit qui proviendrait de crossing over ingaux. Comment les clone ton? En prenant une sonde au hasard, au dbut on prenait M13 comme sonde et on criblait une banque d'ADN gnomique. L'hybridation se fait mal mais comme elle se fait frquemment on obtient une hybridation dcelable. Une autre mthode fait appel au hasard, en criblant des banques avec un oligonuclotide pour trouver un gne, par le mme effet, on clone des minisatellites. Le clone est squenc et on obtient la squence du minisatellite qui peut servir pour l'espce et pour des espces proches. Une troisime mthode consiste digrer l'ADN avec une ou plusieurs enzymes en qui coupent frquemment (tous les 400 pb) comme Sau3A, GATC. Puis faire un gel qui est color au bromure d'thidium. On voit des bandes de haut poids molculaire. Ces bandes sont extraites du gel et clones, au besoin aprs coupure au hasard (ultrason), puis squences. Utilisation des minisatellites : L'ADN des populations analyses est digr par une enzyme de restriction qui coupe souvent mais pas dans la rptition. On obtient ainsi des fragments qui correspondent la taille des rptitions. Ces fragments sont spars sur un gel d'agarose, transfrs sur nitrocellulose ou nylon et hybrids avec le minisatellite. On obtient un fingerprint. Utilisation: typage au niveau de l'individu : criminologie, recherche de paternit

Dtection du nombre de rptition dun lment rpt Il existe plusieurs mthodes pour quantifier le nombre de rptitions : On peut faire une PCR quantitative en utilisant deux amorces hybridant dans lunit rpte. On estime ainsi le nombre de rptition dans le gnome. On peut faire un Southern pour estimer la longueur de chaque rptition. On peut faire une PCR avec des amorces externes. Dans ce cas on estime le nombre de rptitions un seul locus. Une mthode de dtection a t dveloppe par Schalling et al. (1993). On utilise un oligonuclotide complmentaire la squence rpte. Correspondant par exemple 5 rptitions. On incube lADN analyser avec loligonulotide et une ADN ligase thermostable. A chaque cycle, il y a hybridation puis ligation jusqu ce que le produit de la ligation corresponde la taille de la rptition. Le produit de la raction est ensuite

24/10/2011

37

charg sur un gel dnaturant et la taille des produits de la ligation est dtermin, soit par Southern, soit en ayant marqu les oligonuclotides au pralable.

MAAP (Multiple Arbitrary Amplification profiling)


Cette mthode inclus (Caetano-Anollis, 1994) : DAF: DNA amplification fingerprinting RAPD : random amplified polymorphism DNA AP-PCR : Arbitrary primed PCR Ces trois mthodes impliquent une amplification entre des amorces prises au hasard pour obtenir un pattern variant. La principale diffrence entre les trois techniques est principalement la longueur des amorces utilises par la PCR (5-15 nt pour le DAF, 9-10 pour le RAPD et 18-32 pour le AP-PCR) Dans les deux premiers la temprature d'hybridation est proche du Tm de chaque oligonuclotide de telle faon que les sites d'hybridation correspondent la squence. Dans le dernier cas la temprature d'hybridation est en dessous de Tm de telle
Distinction de deux espces dinsectes par RAPD (les deux espces ne sont que trs difficilement diffrentiables par des critres morphologiques) Espce 1 Espce 2

sorte que des oligonuclotides de 11-15 hybrident. L'AP-PCR revient en fait utiliser un mlange de diffrents oligonuclotides plus petit. Cette mthode prsente lavantage de ne pas ncessiter dinformations au pralable, on peut lappliquer sur des espces dont on ne connat aucune squence. Dans les MAAP on peut inclure lIMA (Inter Microsatellite Amplification). On amplifie lADN gnomique avec des amorces microsatellites (Zietkievwicz et al., 1994) comportant en 3 quelques nuclotides au hasard pour diminuer le nombre de bandes.

24/10/2011

38

III) Dtection d'une squence


Dans ce cas on veut dtecter une squence particulire par exemple pour dtecter un parasite dans un organisme. La technique la plus sensible est le PCR associ une technique de dtection de l'amplification (voir chapitre sur la PCR) ou le NASBA si on veut dtecter un ARN. Dans certains cas on veut dtecter la frquence dune squence, par exemple dans lunion europenne, la proportion dorganisme gntiquement modifi ne doit pas dpasser 3% dans la nourriture. On utilise alors la PCR quantitative en prenant comme tmoin un gne de lorganisme qui est donc prsent aussi bien dans les organismes modifis que dans les organismes sauvages. Le rapport des deux amplifications donne la proportion dOGM dans lchantillon.

24/10/2011

39

Expression des protines recombinantes

Introduction
Une fois qu'un gne a t clon, on dsire souvent obtenir une protine partir d'un fragment d'ADN. La technique utilise dpendra tout d'abord de l'objectif final. Par exemple, si on a besoin de la protine pour faire un anticorps polyclonal, on n'a gnralement pas besoin d'avoir une protine active mais par contre la protine doit tre facilement purifiable. Dans ce cas on s'orientera vers la production en bactrie, en fabriquant des protines de fusion ou la protine d'intrt est fusionne avec une autre protine facilement purifiable. Si le but est d'obtenir une protine pour des tudes de biochimie ou de biologie cellulaire, la purification n'est pas toujours le problme prdominant par contre l'activit de la protine (enzyme, rcepteur) devient plus important. Enfin, pour des tudes de biochimie ou de biophysique, on peut avoir besoin de grande quantit de protines purifies comme par exemple pour les tudes de biochimie structurale. On va pouvoir exprimer des protines soit dans des systmes procaryotes, soit dans des systmes eucaryotes. Il faudra donc tenir compte des diffrences entre ces deux systmes. Par exemple chez les procaryotes, l'initiation s'effectue par reconnaissance d'une squence particulire (RBS). Donc, si on veut exprimer un clone provenant d'une cellule eucaryote dans une bactrie, il faudra incorporer cette squence en amont de l'ATG d'initiation.

Rappels sur la traduction


Les vnements de la traduction Couplage de l'acide amin sur l'ARNt L'acide amin se fixe l'extrmit 3' OH ou en 2'OH des ARN de transfert par une liaison ester. Cette raction est catalyse par une enzyme, l'aminoacyl-tRNA synthtase. Il y a tout dabord accrochage de l'acide amin sur l'ATP (aa + ATP ----> aa-AMP + 2 Pi). Le pyrophosphate est hydrolys, la

24/10/2011

40

raction est donc irrversible. Il y ensuite transfert de l'acide amin sur lARNt (aa - AMP + ARNt --> aa - ARNt + AMP). Sur l'enzyme il y a donc trois sites (ARNt, acide amin et ATP) et toutes les ractions se passent sur l'enzyme sans que les constituants intermdiaires quittent l'enzyme. La liaison ester est riche en nergie (provenant de lnergie de la liaison anhydride aa-AMP). Cette nergie sera utilise pour la formation des liaisons peptidiques, pour laccrochage des acides amins les uns aux autres. La raction est spcifique, un ARNt correspond un seul acide amin (le code gntique est du cette spcificit de l'aminoacyl-tRNA synthtase). Pour le vrifier on peut faire lexprience suivante : une cystine lie son ARNt est chimiquement transforme en alanine. Dans la protine, les cystines seront remplaces par des alanines. L'aminoacyl tRNA synthtase reconnat lARNt et lacide amin, pour que la raction soit spcifique, il faut que les reconnaissances prsentent une trs bonne affinit. Mais la reconnaissance de l'ARN de transfert et de l'acide amin n'est pas parfaite. La raction se fait quelquefois avec un mauvais partenaire, et il y a dans ce cas des possibilits de correction.
R H C NH2 C O O

Site acide amin site tRNA


R H C 0 NH 2 0

Site ATP
O O

-O P O
-

P O O

-O P O
O Adnosine

R H C

OH
0

NH 2 O

O P O

Adnosine

24/10/2011

41

L'initiation Il y a 3 phases de lecture possibles: l'initiation permet de dterminer l'endroit exact o commence la traduction. Linitiation seffectue pour ainsi dire toujours au niveau dun codon AUG qui code pour une mthionine. Comme il y a plusieurs AUG dans une squence, Il faut que le bon AUG soit reconnu comme codon de dpart. Chez les procaryotes: Dans la bactrie il y a quilibre entre les formes 70S et 30S + 50 S. Au 30S se lie le facteur d'initiation IF3 ce qui dplace l'quilibre prcdent. Il y a liaison de l'ARN
30 S 70 S + IF3 50 S

30 S

messager avec la sous unit 30S. La liaison s'effectue


+

une squence particulire sur l'ARN (Shine Dalgarno, site de liaison du ribosome) juste en amont, en 5' de l'ATG initiateur. Cette liaison s'effectue par hybridation avec une squence complmentaire en 3' de l'ARN 16S. linitiation est donc interne lARN, il peut y avoir plusieurs sites dinitiation sur lARN. IF3 a deux fonctions : une fonction danti-association des deux sous units 30S et 50S contrlant ainsi le nombre de 30S disponibles pour la traduction et une fonction de liaison de l'ARNm sur le 30S. Un autre facteur d'initiation (IF1) se lie sur le complexe, il

IF3

30 S

mRNA met

met + IF2 methionyl tRNA met +

met

met

met

met

met + +

aide la dissociation entre les deux sous units du ribosome en stabilisant le complexe IF3-30S. Un autre complexe se forme entre IF2 et l'ARN de transfert d'initiation portant une formylmthionine. Les deux complexes se reconnaissent au niveau d'un site appel P. Ce nouveau complexe est capable de se lier au 50S, il y a hydrolyse du GTP en GDP + pi (probablement par une protine du ribosome active par IF2 et relargage des facteurs d'initiation (IF1, IF2 et IF3).

24/10/2011

42

Chez les eucaryotes, l'initiation est diffrente Le ribosome reconnat le cap lextrmit 5 de lARNm. De ce fait l'ARN ne peut pas tre polycistronique. Il ny a pas comme chez les procaryotes de reconnaissance d'une squence particulire en amont de l'ATG. La reconnaissance de lARNm par le ribosome est presque identique. Un complexe contenant une protine eIF2, du GTP et lARNt se lie au 40S libre, c'est ce nouveau complexe qui reconnat lARNm : la diffrence par rapport aux bactries est que lARNt doit tre prsent. Comme pour les procaryotes, la traduction ncessite des facteurs d'initiation et d'longation. Dans certains cas particuliers, il existe des initiations internes chez les eucaryotes : des squences appeles IRES sont reconnues par le ribosome et permettent galement linitiation de la traduction.
met + met 40 S met met + eIF2 methionyl tRNA met + met met met

24/10/2011

43

Llongation Il y a ensuite reconnaissance d'un aminoacyl tRNA sur le site A Il y a transfert de la formylmthionine de l'aminoacyl tRNA d'initiation sur l'aminoacyl tRNA du site A. Il y a alors dans le site A, un peptidyl tRNA et sur le site A un ARNt deactyl LARNt dsacetyl va dans un autre site, le site E, le peptidyl tRNA va dans le site P (avec l'ARN messager). LARNt dsacetyl part du site E ce qui permet l'accessibilit du site A un autre aminoacyl tRNA Cette longation ncessite la prsence de plusieurs facteurs appels EF (facteurs dlongation) Bilan nergtique de l'longation : l'addition d'un acide amin la chane ncessite l'hydrolyse d'une molcule d'ATP et de deux molcules de GTP. L'ATP permet l'accrochage de l'acide amin sur lARNt, une molcule de GTP permet le positionnement de l'aminoacyl-tRNA sur le site A, une deuxime molcule de GTP permet la translocation du peptidyl tRNA du site A vers le site P. Si on regarde le nombre de liaisons riches en nergie, il en a fallu 4 (1ATP en AMP et 2 GTP en GDP), ce qui est important pour faire juste une liaison amide. Mais ici, l'nergie est surtout employe pour assurer la fidlit de la traduction.
AUG N1N1N1 N2N2N2 site P site A AUG N1N1N1 site P site A AUG N1N1N1 site P site A met a.a2

met - a.a2

met - a.a2

a.a3

La terminaison Il y a trois codons STOP = UAA, UAG et UGA. Des protines de libration se lient aux codons STOP au niveau du site A. On les appelle RF (Releasing Factor). Ces protines modifient l'activit de la peptidyl transfrase: il y a addition d'une molcule d'eau la place d'un acide amin. Il y a trois releasing factors chez les procaryotes (RF1 reconnat UAA et UAG; RF2 reconnat UAA et UGA, RF3 permet la dissociation de RF1 ou de RF2 du site A en hydrolysant une molcule de GTP) et une seule chez les eucaryotes. Il y a ensuite libration de la chane polypeptidique en croissance du ribosome, dissociation des deux sous-units ribosomales et libration de l'ARNm. Ainsi, au codon

24/10/2011

44

stop, le ribosome se dissocie, et en aucun cas ne continu traduire lARN, mme sil y a une phase de lecture ouverte en 3.

Rgulation de la traduction Elle peut se faire deux niveaux, au niveau transcriptionnel ou au niveau traductionnel.

Exemples de rgulation au niveau transcriptionnel

L'opron lactose chez E. coli En l'absence de lactose, la bactrie ne fabrique pas les enzymes ncessaires sa mtabolisation (-galactosidase,
oprateur rpresseur pas de transcription

galactoside permase et galactoside actylase). L'expression de ces gnes est gouverne par le mme systme de rgulation, ils sont sous la dpendance du mme promoteur. En prsence de lactose, l'allolactose se forme dans la cellule grce au peu de -galactosidase prsente dans la cellule, l'allolactose se
lactose

allolactose

transcription rpresseur
galactosidase

permase

acetylase ARN

oprateur

fixe un rpresseur, induit un changement allostrique de la protine qui se dtache de l'oprateur, l'ARN polymrase peut se fixer sur le promoteur qui synthtise un ARN polycistronique codant pour les trois protines. C'est une rgulation ngative, le rpresseur fix empche la transcription Le rpresseur est cod par le gne i qui est transcrit sans arrt un taux faible.

24/10/2011

45

La protine d'activation catabolique (CAP). A cot de la rgulation ngative, il existe aussi des rgulations positives, dues des activateurs : l'activateur favorise localement l'action de l'ARN polymrase. La CAP (protine dactivation catabolique) est un activateur qui permet de n'utiliser d'autres sources de carbone qu'en l'absence de glucose chez E. coli. En l'absence de glucose, l'AMP cyclique induit un changement de conformation, la CAP se fixe sur l'ADN, l'opron lactose est transcrit. Ce phnomne est connu sous le nom de rpression catabolique Rgulation du mtabolisme du galactose chez la levure Saccharomyces cerevisiae La rgulation des gnes utiliss pour la mtabolisation du galactose a t trs tudie chez la levure comme source de promoteurs inductibles dans les systmes dexpression de protines. Il y a deux protines rgulatrices principales (GAL4 et GAL80) qui contrlent l'expression des gnes : GAL1 (une kinase), GAL2 (une permase) GAL7 (une transfrase), GAL10 (une epimrase) et MEL1 (une galactosidase). Lorsque le galactose est prsent dans le milieu, GAL4 s'accroche sur un UAS (Upstream Activation Site, quivalent d'un enhancer pour les autres eucaryotes) et, ainsi, favorise la transcription du gne en aval. En l'absence de galactose, GAL80 s'accroche sur l'extrmit C terminale de GAL4, l'empchant de s'accrocher sur l'UAS. A cot de ce systme il y a comme pour E. Coli un systme de rpression en prsence de glucose dans le milieu.
+ glucose - lactose - glucose + lactose
CAP transcription

- glucose - lactose + glucose + lactose

CAP

rpresseur

rpresseur

24/10/2011

46

L'opron tryptophane chez E. coli La synthse du tryptophane


leader TrpE

transcription TrpD TrpC Trp B TrpA ARN promoteur oprateur

ncessite plusieurs tapes qui sont catalyses par 5 enzymes codes par les gnes TrpA, TrpB, TrpC, TrpD, et TrpE. Cet opron contient en outre un promoteur, un oprateur et une squence leader qui joue un rle de rgulation au niveau
rpresseur

+ tryptophane

pas de transcription

traductionnel (voir plus loin). En l'absence de Trp, les 5 gnes sont transcrits, traduits et le Tryptophane est synthtis. En prsence de Trp, l'acide amin se fixe sur le rpresseur qui lui-mme se fixe sur l'oprateur et l'opron n'est plus transcrit. Il s'agit encore ici d'une rgulation ngative, le rpresseur fix empche la transcription mais ici la fixation du ligand permet la protine de se fixer l'ADN.
oprateur

L'opron arabinose chez E. coli. AraC est une protine dimrique qui
C N N C I1 I2 + arabinose AraC

O2

s'accroche sur deux sites distants de 210 pb en l'absence d'arabinose. Les deux protines interagissent si bien que l'ADN forme une boucle qui rprime la transcription. Lorsqu'il y a de l'arabinose, il se fixe sur AraC. Il s'ensuit un changement conformationnel. Le site distal n'est plus utilis et AraC se fixe sur un autre site proximal. Dans cette configuration, AraC agit en tant qu'activateur transcriptionnel.
O2

NN C CAP I1 C I2

AraC transcription

24/10/2011

47

Exemple de rgulation au niveau traductionnel : lopron tryptophane chez E. coli. En parallle la rgulation au niveau transcriptionelle, il existe une rgulation au niveau de la traduction, appele attnuation rappel: - chez les procaryotes la transcription et la traduction sont simultanes - les ARNs sont polycistroniques - l'arrt de la transcription : lARN polymrase s'arrte quand elle synthtise une srie de rsidus U dans la mesure o elle a d'abord synthtis une squence auto-complmentaire capable de se replier. L'ARN, dans la rgion du leader-attenuateur, peut prendre deux structures secondaires distinctes: 1) Dans le cas ou la partie codante ne forme pas de structure secondaire, les parties 2 et 3 suivantes forment une structure secondaire. Il y a continuation de la transcription. 2) Dans le cas ou la partie codante forme une structure secondaire avec la partie suivante (2), il se forme une deuxime boucle prsentant une structure
ribosome bloqu sur la squence leader 1 2 3 transcription 4 1 2 3 4 UUUUU arrt de la transcription promoteur oprateur tryptophane rpresseur leader TrpE transcription TrpD TrpC Trp B TrpA ARN

secondaire d'arrt de la transcription. Ainsi, selon les structures secondaires au niveau de la squence dattnuation, il y a soit transcription des 5 phases de lecture soit arrt prmatur de la transcription et donc pas de traduction des 5 protines ncessaires la synthse du tryptophane. La squence leader est traduite en un peptide de 14 acides amins comportant du tryptophane dans sa squence, lorsqu'il y a du trp dans le milieu le ribosome passe travers et on a la structure 1 et donc arrt de la transcription. En absence de Trp, le ribosome reste bloqu, la transcription continu, la partie 1 ne peut pas s'hybrider avec la partie 2 du fait de la prsence du ribosome, la transcription continue.

24/10/2011

48

Ainsi en labsence de tryptophane, le ribosome reste bloqu sur lARN en cours dlongation et provoque un changement conformationnel de lARN induisant un arrt de transcription.

Exemple de rgulation au niveau traductionnel : contrle de la traduction du gne ompF. La rgulation est due la synthse d'un petit ARN contrlant directement la traduction du gne ompF. Lorsque la pression osmotique augmente, il y a activation de la protine ompR qui active la transcription de micF. Il y a synthse dun petit ARN de 174 bases appel micRNA (mRNA interfering
3 ARN micF gene micF OmpR

transcription 5

ARN de ompF 5 traduction 3

complementary RNA). Cet ARN est antisens complmentaire d'une rgion de ompF qui inclue le site de liaison au ribosome : il empche la traduction de
hybridation

OmpF inhibition de la traduction

ompF et il devient sensible des RNases qui digrent lARN double brin. OmpF code pour une protine de la membrane externe de E. Coli qui ne doit plus tre traduite lorsque la pression osmotique augmente. Utilisation de ce systme : cet exemple a servi de modle pour tudier l'expression de certains gnes. On peut soit transcrire un ARN complmentaire celui du gne teindre soit utiliser des oligonuclotides qui s'hybrident au niveau de l'AUG. Le problme est qu'il faut une grande quantit d'antisens.

Compartimentalisation et modifications post-traductionelles Chez les procaryotes, transcription et traduction sont simultanes, il n y a pas de modification posttranscriptionelle. Il y a un seul compartiment, et il existe peu de modifications des protines aprs leurs synthses (modifications post-traductionelles). Par exemple, les protines ne sont pas glycosyles.

24/10/2011

49

Chez les eucaryotes, transcription et traduction ont lieu dans deux compartiments diffrents, le noyau et le cytoplasme. Les ARN sont maturs avant leur exportation dans le cytoplasme, ils sont capps en 5, pisss et pourvus dune queue polyA lextrmit 3. Une fois dans le cytoplasme, ils sont traduits. Il y a alors deux possibilits. Soit la protine se replie dans le cytoplasme dans un milieu rducteur soit la protine est exporte dans le rticulum endoplasmique, cet vnement est cotraductionel. Lexportation dans le rticulum endoplasmique est due un peptide signal en Nterminal de la protine, ce peptide est reconnu par la particule de reconnaissance du signal, et le peptide en cours de synthse est dirig lintrieur du rticulum endoplasmique. Le milieu est oxydant, il va y avoir formation de ponts disulfure, la protine peut tre glycosyle et son repliement est aid par des protines spcialises, les foldases. Ces protines passent ensuite dans les diffrents compartiments de lappreil de Golgi et sont soit secrtes soit insres dans la membrane.

24/10/2011

50

Expression transitoire partir d'un ARNm ou d'un ARN in vitro (cRNA)


Il est possible de fabriquer un ARN in vitro partir d'un gne et ensuite de le faire traduire soit in vitro dans un lysat cellulaire, soit dans des cellules. Dans ce dernier cas on utilise par exemple l'ovocyte de Xnope.

Obtention d'un cRNA. La mthode classique consiste cloner le fragment exprimer dans un plasmide en aval d'un promoteur reconnu par ARN polymrase puis polymriser lARN in vitro avec lARN polymrase. On utilise gnralement les ARN polymrases des phages SP6, T3 ou T7. Le plasmide est ensuite coup avec une enzyme de restriction dont le site se situe en aval de la squence codante pour viter des brins 3' trop longs qui peuvent affecter la traduction. Le produit de cette digestion, une fois purifi, est incub avec lARN polymrase correspondante au promoteur et des ribonuclotides. On peut faire directement une raction de RT-PCR sur des ARN extraits de cellules exprimant le gne dintrt. Lamorce sens (en 5) comportera en amont de la squence hybridant sur le gne, la squence reconnue par la RNA polymrase et ventuellement les squences ncessaires la traduction. Enfin si le clone nest pas disponible, si on ne dispose pas de cellule exprimant la protine, on peut toujours faire un gne synttique par assembalage doligonuclotides. Linitiation de la traduction dans les systmes eucaryotes ncessite la reconnaissance dun Cap, puis le dmarrage de la traduction au premier ATG. LARN noform est dpourvu de Cap. Les ractions de capping tant difficiles faire car elles ncessitent plusieurs tapes, on utilise des astuces. Une astuce consiste remplacer 90% du GTP fourni la cellule par du diguanosine triphosphate (m7G5'ppp5'G). Ce produit doit tre enlev avant la traduction in vitro, il est en effet un inhibiteur fort de la traduction (il rentre en comptition avec lARNc). Une deuxime astuce vient dune observation, la traduction du gne de la globine ne dpend pas de la prsence du cap, on peut donc utiliser le leader de la globine en fusion avec le gne destin tre traduit. De plus il est important que l'ATG initiateur soit le premier ATG suivant linitiation de la transcription.

24/10/2011

51

Traduction in vitro
Des extraits de nombreuses cellules peuvent tre utiliss pour traduire des ARNm. Il faut que tous les lments de la machinerie ncessaires la traduction (ribosome, ARNt, acide amin, aminoacyl-tRNA synthetase, facteurs d'initiation, d'longation et de terminaison) soient prsents. Par contre le noyau, les polysomes et les inhibiteurs de la traduction doivent tre enlevs pour viter la transcription (noyau) et la traduction dARNm endognes (polysomes). De plus l'extrait doit avoir peu d'activit RNAsique pour ne pas dgrader les ARNm. La prparation d'un tel extrait cellulaire consiste le plus souvent lyser les cellules par choc osmotique, et retirer les polysomes et les noyaux par centrifugation. Le plus souvent les acides amins sont aussi retirs par tamisage molculaire par exemple sur G25. Les acides amins froids et un acide amin marqu sont rajouts. La synthse est simple il suffit de rajouter lARNc au lysat cellulaire. Quelquefois une tape de digestion des ARN par une nuclase a t rajoute en fin d'incubation mais gnralement cette digestion n'est pas utile. Plusieurs extraits sont utiliss en systme eucaryote mais le lysat de rticulocyte et l'extrait de germe de bl sont les plus populaires car ils sont les plus efficaces et sont actuellement commercialement disponibles. Mais on peut effectuer des traductions in vitro avec un d'autres d'extraits cellulaires tels que : - les ascites. Ces cellules sont prleves partir de la peau abdominale de souris, lyses par choc osmotique et les ribosomes sont prpars par centrifugation. - la levure : l'avantage de ce systme est qu'on dispose d'un grand nombre de mutants de rgulation de la traduction. Un systme est utilis pour les procaryotes, un lysat d'E. coli S30 (par exemple commercialis par Promega). L'avantage de ce systme est qu'il peut tre coupl la transcription in vitro: pendant la transcription l'extrmit 5' devient disponible pour la traduction. Le systme de trascription comporte tous les lments ncessaires aux deux tapes : NTPs, RNA polymrase, tRNAs, acides amins, un systme de rgnration de lATP, des ribosomes

24/10/2011

52

Dans l'utilisation de systmes coupls, il faudra faire attention au promoteur utilis, certain promoteur de E. Coli tel que lac ne sont efficaces que si l'ADN est surenroul alors que d'autres ne sont pas sensibles au surenroulement (lacUV5, tac, PL ou PL ). Seuls ces derniers seront efficaces sur un fragment linaire. La traduction in vitro synthtise des protines pendant environ 30 minutes temprature ambiante. Mais des systmes en flux continu ont t dvelopps. Les composants de la traduction sont maintenus dans un boudin de dialyse dans lequel on injecte des acides amins, la protine synthtise sort du boudin de dialyse alors que les composants de la traduction formant des complexes ARN-protines sont trop gros pour passer travers la membrane de dialyse. De tels systmes peuvent fonctionner jusqu' 45 heures. Marquage de la protine : les extraits sont riches en protine, la protine nosynthtise n'est donc pas biochimiquement pure mais comme on traduit un seul ARN, on la marquer. Le plus communment on utilise un acide amin radioactif. La [35S] mthionine est le plus souvent utilise, Mais dautre marquage sont possibles en labsence de mthionine tel que la [35S] cystine ou la [14C] leucine ou l[3H] leucine. Dans ce cas la protine nosynthtise est radiochimiquement pure. Pour viter lutilisation dlments
Lysine Fluorophore
CH 3 O H A O N C C NH O O 2 O O O O O O O O O O O O O O O O O OO OO O O OO O O O O O O O OO OO O O O O O O OOOOOO O O O O OOO O O O O O O O O OO O O O O O O OO O O O O O O O O O O O O O O OO N F N F CH 3

peut

radioactifs on peut utiliser des marquages froids. On peut utiliser des Lysinyl-tRNA modifis avec une lysine marque la position epsilon par de la biotine ou par un fluorophore. LARNt est ajout la solution de traduction et la lysine modifie est incorpore la protine. Dans le cas du marquage la biotine, la protine est rvle laide de streptavidine conjugue une enzyme (proxydase ou phosphatase alcaline), dans le cas dun marquage par un fluorophore, la protine est rvle directement par fluorescence.

24/10/2011

53

Avantage de la mthode La traduction in vitro prsente principalement l'avantage de permettre l'expression de protines trs toxiques pour la cellule. De plus, lors de la traduction d'un ARNc, on obtient une protine marque. On n'a donc pas besoin de purifier la protine. Dans les systmes flux continu, la protine qui sort de la dialyse est pure et non uniquement marque, les acteurs de la traduction restant dans le compartiment intrieur. Inconvnients de la mthode Les protines exprimes in vitro ne sont gnralement pas actives. Toutefois, on peut dans certains cas obtenir des protines actives. Ce sera le plus souvent le cas des protines exprimes dans le cytosol. Par contre les protines exprimes dans le rticulum endoplasmique puis matures dans le golgi seront le plus souvent inactives. Utilisation - Cette mthode est utilise pour vrifier qu'un ARN messager est bien prsent. Par exemple si on veut cloner un gne et qu'on a choisi comme moyen le criblage avec un anticorps. On commence par purifier les ARN messagers pour faire une banque dADNc, l'anticorps servira alors cribler la banque. Mais on ne sait pas toujours si l'ARN est prsent au dpart si le gne n'a pas encore t clon, on ne connat dans le meilleur des cas que la rpartition spatio-temporelle de la protine. Un des moyens de vrification consiste traduire in vitro les ARN messagers puis slectionner les protines ragissant avec l'anticorps, si on slectionne une protine de taille attendue, l'ARN est bien prsent dans le pool de dpart. - Cette mthode permet d'incorporer des acides amins modifis contenant par exemple des groupes photoactivables ou fluorescents. De mme on peut incorporer des acides amins modifis tels que de la lysine biotinyle, on obtient alors une protine biotinyle sur les lysines. - Cette mthode permet dobtenir des prcurseurs utiles par exemple pour tudier l'adressage des protines dans la mitochondrie. Lors de la translocation dans la mitochondrie, la protine est dplie, puis nouveau replie l'intrieur de la mitochondrie. Pour tudier le

24/10/2011

54

passage, on utilise une protine fabrique in vitro et marque radioactivement. De mme si on tudie le repliement des protines in vitro partir du prcurseur nosynthtis et non partir dune protine dnature, la traduction in vitro permet de suivre les diffrentes tapes. Lobtention du prcurseur permet dtudier certaines tapes de maturation des protines comme la N-glycosylation en ajoutant une source de rticulum endoplasmique au lysat de rticulocyte sous forme de microsomes.

Traduction en milieu cellulaire. Lovocyte de Xnope Les ovocytes de Xnope sont des grosses cellules dans lesquelles on peut injecter une solution dARN. Le Xnope est un batracien anoure aquatique vivant en Afrique du Sud et qui se maintient aisment en aquarium. Il pond plusieurs centaines dufs. Si on traite les femelles par des hormones, on peut synchroniser la maturation des ovocytes. Environ deux mois aprs on dissque les femelles et on prlve les ovaires aprs avoir anesthsi la femelle en la mettant au froid, sur de la glace. Le Xnope est relativement robuste et on peut facilement recoudre la femelle et la rutiliser aprs. On traite les fragments dovaire la collagnase pour retirer les cellules folliculaires et on obtient des ovocytes qui font quelques millimtres de diamtre. La solution dARNc, de l'ordre de 100 nl, est injecte dans le cytoplasme. Les ovocytes sont mis incuber dans un tampon contenant au besoin un acide amin marqu. Un deux jours aprs, la protine a t synthtise. Ce systme est particulirement performant pour tudier les rcepteurs situs sur la membrane externe de l'ovocyte. Il est alors facile de faire les expriences d'lectrophysiologie pour tudier le rcepteur. L'avantage est que l'ovocyte est dpourvu de rcepteur. Plus rarement, ce systme est utilis pour tudier d'autres protines. Mais il s'est avr trs utile pour tudier des protines scrtes. En effet l'ovocyte de Xnope ne secrte pas de protines, si bien que la seule protine sortant dans le tampon dincubation des ovocytes est la protine dont lARNc a t inject. On obtient donc directement une protine pure. L'inconvnient du systme est qu'on en n'obtient que trs peu.

24/10/2011

55

Expression en systme procaryote


I) Escherichia coli Escherichia coli a t trs tudi depuis les annes 60 si bien que c'est un des organismes actuellement les mieux connus. L'ensemble de ces connaissances en biochimie, gntique et biologie molculaire a t exploite pour exprimer des protines en grande quantit. Cette bactrie a plusieurs proprits intressantes lui permettant dtre utilise pour exprimer des protines : elle est facile manipuler, elle pousse vite dans des milieux relativement peu cher et les souches de laboratoires sont inoffensives. De plus, tous les laboratoires de biologie molculaire utilisent E. coli pour dautres expriences (clonage, squence). Cette facilit en a fait le systme d'expression le plus populaire. Ce qui est indispensable pour produire une protine dans E. coli. Pour exprimer un gne dans E. coli, il doit tre insr dans un vecteur qui contient plusieurs lments : 1) une origine de rplication, un marqueur slectionnable pour trier et maintenir les bactries ayant incorpor le vecteur et un polylinker, comme tous les plasmides servant de vecteur, 2) un promoteur, si possible contrlable, dont l'induction produira une grande quantit dARNm partir du gne clon, 3) les squences responsables de la traduction telle qu'une squence de liaison au ribosome, ces squences doivent tre bien positionnes.

a) Lorigine de rplication Le gne doit tre rpliqu dans la bactrie, autrement, on va le perdre trs rapidement. La mthode gnrale consiste linsrer dans un plasmide qui porte une origine de rplication. Il existe plusieurs origines de rplication (ori) disponibles. Celle de bluescript (500-700 copies par chromosomes), celle de pBR322 (15-20 copies) et celle de P15A (10-12 copies). Si le produit du gne est toxique on utilisera une origine de rplication qui donne peut de copies, au contraire si le gne nest pas toxique et sil est bien rgul, on utilisera une origine fort nombre de copies

24/10/2011

56

On peut positionner lorigine de rplication pour favoriser la production de protines. Si on veut exprimer un gne non toxique pour la bactrie, l'expression sera simultane la croissance de la population bactrienne. La fourche de rplication doit alors plutt progresser dans le mme sens que la transcription du gne de slection, ainsi la transcription ne gnera pas la rplication du plasmide. Ce phnomne est le mme que celui qui gouverne rplication et transcription dans le chromosome bactrien. Si on veut exprimer un gne toxique pour la bactrie, l'expression s'effectuera en phase stationnaire, lorsqu'il n'y a plus de rplication. La fourche de rplication doit progresser en sens inverse de la transcription pour avorter toute transcription non dsire. Lorigine de rplication la plus utilise est ColE1, elle donne de 15 20 copies par cellule. Lorigine M15 est parfois utilise (10-15 copies). Elle est plus particulirement utilise avec ColE1 lorsquon veut produire deux protines simultanment dans la mme bactrie (Kholod et Mustelin, 2001). En effet ColE1 et M15 sont compatibles. Lutilisation de plasmides pour exprimer un gne dans E. coli est brevet, ceci a amen lutilisation dune autre origine de rplication (Olson et al., 1998). Le gne dintrt est ici incorpor au chromosome bactrien. Pour ce faire, on transforme les bactries avec un ADN comportant le site dattachement du phage , aatP, mais ne comportant pas dorigine de rplication. En prsence dune intgrase code par un plasmide, lADN va sintgrer dans le site attB du chromosome bactrien. Pour slectionner les intgrants, on ajoute un gne de rsistance la kanamycine lADN. Dans un tel systme, on nobtient quune copie du gne dintrt. Pour en avoir plusieurs copies et ainsi augmenter la quantit de protine produite, on peut ajouter lADN des squences permettant la duplication mdie par rec-A et un gne de rsistance la ttracycline pour slectionner les bactries contenant un grand nombre de copies du gne en tandem. Une augmentation progressive de la dose de ttracycline permettra daugmenter le nombre de copies.

24/10/2011

57

tetR promoteur kanR gne dintret

attP intgration dans le chromosome bactrien attBP

attPB

amplification gnique (slection pour la rsistance la ttracycline) attBP

b. Les promoteurs Deux domaines en amont du site d'initiation de la transcription sont importants dans les promoteurs procaryotes. Le domaine -10 (Pribnow box, 5' T-A-T-A-A 3') et un domaine -35 (5' T-T-G-A-C-A 3'). Ces deux domaines sont en contact avec lARN polymrase lors de l'initiation de la transcription. Deux caractristiques des promoteurs sont importantes pour lexpression des protines, la force du promoteur et son inductibilit. La force du promoteur : les promoteurs bactriens sont relativement faibles du moins pour les besoins de production. Pour les amliorer, des mutations ponctuelles ou des petites dltions ont t effectues au sein de ces promoteurs, ce qui a permis d'augmenter la transcription. Linductibilit, cest dire son contrle : le plus souvent on dsire utiliser un promoteur inductible par exemple lorsque la protine est trs toxique pour la bactrie. Dans ce cas, la protine est produite en dbut de la culture et inhibe la croissance

24/10/2011

58

cellulaire. En utilisant un promoteur inductible, on cherchera inhiber la production au dbut de la phase de croissance des bactries puis lapproche de la phase stationnaire, on induira la production. La force des promoteurs : Plusieurs techniques ont t utilises pour augmenter la force des promoteurs. On peut liminer des rpresseurs. Ainsi Le promoteur Plac du gne lacZ dpends de l'activation par la CRP/cAMP. Pour pouvoir tre utilis, ce promoteur doit tre mut (mutation UV5) afin que la rpression catabolique ne puisse pas s'exercer (le rle de la rpression catabolique est de ne pas utiliser le galactose en prsence d'autres sources de carbone, principalement en prsence de glucose). Ainsi on pourra avoir une transcription en prsence de glucose (Hirshel et al., 1980). Le remplacement des squences du promoteur du gne lacZ en amont de la position -20 par les squences du promoteur de l'opron tryptophane a permis de faire un promoteur hybride (Ptac). Cette construction donne une augmentation de la transcription de 10 fois (De Boer et al., 1983).
Boite 35 Ptrp PlacUV5 Ptac Boite de Pribnow

GAGCTGTTGACAATTAATCATCGAACTAGTTAACTAGTACGCA CCAGGCTTTACACTTTATGCTTCCGGCTCGTATAATGTGTGGA GAGCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGA

La technique de choix pour augmenter la force dun promoteur est dutiliser un promoteur spcifique dune ARN polymrase quon surproduit dans la cellule. Le plus utilis est le promoteur de la protine 10 du phage T7 (Studier et Moffatt, 1986). La transcription utilisant lARN polymrase T7 est trs efficace. En effet, La polymrase utilise la plupart des nuclotides triphosphate de la cellule ce qui inhibe la transcription des gnes de l'hte. Elle est 5 fois plus rapide que les polymrases bactriennes. Cette polymrase reste la plupart du temps sur l'ADN. Il n'y a que peu

24/10/2011

59

d'arrt prmatur de la transcription. La transcription peut en fait, faire plusieurs fois le tour du plasmide donnant un ARN trs grand. - LARN polymrase T7 est trs spcifique, elle ne reconnat pas les promoteurs de la bactrie, si bien qu'elle ne transcrit que le gne d'intrt. - LARN polymrase T7 nest pas sensible aux inhibiteurs des ARN polymrases bactriennes tels que la rifampicine. Ainsi, l'ajout de rifampicine dans le milieu bloque toutes les polymrases sauf celle de T7, seul le plasmide est transcrit, tous les ribonuclotides sont utiliss pour la transcription du gne dintrt. LARN polymrase T7 n'est pas
AmpR

prsente dans la bactrie, il faut donc l'ajouter par exemple sur un plasmide. Ce deuxime plasmide doit avoir une autre origine de rplication compatible avec celle utilise dans le vecteur portant le gne d'intrt. Il doit contenir un gne de rsistance un autre antibiotique et enfin il doit contenir le gne de lARN polymrase T7 lui-mme inductible. On peut aussi produire lARN polymrase T7 partir du gnome de la bactrie. On utilise alors une souche qui a intgr le gne de lARN
Col E1 origine de rplication

site de clonage ATG RBS Promoteur P10

PL T7 RNA polymrase

Plac

cI-857

KanR

p15A (origine de rplication)

polymrase T7 sur le chromosome via un lambda lysogne (DE3).

24/10/2011

60

Linductibilit des promoteurs : -> On peut utiliser des rpresseurs : Le promoteur/oprateur du gne lac Z. Une des inductions les plus utilises est celle du gne lacZ. (Plac). La protine LacI est un rpresseur qui se positionne en aval du promoteur et inhibe la transcription. La transcription est drprime (ou induite) par un analogue du galactose, l'isopropyl -D thiogalactoside (IPTG) qui se fixe sur lacI, induit un changement de conformation de lacI qui ne se fixe plus sur loprateur. Pour augmenter lefficacit du rpresseur, on peut dune part surproduire le rpresseur en ajoutant un gne le codant dans le plasmide et dautre part augmenter le nombre doprateurs (lacO) en aval du promoteur du gne dintrt.

Squence de loprateur LacO reconnue par le rpresseur LacI .....GTGAGCGGATAAC.... .....CACTCGCCTATTG....

Pour que la rgulation soit bonne il faut utiliser un souche qui surproduit LacI (lacIq), Linduction peut se faire par lIPTG ou en utilisant un LacI thermosensible (LacIts), Dand ce dernier cas basse temprature (30C) lac I est actif et rprime lexpression du gne dintrt alors qu haute temprature (37 42C) lac I est inactif, et le gne dintrt est exprim (Hasan et Szybalski, 1995). Le systme de rgulation LacI/LacO peut tre utilis pour agir directement sur la transcription du gne dintrt ou indirectement en contrlant la transcription de lARN polymrase T7. -> On peut utiliser des inhibiteurs de lARN polymrase. LARN polymrase T7 est inhibe par le lysozyme. Si on introduit le gne codant pour le lysozyme sur un plasmide, la

24/10/2011

61

production de lysozyme inhibera le peu dARN polymrase T7 produite en labsence dinduction. Par contre, en prsence dinduction, linhibiteur sera en trop faible quantit comparativement lARN polymrase T7 qui est surproduite. On peut ajouter lARN polymrase au moment de la production. Dans certains cas la protine exprimer est toxique pour la bactrie. Or tous les promoteurs inductibles ont une activit basale, mme faible, si bien que la protine est produite en faible quantit en l'absence d'induction (on dit que le promoteur fuit). Si la protine est trs toxique, on peut utiliser une autre stratgie pour produire lARN polymrase T7 en utilisant un phage M13 la produisant. On fait pousser les bactries puis, avant de produire, on infecte les bactries par le virus. Le virus produit lARN polymrase T7 puis le gne d'intrt est transcrit. Le promoteur PL du bactriophage : Ce promoteur est fort et peut tre presque compltement teint par le rpresseur cI du phage. Ce rpresseur est prsent dans le gnome des bactries appeles "lysognes dfectives", ce qui revient dire que le gnome de ces bactries contient une partie du phage intgre. Cette partie du gnome de produit la protine CI rprimant la synthse de l'ARN en aval de PL. Une telle bactrie peut donc pousser haute densit sans produire l'ARN sous la dpendance du promoteur PL. Pour pouvoir induire une synthse de protine, on utilise un rpresseur mutant (cI 857), thermosensible. Dans ce cas, on cultive les bactries 32C, le rpresseur est produit, il n'y a pas de production de l'ARN sous la dpendance du promoteur PL. Lorsqu'elles sont arrives haute densit, on lve la temprature 42C, le rpresseur n'est plus produit, l'ARN est transcrit et donc la protine est traduite. L'induction peut aussi se faire chimiquement avec un rpresseur sauvage en induisant une protase qui dgrade le rpresseur CI. Pour produire la protase, on ajoute de l'acide nalidixique dans le milieu ce qui inhibe la DNA gyrase, cette inhibition amne des lsions sur l'ADN et il y a donc dclenchement la rponse SOS qui induit la RecA protase. Cette protase coupe le rpresseur CI et le gne est transcrit. Le promoteur ttracycline. Ce promoteur est inductible par l'anhydrottracycline. Pour obtenir une bonne rgulation de ce promoteur, on inclu souvent dans le vecteur un gne codant

24/10/2011

62

pour un rpresseur (TetR) (Skerra et al., 1994). C'est donc un promoteur qui dune part doit tre activ et dautre part peut tre rprim.

Le promoteur arabinose. Ara C est une protine dimrique qui, en labsence d'arabinose,
C CAP I1 I2 + arabinose C N N AraC

O2

s'accroche sur deux sites distants de 210 pb (I1 et O2) par leurs extrmits C-terminales. L'opron forme alors une boucle qui rprime la transcription du gne. En prsence d'arabinose, la liaison sur Ara C induit un
O2

NN C CAP I1 C I2

AraC transcription

changement conformationnel du dimre qui s'accroche alors sur un deuxime site (I2). Dans cette configuration, Ara C agit comme un activateur de transcription. De plus on trouve un site de liaison de la CAP (protine d'activation catabolique) si bien qu'en l'absence de glucose, la transcription est stimule. Source de carbone glucose glucose + arabinose glycrol + arabinose Les promoteurs hybrides Lorsquun rpresseur interfre directement avec la liaison de lARN polymrase, le paramtre important pour une rpression efficace du promoteur est la vitesse de formation du complexe ARN polymrase*promoteur (kON). Ainsi, d'une manire gnrale, les promoteurs Facteur d'induction 1 70 820

24/10/2011

63

qui lient lARN polymrase faible vitesse sont bien rprims mais ils restent faibles aprs l'induction. A l'inverse, les promoteurs qui lient lARN polymrase rapidement, sont mal rprims. Plusieurs promoteurs hybrides ont t fabriqus pour obtenir d'une part une transcription forte et d'autre part une bonne rgulation (Lutz et Bujard, 1997). Par exemple, le promoteur PL est un promoteur fort et on peut remplacer la rpression CI dpendante par une rgulation par l'oprateur de l'opron ttracycline. On obtient un promoteur PLtetO-1 qui est teint par le rpresseur tetR et qui peut tre activ jusqu' 5000 fois par l'anhydrottracycline. Ainsi on peut combiner diffrents lments provenant de diffrents promoteurs pour obtenir la rgualtion souhaite. - On peut rajouter d'autres lments pour teindre la transcription du gne, on peut en particulier adopter une stratgie antisens. Dans la stratgie antisens, on clone un gne proximit d'un promoteur fort de E. coli de telle sorte que c'est l'antisens qui est produit. Cet antisens inhibe la traduction du gne pendant la croissance de la cellule. L'ajout de rifampicine dans le milieu arrte la synthse de l'antisens lorsque le gne dintrt est en aval dun promoteur de lARN polymrase T7. Pour la mme raison, la transcription du gne de rsistance doit se faire dans l'autre sens de transcription du gne d'intrt. Ainsi lorsqu'il n'y a pas d'arrt de transcription ou lorsque l'arrt n'est pas total, le gne d'intrt n'est pas lui-mme transcrit en l'absence d'induction. On aura un effet d'antisens, le transcrit initi au niveau du gne de rsistance s'hybridera avec les quelques transcrits du gne d'intrt prsent en l'absence d'induction.

c. Les squences responsables de la traduction Chez les procaryotes, l'initiation s'effectue par reconnaissance d'une squence particulire (RBS, ribosome binding site). Cette squence est compose dune squence riche en purine (Shine-Dalgarno, SD, AGGAGG) et du codon d'initiation qui doit tre proche, idalement, l'extrmit 3' de la boite de Shine-Dalgarno doit tre 6 bases de l'ATG. Il y a plusieurs possibilit de boite de Shine-Dalgarno : UAAGGAGG donne une meilleure traduction que AAGGA (Ringquist et coll. 1992)

24/10/2011

64

Donc, si on veut exprimer un clone provenant d'une cellule eucaryote dans une bactrie, il faudra incorporer cette squence en amont de l'ATG d'initiation. Gnralement, on mutagenise la squence du gne d'intrt au niveau de l'ATG en y incorporant un site de restriction tel que NdeI (CATATG). Ce site est prsent sur le vecteur 8 nuclotides en aval d'un site de liaison au ribosome.

d. Les squences responsables de larrt de la transcription On peut dans certains cas ajouter en 3' du gne des squences responsables de l'arrt de la transcription. Au niveau d'un signal de terminaison, la polymrase libre la matrice et l'ARN monocatnaire nosynthtis. Chez E. coli, il y a deux sortes de terminaison, une terminaison intrinsque et une terminaison
extrmit 3 de lARN arrt de la transcription

dpendante dune protine, la protine . Dans la terminaison intrinsque, la polymrase s'arrte quand elle synthtise une srie de rsidus U dans la mesure o elle a d'abord synthtise une squence autocomplmentaire capable de se replier. C'est le repliement, l'hlice en pingle cheveux, qui se forme rapidement dans cette rgion, qui est crucial pour l'arrt de la transcription. La squence de la rgion autocomplmentaire peut varier. Lors de la terminaison dpendante, la protine reconnat une squence sur lARN nosynthtis et catalyse larrt de la transcription. Dans certains cas, on ajoute une squence de terminaison indpendante en 3 du gne, il y a formation dune boucle qui termine la transcription. Cette arrt de la transcription a peu davantage pour la production de protines recombinantes si ce nest quelle stabilise lARN en inhibant lactivit des 3 5 exonuclases qui ne dgradent que lARN simple brin. Toutefois ces squences ne sont indispensables et sont inefficaces pour larrt de transcription dans le cas dune production utilisant lARN polymrase T7.
UUUUUU

24/10/2011

65

Il peut y avoir des signaux de terminaison dans le gne traduire. Dans ce cas on peut utiliser une bactrie qui produit la protine N du phage qui a une fonction d'antiterminaison. On utilise des bactries lysognes dfectives qui produisent la protine N ce qui permet d'viter une terminaison prcoce du message en interagissant avec lARN polymrase seulement au site Nut. On utilisera alors cette squence Nut (terminateur) en aval du gne clon pour terminer la transcription au bon endroit. Les signaux de terminaison de la transcription sont parfois utiliss en aval du promoteurs pour viter une transcription venant du gne recombinant. Dans ce cas, la transcription en sens inverse pourrait inhiber linitiation de la transcription du gne dintrt. De mme, on peut utiliser un arrt de transcription en amont du promoteur pour diminuer le bruit de fond, due une transcription initie par un promoteur plus en amont.

e. Les squences responsables de larrt de la traduction La prsence dun codon stop est indispensable pour assurer la terminaison de la traduction. Il en existe trois UAA, UAG et UGA. Le plus souvent on met plusieurs codons stop la suite la fin de la squence codante pour viter les drapages et donc les protines plus longues. Il faut viter de produire les protines dans des bactries comportant des supprsseurs qui comportent des tRNA reconnaissant les codons stop. Toutefois cette stratgie est quelquefois utilise pour obtenir des protines de fusion dune manire conditionelle. Lorsquon veut la protine de fusion on transforme des bactries ayant le suppresseur, par contre lorsquon veut la protine seule, on transforme des bactries dpourvues de rpresseur. La base suivante le codon stop a une importance sur lefficacit de la terminaison qui peut descendre 7% pour le cas de UGAC. Pour viter ce problme, on utilise UAAU qui est le plus efficace chez E. coli.

f. Les squences permettant linversion Un des moyens de controler lexpression du gne est de le cloner lenvers puis le retourner au dernier moment lorsque la culture arrive la phase stationaire. Deux systmes ont t utiliss, le systme Int/att et le systme Flp/FRT. Les recombinases sont prsentes dans la bactries et leur

24/10/2011

66

expression est rgule. Suite linduction, elles tournent le gne dintrt qui est traduit (Sektas et al., 2001).

II) Autres bactries utilises en production de protines D'autres protines Gram ngatives ont t utilises pour exprimer des protines. les techniques et concepts ne sont pas diffrents de ceux dvelopps pour E. Coli. Caulobacter crescentus est une bactrie gram ngative non toxique qui est trs rpendue dans lenvironnement principalement dans les biofilms. C. crescentus est couverte sa surface par une proteine qui sarrange selon un rseau en deux dimensions rgulirement structur. Cette protine sert vraissemblablement se protger contre les virus, les bactries pathognes ou les enzymes lytiques susceptibles dattaquer la protine. Le systme de secrtion de cette protine (RsaA) a t utilise pour produire des protines recombinantes en faisant une fusion entre la protine RsaA et la protine recherche. Les protines secrtes se retrouvene t la surface de la bactrie ou sur des liposomes. Le vecteur doit comporter deux origines de rplication, une pour E. coli et une pour C. crescentus, le signal de scrtion en C terminal de la protine produite et un promoteur pour lexpression. Les Bacillus Parmi les protines Gram positives, les Bacillus ont t et sont toujours trs utiliss pour produire des protines pour plusieurs raisons : Ils sont depuis longtemps utiliss par l'industrie pour produire des protines. La subtilisine, protase incorpore aux lessives, est produite partir de Bacillus. Il existe donc de nombreuses souches modifies pour les contingences industrielles. Toutefois ces souches ne sont gnralement pas disponibles.

Exemple de vecteur utilis pour exprimer une protine chez Caulobacter crescentus.

24/10/2011

67

On les connat bien au niveau gntique et leur manipulation par les techniques de biologie molculaire est bien dveloppe. En effet, si priori on peut prendre n'importe qu'elle bactrie, il faut quand mme que l'on ai isol une origine de rplication efficace, un promoteur, etc. De plus on doit avoir mis au point un systme de transformation efficace. Des promoteurs forts sont connus et des peptides signaux responsables de la scrtion sont disponibles. Par exemple le peptide signal d'une subtilisine de Bacillus amyloliquefasciens de 30 acides amins a t utilis avec succs.

Le Bacillus ne sont pas pathognes et ne produisent pas d'endotoxine. Ils scrtent un grand nombre de protines, leur systme de scrtion est donc bien dvelopp. Ce sont des bactries Gram-positives, si bien que les protines n'ont que la membrane cytoplasmique traverser.

Un cas intressant est l'expression avec Bacillus brevis. La souche 47 produit de 12 25 grammes de deux protines scrtes appeles MWP et OWP par litre de milieu. Durant la phase logarithmique, les deux protines sont insres dans la membrane mais elles continuent d'tre produites pendant la phase stationnaire et elles sont alors scrtes dans le milieu. Les deux protines appartiennent au mme opron (cpw), elles sont donc sous la dpendance d'un seul promoteur, et prsentent un peptide signal. La production est norme, on a donc faire un promoteur trs fort qu'on peut utiliser pour la surproduction de la protine recombinante (cette notion d'utiliser des promoteurs extrmement forts est la mme que celle qui a donn lieu l'utilisation de certains promoteurs en systme eucaryote comme par exemple le promoteur de la polydrine du Baculovirus). Un plasmide contenant ce promoteur, un site de liaison au ribosome et le peptide signal a donc t construit. La production d'EGF humain (epidermal growth factor) ou d'-amylase a donn des productions de plusieurs centaines de mg de protine par litre de milieu. Bacillus megaterium. Un des lments rgulateurs de lutilisation du carbone est lopron xylose ce qui permet une inductibilit de 350 fois. Lexpression des protines est relativemnt stable du fait de labsence de protases alkaline qui sont par exemple prsentes chez B. subtilis.

Ralstonia eutropha

24/10/2011

68

Cette bactrie nutilise pas la mme voie de mtblisation des hexoses que E. coli ou que les Bacillus et synthtisent moins dacides organiques losque loxygne devient limitant ce qui affecte la fermentation. De ce fait Ralstonia peut pousser haute densit, jusqu 230 g par litre et il semble que les protines qui font des corps dinclusion chez E. coli reste solubles. Un promoteur fort, inductible par une limitation en phosphate a t isol en comparant les protomes de cellules cultives en milieu pauvre en phosphate, du protome de cellules cultives en milieu riche en phosphate (Srinivasan et al., 2002). Le systme qui a t dvelopp utilise une souche qui produit la T7 RNA polymrase sous le control du promoteur fort et inductible phaP. Le gne dintrt est clon en aval du promoteur T7 puis introduit dans le gnome de la bactrie (Barnard et al., 2004)

La production dune protine eucaryote dans un systme bactrien n'est souvent envisageable que Pour des protines dont l'activit n'est pas requise (pour faire un anticorps par exemple), Pour les protines dont les modifications post-traductionnelle ne sont pas importantes. En effet, les procaryotes sont incapables de raliser la plupart des modifications catalyses par des enzymes. Pour les protines dont le repliement n'est pas d des protines comme c'est le cas pour la plupart des protines synthtises dans le rticulum endoplasmique. Dans les autres cas on utilisera un systme eucaryote

24/10/2011

69

24/10/2011

70

Expression en systme eucaryote : les champignons


les levures Plusieurs levures sont utilises pour exprimer les protines recombinantes. Les plus souvent utilises sont Saccharomyces cerivisiae et Pichia pastoris. a) Saccharomyces cerevisiae (levure de boulangerie) Cette levure prsente deux avantages : d'une part, on dispose de vecteurs qui peuvent se maintenir dans les cellules comme des plasmides bactriens, et, d'autre part, on peut facilement intgrer un gne par recombinaison dans le chromosome. Origine de rplication ou ARS L'origine de rplication de l'pisome 2-m est le plus souvent utilis, il permet d'avoir entre 10 et 40 copies du plasmide par cellule. Ce nombre est trs variable et on peut perdre le plasmide au cours des divisions cellulaires. Aussi, pour obtenir des copies plus nombreuses, on utilise un marqueur de slection faible et on augmente la slection. Toutefois il n'est pas aussi vident que l'augmentation du nombre de copies augmente la production de protine. En effet on a souvent remarqu qu'un grand nombre de copies affecte la croissance des levures et donc la production. Les levures utilisables avec cette origine de rplication doivent tre dpourvues de l'pisome 2-m. Le problme est que ces vecteurs sont peu stables et, lorsqu'ils contiennent uniquement une origine de rplication, ils sont vite perdus en l'absence de slection, ce qui est diffrent des plasmides d'E. coli. En effet, il n'y a pas comme dans la bactrie de dcouplage entre la rplication du plasmide et du chromosome. Pour palier cette perte on peut ajouter une squence centromrique (CEN) qui permet la sgrgation des plasmides dans les cellules filles. L'inconvnient est que dans ce cas, si on gagne en stabilit on perd en nombre de copies, il y a en effet 1 ou 2 copies du plasmide par cellule.

24/10/2011

71

Un autre moyen pour augmenter la stabilit consiste intgrer le plasmide dans le gnome, on profite alors de la squence centromrique du chromosome. On transforme alors un ADN linaire contenant le gne d'intrt et un marqueur de slection flanqu des squences d'un gne non essentiel. Il y a intgration dans ce gne non essentiel. Les marqueurs de slection De nombreuses souches de laboratoire sont auxotrophes pour des acides amins ou des nuclotides, c'est dire qu'elles ne peuvent pas pousser en l'absence du compos dans le milieu. On peut donc utiliser la complmentation des enzymes entrant dans les voies de biosynthse. Les plus utiliss sont les gnes URA3 ou LEU2 responsables de la synthse de l'uracile ou de la leucine. Mais il existe d'autres systmes de complmentation. L'inconvnient de ce systme est qu'il faut utiliser des milieux biochimiquement dfinis or, dans ces milieux, les levures poussent moins bien et, de ce fait, la production de protine est moins bonne. De plus, les milieux dfinis sont plus chers fabriquer que les milieux non dfinis comportant par exemple de l'extrait de levure, de la bactone peptone comme les milieux bactriens. Aussi, on prfre souvent utiliser des marqueurs de slection qui donnent la rsistance des drogues, la tunicamycine (TUN) ou l'hygromycine (Hgm), mais il y a toujours un risque d'apparition de rsistances spontanes dans la souche utilise et donc de perte du plasmide. Le promoteur On peut utiliser des promoteurs "constitutifs". Les gnes codant pour l'alcool dshydrognase (ADH1) ou pour 3-phosphoglycerate kinase (PGK) sont exprims trs haut niveau, en prsence de glucose dans le milieu, leurs ARNm reprsentent jusqu 1% des ARN totaux. Ils ne sont pas tout fait constitutifs, en effet l'ADH1 est transcrit 2 10 fois moins en absence de glucose et la PGK 20 30 fois moins. Mais ces diffrences sont faibles par rapport celles observes pour d'autres promoteurs tels que GAL1 ou PHO5. La rgulation des gnes utiliss pour la mtabolisation du galactose est trs utilise pour rguler la production de protines recombinantes. Ce promoteur est en effet trs fort : en

24/10/2011

72

prsence de galactose, la production de la kinase GAL1 est augmente de 1000 fois et reprsente 0.8% des protines totales de la levure. Un autre gne inductible trs utilis est celui codant pour la phosphatase acide (PHO5). Cette phosphatase acide a pour rle de dphosphoryler les protines du milieu extrieur et ainsi de procurer une source de phosphate la cellule. Lorsque le phosphate inorganique dans le milieu est faible, le gne est transcrit, la phosphatase acide est scrte, elle dphosphoryle des protines, le phosphate libr est incorpor dans la levure. A l'inverse, quand il y a du phosphate inorganique dans le milieu, la phosphatase devient inutile, le gne la codant n'est pas transcrit. On peut utiliser ce systme en employant un milieu riche en phosphate inorganique pour viter la transcription et un milieu dpourvu pour l'augmenter. Toute une srie de rpresseurs et d'activateurs ont t mis en vidence comme pour le systme de la galactosidase. Parmi ceux-ci, PHO2 est ncessaire pour l'activation et PHO80 a un rle dans la rpression. On utilise une souche qui a une mutation de perte de fonction du rpresseur PHO80, il n'y a donc pas de rpression par PHO80. De plus on utilise une mutation thermosensible de l'activateur PHO2 de faon contrler lactivation par des changements de temprature. Les deux exemples prcdents viennent des tudes de gntique de la levure, mais on peut emprunter des systmes chez les autres eucaryotes. Les rcepteurs des strodes de mammifres gardent leurs activits en tant que rgulateurs conditionnels de la transcription chez la levure. Dans ce cas, en amont d'un promoteur de levure on clone plusieurs lments de rponse aux glucocorticodes (GRE, Glucocorticodes Response Elements) qui sont des lments de 26 pb. Le rcepteur est lui clon dans un deuxime plasmide. L'addition de glucocorticodes favorise la liaison du rcepteur sur les GRE et le gne est transcrit. Scrtion des protines Les peptides signaux htrologues fonctionnent pour la plupart dans la levure, il n'est donc pas ncessaire d'en changer lorsqu'on veut exprimer une protine habituellement scrte. Dans le cas o on dsirerait faire secrter une protine cytoplasmique, il suffirait de faire une fusion avec un peptide signal d'une protine de la levure tel que celui de l'invertase. Toutefois, il est difficile de produire des protines scrtes dans Saccharomyces cerevisiae.

24/10/2011

73

- En tudiant la glycosylation des protines, il est apparu qu'il existe une tape limitante dans cette maturation quelque part entre le rticulum endoplasmique et le golgi. Une premire technique consiste changer d'espce et utiliser Pichia pastoris. Cette dernire permet l'expression de protines membranaires qui sont difficiles obtenir avec S. cerevisiae. - La scrtion ne s'effectue que pendant la phase de croissance exponentielle, pour une protine scrte, il est donc prfrable d'utiliser un promoteur constitutif. - La plupart des modifications post-traductionnelle sont effectues par S. cerevisiae. Toutefois la N-glycosylation est trs diffrente de celle observe pour les autres eucaryotes. Les sites sont les mmes (N-X-S/T), mais les sucres ajouts sont diffrents et prsents en trs grand nombre. On compte par exemple de 50 150 rsidus mannose dans chaque chane. Transformation On dispose de plusieurs mthodes pour faire rentrer un ADN dans la levure. On peut utiliser soit une transformation chimique avec le l'actate de lithium, soit une transformation avec du CaCl2 sur des sphroblastes (les sphroblastes sont obtenus par une lyse de la paroi des levures par une lyticase), soit par lectroporation. Avantage de la levure. On a quelques millnaires dexprience et on sait quil n'y a pas de toxicit pour l'homme si bien qu'on peut produire dans la levure des protines destines tre utilises comme vaccin. Par exemple, le vaccin contre l'hpatite B a t fait dans la levure. b) Schizosaccharomyces pombe L'expression dans cette levure est similaire l'expression dans S. cerevisiae. Le vecteur peut se rpliquer dune manire autonome et peut tre slectionn par auxotrophie en utilisant Leu2p. Parmi les promoteurs utiliss on peut citer nmt1 qui est inductible par la thiamine, en prsence de thiamine nmt1 est rprim et linduction se fait en retirant las thiamine du milieu. La TATA box de ce promoteur a t modifie pour avoir des promoteurs plus ou moins fort et donc avoir des quantits de protines produites plus ou moins importantes.

24/10/2011

74

c) Pichia pastoris P. pastoris est une levure qui a t dveloppe dans les annes 70 pour utiliser le mthanol qui tait alors un sous produit de l'industrie ptrolire. Elle est en effet capable de se dvelopper sur du mthanol comme seule source de carbone. Ce mthanol tait converti par P. pastoris en protines et donc en aliment pour btail. Avec la crise ptrolire, la difficult de concurrencer les aliments tels que le soja a amen l'abandon de P. pastoris. De plus d'autres utilisations du mthanol ont t trouves si bien que l'utilisation de P. pastoris a t arrte au dbut des annes 80. La premire tape de la mtabolisation du mthanol est une oxydation par le produit du gne AOX1 (le produit d'un deuxime gne, AOX2 est aussi impliqu, mais AOX1 est responsable de la majeure part de loxydation). L'expression de AOX1 est rgule au niveau transcriptionnel, en prsence de mthanol dans le milieu de culture, l'ARN codant pour l'oxydase reprsente 5% des ARN polyA+. Le vecteur typique contient un gne de rsistance un antibiotique et une origine de rplication pour la propagation dans E. coli. Il contient, en outre, le promoteur de AOX1 et la partie terminale (3') de AOX1. Ces deux parties sont interrompues par un site de clonage multiple suivi au besoin d'une squence codant pour un peptide signal pour insrer le gne d'intrt. Comme moyen de slection, on utilise soit un gne codant pour une histidinol dshydrognase permettant la synthse d'histidine (HIS4) soit un gne bactrien procurant la rsistance la kanamycine et procurant chez la levure la rsistance au G418, soit un gne de rsistance la zocine. Ce plasmide est introduit dans P. Pastoris soit par lectroporation soit par transformation de sphroblastes comme pour S. Cerivisae.
Vecteur dexpression dans Pichia pastoris

24/10/2011

75

Il y a plusieurs possibilits d'intgration dans le chromosome: Le remplacement de gne ou insertion omga. Dans ce cas il y a deux crossing over entre les promoteurs de AOX1 et la partie 3' de AOX1, les recombinants ont le phnotype Muts. (Muts signifie que la levure n'est plus capable d'oxyder le mthanol et donc plus capable d'utiliser cet alcool comme seule source de carbone). Dans ce cas, le plasmide est coup en deux endroits avant la transformation. L'insertion de gne s'effectue par un seul crossing over entre le locus AOX1 du chromosome et une des squences d'AOX1 prsente sur le vecteur (rgion 5' ou rgion 3'). On a dans ce cas insertion d'un plasmide en amont ou en aval de AOX1 qui peut demeurer Mut+. Plusieurs copies peuvent ainsi s'intgrer en tandem. De telles insertions multiples peuvent tre slectionnes en utilisant la rsistance au G418 ou la zomycine. Chaque gne entrane une faible rsistance, en augmentant la dose dantibiotique, on slectionne les recombinants qui ont le plus de copies. fonctionnel. Le phnotype de tels transformant est
5 gne AOX1 3 gnome de pichia ori gne de slection 3AOX1 gne dintrt
5 gne dintrt 5AOX1 gne AOX1 3 3AOX1 plasmide linaris gnome de Pichia

PAOX1

gne dintrt

gne de slection

3AOX1

plasmide intgr dans le gnome de pichia

5 AOX1 (promoteur)

24/10/2011

76

L'insertion de gne peut aussi se faire au locus his4. Dans ce cas, le phnotype devient His+ et Mut+ comme prcdemment. Ici aussi on peut avoir des insertions multiples. Dans ce cas, on utilise un mutant his portant une mutation ponctuelle pour pouvoir avoir un sauvetage dans une des deux copies gnres par la recombinaison. Avantages de la production de protines dans P. pastoris - La production de protine est de 10 100 fois plus importante qu'avec S. cerevisiae - Elle permet l'expression de protines membranaires qui sont difficiles obtenir avec S. cerivisiae - Compar S. Cerevisiae, les protines scrtes sont moins glycosyles, il y a en effet moins de rsidus mannose ajouts dans chaque N glycosylation (8 14 par chane alors que S. cerevisiae en comporte de 50 150). - On peut utiliser un marquage des protines au
13 13 13

C, utile pour les tudes en RMN. On

utilise du C mthanol qui est mtabolis et le C est incorpor dans les protines.

Les champignons filamenteux On utilise principalement deux espces, Trichoderma reesei et Aspergillus niger. Les productions sont trs importantes, la cellulase est produite 30 g/l, l'interleukine 300 mg/l, la chymosine bovine 1 g/l et la lactoferrine humaine 3 g/l. Cette production au stade industriel est due des mutagenses alatoires visant obtenir des superproducteurs. Gnralement on effectue une fusion avec une protine du champignon pour obtenir la scrtion de la protine d'intrt. Il y a toutefois plusieurs problmes : - Les souches surproductrices sont industrielles et donc ne sont pas disponibles. - Comme pour Saccharomyces cerevisiae, il y a une hyperglycosylation des protines. - Les mthodes de transformations sont difficiles.

Dictyostelium discoideum

24/10/2011

77

Eucaryote monocellulaire qui forme des agrgats et, en condition dfavorable, il y a formation d'un sporocarpe. Cet eucaryote a l'avantage de possder des plasmides et donc un vecteur potentiel de transformation. Plasmide utilisable chez Dictyostelium discoideum
terminateur

MCS Pact15

(Manstein et al., 1995) Pact15: promoteur constitutif Dpd2 : origine de rplication AmpR et ori : rsistance lampicilline et origine de rplication pour les constructions dans E. coli.

Dpd2

gne de slection (G418)

AmpR

ori

Ce systme est peu utilis mais il a t montr qu'une protine recombinante pouvait reprsenter 1% des protines totales de la cellule.

24/10/2011

78

Les cellules vgtales


Cette technologie vient de la transformation des plantes, la seule diffrence est quau lieu de rgnrer une plante entire, on cultive les cellules. Pour transformer une cellule vgtale, le plus facile est dutiliser Agrobacterium tumefasciens. Cette bactrie infecte certaines plantes, et les cellules infectes ont acquis la capacit de crotre de faon indpendante et non rgules (elles sont transformes). Ces cellules sont capables de se dvelopper en culture mme sans hormone et mme en l'absence de la bactrie. Les plasmides Ti sont grands 200 kb, une partie (ADN-T) porte les gnes responsables de la synthse d'acide amins peu courants appel les opines qui ne peuvent pas tre utiliss par la plante. Elles sont utilises uniquement par la bactrie qui a sur le plasmide Ti des gnes dont les produits sont capables de dgrader les opines comme source nergtique. Cette utilisation des opines est vraisemblablement un moyen de se maintenir. Une autre partie de l'ADN-T code pour des hormones qui induisent la prolifration cellulaire. Enfin le plasmide Ti porte aussi des gnes de virulence. Les cellules vgtales endommages produisent des substances chimiques qui dclenchent lexpression des gnes de virulence (vir) situ sur le plasmide Ti. L'lment T est excis de l'ADN plasmidique au niveau de squence rpte de 25 bp sous la forme simple brin (un seul des deux brins est excis comme dans le cas de la conjugaison bactrienne). Cet ADN-T simple brin est transfr la cellule vgtale, rentre dans le noyau et s'intgre dans l'ADN. Ce systme a t utilis pour introduire des gnes via l'ADN-T. Comme le plasmide Ti est trop grand (200 kb) pour pouvoir tre utilis in vitro, L'ADN-T a t introduit dans un petit plasmide utilis couramment en biologie molculaire. Il a t raccourci, les gnes codant pour les hormones ont t limins pour viter la croissance incontrle des cellules infectes. Dans cet ADN-T on introduit le gne exprimer, un gne de slection dans l'agrobactrium et un gne de slection dans la plante. Le plasmide est ensuite introduit dans agrobactrium par conjugaison. Il y a alors des vnements de recombinaison et ceux l seul sont slectionns car le plasmide venant de E. coli n'est pas capable de se rpliquer dans Agrobactrium. La slection des recombinant (par rapport au Ti sauvage s'effectue par un gne de rsistance). Le plasmide Ti recombinant est alors transfr dans les cellules vgtale en les infectant avec l'agrobactrium recombinant.

24/10/2011

79

Un deuxime systme a t mis au point. Le plasmide propag dans E. Coli ne contient que les deux squences rptes bordant l'ADN-T (LB et RB). Entre ces deux fragments, on a un site de clonage et un gne de slection pour slectionner les recombinants dans la plante (NPTII qui confre la rsistance la kanamycine). On dispose par ailleurs d'un plasmide Ti modifi qui ne contient plus l'ADN-T mais toujours les genes vir. Le plasmide de E.coli est transfr dans agrobactrium par conjugaison mais ici il n'y a pas de recombinaison. La bactrie contenant les deux plasmides est utilise pour infecter des cellules vgtales. Il y a intgration de l'insert entre les deux extrmits rpts du plasmide construit dans E. coli. Les cellules les plus utilises sont les cellules de tabac et en particulier la souche BY2 (Bright Yellow 2) qui se multiplie rapidement. Avantage de lexpression dans les cellules vgtales. Ces cellules se multiplient facilement.

24/10/2011

80

Les cellules d'insectes


a) Baculovirus. Les Baculovirus sont responsables de polydroses nuclaires des insectes en particulier des lpidoptres. Ce sont de gros virus dont le gnome est constitu d'un ADN d'environ 100 kb. A la fin de l'infection, ces virus forment des corps d'inclusion (appels polydres) dans la cellule. Ces polydres sont principalement constitus d'une protine d'environ 30 kDa, la polydrine, qui protge les virions. Dans la nature, ces polydres sont ingrs par les insectes, dgrads par les protases du tube digestif, les virions sont librs et vont se fixer sur les microvillosits des cellules pithliales de l'intestin moyen et ils traversent les cellules intestinales. Ils se multiplient dans les hmocytes et dans le tissu adipeux. Les virions sont transmis de cellules cellules par exocytose. En fin de cycle, les noyaux renferment de trs nombreux polydres, ces polydres constituent donc le mode de transmission d'insecte insecte.

Depuis quelques annes on sait utiliser le Baculovirus pour produire des protines in vitro. En fin de cycle le virus produit une trs grande quantit de polydrine. L'astuce a donc t de remplacer la partie codante du gne codant pour la polydrine par celui qui nous intresse. On transfecte des cellules. Le virus, au lieu de produire une trs grande quantit de
AmpR promoteur polydrine promoteur P10 ori
Exemple de vecteur de transfert deux promoteurs : p10 et polydrine

polydrine, produit la protine voulue. A cot de ce promoteur, il existe un autre promoteur tardif qui est trs fort, le promoteur de P10. On peut cloner notre gne derrire ce

promoteur. Dans ce cas, la lyse des cellules est retarde ce qui a pour effet d'augmenter la production. L'utilisation des deux promoteurs, P10 et polydrine permet en outre de coproduire deux protines, une protine exprime partir du promoteur de la polydrine et une autre

24/10/2011

81

exprime partir de P10. En utilisant un vecteur comportant deux promoteurs P10 tte-bche, on peut mme produire trois protines simultanment. Comment remplacer le gne de la polydrine par le gne d'intrt ? Comme il n'est pas ais de manipuler de grands fragments d'ADN (100 kb) in vitro on peut utiliser deux mthodes, utilisant soit la recombinaison dans la cellule dinsecte, soit la transposition dans la bactrie. La recombinaison consiste utiliser la "plasticit" du gnome des Baculovirus qui est trs importante. En effet il arrive qu'ils changent une partie de leur information gntique. Les recombinants peuvent donc acqurir des proprits nouvelles, en associant dans le mme virus des proprits des deux "parents". On profite donc de la facilit d'obtention de recombinant en manipulant en bactrie une petite partie du gnome du Baculovirus comportant le promoteur de la polydrine, une rgion d'ADN en amont du promoteur et une rgion en aval pour avoir des rgions ou peuvent s'effectuer les recombinaisons. Ce plasmide bactrien est appel vecteur de transfert. On co-transfecte ensuite des cellules avec le virus sauvage et le plasmide bactrien comportant une petite partie de l'ADN viral et on cherche les vnements de recombinaison, les plages de lyse qui ne produisent pas de polydrine. Il existe une solution pour viter de passer par le vecteur de transfert. Le gne d'intrt est amplifi avec des amorces spcifiques, mais en amont de ces amorces, on ajoute 50 nuclotides correspondant aux squences amont et aval de la polyddrine sur la squence du virus. Ces nuclotides vont permettre la recombinaison comme dans le cas des squences prsentes sur le vecteur de transfert (Gritsun et al., 1997). La recombinaison est un phnomne relativement rare et l'isolement des recombinant tait jusqu' rcemment relativement fastidieux. Une technique amliorant ce processus a t
DNA viral (100 kb) polydrine p10

dveloppe. Elle consiste couper l'ADN viral dans la rgion qui doit tre remplace par le gne dintrt. Pour ce faire, on coupe le virus par une enzyme de restriction qui ne

Bsu36I

Bsu36I

Bsu36I

ORF 603

LacZ

ORF1629

promoteur polydrine

24/10/2011

82

coupe qu' cet endroit (Bsu36I). On cotransfecte l'ADN viral et le vecteur de transfert et on attend la recombinaison sur les ORF 603 et 1629. Seuls les recombinants vont se dvelopper, il restera toutefois quelques virus sauvages si la coupure n'a pas t totale. Enfin on peut fabriquer les recombinants directement dans la bactrie si on arrive cloner directement le gne d'intrt derrire le promoteur de la polydrine en bactrie. Il faudra alors simplement extraire l'ADN et transfecter des cellules et la recombinaison dans les cellules d'insecte sera alors vite. Cette construction est difficile effectuer in vitro, en effet les sites de restriction uniques sur 100 kb sont rares et la manipulation de grand fragments d'ADN sans les casser est difficile. Mais on peut effectuer la construction bactrie dans soit la par
mini-att Tn7 ori LacZa LacZ Tn7R pSC101 ts ori

ampiciline R

donneur
5000 bps
gentamicine R gne tnsA-E Tn7L

Ppol

Helper
tetracycline R

recombinaison soit par transposition. C'est cette dernire mthode qui est la plus utilise. L'ADN viral a t clon dans son ensemble dans E. coli.
kanamycine R mini-F-ori

bacmide
100 kb

Pour ce faire, l'origine de rplication du facteur F et un gne de rsistance un antibiotique ont t ajouts au gnome de baculovirus. On a ainsi obtenu un gnome du baculovirus capable de se rpliquer faible nombre de copies chez E. coli. Cette construction a pris le nom de bacmide (Luckow et al., 1993). Dans le bacmide, on a rajout un site cible du transposon bactrien Tn7 (mini-att Tn7) en phase avec le gne codant pour le peptide de la -galactosidase (LacZY). Ainsi un vnement de transposition peut se reprer par larrt de synthse de la -galactosidase dans une souche dficiente en peptide . Le transposon vient du plasmide donneur. Il contient, entre les deux

24/10/2011

83

LTR de Tn7, le promoteur de la polydrine clon en amont du gne dintrt et un gne de slection. On fabrique donc in vitro le plasmide donneur, avec le gne dintrt en aval de son promoteur. Ce plasmide est alors utilis pour transformer des bactries contenant le bacmide et un plasmide helper. Ce dernier fourni les diffrents composants ncessaires la transposition comme la transposase. Les colonies o un vnement de transposition a eu lieu sont blanches et sensibles lantibiotique prsent dans le plasmide donneur en dehors du transposon. Il faut alors liminer le plasmide donneur et, pour ce faire, on a plusieurs moyens : utiliser le lacZ en dehors du transposon, les bactries exprimant la -galactosidase ne seront pas prises, ou utiliser une origine de rplication thermosensible. Aprs la transposition, les bactries seront incubes 42C (Leush et al., 1995). Pour isoler le virus on a deux mthodes. La premire ("plaque assay") consiste taler des cellules sur une boite puis les infecter avec la population de virus. On coule ensuite de l'agarose pour limiter le passage des virus aux cellules voisines. On utilise de l'agarose bas point de fusion pour viter de cuire les cellules. On obtient ainsi des plaques de lyse comme losqu'on isole des clones de lambda recombinants dans une banque. La deuxime mthode est appele "end point dilution". On utilise une plaque de microtitration de 96 puits qui sont inoculs par des cellules. Dans chacun des puits d'une range, on infecte les cellules par 1 microlitre de la solution virale, dans la seconde par 100 nl soit 10 fois moins, dans la troisime par 10 nl, etc... Cette quantit est obtenue par dilution successive de la solution primordiale. A partir d'une certaine dilution, les virus sont isols. Par exemple si la solution virale au dbut est de 1 virus par nl, la dilution de 1 nl et de 0.1 nl par puits on aura des clones isols. Cette mthode permet donc d'une part d'isoler des virus d'une solution et d'autre part de la titrer. Dans les deux mthodes, il faut ensuite reconnatre les virus "sauvages" des virus recombinants. Les premiers essais utilisaient un virus sauvage produisant la polyhdrine. Ces virus taient reconnaissables au polydre prsent dans le noyau des cellules infectes. Maintenant on utilise plutt comme virus "sauvage" un virus exprimant la -galactosidase, reprable par une raction enzymatique avec le X-gal donnant une couleur bleue, les recombinants ne donnant pas de raction colore avec le X-gal.

24/10/2011

84

La production de protine est le plus souvent effectue laide de culture de cellule dinsectes. Quelques cellules d'insectes ont t immortalises d'une manire assez empirique, gnralement en dissociant des cellules non diffrenties et en les mettant en culture (les larves d'insectes htromtaboles possdent des amas de cellules non diffrenties qui seront utilises pour gnrer les tissus spcifiques de l'adulte). Des cellules dissocies ont t mises en culture, certaines d'entre elles se sont maintenues. On dispose ainsi de trois souches de cellules, des Sf9 et Sf21 provenant d'ovaires de Spodoptera frugiperda et Tn5 provenant de Trichoplusia ni. Les cellules sont infectes avec un virus recombinant, le virus se dveloppe, produit la protine et lyse les cellules. Une autre possibilit est dinfecter des larves de lpidoptre avec le virus recombinant. Les chrysalide du vers soie (Bombyx mori) sont actuellement utilis en Asie, parce que cest un levage mis au point depuis longtemps pour fabriquer de la soie naturelle, parce que cest un insecte assez gros et parce que linsecte est non toxique en effet les chrysalides sont consommes en chine. La technique consiste injecter une solution virale dans les chrysalides et les rcolter 4-5 jours aprs.

Avantage de l'expression en baculovirus: Ce systme de production en infectant soit des insectes soit des cellules d'insecte prsente plusieurs avantages: Fonctionnalit des protines recombinantes : Les insectes sont des eucaryotes et ils sont capables d'effectuer tous les repliements des protines avec ralisation des bons ponts disulfures et les bonnes oligomrisations, ce qui n'est pas le cas des bactries ou des levures. Cependant, lorsque la protine fonctionne sous la forme dhtrodimre, elle ne sera pas fonctionnelle moins que la deuxime protine ne soit co-exprime. Modifications post-traductionnelles : La plupart des modifications post-traductionelles sont effectues en baculovirus et ce aux sites o on les trouve dans les protines natives. Toutefois,

24/10/2011

85

ce systme produit une trs grande quantit de protine et on observe parfois une saturation du systme. Par exemple on observe parfois un plus faible niveau de glycosylation, de phosphorylation ou de glypiation (ajout dun ancrage GPI) de la protine. Dans certains cas, la modification post-traductionnelle est espce ou tissus spcifique, cette modification posttraductionnelle est due des enzymes particuliers et on ne les observe pas chez les cellules d'insectes moins que ces enzymes ne soient coexprimes. Haut niveau d'expression : Le record de l'expression mentionne avec baculovirus est de 1 gramme de protine recombinante pour 109 cellules soit plus d'un gramme de protine par litre de culture. Cependant il s'agit d'un record et il est difficile de prvoir la quantit de protine que l'on obtiendra. Par exemple une protine cytotoxique tuera prcocement la cellule et la production sera plutt de l'ordre du microgramme par litre. Capacit de grande insertion : jusqu' maintenant on ne connat pas de taille maximale pouvant tre intgr dans le baculovirus. La seule limitation est donc la manipulation de grands fragments d'ADN dans le vecteur de transfert. Capacit d'pisser les gnes : La plupart des sites d'pissage seront utiliss par la cellule. Cependant l'pissage des sites alternatifs, qui sont tissus spcifiques seront plus alatoires. Expression simultane de plusieurs gnes : Des vecteurs comportant jusqu' trois promoteurs (deux P10 et un polydrine) sont actuellement disponibles. La seule limitation est simplement la difficult de construire les vecteurs de transfert trs grands, comportant plusieurs inserts.

b) Cellules dinsecte ayant intgr le gne dintrt dans leur gnome Toutes les lignes cellulaires ont la proprit intressante de pouvoir intgrer de l'ADN dans leurs chromosomes. Si on transfecte une cellule avec un plasmide on a tout d'abord expression transitoire partir du plasmide puis dans un deuxime temps tablissement d'une

24/10/2011

86

culture cellulaire exprimant la protine d'une manire stable puisque le plasmide s'est intgr dans le gnome. Des centaines de copies du plasmide se retrouvent dans le gnome. Le promoteur. Pour obtenir ces lignes stables on a besoin dun promoteur reconnu par la machinerie transcriptionnelle de la cellule et dun agent de slection. On connat un trs grand nombre de promoteurs chez les insectes. On utilise soit un promoteur constitutif soit un promoteur inductible. Dans ce dernier cas, on peut utiliser le promoteur de la metallotionine qui est inductible par le sulfate de cuivre. Une autre alternative est d'utiliser un promoteur viral prcoce. Ainsi le promoteur OpIE2 du baculovirus de Orgyia pseudotsugata est utilis car il est fonctionnel dans un grand nombre de cellules d'insecte diffrentes. La slection : le facteur limitant est la transfection, si une cellule incorpore de l'ADN, elle incorpore un grand nombre de molcules prsentes dans le milieu. Une premire technique consiste faire une cotransfection avec un plasmide comportant un gne de rsistance. Les cellules ayant incorpor des plasmides dans leur gnome seront hygromycine rsistante, les autres seront sensibles et seront limines. Une deuxime technique consiste intgrer le gne de slection au plasmide. On augmente la pression de slection pour slectionner les cellules qui sont les plus rsistantes, ces cellules comportent plus de plasmide, ainsi plus de copies du gne dintrt et donc produiront plus de protines. En augmentant graduellement la slection, on peut esprer slectionner des lignes produisant un grand nombre de copies par recombinaison. Ce systme offre lavantage de pouvoir utiliser un grand nombre de cellules diffrentes, et donc de choisir celle qui sera le plus adapte produire la protine dintrt. En effet, les capacits effectuer les diffrentes modifications post-traductionnellles varient en fonction des cellules. Par contre de systme est peu efficace si on veut exprimer une protine prsentant une toxicit pour la cellule. En effet, plus on exprime la protine toxique, moins on a de chance de pouvoir tablir la ligne stable.

24/10/2011

87

Les cellules de vertbrs 1) L'ovocyte de Xnope


On peut faire exprimer une protine par l'ovocyte de Xnope en injectant de lADN dans le noyau. Le noyau est situ au 2/3 du ple animal et n'est pas visible sur l'ovocyte vivant. Pour pouvoir injecter l'ADN on centrifuge doucement (200-400 g pendant 5 min. Le noyau plus dense que le cytoplasme se dplace vers le ple animal jusqu' le toucher. On observe alors une dcoloration au ple animal qui nous permet de le localiser. On injecte environ 10 nl d'ADN. Le gne d'intrt est clon derrire un promoteur eucaryote fort. Il y a alors transcription puis traduction. Les avantages et inconvnients du systme sont les mmes que ceux noncs pour l'injection d'un ARNc, c'est dire peu de protines sont produites mais cette protine est active. On va donc l'utiliser principalement pour exprimer des rcepteurs. Par rapport l'injection d'un ARNc, il y a plusieurs avantages: c'est plus facile raliser puisque la transcription in vitro n'est plus ncessaire de plus, on obtient gnralement plus de protines. Toutefois il y a aussi des dsavantages : la production est trs variable selon les ovocytes, certains produisent beaucoup de protines alors que d'autres n'en produisent que trs peu. Cette variabilit est sans doute due au moins en partie la centrifugation et l'injection dans les noyaux qui peut les abmer.

2) Cellules de mammifre On peut distinguer trois grands types d'expression, l'expression partir d'une infection virale, l'expression transitoire et l'tablissement dune ligne stable. Dans les deux premiers cas, les cellules sont infectes ou transfectes et analyses quelques jours aprs, dans le troisime cas l'ADN inject est incorpor au chromosome.

24/10/2011

88

a) Expression l'aide d'un virus

De nombreux virus qui infectent les cellules de mammifre ont dvelopp des mcanismes pour dtourner la machinerie de synthse des protines. Il a alors t tentant d'utiliser ces virus pour produire des protines. Les premiers vecteurs viraux ont t fabriqus partir du virus tumorigne simien SV40. Ce virus est petit (5 kb) et ne peut pas s'accommoder de squence supplmentaire importante. Il faut donc remplacer quelques gnes viraux par le gne d'intrt. Mais ces gnes sont indispensables pour la viabilit du virus. On transfecte donc la cellule avec deux virus SV40 : le virus recombinant portant le gne d'intrt et un virus mut un autre endroit du gnome. Les deux virus se complmentent et on obtient un stock viral comportant les deux virus. (N.B. ce systme d'helper suit la mme stratgie que la formation de simple brin en utilisant un plasmide portant l'origine de rplication des phages f1 ou M13). Le BPV (Bovine Papilloma Virus) est un papovavirus de 8 kb, ADN double brin circulaire. In vitro, il peut infecter un faible nombre de cellules et 30% de son gnome peut tre remplac par un ADN tranger ce qui permet d'insrer des squences de plasmide permettant la propagation dans E. coli ainsi que le gne d'intrt. Son avantage est d'tre prsent en grande quantit dans les cellules (50 200 copies), la transfection des cellules de souris (C127 ou 3T3) est aise et on peut mme tablir des lignes stables o le virus se maintient comme un pisome (quivalent d'un plasmide). Les lentivirus ont lavantage de pouvoir infecter toutes les lignes cellulaires. Un systme de production est commercialis par Invitrogen sous le nom de ViraPower. On transforme le plasmide contenant le gne dintrt avec deux autres plasmides dans une souche de cellules pour reconstituer le virus portant le gne en aval dun promoteur eucaryote fort. Le surnageant de culture contient les virus et peut tre utilis pour infecter dautres types cellulaires. Le virus de la vaccine est un poxvirus contenant un ADN de grande taille (185 kb) dont la rplication s'effectue entirement dans le cytoplasme. Le gne d'intrt est plac en aval d'un

24/10/2011

89

promoteur de poxvirus, les promoteurs eucaryotes n'tant pas reconnus par la machinerie transcriptionnelle du virus. Comme pour Baculovirus, l'ADN du virus est trop grand pour tre manipul aisment in vitro. La construction sera donc effectue par recombinaison homologue avec un vecteur navette portant des squences du virus. Ici aussi, la recombinaison est assez rare, on obtient environ un recombinant pour 1000 parents. Pour amliorer ce pourcentage et ainsi faciliter la slection des recombinants plusieurs systmes ont t mis au point: On utilise le gne viral codant pour la thymidine kinase (TK) comme squence flanquante permettant la recombinaison, de telle faon que la recombinaison l'inactive. On utilise des cellules mutes sur leur gne cellulaire de la thymidine kinase donc TK-. Lorsquil y a le virus, les cellules sont TK+ du fait de la prsence dune thymidine kinase virale. Les recombinant seront TK- due linactivation de la thymidine kinase virale. Or, on sait trier les cellules TK- des cellules TK+ : les cellules TK- sont rsistantes la 5-bromodsoxyuridine. En effet, pour tre active, cette drogue doit tre phosphoryle par la thymidine kinase. Le problme est que la mutation de TK+ vers TK- a une frquence de 10-4, aussi on associe souvent cette slection une autre mthode. Cette deuxime mthode utilise la co-expression d'un gne de rsistance un antibiotique codant pour la guanine phosphorybosyltransfrase (gpt) qui procure la rsistance au G418. Une troisime mthode utilise, comme pour le Baculovirus, un virus parent exprimant la -galactosidase pour pouvoir trier visuellement les virus recombins des virus parents. L'avantage du virus de la vaccine est qu'il teint les productions d'ARNm de l'hte si bien que l'ARN du gne clon peut reprsenter jusqu' 30% de l'ARN de la cellule. Les adenovirus sont des virus ADN double brins linaires de 36 kb. Ils causent chez l'homme des infections des voies respiratoires ou des conjonctivites. On peut utiliser des virus attnus comme vecteur en clonant l'ADN d'intrt derrire un promoteur fort. L'introduction de l'ADN se fait par un premier clonage dans un plasmide puis par une recombinaison in vivo comme pour le cas du baculovirus ou du virus de la vaccine. L'avantage de ce virus est que l'expression peut se faire dans un grand nombre de cellules humaines telles que la ligne 293.

24/10/2011

90

Ainsi, les modifications post-traductionnelles caractristiques des cellules humaines sont respectes. L'expression est souvent leve, jusqu' 10-20% des protines cellulaires. Une autre catgorie de virus peut tre utilise : les rtrovirus. Ce sont des virus ARN, une fois l'ARN entr dans le cytoplasme, il est rtrotranscrit en ADN et cet ADN est intgr dans le gnome avec chaque extrmit les LTR (Long Terminal Repeat). Il produit de l'ARN viral partir d'une squence proche de l'extrmit du virus. Cet ARN sert produire les protines virales et donc la cration de nouveaux virus. Ces virus sont assembls dans le cytoplasme et sortent de la cellule par bourgeonnement. Ainsi tout gne insr dans un virus recombinant sera intgr dans le gnome. Pour utiliser un tel systme on fabrique un plasmide dans lequel on a ajout le gne dintrt derrire son promoteur et le signal dempaquetage de lARN (+), le tout est insr entre les deux LTR. Ce virus est incapable de s'intgrer dans le gnome et est dpourvu de gag (protine de structure), de pol (reverse transcriptase, intgrase) et denv (protine de lenveloppe). Dans un deuxime plasmide (ou intgr dans le gnome), on a un virus complet mais qui manque de squences ncessaires l'encapsidation de lARN. Le plasmide portant le gne dintrt est transfect dans la cellule qui produit les protines virales (gag, pol, env), ce qui permet d'obtenir un virus ARN. Ce systme a simplement permis de passer dun plasmide un virus, incapable de se rpliquer mais pouvant sintgrer dans un gnome. Ces virus sont purifis et infectent d'autres cellules qui ne comportent pas de virus. L'ARN est rtrotranscrit en ADN, circularis et intgr dans le gnome. Le nouveau virus est incapable de s'encapsider, l'intgration est stable.

24/10/2011

91

1) Transfection 2) intgration gnome

vecteur retroviral

3) transcription traduction gene X, , resistance ARN

gag, pol, env 4) Reconnaissance de par les protines virales 5) Empaquetage

6) Virus infectants mais incapables de se rpliquer

Les alfavirus tels que le SFV (Semliki Forest Virus) sont des petits virus ARN simple brin qui peuvent se rpliquer dans toutes les cellules animales. A la suite de l'infection, l'ARN code pour quatre protines qui produisent l'autre brin appel brin -. Ces derniers servent alors de matrice pour produire des brins + et des petits gnomes qui servent faire les protines de structure. Plusieurs alfavirus ont t clons sous la forme dADNc pour produire des ARN in vitro, infectieux dans lesquels les gnes codant pour les protines de structures ont t remplacs par le gne d'intrt. Ce systme a plusieurs avantages : on obtient une grande quantit de protine, la construction du virus s'effectue entirement dans E. coli, il n'y a pas besoin d'helper. La principale difficult provient de la transfection de l'ARN dans les cellules qui est faite par lectroporation. Ce systme est proche de l'injection dARN dans l'ovocyte de Xnope mais, ici, il y a rplication de l'ARN par une rplicase.

24/10/2011

92

Il y a quelques dangers utiliser des virus pour exprimer des protines. Par exemple, le virus de la vaccine n'est pas toxique et on s'en sert pour les vaccinations contre la variole. Toutefois, il faut faire attention, il est en effet capable d'attaquer les cellules humaines.

24/10/2011

93

b) Expression transitoire

Les vecteurs Les vecteurs utiliss ici sont constitus de deux parties, une permettant la manipulation dans les bactries, avec au minimum une origine de rplication (pBR322 ori ou pUC ori ou col E1 ori) et un gne de rsistance aux antibiotiques. A ces deux parties, on peut ajouter des parties accessoires : une origine d'un phage ADN simple brin (M13 ou f1) pour faire certains protocoles de mutagense ou pour squencer, les promoteurs des phages T3, T7 ou Sp6 si on veut faire de l'ARN in vitro. Une deuxime partie servira la manipulation dans les cellules eucaryotes. Ces deux parties ne sont pas forcement spatialement spares et on peut ajouter ou retirer les parties que l'on souhaite. Les marqueurs de slection Un des principes de base des techniques de biologie molculaire est d'utiliser un marqueur biologique pour identifier ou slectionner les cellules contenant des molcules d'ADN recombinant. Le gne de slection doit lui-mme tre en aval d'un promoteur fonctionnant dans la cellule transfecte Une premire technique consiste complmenter une dficience de la cellule. Exemple de la thymidine kinase dj vue dans l'utilisation du virus de la vaccine. Cette enzyme est code par le gne tk qui a t isol chez le virus de l'herps simplex (HSV). Elle est implique dans une des voies de synthse de la thymidine monophosphate partir de la thymidine et donc de la thymidine triphosphate, nuclotide indispensable pour la synthse de l'ADN et donc pour la rplication et la viabilit de la cellule. Une deuxime mthode consiste utiliser des enzymes rsistants une drogue comme par exemple :

24/10/2011

94

- Une dihydrofolate rductase (DHFR) rsistante au mthotrexate qui peut alors tre ajout au milieu de culture (la DHFR rsistante a t trouve dans les cellules cancreuses rsistante au mthotrexate). - Une hygromycine phosphotransfrase (HPH) inactive l'hygromycine qui inhibe aussi la synthse protique. - Une aminoglycosyl phosphotransfrase (APH) donne la rsistance au G418, proche de la nomycine. Le G418 bloque la synthse protique et est dtruit par l'APH. C'est le marqueur le plus utilis car le gne bactrien de rsistance la kanamycine procure la rsistance au G418 chez les eucaryotes. Dans ce cas, le mme gne marqueur peut tre utilis pour les tapes de construction dans E. coli comme pour les tapes dexpression dans les cellules eucaryotes.
RBS

promoteur procaryote

promoteur eucaryote

neomyciner

signal de polyadnylation

Il faudra alors que le gne soit fonctionnel dans les deux systmes. Il faudra deux promoteurs en amont du gne, un procaryote et un eucaryote, un site de liaison au ribosome en amont de lATG dinitiation de la traduction pour lexpression en procaryote et un site de polyadnylation en 3 pour lexpression en eucaryote. Il est aussi possible de trier les cellules transfectes par coexpression d'un anticorps sur la surface externe de la cellule. Les cellules transfectes expriment l'anticorps leur surface, ainsi que la protine d'intrt, ces anticorps ragissent avec un haptne lie une bille magntique, ces billes peuvent tre tries avec un aimant. Une autre mthode consiste exprimer une protine qui colore les cellules. On utilise le plus souvent la GFP (green fluorescent protein) qui colore les cellules en vert. Les cellules

24/10/2011

95

transfectes sont vertes. Cette mthode peut tre en plus employe en combinaison avec la slection une drogue. On peut en effet fabriquer une protine de fusion entre la GFP et lhygromycine phosphotransfrase. Les cellules qui se dveloppent en prsence dhygromycine doivent tre vertes. On peut ainsi vrifier que la slection lhygromycine est efficace. Les promoteurs Les promoteurs et enhancers consistent en des squences qui interagissent avec les protines impliques dans la transcription. La combinaison de ces squences dtermine l'efficacit avec laquelle un gne donn est transcrit dans une cellule donne. On distingue grossirement deux types de squence dans un promoteur, la "TATA box" et les lments en amont. La "TATA box" est localise 25 30 bp en amont du site d'initiation de la transcription. Ce site est directement impliqu dans le positionnement de lARN polymrase II qui commencera la synthse au bon site. Les lments en amont, eux, sont responsables de la vitesse de l'initiation de la transcription. L'action de ces lments est indpendante de leurs orientations, ils sont localiss 100 200 bp en amont de la TATA box. Les enhancers stimulent la transcription, mme grande distance du promoteur (plus d'un kb), ils peuvent se situer en amont ou en aval du promoteur. La plupart d'entre eux fonctionnent uniquement dans un type de cellule et, de plus, sont actifs seulement dans des conditions spcifiques telles que la prsence d'un inducteur comme une hormone ou un ion mtallique. Ainsi le choix d'un promoteur et d'un enhancer va principalement dpendre de la ligne cellulaire utilise. Les promoteurs et enhancer les plus utiliss proviennent de virus qui ont une faible spcificit cellulaire. Par exemple l'enhancer prcoce de SV40 est actif dans presque toutes les cellules. De mme, le promoteur prcoce du cytomgalovirus (CMV) humain permet l'expression dans un grand nombre de lignes cellulaires. Mais on peut aussi utiliser des promoteurs de gne codant pour des protines ubiquitaires. Ainsi, UbC le promoteur de lubiquitine qui est une protine trs conserve chez les eucaryotes est utilis parce quil fonctionne dans un trs grand nombre de cellules et que la transcription est quivalente celle obtenue avec le promoteur CMV.

24/10/2011

96

Un systme hybride utilise le virus de la vaccine et lARN polymrase T7. On infecte des cellules avec un virus recombinant codant pour lARN polymrase T7. On transfecte ensuite les cellules avec un plasmide o le gne d'intrt est sous le contrle d'un promoteur de T7. Ce systme permet d'avoir une grande quantit de protine en profitant d'une part de la forte transcription et traduction de la polymrase puis de sa forte capacit de synthse de l'ARN d'intrt. Pour avoir un bon contrle de l'expression, on peut utiliser des promoteurs inductibles par exemple par les mtaux lourds, un choc thermique ou une hormone strodienne. Toutefois tous ces systmes fuient, il y a toujours une expression faible en absence dinduction. De plus les inducteurs sont souvent toxiques et linduction nest gnralement pas spcifique. Pour rsoudre ce problme, on utilise une rgulation htrologue. Par exemple, on peut utiliser une squence rgulatrice d'insecte dans le promoteur. Lecdysone est une hormone de mue des insectes, absente chez les vertbrs. On fabrique des cellules (CHO ou 3T3) qui synthtisent d'une manire constitutive un rcepteur htrodimrique de l'ecdysone. On utilise dans le plasmide, un promoteur minimal comportant en amont la squence de rponse l'ecdysone. On induit alors l'expression avec de la muristerone A, un analogue de l'ecdysone qui n'a aucun effet sur les cellules de mammifre, et qui n'induit aucun autre gne. Un deuxime exemple est lutilisation dun systme de rgulation bactrien comme lopron tetracycline de E. coli (Gossen et Bujard, 1992 ; Gossen et al., 1995). Le gne dintrt est clon en aval dun promoteur minimal du cytomegalovirus (PminCMV) en aval dun lment de rponse la ttracycline (TRE) qui contient plusieurs copies de loprateur. Le plasmide doit coder pour le rpresseur qui nexiste pas dans la cellule eucaryote (TetR). En labsence de tetracycline, TetR se fixe sur loprateur (TRE). Pour convertir TetR, un rpresseur procaryote en transactivateur eucaryote, il a t fusionn avec un domaine

24/10/2011

97

dactivation du virus de lherpes (VP16). En prsence de ttracycline, il ny a pas transcription alors que linduction se fait en retirant la ttracycline.

VP16 TetR + Tetracycline -Tetracycline VP16 TetR Psv40 tetR VP16 gne dintrt Pcmv TRE

Rgulation de lexpression dun gne dans une cellule eucaryote par systme de rgulation procaryote.

Mais il nest pas toujours simple d'liminer la ttracycline du milieu pour avoir une induction. TetR a t mut par mutagense au hasard et le mutant appel rTetR, pour reverse TetR se lie lADN en prsence de ttracycline uniquement. Comme la ttracycline a des effets indsirables, des effecteurs plus efficaces et donc moins toxiques ont t recherchs, la doxycycline est le plus utilis actuellement. Le polylinker Not soit avec tous les sites d'enzymes de restriction, soit MCS (multiple cloning site), il est gnralement optimis pour viter les structures secondaires de l'ARN pouvant gner la traduction. Il y a gnralement plusieurs sites de coupures avec diffrentes localisations ce qui permet d'orienter l'insert, en utilisant des enzymes qui ne coupent pas l'intrieur de la squence codante. Comme dans le cas des procaryotes, un site de restriction est souvent positionn sur l'insert par mutagense dirige. La terminaison

24/10/2011

98

Lors de la transcription, lARN polymrase II passe travers le site de polyadenylation. L'extrmit 3' est donc forme lors de la maturation de l'ARN par clivage et ajout de la queue poly-A. On ne connat pas bien les arrts de la transcription chez les eucaryotes. La maturation est due deux sites : une squence riche en GU ou en U situe en aval du site de coupure et une squence trs conserve AAUAA situe 11 30 nuclotides en amont du site de coupure. Pratiquement ces squences doivent tre prsentes pour assurer une bonne maturation de l'ARN. Ces lments sont prsents lorsqu'on veut exprimer un ADNc complet mais souvent ils ne sont pas suffisant pour assurer une bonne maturation. Aussi, on en rajoute une dans la plupart des vecteurs. Le plus souvent on utilise les sites de polyadenylation des transcrits de SV40. Un intron Chez les eucaryotes l'ARN prmessager (hnRNA) est souvent piss. Aprs la polyadnylation, les introns sont retirs pour gnrer l'ARN mature. Les squences consensus de l'pissage ont t dtermines en comparant un grand nombre de squences dADNc et dADN gnomique. On a AG/GU(A)AGU....(UC)nN11CAG/G, le GU au site donneur et le AG au site accepteur tant invariable. Or, des squences proches de la squence consensus peuvent se trouver dans la squence codante de lADNc et ces sites peuvent tre utiliss quand il ny a pas dintron pisser. Pour viter ce problme, un intron est gnralement ajout en aval du site de clonage. De plus, il semble que l'pissage augmente l'efficacit du transport de l'ARN vers le cytoplasme o il est traduit. On a remarqu que lexpression chez les mammifres tait augmente lorsquun intron est inclus dans la squence (Brenner et al., 1994). Comme la prsence dun intron nest par ailleurs gnralement pas prjudiciable, on prfre l'ajouter. Une squence responsable de la traduction L'ATG d'initiation doit tre dans un environnement favorable et respecter la squence consensus de Kozac pour une bonne traduction. Cette squence est (G/A)NNATGG. Bien que

24/10/2011

99

d'autres squences soient possibles, il est prfrable d'avoir une purine en position -3 et une guanine en position +4. Des squences d'adressage Lorsqu'on souhaite que la protine soit adresse dans un rgion particulire, on ajoute en fusion une squence codante permettant son adressage. Le plus courant est la scrtion en ajoutant un peptide signal, la protine sera dirige dans le rticulum endoplasmique puis scrte. Mais on peut aussi utiliser un signal de scrtion dans les mitochondries ou un signal de scrtion dans le noyau. Dans ce dernier cas, on peut utiliser une fusion avec VP22. Cette protine de 38 kDa du virus de lherps a la particularit dtre transloque dans le noyau dune cellule lautre. Aprs la traduction dans le cytoplasme, VP22 est importe dans le noyau des cellules adjacentes, non transfectes et cette facult de translocation est en mme temps confre aux protines de fusion (OHare et Elliot, 1997). Un des avantage de cette fusion est de pouvoir utiliser cette fusion en expression transitoire, dans ce cas, lefficacit de la transfection na plus grande importance puisque toute les cellules auront la protine. Des sites interne d'initiation de la traduction. Bien que les ARN eucaryotes soient monocistroniques, il existe une exception : le virus de la polio (picornaviridae) produit un ARN polycistronique pour lequel il existe des sites d'initiation internes (Peletier et Sonenberg, 1988). Ces sites de liaison du ribosome (IRES, Internal ribosomal entry site) peuvent tre utiliss en amont du gne dintrt, ils ont alors la mme fonction que le RBS. Ces IRES seront donc utiliss lorsqu'on veut avoir deux protines diffrentes provenant du mme ARN. Une protine peut ainsi servir de marqueur de transcription pour la protine d'intrt.

c) L'tablissement de lignes stable

24/10/2011

100

Mme dans les meilleurs cas, 5% 50% des cellules seulement sont transfectes, on analyse donc des cellules transfectes et des cellules non transfectes. L'origine de rplication de E. coli ne fonctionne pas dans les cellules eucaryotes , on a donc trois solutions : soit en ajouter une, soit intgrer le gne dans le gnome et, dans ce cas, on a tablissement d'une ligne stable soit ne pas en rajouter, dans ce dernier cas, on a une expression transitoire, uniquement dans les cellules transfectes. Le problme de l'tablissement de lignes stables est que l'on ne connat pas d'origine de rplication chez les eucaryotes utilisables pour faire rpliquer un plasmide.

Utilisation d'un virus On s'est donc tout d'abord adress au virus. La mthode utilisant le virus SV40 a peu peu volu, uniquement l'origine de rplication de SV40 a t introduite dans le plasmide et le virus auxiliaire (helper) a t introduit dans le gnome de certaines cellules. Ainsi les cellules COS ont un virus intgr dans le gnome, cette squence produit l'antigne viral T qui dclenche la rplication du plasmide. L'antigne T se fixe sur l'origine de SV40, carte les deux brins d'ADN et joue le rle d'une hlicase. De plus l'antigne T se lie des protooncognes tels que P53 ce qui favorise la multiplication des cellules. Aprs transfection, le plasmide est rpliqu en un grand nombre de copies (entre 10.000 et 100.000 par cellules) 48 heures aprs l'infection. Il est possible de transfecter plusieurs plasmides simultanment, et donc d'obtenir plusieurs protines ou des complexes multiprotiques. Ce systme a servi au clonage d'un grand nombre de protines par expression comme par exemple le clonage de rcepteurs. Il existe certaines limitations l'utilisation de ce systme : ce systme ne marche qu'avec des cellules de singe et il y a souvent des remaniements dans le gnome. D'autre part la production est souvent trop importante si bien que la cellule occupe faire la protine au lieu de ses propres protines meurt au bout d'une semaine et on se retrouve dans une situation proche d'une expression transitoire.

24/10/2011

101

Intgration alatoire Lorsqu'on introduit un fragment d'ADN dans une cellule, il y a toujours une chance que cet ADN s'intgre dans le gnome. L'intgration se fait de manire alatoire et on observe assez souvent une intgration de plusieurs copies en tandem au mme locus. La slection peut dans certains cas s'effectuer sur un grand nombre de copies. C'est le cas de la slection avec la DHFR. Dans les cellules cancreuses rsistante au mthotrexate, le gne est amplifi. L'amplification n'est pas limite au gne seul mais les squences situes proximit sont aussi amplifies. Ce phnomne a t exploit en clonant le gne d'intrt prs du gne de la DHFR. Aprs la transfection, les cellules sont soumises une slection au mthotrexate pour slectionner les cellules ayant incorpor l'ADN puis, progressivement, au cours de gnrations, la dose de mthotrexate est augmente jusqu' arriver 80 M, concentration pour laquelle l'entre du mthotrexate dans la cellule devient limitante. A cette concentration, on a entre 500 et 2000 copies du gne dans le gnome. L'inconvnient de cette mthode est qu'elle peut prendre une dure dun an. Un autre mthode de slection utilise l'amplification de la glutamine synthtase. Ce gne confre une faible rsistance la methionine sulfoximine (MSX).

Intgration par recombinaison On peut utiliser la recombinase Flp si on a les sites FRP dans le plasmide et dans le gnome de la cellule. On effectue donc une premire transfection stable du site FRP, slectionne avec un gne de rsistance. Puis on transfecte les cellules avec deux plasmides, un plasmide portant le gne d'intrt, un site FRP et un gne de slection et un plasmide codant pour la
FRT gne de slection 2 gne dintrt FRT gne de slection 1 FRT gne de slection 1 gnome gne de slection 2 FRT gne dintrt

24/10/2011

102

recombinase. La recombinaison est alors slectionne avec la rsistance provenant du plasmide portant le gne d'intrt. L'avantage de ce systme est l'absence d'effet de position puisque le plasmide s'intgre toujours au mme endroit. Choix du systme cellulaire. - Il ne faut pas qu'il y ait de protine endogne correspondant celle que lon recherche ou d'antigne cross-ragissant avec les anticorps qui seront utiliss pour voir la protine. - La temprature de culture peut avoir une importance. - Le choix peut avoir des consquences sur les modifications post-traductionnelles. Les diffrents organismes ont une spcificit, par exemple les sucres ajouts par les levures sont diffrents des sucres ajouts par les cellules de mammifres. A l'intrieur des mammifres toutes les cellules ne font pas exactement les mmes modifications post-traductionnelles, par exemple les cellules CHO (provenant d'ovaire de hamster) ajoutent plus d'acide sialique que les cellules CV-1 (de singe) ou NIH-3T3 (de souris). Mais certaines modifications sont tissus spcifique. Uniquement certaines cellules sont capables d'effectuer certaines modifications post-traductionnelles. Par exemple pour le facteur IX de coagulation, il y a une -carboxylation de certains acides glutamiques qui ne peut tre effectue que par les cellules du foie. Le problme est d'autant moins facilement rsolu qu'une des caractristiques des cellules eucaryotes diffrencies est de ne pouvoir tre cultives.

Les systmes hybrides On ne sait souvent pas quel systme choisir au dpart et il est souvent ncessaire de faire des essais en procaryote et en eucaryote. Pour allger les travaux de construction, on peut cloner le gne d'intrt directement dans un vecteur en aval de deux promoteurs, un eucaryote et un procaryote. L'ensemble des squences ncessaires aux deux systmes sera alors prsent dans le vecteur (site de liaison au ribosome procaryote, site de polyadnylation, gne de slection...).

24/10/2011

103

Expression dans des eucaryotes unicellulaires

Exemple de lutilisation de Leishmania tarentolae, un Kinetoplastidae non pathogne. Ce systme a t dvelopp par une compagnie, JenaBioScience. Le gne est introduit par transfection et maintenu soit sous forme pisomale soit par intgration dans le gnome. Les protines sont produites avec les maturations post-traductionnelles des eucaryotes. Avantage du systme : la culture est facile dans un milieu peu cher.

24/10/2011

104

Les causes d'checs de la production de protines.


Dans de nombreux cas, on nobtient pas ou trs peu de protine dsire. Les problmes peuvent venir de le squence du gne ou de la squence de la protine.

1) Il ny a pas ou peu de protine Le problme peut provenir de la squence du gne Dans ce cas il ny a pas ou peu de traduction du fait de l'htrognit des systmes : diffrence procaryotes/eucaryotes ou eucaryotes/ virus

Les codons La vitesse de traduction est fonction des codons utiliss. Le code gntique est dgnr, un mme acide amin peut tre cod par plusieurs codons, mais les concentrations des diffrents ARNt ne sont pas identiques selon les espces. Ils peuvent donc devenir un facteur limitant dans la vitesse de traduction simplement en la ralentissant. Par exemple le glutamate est cod par GAG ou GAA mais GAG est utilis dans 60 % des cas chez les mammifres (et donc GAA dans 40% des cas) alors que c'est l'inverse chez les bactries gram- GAG est utilis dans uniquement 35% des cas. De mme, l'arginine est cod par AGPu ou CGN. Les codons AGPu sont les plus utilis chez les mammifres (21% chacun) mais rarement utilis chez E. coli (4% chacun). Comme chez E. coli, la transcription et la traduction sont coupls, un ralentissement de la traduction affecte la stabilit de l'ARN messager. Si le ribosome est ralenti sur plusieurs codons rares, l'extrmit 3' du messager est expose aux RNAses. De plus on observe une terminaison prmature de la transcription et donc pas de production de la protine. Dans ce cas l, il existe deux solutions : une mutagense de certains codons peut tre envisage pour amliorer la traduction. Si un codon est peu utilis, c'est gnralement parce que l'ARN de

24/10/2011

105

transfert corespondant est rare. Une autre solution consiste alors coexprimer les ARNt rares (Sauge-Merle et al., 1999). Comme il y a gnralement de nombreux codons modifier, un gne synthtique correspondant une optimisation des codons peut tre construit (Feng et al., 2001). Les codons choisis correspondent alors ceux qui sont les plus utiliss pour les protines qui sont trs exprimes dans lorganisme. Des tables ont t tablies pour donner la frquence relative dutilisation des codons,
RCUij = Xij 1 ni

Xij
j =1

ni

RCU : relative codon usage ; Xij : nombre de rencontre du codon j pour lacide amin i, ni : nombre de codon pour lacide amin i. Un logiciel permet de faire la traduction inverse dune squence de protine (http://www.entelechon.com/eng/backtranslation.html) pour tre optimise selon lorganisme.

Linitiation Chez E. coli, la squence de liaison du ribosome doit tre optimise lors de l'expression. En dehors de la squence de Shine Dalgarno, plusieurs lments doivent tre pris en compte : la squence du premier acide amin aprs la methionine est importante. On a par exemple 10 fois plus de protine produite si on remplace un tryptophane (UGG) par une alanine (GCU) (Looman et al., 1987). Les codons AGG, CGG, UGG et GGG sont associs une faible expression sil sont localiss entre les positions +2 +5. Il semble que la prsence de ces codons au dbut de la traduction entrane un dtachement du peptidyl tRNA (Valdivia et Isaksson, 2005). La prsence de structures secondaires impliquant des rgions amont et aval au site de liaison du ribosome est dfavorable la traductibilit, (Schauder et McCarthy, 1989), plus ces structures sont stables, moins on obtient de protine. Ainsi, si on augmente la proportion de AT dans les premiers nuclotides en aval de lATG, on augmente la production.

24/10/2011

106

Il peut y avoir des initiations internes (squences de Shine Dalgarno pour les bactries). Chez les procaryotes, les ARN sont polycistroniques, si bien qu'il faudra faire attention lors de l'expression d'un gne eucaryote, qu'il n'y ait pas l'intrieur de la squence codante une squence susceptible d'tre reconnue par un ribosome procaryote. Il peut y avoir un promoteur procaryote lintrieur de la squence. Ce promoteur peut gner la production de la protine soit en initiant la synthse dun ARN antisens soit en tant un site de liaison de la polymrase qui gne le droulement de la traduction.

5 TTGACA

17 +/- 1 bp

TATAAT

Squence consensus dun promoteur chez E. coli (Hawley et MacClure, 1983)

Il peut y avoir une initiation prmature. Chez les eucaryotes, de nombreux gnes comportent de courtes phases de lecture ouverte en amont de lATG initiateur de la protine dintrt. Ces phases de lecture ont souvent un rle de rgulation de la traduction. Pour obtenir une bonne surexpression dans un systme eucaryote, on enlvera ces phases de lecture ouverte avant le codon initiateur.

La terminaison de la transcription La polymrase bactrienne s'arrte quand elle synthtise une srie de rsidus U dans la mesure o elle a d'abord synthtis une squence autocomplmentaire capable de se replier. L'limination de telles structures par mutagense permet une meilleure traduction. On a le mme problme avec l'expression dans le virus de la vaccine, les signaux d'arrt de transcription du virus (TTTTTNT) ventuellement prsents dans le gne seront enlevs de la squence ajoute par mutagense dirige. Si on veut exprimer un gne mitochondrial dans une cellule eucaryote, il faudra faire attention quil ny ait pas de signaux de polyadenylation dans la squence. En effet les transcrits

24/10/2011

107

mitochondriaux ne sont pas polyadnyls, si bien que la squence consensus peut tre prsente en amont ou dans la phase de lecture du gne exprimer.

Les structures secondaires de l'ARN empchent la traduction On a montr qu'il existait une corrlation inverse entre le pourcentage de structure secondaire sur l'ARN messager et l'efficacit de traduction. Ces structures secondaires sont relativement importantes en 5' o elles ont un rle dans le contrle de la traduction. Pour surexprimer une protine, il faudra donc liminer les squences inhibitrices de la traduction existant dans la partie non codante en 5' des ARNm, phnomne connu sous le terme d'attnuation (comme par exemple dans le cas de l'opron tryptophane chez E. coli). Pour l'expression dans le virus de la vaccine, les squences non traduites en 3' et en 5' seront courtes pour mimer les ARNm des poxvirus.

Stabilit de l'ARN Chez les procaryotes, les ARN peuvent tre stabiliss en ajoutant en 3 une structure secondaire pour inhiber la dgradation par des exonuclases 3-5. Bien quil nexiste pas de RNAse 5-3 la prsence dune structure secondaire en 5 stabilise le transcrit en inhibant laction dendonuclases telle que la RNAse E. Chez les eucaryotes, il y a de grandes diffrences de stabilit des ARNm. La stabilit peut dpendre de lARN synthtis. Gnralement, les protines rgulatrices dont le taux varie rapidement dans la cellule sont codes par des ARNs instables. Ainsi, l'ARN de la -globine a une dure de demi-vie de plus de 10 heures, alors que l'ARN d'un facteur de croissance a une dure de demi-vie d'environ 30 min. Cette stabilit dpend souvent des squences non traduites en 3'. Pour analyser ce phnomne on transfre les squences du gne analys sur un gne rapporteur. Si on transfre l'extrmit du gne codant la -globine l'ARN de fusion devient plus

24/10/2011

108

stable. Par contre si on ajoute une squence riche en A et U prsente dans les ARN instables comme ceux codant pour un facteur de croissance, l'ARN de fusion devient instable. Lorsquon efffectue une surproduction dune protine peu synthtise, on enlve souvent les squences en 3' de lADNc et, au besoin, on rajoute en 3 des squences favorisant la stabilit de lARN. Pour ce faire, on ajoute les squences 3 non codantes dun gne dont lARN est stable. Par exemple, la squence du gne codant pour lhormone de croissance bovine est souvent rajoute pour les expressions en cellules de mammifre.

Problme inconnu, mutagense au hasard Dans certains cas plutt que de chercher mutageniser les codons et les structures secondaires par mutagense dirige, on mutageneise au hasard le plasmide, on transforme des bactries et on trie celles qui produisent le plus. Cette exprience a par exemple t ralise avec l'-antitrypsin. Ils ont obtenu une production augmente de 100 fois. L'analyse de la squence exprimant le plus n'a pas permis de comprendre les mutations responsables de cette surproduction (la surproduction n'a pas t explique par une limination des codons rares ou des structures secondaires). Dans de nombreux cas on ne sait pas pourquoi la protine nest pas produite. La solution est alors de changer de systme. Si on na pas dexpression lors dune traduction in vitro dans le systme du lysat de rticulocyte, on peut obtenir une bonne expression dans le systme du germe de bl et inversement. Ce phnomne est assez gnral, la production dune protine dans un systme ne permet pas de le valider, la comparaison de deux systmes de production ou de deux cellules avec un mme systme de production ne permet pas de dire quun systme est meilleur quun autre.

2) La protine est produite mais est toxique


De nombreuses protines sont toxiques pour la cellule. La culture ne se dveloppe pas et on obtient pas ou peu de protine. Dans certains cas, la toxicit est prvisible. C'est par exemple le

24/10/2011

109

cas des protines impliques dans le cycle cellulaire ou la surexpression dune ADN polymrase. Par contre, dans certains cas, on ne s'y attend pas. Par exemple l'expression de la transposase dun lment transposable de la mouche des fruits est toxique pour E. coli. Cette toxicit a plusieurs consquences, elle s'accompagne - de mutations qui diminuent la transcription et la traduction de la protine. - de perte du vecteur (plasmide chez E. coli) - d'accumulation de mutations dans la protine la rendant moins toxique. Il existe plusieurs solutions : Utiliser des promoteurs fortement inductibles comme par exemple le promoteur arabinose avec AraC et un site de liaison de la CAP. Dans ce cas on a une induction de 800 fois dans un milieu sans glucose et contenant de l'arabinose. Augmenter linductibilit du promoteur. On peut surexprimer un rpresseur tel que LacI et ajouter des oprateurs tels que LacO en amont du gne dintrt. Dans le cas du promoteur LacZ, le rprimer par le glucose. Cest la rpression catabolique qui, bien quelle soit diminue en utilisant un mutant (LacUV5), nest pas totalement abolie. La technique consiste donc faire pousser la bactrie dans un milieu riche en glucose puis lors de linduction changer le milieu pour un milieu pauvre (Pan et Malcolm, 2000). Produire un inhibiteur de la polymrase. Cette stratgie est utilise lorsque le gne dintrt est plac en aval dun promoteur reconnu par une polymrase exogne, produite par la cellule. Cest le cas de lutilisation de lARN polymrase T7 dans les expressions chez E. coli. Dans ce cas on coproduit le lysozyme du phage T7 qui est un inhibiteur de lARN polymrase T7 et qui inhibe lenzyme exprime bas niveau avant linduction (Studier, 1991). Lors de linduction, lARN polymrase T7 est produite en grande quantit, le lysozyme est en trop faible quantit pour linhiber. Ajouter lARN polymrase au moment de la production par exemple en infectant les bactries avec un M13 portant le gne de lARN polymrase T7. Utiliser une stratgie antisens, en absence d'induction, la fuite du promoteur est contrle par un ARN antisens produit par un promoteur constitutif en aval du gne. Utiliser un systme de scrtion de la protine dans le milieu cellulaire.

24/10/2011

110

Dans le cas ou la protine est trs toxique, on peut toujours se replier sur les systmes de traduction in vitro.

3) La protine est surexprime mais est mal replie


Lorsque les protines sont exprimes en grande quantit dans E. coli, (jusqu' 50% des protines totales), elles sont agglomres dans des "corps d'inclusion" visibles en microscopie contraste de phase aux extrmits de la bactrie. Les protines ainsi incluses sont gnralement inactives et ne peuvent pas tre purifies par chromatographie. Ces corps dinclusion sont frquents lors des productions dans E. coli. Plusieurs techniques ont t mises en place pour viter ou diminuer cette agglomration Utilisation de souches particulires. Il n'existe pas de souche liminant compltement les corps d'inclusion, mais parfois en changeant de souche on obtient souvent moins de protine. Diminution de la vitesse de production en faisant varier les conditions de temprature. On peut faire varier les tempratures de 10 43C sans altrer E. coli. Par exemple la production de subtilisine active est augmente de 14 fois lorsque la culture est faite 23C au lieu de 37C. Pour l'interfron, 5% de la protine est active 37C et 73% 30C ce qui a donn une augmentation de 7 fois de protine active en passant 30C. De mme, lajout de chloramphnicol au milieu permet dobtenir plus de protines solubles. La quantit d'inducteur a aussi de l'importance pour viter la formation des corps d'inclusion, il faut diminuer au maximum la quantit d'inducteur pour obtenir une protine active. Toutefois, toutes ces techniques visent diminuer la production, aussi on observe souvent une baisse du rendement. Utilisation de stabilisants. Laddition de sucres non mtabolisables par la bactrie (saccharose, raffinose ou sorbitol) permet souvent de diminuer le pourcentage de protine insoluble. Ce rsultat est attribu leffet stabilisateur des sucres sur la conformation des protines. Dautres mthodes de stabilisation particulires peuvent tre efficaces, c'est par

24/10/2011

111

exemple le cas des protines qui contiennent un mtal comme cofacteur soit structural soit catalytique. Si la protine est fabrique plus vite que le mtal n'est transport dans la cellule, l'apoprotine sans le mtal s'accumulera et ne se repliera pas correctement. Un autre facteur qui influence la prsence d'agrgat est le pH. Faire scrter la protine dans le milieu extrieur ou dans le priplasme chez E. coli. Le cytoplasme des bactries est un milieu rducteur dans lequel les ponts disulfures ne peuvent pas se former. Par contre le priplasme est un milieu oxydant. Plusieurs protines de E. coli sont scrtes dans le priplasme, par exemple, les -lactamases confrant la rsistance certains antibiotiques tels que l'ampicilline ou la pnicilline sont scrtes dans le priplasme. L'adressage de ces protines est d un peptide signal qui est coup lors de la translocation. Le peptide signal actuellement le plus utilis est celui du OmpA, la coupure s'effectue juste au niveau de la jonction si bien que la protine exprime se retrouve dans le priplasme avec son extrmit N-terminale. Problme: la scrtion est souvent relativement peu efficace. Il est aussi possible de faire scrter la protine dans le milieu extracellulaire en coexprimant une protine, la BRP (Bacteriocin Release Protein), qui permabilise la membrane externe de la bactrie en activant une phospholipase. A linverse, ladressage au priplasme peut empcher le bon repliement de la protine, c'est pas exemple le cas de la GFP qui nest pas fonctionnelle si on essaye de lexprimer dans le priplasme. Utilisation de foldases. Il y a de nombreuses protines telles que la thiordoxine, la protine disulfide isomrase ou la prolyl cis-trans isomrase ou les chaperonines, qui aident au repliement des protines dans les cellules eucaryotes. Toutes ces protines nont pas le mme rle, par exemple il semble que la protine disulfide isomrase participe au repliement alors que les chaperones maintiennent la protine bien replie dans son tat. Par exemple la coexpression de la chaperonine GroEL en mme temps que la RuBisCo (ribulose 1,5 bisphosphate carboxylase/oxygenase) a augment le taux de RuBisCo soluble par 10. Comme autre exemple, on peut citer lexemple de la thioredoxine qui est une petite protine de 11,7 kDa restant soluble mme quand elle est exprime des taux de 40% dans la cellule. Une fusion du gne d'intrt et du gne codant pour la thioredoxine permet de diminuer la formation de corps d'inclusion.

24/10/2011

112

Utilisation dune fusion avec une protine soluble en amont. Les partenaires les plus souvent utiliss pour lexpression chez E. coli sont la glutathion-S transfrase, la maltosebinding protein et la thioredoxin. Mais dautres partenaires ont t dcrits tels que Nus An grpE, la bacterioferritine, la kinase du phage T7 ou une chaperone de E. coli, Skp (Chatterjee et Esposito, 2005).

Le fait que la protine s'agrge en corps d'inclusion a toutefois quelques avantages, elle est protge de la protolyse et elle est facile purifier. Il suffit en effet de purifier les corps d'inclusion simplement par des sries de centrifugations et de lavage du culot. Il faut ensuite dnaturer la protine puis la renaturer en faisant varier les proportions d'agent dnaturant. Techniquement, on ajoute des agents dnaturants, typiquement de l'ure ou des sel de guanidinium, des dtergents et un agent rducteur pour couper les ponts disulfures (mercaptoethanol ou DTT). Ces agents sont ensuite limins soit par dialyse dans une solution dilue pour viter les interactions entre les protines soit en bloquant la protine sur un gel d'affinit.

4) La protine est produite mais est protolyse


La plupart des protines htrologues que l'on fait synthtiser dans la bactrie sont protolyses trs rapidement (en deux minutes par exemple pour l'insuline humaine). Plusieurs solutions ont t utilises pour rsoudre ce problme : - Faire une protine de fusion constitue de la protine dsire et en amont une autre protine. Cette stratgie n'est valable que si la protolyse est due la faible stabilit des petites protines ou peptides. - Utiliser des bactries mutantes, dficientes pour certaines protases. Cette stratgies a t adopte pour les protines secrtes dans le priplasme (pour permettre les ponts disulfures) qui sont souvent peu stables. Une srie de souches portant des mutations de dficience en protases et une mutation sur le gne rpoH codant pour le facteur sigma de lARN polymrase qui contrle la transcription de certaines protases ont t fabriques

24/10/2011

113

(Meerman et Georghiou, 1994). Ces souches permettent une meilleure expression des protines, mais on ne peut pas liminer toutes les protases, soit parce quelles sont toujours inconnues, soit parce quelles sont indispensables au fonctionnement de la cellule. - Utiliser des inhibiteurs de protases, mais comme prcdemment, ces inhibiteurs sont souvent toxiques pour la cellule. Cette protolyse existe aussi dans les systmes eucaryotes. Par exemple, en traduction in vitro dans le lysat de rticulocyte, on a remarqu que la traduction des protines de petit poids molculaire (< 30 kDa) est souvent difficile. Ceci est du en partie au fait quelles sont instables dans les rticulocytes. Pour palier ce problme, le plus simple est de changer de systme de traduction et de choisir par exemple le lysat de germe de bl qui traduit aussi bien les petites que les grosses molcules. Chez les procaryotes comme chez les eucaryotes, des protines longue dure de vie coexistent avec des protines courte dure de vie. Chez les eucaryotes, la dgradation des protines courte dure de vie est sous la dpendance de lubiquitination. Dans ce systme, les protines qui seront dgrades sont tout dabord lies covalement lubiquitine, une petite protine de 76 acide amins. Cest une liaison peptidique entre la fonction carboxilique terminale de lubiquitine et, soit une fonction amine dune lysine interne, soit lamine prsente lextrmit N-terminale de la protine. Dans ce dernier cas lacide amin prsent en N-terminal est important. Ainsi, les acides amins M, S, A, G, T et V sont stabilisant (Bachmair et al., 1986).

5) Les maturations post-traductionelles ne sont pas correctes


Ce problme est vident lors de l'expression dans des systmes htrologues. La cellule hte n'est pas capable de faire une modification post-traductionelle qui normalement se produit dans le systme homologue. Lorsque la modification post-traductionelle existe dans la cellule pour les protines endogne, il arrive que la squence signal ne soit pas reconnue. Cest le cas par exemple de

24/10/2011

114

l'actylcholinestrase d'insecte : un peptide hydrophobe en C-terminal est normalement chang contre un glycolipide. Cette maturation est co-traductionnelle et a lieu dans le rticulum endoplasmique. Si on exprime cette enzyme dans l'ovocyte de Xnope, on obtient une protine avec le peptide hydrophobe et non le glycolipide l'extrmit C-terminale. L'ovocyte est capable de faire cette maturation avec d'autres protines mais n'est pas capable de la faire avec le peptide de l'actylcholinestrase de drosophile. Un moyen d'obtention de la protine proche de la protine native, naturelle, trouve chez l'insecte, est de modifier la squence primaire du peptide hydrophobe pour qu'il soit reconnu. A l'inverse, la cellule hte peut faire une modification post-traductionnelle qui n'existe pas dans la cellule. Par exemple, la MCP-1 humaine (Monocyte Chemoattractant Protein-1) est non Nglycosyle. Si on l'exprime dans Pichia pastoris ou dans Saccharomyces cerevisiae, on observe une N-glycosylation. Cette N-glycosylation augmente la masse apparente de la protine d'environ 12 kDa et peut tre identifie l'aide de la reconnaissance de la protine par une lectine, la concanavaline-A. Dans ce cas la glycosylation peut tre retire en digrant la protine par l'endoglycosidase F qui coupe la liaison asparagine/N-acetylglucosamine. Toutefois cette solution ne peut tre envisage que pour les protines qui ne sont normalement pas glycosyles en effet, si la protine est normalement glycosyle et si la cellule hte rajoute une glycosylation, celle-ci ne pourra pas tre spcifiquement retire. Le problme peut aussi provenir de la surproduction. Il y a saturation d'un systme de maturation qui ne peut pas fonctionner sur toutes les protines synthtises. On obtient alors une htrognit dans les protines produites, certaines prsentent la maturation et d'autres non. La MCP-1 humaine (Monocyte Chemoattractant Protein-1) prsente une modification l'extrmit N-terminal, qui est bloque du fait de la prsence d'un pyroglutamate. La surproduction dans Pichia pastoris donne les deux protines, une avec un pyroglutatmate et une autre avec une glutamine. L'actylcholinestrase humaine est glycosyle, mais sa surproduction en cellule de mammifre entrane une acetylcholinestrase mal glycosyle, qui manque d'acide syalique. Ce problme a t rsolu en coexprimant l'enzyme limitant, une syalictransfrase.

24/10/2011

115

Le codon d'initiation (ATG) code chez les bactries pour une N-formyl mthionine. Le groupe formyl est toujours retir mais la mthionine reste la plupart du temps. Dans le cas d'une expression faible, elle est enleve lorsque le premier acide amin est par exemple une glycine, une srine, mais il n'est jamais enlev avec d'autres acides amins tels que l'arginine. De plus lorsque la surproduction est trop importante il y a saturation de l'enzyme de maturation (mthionine aminopeptidase) et il n'y a pas de coupure. Ce n'est souvent pas important mais si a l'est, on a deux possibilits: soit traiter la protine avec la mthionine aminopeptidase, soit coexprimer cette enzyme dans la bactrie.

Par ailleurs, le fait de rester dans un systme proche du systme homologue ne garanti pas dobtenir toutes les modifications post-traductionnelles. Par exemple, certaines maturations de la protine observes chez Pseudomonas ne se retrouvent pas ou peu chez E. coli alors quil sagit de deux bactries. Parmi les maturations de la protine, il y a l'oligomrisation. Lorsqu'on ajoute un tag pour faciliter la dtection ou la purification (voir plus loin), ce tag peut favoriser des oligomerisations non attendues. C'est le cas par exemple avec les queues d'histidines rajoutes en N ou C terminal de la protine. Ces histidines favorisent la formation d'oligomres (Hom et Volkman, 1998).

6) La protine est produite mais on ne sait pas la dtecter


Dans certains cas on na pas danticorps, on ne connat pas lactivit de la protine. On a donc des difficults contrler la production ou slectionner les cellules qui produisent le plus. Une premire solution est de produire simultanment une protine marqueur. On peut lors dune production en bactrie placer le gne marqueur en aval du gne dintrt avec son propre RBS. Les deux protines seront traduites partir du mme ARN. La mme stratgie peut se faire dans les systmes eucaryotes, bien que les ARN eucaryotes soient

24/10/2011

116

monocistroniques, on peut ajouter un IRES qui fait office de RBS chez les eucaryotes. Une autre technique est de cloner le gne derrire un promoteur bidirectionnel. Dun
gne marqueur Pcmv TRE Pcmv gne dintrt

cot le promoteur rgule la production dune protine marqueur et de lautre le promoteur rgule la production de la protine dintrt. Un tel promoteur bidirectionnel peut tre

Contrle de lexpression du gne dintrt par un promoteur bidirectionnel

fabriqu autour de llment de rponse la ttracycline. Une autre technique est dutiliser un vecteur avec plusieurs promoteurs, le mme promoteur peut tre utilis deux fois dans le mme vecteur mais dans ce cas on positionne les deux copies tte-bche pour viter les recombinaisons. Une deuxime solution est dutiliser une protine de fusion, un tag (voir chapitre sur les tag)

7) La protine est produite mais on ne sait pas la purifier


On peut utiliser une fusion avec une protine dont on possde un anticorps. Aprs la production, la protine fusionne sera purifie par immunoaffinit. Les anticorps sont accrochs sur une phase fixe et la protine de fusion se trouve dans la phase mobile. Il y a accrochage de la protine de fusion par raction antigne-anticorps puis la protine de fusion est dcroche soit en faisant passer un tampon acide (pH 2.6) soit un tampon comprenant un agent dnaturant si la protine n'a pas besoin d'tre active. Parmi les anticorps disponibles, on peut citer ceux dirigs contre la -galactosidase. Plusieurs protines sont facilement purifiables et peuvent donc tre utilises en fusion pour faciliter la purification. Cette squence (tag) va permettre la protine de fusion de s'attacher sur un ligand. De plus, comme les protines utilises comme tag sont des protines qui s'expriment bien in vitro, la fusion permet souvent d'augmenter l'expression de protines qui sont faiblement produites.

24/10/2011

117

8) La protine est produite mais il existe aussi des protines proches produites par la cellule, des endognes
Plus le systme de production est proche du systme naturel, plus on a de chance que la protine soit bien produite. Mais paralllement, plus on a de chance quil y ait des endognes dans la production. La premire solution consiste sloigner du systme naturel, la deuxime solution est dutiliser un tag pour purifier la protine recombinante de lendogne.

9) Problme particulier li l'utilisation de la protine chez l'homme


Dans certains cas, la protine est destine tre inject l'homme. Il est alors important que ces cellules ne soient pas infectes par un virus. C'est arriv dans le cas de la production de vaccin contre la polyomlyte prpar dans des cellules de singe. On s'est aperu plus tard qu'elles taient infectes par SV40.

24/10/2011

118

TAG, protases et acides amins modifis


Les TAG
Ce sont des protines ou des peptides qui permettent la production, la dtection, la stabilit et la purification aise des protines recombinantes lorsqu'elles sont ajoutes en fusion la protine d'intrt. Elles permettent souvent une meilleure production, en effet l'expression d'ARN messager eucaryote dans E. coli se heurte de nombreux problmes dus en particulier la mauvaise initiation de la traduction. Si la protine de fusion est place en amont de la protine d'intrt, on aura normalement une bonne initiation de la traduction. La surexpression de protines dans E. coli s'accompagne souvent de formation de corps d'inclusion dans lesquels la protine surexprime est mal replie. La fusion avec une autre protine qui se replie correctement aide souvent avoir une protine bien replie. La protine de fusion joue alors le rle de chaperonne intramolculaire. Elles permettent la dtection de la protine de fusion. En effet on dispose d'anticorps pour les protines de fusion mais de plus certaines d'entre elles sont des enzymes qui peuvent tre dtectes par leur activit. Elles permettent une stabilisation de la protine. Les petits peptides sont rapidement dgrads chez E. coli. Un des moyens pour viter cette dgradation est donc de les produire en fusion.

Les TAG les plus utiliss : - Epitopes: Des petites squences, d'une dizaine d'acides amin, sont ajoutes gnralement lune des deux extrmits de la protine, plus rarement lintrieur. Ces squences sont reconnues par des anticorps monoclonaux. Ceci permet de localiser la protine sur des filtres, de la quantifier par ELISA ou de la purifier aprs immunoaffinit

24/10/2011

119

avec un anticorps spcifique. On utilise des pitopes pour lesquels on dispose d'anticorps trs efficaces et trs spcifiques qui n'ont pas de crossractivit dans le systme utilis. Il existe plusieurs squences et les anticorps correspondants commercialiss - Xpress : DLYDDDDK (invitrogen) - c-myc : EQKLISEEDL (invitrogen). Lanticorps a une trs bonne affinit pour ce tag, il est donc principalement utilis pour la dtection de la protine de fusion. - FLAG : DYDDDDK (sigma). Lanticorps na pas une trs bonne affinit, il est principalement utilis pour la purification de la protine de fusion, en effet la liaison anticorps-antigne peut facilement se dissocier (Hopp et al., 1988). Pour certains anticoprs, la liaison tag-anticops peut tre rompue par lajout dEDTA ce qui est assez pratique pour les purifications. - V5 : GKPIPNPLLGLDST (In vitrogen) - HA : YPYDVPDYA de l'hmagglutinine d'Influenza : (Roche Molecular Biochemicals) - pitope de la protine C : 12 acides amins (Roche Molecular Biochemicals) L'anticorps prsente l'avantage de ne se fixer qu'en prsence de calcium, ce qui permet d'luer la protine de fusion en prsence d'EDTA. - T7 : MASMTGGQQMG, anticorps disponible chez Abcam (http://www.abcam.com) Staphylococcus protein A (Nilsson et Abrahmsen, 1990). S-tag : KETAAAKFERQHMDS ce peptide a une forte interaction avec la protine S qui drive de la RNAse A (Karpeisky et al. 1994). La liaison est trs forte et gnralement llution est obtenue soit pH2 ou en coupant la jonction entre les deux proteines.

- Lac Z : Si la squence est insre en amont de LacZ en fusion. LacZ garde son activit. Il est donc possible de faire une protine bifonctionelle, ayant les deux activits, en amont la protine d'intrt et en C-terminal l'activit -galactosidase. La fusion dans l'autre sens n'est pas possible, il faut que l'extrmit C-terminale de la -galactosidase soit libre pour garder son activit. Cette fusion permet en outre de suivre la protine lors de la purification.

24/10/2011

120

- La calmoduline-binding peptide (Stofko-Hahn et al., 1992). Cette protine trs acide prsente une forte affinit pour certains peptides en prsence de calcium. - La maltose binding protine (MBP) de E. coli peut tre purifiable sur une colonne d'amylose et lue avec du maltose. La fusion est gnralement effectue en C-terminal de la MBP, si bien que le peptide signal de la MBP permet de plus d'adresser la protine de fusion dans le priplasme (Guan et al., 1988). - Les interaction streptavidine-biotine sont trs utilises en biologie. Un peptide de 10 acides-amins qui interagit fortement avec le site de liaison de la biotine de la strptavidine a t slectionn partir d'une banque de peptides, le "strep-tag" (Schmidt et Skerra, 1993). Ce peptide a t amlior pour donner le strep-tag II (WSHPNFEK). La strpetavidine a une affinit de 3,5 M pour ce peptide. Pour amliorer cette affinit, un peptide plus long, le SBP (Streptavidin Binding Peptide,
MDEKTTGWRGGHVVEGLAGELEQLRARLEHHPQGQREP) a t isol. Laffinit de la

streptavidine pour ce peptide est de 2,5 nM (Keefe et al., 2001). Une deuxime stratgie a consist slectionner un peptide de 13 acides amins qui est facilement biotinyl dans E. coli par BirA, l'enzyme endogne de biotinylation chez E. coli. (Schatz, 1993). Dans les deux cas les protines comportant le peptide mimant la biotine ou le peptide biotinyl peuvent tre purifies par affinit sur la streptavidine. - La glutathion S-transfrase de shistosome. Cette protine catalyse la raction entre un tripeptide, le glutathion (Glu-Cys-Gly) et un substrat lectrophile. Si on utilise un seul substrat, on n'a pas de mtabolisation mais uniquement fixation du glutathion sur la glutathion S-transfrase. Cette proprit a t exploite pour fabriquer des chromatographies d'affinit en bloquant du glutathion sur la phase fixe. La glutathion transfrase s'accroche sur le glutathion fix sur la colonne et est dcroche en ajoutant du glutathion au tampon. L'avantage de cette protine est son activit enzymatique quil est possible de suivre. Ainsi, on peut connatre au cours de la production la quantit de protine produite, sans avoir besoin de faire de gel (Smith et Jonhson, 1988).

24/10/2011

121

- Thioredoxine de E. coli (LaVallie et al., 1993). La purification des protines de fusions avec la thioredoxine utilisent les proprits de la thiordoxine qui peut tre extraite des bactries par choc osmotique et qui est rsistante la chaleur. De plus, un mutant prsentant une srie d'histidine sa surface a t construit ce qui permet une purification sur colonne de nickel. - Les queues homopolymriques. Plusieurs essais ont t effectus, une queue polyarginine permet la purification de la protine sur une rsine d'change de cation (Saasenfeld et Brewer, 1984). Une polyarginine permet en outre daccrocher la protine sur le verre, toutefois ce tag est moins performatnt que le Si-tag. Une queue polyaspartate permet la purification sur rsine changeuse d'anions, une queue de phnylalanine permet la purification sur colonne d'hydrophobicit de type phnyl spaharose et une queue poly-cystine permet la purification sur thiopropyl-spharose. Dans ce dernier cas, on accroche la protine par une liaison covalente et on l'lue soit l'aide de cystine soit en ajoutant un agent rducteur tel que le dithiotreitol (Persson et al., 1988). La queue homopolymrique actuellement la plus populaire est une queue histidine ou HIS-tag, ce qui cre un site de haute affinit pour les cations divalents tel que le nickel ou le cobalt. La protine qui a un tel site s'accroche sur colonne d'affinit de Ni et se dcroche spcifiquement en ajoutant de l'imidazole la phase mobile. Cette squence de 6 histidines peut se fusionner aux extrmits N ou C terminal de la protine ou tre incorpore dans une protine de fusion. Par exemple dans le cas d'une fusion avec la thioredoxine, protine servant solubiliser les protines recombinantes produites dans E. coli, la mutagense de deux rsidus (acide glutamique et glutamine) en histidine produit un amas d'histidine confrant la protine une bonne affinit pour le nickel. Lavantage de cette fusion est que la squence rajoute est petite. Cette technique est actuellement la plus populaire principalement parce que ce tag est petit et priori va moins perturber la fonction de la protine (Van Dyke et al., 1992). Les histidines ne sont pas ncessairement la suite lune de lautre, il faut simplement quelles soient proximit. Le tag peut donc se modliser sur la structure tridimentionelle de la protine. Par ailleurs certains

24/10/2011

122

commerants proposent des tags hybrides comme le HQ tag (HQHQHQ) qui a les mmes proprit quun tag HHH, une affinit pour le nickel. - Le Si-Tag : En slectionnant les protines batriennes qui saccrochent sur le verre puis en les identifiant par spectrographie de masse, on a trouv que la protine ribosomale L2 de E. coli a une forte affinit pour les silicates. Une analyse par deletion a ensuite permis didentifier deux domaines non structurs de la protine qui intrragissent avec le verre, un domaine N terminal correspondant aux acides amins 1-60 et un domaine C-terminal correspondant la squence 203-273. En fusion avec la protine dintrt, ce tag permet de fixer la protine sur des lames de verres utilises par exemple lors de llaboration de puces protines (Taniguchi et al. 2006). - Le domaine de liaison la cellulose, domaine de la cellulase de la bactrie clmostridium cellulovorans peut tre utilis comme Tag (Shpigel et al., 1998). La protine de fusion est purifie sur colonne de cellulose. Le principal avantage par rapport aux autres protines est le faible cot de la colonne daffinit utilise. Les protines fluorescentes : La Green fluorescent protein (GFP) a t isole de la mduse Aequorea victoria, elle met de la lumire verte lorsqu'elle est excite en UV (Prasher et al., 1992). Diffrents variants plus efficace ou mettant diffrentes longueur donde ont t gnrs par mutagense. GFPuv se replie plus facilement que la GFP et a un rendement de fluorescence GFPmut1 contient deux mutations (F64L et S65T) son rendement de GFP+ combine les mutations de GFPuv et de GFPmut1 ce qui lui donne une LEGFP est un variant optimise pour lexpression en cellules eucaryotes. 16 fois plus importante que la GFP (Crameri et al., 1996). fluorescence est 35 fois suprieur celui de la GFP (Cormack et al., 1996). augmentation de 130 fois par rapport la GFP (Scholz et al., 2000).

24/10/2011

123

La HcRed a t gnre par mutagense partir dune protine non fluorescente du corail, Heteractis crispa. Elle met dans le rouge. Ces protines gardent leurs proprits de fluorescence en fusion N ou C terminale. En fusion, elle permet donc la dtection et la localisation de la protine dans les cellules. La DsRed a t isole de Discosoma sp. (Baird et al., 2000), elle peut tre excite 488 nm comme la GFP mais met dans le rouge 583 nm (la GFP mt 500 nm. Son expression a t amliore par optimisation des codons pour donner la DsRed1. Elle prsentait un dfaut important, sa maturation prenait trop longtemps elle avait une demie vie suprieure 24 heures. La vitesse de maturation a t amliore et la DsRedT4 ainsi obtenu a une demie vie de maturation infrieure 45 minutes (Bevis et Click, 2002) Les protines fluorescences sont principalement utilises pour localiser les protines de fusion dans les cellules ou dans les tissus. - Les protines colores : La Coulour-Tag-protein absorbe dans le jaune parce quelle contient du FAD. Cest une proteine petite (100 acide amins) soluble et stable (produit par X-Zyme). - Le domaine de liaison de la chitine (Chitin-binding domain, CBD) de la chitinase A1 de Bacillus citrulans. La forte affinit du domaine de liaison la chitine pour les billes de chitine permet de bien purifier la protine de fusion, en effet la colonne peut tre lave avec un tampon de forte force ionique (1M NaCl) pour retirer les liaisons non spcifiques. On dcroche la protine avec des agents dnaturants tels que du SDS (>0.5%) ou des sels de guanidium (6M). - Tetracystine : Les protines portant le motif CCXXCC lintrieur dune hlice o XX est nimporte quel acide amin peuvent tre color par un driv arsnique de la fluoresceine (FlAsH-EDT2, 4,5-bis(1,3,2-dithioarsolan-2-yl)fluoresceine). Ce compos rentre facilement dans les cellules et se lie au Tag avec une forte affinit (10 pM) donnant

24/10/2011

124

une fluorescence verte (Griffin et al., 1998). On peut aussi utiliser un driv arsenique de la resorufine (ReAsH-EDT2). Ce compos prsente lavantage dmettre dans le rouge ce qui permet de faire des expriences de pulse-chase avec la FlAsH-EDT2. De plus le ReAsH-EDT2 peut tre utilise pour photoconvertir la diaminobenzidine en un compos insoluble permetttant de dtecter la protine en microscopie lectronique (Graham et Karnovsky, 1966).

Les protases
Souvent on veut enlever des fusions entre deux protines aprs une expression in vitro et purification. Dans ce cas, on intercale entre les deux protines une squence qui va coder pour un site de coupure. La coupure peut tre chimique par exemple en utilisant le bromure de cyanogne qui coupe au niveau des mthionines ou l'acide iodosobenzoique qui oxide les tryptophane. Ces mthodes marchent bien mais on obtient des coupures des endroits autres que la jonction, problme qui empire avec la taille de la protine exprime. On peut utiliser une mthode enzymatique, des protases spcifiques d'une squence. - L'enterokinase reconnat et coupe la squence Asp-Asp-Asp-Asp-Lys/ - La thrombine reconnat et coupe la squence Leu-Val-Pro-Arg-/-Gly-Ser. Selon le positionnement de la fusion l'extrmit N ou en C terminale, on obtiendra deux ou quatre acide amins. - Le facteur Xa coupe en C-terminal de la squence de reconnaissance Ile-Glu-Gly-Arg/ - Les TEV protinase (Tobacco Each Virus Proteinase) reconnat la squence Glu-X-XTyr-Gln/ avec X symbolisant n'importe quel acide amin. Cette protase a l'avantage d'tre trs spcifique de son site de coupure et de ne pas tre inhibe par les inhibiteurs de protase srine (Parks et al., 1994).

24/10/2011

125

Il y a plusieurs dsavantages l'utilisation de protases. la coupure n'est pas toujours spcifique et on peut couper la protine d'intrt. La temprature assez haute ncessaire la coupure peut affecter la stabilit de la protine d'intrt. La coupure est souvent inefficace du fait de l'inaccessibilit du site de coupure dans la protine de fusion. Aprs la coupure, il faut retirer la protine de fusion, qui va s'accrocher sur la colonne d'affinit ayant permis la purification. La protase est retire par exemple en utilisant une protase biotinyle qui va s'accrocher sur une colonne de streptavidine agarose.

Intein
On peut utiliser des protines qui sont capables d'autocoupure. C'est le cas par exemple des sites d'pissages des protines pour lesquelles on trouve des inteins (quivalent aux introns) et des exteins (quivalent aux exons). Ces pissages ont t trouvs chez des bactries msophyles et thermophyles ainsi que chez la levure. Chez cette dernire, les diffrentes tapes de l'pissage
SH H N 2 H N 2 N-extein O NH 2 intein S H N 2 N-extein O SH

cys
O intein

SH

cys
C -extein CO 2

NH

NH NH 2 O

Asn

N-S change
SH O NH NH 2 O C -extein CO 2

Transestrification
N-extein O

ont t dcrites. On trouve une cystine au site donneur et une asparagine et une cystine au site accepteur. Il y
SH

S O NH 2 intein NH NH 2 C-extein CO 2

Clivage
H N 2 N-extein

a tout d'abord un change entre l'azote de la liaison peptidique et le soufre de la cystine suivi d'une transestrification entre les deux cystines. Il y a ensuite coupure petidique associe la formation d'un driv succinimidique et enfin un nouvel change entre l'azote et le soufre (Chong et al., 1996).

O NH 2 intein

S + NH NH 2 C -extein CO 2

O SH

N-S change
O intein H N 2 NH 2 O O N-extein

SH O NH C -extein CO 2

NH 2

Exemple de mcanisme dpissage dune intine.

24/10/2011

126

Ce mcanisme a t dcrit pour les levure, chez les archobactries, il est peu prs quivalent, la cystine est seulement remplac par un autre nuclophile, une srine.

Pour obtenir une coupure, on peut utiliser une intine mute au site accepteur. La cystine du site accepteur est alors remplace par un nuclophile prsent dans le milieu (DTT, mercaptoethanol, cystine...). la protine d'intrt est alors place en N du site donneur et la coupure par addition du
HN 2 protine d'intrt HN 2 protine d'intrt O HN 2 protine d'intrt O

SH

NH

intein

Tag

N-S change S

NH 2

intein

Tag

HSCH CH OH 2 2

HS
S + O

CH OH 2

NH 2

intein

Tag

nuclophile sur la colonne d'affinit on obtient une lution de la protine dsire. (Chong et al., 1997)
HN 2

H O 2

protine d'intrt O

OH

24/10/2011

127

De la mme faon, on peut utiliser le clivage en N et C terminal de l'intine en mutant le site accepteur (Chong et al., 1998). En mutant le site
SH

accepteur

His-Asn/Cys

en

Gln-Asn/Ala,

tag H N 2 proteine 1 O NH intine

O NH NH 2 O protine d'intrt CO 2

linduction de la coupure en N-terminal par des thiols induit le clivage en C-terminal. Dans un tel systme le tag est positionn dans une boucle de linteine. Lors de la production on obtient une fusion protine 1 - N terminus de lintine - tag - C
H N 2 proteine 1 H N 2 proteine 1

S O NH 2 tag intine O NH NH 2 O protine d'intrt CO 2

SHS
DTT

OH OH

O OH S HS OH

SH tag O

terminus de lintine - protine dintrt. Aprs induction la protine de fusion est accroche sur une colonne daffinit. Laction de thiols (cystine, DTT ou b-mercaptoethanol) relarge la

NH 2

intine

NH
O

protine d'intrt

NH2

CO 2

protine 1 et la protine dans le milieu. Ce systme a principalement pour avantage de profiter de la haute traductibilit de la protine 1. Si cette protine 1 est assez petite, elle peut tre ensuite limine par dialyse.

Les acides amins modifis


Comment introduire une sonde dans les protines un site spcifique ? Une premire technique consiste muter lacide amin par une cystine puis modifier cette cystine une fois incorpore dans la protine. On peut substituer un acide amin par un analogue structural en utilisant une souche auxotrophe (van Hest et al., 2000). On peut utiliser une stratgie non sens . Le but est ici davoir dans la cellule un aminoacyl tRNA non sens coupl lacide amin non naturel. Un codon ambre est ajout lemplacement dsire. Il y a deux possibilits pour fabriquer un aminoacyl-tRNA : on peut aminoactyl un tRNA suppresseur in vitro (Noren et al., 1989) ou on peut ajouter dans la bactrie une aminoacyl tRNA synthetase modifie qui ajoute un aminoacid non naturel (Wang et al., 2001).

24/10/2011

128

24/10/2011

129

Purification des protines recombinantes

Dtermination de la concentration en protine


Pour suivre une purification, on a besoin de connatre la concentration des protines dans lchantillon et dvaluer la puret. Toutes les mthodes de dtermination de la concentration dune solution en protine sont relatives, en effet elles dpendent de la composition en acide amin qui nest pas connue dans le cas dun mlange de protines. Traditionellement, on utilise comme rfrence lalbumine de serum de veau (BSA), on fait une courbe talon avec cette protine puis on value la concentration de la solution. La BSA sera prpare dans le mme solvant, le mme tampon que lchantillon pour dtecter dventuelles interfrences. Les mthodes les plus utilises sont labsorption en UV et labsorption dans le visible aprs raction avec un colorant.

La spectrophotomtrie UV
Mesure 280 nm. Les tryptophanes et la tyrosine absorbent 280. La mesure est donc fortement dpendante de la prsence de ces deux acides amins dans la protine. Mesure 205 nm. La liaison peptidique absorbe 181-194 nm, mais cette longueur donde ne peut pas tre utilise du fait de laborption de loxygne. Aussi, on effectue les mesures 205 nm mais cette mthode est assez dlicate utiliser, il faut en effet avoir des cuvettes de quartz trs propres.

La fluorimtrie
On peut utiliser la fluorescence intrinsque de la protine en utilisant la fluorescence des tryptophanes avec une excitation 280 nm et une mission 340 nm.

24/10/2011

130

Les mthodes colorimtriques


Le cuivre Dans des conditions alcalines, les ions cuivre (II) se lient lazote des protines pour donner une coloration qui absorbe 540-560 nm (violet). La premire mthode dite Biuret est peu spcifique et peu sensible (on dtecte des concentrations de lordre de 1mg/ml). Elle a t amliore en y ajoutant le ractif de Folin-Ciocalteau (mthode de Lowry) qui colore la protine en bleu. La sensibilit est de lordre de 100g/ml. Un autre additif a t lacide bicinchoninic. Les colorants Le coomassie (colorant de Bradford) est le plus utilis, la liaison du colorant sur les arginines et les acides amins aromatiques entrane un dplacement de labsorption de 465 nm (rouge) vers 595 (bleu). Ce colorant est un des plus populaire du fait de la facilit de sa mise en uvre. Dautres colorants peuvent tre utiliss, le rouge ponceau, lorange G ou lamino black principalement parce leur liaison est peu forte. Largent Les protines se lient largent, cet essai est trs sensible mais en parallle est aussi trs sensible de nombreux autres composs (les anions, lEDTA, le SDS, les agents rducteurs tels que le mercapthanol) aussi, il nest utilis que lorsque la protine est en trs faible quantit et quil ne faut pas la gcher uniquement pour dterminer sa concentration.

24/10/2011

131

Solubilisation des protines


Extraction des protines cellulaires
Pour aboutir la purification d'une protine, il faut tout d'abord prparer l'extrait qui contient cette protine. Si la protine est intracellulaire, on doit passer par une tape de solubilisation : on casse les cellules et on libre les protines en solution. Pour casser les cellules, on a notre disposition diffrentes mthodes : choc osmotique lyse des parois par mthode enzymatique, on utilise par exemple le lysosyme pour dissoudre la paroi des bactries Gram+. broyage laide dun homogniseur lames ou dun potter. choc par pression (French Press) ultrasons billes de verre (pour les levures)

Aprs sparation par ultrafiltration ou centrifugation, on obtient un extrait clarifi. Parfois les protines sont membranaires et il est difficile de les solubiliser. On peut alors utiliser un dtergent qui, par interactions hydrophobes, va solubiliser la protine. Mais il faut faire attention car un dtergeant trop fort peut inactiver la protine Le solvant Les protines ne sont solubles que dans une gamme de pH plus ou moins grande selon les protines. De mme les protines ne sont souvent pas solubles faible force ionique. Aussi, le pH et la force ionique doivent tre maintenus constants en utilisant une solution tamponne. On caractrise un tampon par son pKa (pKa = -log Ka) AH+ <-->A- + H+ Ka = [A-][H+] / [AH] BH+ <--> B + H+ Ka = [B][H+] / [BH+]

24/10/2011

132

Relation Handerson - Hassenbach pH = pKa + log [base] / [acide] Le pouvoir tampon d'une solution est maximum au pKa. Le tampon est efficace dans la zone pKa-1/ pKa+1. Quelques pKa : Actate : 4,76; Succinate : 5,64; Glycine : 9,8. Les protines s'inactivent rapidement par dnaturation (perte de stucture tertiaire) par raction chimique (oxydation)ou par protolyse (coupure des liaisons peptidiques). Pour rsoudre cela : on travaille basse temprature, on limine les catalyseurs permettant l'oxydation en ajoutant de l'EDTA qui complexe les mtaux qui sont ncessaires l'oxydation et on peut ajouter un agent inhibiteur comme le Mercaptothanol (sil ny a pas de ponts disulfures dans la protine) -

on ajoute des inhibiteurs des protases on ajoute des stabilisants comme le polyol. On travaille loin du pI de la protine

Cas particulier des protines thermostables : Les protines thermostables comme par exemple la taq DNA polymrase sont stables haute temprature, au dessus de 80C. Si on exprime une protine thermostable dans un organisme msophyle comme E. coli, la protine thermostable se trouve mlange des protines thermosensibles. Pour purifier la protine thermostable il suffit de chauffer lextrait 80C, les protines thermosensibles se dnaturent et prcipitent. A la suite dune centrifugation, on obtient la protine thermostable pure. On peut utiliser cette technique pour purifier des petites protines recombinantes en les fusionnant une protine thermostable. Comme elles sont petites, la fusion naffecte pas la stabilit thermique de la protine thermostable et la fusion peut se purifier en dnaturant les autres protines.

24/10/2011

133

Solubilisation et renaturation des corps dinclusion


Un cas particulier est la purification des corps dinclusion lors de la production de protine dans E. coli. En effet dans certains cas, on observe laccumulation de protine dans des corps non solubles. Ces agrgats sont visibles en morphologie, leur rfringence permet de les voir en microscopie de contraste e phase. Ils ont t appels corps dinclusion. Les protines composant les corps dinclusion sont gnralement mal replies et prsentent un excs de feuillet . Ce sont gnralement des intermdiaires de repliements qui se sont agrgs avant que le repliement soit fini (Mitraki et King, 1989). Lorsquil y a des cystines, des ponts disulfure non correct se sont forms entre les chanes peptidiques. La technique de purification consiste alors purifier ces corps dinclusion par centrifugation ou par filtration sur filtre de 0,45 m. Les corps dinclusions sont alors lavs en ajoutant de lEDTA, des dtergents non dnaturants tels que le Triton X-100 ou le desoxycholate ou des dtergents dnaturants faible concentration. Cette opration de lavage des corps dinclusion a pour but dliminer les protines solubles, prsentes dans le surnageant qui sont limines par centrifugation ou filtration. Les corps dinclusion sont alors solubiliss en utilisant gnralement soit lure soit le chlorure de guanidinium, cette solubilisation correspond leur dnaturation. On peut utiliser une concentration de dnaturant qui dnature que partiellement la protine, la renaturation sera souvent plus facile. Dans ce dernier cas, on recherche la concentration minimale qui permet la solubilisation. Pour purifier la protine dintrt on peut effectuer une solubilisation diffrentielle des protines. En effet, une premire solubilisation une faible concentration dagent dnaturant ne solubilisant pas la protine recombinante permet dliminer les protines non dsires. Il faut le plus souvent ajouter un agent rducteur tel que le dithiotreitol (DTT) ou le mercaptoethanol pour rduire les ponts disulfures non natifs ou viter quils ne se forment lors de la solubilisation.

24/10/2011

134

Dans certains cas on peut remplacer la solubilisation par lure ou les sels de guanidium par une solubilisation laide pH extrmes. Ainsi des protines de fusion de la maltose binding protein peuvent tre dissous laide de 20% acide actique (Reddy et al., 1998). Cependant, les pH extrmes peuvent entraner des coupures de la protine ou des modifications chimiques des rsidus. Les dtergents comme le sodium dodecylsulfate (SDS) ou le bromure de n-cetyl trimetylammonium (CTAB) peuvent parfois tre utiliss faible concentration. Lavantage dans ce cas est que le plus souvent, la solubilisation ne saccompagne pas de dnaturation de la protine et donc dune perte de son activit. Les ultrasons sont parfois efficaces pour solubiliser les corps dinclusion, ici encore, la protine nest pas dnature.

Le repliement de la protine est ensuite effectu par limination de lagent dnaturant soit par dialyse, par diafiltration soit en accrochant la protine sur une colonne daffinit. Ce repliement de la protine savre souvent difficile voir impossible. Il y a plusieurs recettes pour russir la renaturation. Il faut diluer la solution pour viter les relations entre les protines partiellement non renatures et donc exposant des surfaces hydrophobes. On ajoute gnralement du glutathion pour changer les oxydo-rductions une concentration avoisinant les 10 mM. Il est utilis sous forme rduite (GSH) et oxyd (GSSG). Le glutathion a pour rle de favoriser les changes de ponts disulfures et ainsi dviter la stabilisation de ponts disulfures mal placs. lajout de ligand (cofacteurs, mtaux, hmes, inhibiteurs) dans certains cas favorise la renaturation De nombreux additifs sont utiliss pour faciliter la renaturation sans toujours savoir leur mode daction. Ainsi la L-arginine (0,5-1 M) est souvent utilise. Des dtergents (SDS, CTAB, Triton X-100) amliorent parfois le repliement des protines. On peut ajouter des molcules qui vont favoriser le repliement tels que des molcules switterioniques portant un groupement sulfobetaine comme groupement hydrophile et un groupement hydrophobe (Chong et Chen, 20000). Des chaperones et des foldases sont parfois utilises, elles sont

24/10/2011

135

dans ce cas utilises sous forme insolubles, lies des billes dagarose pour pouvoir les liminer facilement la fin de la renaturation.

24/10/2011

136

La concentration des protines


Par prcipitation : Pour concentrer les protines on utilise souvent la prcipitation par augmentation de la force ionique (salting out). Les protines sont solubles dans l'eau car leurs surfaces hydrophiles prsentent des interactions avec les molcules d'eau. Le sel interagit avec l'eau, si la concentration en sels augmente, on pompe l'eau de la solution et il y a moins d'eau disponible pour les protines. Elles forment des agrgats en interagissant par leur partie hydrophobe. Quand la taille de l'agrgat est suffisante, il y a prcipitation. Le sel le plus utilis est le sulfate dammonium. A 70% de la saturation, on prcipite pour ainsi dire toutes les protines (La saturation est la solubilit dans l'eau 20C. 100% correspond environ une concentration de 4 moles/litre). Dune manire gnrale, les protines ne sont pas dnatures par cette prcipitation. Comme toutes les protines ne prcipitent pas avec la mme facilit, on peut faire des prcipitations avec diffrentes concentrations de sulfate dammonium. Toutefois comme cette mthode dlicate et peu rsolutive nest plus que rarement utilise. Pour quelques protines, on peut utiliser des solvants organiques tels que lactone ou lthanol. Mais lutilisation de ces solvants organiques est limite, en effet ils occasionnent souvent une dnaturation irrversible de la protine. Par filtration : Pour rduire le volume de la solution, la mthode la plus utilise est l'ultrafiltration. On soumet la solution protique l'action d'une filtration; la taille des pores du filtre doit tre telle que les protines doivent tre retenues. Il existe plusieurs systmes, le plus simple utilise un boudin de dialyse, la solution est lintrieur du boudin et lextrieur on place un polymre absorbant tel que l aquacide . Leau comme les petites molcules passent par les pores du boudin, les protines restent lintrieur. On utilise souvent des filtres pour concentrer les protines, pour les volumes importants, on cre un courant sur le filtre pour viter les colmatages, on parle alors dultrafiltration tangentielle.

24/10/2011

137

Ajout de tampon (pour la diafiltration)

chantillon

Pince serre

pompe membrane pore de 10 kDa

Ultrafiltration tangentielle
Les diffrentes mthodes de sparation des protines
On peut utiliser deux grands types de mthodes pour sparer les protines, la chromatographie et llectrophorse. Certaines mthodes seront utilises pour purifier alors que dautres seront plutt utiliser pour vrifier la puret de la solution.

La chromatographie
La chromatographie est une technique de sparation qui utilise une colonne contenant un support qui possde plusieurs proprits. On distingue plusieurs tapes 1 Rgnration et quilibrage de la colonne avec le tampon. 2 Charge de la solution protique 3 Lavage avec le tampon. On utilise tout dabord le tampon de charge et au besoin successivement plusieurs tampons qui vont dcrocher des protines contaminantes.

24/10/2011

138

4 Elution : elle peut se faire en ajoutant directement le tampon dlution, en faisant un gradient entre le tampon de lavage et le tampon dlution. Ce gradient peut tre continu ou discret. Types de matrice et de pression Il existe diffrents types de supports : cellulose, sephadex. Si on applique une pression leve on augmente la rsolution. On effectue alors une Chromatographie Liquide Haute Performance (HPLC).

Llectrophorse
La technique consiste faire migrer les protines dans un gel. Le gel le plus utilis est un gel dacrylamide. L'acrylamide est un monomre, en prsence de radicaux libres (en gnral persulfate d'ammonium stabilis par le TEMED), une raction
CH2 CH C NH CH2 NH C CH 2 CH O O

CH2

CH C O NH2

en chane est initialise et on obtient un polymre. Si la raction est faite en prsence de N. N'mthylenebisacrylamide, on a formation d'un rseau de mailles plus ou moins serres en fonction de la concentration de l'acrylamide.

+ persulfate d'ammonium + temed

CH2

CH CH2 CH CH2 CH C O C O C O NH2 NH 2 NH 2

Bisacrylamide

On obtient donc un gel dont les largeur des mailles dpend des concentrations en acrylamide et bisacrylamide de dpart.

24/10/2011

139

Sparation selon la taille


Dialyse Son principe est de mettre la solution dans un boudin de dialyse qui lui-mme se trouve dans un tampon dpourvu de sels. Le boudin de dialyse est constitu dune membrane qui laisse passer les petites molcules. Les boudins les plus couramment utiliss laissent passer les molcules qui prsentent un poids molculaire infrieur 10 kDa, mais il existe des boudins avec dautres seuils de coupure, soit plus faibles (3 kDa) soit plus importants (30, 50 ou 100 kDa). Par un phnomne de diffusion, les sels vont sortir du boudin jusqu' atteindre l'quilibre entre la concentration dans le boyau et la concentration dans le tampon. On effectue plutt plusieurs dialyses successives quune dialyse dans un grand volume. Filtration sur gel Le principe est de faire passer la solution de protine dans un gel constitu de billes creuses, les petites molcules passent par lintrieur des billes et font donc un chemin plus long que les grosses molcules qui ne passent pas par lintrieur des billes. Cette mthode est aussi utilise comme dessalage pour liminer les sels dune solution ou pour changer le tampon. Ultrafiltration La solution est filtre sur une membrane ayant un seuil de coupure correspondant des poids molculaires de 1 100 kDa. Le filtrat ne contient donc que des petites molcules et, si la solution ne passant pas par la membrane est dilue plusieurs fois avec le tampon, elle ne contient que des molcules de grande taille. Cette mthode est plutt utilise pour les grands volumes. Ultracentrifugation Les protines sont spares en fonction de leur vitesse de sdimentation dans un milieu visqueux, gnralement une solution concentre de saccharose. Les protines les plus grosses sdimentent plus

24/10/2011

140

vite que les molcules plus petites. Lultracentrifugation ne permet de sparer que de petits chantillons, cest donc une mthode analytique.

Sparation selon la charge


On spare les protines selon leur charge. Les protines sont des polylectrolytes, ainsi, un pH donn, chacun des groupements ionisables sera dans un tat d'ionisation donn (en fonction du pKa). Le pI est le pH auquel la charge globale de la protine est nulle. Si pH < pI, la molcule est positive. Si pH pI, la molcule est ngative. Ainsi, selon la charge du support et sa propre charge, la protine va interagir ou pas avec le support. On utilise la chromatographie dchange dion.

Types de groupements changeurs dions Echangeurs danions Echanges de cations Carboxy-mthyl (CM) Phosphate (P) Sulfothyl (SE) Sulfopropyl (SP) Dithyl-amino-thyl (DEAE) Trithyl-amino-thyl (TEAE) Quaternary-amino-thyl (DEAE)
C COOH2

O PO3H2C C SO3H2 H2
CH2 C C SO3H 2 H2

(CH2)2

(C2H5)2

(CH2)2
(CH2)2

+
+

(C2H5)3
(C2H5)3

CH2. CH. CH3 OH

Si on est pH 7, les protines dont le pI > 7 ne seront par retenues sur une changeuse danion mais seront retenues par une rsine changeuse de cation

24/10/2011

141

Llution seffectue gnralement en augmentant la force ionique, laide dun gradient de sel. Elle peut aussi se faire en faisant varier le pH de la solution, mais dans ce cas on passe souvent par un pH dnaturant pour la protine. On peut utiliser llectrofocalisation. Il sagit dune lectrophorse qui permet de focaliser les protines dans une rgion du gel qui correspond leurs points isolectriques. Pour avoir un gel avec un gradient de pH, on ajoute des ampholines qui sont des polymres avec des groupements ionisables. La protine va migrer jusqu'au niveau de pH qui correspond son pI. Cette mthode est trs utilise car elle est trs rsolutive : elle spare les isoenzymes qui sont trs proches en squence d'acides amins. Llectrofocalisation ne permet pas de sparer une grande quantit de protine. Cette mthode a t adapte la chromatographie et a pris le nom de chromatofocalisation.

Sparation selon la taille et la charge


On utilise une lectrophorse sur gel de polyacrylamide en condition native. Etant donn que l'on applique un courant lectrique sur le gel, les protines vont migrer en fonction de leur taille et de leur charge. Le gel agit comme un tamis qui va plus retenir les grosses molcules que les petites. La majorit des protines est charge ngativement et vont donc migrer vers le ple positif. Ces gels sont appels natifs car la protine garde son activit.

Sparation selon lhydrophobicit


Chromatographie: On utilise un support qui contient un greffage hydrophobe et qui peut donc interagir avec les protines hydrophobes. On connat deux types de support : - groupement aliphatique, la longueur des chanes amine peut varier (C4->C10). Ex : le butyl sepharose est un greffage en C4. - noyau aromatique : phenyl sepharose.

24/10/2011

142

Ces supports retiennent les protines par interaction hydrophobe. On charge la colonne en prsence de sel car il favorise les interactions hydrophobes ((NH4)2 SO4 1M). L'lution peut se faire soit en diminuant la concentration en sels soit en ajoutant un dtergent qui solubilise les interactions hydrophobes. Sparation de phase. Le triton X-114 est soluble dans leau basse temprature (4C) mais la solubilit est fortement diminue plus haute temprature (35C). Les protines hydrophobes ayant plus daffinit pour le dtergent que pour leau, on les retrouvera prfrentiellement dans la phase dtergente. La mthode consiste donc prparer une solution de TX-114 sature en eau haute temprature, ajouter lchantillon, abaisser la temprature pour favoriser les contacts entre les protines et le TX-114. La solution est alors chauffe 37C, et centrifug pour sparer les deux phases.

Sparation selon laffinit

Site actif On fixe sur le support un ligand dont on sait qu'il a une forte interaction avec la protine que l'on cherche purifier. L'lution peut tre non spcifique (augmentation de la force ionique) ou spcifique (lution avec le ligand libre - il y a alors comptition et fixation de la protine sur ce ligand libre; le ligand libre est enfin limin par dialyse). L'avantage de cette dernire mthode est qu'elle ne fait pas appel aux proprits physico-chimiques qui peuvent tre communes plusieurs protines mais la spcificit : en une seule tape, on a une meilleure purification qu'avec l'change d'ions ou la chromatographie hydrophobe. Il faut videmment avoir une certaine connaissance de l'enzyme. Exemple de chromatographie daffinit avec des tag : Glutathion-S-transfrase : llution se fait en rajoutant du glutathion dans le tampon Strep-tag : llution est obtenue en ajoutant de la desthiobiotine

Modification post traductionnelle.

24/10/2011

143

On peut trier des protines glycosyles des protines non glycosyles en utilisant une lectine fixe sur une colonne. Une lectine est une protine qui a une forte affinit pour les sucres. En utilisant une lectine qui reconnat un sucre composant les structures glycosyles des protines, on peut accrocher les protines glycosyles sur la colonne et les luer en utilisant le sucre dans la phase mobile. Une des lectines les plus utilise est la concanavaline A qui reconnat le mannose.

Squence primaire Certaines les squences peuvent tre reconnues par des ligands. Par exemple, queues homopolymriques dhistidine peuvent tre purifies avec des colonnes de Nickel ou de Cobalt. Llution est obtenue avec une solution contenant de limidazole ou avec une solution dEDTA. Cette mthode
Protine Nickel Matrice

propose en 1975 par Porath et al., est

actuellement une la mthode de purification la plus populaire. Le cobalt est quelquefois prfr au nickel, parce que la liaison est moins sensible au -mercaptoethanol et parce que le cobalt forme quatre liaisons avec les histidines au lieu de deux pour le Nickel ce qui rend laffinit plus spcifique.

Structure tertiaire On peut immobiliser un anticorps spcifique de la protine purifier sur une colonne en utilisant soit la protine A soit un ligand compos de sulfone thioeher (thiophilic resin). Lorsque lon fait passer un extrait sur cette colonne, les autres protines ne seront pas retenues : cette technique est donc spcifique. Cependant, l'interaction antigne/anticorps est tellement forte qu'il est ensuite difficile de les sparer : les constantes de dissociation sont comprises entre 10-6 10-12. L'lution est donc problmatique. La seule manire de les dissocier serait de baisser fortement le pH (jusqu' 2) mais ce pH l, l'enzyme peut tre dnature. A faible pH on dissocie la liaison Anticorps/protine A si bien quon obtient les anticorps avec la protine dsire. Pour viter cette colution de lanticorps, il faut fixer de manire covalente lanticorps sur la protine A.

24/10/2011

144

Sparation par des colorants


Elles ressemblent une chromatographie d'affinit mais sont moins spcifiques. Bleu de cybacron : on la tout dabord utilis comme chromatographie daffinit pour purifier les protines ayant un site de reconnaissance du NAD. Comme de nombreuses protines sont retenues par le bleu de cybacron, on sen est servi pour purifier un grand nombre de protines. L'lution s'effectue grce un gradient de sels.

Evaluation de la puret
Si la protine purifier a une activit enzymatique, on peut la suivre dans les tapes de purification grce cette activit, et quantifier le rendement de chaque tape en calculant lactivit spcifique, activit observe/ concentration en protine. Mais ce nest gnralement pas possible, et on estime le plus souvent la puret dune protine par un gel dnaturant. On utilise les proprits du sodium duodecyl sulfate (SDS), cest un dtergent anionique qui dnature les protines en se fixant sur les zones hydrophobes. Il se fixe en moyenne 1.4 g de SDS par gramme de protine. Les protines sont dnatures. Etant donn que les protines deviennent toutes charges positivement cause de cette interaction, elles ne vont plus migrer en fonction de leur quantit de charge mais seulement en fonction de leur taille. Il existe deux types de gel : Le gel de sparation qui permet la sparation selon la masse molculaire. Le gel de concentration qui a une teneur plus faible en polyacrylamide, ce qui va permettre une migration plus rapide. On aura donc des bandes plus fines et donc une meilleure rsolution. Le gel de concentration est gnralement coul au-dessus du gel de sparation. Avant dtre charg sur le gel les protines sont dnatures en rajoutant du SDS 1% avec du Mercaptothanol (10mM pour couper les ponts disulfure), puis par chauffage 1 3 minutes 100C. C'est le test de puret le plus utilis car il est fiable et simple.

24/10/2011

145

Comme plusieurs protines peuvent migrer la mme place dans un gel SDS, on peut augmenter la sparation en effectuant une lectrophorse bidimensionnelle. C'est une association des mthodes d'lectrofocalisation et d'lectrophorse en conditions dnaturantes. On ralise une premire tape d'lectrofocalisation, puis, 90, une tape en gel SDS, ainsi, deux protines qui ont le mme pI vont pouvoir tre spares selon leur poids molculaire.

Pour colorer les protines sur le gel, il faut les fixer sur le gel. Pour cela on les traite l'acide actique. La coloration se fait ensuite par : le bleu de Coomassie : seuil de dtection : 1 10 g; le nitrate d'argent : seuil de dtection : 10 100 ng.

Caractrisation des protines


Taille et masse : Il existe plusieurs mthodes pour estimer la taille ou la masse dune protine, ces deux notions sont souvent prises lune pour lautre puisquil existe une relation linaire entre la masse molculaire dune protine et sa taille, du moins pour les protines globulaires. . - Electrophorse en condition dnaturante : La solution contenant la protine est chauffe en prsence de SDS ce qui a pour effet de dnaturer la protine et en prsence de 2-mercaptoethanol pour rduire les ponts disulfures. On effectue ensuite un lectrophorse en prsence de SDS, a cot de marqueurs, cest dire de protines dont on connat la masse. Cette mthode permet de sparer des peptides de 5 200 kDa. - Electrophorse en grandient dacrylamide en condition native. On prpare un gel dacrylamide concentration variable, par exemple de 4 40%.. dans un tampon loign du point isolectrique de la protine de faon ce quelle soit charge. En appliquant le courrant lectrique, la protine migre jusqu ce que la maille du gel soit petite. La migration est donc longue, de lordre de 16 heures et la protine nest pas dnature. Comme pour lelectrophorse en condition dnaturante, des marqueurs sont dposs en parallle pour avoir un calibration. Cette mthode permet de sparer des protines de 50 kDa 1000 kDa. - La centrifugation zonale utilise le fait quun protine de gros poids molculaire sdimente plus rapidement quune protine de petit poids molculaire. On dpose la solution de protine sur solution de saccharose puis on centrifuge plusieurs heures a grande vitesse pour avoir une acceleration de lordre de 100 000 g. On rcupre ensuite les fractions le long du tube de centrifugation. La migration correspond une vitesse de sdimentation et est exprim en Svedberg (S). La calibration

24/10/2011

146

est effectue en ajoutant dans lchantillon des protines qui sont rvles par leurs activits enzymatiques. La centrifugation analytique est une amlioration de la centrifugation zonale en effet, la migration de la protine dans le tube est suivie au cours de la centrifugation grce leur absorbtion 280 nm. - La chromatographie dexclusion (SEC, size exclusion chromatographie) utilise le fait quune protine de grosse taille ne passe pas travers les pores dune bille, alors quune protine de petite taille passe par les pores et est donc ralentie. Les grosses molcules passent les premires et les petites sont chromatographies. Il existe plusieurs tailles de pores pour pouvoir analyser des protines de 10 kDa 1000 kDa. Selon la pression utilise en tant que vecteur de migration, on parlera de chromatographie basse pression de FPLC ou dHPLC. Plus la pression est importante, moins il y ade diffusion et plus la rsolution est bonne. . - Diffusion de la lumire statique (Static light scattering, classical light scattering, total intensity scattering) : La lumire reue par un objet est diffus selon un angle qui dpend de sa taille. Pour cette technique, on envoie un faisceau lumineux sur un cahntillon et on mesure sa diffusion plusieurs angles. - Diffusion de la lumire dynanique (Dynamic Light Scattering, DLS ; Correlation photon spectroscopy). Plus un objet est petit plus sa vitesse de diffusion est importante. Si on mesure la diffusion de la lumire au cours du temps on peut estimer la vitesse de diffusion dun objet et ainsi estimer sa taille ou plus exactement son rayon hydrodyanique. - La microspcopie permet de voir des objers de tailles suprieurs 10 nm. Pour les grosses protines ou pour les complexes de protines, on peut utiliser la microspcopie lectronique ou la microscopie de champ proche (AFM, atomic force microspcopy) - La spectromtrie de masse permet destimer la masse de la protine. Cette technique est utilise pour des protines jusqu 50 kDa. - La structure trimentionelle des protines peut tre rsolue par diffraction des rayons X dans un cristal ou par RMN en solution. Cette structure, lorsquelle est entirement rsolue nous donne la taille et la masse de la protine.

24/10/2011

147

Stabilisation des protines


Trois raisons principales sont gnralement mises en avant pour expliquer la dnaturation des protines : 1- La protine perd son activit via un mcanisme monomolculaire de dnaturation physique. Des interactions non-covalentes qui la maintiennent sous sa forme native sont remplaces par les liaisons non covalentes qui la maintiennent sous une forme dnature. Une chane polypeptidique peut prendre de nombreuses conformations et une seule dentre elle correspond ltat natif. Dans certains, la conformation native est la seule, la dnaturation est alors rversible, par contre dans les autres cas, il existe plusieurs conformations possibles qui correspondent des tats inactifs, la dnaturation est alors irrversible. 2- Cette mauvaise conformation expose des rgions hydrophobes la surface de la protine. Les rgions hydrophobes de diffrentes molcules ragissent entre elles et forment des agrgats. Environ la moiti des rsidus prsents dans une protine ne sont pas polaires, ils sont soit enfouis dans le cur de la protine ou alors ils forment la surface de la protine des rgions qui jouent un rle dans les interactions avec les autres protines, avec les lipides constituants les membranes ou avec les polysaccharides. Cependant, le contact des rsidus hydrophobes avec les molcules deau est thermodinamiquement dsavantageux et est prjudiciable pour la stabilit des protines in vitro. 3- De nombreux groupes fonctionnels sur les protines sont ractifs et donc susceptibles chimiquement modifis. Loxidation est la voie majeure de dnaturation des protines lors de leur stockage. Les sites doxidation potentiels dans les protines sont les chanes latrales des mthionines, cystines, histidines, tryptophane et tyrosines. De plus il peut y avoir hydrolyse des liaisons peptidiques Asp-X, destruction des ponts disulfures, et dsamidation (Ahern et klibanov, 1986).

24/10/2011

148

Stabilisation des protines par lutilisation dadditifs.


Lajout de stabilisateurs dans les formulations de protines est la mthode la plus commune pour augmenter la demi-vie des protines. Ces composs sont souvent choisis dune manire empirique, leffet obtenu est variable et dpend des caractristiques de chaque protine. On peut augmenter la diffrence dnergie libre entre ltat natif et ltat dnatur. Pour cela on utilise des osmolytes. Les osmolytes agiraient en augmentant plus le potentiel chimique de la forme dnature que celui de la forme native, Ainsi les osmolytes augmentent la diffrence dnergie de Gibbs (G) entre les formes natives et dnatures (Arakawa et al., 1990). Dans le diagramme dnergie, G1 est la diffrence dnergie entre la forme native (Naq) et la forme dnature (Uaq) en solution aqueuse et G3 est la mme diffrence osmolytes en prsence dosmolyte. plus le Les augmentent potentiel
G1 G2 Uaq Nos Naq G4 G3 Uos

chimique de la forme dnature (G2) que celui de la forme native ((G4). Il y a trois grande classes dosmolytes, i) les polyols tels que le sucrose, ii) les methylamines telles que la sarcosine iii) certains acides amins tels que la proline. On utilise par exemple la L-arginine (Lin et al., 2001), la L-proline, la L-serine, la glycine, lacide gamma amino-butyrique, la btaine. La trimethylamine N-oxide (TMAO) est un osmolyte naturel qui compense leffet dltre de lure qui est prsent la concentration de 400 600 nM dans les cellules des lasmobranches (Baskakov et al., 1998). On peut stabiliser la conformation des protines par un mcanisme dexclusion prfrentiel ou dhydratation prfrentielle due au rseau de liaisons hydrognes dans la couche dhydratation de la protine. Les molcules gnrent une cage autour de la protine en excluant la couche dhydratation et ainsi en liminant les molcules deau actives proximit de la protine. On utilise des polymres comme la BSA (albumine), le Poly-LHistidine, le Poly-L-Arginine, le dextran, le Ficoll et polyethylene glycol. Des sucres tels que le saccharose, le trehalose (dimre de glucose lis en alpha 1.1) ou le glucose (Krest et

24/10/2011

149

al., 1999 ; Felix et al., 1999). Des compos naturel comme lectoine quon trouve souvent dans les bactries halophyles (Lippert et Galinski, 1992). Les sels peuvent tre caractriss par leur pouvoir de structuration de leau, effet Hofmeister. Les sels kosmotropes qui strucurent leau, stablisent les protines en favorisant une structure plus compacte. Ainsi, le chlorure de sodium, le phosphate de sodium, le borate de sodium ou le formate de sodium ou Na2SO4 sont stabilisant du fait de leur pouvoir dhydratation des protines (Bowie et Sauver, 1989 ; Weijers et Vant Riet, 1992 ; Ahmad et al., 2001 ; Ebel et al. 1999). Dun autre cot, les sels chaotropes tels que KSCN, CaCl2 ou MgCl2 augmentent la tension de surface et ainsi dstabilisent la structure des protines (Arakawa et Timasheff, 1982). On peut stabiliser les protines en diminuant les modifications chimiques des rsidus. Le saccharose peut diminuer la vitesse doxydation des rsidus mthionine. Si la mthionine est implique dans le site actif, le saccharose protgera lactivit de la protine (De Paz et al., 2000). Le poly(ethyleneimine) (PEI) est un polycation qui est un des meilleur protectant contre loxidation. LEDTA est un agent chlateur qui protge contre loxidation mdie par des traces dions mtallique (Andersson et al., 2000). Le sorbitol inhibe compltement la deamidation des rsidus de la protine.

Stabilisation des protines par mutagense dirige


Il existe plusieurs mthodes pour stabiliser une protine en modification de sa structure primaire. Une premire mthode consiste effectuer de la mutagne alatoire puis cribler les mutants les plus stables (Morawski et al., 2001). Une deuxime mthode consiste effectuer des mutagenses diriges. Pour trouver les rsidus muter, deux informations peuvent tre utilises, les donnes structurales et les donnes phylogntiques. Dans ce deuxime cas, la comparaison des squences de plusieurs espces peut tre une source dinformation pour la mutagense. Il est par exemple habituel de comparer des protines despces msophile et thermophiles, le problme est quelles diffrent de nombreuses positions (Molk et al., 2001 ; Jiang et al., 2001, Perl et al., 2000).

Stabilisation des hlices


Il existe plusieurs mthodes pour stabiliser les hlices alpha dans une protine.

24/10/2011

150

Une solution consiste ajouter une triade de rsidus chargs Arg(+)-Glu(-)-Arg(+) espacs des intervalles i,i+4 ou i,i+3 dans la chane peptidique (Olson et al. 2001). Une autre solution consiste changer les glycine en alanine. Les rsidus glycine sont les moins frquents dans les hlices , juste aprs les prolines. Cette proprit a t remarque par des tudes statistiques comme par des tudes thermodynamiques. Lalanine stabilise l hlice de plus de 2 kcal/mol par rapport la glycine et lalanine a une forte prfrence thermodynamique pour un environnement hlicodal (ONeil and DeGrado, 1990). Ainsi, la substitution de glycine en alanine dans les hlices augmente la stabilit des protines (Chakrabartty et al., 1991, 1995; Munoz et al., 1994; Pace et al., 1998; Hecht et al., 1986; Ganter et al., 1990 ; Margarit et al., 1992, Blaber et al., 1995 ; Predki et al., 1995). On peut aussi ajouter un cap lextrmit N-terminale de la protine le plus souvent en ajoutant une serine lextrmit et un glutamate la position 3 pour tablir une liaison hydrogne. Enfin, certains sites peuvent aider calculer la stabilit dune hlice : http://www.emblheidelberg.de/Services/serrano/agadir/agadir-start.html

Stabilisation par rigidification du squelette


Pour fixer la structure tertiaire on peut ajouter des prolines dans les boucles. Stabilisation par cration de ponts Ponts disulfures : on peut introduire des liaisons covalentes en crant des ponts disulfures. Thoriquement, lintroduction dun lien intramolculaire dcrot lentropie de la protine dnature (Flory, 1956), dstabilisant ainsi ltat dnatur et stabilisant thermodynamiquement la protine. De nombreuses protines telles que le lysozyme (Johnson et al.,1978, Ueda et al., 1985 ; Wetzel et al., 1988 ; Matsumura et al., 1989), des RNases (Lin et al., 1984, Futami et al. 2000), la subtilisine (Pantoliano et al., 1987) ont t stabilises en ajoutant des liaisons covalentes soit par des moyens chimiques soit par des moyens gntiques. Cependant, lintroduction de liaison covalentes peut aussi entraner une inactivit de la protine.
-

Les ponts salins : limportance des ponts salins a t suggr par Perutz et Raitz en 1975. Les protines thermostables provenant dorganismes thermostables ont gnralement plus de ponts salins que leurs homologues provenant dorganismes msophiles et de nombreuses expriences

24/10/2011

151

de mutagense dirige ont montr leur importance dans la stabilit des protines. La force dun pont salin est estime 3-5 kcal mol-1. Cependant le rle stabilisant des interactions electrostatiques est controvers et dpend fortement de la position de linteraction. Les ponts lintrieur de la protine sont plus favorables que les ponts lextrieur (Dao-pin et al., 1991) et les interactions ioniques la surface de la protine peuvent mme avoir un effet dstabilisant. Les liaisons hydrogne stabilisent les protines. Des mutations occasionnant une perte dune liaison hydrogne sont souvent trouves dans les mutants thermosensibles produisant des protines stabilit rduite (Grutter et al., 1987) et une tude rcente (Pace et al., 2001) a montr que le remplacement des tyrosines en phnylalanine dstabilise habituellement les protines. Ainsi, les liaisons hydrogne entre groupes polaires lintrieur des protines sont plus favorables que les interactions similaires avec leau dans les protines dnatures. La stabilit due une liaison hydrogne a t estime 1,3 kcal/mol et lintroduction de nouveaux ponts hydrogne augmente la stabilit de la protine (Peterson et al., 1999).

Stabilisation par mutagense des rsidus exposs au solvant :


On peut remplacer les rsidus Asp et Glu qui ont des liaisons hydrognes exposes au solvant par des rsidus isostriques neutre, Asn or Gln (Irun et al., 2001). Lexposition des chanes latrales hydrophobes au solvant entrane une variation dnergie libre dfavorable en diminuant lentropie du solvant. Certains rsidus hydrophobes peuvent tre moins exposs au solvant dans ltat dnatur que dans ltat natif. Pour ces rsidus, il y a un effet hydrophobe inverse qui soppose au repliement. Ainsi, des mutations qui remplacent des rsidus exposs au solvant par des rsidus hydrophobes peuvent augmenter la stabilit de la protine (Pakula et Sauer, 1990).

Stabilisation par ajout de sites de glycosylation


La glycosylation est une des modifications post-traductionelles les plus importantes. Les chanes de sucre sont lies soit lazote dune asparagine soit loxygne dune srine ou dune thronine. La N-glycosylation seffectue la squence Asn-X-Ser or Asn-X-Thr (Kaplan et al., 1987). Lefficacit de la glycosylation dpends de lacide amin la position X, elle est impossible lorsquil y a une

24/10/2011

152

proline et relativement inefficace lorsque X est un tryptophane, un aspartate ou un glutamate (ShakinEshleman et al., 1996). Cette modification est co-traductionelle et la structure de loligosaccharide est modifie durant la translocation de la protine du rticulum endoplasmique vers la membrane. La plupart des protines sont glycosyles ds que la chane polypeptidique entre dans le rticulum endoplasmique, cependant la glycosylation ne prcde pas ncessairement le repliement. La stabilisation peut tre augmente par addition de site de N-glycosylation (Khanna et al., 2001). Cette mthode est valable uniquement pour les protines qui sont produites en cellules eucaryotes. Il semble que la glycosylation dcrot la dnaturation irrversible et non la dnaturation rversible (Tams et Welinder, 2001).

Stabilisation par mutagense des rsidus internes


On peut stabiliser les protines en re-empaquetant leur cur hydrophobe. Cette stratgie a donn de bons rsultats pour des protines qui avaient des dfauts de repliement vidents (Finucane and Woolfson,1999), des rsidus charg lintrieur (Waldburger et al., 1995) ou des cavits qui peuvent tre remplies par des acides amins avec des rsidus plus encombrants. Cette stratgie a t appele cavity-filling strategy (Baldwin et al., 1996 ; Ohmura et al., 2001).

Stabilisation par limination des rsidus ractifs


Linactivation thermique des protines provient de certains acides amins : aspartate, asparagine et cystine. Lasparagine est sujet une damidation, elle peut tre remplac par des rsidus qui ont des proprites proches (Gln, Ile ou Thr). La prsence daspartate conduit la coupure de la liaison peptidique, il peut tre remplac par un glutamate.

24/10/2011

153

Analyse des interactions entre macromolcules Interactions acides nuclique-protine


I - Techniques permettant de dterminer la (les) protine(s) qui se fixe(nt) sur un acide nuclique cible (ADN ou ARN) : I 1 : Criblage de banque dexpression :
Il sagit dutiliser la trs classique technique de criblage dune banque dexpression, le criblage se faisant ici avec un oligonuclotide double brin marqu radioactivement. Les clones exprimant la protine interagissant avec cet ADN seront donc reprs aprs autoradiographie du filtre.
Banque d ADNc clone dans un vecteur dexpression Transformation chez E. coli Etale sur bote Transfre sur filtre (nitrocellulose ou nylon) Lyse les bactries -> les protines de chaque clone bactrien se fixent sur le filtre Bloque (ADN double brin non spcifique) Ajoute la sonde (ADN double brin marqu au 32P) Repre les clones positifs Rcupre ces clones sur la bote de ptri Squence lADNc de ces clones -> identification du partenaire

Une alternative cette technique consiste utiliser des phages lytiques de type lambda afin dviter les tapes de lyse des bactries.

I 2 : Simple Hybride
Cette technique est drive de la technique du double hybride. Elle permet

didentifier de nouvelles protines interagissant avec un fragment dADN connu et daccder


directement leur ADNc

de vrifier une interaction entre une squence dADN et une protine dtudier les nuclotides et/ou acides amins impliqus dans linteraction.
Bien sr, la stratgie exprimentale choisie variera lgrement en fonction de ce que lon veut faire. Comme pour le double hybride, on travaille chez la levure.

24/10/2011

154

Principe : Si la protine X se lie sur la squence cis rgulatrice E, il y aura activation de la transcription du gne rapporteur. Si on fait pousser les levures ayant reu ce vecteur sur un milieu en prsence de X-gal, les colonies obtenues seront bleues.

A X

Gne rapporteur R t

E : Elment cis rgulateur - squence ADN cible tester X : protine dont on teste linteraction avec la squence E soit une banque d ADNc soit un ADNc dune protine connu A : domaine protique activateur transcriptionnel (par exemple celui de Gal4) Gne rapporteur - par exemple celui de la galactosidase Afin damliorer le rendement de lactivation transcriptionnelle, la squence cible E est rpte plusieurs fois. Tout comme dans les cas du double hybride, un double systme de slection ( galactosidase et un gne dauxotrophie) est en gnral utilis.

Afin damliorer le rendement de lactivation transcriptionnelle, la squence cible E est rpte plusieurs fois. Tout comme dans les cas du double hybride, un double systme de slection ( galactosidase et un gne dauxotrophie) est en gnral utilis. Particularit des ARNs

Triple hybride

24/10/2011

155

Le systme triple hybride permet la dtection dinteractions ARN-protine dans la levure en utilisant un test phnotypique simple. Le principe est le mme que celui du double hybride mais, ici, un ARN adaptateur est utilis en plus. Cet ARN est une molcule hybride qui prsente :

une partie correspondant un ARN connu interagissant avec une protine connue (ex. ARN
MS2/protine de lenveloppe de MS2)

une partie correspondant lARN tester.


La protine verte est, soit la protine tester pour son interaction avec lARN, soit la transcription/traduction dune banque dADNc.

LARN hybride est produit partir de la transcription dun plasmide qui prsente lADN correspondant sous la dpendance dun promoteur inductible (Pmet25 par ex.). D. SenGupta, B. Zhang, B. Kraemer, P. Prochart, S. Fields and M. Wickens. 1996. A three-hybrid system for detecting RNA-protein interactions. Proc. Natl. Acad. Sci. 93, 8496-8501

24/10/2011

156

Mthode de Belasco (Jain et Belasco, 1996)


Le principe est semblable celui du simple hybride mais les interactions se font chez E. coli (et non chez la levure) et linteraction se fait directement avec lARN (et non par lintermdiaire de protines comme dans le cas du triple hybride). La squence dARN tester est introduite (sous la forme dun ADN double brin) en amont dun site de fixation du ribosome (RBS) lui-mme en amont dun gne galactosidase. Lensemble est port par un plasmide portant la rsistance lampicilline (plasmide reporter). Si linteraction entre la protine tester et notre ARN cible se fait, laccs du ribosome au RBS sera empch et il ny aura pas de traduction de la galactosidase. Si, par contre, linteraction ARN/protine ne se fait pas, le ribosome se fixera sur le RBS et la traduction de la galactosidase pourra se faire. La prsence de galactosidase sera vrifie en prsence de X gal.
Squence tester
Promoteur
RBS ATG

galactosidase

ADN

transcription
RBS AUG

galactosidase

ARNm

traduction
Il y a interaction entre la protine tester et l ARN Il n y a pas interaction entre la protine tester et l ARN

ribosome
RBS AUG

galactosidase

RBS

AUG

galactosidase galactosidase

X Gal

X + Gal

24/10/2011

157

Le plasmide rapporteur est donc cotransform avec une banque dADNc clone dans un vecteur dexpression portant la rsistance au choramphnicol. Les bactries transformes sont alors slectionnes sur des boites en prsence dampicilline, de chloramphnicol et de X gal. Si la bactrie porte un plasmide dexpression avec un ADNc correspondant une protine qui fixe notre squence dARN, la bactrie sera blanche. Le cas chant, la bactrie sera bleue. On rcupre donc les bactries blanches, on extrait les plasmides quelles portent et on squence lADNc quelles contiennent. Il sagit de lADNc dune protine interagissant avec notre ARN.

N.B. Il faut utiliser des bactries LacZ, cest dire des bactries dltes pour le gne codant pour la galactosidase.
Jain C. & Belasco G. (1996) A structural model for the HIV-1 Rev-RRE complex deduced from altered-specificity Rev variants isolated by a rapid Genetic Strategy. Cell, 87; 115-125

South-Western
Cette mthode permet de caractriser des protines se liant sur un ADN cible. On peut aussi par cette mthode cartographier leurs sites de liaison (Lelong et al., 1989). Les protines sont spares sur un gel dnaturant (gel SDS-PAGE ou gel 2D) puis renatures en prsence dune faible concentration en ure et transfres sur nitrocellulose par diffusion ou encore directement lectrotransfre sur nitrocellulose. Dans ce dernier cas elle se renaturent durant le transfert. LADN tester est marqu radioactivement ses extrmits et incub avec la membrane de nitrocellulose. Les fragments dADN spcifiquement lis la protine teste peuvent tre lus de chaque complexe ADN-protine, et analyss aprs amplification par PCR. LADN peut tre : un fragment de restriction un oligonuclotide (double ou simple brin un fragment PCR, Si au lieu de faire migrer de lADN sur le gel, on fait migrer des ARN, la mthode prend le nom de North-Western (Kwon et al., 1993).

24/10/2011

158

II - Techniques permettant de dterminer la cible (ADN ou ARN) dune protine : II 1 : Technique du Selex
La technique de SELEX (Systematic Evolution of Ligand by Exponential Enrichment), encore appele mthode de slection in vitro, est une technique qui permet le tri simultan dun mlange complexe (plus de 1015 molcules dARN ou dADN (simple ou double brin) pour une caractristique particulire (ici la liaison avec une protine). Nous ne prsenterons ici que le SELEX ralis sur des ADN cibles double brin.

Principe : Tout dabord, un mlange doligonuclotides est synthtis. Ces oligonuclotides sont composs dune vingtaine de nuclotides alatoires (25 dans lexemple ci-dessous) encadrs par deux squences constantes partir desquelles se feront les PCR. Au moins 1015 molcules doivent tre synthtises pour avoir des chances davoir un pool suffisamment dgnr.

5 TGGGCACTATTTATATCAAC (N25) AATGTCGTTGGTGGCCC-3


Ces oligonuclotides simples brins sont fabriqus par synthse chimique. Une fois le premier brin ralis, le deuxime est fabriqu en hybridant un oligonuclotide complmentaire de la rgion 3 constante : 5GGGCCACCAACGACATT

5 TGGGCACTATTTATATCAAC (N25) AATGTCGTTGGTGGCCC-3 TTACAGCAACCACCGGG-5


On fabrique alors le deuxime brin laide de polymrase de Klenow en prsence de dNTP.

5 TGGGCACTATTTATATCAAC (N25) AATGTCGTTGGTGGCCC-3 3 ACCCGTGATAAATATAGTTG (N25)TTACAGCAACCACCGGG-5

La polymrase de Klenow (encore appele grand fragment de l ADN polymerase I d E. coli), est frquemment utilis la place de cette dernire chaque fois que l on ne dsire

24/10/2011

159

pas avoir l activit 5' -> 3' exonuclease de cette dernire. Il a t initialement t produit par protolyse partir de l enzyme pleine taille. La protase utilise pour cela est la subtilisine.

Aujourdhui, ce fragment est exprim directement dans la bactrie (E. Coli) partir du gne tronqu de lADN polymrase I Parmi ce pool doligonuclotides dgnr, la slection des molcules interagissant avec la protine tester se fait par chromatographie daffinit, gel retard ou liaison sur filtre. Chromatographie daffinit ou techniques drives : la protine cible est taggue, biotinyle ou on possde un anticorps dirig contre cette protine. On peut alors faire une chromatographie daffinit, un pull-down ou une Co-immunoprcipitation Parce que le pool prsente au dpart une trs faible proportion de molcules dADN capables dinteragir avec la protine appt, plusieurs cycles de slection sont ncessaires. Une amplification par PCR des fragments isols est ralise aprs chaque round de slection. Oligonuclotides utiliss dans notre exemple pour la PCR :

5 TGGGCACTATTTATATCAAC TTACAGCAACCACCGGG-5
Plusieurs cycles successifs de slection/amplification vont nous permettre daugmenter de faon exponentielle labondance dans le mlange des squences fonctionnelles, jusqu avoir une majorit de ce type de squences. La stringence des tampons utiliss pour linteraction augmente chaque cycle.

24/10/2011

160

Clonage et squenage

Aprs chaque cycle de PCR, on vrifie par gel retard (EMSA) que lon a bien augment laffinit du pool doligonuclotides pour notre protine. Enfin, on aligne (par bioinformatique les squences obtenues -> squence consensus)

A Analyse par gel retard de linteraction de la protine X avec les ADN obtenus lors des premiers cycles de SELEX, B : alignement des squences obtenues par bioinformatique, C : squence consensus A Cycles SELEX 0 1 2 3 4 5

II-2 : Immunoprcipitation de chromatine

24/10/2011

161

Le ChIP (Chromatin ImmunoPrecipitation) consiste purifier des complexes ADN-protines, forms in vivo et lis de faon covalente par du formaldhyde.

Principe de la Technique :
Les protines cellulaires sont lies de faon covalente l'ADN par un traitement au formaldhyde. L'ADN est ensuite cliv en fragments denviron 500 pb par sonication. La protine d'intrt est immunoprcipite, l'ADN sur lequel elle tait lie rcupr et analys (par exemple par PCR comme sur le schma ci-dessous.

Avantage :
Cette technique est ralise sur des cellules vivantes Cette technique ncessite de trouver les conditions idales d'immunoprcipitation, de cross-

Inconvnients :
link mais aussi de fragmentation de l'ADN. Le choix des oligonuclotides utiliss pour la PCR est galement important. Il faut avoir un anticorps trs spcifique et prsentant une bonne affinit pour sa protine cible et que la protine tudie soit exprime dans la cellule en quantit suffisamment importante. On peut dtourner ces derniers inconvnients en utilisant une protine taggue et surexprime mais, dans ces conditions l, on sloigne de l in vivo .

Mthode :

24/10/2011

162

Fixation au formaldhyde, sonication et immunoprcipitation


Le formaldhyde est une petite molcule de 2 Angstrm, cest un agent de liaison qui va permettre de produire un lien in vivo la fois acides nucliques protines et protines protines . Le formaldhyde est un compos dipolaire trs ractif dans lequel les atomes de carbones agissent comme des centres nuclophiles. Les groupements amines et imines des acides amins (Lysines, Arginines et Histidines) et de lADN (Adnines et Cytosines) ragissent avec le formaldhyde pour former une base de Schiff. Cet intermdiaire peut alors ragir avec un second groupe amin et se condenser pour donner le complexe ADN-protine final. Ces ractions se mettent en place in vivo en quelques minutes aprs lajout de formaldhyde sur les cellules vivantes. La raction est totalement rversible. Cette raction est ralise par protonation du groupe imino faible pH dans un milieu aqueux. Un autre paramtre qui doit tre considr lors de la mise au point des conditions de fixation est le fractionnement du matriel fix. La sonication est une des possibilits (avec la digestion par les endonuclases) pour solubiliser le matriel fix, en particulier la chromatine. Pour lidentification et la caractrisation in vivo des ADNs cibles dune protine donne, aprs immunoprcipitation de la chromatine crosslinke , lADN est purifi puis analys par les techniques conventionnelles telles que le southern blot, le squenage, lhybridation sur puces et lanalyse par PCR. De telles analyses demandent llimination de toutes les protines de la fraction chromatine immunoprcipite. Pour cela, le cross-link est rvers par chauffage en solution aqueuse (65C, au moins 4 heures) on peut en plus traiter la protinase K pour liminer les protines puis lADN est purifi par des mthodes standards (par exemple par une partition phnol/chloroforme/eau, suivi dune prcipitation lthanol).

2) Mthodes danalyses
- Analyse par PCR : Si on a une ide des rgions chromosomiques sur lesquelles la protine tudie a pu se fixer, on peut raliser une analyse par PCR. Pour cela, on va dessiner des oligonuclotides qui shybrident de par et dautre de la squence tester (squence sur laquelle on pense que sest fixe la protine tudie) puis on ralise une PCR laide de ces amorces afin de tester la prsence du fragment dADN correspondant parmi les fragments prcipits. Si la protine tait sur cette rgion de lADN, il y aura amplification par PCR, sinon, on naura pas damplification.

24/10/2011

163

- Analyse par southern-blot Les fragments dADN immunoprcipits sont marqus (ventuellement aprs LM-PCR) puis hybrids par southern blot. Ce nest bien sr pas un gnome total que lon a fait migrer sur le blot mais seulement diffrents fragments dADN que lon veut tester. - Hybridation sur chip - ChIP on chip ou ChIP to chip Dans lexprience appele ChIP to chip , tous les fragments dADN co-immunoprcipits avec la protine dintrt sont amplifis. Ceci est ralis en ajoutant par ligation des linkers classiques sur les extrmits des fragments dADN rpars (LM PCR). Le matriel amplifi est alors hybrid une puce dADN (DNA microarray) portant les sondes appropries fragments dADN gnomique ou correspondant des squences promotrices. Ces expriences sont ralises avec deux marquages, la deuxime couleur correspondant lADN total comme contrle (Input). Chaque ADN enrichi par limmunoprecipitation est enregistr comme un site de liaison potentiel pour la protine tudie.

24/10/2011

164

Types de puces souvent utiliss : Les puces gnomiques : portent lensemble du gnome plutt utilises pour des organismes peu complexes (levure, drosophile). Point fort : on crible lensemble du gnome Points faibles : la rsolution est mauvaise (de lordre de 0.5 mga base), on ne peut voir que des rgions dinteraction et non des sites. Beaucoup de faux positifs.

Les puces promoteurs :


Point fort : peu de faux positifs. Permet de dterminer lidentit du gne concern Points faibles : ne portent que les promoteurs proximaux, or, on sait que des squences rgulatrices trs importantes sont en dehors de ces rgions. Ce type darray nexiste que pour quelques organismes modles.

Clonage puis squenage

24/10/2011

165

Laddition dun linker permet lamplification de la banque et le clonage des diffrents fragments dans un vecteur dexpression.
Clonage

Squ enage

Cette technique est srement la plus valable de toutes. Cependant elle est trs lourde et onreuse mettre en place. En effet, le nombre de clones squencer pour avoir une bonne ide de lensemble des sites de fixation est trs important (on estime le nombre de clones squencer environ 100 000 pour lanalyse des sites dinteraction dans un gnome humain).

SAGE applique au squenage de fragments dADN gnomiques obtenus aprs immunoprcipitation de chromatine.

24/10/2011

166

Amlioration de la technique : les PET (Paired End Tags). Ici, on veut squencer les extrmits de chaque fragments obtenu par ChIP afin davoir une signature parfaite de chaque fragment squenc. Les fragments dADN immunoprcipits sont clons dans un plasmide contenant le site MmeI de part et dautre du site dinsertion.

24/10/2011

167

Ces plasmides sont alors digrs MmeI, digrs pour les rendre bord franc puis referms par ligation. On ralise enfin la concamrisation de ces fragments ralise aprs les avoir isols par digestion BseRI.

Avantage de cette technique : on obtient alors, en squenant juste quelques nuclotides des extrmits de chaque fragment, une ide exacte de lensemble du fragment.

24/10/2011

168

Si on obtient plusieurs fragments correspondant un site de fixation, on peut les aligner ce qui nous permettra de prciser le site dinteraction.

Une alternative au ChIP : DamID


Les expriences dimmunoprcipitation de chromatine ntant pas toujours ralisables (en particulier si on na pas danticorps immunoprcipitant dirigs contre notre protine, une alternative cette technique a t imagine. Cette technique consiste fusionner la mthylase Dam dE coli la protine X dont nous recherchons les cibles. Ainsi, quand la protine de fusion se liera lADN (par lintermdiaire de la protine X) la mthylase dposera sur lADN une marque (mthylation) de cette interaction.

Me

Dam X

Me

Les mthylations seront ensuite repres aprs digestion lenzyme DpnI (seuls les sites mthyls par Dam seront digrs). Les fragments dADN gnomique de petite taille (digrs par DpnI) seront alors isols et analyss (par squenage, PCR, hybridation, chip, etc.).

24/10/2011

169

Afin dtre sr que ces mthylation sont bien spcifique de linteraction de la protine X avec sa cible ADN, une transfection de la mthylase Dam seule est ralise en parallle. Le schma ci-dessous nous montre un exemple dexprience avec analyse des rsultats par chip.

A gauche : cellules transfectes par un plasmide permettant de produire la protine X fusionne la mthylase Dam. A droite : cellules contrle transfectes par un plasmide permettant lexpression de la mthylase Dam seule.

24/10/2011

170

Mthodes permettant dtudier les interactions acide nuclique / protine Electrophoretic Mobility Shift Assay (EMSA) - gel retard
Principe de la Technique : La technique du gel retard est base sur le retard de migration dans un gel natif de polyacrylamide de duplexes d'oligonuclotides de squences courtes en prsence de protines (ou de complexes protiques) ayant la proprit de reconnatre spcifiquement la squence d'intrt. La variation de migration des duplexes (ou sondes) complexs aux protines par rapport aux duplexes libres est suivie grce au marquage radioactif au 32P des sondes nuclotidiques.
Concentrations croissantes en protine ADN complex deux protines ADN complex une protine

* * *

* * *

ADN nu marqu en 5

Le gel retard peut tre ralis partir de protines purifies mais aussi partir dun extrait protique plus complexe (un extrait nuclaire par exemple). La spcificit de reconnaissance des sondes marques peut tre teste par l'ajout en excs du mme duplexe non radioactif qui entrent en comptition avec la forme radioactive. La prsence de protines spcifiques dans le complexe retard peut tre mise en vidence par l'ajout d'anticorps spcifiques qui permettent un retard plus important sur le gel appel " supershift ".

La mme exprience peut-tre ralise avec de lARN.

24/10/2011

171

Footprint empreinte sur lADN


Exonuclase A
Lexonuclase A est une enzyme qui a une activit 3-5 exonuclase, mais ne sattaque quaux extrmits prominentes ou franches. Elle ne coupe ni lADN simple brin, ni les extrmits 3 prominentes. Cette activit est utile pour dterminer les limites dune interaction entre une protine et un fragment dADN. Si on marque au 32P une seule des deux extrmits 5 de notre fragment dADN, et si lon traite celuici lexonuclase III pendant quune protine en protge une partie, lexonuclase III ne pourra digrer lADN que jusqu ce quelle entre en contact avec cette protine qui lempche de progresser dans la digestion. La mme exprience sera ralise avec le fragment dADN marqu sur lautre extrmit. La taille de lADN protg que lon dtermine sur un gel dnaturant haute rsolution nous permettra de dterminer o est localise linteraction ADN-protine.

Un des avantages de lempreinte lexonuclase III est que lADN non-protg par une protine est entirement dgrad; une interaction partielle ne gnre pas de bruit de fond.

24/10/2011

172

Dnase I

Radicaux libres
Le principe de lempreinte se prte diffrents ractifs outre les nuclases. On peut par exemple gnrer dans le milieu dincubation des radicaux hydroxyl libres qui attaquent la chane de phosphate de lADN et cassent un des brins de lADN. La raction pour gnrer ces radicaux est la suivante: Fe2+(EDTA4-) + H2O2 -> Fe3+ (EDTA4-) + HO. Cest le radical HO. qui attaque lADN. Il na pas de prfrence quant la squence et tend couper partout. Une telle empreinte peut donner plus de bruit de fond quune empreinte la DNAse parce

24/10/2011

173

que cette dernire, beaucoup plus massive, peut difficilement atteindre des sites situs sous la protine qui protge lADN, alors quune petite molcule comme HO. y arrive plus facilement. Dautres radicaux existent pour ce type de raction, comme par exemple le cuivre-phnanthroline. Le permanganate de potassium (KMnO4) par exemple, est une molcule trs ractive qui oxyde prfrentiellement les thymines dADN monocatnaire [Rubin et Schmid, 1980; Kahl et Paule, 2001]. Il peut ainsi dtecter des portions de squences dADN qui sont monocatnaires. Le KMnO4 a t utilis pour dterminer des distorsions dpendantes de la squence [McCarthy et Rich, 1991], des structures dADN en pingle cheveux [Balagurumoorthy et Brahmachari, 1994] ou lADN de type B et lADN hlice triple [Jiang et coll, 1991].

Les autres
Presque toutes les techniques utilises pour tudier les interactions ADN-protines in vitro peuvent aussi tre utilises in vivo. Il est juste un peu plus difficile de faire pntrer les ractifs dans la cellule et den rcuprer lADN par la suite. Parmi les traitements disponibles pour effectuer des empreintes in vivo, on trouve les empreintes : (a) la DNAse I (il faut alors permabiliser les cellules pour permettre lentre de lenzyme, et sassurer de ce quil y ait assez de Mg2+ prsent dans le milieu); (b) au dimthylsulfate ou DMS, qui pntre spontanment dans les cellules et va causer une mthylation des guanines non-protges, une activit particulirement efficace dans le sillon majeur de lADN; les guanines mthyles peuvent alors tre coupes par la piperidine; (c) l UV footprinting, ou formation de dimres de pyrimidines par irradiation aux rayons ultraviolets UVB (280-320nm) ou UVC (200-280nm). Ces dimres de pyrimidines peuvent tre coups par une photolyase et la piperidine. Cette empreinte aux UV a lavantage de ne pas toucher aux cellules du tout, et permet donc dtudier une cellule trs prs de son tat naturel.

24/10/2011

174

La technique la plus populaire pour rcuprer des fragments dADN aprs une raction dempreinte in vivo est celle du LMPCR, ou ligation-mediated Polymerase chain reaction.

24/10/2011

175

LMPCR et footprint in vivo : (1) Rcupration de l'ADN gnomique. Cet ADN contient des coupures simple-brin, l o la DNAse I ou un autre agent comme le DMS, a endommag la chane d'acides phosphoriques.

(2) Sparation des brins et annlisation de l'un d'eux avec une amorce 1 spcifique une rgion qui nous intresse. L'autre brin pourra tre tudi plus tard lors d'une autre exprience. Notez que les fragments d'ADN dont nous disposons cette tape sont de tailles diffrentes, parce que la coupure la DNAse I n'est que partielle.

(2) Extension de l'amorce 1.

(3) Ligation d'un adapteur double brin l'extrmit franche. Comme l'autre extrmit n'est pas franche, l'adapteur ne peut pas s'y attacher. Cet adapteur a une extrmit prohminente, ce qui l'empche de se liguer plusieurs fois au bout de notre extrmit franche.

(5) PCR entre une deuxime amorce spcifique (l'amorce 2, ct du site de l'amorce 1) et une amorce (l'amorce 3) semblable l'extrmit prohminente de l'adapteur que nous avons ajout

24/10/2011

176

l'tape prcdente. Le premier cycle de ce PCR ne fonctionne que dans un sens, c'est dire partir de lamorce 2, parce que l'amorce 3 n'a pas encore de squence complmentaire. Cette squence sera synthtise lors de ce premier cycle.

24/10/2011

177

BIAcore
On mesure ici linteraction entre deux partenaires molculaires grce une machine mesurant lintensit dun rayon de lumire. Cette machine est fabrique par la compagnie Biacore, qui a donne son nom lappareil. La SPR, ou rsonance de plasmon, se produit quand un rayon lumineux est rflchi sous certaines conditions par un film conducteur linterface entre deux milieux dindices de rfraction diffrents. Dans le systme Biacore (tm) ces milieux sont (1) la solution dans laquelle se trouvent les molcules analyser et (2) le verre dune lame qui sert de senseur. Le film conducteur linterface des deux est un trs fin film dor la surface de la lame de verre. La rsonance de plasmon cause une rduction de lintensit de la lumire rflchie un angle spcifique de rflection. Cet angle varie avec lindice de rfraction prs de la surface du ct oppos la lumire rflchie (cest donc dire du ct de lchantillon). Dans le systme Biacore (www.biacore.com) , la molcule appt est attache la feuille dor, du ct solution. Les molcules avec lesquelles elle peut interagir sont ajoutes en flot continu. Si lune dentre elles interagit avec lappt, la concentration locale en molcules augmentera dans la rgion immdiate de lappt, ce qui fera changer lindice de rfraction local. Le changement dindice de rfraction aura pour effet de changer langle pour lequel la lumire rflchie perd un maximum dnergie par rsonance. Le systme dtecte un changement et enregistre une interaction. La mesure du niveau dinteraction en fonction du temps permet dvaluer le taux dassociation. Une unit de rsonance (RU) correspond un changement de 0.0001 dans langle donnant une intensit minimale de lumire rflchie, ce qui pour la plupart des protines correspond un changement de concentration de lordre de 1 pg/mm2 de surface sur la lame de verre. Le Biacore est donc extrmement sensible.

24/10/2011

178

Les puces en gnral

ANNEXE :
Les puces ADN (DNA microarray) permettent un criblage rapide et simultan dun gnome ADN. Les puces ADN consistent en un support solide (petite lame de verre comme celles utilises en microscopie traditionnelle ou membrane de nylon) sur lequel des milliers de fragment dADN sont dposs de faon gomtrique laide dune micropipette robotise. Grce cette technique, chacun des fragments dADN est reprsent par un point sur le support (ou puce). Ils servent de sondes pour fixer de faon trs spcifique les fragments de gnes complmentaires (cibles), prsents dans les chantillons biologiques tester : leur mise en contact permet de reconstituer la double hlice dADN et ce phnomne (hybridation) peut tre mis en vidence par des techniques optiques sous clairage fluorescent ou par dtection de radioactivit; un systme de marquage de lchantillon au moyen de traceurs fluorescents ou radioactifs ayant t ralis pralablement. La quantification des signaux obtenus et lidentification des fragments de gnes reconnus sont ensuite rendues possibles au moyen dun systme dacquisition dimage puis danalyse des donnes faisant appel des logiciels informatiques spcialement conus cet effet. Les rsultats obtenus sont ensuite valids sur le plan statistique et interprts dans un contexte biologique.

24/10/2011

179

Le potentiel de cette mthodologie est norme, mais la masse de rsultats qui rsulte de ces expriences est considrable et leur exploitation par le biais de programmes informatiques nen est encore qu ses dbuts. De nombreux dveloppements sont encore faire au niveau des logiciels danalyse et de reprsentation afin dextraire de ces donnes le maximum de sens sur le plan biologique. Le terme puces ADN est un terme gnrique. Il existe actuellement 2 procds majeurs de fabrications de puces ADN ce qui permet de distinguer diffrents types de puces : (1) les macro et microarrays avec un dpt direct de molcules dADN sur leur support (2) les puces oligonuclotides avec la synthse in situ des sondes oligonuclotidiques sur une surface solide. Les macroarrays ou filtres haute densit : Les dpts (sondes) sont des clones dADNc ou des produits de PCR fixs haute densit sur une membrane de nylon (8 x 12 cm). Le marquage est le plus souvent radioactif et le criblage est ralis en excs de cible, on obtient ainsi une mesure de labondance relative de chacun des ARNm prsent

24/10/2011

180

dans lchantillon de dpart. On parle de macroarrays jusqu une densit denviron 25 fragments ADN dpos par cm2. filtres haute densit ou macroarrays

Les microarrays : Ils permettent la miniaturisation des dpts d'ADN, ce qui permet de fixer plusieurs milliers de sondes sur des surfaces gales ou infrieures celle dune lame de microscope standard. Elles sont dposes une densit de 1 000 sondes/cm2 par un robot sur des lames de verre au pralablement traites chimiquement, soit jusqu 12 000 sondes/lame. Les sondes sont gnralement des ADN double brin de longueur de 200 2000 bp amplifis par la technique de PCR mais rcemment, des oligonuclotides longs (50-70 mers) ont galement t greffs sur la puce aprs leur synthse. Les cibles utilises sont ralises par transcription inverse, partir dARN total ou messager utilisant 2 fluorochromes diffrents (Cy3 et Cy5) ce qui permet dhybrider simultanment 2 cibles sur une mme sonde. Les signaux dhybridation sont analyss grce un lecteur capable de discriminer les 2 fluorochromes et de gnrer deux images dont le niveau de gris reprsente lintensit de la

24/10/2011

181

fluorescence lue. Si on remplace les niveaux de gris par des niveaux de couleur verte pour la premire image et rouge pour la seconde, on obtient en les superposant une image en fausses couleurs compose de spots allant du vert au rouge en passant par le jaune. Un excs du gne X dans lchantillon marqu en rouge donnera un signal rouge ; un excs du gne Y dans lchantillon en vert donnera un signal vert ; une expression quivalente du gne Z dans les deux chantillons donnera un signal jaune. On calcule ensuite le ratio des intensits de fluorescence rouge/fluorescence verte pour chacun des spots ce qui permet de rechercher une expression diffrentielle des gnes dans les 2 chantillons biologiques tudis. Gnralement, on fixe la limite dun ratio suprieur 2 ou infrieur 0,5 pour considrer quun gne est sur- ou sousexprim dans une des cibles par rapport lautre. On peut ensuite essayer de regrouper des gnes ayant le mme profil dexpression sur plusieurs expriences ayant un rapport biologique.

24/10/2011

182

Principe d'une hybridation sur microarrays

Les puces oligonuclotides : Elles drivent lorigine dun projet de squenage par hybridation. Les puces les plus couramment utilises sont les puces de la socit Affimetrix. Dans ce cas, les sondes sont des oligonuclotides synthtiss in situ par une technique de photolithographie. On peut synthtiser jusqu 300 000 oligonuclotides reprsentant 30 000 gnes sur une puce dune surface denviron 1 cm2. On hybride une seule sonde par puce et lintensit de fluorescence mesure par un scanner permet une mesure de labondance relative de chacun des ARNm prsent dans lchantillon biologique tudi.

24/10/2011

183

Interactions protine - protine


1.

Avant propos
Liaisons stables liaisons transitoires

Deux protines peuvent sassocier indpendamment de tout autre partenaire de deux manires diffrentes :

Liaisons stables : toute association donnant naissance un complexe que lon peut isoler
(Attention, ne pas confondre avec liaison covalente ! une liaison peut-tre stable sans tre covalente).

Liaison transitoire : donnent des complexes trop peu stables pour que lon puisse les isoler. Dans ce
cas l, lisolement de ces complexes passera souvent par une tape prliminaire de cross-link (pontage covalent ralis par un traitement chimique ou physique). La force de la liaison (affinit) est dfinie par des paramtres dquilibre et en particulier par le Kd ou constante de dissociation. Notion de Kd
Kon : constante de vitesse de formation du complexe Koff : constante de vitesse de dissociation du complexe

Kon A + B <====> AB Koff

[A] x [B]

AB

Kd = [A] [B] / [AB] = koff / kon = 1 / Ka (constante Avec [A], [B], [AB] : respectivement concentration en A, B et AB
Quelques exemples de Kd : streptavidine / biotine : 10-14 M

dassociation)

Histone / ADN 10-11 M

Antigne / Anticorps : 10-8 10-10 M pour un bon anticorps, 10-6 M pour un anticorps plus faible Liens molculaires

Les interactions protine / protine sont possibles grce la formation de liaisons non covalente. Ces liaisons sont de diffrente nature : Liaisons ioniques - interactions qui relient deux atomes de charges opposes- la plus forte des liaisons non covalentes

24/10/2011

184

Liaisons hydrogne - se forment chaque fois quun atome dhydrogne li un atome

lectrongatif est proximit dun autre atome lectrongatif (en gnral oxygne et azote) Lnergie de liaison est moyenne Liaisons hydrophobes - se rencontrent lorsque deux molcules hydrophobes voisines se Forces de Van Der Waals interactions lectrostatiques entre deux atomes voisins. Doivent rencontrent (par exemple deux acides amins hydrophobes) - lnergie de liaison est faible tre trs proches car lnergie de cette liaison est trs faible.

2. Introduction
Les gnomes de diffrentes espces procaryotes mais aussi eucaryotes ayant t squencs ces dernires annes, la majorit des efforts de la communaut scientifique se porte aujourdhui sur l'analyse du produit des gnes, les protines. En effet, le nombre et la fonction biologique de la plupart de ces molcules codes par les gnes ne sont pas encore connus. Ltude des protines est appele la protomique.

Comment accder la fonction (aux fonctions) dune protine X ? Analyse in silico :, recherche de protines prsentant des homologies de squences, recherche de domaines connus (de liaison lADN par exemple), Etudes enzymatique Etudes de biologie cellulaire : cellules/compartiments cellulaires dans lesquels la protine est prsente Etudes de biologie structurale : recherche de domaines structuraux de fonction connue Etudes gntiques : inactivation du gne (KO, RNAi) suivie dtude du phnotype obtenu Etudes biologie molculaire : facteurs impliqus dans la rgulation de ce gne ? Comme les protines fonctionnent le plus souvent (toujours ?) en rseaux, l'identification des interactions entre protines permet de mieux comprendre leur fonction (si la fonction du (des) biochimiques : recherche dune activit

24/10/2011

185

partenaires de la protine X est connue, cela nous donnera des informations sur sa propre fonction) et permettra ventuellement de dcouvrir de nouvelles cibles thrapeutiques.

=> Etude de lINTERACTOME

3 - Recherche de partenaires protiques partir dune banque dADNc Principe de ces techniques :
Les partenaires protiques de la protine dintrt (que nous appellerons la protine appt) seront recherchs partir de banques dADNc. Ces ADNc seront transcrits puis traduits chez un hte particulier (la nature de lhte dpend de la technique choisie). Linteraction sera rvle par diffrentes mthodologies dcrites par la suite.

Intrt de ces techniques : une fois le partenaire identifi, on aura directement accs son ADNc. Simplicit de mise en uvre Inconvnients : Les interactions binaires pourront essentiellement tre tudies Les interactions sont ralises avec des protines htrologues ou recombinantes (problme de
quantit relative des partenaires, de compartimentation de la cellule, de modifications posttraductionnelles, ).

3.1 - Criblage en interaction sur colonies ou sur plages de lyses


Il sagit dutiliser dans un premier temps la trs classique technique de criblage dune banque dexpression, la seule diffrence repose sur le fait que le criblage ne fait pas par hybridation avec une sonde simple brin radioactive mais avec la protine appt (que nous appellerons protine X) au pralablement marque. Les clones exprimant la protine interagissant avec la protine X seront donc reprs par sa visualisation (autoradiographie si la protine X est marque radioactivement). Les clones positifs, contenant lADNc des partenaires de la protine X, seront identifis par squenage.

24/10/2011

186

Criblage avec la protine X marque

Pour marquer la protine appt, on peut la traduire in vitro en prsence de mthionine 35S. On peut
aussi la biotinyler ou encore la produire chez E. coli en fusion avec une tiquette facilement reprable. On peut enfin la reprer grce des anticorps. La banque peut tre ralise dans un plasmide ou dans un phage (lamda par exemple). Lavantage du phage sur le plasmide est quil vite ltape de lyse des bactries. Avantages de cette technique : ceux dj cits plus haut pour lensemble de ces techniques. Inconvnients de cette technique : les interactions se faisant partir de protines fixes sur des filtres (nitrocellulose ou nylon), lefficacit de liaison entre la protine X et ses partenaires est moins bonne.

Cette technique ncessite davoir la protine X purifie. Si on veut tester un grand nombre de partenaires, il faudra cribler un grand nombre de botes.

3.2 - Phage display


Une alternative cette technique consiste faire du phage display, on peut alors faire un enrichissement des phages positifs en milieu liquide, ce qui permet de tester un grand nombre de clones sans augmenter la charge de travail. Cette technique consiste faire exprimer la protine cible la surface dun bactriophage non lytique. Ces phages seront utiliss pour infecter des bactries E. coli. Le bactriophage utilis ici est le bactriophage filamenteux M13. Pour faire exprimer nos protines tester en surface de ce bactriophage, leur ADNc est clon en fusion avec le gne

24/10/2011

187

III qui code pour une protine mineure de la capside qui est exprim la surface du phage. Le site de clonage se trouve en N terminal de la protine du gne III afin que le motif protique variable soit tourn vers lextrieur, donc accessible une slection. Entre la squence codante du gne III et les ADNc, on met une squence espaceur afin que les protines tester puissent adopter un repliement indpendant de celui de la protine "III". Une banque dADNc est insre dans lADN du phage au niveau du site de clonage. LADN phagique ainsi modifi est transform dans des bactries E. coli (avec en thorie un phage donc une protine recombinante par bactrie) puis les phages sont obtenus par infection avec le bactriophage helper M13KO7. Ce bactriophage prsente un gnome modifi qui ne permet pas sa rplication. Il permettra par contre la formation des bactriophages partir des ADN phagiques portant les ADNc. Les phages recombinants sont rcuprs dans le surnageant de culture puis slectionns par rapport leur interaction avec la protine pour laquelle on recherche des partenaires. La slection peut se faire de diffrentes faons en fonction des caractristiques de la protine pour laquelle on recherche des partenaires (protine appt) : Fixation directement sur un support activ

Les supports ou matrices utiliss pour la chromatographie d'affinit sont gnralement des billes d'agarose ("Sepharose", Pharmacia).
L'immobilisation du ligand sur la matrice ncessite qu'il soit pralablement activ, c'est--dire qu'il faut crer des sites ractionnels qui permettent d'tablir des liaisons covalentes avec la protine appt.

Colonne daffinit Si la protine est tiquete ou biotinyle, ou encore si on lui connait un ligand, on peut slectionner les phages positifs en ralisant une colonne daffinit.
Particules virales exprimant des fragments d ADNc

Les phages ainsi slectionns sont utiliss pour rinfecter des souches bactriennes, les surnageants sont
Amplifications (infection d E. coli) Fixation sur une protine cible

34X

lavages

lutions
(augmente conc. en NaCl par ex.)

24/10/2011

188

rcuprs et reslectionns contre la protine. En rptant cette tape de slection plusieurs fois (en augmentant la stringence de linteraction chaque cycle), on enrichit notre population en clones produisant recombinantes les protines le interagissant

mieux avec lappt. Ces candidats sont alors isols (par dilutions ou sur boites en effet, bien que le phage ne soit pas lytique, sa prsence dans une bactrie diminue sa vitesse de division, on voit donc apparatre des pseudo plages de lyse sur les tapis bactriens). LADNc du phage est alors squenc, permettant ainsi lidentification des les partenaires de la protine X.

Avantages de cette technique : permet de cribler rapidement une grande quantit de clones. Inconvnients de cette technique : seules des interactions de forte affinit peuvent ainsi tre tudies (au moins 10-8M), ncessit davoir des quantits importante dappt purifi. 3.3 - Double hybride ou pige interaction .
Cette technique est base sur la capacit des domaines de liaison lADN (BD) et dactivation de la transcription (AD) du facteur de transcription Gal4 fonctionner de manire indpendante. Dans le systme du double hybride, ces deux domaines sont spars et chacun est fusionn aux protines dintrt (X et Y). Ainsi, cest linteraction entre les deux protines X et Y qui permettra de reconstituer un facteur de transcription actif. Il y aura alors transcription de gnes rapporteurs. Gne rapporteur : gne non prsent dans la souche de levure utilise et dont lexpression est facilement reprable. Ex : lacZ : gne dE. coli, non prsent chez S. cerevisiae facile reprer grce son activit enzymatique. La squence codant la protine X (lappt) sera fusionne la squence codant pour le domaine de liaison lADN de Gal4 -> clone dans un plasmide La proie (protine Y) correspondra soit lADNc de la protine dont on veut tester son interaction avec la protine X, soit une banque dADNc si aucune exprience prliminaire na encore t

24/10/2011

189

ralise. Sa squence sera fusionne avec le domaine dactivation de la transcription de Gal4. -> clone dans un plasmide.

Le gne rapporteur, prcd du promoteur portant les sites de liaison de Gal 4 (rpts 6x), est insr dans le gnome de la levure. Parmi les sites de liaison de Gal4, lUAS de Gal1 est souvent
utilis. UAS : Upstream Activated Sequence Les deux plasmides sont co-transforms dans la souche de levure approprie prsentant le gne rapporteur sous la dpendance dune UAS de Gal4 et dficiente pour les gnes dauxotrophie utiliss comme marqueurs de slection.

Les protines X et Y ninteragissent pas.


Y X
Gal 4 BD Gal 4

AD

Pas dexpression
ARN Pol II Gne rapporteur

Sites de liaison de Gal 4

Les protines X et Y interagissent.


X
Gal 4

Gal 4

AD

Expression
ARN Pol II Gne rapporteur

BD

Sites de liaison de Gal 4

Si le gne rapporteur est LacZ, les colonies positives seront capables de pousser sur milieu galactose et, en prsence de Xgal, les levures seront bleues.

Xgal : Le X-gal, ou 5-bromo-4-chloro-3-indolyl-beta-D-galactopyranoside est un


driv du galactose, li un noyau indole. Il peut tre hydrolys par la galactosidase, produit du gne LacZ, en formant un compos bleu, ce qui permet de dtecter la prsence de cette enzyme. Le dosage de lactivit galactosidase peut nous donner une ide de la force de linteraction.

Xgal

24/10/2011

190

Les levures utilises pour ce double hybride seront donc : Gal4-, dficientes pour les gnes dauxotrophie utiliss, et porteront le gne rapporteur (sous la dpendance de Gal4) insr dans leur gnome

Les limites de la mthode sont essentiellement le trs grand nombre de clones artfactuellement positifs ou ngatifs. 1 - Faux positifs (signaux positifs artfactuels en double hybride).
Pour limiter le nombre de faux positifs, il est ncessaire, en pralable ou suite au criblage, deffectuer de nombreux contrles et dutiliser comme marqueur dinteraction plusieurs gnes rapporteurs diffrents par la squence de leur promoteur. On utilisera, chaque fois que cela est possible, des contrles positifs (deux protines dont linteraction a dj t caractrise) et des contrles ngatifs (des protines dont on sait quelles ne prsentent pas daffinit lune pour lautre, transfection dun plasmide vide avec lautre plasmide recombinant). Faux positifs les plus frquemment rencontrs :

Transactivateurs :

Cest la capacit de X ou Y activer spontanment la transcription des gnes rapporteurs lorsquils sont fusionns BD ou AD.

1er cas : lappt X est transactivateur, la transactivation peut tre directe (a) ou se faire via une
interaction avec une protine rsidente de la levure (b)
(a)

Lea une la protine appt u2 activit transactivatrice X

Le appt X lie une protine de la Leu levure (b)La protine 2 u2 capable dactiver la transcription Y AD X Z

BD

BD

Contrles: expression indpendante de la protine de fusion BD-X dans S. cerevisiae (tmoin ngatif)

2me cas : la proie Y est transactivatrice. Ceci a lieu quand la protine AD-Y est recrute au
promoteur Gal de manire indpendante de la proie. Il y a 2 cas classiques : 1. 2.
(a)

liaison directe de Y au promoteur (a) liaison des protines (b) de lhte complexes au promoteur (ex : TATA Binding Protine)
(b)

AD

24/10/2011

191

AD

TB

Contrles effectuer : expression de AD-Y seul (tmoin ngatif)

Faux positifs dus une affinit artfactuelle des protines proies et appt par les domaines

BD et AD
2 cas classiques : 1. La protine proie reconnat BD

AD

BD

Contrle (tmoins ngatifs): combinaison AD-Y + BD

2.

La protine appt reconnat AD


Y X AD

BD

Contrle : combinaison BD-X + AD

Intervention dune troisime protine Z adaptatrice :

AD

BD

Contrle avec techniques dtude des interactions protine/protine in vitro (ex : GST-pull-down, co-immunoprcipitation)

2 - Faux ngatifs (incapacit mettre en vidence par double hybride des interactions quon sait exister in vivo). La (les protines) nest (ne sont) pas produite(s) dans la levure La protine nentre pas dans le noyau Contrle : Vrifier la prsence et la localisation de nos protines de fusion dans les levures (par exemple en immunofluorescence)

24/10/2011

192

Certaines modifications post-traductionnelles sont absentes Protines chimriques mal replies Les protines ne sont pas dans leur environnement naturel pas dinteraction possible dans un
environnement autre (pH, concentration saline, non adquat) Contrle : tester, chaque fois que cest possible, une proie connue pour interagir avec lappt

Conclusion
La mthode du double hybride permet de montrer que 2 protines sont capables dinteragir de faon binaire lorsquelles coexistent dans le noyau de la levure. La technique nest pas suffisante en soi pour valider une interaction. Le rsultat doit tre valid par dautres types dexpriences complmentaires (coimmunoprcipitation, pull-down) Ncessit dune validation biologique : les deux protines coexistent-elles dans lorganisme ? Linteraction peut-elle avoir une signification biologique ?

Rfrences Brachmann and Boeke (1997) Current opinion in biotechnology 8: 561-568 Vidal M. and Legrain P. (1999) Nucleic Acids Research 27, n 4, 919-929; Fashena et al. (2000) Gene 250, 1-14 Suter B, Kittanakom S, Stagljar I. (2008) Curr Opin Biotechnol. Aug;19(4):316-23. 3.4 Complmentation (PCA Protein fragment Complementation Assay).
Cette mthode permet de tester les interactions protine-protine lintrieur des cellules vivantes, quelles quelles soient. Elle permet soit dtudier une interaction entre des protines connues, soit didentifier, partir dune banque dADNc, le (les) partenaires dune protine. Dans la stratgie PCA, une enzyme ou une protine facilement dtectable soit directement par sa prsence (protine fluorescente) soit par son activit (par exemple avec la galactosidase). Cette protine est appele

reporteur . Elle sera alors spare en deux fragments et les deux fragments seront fusionns avec
les protines dont on veut tester linteraction (protines A et B dans le schma ci dessous). Lactivit de la protine reporteur est alors conditionnelle de linteraction entre les deux partenaires. Les deux fragments de la protine reporteur ne doivent pas tre capables de sassocier indpendamment des protines A et B.

Avantages de la stratgie PCA :

24/10/2011

193

Les interactions molculaires sont visualises plus directement et non au travers dvnements
secondaires comme une activation transcriptionnelle -> moins de faux positifs/ngatifs.

Ces expriences peuvent tre ralises dans tous organismes et types cellulaires. La localisation cellulaire peut-tre choisie, y compris au niveau des membranes. Inconvnients de la technique PCA: peut manquer de sensibilit si les constantes daffinit entre les protines tester sont faibles. Linteraction entre les protines A et B doit permettre le rapprochement dans lespace des deux
parties du reporteur pour pallier ce problme, on utilise des espaceurs squences de quelques acides amins (souvent des glycines) qui permettent une grande flexibilit dans le positionnement des deux parties des protines de fusion. On peut aussi tester les fusions en N et C terminal des protines reporteurs.

Les protines reporteurs utilises peuvent tre de diffrentes natures, lune delles est prsente ci-dessous.
lucifrase (Osawa et al, 2001) Certains tres vivants tels que la luciole (firefly) mettent spontanment de la lumire par un phnomne appel bioluminescence. La lucifrase de type Firefly est une protine monomrique de 61kDa trs utilise en imagerie de bioluminescence. Cette protine catalyse loxydation de la lucifrine selon les ractions dcrites dans la figure ci-contre: lactivation de la lucifrine par la lucifrase en prsence dATP permet la formation dun complexe instable qui mettra de la lumire lors de son retour un tat fondamental. Raction doxydation de la lucifrine par la lucifrase Firefly
Ici, la lucifrase sera spare en deux parties :

la partie N terminale (acide amins 1 437) et la partie C terminale (acides amins 438 544). Ces deux parties ne sont pas capables de sassocier.

24/10/2011

194

Lactivit de la lucifrase est dtecte par la mesure de la bioluminescence mise en prsence de lucifrine.
Ozawa T, Kaihara A, Sato M, Tachihara K, Umezawa Y. 2001 Anal Chem. 73(11):2516-21.

Recherche

de

partenaires

protiques

partir

dun

extrait

protique :

Co-

immunoprcipitation (co IP) 4 1 : Principe gnral : La co immunoprcipitation est une technique qui consiste isoler un complexe protique en utilisant un anticorps dirig contre un des membres du complexe. Si on recherche les Anticorps partenaires de la protine X, on va donc utiliser un Ac antiX qui nous permettra de limmunoprcipiter. Avec elle seront Protine A isols ses partenaires protiques. Ces protines seront alors Protine cible identifies. Lanticorps utilis sera de prfrence un anticorps polyclonal, afin dviter que lpitope reconnu par lanticorps ne soit masqu dans le complexe. Limmunoprcipitation se fera alors en utilisant de la protine A ou de la protine G, couple des billes de spharose, dagarose ou des billes magntiques. Le choix protine A / protine G dpend de lanticorps que lon va utiliser (ex. protine A pour un IgG prpar chez la souris).
Bille de spharose

Partenaire

Les protines A et G sont des protines recombinantes dorigine microbienne qui prsentent la capacit de fixer les molcules dimmunoglobuline de mammifre. Ces protines sont couples de faon covalente des billes de spharose. Linteraction entre ces protines et les immunoglobulines nest pas quivalente pour toutes les catgories danticorps :
Antibody Human IgG Goat IgG Chicken IgG Protein A S W NB Protein G S S NB W = interaction faible S = interaction forte NB = pas dinteraction; non test

Si les Ig dont nous disposons pour faire limmunoprcipitation ne se fixent ni sur la protine A, ni sur la protine G, il est toujours possible de faire un sandwich :

4 2 : le matriel de dpart :
Le matriel de dpart correspond un extrait protique qui sera ralis par une lyse des cellules, suivie dune sonication (pour casser lADN, ce qui permet de diminuer la viscosit de la solution) puis dune clarification par centrifugation (afin dliminer les dbrits cellulaires). Si le nombre de protines ainsi isoles est trop important et si on connat la localisation de la protine appt dans la

24/10/2011

195

cellule, on peut simplifier le systme en faisant du fractionnement cellulaire. Le mme protocole prcdemment dcrit sera alors appliqu aprs fractionnement.

4 3 : Mthodologie : Pratiquement, on va dans un premier temps raliser linteraction extrait protique/protineA ou G


fixe sur les billes. Cette tape va nous permettre dliminer toutes les protines de lextrait qui se fixent sur les billes de faon non spcifique (clearing). On va alors centrifuger et rcuprer le surnageant. Puis on va ajouter lanticorps dirig contre notre protine puis, enfin, un nouveau lot de billes protine A/ G. On va nouveau centrifuger (ou passer sur le portoir aimant) et rcuprer les billes que lon va laver afin de se dbarrasser de toutes les interactions non spcifiques. Enfin, il faudra luer les complexes des billes. Diffrentes techniques sont alors possibles en fonction du type danalyse que lon veut raliser sur les co-immunoprcipitats (reprendre dans du tampon SDS/DTT et chauffer si on veut faire une sparation sur gel polyacrylamide dnaturant, lution par la force ionique si on ne veut pas rcuprer notre protine, lution par un peptide comptiteur, lution par choc acide, )

4 4 : Identification des protines du complexe : Une fois les complexes isols, elles devront tre identifies. Cependant, une tape de sparation des
membres du complexe est gnralement utilise comme tape prliminaire.

Sparation des protines 9


Gel 1D (dnaturant, de type SDS-PAGE) Cest la faon la plus simple de procder mais on peut tre limit par la qualit de la rsolution (bandes trop proches sur le gel pour pouvoir tre spares). Pour amliorer la rsolution du gel, on peut jouer : Sur le % en acrylamide, ventuellement en gradient Sur le tampon de migration (tris tricine par exemple) Sur la taille du gel Une fois les protines spares, il faut les identifier.

Identification des protines 9 Western blot


Si on prsume de la prsence dune protine partenaire P dj connue, on peut faire un western blot laide dun anticorps anti-P. Si les protines ont t rcupres par co-immunoprcipitation, on peut, dans certains cas, rencontrer un autre problme : la protine que lon veut dtecter migre la mme vitesse que les chanes lourdes ou lgres des anticorps qui nous ont servi immunoprcipiter. Dans ce cas l, deux solutions sont possibles.

24/10/2011

196

Utiliser des anticorps secondaires qui dtectent la forme native (avec les ponts disulfide) des
immunoglobulines, permettant ainsi de ne pas rvler les anticorps qui ont permis de raliser limmunoprcipitation qui eux sont dnaturs (traits au SDS).

Une deuxime possibilit consiste utiliser pour le western blot un anticorps ralis dans une
espce diffrente de celle qui a t utilise pour fabriquer lanticorps utilis en immunoprcipitation.

Digestion trypsique / Spectroscopie de Masse Maldi-ToF

La premire tape consiste dcouper la/les bandes dacrylamide qui contiennent des protines. Pour cela, il faut colorer le gel. Le bleu de coomassie est le plus souvent utilis pour cette tape. Une alternative cela consiste analyser lensemble du gel. Pour cela, la piste de migration sera dcoupe en bandes de tailles gales et chacune de ces bandes sera analyse. Les bandes dcoupes sont alors digre la trypsine (ou toute autre protase spcifique). La masse prcise de lensemble des peptides obtenus est alors dtermine par spectromtrie Maldi ToF (ou autre spectrophotomtre de masse prsentant ce type dionisation). La comparaison avec des banques de donnes nous permet didentifier la protine recherche. Si des ambiguts restent lever, un squenage par LC/MS/MS est possible, il nous permettra dobtenir la squence de 5 10 acides amins. La digestion trypsique est alors toujours une digestion totale et la sparation des peptides est ralise grce un systme de chromatographie en phase liquide (LC) qui est coupl au Spectro de Masse (en tandem). Le premier tage de MS sert slectionner un ion, et le second analysera les ions issus de la fragmentation de celui-ci. La fragmentation se ralise par coupure au niveau des liaisons peptidiques principalement (et ce partir des deux extrmits). Il est alors possible de dduire de l'ensemble des ions obtenus la squence peptidique lue simultanment dans les deux sens.

4 5 : Avantages/inconvnients : Avantages de la co IP :: Le complexe sest form in vivo avec de la protine endogne .


Laffinit Ag/Ac est gnralement trs forte et spcifique. Il faut avoir un Ac immunoprcipitant c'est--dire un anticorps reconnaissant la protine appt Un autre inconvnient est la quantit de protine appt endogne dans les cellules. Si elle est Dans le cas de complexes de tailles trs importantes, le/les pitope(s) peuvent tre masqus,

Inconvnient de la coIP :
au sein dun complexe avec la fois une forte affinit et une grande spcificit. trop faible, la quantit de complexe isole ne sera pas suffisante pour isoler les complexes. on ne pourra pas alors utiliser cette mthode.

24/10/2011

197

Pour cette technique galement, il faudra raliser diffrents contrles et en particulier extrait +billes protine A/G+Ac non spcifique.

4 6 : Alternatives la Co Immunoprcipitation : - Chromatographie daffinit, pull down.


Quand limmunoprcipitation nest pas possible (on na pas danticorps utilisable pour limmunoprcipitation ou la protine appt est en concentration trop faible dans nos cellules pour rcuprer suffisamment de complexes pour leur analyse ultrieure), on utilisera des variantes cette techniques que sont les chromatographies daffinit ou les pull down (chromatographies daffinit pour lesquelles la phase stationnaire nest pas insre dans une colonne mais est rcupre par centrifugation. Pour la purification dun complexe protique associ une protine X, on utilise un support solide constitu de billes dagarose ou de spharose sur lesquelles on a greff un ligand prsentant une forte affinit avec la protine X.
Support solide

Tag

Protine cible

Partenaire

Ces billes seront alors introduites dans une colonne. Ensuite on fait passer lextrait de protine contenant la protine X. Aprs diffrents lavages, llution se fera le plus souvent laide dun comptiteur. Une autre possibilit est dutiliser un gradient de force ionique. Dans ce dernier cas, sortiront les premires les protines faiblement associes dans le complexe (souvent par des liaisons indirectes), puis celles plus fortement lies. Si la protine appt ne possde pas naturellement de ligand connu, on utilisera une protine X tague. C tag sera loign de notre protine grce un espaceur qui permettra linteraction quelque soit la taille et la gomtrie du complexe. On a alors deux possibilits : soit on transfecte (transforme) nos cellules par un vecteur dexpression portant lADNc de la protine appt fusionn avec une (ou plusieurs) tiquette(s), soit la protine taggue aura t au pralablement prpare. Dans ces cas l, cest le ligand du tag qui sera fix sur les billes. Si on a insr un site reconnu par une protase spcifique entre le tag et la protine X, llution pourra se faire par digestion de ce site. Linconvnient de ces deux variantes est quon ne travaille plus sur une protine sauvage mais sur une protine modifie. La quantit de protine appt est gnralement plus importante que la protine endogne ce qui peut engendrer des faux positifs. Pull down Une variante de la chromatographie daffinit est utilise mais, au lieu de retenir les billes dans une colonne, on les sdimentera par centrifugation. Une autre variante consiste utiliser des billes magntiques. La rcupration se fera alors par lintermdiaire dun aimant. Ex. GST pull down, billes magntiques, complexe form in vitro.

24/10/2011

198

GST : glutathione Sulfo Transfrase fusionn avec la protine X entre les deux, un site de digestion la thrombine. On veut tester la liaison de la protine X avec la protine Y. Pour cela, on va : 1 - fusionner la protine X avec la Fixation et lavage GST et marquer la protine Y. 2 - fixer la protine X sur des billes de glutathione spharose 3 - ajouter la protine Y en prsence Protine X, fusionne la GST SDS-PAGE Bille glutathione spharose Si on ne veut pas marquer la protine Y, on peut la dtecter par de western. Protine Y, radioactive La mme technique est utilise pour aller pcher des partenaires de la protine X dans un

extrait protique complexe. Autoradiographie Protines comptiteurs Coloration coomassie ! Penser aux tmoins : billes + extraits, billes + GST + extraits car des interactions non spcifiques de
ce type peuvent tre obtenues et ce, indpendamment de la protine X. Autres systmes utiliss : steptavidine/biotine, Ni/6xHis, maltose/MBP,

Avantage de cette technique : simple et rapide Inconvnients :


Dans le cas des GST-pull-down, la taille importante de la GST peut entrainer un encombrement strique qui peut gner la fixation de certains membres du complexe. On peut dans ce cas l essayer de mettre le tag en C-terminal si il tait en N (ou vice-versa). On peut aussi mettre un espaceur entre le tag et notre protine. Enfin, on peut aussi essayer avec un autre tag plus petit (flag, 6xHis, )

Souvent des faux positifs , valider la validit de ces interactions par une autre technique, si

possible in vivo .

Quelle que soit la technique utilise, les interactions doivent ensuite tre vrifies in vitro et mme de prfrence in vivo afin de Sassurer de la validit de linteraction Vrifier si cette interaction est directe ou indirecte.

24/10/2011

199

Etude/vrification des interactions protine/protine.

5.1 -> Vrification par une des techniques prcdemment cites


Pour tester linteraction entre une protine X et une protine Y ou vrifier la validit dun partenaire identifi par lune des techniques prcdemment cites, toutes les techniques permettant de rechercher des partenaires protiques peuvent tre utilises. Cependant, dans le cas de la vrification dune interaction, il faudra changer de type dexprience mais aussi inverser la nature de lappt et de la proie (ex. : si la protine Y a t identifie comme partenaire de la protine X en utilisant cette dernire comme appt, la vrification se fera en prenant la protine Y comme appt). Pour vrifier si linteraction est directe, on fera un pull down partir des deux partenaires purifis.

5.2 -> Vrification de linteraction in vivo

Colocalisation par immunofluorescence

Rappels sur limmunofluorescence : L'immunofluorescence est une technique qui permet la


dtection et la localisation d'une ou plusieurs protines grce l'utilisation d'anticorps spcifiques. La ralisation d'un marquage passe par diffrentes tapes : (i) prtraitement (fixation et permabilisation) du tissu ou des cellules, (ii) ajout de l'anticorps primaire puis lavages, (iii) ajout de l'anticorps secondaire spcifique de lanticorps primaire coupl un fluorochrome puis lavages, (iv) rvlation du signal fluorescent l'aide d'un microscope de fluorescence ou par microscopie confocale. L'immunofluorescence est utilise sur les cellules en culture (on parlera alors d'immunocytochimie) ou sur des coupes de tissus (immunohistochimie).
I ii iii iv

Utilisation de limmunofluorescence pour faire de la colocalisation de protines :


Limmunofluorescence sera ralise de la mme faon que dcrite prcdemment mais on met les deux anticorps primaires dirigs contre les deux protines dont on veut tester la colocalisation puis les deux anticorps secondaires dirigs contre les deux anticorps primaires et portant des fluorochromes diffrents. Il est impratif que les deux anticorps primaires soient de types diffrents afin que lon puisse diffrencier les deux signaux et que les deux fluorophores aient des spectres dmission

24/10/2011

200

suffisamment loigns. Lacquisition des deux signaux se fait indpendamment puis on superpose les deux images pour voir sil y a colocalisation.
Dans lexemple montr ci-contre, la premire protine est dtecte avec un anticorps prpar dans la chvre et la deuxime avec un anticorps prpar dans la souris. Lanticorps secondaire permettant de rvler la premire protine est un anticorps anti anticorps de chvre coupl la Cy3 (fluorescence rouge) et lanticorps secondaire permettant de rvler la deuxime protine est un anticorps anti anticorps de souris coupl au FITC (fluorescence verte). La superposition des deux images montre un signal jaune, ce qui nous permet de valider lhypothse dune colocalisation de ces deux protines.

Avantages de cette technique : la visualisation de la colocalisation se fait in vivo sur des protines
endognes.

Inconvnients :
Il faut avoir des anticorps spcifiques des deux protines tester, les anticorps doivent pouvoir tre diffrencis (organismes partir desquels ils ont t prpars diffrents ou isotypes diffrents IgG pour un et IgM pour lautre par exemple).

La concentration de chacune des protines doit tre suffisamment importante pour pouvoir

tre rvle par cette technique qui nest pas trs sensible. Parfois, on fait de limmunofluorescence directe. Dans ce cas particulier cest lanticorps primaire qui porte le fluorochrome, la rvlation se fait alors sans passer par la troisime tape. Ceci permet dune part de diminuer le bruit de fond d des interactions non spcifiques des divers anticorps utiliss et dautre part permet de faire de la colocalisation alors que les deux anticorps dont nous disposons sont du mme type (IgG de type 1 de souris par exemple).

Protines de fusion

Dans le cas o des anticorps ne sont pas disponibles ou si la quantit de protine tester est insuffisante pour la dtection en immunofluorescence, une alternative est lutilisation de protine de fusion entre la protine dintrt et des protines naturellement fluorescentes comme la GFP (Green Fluorescent Protein) ou un de ses mutants (BFP Blue Fluorescent Protein, CFP - Cyan Fluorescent Protein ou encore YFP Yellow Fluorescent Protein). Le gne de la GFP a t initialement identifi

24/10/2011

201

chez la mduse Aequorea Victoria. Les autres protines (BFP, CFP, YFP, ) ont t produites par biotechnologie (mutagnse de la squence sauvage).

Avantage de cette technique : la visualisation est directe, on na donc plus de problmes de bruit de
fond li des interactions non spcifiques des anticorps (primaires et secondaires avec dautres constituants cellulaires). Dautre part, comme on contrle la quantit de protine produite, on nest donc plus limit par cette quantit.

Inconvnients : on ne travaille plus avec des protines endogne ni des concentrations


physiologiques. On nest donc pas assur davoir la localisation naturelle des protines tester.

Pour ces deux dernires techniques, linteraction nest pas prouve, on montre juste que cette interaction est possible de part la localisation des partenaires. Ces expriences ne sont donc en aucun cas suffisantes pour dmontrer une interaction.

FRET (Fster Resonance Energy Transfer)

Le FRET est une technique qui permet de dtecter la proximit de deux molcules. Chacune de ces molcules porte un groupement fluorescent et la technique repose sur le transfert, par rsonance, de lexcitation de lun de ces groupements (le donneur) lautre (laccepteur) sans mission dun photon. Pour cela, les deux partenaires de linteraction (protine A et B) doivent tre conjugus avec un couple de fluorophores de couleurs diffrentes (donneur et accepteur). On excite ensuite le donneur A. Quand linteraction entre A et B amne les colorants fluorescents faible distance lun de lautre, un signal de fluorescence nouveau (issu de lmission du receveur B) est dvelopp. La prsence de ce signal confirme la faible distance et donc linteraction entre A et B. Ces interactions peuvent tre suivies en temps rel grce une camra jointe au microscope fluorescence. Pour raliser le transfert dnergie de fluorescence, les spectres dabsorption de la premire molcule fluorescente (le donneur) et de la deuxime molcule fluorescente (laccepteur) doivent se superposer. La famille des GFP (Green Fluorescent Protein) offre diffrentes paires de mutants utilisables pour des expriences de FRET. Par exemple, le mutant appel EGFP (Enhanced GFP) et le mutant appell BFP (Blue Fluorescent Protein).

24/10/2011

202

Avantage de cette technique : La visualisation de linteraction se fait dans les cellules vivantes Inconvnients : on ne travaille pas sur des protines endognes.

BRET

Une variation de cette technique est le BRET (Bioluminescence Resonance Energy Transfert).
Dans cette variante, le donneur est une molcule capable dmettre des photons. Les photons mis iront, si la distance entre le donneur et laccepteur est suffisamment faible, exciter laccepteur. Gnralement, le donneur est la lucifrase de Renillla, qui sera fusionne une protine dintrt (protine A). La GFP est fusionne lautre protine dintrt (protine B), susceptible dinteragir avec la protine A. La lucifrase est excite laide dun substrat qui pntre dans la cellule (la clenterazine). La lucifrase de Renilla, initialement isole partir de lorganisme Renilla Reniformis (pense de mer) est une enzyme de 36 kDa qui catalyse l'oxydation de la coelentrazine en prsence doxygne. Cette raction catalytique produit une lumire bleue avec un pic d'mission 480 nm.

Si les deux protines ninteragissent pas, on ne dtecte que le signal mis par la lucifrase. Si les deux protines interagissent, il y a transfert dnergie entre la lucifrase et la GFP et lon peut mesurer un signal supplmentaire mis par la GFP 530 nm. Le transfert dnergie reflte une interaction physique troite : pour quil y ait transfert dnergie, la distance entre la lucifrase et la GFP doit tre infrieure 100 .

24/10/2011

203

Avantage de cette technique : Les mmes que pour le FRET mais, en plus, le BRET est plus sensible
que le FRET et elle permet de saffranchir dune source excitatrice extrieure vitant ainsi les problmes de photoblanchiment des GFP, deffet de filtre des milieux la longueur donde dexcitation du donneur ou encore de lexcitation croise de laccepteur.

Inconvnients : Les mmes que pour le FRET

6 - Cross-linking (association par des agents pontants)


On lutilisera en complment dune des techniques dcrites ci-dessus chaque fois que lon voudra stabiliser une interaction. Le principe consiste associer de faon covalente la protine tester avec son partenaire avant disoler le complexe. Cette technique nous permet de rvler des complexes prsentant des interactions de faible affinit. Elle peut aussi se raliser in vivo, condition que les agents crosslinkant utiliss traversent les membranes de la cellule. Enfin, en utilisant un ensemble dagents pontants qui agissent des distances variables, on pourra positionner les diffrents constituants au sein dun complexe multimolculaire.

Les agents cross-linkant chimiques :


Il existe un trs grand nombre dagents cross-linkant chimiques. Ils se distinguent : ) Par la nature du rsidu impliqu dans le cross-link (amine, sulfhydryls, carboxyls, hydroxyls,

24/10/2011

204

vivo)

Par la distance entre les deux espces cross-linker (de 1,5 plus de 30 A) Par la possibilit de rverser le cross-link (certains ne sont pas rversibles, dautres le sont en Le milieu dans lequel ils sont solubles (on choisira de prfrence ceux qui le sont en milieu Leur capacit traverser les membranes de la cellule (indispensable pour un cross-link in Le nombre de partenaires (deux ou plus) quils peuvent assembler,

prsence de thiols, dun milieu basique, ) aqueux pour un cross-link in vivo)

La socit Pierce en commercialise un trs grand nombre, toutes leurs caractristiques sont rpertories dans leur catalogue. Leur site sur le web www.piercenet.com permet mme un guide de slection de lagent cross-linkant en fonction de lexprience que lon veut raliser. Cette technique ne permet pas daffirmer quil y a interaction directe entre les deux partenaires, il peut y avoir seulement une proximit dans lespace qui peut tre due une interaction indirecte.

1. Caractrisation de linteraction
Quelle partie de la protine X interagit avec la protine Y Beaucoup de protines, en particulier des protines eucaryotes, prsentent une structure avec diffrents domaines structuraux indpendants. Dans ce cas, la protine peut tre dcoupe en diffrents morceaux capables de se structurer dans lespace indpendamment les uns des autres. Dans ce cas l (et dans ce cas l uniquement), on peut rechercher le ou les domaines impliqus dans linteraction protine/protine.

dfinition des domaines structuralement indpendants il est ncessaire de connatre la structure de la protine soit directement (RMN ou
cristallographie), soit parce quelle appartient une famille dont la structure est connue, soit parce quelle prsente des domaines structuralement identifis. Ex : 1 squence protique pour X bioinfo (voir TP bioinfo)-> 1 domaine POU (lui-mme constitu de deux sous domaines POUh et POUs), 1 domaine GLU, 1 domaine ring. Pour Y, pas de domaines structuraux dfinis
POU
GLU RING

24/10/2011

205

Clonage de ces sous domaines


clonage dans un vecteur dexpression, production, ventuellement purification (pas oblig) PCR

Etude de leur interaction (far western, coIP, pull down) avec Y reprable (marquage par exemple). Kd, Kon, stchiomtrie de linteraction, dtermination des paramtres de tampon,

9 Ultracentrifugation analytique
L'ultracentrifugation analytique (UCA) est une mthode de choix pour l'tude des interactions en solution. En effet, elle permet de dterminer les stchiomtries, les processus d'association, l'agencement spatial des sous-units dans des complexes, l'influence des paramtres du solvant (pH, sel, temprature). Il existe deux types principaux dexpriences de sdimentation :

vitesse de sdimentation quilibre de sdimentation


La plus utilise pour tudier les interactions protine/protine est la deuxime. Pratiquement, on va mesurer prcisment la masse des particules prsentes dans des solutions prsentant des concentrations croissantes en protine A, protine B, et protine A + protine B. On pourra ainsi en dduire si la protine A est prsente en solution sous forme dun monomre ou dun multimre idem pour la protine B si les protines A et B sassocient. Si cela est le cas, la stchiomtrie de linteraction sera dduite de la masse du complexe. Des expriences de diffusion de lumire (DLS Dynamic Light scattering) peuvent nous apporter en plus une information sur la forme du complexe, information qui peut nous aider proposer un modle dinteraction pour ce complexe.

9 Biacore

24/10/2011

206

La fonction de cet appareil est dj suggre par son appellation : "BIA" signifie Biospecific Interaction Analysis et "core", au cur de. En effet, le BIAcore est un automate qui permet de mesurer en temps rel toute interaction biologique sans marquage de molcules. L'intrt majeur de cette mesure en temps rel est de pouvoir visualiser, sur l'cran, la cintique de l'interaction et d'en dgager ses caractristiques propres. On peut ainsi mesurer les vitesses d'association et de dissociation et en dduire la constante d'affinit et la constante de dissociation Son principe de fonctionnement est d'enregistrer, en continu, la surface d'une lamelle ractive (appele "sensor chip") la modification de rsonance induite par toute interaction molculaire [rsonance plasmonique de surface ( S P R ) ] . Cette modification est directement proportionnelle la masse de molcule lie et sa quantit fixe sur le chip. Le systme de mesure est compos de trois lments : 1. Le sensor chip Il comprend une lamelle de verre sur laquelle est dpose une fine pellicule d'or elle-mme recouverte d'une couche de dextran carboxymthyl sur lequel on couple de faon covalente la premire molcule implique dans la raction que l'on veut tudier. Le couplage peut se faire par les groupements amines, par les sucres ou par les groupements thiols selon des procds de chimie classique. 2. La micro-plaquette fluidique Elle contrle l'injection (de 5 300 microlitres) et le dbit (de 1 100 microlitres/mn) des ractifs la surface du sensor chip. 3. L'unit optique Une lumire polarise est envoye sur un prisme de verre, en contact direct avec la lamelle de verre du sensor chip. Lappareil mesure et enregistre les changements de lindice de rfraction gnrs par un faisceau de lumire polarise dirige vers la face oppose de la feuille dor lors du processus dassociation et de dissociation de A et B. Le faisceau rflchi, qui est analys en temps rel par un ensemble de diodes, montre une extinction partielle pour un angle prcis dincidence, qui dpend de lindice de rfraction au voisinage de la feuille dor. Les signaux obtenus, mesurs en units arbitraires (units de rsonance ou RU) sont proportionnels la masse de B adsorbe la

24/10/2011

207

surface (pour les protines, 1 RU approximativement gal 1 pg.mm-2). Les courbes obtenues sont alors traites par le logiciel BIAevaluation -> constante dquilibre linterface Kd. L'interaction peut tre analyse rapidement en quelques minutes et ncessite de trs petits volumes de ractifs (80 microlitres en moyenne). En pratique, une protine ligand (A) est immobilise sur un support (chip). On distingue alors trois phases : 1 - Phase dadsorption : un tampon circule en flux continu sa surface. Dans ce tampon se trouve la protine (B) qui interagit avec la protine (A). 2 - Phase de dsorption : un tampon nincluant pas B est inject, conduisant une dissociation progressive des complexes AB forms. 3 Phase de rgnration : la dissociation est brutalement acclre, aboutissant une surface vierge de B, comme au dbut de lexprience.

Microcalorimtrie [Microcalorimtrie isotherme titration (ITC)]

1) Principe et mthode

24/10/2011

208

Afin de mesurer linteraction entre deux molcules et les paramtres thermodynamiques qui en dcoulent, il est ncessaire de mesurer les changes thermiques dus aux associations entre ces molcules. Le principe est le suivant : une macromolcule est place dans la cellule de mesure dun calorimtre isotherme puis est progressivement sature par injection laide dune seringue de petits volumes de la deuxime molcule. Linteraction entre 2 molcules peut saccompagner dun change de chaleur (absorption ou mission). Le suivi des interactions va se faire indirectement par suivi des changes thermiques. Prenons lexemple dun ligand se fixant sur une protine : En fonction de la quantit de complexe forme, on obtient des signaux thermiques proportionnels qui seront visualisables sous forme de pics grce un logiciel (Origin). La mesure du signal thermique permet donc de mesurer la quantit de complexe form, et ainsi de mesurer les paramtres thermodynamiques de linteraction.

Ligand + protine = complexe + H

Ainsi, la microcalorimtrie isotherme titration permet de mettre en vidence et de quantifier les interactions entre diverses familles de protines et leurs ligands potentiels et les modifications structurales qui en dcoulent. Interactions molculaires structure 3D

Une protine se replie et acquiert une conformation particulire dans l'espace. C'est cette structure tridimensionnelle qui dtermine la fonction que va jouer la protine dans la cellule. Connatre cette structure est donc une tape-cl si l'on veut comprendre le dtail des mcanismes de la cellule, par

24/10/2011

209

exemple pour concevoir des mdicaments. Pour tudier la structure tridimensionnelle des protines, mais aussi des complexes protine/protine, il y a plusieurs approches possibles :

9 La RMN (Resonnance Magntique Nuclaire) On excite les atomes de la molcule tudie. Chaque atome rsonne une frquence qui lui est propre et qui dpend de son environnement magntique. L'atome rmet un signal cette frquence. La superposition des signaux provenant de tous les atomes est enregistre puis analyse. En jouant sur les diffrents types d'atomes et en utilisant des squences d'excitation particulires, on peut faire apparatre de faon slective certaines proprits gomtriques comme la proximit de deux atomes travers l'espace ou leur proximit dans le squelette de la molcule. Contrairement la cristallographie, l'analyse des spectres de RMN ne donne pas accs immdiatement la structure tridimensionnelle. Il faut d'abord attribuer chaque frquence de rsonance l'atome correspondant dans la molcule, puis utiliser les donnes gomtriques observes pour calculer la structure tridimensionnelle globale. Aujourd'hui, la RMN est limite par la rsolution des spectres, qui dpend directement de la puissance des champs magntiques utiliss pour exciter les atomes.
La RMN en phase liquide est la seule mthode amenant la structure atomique de macromolcules en solution. Elle comporte cependant des contraintes significatives sur la taille des molcules tudies (30 40 kDa au plus) comme sur leurs proprits de solubilit. La RMN du solide ouvre quant elle des possibilits intressantes, mais encore peu exploites, pour ltude de macromolcules sous forme de poudre (donc non cristallisable) et pour les protines membranaires.

9 Cristallographie et diffraction aux rayons X


En envoyant des rayons X sur un cristal de protines, on observe un spectre de diffraction. Grce une transformation mathmatique simple, il est possible d'accder rapidement la structure tridimensionnelle des protines dans le cristal. L'tape limitante de cette mthode est la production d'un cristal pur (un monocristal). Elle peut tre plus ou moins difficile, de faon plutt imprvisible. Amlioration de la technique : le rayonnement synchrotron. Le rayonnement synchrotron permet la production dun rayonnement X intense, stable, de longueur donde variable et de grande qualit optique. Ils offrent des donnes exploitables pour des cristaux de macromolcules que des mthodes classiques ne permettaient pas dtudier : mailles plus grandes (et donc molcules ou complexes plus grands), cristaux plus petits voire imparfaits. Dautre part, le rayonnement synchrotron a considrablement acclr la vitesse dacquisition des donnes, rduisant celle-ci quelques heures au lieu de quelques semaines. La trs grande majorit des tudes cristallographiques contemporaines reposent sur lutilisation de donnes collectes partir dun synchrotron.

9 In silico
Il est possible de prdire in silico la structure tridimensionnelle d'une protine X par homologie par rapport une autre protine, de structure connue et prsentant des homologies structurales avec la protine X.

24/10/2011

210

La prdiction ab-initio du repliement, sans autre information que la seule squence de la protine, reste encore largement hors de porte, sauf cas exceptionnels. La mthode ab-initio ncessite des puissances de calcul importantes. Toute molcule dessine doit tre minimise, cest dire que sa conformation doit tre amene une position stable. Cette procdure appele minimisation est un processus itratif dans lequel les coordonnes des atomes sont constamment ajustes jusqu' amener la molcule une nergie minimale. La conformation ayant la plus basse nergie est considre comme la plus stable. Le docking est l'tude des interactions entre molcules. Dautre part, diffrents programmes ou serveurs permettent soit de prdire les rgions protiques permettant ventuellement une protine dinteragir avec une autre, soit de retrouver une interaction dj mise en vidence dans le pass. Quelques exemples de ce type de sites : banques dinteraction protine/protine DIP : Database of Interacting Proteins : http://dip.doe-mbi.ucla.edu Cette banque de donne catalogue les interactions (dtermines exprimentalement) entre protines. Ce site prsente un accs libre sur Internet et est suppos aider ceux qui tudient les interactions protine/protine, les voix de signalisation les interactions multiples et les systmes complexes. prdiction de surfaces potentielles dinteraction Protein protein Interaction server : http://www.biochem.ucl.ac.uk/bsm/PP/server Ce serveur nous fourni un moyen de calculer une srie de paramtres descriptifs sur linterface entre deux chanes polypeptidiques dans une structure protique tridimensionnelle. En comparant ces rsultats avec des rsultats obtenus avec des protines connues pour interagir les unes avec les autres, on peut estimer la validit de linterface prdite entre nos deux protines. Inconvnient : ce programme ne fonctionne actuellement que sous Unix et ncessite une bonne connaissance en biologie structurale et en bioinformatique.

9 Applications conception de peptides inhibiteurs


Lorsqu'un compos actif de base (LEAD) a t identifi (exprimentalement ou in silico) et sa structure chimique dtermine, on peut amliorer l'activit et/ou rduire les effets secondaires en modifiant sa structure chimique de base. Les peptides sont subsquemment optimiss par des modifications apportes aux chanes latrales ou au squelette de base. On peut ainsi concevoir des peptides avec des affinits suprieures la cible (par

24/10/2011

211

rapport la molcule de dpart). Mais le plus grand dfi qui reste surmonter dans le cas des inhibiteurs peptidomimtiques est de modifier ceux-ci pour qu'ils puissent tre absorbs oralement et qu'ils ne se dcomposent pas rapidement dans lorganisme. Il faut alors trouver des inhibiteurs de type nonpeptidique.

24/10/2011

212

Rfrences

Adams M.D., Kelley J.M., Gocayne J.D., Dubnick M., Polymeropoulos M.H., Xiao H., Merril C.R., Wu A., Olde B., Moreno R.F., Kerlavage A.R. McCombie W.R. et Venter J.C. (1991) Science 252, 1651-1656. Ahmad A., Akhtar M.S. et Bhakuni V. (2001) Biochemistry 40, 1945-55. Ahern T.J. et Klibanov A.M. (1986) Dans Protein Structure, Folding and Design, 283-286, Alan R. Liss ed. Ahmadian A., Gharizadeh B., Gustafsson A.C., Sterky F., Nyrn P., Uhln M. et Lundeberg J. (2000) Anal. Biochem. 280, 103-110. Andersson M.M., Breccia J.D. et Hatti-Kaul R. (2000) Biotechnol. Appl. Biochem. 32, 145-53. Arakawa T. et Timasheff S. (1982) Biochemistry 21, 6545-6552. Arakawa T., Bhat R. et Timasheff S. (1990) Biochemistry 29, 1914-1923. Aronheim A., Zandi E., Hennemann H., Elledge S.J., Karim M. (1997) Mol. Cell. Biol. 17, 30943102. Bachman B., Luke W. et Hunsmann G. (1990) Nucleic Acid Res. 18, 1309. Bachmsair A., Findley D. et Varshavsky A. (1986) Science 234, 179-186. Baird G.S., Zacharias D.A. et Tsien R.Y. (2000) Proc. Natl. Acad. Sci. U.S.A. 97, 11984-11989. Baldwin E. Xu J. Hajiseyedjavadi O. Baase W. A. Matthews B. W. (1996) J. Mol. Biol. 259, 542559. Bambara R.A., Uyemura D. et Choi, T. (1978) J. Biol. Chem. 253, 413-423 Baskakov I. et Bolen D.W. (1998) Biophys J. 74, 2658-2665. Barnard G.C., Henderson G.E., Srinivasan S. et Gerngross T.U. (2004) Protein Expression Purif. (In press) Barnes W.M. (1994) Proc. Natl. Acad. Sci. 91, 2216-2220. Barr P.J. et al. (1986) Biotechniques 4, 428. Bernard (1995) Gene 162, 159-160. Bielefeldt-Ohmann et Fitzpatrick (1997) Biotechniques 23, 822-824. Bevis B.J. et Click B.S. (2002) Nat. Biotechnol. 20, 83-87. Blaber M., Baase W. A., Gassner N. et Matthews, B. W. (1995) J Mol Biol 246, 317-30

24/10/2011

213

Blais B.W., Turner G., Sooknanan R. et Malek L.T. (1997) Appl. Environ. Microbiol. 63, 310313. Brenner M., Kisseberth W.C., Su, Y., Besnard F. et Messing A. (1994) J. Neurosci. 14, 10301037. Brunk C. F., Jones K.J. et James T.W. (1979) Anal. Biochem. 92, 497-500. Burton K. (1956) Biochem. J. 62, 315-323. Carninci P., Shiraki T., Mizuno Y., Muramatsu M., Hayashizaki Y. (2002) BioTechniques 32, 984-985. Cha J. (1993) Gene 136, 369-370. Chakrabarti G., Kim S., Gupta M.L. Jr, Barton J.S. et Himes R.H. (1999) Biochemistry 38, 30673072. Chakrabarti R. et Schutt C.E. (2002) BioTechniques 32, 866-874. Chakrabartty A., Schellman J. A. et Baldwin R. L. (1991) Nature 351, 586-588. Chakrabartty A. et Baldwin, R. L. (1995) Adv Protein Chem 46, 141-76. Chamberlain J.S., Gibbs R.A., Ranier J.E. Nguyen P.N.et Casley C.T. (1988) Nucleis Acid Res.

16, 11141-11156.
Chatterjee D.K. et Esposito D. (2005) Protein Exp Purif sous presse Chen B. et Przybyla A.E. (1994) Biotechniques 17, 657-659. Cheng S., Fockler C., Barnes W.M. et Higuchi R. (1994) Proc. Natl. Acad. Sci. USA 91, 56955699. Cho R., Campbell M.J., Winzeler E.A., Steinmetz L., Conway A., Wodicka L., Wolfsberg T.G., Gabrielian A.E., Landsman D., Lockahart D.J. et Davis R.W. (1998) Mol. Cell. 2, 65-73. Chong S., Shao Y., Paulus H., Benner J., Perler F.B. et Xu M-Q. (1996) J. Biol. Chem. 271, 22159-22168. Chong S., Mersha F.B., Comb D.G., Scott M.E. Landry D., Vence L.M., Perler F.B., Benner J., Kucerra R.B., Hirnoven C.A., Pelletier J., Paulus H. et Xu M-Q. (1997) Gene 192, 271281. Chong S., Montello G.E., Zhang A., Cantor E.J., Liao W., Xu M-Q. et Benner J. (1998) Nucl. Acid Res. 26, 5109-5115. Chong Y. et Chen H. (2000) BioTechniques 29, 1166-1167.

24/10/2011

214

Citti L., Rovero P., Colombo M.G., Mariani L., Poliseno L. et Rainaldi G. (2002) BioTechniques

32, 172-177.
Clark (1988) Nucleic Acid Res. 16, 9677-9686. Compton J. (1991) Nature 350, 91-92. Cormack B.P., Valdivia R.H., Falkow S. (1996) Gene 173, 33-38. Cotton R.G.H., Rodrigues N.R. et Campbell R.D. (1988) Proc. Natl. Acad. Sci. U.S.A. 85, 43974401. Crameri A., Whitehorn E.A. Tate E., Stemmer W.P. (1996) Nat. Biotechnol. 14, 315-319. Dao-pin, S., Sauer, U., Nicholson, H. et Matthews, B.W. (1991) Biochemistry 30, 7142-7153. Davies M. J., Taylor J. I., Sachsinger N. et Bruce I.J. (1998) Anal. Biochem. 262, 92-94. Daxelet G.A., Coene M.M., Hoet P.P. et Cocito C.G. (1989) Anal. Biochem. 179, 401-403. De Boer H.A., Comstock L.J. et Vasser M. (1983) Proc. Natl. Acad. Sci. USA 80, 21-25. DePaz R.A., Barnett C.C., Dale D.A., Carpenter J.F., Gaertner A.L. et Randolph TW. (2000) Arch. Biochem. Biophys. 384,123-32. Di Donato A., de Nigris M., Russo N., Di Biase S. et DAlessio G. (1993) Anal. Biochem. 212, 291-293. Ebel C., Faou P., Kernel B. et Zaccai G.(1999) Biochemistry 38, 9039-47 Felix C. F., Moreira C. C., Oliveira M. S., Sola-Penna M., Meyer-Fernandes J. R., Scofano H. M. et Ferreira-Pereira A. (1999). Eur. J. Biochem. 266, 660-664. Feng L., Chan W.W., Roderick S.L. et Cohen D.E. (2000) Biochemistry 39, 15399-15409. Fisher C.L. et Pei (1997) Biotechniques 23, 570-574. Finucane M. D. Woolfson D. N. (1999) Biochemistry 38, 11613-11623. Flory D.J. (1956) J. Am. Chem. Soc. 78, 5222-5235. Futami J., Tada H., Seno M., Ishikami S. et Yamada H. (2000) J Biochem (Tokyo). 128, 245-50. Ganter C. et Pluckthun A. (1990) Biochemistry 29, 9395-9402. Gossen M. et Bujard H. (1992) Proc. Natl. Acad. Sci. USA, 89, 5547-5551. Gossen M., Freundlieb S., Bender G., Mller G., Hillen W. et Bujard H. (1995) Science 268, 1766-1769. Gould S. J., Subramani S. et Scheffler I.E. (1989) Proc. Natl. Acad. Sci. USA 86, 1934-1938. Graham Jr R.C. et Karnovsky M.J. (1966) J. Histochem. Cytochem. 14, 291-302. Griffin B.A., Adams S.R. et Tsien R.Y. (1998) Science 281, 269-272.

24/10/2011

215

Gritson T.S., Mikhailov M.V., Roy P. et Gould E.A. (1977) Nucleic Acid Res. 25, 1864-1865. Grutter M.G., Gray, T.M., Weaver, L.H., Wilson, T.A. et Matthews B.W. (1987). J Mol Biol. 197, 315-29. Guan C. di, Li P., Riggs P.D. et Inouye H. (1988) Gene 67, 21-30. Hanes O. et Plckthun A. (1997) Proc. Natl. Acad. Science USA 94, 4937-4942. Hasan N et Szybalski W. (1995) Gene 163, 35-40. Hawley D.K. et McClure W.R. (1983) Nucleic Acids Res. 11, 2237-2255. Hecht M. H., Sturtevant J. M. et Sauer R. T. (1986) Proteins 1, 43-46. Hill B.T. (1976) Anal. Biochem. 70, 635-638. Hirschel B.J., Shen V. et Schlessinger D. (1980) J. Baceriol. 143, 1534-1537. Ho A. et al. (2001) Cancer Res. 61, 474-477. Hoff H., Random J. et Bricca G. (1999) Anal. Biochem. 268, 398-401. Hom L.G. et Volkman L.E. (1998) Biotechniques 25, 20-22. Hopp T et al., (1988) Biotechnology 6, 1204-1210. Irun M.P., Maldonado S.et Sancho J. (2001) Protein Eng. 4, 173-81 Jiang X., Kowalski J. et Kelly J.W. (2001) Protein Sci.10, 1454-65. Johnson R.E., Adams P. et Rupley J.A. (1978) Biochemistry 17, 1479-1484. Johnsson N. et Varshavsky A. (1994) Proc. Natl. Acad. Sci. USA, 91, 10340-10344. Kaplan, H.A., Welpy, J.K. et Lennarz, W.J. (1987) Biochim. Biophys. Acta 906, 161-173. Karpeisky M.Y., Senchenko V.N., Dianova M.V. et Kanevsky V (1994) FEBS Lett 339, 209-212. Keefe A.D., Wilson D.S., Seelig B. et Szostak J.W. (2001) Protein Expr Purif 2001, 440-446. Kennedy D.G., Nelson J., van den Berg H.W. et Murphy R.F. (1987) Anal. Biochem. 167, 127127. Kinney J., Leippe D., Lewis K., Lyke B., Mandrekar M. et Shultz J. Promega notes 73, 3-7. Khanna R., Myers M.P., Laine M. et Papazian D.M. (2001) J Biol Chem. Jun 26 [epub ahead of print]) Kholod N. et Mustelin T. (2001) Biotechniques, 31,322-328. Kondoh N., Wakatsuki T., Ryo A., Tanaka K., Hada A., Shichita M. et Yamamoto M. (1999) Anal. Biochem. 269, 427-430. Krest I. et Keusgen M.(1999) Pharmazie 54, 289-93 Kunkel T.A. (1985) Proc. Natl. Acad. Sci. U.S.A. 82, 488-492.

24/10/2011

216

Kwon Y.K., Murray M.T. et Hecht N.B. (1993) Dev. Biol. 158, 90-100. LaVallie E.R., DiBlasio E.A., Kovacic S., Grant K.L., Schendel P.F. et McCoy J.M. (1993) Bioctechnology 11, 187-193. Langemeier J.L., Cook F., Issel C.J.et Montelaro R.C. (1994) Biotechniques 17, 486-490. Lelong JC, Prevost G, Lee K, Crepin M.(1989) Anal. Biochem. 179, 299-303 Le Peck, J.-B. et Paoletti , C. (1966) Anal. Biochem. 17, 100-107. Letsinger, R.L. et al. (1989) Proc. Natl. Acad. Sci - USA 86, 6553. Leush M.S., Lee S.C. et Ollins P. (1995) Gene 160, 191-194. Lewis,R.V., Hinman, M., Kothakota, S., Fournier, M.J. (1996) Protein expression Purif. 7, 400406. Liang P. et Pardee (1992) Science 257, 967-969. Lin S.H., Konishi Y., Denton M.E. et Scheraga, H.A. (1984) Biochemistry 23, 5504-5512. Lippert K. et Galinski E.A. (1992) Appl. Microbiol. Biotechnol. 37, 61-65. Looman A.C., Bodlaender J., Comstock L.J., Eaton D., Jhurani P., de Boer H.A. et van Knippenberg P.H. (1987) EMBO J. 6, 2489-2492. Luckow V.A., Lee S.C., Barry G.F. et Olins P.O. (1993) J. Virol. 67, 4566-4579. Lutz R. et Bujard H. (1997) Nucl. Acid. Res. 25, 1203-1210. Majunder K. (1992) Gene 110, 89-94. Makarova O., Kamberov E. et Margolis B. (2000) BioTechniques 29, 970-972. Manstein D.J., Schuster H-P, Morandini P. et Hunt D.M. (1977) Gene 162, 129-134. Margarit, I., Campagnoli, S., Frigerio, F., Grandi, G., De Filippis, V. et Fontana, A.(1992) Protein Eng 5, 543-50. Mariac C., Trouslot P., Poteaux C., Bezanon G. et Renno J.-F. Biotechniques 28, 110-113. Maruyama, I.N., Rakow, T.L., Maruyama, H.I. (1995) Nucl. Acid. Res. 23, 3796-3797. Matsumura M., Becktel W.J., Levitt M. et Matthews B.W. (1989) Proc. Natl. Acad. Sci. USA 86, 6562-6566 Meerman H.J. et Georgiou G. (1994) Biotechnology 12, 1107-1110. Mitraki A. et King J. (1989) BioTechnology 7, 690-697. Mok Y.K., Elisseeva E.L., Davidson A.R. et Forman-Kay J.D. (2001) J Mol Biol. 307, 913-28. Monia B.P., Lesnik E.A., Gonzalez C., Lima W.F., McGee D., Guinosso C.J., Kawasaki A.M., Cook P.D. et Freier S.M. (1993) J. Biol. Chem., 268, 1451414522.

24/10/2011

217

Morawski B., Quan, S. et Arnold F.H; (2001) Biotech. Bioengin. 76, 99-107. Mller W., Weber H., Meyer F. et Weissmann C. (1978) J. Mol. Biol. 124, 343-358. Munoz V. et Serrano L. (1994) Proteins 20, 301-311. Myers R.M., Larin Z. et Maniatis T. (1985) Science 230, 303-305. Myers R.M., Lumelsky N., Lerman L.S. et Maniatis T. (1985) Nature 313, 495-498. Nakamaye K. et Eckstein F. (1986) Nucleic Acid Res. 14, 9679-9698. Nilsson B. et Abrahmsen L. (1990) Methods Enzymol. 185, 144-161. Noren C.J., Anthony-Cahill M.C., Griffith M.C., Schultz P.G. (1989) Science 244, 182-188. OHare P. et Elliot G. (1997) Cell 88, 223-233. ONeil K.T. et DeGrado W.F. (1990) Science 250, 646-651. Ochman H., Gerber A.S. et Hartl D.L. (1988) Genetics 120, 621-623. Oefner P.J. et Underhill P.A. (1995) Am. J. Hum. Genet. 57 suppl, A266 Ohmura T., Ueda T., Ootsuka K., Saito M. et Imoto T (2001) Protein Sci. 10, 313-320. Oleykowski C.A., Bronson C.R., Godwin A.K. et Yeung A.T. (1998) Nucleic Acid Res. 26, 45974602. Oliphant A.R et Struhl K. (1988) Nucleic Acid Res. 16, 7673-7683. Oliphant A.R et Struhl K. (1989) Proc. Natl. Acad. Science USA 86, 9094-9098. Olson P, Zhang Y., Olsen D., Owens A., Cohen P., Nguyen K., Ye J-J., Bass S. et Mascarenhas D. (1998) Prot. Exp. Purif. 14, 160-166. Olson C.A., Spek E.J., Shi Z., Vologodskii A. et Kallenbach N.R. (2001) Proteins 44,123-132. Orita M. Iwahana H., Kanazawa K., Hayashi K et Sekiya T. (1989) Proc. Natl. Acad. Sci. 86, 2766-2770. Ozawa T., Nogami S., Sato M., Ohya Y. et Umezawa Y. (2000) Anal. Chem. 72, 5151-5157. Paabo S., Irwin D.M. et Wilson A.C. (1990) J. Biol. Chem. 265, 4718-4721. Pace, C. N. et Scholtz, J. M. (1998) Biophys J. 75, 422-7. Pace C.N., Horn G., Hebert E.J., Bechert J., Shaw K., Urbanikova L., Scholtz J.M. et Sevcik J. (2001) J. Mol. Biol. 312, 393-404. Pakula AA et Sauer RT (1990) Nature 344, 363-364. Pan S-H. et Malcolm B.A. (2000) Biotechniques 29, 1234-1238. Panjkovich A. et Melo F. (2005) Bioinformatics 21, 711-722.

24/10/2011

218

Pantoliano M.W., Ladner R.C., Bryan P.N., Rollence M.L., Wood J.F. et Poulos T.L. (1987) Biochemistry 26, 2077-2082 Parker J.D., Rabinovitch P.S. et Burmer G.C. (1991) Nucl. Acid Res. 19, 3055-3060. Parks D., Leuther K.K., Howard E., Johnston S.A. et Dougherty W.G. (1994) Anal. Biochem. 216, 416-417. Paris P.L., Langenham J.M. et Kool E.T. (1998) Nucl. Acid Res. 26, 3789-3793. Paulmurugan, R. et Gambhir, S.S. (2003) Anal. Chem. 75, 1584-1589. Pelletier J. et Sonenberg N. (1988) Nature 334, 320-325. Perl D. Mueller U. Heinemann U. et Schmid F. X. (2000) Nature Struct. Biol. 7, 380-383 Persson M., Bergstrand M.G., Bulow L.et Mosbach K. (1988) Anal. Biochem. 172, 330-337. Perutz, M.F. and Raidt, H. (1975) Nature 255, 256-259. Peterson, R.W., Nicholson, E.M., Thapar, R., Klevit, R.E. et Scholtz, J.M. (1999) J. Mol. Biol.

286, 1609-1619.
Porath J., Carlsson J., Olsson I. et Belfrage G. (1975) Nature 258, 598-599. Powell J. (1998) Nucleic Acid Res. 26, 3445-3446. Prasher D.C., Eckenrode V.K., Ward W.W., Prendergast F.G., Cormier M.J. (1992) Gene 111, 229-233. Predki P. F., Nayak L. M., Gottlieb M. B. et Regan L. (1995) Cell 80, 41-50. Raschthian A., Buchman G.W., Schuster D.M. et Berninger M.S. (1992) Anal. Biochem. 206, 9197. Reddy A., Grimwood B.G., Plummer T.H. et Tarentino A.L. (1998) Glycobiology 8, 633-638. Ringquist S., Shinedling S., Barrick L., Green L., Bindley J., Stormo G.D. et Gold L. (1992) Mol. Microbiol. 6, 1219-1229. Ronaghi M., Uhln M. et Nyrn P. (1998) Science 281, 363-364 Rosenthal A. et Jones D.S.J. (1990) Nucl. Acid Res. 18, 3095-3096. Ross-Macdonald P., et al. (1999) Nature 402, 413-417. Rossi, F., Charlton C.A. et Blau, H.M. (1997) Proc. Natl. Acad. Sci. USA, 94, 8405-8410. Russel M., Kidd S. et Kelly M.R. (1986) Gene 45, 333-338. SantaLucia J.Jr., Allawi H.T. et Seneviratne P.A. (1996) Biochemistry 35, 3555-3562. Sarkar G. et Sommer S.S. (1990) Biotechniques 8, 404-407. Sarkar G., Yoon H.S. et Sommer S.S. (1992) Genomics 13, 441-443.

24/10/2011

219

Sassenfeld H.M. et Brewer S.J. (1984) Bio/Technology 2, 76-81 Sauge-Merle S., Falconet D. et Fontecave M. (1999) Eur. J. Biochem. 266, 62-69. Schauder B et McCarthy J.E.G. (1989) Gene 78, 59-72. Schaeffer B.C. (1995) Schalling M., Hudson T.J, Buctow K.H.et Housman D.E. (1993) Nat. Genet. 4, 135-139. Schatz P.J. (1993) Biotechnology 11, 1138-1143. Schildkraut C et Lifton S. (1965) Biopolymers 3, 3555-3562. Schmidt T.G.M. et Skerra, A. (1993) Protein Eng. 6, 109-122. Scholz O., Thiel A., Hillen W. et Niederweis M., (2000) Eur. J. Biochem. 267, 1565-1570. Scott M.R.D., Westphal K-H et Rigby P.W.J. (1983) Cell 34, 557-567. Sektas M., Hasan N. et Szybalski W. (2001) Gene 267, 213-220. Shakin-Eschleman S., Spitalnik S. L. et Kasturi L. (1996) J. Biol. Chem. 271, 6363-6366. Shpigel E., Elias D., Cohen I.R. et Shoseyov O. (1998) Prot. Exp. Purif. 14, 185-191. Short J.M., Fernandez J.M., Sorge J.A. et Huse W.D. (1988) Nucleic Acid Res. 16, 7583-7600. Shortle D. et Nathans D. (1978) Proc. Natl. Acad. Sci. USA 75, 2170-2174. Shuman S. (1994) J. Biol. Chem. 269, 32678-32684. Siebert P.D., Chenchik A., Kellogg D.E., Lukyanov K.A. et Lukyanov S.A. (1995) Nucl. Acid . Res. 23, 1087-1088. Skerra A. (1994) Gene 151, 131-135. Smith H.W. (1975) Nature 255, 500-502. Smith D.B. et Johnson K.S. (1988) Gene 67, 31-40. Sommer S.S., Groszbbach A.R. et Bottenma C.D.K. (1992) BioTechniques 12, 82-87. Southern E.M. (1975) J. Mol. Biol. 98, 503-517. Song S.B., Kim K.K.et Kim K.E. (2002) BioTechniques 32, 248-252. Srinivasan S., Barnard G.C. et Gerngross T.U. (2002) Applied Environ. Microbiol. 68, 5912-5932. Stemmer, W.P.C., Crameri, A., Ha, K.D., Brennan, T.M. et Heyneker, H.L. (1995) Gene 164, 4953. Stofko-Hahn R.E., Carr D.W. et Scott J.D. (1992) FEBS Lett. 302, 274-278. Studier F.W. (1991) J. Mol. Biol. 219, 37-44. Studier F.W. et Moffatt B.A. (1986) J. Mol. Biol. 189, 113-130. Tabor S. et Richardson C.C. (1995) Proc. Natl. Acad. Sci. U.S.A. 92, 6339-6343.

24/10/2011

220

Tams J.W. et Welinder K.G. (2001) Biochem. Biophys. Res. Comm. 286, 701-706. Taniguchi K., Nomura K., Hata Y., Nishimura T., Asami Y., Kuroda A. (2007) Biotechnol. Bioeng. 96, 10231029. Thalhammer, S., Stark, R.W., Schtze, K et Heckl, W.M. (1997) Thomas C.A.J. et Dancis B.M. (1973) J. Mol. Biol. 77, 43-55. Ueda T., Yamada H., Hirata M. et Imoto T. (1985) Biochemistry 24, 6316-6322. de Valdivia E.I.G et Isaksson L.A. (2005) FEBS J. 272, 5306-5316. Van Dyke M.W., Sirito M. et Sawadogo M. (1992) Gene 111, 99-104. Van Hest J.C.M., Kiick K.L., Tirrell D.A., (2000) J. Am. Chem. Soc. 122, 1282Vartamian J.P., Henry M., Wain-Hobson, S. (1996) Nucleic Acids Res. 24, 2627-2631. Velculescu V.E., Zhang L., Volgelstein B. et Kinzler K.W. (1995) Science 270, 484-487. Viazov S., Zibert A., Ramakrishnan K., Widell A., Cavicchini A., Schreier E. et Roggendorf M. (1994) J Virol Methods 48, 81-91. Waldburger C. D. Schildbach J. F. et Sauer R. T. (1995) Nature Struct. Biol. 2, 122-128. Wang M., Doyle M.V. et Park D.F. (1989) Proc. Natl. Acad. Science USA 86, 9717-9721. Wang D.G. et al. (1998) Science 280, 1077-1082. Wang L., Brock A., Herberich B., Schultz P.G. (2001) Science 292, 498-500. Watson D.E. et Bennett G.N. (1997) BioTechniques 23,858-862. Weijers S. R. et vant Riet K. (1992) Biotechnol. Adv. 10, 237249. West M. et Wilson V.G. (2002) BioTechniques 32, 44-46. Wetzel R., Perry L.J., Baase W.A. et Becktel W.J. (1988) Proc. Natl. Acad. Sci. USA 85, 401-405. Wieland I., Bolger G, Asouline G., Wigler M. (1990) Proc. Natl. Acad. Sci. 87, 2720-2724. Zamecnik P.C. et Stephenson M.L. (1978). Proc. Natl. Acad. Sci. USA, 75, 280-284. Zabner J., Fasbender A.J., Moninger T, Poellinger K.A. et Welsh M.J. (1997) J. Biol. Chem. 270, 18997-19007. Zaccolo M., Williams D.M., Brown D.M., Gherardi E. (1996) J. Mol. Biol. 225, 589-603. Zhen G. et Lyons G. (2002) BioTechniques 33, 32-36. Zhou M. et Hatalet Z. (1995) Nucleic Acid Res. 23, 1089-1090.

24/10/2011

221

Fournisseurs
Clonteck : www.clonteck.com In Vitrogene : www.invitrogen.com Perbio : www.perbio.com Gene Therapy Sustem Inc : www.genetherapysystems.com

24/10/2011

222

Index

A
adenovirus, 285 ADNc, 58 ADN-T, 274 Adriamycine, 12 AFLP, 230 Agrobacterium tumefasciens, 274 alfavirus, 287 Aminoglycosides, 44 Aminopteridine, 46 ampicilline, 45 Amplification, 99 Amplification dARN, 105 AP-PCR, 234 ARN polymrase, 29

digoxignine, 69 diphenylamine, 13 DNase I, 17 DNases, 16 double hybride, 150

E
enterokinase, 319 Erythromycine, 43 exonuclases, 16

F
facteur Xa, 319 Far-Western, 347

B
BAC, 40 Bacillus, 263 Baculovirus, 276 banque, 58 banque de cDNA, 124 Banque de saut, 147 biotine, 68 bisbenzimide, 10 Blasticidine, 46 blot overlay, 348 Bovine Papilloma Virus, 284 Bridging PCR, 106 Bromodesoxyuridine, 47 bromure d'thidium, 9

G
G418, 47 GFP, 317 glancicovir, 47 glutathion S-transfrase, 315 glycosidase, 32 Green fluorescent protein, 317 GST pull down, 347

H
HcRed, 317 HIS-tag, 316 Histidinol, 47 Hoechst, 10 hot start, 101 Hybridation, 78 hybridation soustractive, 157 Hygromycine B, 48

C
chitine, 318 Chloramphenicol, 44 corps dinclusion, 327 cosmide, 41 Cristal violet, 12

I
IMA, 234 Intein, 320

D
DAF, 234 DAPI, 11 ddF, 224 DDPCR, 160 dnaturation, 78 DGGE, 224 Dictyostelium discoideum, 272 didoxynuclotide, 77 differential display, 160 Jumping PCR, 106

J K
kanamycine, 45

L
lentivirus, 284

24/10/2011
ligase, 30 RFLP, 222, 229 ribosome display, 122 Rifampicine, 46 RNases, 22

223

M
M13, 38 MAAP, 234 Macrolides, 43 maltose binding protine, 315 Maxam et Gilbert, 89 Methotrexate, 48 mthylase, 32 Microsatellites, 232 minisatellites, 232 mithramycine, 13 Mitomycine C, 48 Molecular beacons, 103 mung bean, 18 mutagense, 108 mutation, 213

S
Saccharomyces cerevisiae, 266 Sanger, 90 Schizosaccharomyces pombe, 269 scintillation proximity assay, 347 squence, 89 sonde, 68 Southern, 83, 216 South-Western, 350 SPA, 347 SSCP, 223 streptavidine, 69, 315 SV40, 284

N
NASBA, 105 nick translation, 73 northern, 86 North-Western, 350 Nuclase S1, 17 Taq DNA pol, 26 tlomrase, 28 Terminal transfrase, 28 Ttracycline, 44 Tetracystine, 318 TEV, 319 Thioredoxine, 316 thrombine, 319 Tm, 78 topoisomrase, 30 traduction, 236 Trichoderma reesei, 272 tsp, 180

O
Oubaine, 48

P
PAC, 40 PASA, 219 PCR, 99 phage, 36 phage display, 131 phagemide, 40 Phosphatase, 31 Pichia pastoris, 270 plasmide, 34 polymrase, 23 polymorphisme, 229 protase, 318 Puromycine, 49 Pyrosequencing, 92

V
vaccine, 285 Vancomycine, 45 Viomycine, 45

X
Xnope, 283 Xyl-A, b-D-Xylofuranosyl, 49

Y R
YAC, 40

Ramdom priming, 74 RAPD, 234 restriction, 18 rtrovirus, 286 reverse transcriptase, 27

Zap, 41