Vous êtes sur la page 1sur 96

République Algérienne Démocratique et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique


Université Ferhat Abbas Sétif -1-
PRODUCTION DE PROTÉINES
Faculté des Sciences RECOMBINANTES
de la Nature et de la Vie
Département de Biochimie

Polycopié de cours :

Production de Protéines Recombinantes


Master 1 Immunologie

Mme BOUZAHAR.DEFFAR Khalissa

Mars 2017

0
PRODUCTION DE PROTÉINES RECOMBINANTES

Sommaire
INTRODUCTION ....................................................................................................................................... 1
1. OBJECTIFS D’UNE PRODUCTION DE PROTÉINES EN SYSTÈME HÉTÉROLOGUE ....... 2
i. Généralités ................................................................................................................................................................. 2
1. Biotechnologie .......................................................................................................................................................2
2. Biologie moléculaire ............................................................................................................................................. 2
3. Génie génétique .................................................................................................................................................... 2
4. Protéine recombinante ........................................................................................................................................... 2
5. ADN recombinant ............................................................................................................................................. 3
6. Clonage ...............................................................................................................................................................3
ii. But: Produire une protéine recombinante, pourquoi ? ................................................................................................. 3
iii. Systèmes hétérologues utilisés ............................................................................................................................ 4
1. Escherichia coli..................................................................................................................................................... 4
2. Saccharomyces cerevisiae ..................................................................................................................................... 5
3. Cellules CHO (Chinese Hamster Ovary)... ....................................................................................................... 5
4. Animaux transgéniques .................................................................................................................................... 6
5. Plantes transgéniques ...................................................................................................................................... 6
iv. Synthèse des protéines .............................................................................................................................................. 6
v. Production de protéine recombinante ......................................................................................................................... 7
1. Principe................................................................................................................................................................. 7
2. Étapes d’une production de protéine recombinante ........................................................................................... 7
2. RAPPELS SUR LA TRANSCRIPTION ET LA TRADUCTION CHEZ LES BACTÉRIES, LES
EUCARYOTES ET LES VIRUS .............................................................................................................. 14
i. Généralités ................................................................................................................................................................14
ii. Transcription de l’ADN procaryote ..........................................................................................................................14
1. Pré-initiation ........................................................................................................................................................15
2. Initiation ..............................................................................................................................................................16
3. Elongation............................................................................................................................................................16
4. Terminaison .........................................................................................................................................................17
5. Maturation des transcrits primaires .......................................................................................................................17
iii. Transcription de l’ADN eucaryote ...........................................................................................................................18
1. ARN-pol ymérases eucaryotes ..............................................................................................................................18
2. Différences dans la transcription eucaryote ............................................................................................................18
3. Régions cis-régulatrices ..................................................................................................................................19
4. Caractéristiques structurales des protéines régulatrices ..........................................................................................20
5. Maturation des transcrits primaires .......................................................................................................................20
iv. Code génétique ...................................................................................................................................................21
v. Acteurs de la traduction .......................................................................................................................................22

BOUZAHAR.DEFFAR K
PRODUCTION DE PROTÉINES RECOMBINANTES

1. Ribosomes............................................................................................................................................................22
2. ARNt ...................................................................................................................................................................23
vi. Différentes étapes de la traduction procaryote .....................................................................................................23
1. Initiation ..............................................................................................................................................................23
2. Elongation............................................................................................................................................................24
vii. Réplication virale ...................................................................................................................................................25
1. Virus à ARN enveloppé .......................................................................................................................................25
2. Rétrovirus ou Adénovirus .....................................................................................................................................26
3. CLONAGES, DESSIN DES AMORCES ET ANALYSES DES VECTEURS .................................... 28
i. Clonage ................................................................................................................................................................28
1. Principe du clonage .........................................................................................................................................28
2. Étapes résumant le clonage .............................................................................................................................28
ii. Vecteurs de clonage et l’analyse des vecteur .......................................................................................................36
1. Propriétés des vecteurs de clonage ........................................................................................................................36
2. Types de vecteurs en fonction des cellules hôtes ...................................................................................................37
iii. Dessin des amorces .................................................................................................................................................39
4. STRATÉIES DE CLONAGE ................................................................................................................ 41
i. Introduction ..............................................................................................................................................................41
1. Principe................................................................................................................................................................41
2. Besoins de cette technologie...........................................................................................................................41
ii. Avantages et défauts de chaque système d’expression ...............................................................................................42
1. Expression chez les procaryotes ............................................................................................................................42
2. Expression chez la levure .....................................................................................................................................42
3. Expression dans les cellules d’insectes..................................................................................................................43
4. Expression dans les cellules de mammifères .........................................................................................................43
iii. Comparaison des systèmes d’expression ..................................................................................................................44
5. DIFFÉRENTES APPROCHES DE LA PROTÉOMIQUE .................................................................. 45
i. Protéome ..............................................................................................................................................................45
ii. Protéomique ........................................................................................................................................................45
iii. Pourquoi le protéome ?............................................................................................................................................46
iv. Étapes principales de la Protéomiques ......................................................................................................................47
1. Extraction des protéines et préparation des échantillons ........................................................................................47
2. Séparation des protéines par électrophorèse bidimensionnelle (2D) .......................................................................48
3. Détection et quantification des protéines ...............................................................................................................49
4. Identification des protéines ..................................................................................................................................50
v. Protéomique fonctionnelle ........................................................................................................................................51
vi. Protéomique structurale ...........................................................................................................................................51
6. PRODUCTION EN SYSTÈME BACTÉRIEN (ESCHERICHIA COLI) ............................................. 52
i. Introduction ..............................................................................................................................................................52

BOUZAHAR.DEFFAR K 1
PRODUCTION DE PROTÉINES RECOMBINANTES

ii. Avantages et défauts du système ...............................................................................................................................52


iii. Construction des souches.........................................................................................................................................53
iv. Analyse et construction des vecteurs d’expression ....................................................................................................54
v. Choix d’un système d’induction ................................................................................................................................57
vi. Choix d’un système de purification .........................................................................................................................59
vii. Choix de la localisation subcellulaire de la protéine exprimée .................................................................................59
1. Corps d’inclusion .................................................................................................................................................59
2. Soluble dans le cytoplasme ...................................................................................................................................61
3. Expression dans le périplasme ..............................................................................................................................61
viii. Optimisation de la synthèse ...................................................................................................................................62
1. Renaturation des protéines in vitro ........................................................................................................................62
2. Minimiser l’agrégation in vivo .............................................................................................................................62
ix. Autres bactéries utilisées en production de protéines ................................................................................................63
7. PRODUCTION CHEZ SACCHAROMYCES CEREVISIAE ................................................................ 65
i. Introduction ..............................................................................................................................................................65
ii. Avantages et défauts du système ...............................................................................................................................66
iii. Vecteurs d’expression .............................................................................................................................................66
iv. Souches...................................................................................................................................................................68
v. Système de sécrétion ................................................................................................................................................69
vi. Modifications post-traductionnelles .........................................................................................................................69
8. PRODUCTION CHEZ PICHIA PASTORIS......................................................................................... 70
i. Introduction ..............................................................................................................................................................70
ii. Avantages du système ..............................................................................................................................................70
iii. Étapes d’expression d’une protéine chez Pichia pastoris ....................................................................................71
iv. Vecteurs d’expression .............................................................................................................................................71
v. Souches ....................................................................................................................................................................74
vi. Système de sécrétion ...............................................................................................................................................74
vii. Modification post-traductionnelles ..........................................................................................................................74
9. PRODUCTION EN CELLULES D’INSECTES ET EN CELLULES ANIMALES ........................... 76
i. Introduction ..............................................................................................................................................................76
ii. Avantages et les inconvénients de chaque système ..............................................................................................76
1. Cellules d’insectes ..........................................................................................................................................76
2. Cellules de mammifères ..................................................................................................................................77
iii. Étapes de production d’une protéine recombinante .............................................................................................77
1. En cellules d’insectes ...........................................................................................................................................77
2. En cellules de mammifères ...................................................................................................................................79
iv. Vecteurs d’expression ........................................................................................................................................80
v. Modifications post-traductionnelles ....................................................................................................................81
10. PRODUCTION DANS UN ORGANISME MÉTAZOAIRE .............................................................. 82

BOUZAHAR.DEFFAR K 2
PRODUCTION DE PROTÉINES RECOMBINANTES

i. Introduction ..............................................................................................................................................................82
ii. Sécrétion de protéines recombinantes dans le lait des animaux transgéniques (comme exemple)............................82
iii. Intérêt de la production de protéine dans le lait ........................................................................................................82
iv. Comment crier une lignée transgénique? ..................................................................................................................83
1. Micro-injection dans le pronucléus...................................................................................................................83
2. Lransfection de cellule embryonnaire souches (ES) ...........................................................................................84
v. Avantages et inconvénients du système .....................................................................................................................85
Liste des abréviations
Références Bibliographiques

BOUZAHAR.DEFFAR K 3
PRODUCTION DE PROTÉINES RECOMBINANTES

Objectifs de l’enseignement : L’objectif de l’enseignement est que les étudiants puisse


acquérir une vision d’ensemble des différents systèmes de production des protéines recombinantes,
avec les avantages et les limites de chaque système, actuellement disponibles de manière à pouvoir
faire un choix raisonné du système le plus adapté à un objectif précis. Cette formation s’intéresse aux
méthodes qui peuvent être mises en place pour optimiser la production en fonction de l’objectif de la
sur-expression. De même se familiariser avec la purification sur colonne de nickel une fois la
protéine produite et de pouvoir identifier les points critiques d’un système d’expression et l’optimiser
de façon rationnelle.
Les connaissances préalables recommandées : biologie moléculaire et manipulation
génétique, notions de bases de microbiologie et de techniques de purification et d’analyse des
protéines.
Contenu de la matière :
 Objectifs d’une production de protéines en système hétérologue.
 Rappels sur la transcription et la traduction chez les bactéries, les eucaryotes et les virus.
 Clonages, dessin des amorces et analyse des vecteurs.
 Stratégies de clonage.
- comparaison des systèmes d’expression,
- identification des défauts de production.
 Différents approches de la protéomique.
 Production en système bactérien : exemple le système bactérien (E. coli)
- avantages et défauts du système,
- la construction des souches,
- analyse des vecteurs et des souches,
- système d’induction,
- localisation,
- structure et activité des protéines purifiées,
- optimisation de la synthèse.
 Production chez S. cerevisiae et P. pastoris.
- avantages, limites, vecteurs d’expression,
- souches,
- modifications post-traductionnelles.
 Production en cellules d’insectes et en cellules animales.
- Avantages, limites, vecteurs, sélection des lignées, modifications post-traductionnelles.
 Production dans un organisme métazoaire.

Références : livres et polycopiés, sites internet, etc.

BOUZAHAR.DEFFAR K
PRODUCTION DE PROTÉINES RECOMBINANTES

Introduction

La biologie moléculaire est consacrée à l'étude des molécules porteuses du message héréditaire
(ADN, ARN), de leur structure, synthèse et altérations ou mutations.
Le génie génétique qui conduit aux transformations génétiques s'opérant sur l’ADN, s'appuie sur
un ensemble d'outils cellulaires et moléculaires. C'est-à-dire le génie génétique est l’ensemble de
méthodes d’investigation et d’expérimentation sur les gènes.
La biologie moléculaire et le génie génétique sont à la base des biotechnologies, en particulier,
celles basées sur l’ADN recombiné et les transformations génétiques. La biotechnologie est une
application des principes scientifiques et de l’ingénierie à la transformation de matériaux par des
agents biologiques pour produire des biens ou des services.
Les biotechnologies ont un champ d'application vaste dans le domaine de la santé et des
médicaments du futur comme la thérapie génique, ingénierie moléculaire et protéines recombinantes
et thérapie cellulaire.
Protéine recombinante/hétérologue est une protéine qui n’est pas synthétisé naturellement par
l’organisme qui la produit. Elle est produite par un autre organisme qui est dit recombinant et il a été
obtenu par génie génétique. C’est une technique qui est extrêmement rependu et qui permet de
produire et de purifier une protéine donnée en grande quantité afin de :
- l’étudier (propriété biologique, structure…),
- la commercialiser à des fins thérapeutique (insuline, anticorps…) ou industrielle,
- produire des anticorps contre la protéine donnée,
- produire des protéines modifiées présentant de nouvelles propriétés.
Concerne la production de protéines recombinantes et hormones et où certaines bactéries, levures,
virus, plantes, cellules animales et les animaux deviennent une 'usine' de production de molécules
d'intérêt par biotechnologies. La production d'insuline et d'hormones de croissance sont des exemples.
Les applications sont les traitements du diabète par l'insuline, le nanisme par l'hormone de
croissance, le cancer par des anticorps monoclonaux et la sclérose en plaque par l'interféron béta.
Pour produire une protéine recombinante par biotechnologies, il faut essentiellement disposer d'un
vecteur et d'une cellule hôte. Le vecteur d'expression doit être stable, en grand nombre de copie dans
la cellule hôte et avec un promoteur inductible. La cellule hôte doit pousser en grande quantité dans
les fermenteurs. La protéine produite doit être soluble et facile à purifier.

BOUZAHAR.DEFFAR K 1
PRODUCTION DE PROTÉINES RECOMBINANTES

1. Objectifs d’une production de protéines en système


hétérologue

i. Généralités
1. Biotechnologie
La biotechnologie, ou « technologie de bioconversion » comme son nom l'indique, résulte d'un
mariage entre la science des êtres vivants – la biologie – et un ensemble de techniques nouvelles
issues d'autres disciplines telles que la microbiologie, la biochimie, la biophysique, la génétique, la
biologie moléculaire et l'informatique.
2. Biologie moléculaire
La biologie moléculaire (parfois abrégée bio mol ou BM) est une discipline scientifique au
croisement de la génétique, de la biochimie et de la physique, dont l'objet est la compréhension des
mécanismes de fonctionnement de la cellule au niveau moléculaire. Le terme « biologie
moléculaire », utilisé la première fois en 1938 par Warren Weaver, désigne également l'ensemble des
techniques de manipulation d'acides nucléiques (ADN, ARN), appelées aussi techniques de génie
génétique. La biologie moléculaire est apparue au XXe siècle, à la suite de l'élaboration des lois de la
génétique, la découverte des chromosomes et l'identification de l'ADN comme support chimique de
l'information génétique.
3. Génie génétique
Le génie génétique (ou ingénierie génétique) est un ensemble de techniques, faisant partie de la
biologie moléculaire et ayant pour objet l’utilisation des connaissances acquises en génétique pour
utiliser, reproduire, ou modifier le génome des êtres vivants. Le génie génétique est un champ très
actif de la recherche car les applications possibles sont multiples, notamment en santé humaine
(correction d’un gène porteur d’une mutation délétère, production de protéines thérapeutiques,
élimination de séquences virales persistantes, etc.), en agriculture biotechnologique (mise au point de
nouvelles générations de plantes génétiquement modifiées, etc.) ou encore pour la mise au point
d’outils destinés à la recherche (par exemple pour explorer la fonction d’un gène).
4. Protéine recombinante
Une des applications des biotechnologies modernes est la production de protéines recombinantes
qui sont des protéines produites par des cellules dont l’ADN a été modifié par recombinaison
génétique.

BOUZAHAR.DEFFAR K 2
PRODUCTION DE PROTÉINES RECOMBINANTES

5. ADN recombinant
L'ADN recombinant est une molécule d'acide désoxyribonucléique composée de séquences
nucléotidiques provenant de plusieurs sources.
6. Clonage
Le terme clonage est l'opération faisant appel au génie génétique et permettant la production d'un
clone. À partir de cellules isolées, il s'agit d'obtenir une lignée (plusieurs cellules similaires appelées
clones) dérivant d'un seul ancêtre. La spécificité de ce processus est le fait d'avoir un patrimoine
génétique rigoureusement identique. Autrement dit le clonage permet d'obtenir un grand nombre de
copies absolument identiques soit d'une cellule et l'on parle alors de clonage cellulaire soit d'un
fragment d'ADN et l'on parle alors de clonage moléculaire.

ii. But : Produire une protéine recombinante, pourquoi ?


La technologie de l’ADN recombinant est un outil pour comprendre la structure, la fonction et la
régulation des gènes et leurs produits. Les objectifs de cette technologie sont :
1. L’identification des gènes.
2. L’isolement des gènes.
3. La modification des gènes.
4. La réexpression des gènes dans d’autres systèmes.
Les autres buts de cette technologie sont :
5. La production d’une petite quantité de protéines d’intérêt scientifique comme les anticorps pour
des applications expérimentales (ELISA, Western Blot…).
6. La production de protéines d’intérêt médical comme les anticorps, les vaccins ou les enzymes
pour le traitement et parfois dans des cas d’un manque ou d’une déficience. Produire des anticorps
pour le diagnostic.
7. La production d’une grande quantité de protéines d’intérêt économique et commercial.

Quelques exemples
L'exemple connu des protéines recombinantes est l'insuline recombinante. L'insuline fut
cristallisée en 1926. Elle fut la première protéine à être complètement séquencée en 1955, la
première à être synthétisée chimiquement en 1958 et la première protéine humaine produite par
biotechnologies en 1979 et commercialisée en 1982. L'insuline est sécrétée par les cellules βdes îlots
de Langerhans du pancréas. Elle exerce un effet hypoglycémiant. L'insuline est administrée aux

BOUZAHAR.DEFFAR K 3
PRODUCTION DE PROTÉINES RECOMBINANTES

personnes touchées par le diabète qui est une maladie caractérisée par l'augmentation du taux du
sucre dans le sang et les urines (glycémie normale : 0,7-1,1 g/L). C'est l'une des maladies les plus
répandues dans le monde (1% de la population mondiale). Il existe deux formes principales de
diabète : le diabète insulino-dépendant (type I) et le diabète insulino-indépendant (type II). L'insuline
est constituée de deux chaînes polypeptidiques (51 acides aminés en tout) ; les chaînes A et B 21 et
30 acides aminés, respectivement et reliées entre elles par 2 ponts disulfures et 1 pont disulfure
intrachaîne dans la chaîne A.
L'autre exemple de protéines recombinantes est l'hormone de croissance. L'hormone de croissance
est une substance chimique naturelle que sécrète l'hypophyse. Elle règle la croissance et le
développement normal chez les enfants. L'hormone de croissance recombinante humaine (rHGH) est
produite à partir de cellules modifiées par génie génétique afin de produire cette hormone. Un déficit
en hormones de croissance entraîne une maladie appelée le nanisme hypophysaire. Les autres
exemples sont résumés ci-dessous.

Anticoagulants
Erythropoïétine CHO
Interférons ,  et 
Facteurs VIII et IX de la coagulation
Antithrombine
1-antitrypsine
TNF (tumor necrosis factor)
Insuline E. coli
EGF (epidermal growth factor)
G-CSF (granulocyte colony stimulating factor)
Anticorps
Interleukine 2 E. coli
Vaccin contre l’hépatite B
Lipocortine

iii. Systèmes hétérologues utilisés


Une vaste gamme de systèmes de production de protéines recombinantes -c'est-à-dire, au sens
restreint, de couples vecteurs-hôtes est aujourd'hui disponible, chacun d'eux présentant des avantages
et des inconvénients. Les hôtes les plus utilisés à l'heure actuelle sont incontestablement la bactérie
Escherichia coli, la levure Saccharomyces cerevisiae et les cellules CHO extraites des ovaires de
hamster.
1. Escherichia coli : elle fut et reste encore le premier hôte utilisé pour la
fabrication de protéines recombinantes. Exemples de protéines recombinantes
Escherichia coli
produites : hormone de croissance humaine, insuline, interféron α et interleukine-2...

BOUZAHAR.DEFFAR K 4
PRODUCTION DE PROTÉINES RECOMBINANTES

D'autres bactéries : Bacillus subtilis, Streptomyces... A leur actif, celles-ci possèdent des
capacités de sécrétion supérieures à E. coli. Cependant leur génétique est moins connue, et le niveau
de production de protéines est inférieur à celui obtenu avec E .coli.

Bacillus Streptomyces

2. Saccharomyces cerevisiae : il s'agit de la levure de boulanger, utilisée depuis


des millénaires dans l'alimentation humaine. Exemples de protéines recombinantes
produites : antigène de surface du virus de l'hépatite B, insuline…

D'autres levures et champignons filamenteux : Pichia pastoris, Kluyveromyces lactis,


Hanseluna polymorpha, Yarrowia lipolytica, Aspergillus niger.

Champignon

3. Cellules CHO (Chinese Hamster Ovary) : exemples de protéines


recombinantes produites : antigène du virus de l'hépatite B, hormone de croissance
humaine, cytokines, facteurs de coagulation...
Cellules CHO

Des cellules d'insectes (Spodoptera frugiperda), utilisant des vecteurs d'expression


développés à partir du Baculovirus. Ces cellules sont capables de sécréter la protéine
recombinante et d'effectuer les opérations post-traductionnelles. Par ailleurs il est
possible également d'utiliser des larves de vers à soie vivants. Baculovirus

Une autre voie consiste aujourd'hui à utiliser des bioréacteurs vivants en tant que système de
production de protéines recombinantes, c'est-à-dire des plantes et animaux vivants transgéniques.

BOUZAHAR.DEFFAR K 5
PRODUCTION DE PROTÉINES RECOMBINANTES

4. Animaux transgéniques : les principales techniques de transgénèse utilisées sont la


micro-injection dans les pronucléus ou dans le cytoplasme de l'embryon. Les animaux transgéniques
peuvent être utilisés afin de produire des protéines hétérologues : production de facteur IX de la
coagulation dans le lait de brebis transgéniques, lactoferrine humaine obtenue dans le lait de vache
transgénique, hormone de croissance humaine dans le lait de souris, hémoglobine humaine produite
dans le sang du porc... L'intérêt d'une production de protéines recombinantes dans le lait ou le sang
d'animaux transgéniques se heurte cependant à des niveaux d'investissements très lourds pour des
marchés a priori très restreints.

5. Plantes transgéniques : différentes techniques sont employées afin de transférer un


gène d'intérêt dans le patrimoine génétique d'une plante : vecteurs bactériens, injection de cellules
embryonnaires totipotentes, biolistique, électroporation du protoplaste. La mise au point de plantes
transgéniques à partir de végétaux comme le tabac, le colza ou encore la pomme de terre, permet de
produire une variété de protéines recombinantes précieuses (molecular farming) : interféron,
interleukine, facteur VIII de la coagulation. Dans ce domaine, restent principalement à résoudre les
problèmes de niveau d'expression des protéines (rendements faibles), ainsi que d'extraction et de
purification. Les plantes transgéniques pourraient représenter un moyen de production peu coûteux.

iv. Synthèse des protéines


La synthèse comprend deux étapes :
- la transcription permet de copier l'ADN en ARN messager (ARNm). Elle se déroule dans le noyau
chez les eucaryotes et dans le cytoplasme chez les procaryotes. On parle de transcription car l'ADN
est copié en ARNm sans changement de langage (langage de nucléotides). Elle est réalisée grâce à
l'ARN polymérase qui se fixe sur l'ADN déroulé et synthétise un brin d'ARN complémentaire à
l'ADN. Elle nécessite des Nucléosides triphosphates et progresse dans le sens 5'-3'.

Figure 1. Synthèse des protéines.

BOUZAHAR.DEFFAR K 6
PRODUCTION DE PROTÉINES RECOMBINANTES

- la traduction correspond au décodage de l'information portée par l'ARN messager en protéines.


Dans ce cas on passe du langage de nucléotides au langage des acides aminés grâce au code
génétique.

v. Production de protéine recombinante


1. Principe

Figure 2. Principe du clonage.

2. Étapes d’une production de protéine recombinante

Obtention de cDNA correspondant à la protéine d’intérêt

Clonage dans un vecteur d’expression

Transformation/transfection dans une cellule hôte

Purification et analyse de la protéine d’intérêt

a. Obtention du cDNA correspondant à la protéine d’intérêt


Pour le clonage en vue de l’obtention d’une protéine recombinante on doit utiliser soit l’ADN
génomique (l’ADN génomique est obtenu à partir de lignées cellulaires, de tissus ou d’organismes

BOUZAHAR.DEFFAR K 7
PRODUCTION DE PROTÉINES RECOMBINANTES

entiers en fonction de la taille de l’organisme. Pour un organisme donné on part de n’importe quel lot
de cellules, l’ADN génomique sera le même) et l’amplifier par la PCR ou l’ARNm (si la protéine
n’est exprimée que dans certains tissus : on doit récupérer l’ARNm à partir de ces cellules puis la
conversion de ARNm en ADN par l’utilisation de la technique de RT-PCR). Comme pour l’ADN
génomique, l’ARN est obtenu à partir de lignées cellulaires, de tissus ou d’organismes entiers. Mais
chaque type cellulaire exprime un lot donné de gènes donc pour un organisme donné on part d’un lot
de cellules ; l’ARN est différent pour chaque type cellulaire.

a La PCR : Amplification
exponentielle

Figure 3. Deux techniques d’amplification de l’ADN. a. La PCR, b. La RT-PCR.

Informations portées par l’ADN donneur


 Sur l’ADN génomique : région codante et non codante (régions promotrices, régulatrices).

BOUZAHAR.DEFFAR K 8
PRODUCTION DE PROTÉINES RECOMBINANTES

 Sur l’ADN complémentaire : région codante, mais il y a aussi les régions (5’et 3’ non
traduites).
b. Clonage dans un vecteur d’expression
 Le cDNA et le vecteur doivent couper par l’utilisation des enzymes de restrictions qui sont
des enzymes bactériennes qui reconnaissent des séquences spécifiques sur l’ADN le (cDNA ou le
vecteur) de 4 à 8 paires de bases, et qui clivent l’ADN sur les deux brins au niveau de ces sites. Elles
coupent l’ADN au niveau des ponts phosphodiesters.

o Caractéristiques :
• La plupart des sites sont des séquences inversées répétées (palindromes) cas de EcoRI :
5’GAATTC 3’ ; 3’ CTTAAG 5’.
• Coupure avec formation de bouts collants ou à bouts francs :

Figure 4. L’action des enzymes de restriction.

o Propriétés des vecteurs de clonage


•Capables de réplication autonome dans une cellule hôte donnée (origine de réplication de type
procaryotique et/ ou eucaryotique).
•Possèdent un polylinker ou site multiple de clonage.
•Supportent l’insertion d’un fragment d’ADN plus ou moins grand.

 Différents vecteurs de clonage :

(Taille maximum approximative du fragment d’ADN qui peut être cloné dans chaque vecteur).

 Ligation (ligature...)
Une enzyme, la ligase, est capable de lier de façon covalente deux molécules d’ADN en une.

BOUZAHAR.DEFFAR K 9
PRODUCTION DE PROTÉINES RECOMBINANTES

Figure 5. L’insertion d’un fragment simple d’ADN dans un plasmide.

c. Transformation/transfection dans une cellule hôte : il existe plusieurs méthodes de


transformation/transfection de l’ADN recombinant dans les cellules hôtes :
 Chlorure de calcium et choc thermique :
Méthode de transformation des bactéries compétente.
 Électroporation :
Brève impulsion électrique provoquant l’ouverture temporaire de pores laissant passer l’ADN.
Application :
- Bactéries (protoplastes E. coli),
- Levure (S. cerevisiae),
- Cellules de mammifères en suspension.
Cette technique nécessite beaucoup de cellule, 50% de mort.
 Lipofection :
Complexe ADN/Lipide qui entre par fusion avec la membrane plasmique.
Plusieurs formulaires lipidiques : cationiques, anioniques et mixtes.
Application :
- Cellules de mammifères adhérentes et en suspension.
Méthode moins toxique et parfois beaucoup plus efficace.

BOUZAHAR.DEFFAR K 10
PRODUCTION DE PROTÉINES RECOMBINANTES

 Biolistique :
L’ADN adsorbé sur des particules d’or ou de tungstène (coprécipité avec Ca) est projeté sur les
cellules sous pression d’hélium par exemple.
Application :
- Cellules végétales.

 Infection virale :
Réservé aux vecteurs viraux évidements.
Application :
- Baculovirus (cellules d’insectes),
- Adénovirus (cellules de mammifères),
- Bactériophages (bactéries).

d. Purification de protéine d’intérêt


Protéine est-elle excrétée par la cellule productrice?
• Si oui : récupération dans le milieu de culture + purification.
• Si non : il faut casser les cellules.
Avant de casser les cellules : récupération de la biomasse (centrifugation, décantation).

Méthodes pour casser les cellules :


 Choc osmotique
 Traitement alcalin
 Extraction par solvants organiques
 Sonication

BOUZAHAR.DEFFAR K 11
PRODUCTION DE PROTÉINES RECOMBINANTES

La sonication

Méthodes pour purifier les protéines


• Précipitation: concentration par des solvants ou des sels (sulfates d’ammonium ou de sodium).
• Purification: chromatographies : différents types selon la protéine à purifier la filtration sur gel, la
chromatographie d’affinité et la chromatographie d’echange d’ions.

BOUZAHAR.DEFFAR K 12
PRODUCTION DE PROTÉINES RECOMBINANTES

Stockage
Forme liquide.
Forme solide : atomisation, lyophilisation
(Pulvérisation de la solution protéique dans un une enceinte chauffée à 130 °C : déshydratation : on
collecte la poudre. Lyophilisation = cryodessiccation = surgélation + pression ; point triple puis
dessiccation).

(Références : Cold Spring Harbor Laboratory Press, 2001 ; Housset et Raisonnier, 2002 ;
Malacinski, 2002 ; Desmond, 2008 ; ABRF, 2009 ; Deffar, 2009 ; Potocki-Veronese, 2009 ; Boublik,
2013;
http://www.accessexcellence.org/AB/GG/plasmide.html;
http://biotech-btk.wifeo.com/proteine-heterologue.php).

BOUZAHAR.DEFFAR K 13
PRODUCTION DE PROTÉINES RECOMBINANTES

2. Rappels sur la transcription et la traduction chez les bactéries, les


eucaryotes et les virus

i. Généralités
Le gène (ou cistron) est un segment d’ADN qui constitue l’unité d’expression menant à la
formation d’un produit fonctionnel qui peut être sous la forme d’ARN ou de polypeptide.
Chez les procaryotes plusieurs gènes peuvent faire partie d’une même unité de transcription, on parle
d’unité polycistronique dont l’exemple le plus classique est l’opéron lactose.
Chez les eucaryotes les unités de transcription sont monocistronique (exception chez certains
vertébrés).

Les gènes eucaryotes sont départagés dans 3 classes :


 Les gènes de classe 1 ont comme produits des ARNr. Ils sont répétés en tandem et séparés
par des espaces inter-géniques. La transcription des ARNr se fait sous forme d’un précurseur
l’ARN 45 S (≈ 13 000 pb) qui sera clivé en 3 ARNr : 5,8 S ; 18 S et 28 S.
 Les gènes de classe 2 ont comme produits des protéines. Les protéines sont formées par
traduction des ARNm qui sont plus instables que les autres ARN. Les gènes de classe 2 sont
constitués de différents segments : des exons portant l’information et correspondant aux
régions codantes, et des introns qui sont des régions non codantes. Attention, les procaryotes
ne possèdent pas d’introns.
 Les gènes de classe 3 ont comme produits des ARNt, les ARNr 5S et les petits ARN qui sont
également répétés en tandem comme les gènes de classe 1. La synthèse d’ARN à lieu
essentiellement pendant l’interphase du cycle cellulaire.

ii. Transcription de l’ADN procaryote


L’ARN polymérase est une protéine ADN dépendante, multimérique possédant les sous-unités α,
β, β’ et σ. Elle est présente sous deux formes l’enzyme-cœur (α2ββ’) et l’holoenzyme (α2ββ’σ). Les
ARN polymérases ne nécessitent pas d’amorce et ne possèdent pas d’activité exo-nucléasique et
donc de correction d’erreur, le taux d’erreur est ainsi plus important que pour les ADN-polymérases,
mais ce taux est supporté.

BOUZAHAR.DEFFAR K 14
PRODUCTION DE PROTÉINES RECOMBINANTES

Les nucléotides triphosphates sont additionnés à l’extrémité 3’ de la chaîne en cours de synthèse


par complémentarité de la matrice d’ADN. L’hydrolyse de la liaison anhydride fournit l’énergie pour
la synthèse de la liaison phosphodiester.
La réaction est réalisée en milieu tamponné à pH neutre, contenant du sel de Mg 2+, un agent de
protection des groupements SH de l’enzyme (agent réducteur comme le β-mercaptoéthanol), les 4
ribonucléotides (rNTP) et de l’ADN bicaténaire contenant un promoteur comme matrice.
La molécule d’ADN est composée d’un brin matriciel (ou brin anti-codant) dirigé par définition
de 3’ vers 5’ et servant comme son nom l’indique de matrice à l’ARN-polymérase, ainsi que d’un
brin codant dirigé par définition de 5’ vers 3’ et ayant une séquence identique à l’ARN transcrit
mise à part le fait que la thymine est changée par l’uridine. L’ARN messager est lui monocaténaire et
dirigé tout comme le brin codant de 5’ vers 3’.

Chez E-coli, une seule ARN-polymérase catalyse la synthèse de tous les ARN de la cellule (en
mettant à part l’ARN des amorces nécessaire à la réplication de l’ADN).
La transcription est divisée en plusieurs étapes : la pré-initiation, l’initiation, l’élongation et la
terminaison.

1. Pré-initiation
Le promoteur est une séquence d’une centaine de nucléotides située dans la région régulatrice et
désignant le début de la transcription. Il est situé en amont du site d’initiation et porte des éléments
de séquence reconnus par l’ARN-polymérase et déterminant le sens de la transcription.
Le promoteur est constitué de courtes séquences conservées d’une unité de transcription à l’autre et
appelées séquences consensus :
 En -10 du site d’initiation on trouve la TATA box ou boîte de Pribnow : « TATAAT »
 En -35 du site d’initiation on trouve : « TTGACA »

Le promoteur agit sur la transcription du segment d’ADN qui lui est adjacent sur le même
chromosome, on dit que le promoteur est actif en « cis ». Le promoteur n’est pas actif sur les
séquences codantes situées ailleurs sur le chromosome, dans ce cas-là on parlerait alors du
qualificatif « trans ». Le cis s’oppose au trans.

BOUZAHAR.DEFFAR K 15
PRODUCTION DE PROTÉINES RECOMBINANTES

L’affinité de l’ARN-polymérase pour l’ADN dépend de la forme de l’enzyme : l’enzyme-cœur a


une affinité faible et non spécifique, l’holoenzyme a une affinité très forte et spécifique pour le
promoteur. On peut faire la remarque que la sous-unité sigma σ à l’état libre ne se fixe pas sur
l’ADN. La sous-unité β’ étant basique et l’ADN étant acide, ce sera elle qui facilitera l’interaction du
complexe avec le promoteur.
La sous-unité sigma σ permet donc une reconnaissance spécifique du promoteur par l’ARN-
polymérase et diminue l’affinité de l’enzyme pour les régions non promotrices. Il agit de manière
cyclique, en effet après l’initiation faite, le facteur sigma se détache pour être recyclé et réutilisé pour
d’autres initiations de gènes.
L’ARN-polymérase entraîne la dénaturation des deux brins d’ADN sur 14 paires de nucléotides,
on parle de complexe ouvert qui augmente encore l’affinité de l’enzyme pour la double hélice.

2. Initiation
L’initiation correspond à la synthèse de la première liaison phosphodiester réalisé par la sous-
unité β qui correspond à la sous-unité catalytique de l’ARN-polymérase.
L’interaction de cette sous-unité est inhibée par la rifampicine qui inhibe ainsi de manière
irréversible la transcription de l’ADN, c’est le cas de la tuberculose. Une mutation dans la SU β
induit l’apparition de souches bactériennes résistantes à la rifampicine.
Le déroulement des premières étapes de la transcription est donc :
1. liaison non spécifique de l’holoenzyme.
2. formation d’un complexe fermé au niveau du promoteur.
3. formation du complexe ouvert (déroulement sur 14 nucléotides).
4. Mise en place du premier nucléotide (très souvent A ou G).
5. Allongement de 4 à 5 nucléotides.
6. Détachement du facteur sigma, après la transcription des 4-5 premiers nucléotides.

3. Elongation
L’élongation correspond au déplacement de la bulle de transcription le long de la molécule
d’ADN. La région désappariée est alors de 70 paires de bases. Pendant la transcription, l’ARN forme
un court appariement avec le brin matriciel de l’ADN formant une hélice hybride ADN-ARN sur une
dizaine de paires de bases.

BOUZAHAR.DEFFAR K 16
PRODUCTION DE PROTÉINES RECOMBINANTES

4. Terminaison
La terminaison se fait lorsque l’enzyme arrive au niveau d’une séquence spécifique appelée
terminateur.
Le terminateur se présente sous la forme d’un palindrome qui peut être parfait ou imparfait. Ce
palindrome entraîne une complémentarité de séquence au niveau de l’ARNm qui permet la mise en
place d’une structure en épingle à cheveux (ou tige-boucle) qui est un appariement intra-chaîne qui
déstabilise l’ARN-polymérase jusqu’à dissociation.
Elle peut être facilitée par un facteur rho ρ suivant la séquence du terminateur, on met ainsi en
évidence des terminateurs rho indépendant (environ les 2/3) et des terminateurs rho dépendant
(environ 1/3) :
 Pour les terminateurs rho indépendant on trouve une structure en épingle à cheveux riche en
paires de bases G-C, suivie d’une séquence poly-U d’environ 6 nucléotides permettant une
dissociation plus facile de l’hybride ADN-ARN.
 Pour les terminateurs rho dépendant on trouve une structure en épingle à cheveux plus courte
et qui n’est pas riche en paires de bases G-C et qui est non-suivie d’une séquence poly-U. Il y
a donc nécessité du facteur rho qui a une affinité pour les ARN en court de synthèse, le
parcourant de 5’ vers 3’ jusqu’à trouver l’ARN-polymérase. Le facteur rho est ATP
dépendante, dont l’hydrolyse permettra la dissociation du complexe.

5. Maturation des transcrits primaires


Le transcrit primaire correspond à l’ARN non mature qui nécessite une maturation sous forme
de clivages ou de modifications de bases. Cette maturation n’est pas obligatoire. Après maturation on
obtient l’ARN mature. On peut prendre quelques exemples comme la maturation du transcrit
primaire donnant les ARNr (transcrit primaire 45 S) ou les ARNt par des ribonucléases, ou la
maturation du transcrit primaire codant les ARNm. Généralement, il y a peu de modifications pour
les ARNm ; beaucoup d’ARNm sont traduits en protéines alors qu’ils sont encore transcrits
(Attention : il n’y a pas de noyau chez les procaryotes).
Le transcrit primaire code soit pour un produit, on parle d’ARN monocistronique, soit plusieurs
produits, on parlera alors d’ARN polycistronique.

BOUZAHAR.DEFFAR K 17
PRODUCTION DE PROTÉINES RECOMBINANTES

iii. Transcription de l’ADN eucaryote


1. ARN-polymérases eucaryotes
Trois ARN-polymérases eucaryote ont été mis en évidence. Elles diffèrent par leur localisation
dans le noyau, par la nature des ARN formés et par leur sensibilité à des inhibiteurs tels que l’α-
amanitine.
 ARN-polymérase I dans le nucléole pour les ARNr 5,8 ; 18 et 28 S, et est insensible à l’α-
amanitine.
 ARN-polymérase II dans le nucléoplasme pour les ARNm et est sensible à l’α-amanitine.
 ARN-polymérase III dans le nucléoplasme pour les ARNt, ARNr 5 S et pour les petits ARN,
elle est également sensible à l’α-amanitine mais à hautes doses.
L’α-amanitine se fixe sur certaine sous-unité de l’ARN-polymérase et inhibe l’élongation de la
transcription.
L’actinomycine D inhibe la transcription eucaryote et procaryote en s’intercalant entre certaine base
de l’ADN pendant l’élongation.

2. Différences dans la transcription eucaryote


a) Complexe protéique nécessaire à la transcription
L’ARN-polymérase II n’étant pas suffisante pour démarrer la transcription, elle nécessite d’autres
protéines interagissant avec l’ADN du promoteur, appelées TFII (pour transcription factor II,
facteurs de transcriptions interagissant avec l’ARN-polymérase II) :
 TFII D interagit avec l’ADN du promoteur et plus spécifiquement à la TATA box lorsqu’elle
existe.
 TFII A interagit avec l’ADN en amont de la TATA box.
 TFII B interagit avec l’ADN en aval de la TATA box au niveau du site d’initiation.
 TFII F agit lors de l’élongation.
 TFII H possède une activité hélicase, une activité de réparation de l’ADN et une activité
kinase qui sert à phosphoryler l’ARN-polymérase II au niveau de son domaine C-terminal
(CTD, pour carboxy-terminal domain) nécessaire à l’activation de la transcription. Une
déphosphorylation est nécessaire pour permettre une nouvelle pré-initiation. L’extrémité
CTD est formée par un enchaînement de sérine pouvant être phosphorylée.
b) Promoteur minimum et régions régulatrices
Les séquences consensus sont plus nombreuses que chez les procaryotes, on trouve :

BOUZAHAR.DEFFAR K 18
PRODUCTION DE PROTÉINES RECOMBINANTES

 La TATA box (= boîte de Hogness) entre -30 et -25, elle est présente dans environ 80% des
promoteurs.
 L’INR box à partir du +1 et présente dans environ 60% des promoteurs.
 La GC box.
 La CAAT box.
Le promoteur eucaryote est une structure modulaire. La TATA box et à l’INR box forme le
promoteur minimum au niveau duquel se fixe l’ARN-polymérase II via les facteurs généraux de
transcription.
On trouve en plus des séquences activatrices et amplificatrices jusqu’à -200 en amont du site
d’initiation ; parmi elles on trouve la GC box et la CAAT box. Les séquences activatrices sont très
variables et sont plus ou moins présentent à des nombres également variables suivant le promoteur.
Ces boîtes constituent les sites de fixation des facteurs de transcription et permettent ainsi la
modulation de l’activité du promoteur minimum.
Le terminateur au niveau de l’ARN est constitué de la séquence CPSF (AAUAAA) suivie par un
site de poly-adénilation 20 nucléotides en aval, elle-même suivie de la séquence CSTF qui est une
séquence riche en G/U qui s’apparie avec la séquence CPSF (formation d’une structure tige-boucle)
et après laquelle il y aura clivage.

3. Régions cis-régulatrices
a) Séquences amplificatrices de type enhancers
Les enhancers fixent des protéines qui vont permettre l’amplification de l’expression des gènes de
10 à 100 fois. Ils peuvent agir en trans sur un promoteur hétérologue et sont actifs dans les deux
directions. Ils sont généralement situés en amont du site d’initiation mais peuvent également se situer
en aval au milieu de l’unité de transcription.
On pourra prendre comme exemple les récepteurs des hormones thyroïdiennes et les récepteurs des
hormones stéroïdes (glucocorticoïde, progestérone, œstrogène). Les deux sont des récepteurs
nucléaires et il y a ainsi action au niveau du noyau par modulation de l’expression de certains gènes.
b) Séquences extinctrices de type silencers
Les silencers sont des séquences fixant des protéines qui inhibent l’expression des gènes en
agissant à distance.
c) Séquences isolantes de type insulators
Les insulators sont des séquences isolantes qui permettent d’isoler certaines régions du génome.

BOUZAHAR.DEFFAR K 19
PRODUCTION DE PROTÉINES RECOMBINANTES

4. Caractéristiques structurales des protéines régulatrices


 Le motif hélice-boucle-hélice : une hélice de liaison à l’ADN au niveau du grand sillon et
une hélice de stabilisation reliée par la boucle.
 Les motifs en doigt de zinc sont de plusieurs types, dont celui du type 4 cystéines ou du type
2 cystéines + 2 hydrogènes.
 Les leucines zipper correspondent à des hélices amphipathiques présentant des leucines qui
interagissent par des liaisons hydrophobes leucine-leucine.

5. Maturation des transcrits primaires


La maturation des transcrits primaires à lieu dans le noyau de la cellule. Chez les procaryotes ce
phénomène n’existe pas, le début de la traduction de l’ARNm se faisant avant la fin de la
transcription, la cellule procaryote ne possédant pas de noyau.
Les transcrits primaires ne correspondent qu’aux produits de la transcription de l’ARN-polymérase II,
ce qui ne veux pas pour autant dire que les produits de la transcription des autres ARN-polymérases
ne sont pas soumis à des modifications post-transcriptionnelles. On parle de pré-ARNm, pré-ARNr
et pré-ARNt.

a) Addition de la coiffe en 5’ (ou capping)


La coiffe correspond à l’ajout d’un groupement, dit « m7G », par une liaison 5’-5’ tri-phosphate.
Ce groupement m7G correspond à l’addition de trois groupements phosphates et d’une molécule de
GTP au niveau de l’extrémité 5’ du transcrit primaire grâce à l’énergie libérée par l’hydrolyse de la
molécule de GTP. Le nucléotide G va ensuite être méthylé sur le septième carbone (C7) pour donner
la 7-méthyl-guanosine. La coiffe est ajoutée grâce à un complexe protéique appelé « Cap-Binding-
Complex » qui possédant une activité triphosphatase, une activité guanylyl-transférase et une
activité méthyl-transférase.

b) Poly-adénilation en 3’ par la poly-A polymérase


La poly-adénilation correspond à l’ajout de jusqu’à 200 adénines à l’extrémité 3’ du transcrit
primaire et ceci sans matrice par la poly-A-polymérase. La poly-A-polymérase reconnaît le signal
de poly-adénilation qui n’est autre que la séquence CPSF (AAUAAA). 20 nucléotides en aval de
cette séquence la poly-A-polymérase utilise son activité endo-nucléasique et son activité A-
polymérasique.

BOUZAHAR.DEFFAR K 20
PRODUCTION DE PROTÉINES RECOMBINANTES

c) Excision des introns et épissage des exons (ou splicing)


Après l’addition de la coiffe et la poly-adénilation, le transcrit primaire est encore soumis à
l’excision des introns et l’épissage des exons ; les introns sont ainsi éliminés. Ceci est possible par la
présence de site donneur d’épissage (dinucléotide GU) à l’extrémité 5’ des introns et de site
accepteur d’épissage (dinucléotide CAG) à l’extrémité 3’ des introns.

Le groupement 3’OH du premier exon peut ainsi réagir avec l’extrémité 5’phosphate du deuxième
exon pour former une liaison phosphodiester et permettre la libération de l’intron qui sera dégradé.

d) L’épissage alternatif
A partir d’un transcrit primaire on peut avoir deux ou plus ARNm matures qui seront à l’origine de la
formation des protéines-isoformes. Ceci est possible grâce à l’épissage alternatif qui consiste en
l’élimination de certains exons. En effet certains exons sont constants au niveau des différents
ARNm matures et d’autres sont variables et spécifiques du tissu dans lequel se trouve la protéine
isoforme.

iv. Code génétique


Le code génétique est un code qui permet la conversion d’une séquence de nucléotides (ADN puis
ARN) en séquence d’acides aminés (protéines). Le code implique les bases A, C, T et G ainsi que les
20 acides aminés.
Le code génétique possède différentes caractéristiques :
 Les codons sont des triplets de nucléotides et ils codent pour un acide aminé.
 La séquence du gène et la séquence de la protéine codée sont colinéaires, c’est-à-dire que
la longueur du gène et la longueur de la structure primaire de la protéine finale sont
proportionnelles.
 Le code génétique est universel. En effet chaque acide aminé dispose d’un ou plusieurs
codons et ceci au niveau d’une multitude d’organismes vivants procaryote et eucaryote.
 Le code génétique est redondant (ou dégénéré). Plusieurs codons codent pour un même
acide-aminé : on trouve 64 codons et 20 acides aminés. Souvent se sont les deux premiers
nucléotides du codon qui définissent l’acide aminé, la redondance est donc due au troisième
nucléotide du codon.

BOUZAHAR.DEFFAR K 21
PRODUCTION DE PROTÉINES RECOMBINANTES

 Le code génétique est non-chevauchant. Les nucléotides d’un codon ne participe qu’au
code d’un seul acide aminé, ainsi le prochain acide-aminé sera codé par le prochain codon
présent sur l’ARNm. On parle du cadre de lecture (ou reading frame).
 Le code possède un système de ponctuation. Le codon d’initiation est le codon AUG (GUG
pour ma mitochondrie) et les codons de terminaison sont les codons UAA (ocre), UAG
(ambre) et UGA (opale). Le codon UGA (opale) n’est pas présent au niveau de la
mitochondrie.

v. Acteurs de la traduction
Les acteurs de la traduction sont l’ARN messager (ARNm), les ARN de transfert (ARNt), les
ribosomes, les acides aminés, les amino-acyl tRNA synthétases, le Mg2+, le GTP et l’ATP.

1. Ribosomes
Les ribosomes sont constitués d’ARN ribosomiques (ARNr) et de protéines et sont structurés sous
forme de deux sous-unités que ce soit chez les procaryotes ou chez les eucaryotes. Leur taille est
définie en unité Svedberg.
 Les ribosomes procaryotes (70S) sont constitués d’une petite sous-unité 30S et d’une grande
sous-unité 50S.
o La sous-unité 30S est constituée d’un ARNr 16S (1541 nucléotides) et de 21 protéines.
o La sous-unité 50S est constituée des ARNr 23S (2904 nucléotides) et 5S (120
nucléotides) ainsi que de 32 protéines.
 Les ribosomes eucaryotes (80S) sont constitués d’une petite sous-unité 40S et d’une grande
sous-unité 60S.
o La sous-unité 40S est constituée d’un ARNr 18S et de 33 protéines.
o La sous-unité 60S est constituée des ARNr 28S, 5,8S et 5S ainsi que de 49 protéines.
Attention chez les eucaryotes le premier acide aminé est la méthionine et non pas la f-Met présent
chez les procaryotes.
L’enchaînement des ribosomes sur l’ARNm forme le polysome, il permet d’augmenter
l’efficacité de la traduction. La distance minimale qui sépare deux ribosomes est de 100 nucléotides.
Au niveau des ribosomes associés au réticulum endoplasmique les protéines en voie de synthèse
pénètrent dans les vésicules du réticulum directement après le site E.

BOUZAHAR.DEFFAR K 22
PRODUCTION DE PROTÉINES RECOMBINANTES

2. ARNt
a) Structure des ARNt et ARNt iso-accepteur :
Les ARNt ont une structure secondaire en forme de trèfle à 3 feuilles et une structure tertiaire en
forme de L à l’envers. Lors du mécanisme de traduction il y a un appariement antiparallèle entre
l’ARNm et l’ARNt : reconnaissance codon-anticodon au niveau de la boucle de l’anticodon. Il existe
une flexibilité dans l’appariement des bases en position 3 du codon et en position 1 de l’anticodon,
cette flexibilité s’appelle le wobble.

Remarque : I est une base purique qui peut s’apparier avec U, C et A mais pas G.
On trouve 40 à 60 ARNt différents par cellule, il existe donc plusieurs ARNt différents pour un
acide aminé, on les appelle ARNt iso-accepteurs. (Ecriture : tARN leu 1)

b) Chargement de l’acide aminé sur l’ARNt :


La formation du complexe amino-acyl-tARN (aa-tARN) nécessite une Amino-acyl-tRNA-
synthétase spécifique de l’acide aminé, qui doit ainsi reconnaître toutes les formes de codon de cet
acide aminé. Le chargement correct de l’ARNt est un élément important dans la fidélité de la
traduction. L’acide aminé (aa) est tout d’abord activé et cette activation nécessite de l’énergie sous
forme d’ATP pour permettre la formation d’aa-AMP (liaison anhydride mixte). La liaison formée
entre l’ARNt et l’acide aminé est une liaison covalente de type carboxy-ester. Les Amino-acyl-
tRNA-synthétase sont au nombre de 20 dans la cellule, autant qu’il y a d’acides aminés qui rentrent
en compte dans la traduction. L’acide aminé complexé peut ainsi s’associer à la chaîne.

vi. Différentes étapes de la traduction procaryot e


1. Initiation
Un ribosome reconnaît le début de la séquence codante, il utilise des signaux d’adressage en
amont entre -8 et-13 du codon initiateur (AUG) qui correspond à la séquence de Shine-Dalgarno ou
RBS (AGGAGG). Il y a appariement antiparallèle de bases entre l’ARNm et la petite sous-unité
(30S) du ribosome, dû à une complémentarité de séquences entre l’ARNm et l’ARNr 16S.
Les bactéries nécessitent un acide aminé particulier pour l’initiation ; cet acide aminé est la
méthionine et elle nécessite une formylation sur l’extrémité NH2 (ajout d’un formyl) pour former la

BOUZAHAR.DEFFAR K 23
PRODUCTION DE PROTÉINES RECOMBINANTES

f-Met, c’est un phénomène pré-traductionnel. Cette formylation est réalisée par un cofacteur, la
vitamine B9 (ou tétrahydrofolate) qui reconnaît l’ARNt caractéristique et responsable du transport de
la f-Met. La particularité de conformation de cet ARNt lui permet d’être placé directement dans le
site P et non pas dans le site A.
L’initiation est permise grâce à la présence de facteurs d’initiation (IF pour Initiation Factor) :
 IF 1 est le facteur de dissociation du ribosome 70S.
 IF 2 est un facteur assurant la fidélité de reconnaissance entre l’ARNt et l’acide aminé. Il
possède également une activité GTPasique (c’est-à-dire d’hydrolyse du GTP).
 IF 3 est un facteur nécessaire à la fixation spécifique de 30S sur l’ARNm et de contrôle de
l’équilibre entre la forme associé et dissocié du ribosome (facteur anti-réassociation).
Par la suite le complexe 70S est reformé : lorsque l’ARNt fixé à la formyl-méthionine est fixé à la
petite sous-unité de l’ARNr, il y a hydrolyse du GTP et la grande SU se fixe sur le complexe.

2. Elongation
L’élongation correspond à une synthèse protéique par ajout d’acides aminés à l’extrémité C-
Terminale de la chaîne peptidique naissante, réaction catalysée par l’activité peptidyl-transférase de
la grande SU des ribosomes. La lecture de l’ARNm par le ribosome se fait de 5’ vers 3’. Il y a
formation d’une liaison amide particulière appelée liaison peptidique, les deux fonctions formant la
liaison étant portées par le carbone-α de deux acides aminés différents. Cette réaction entraîne
l’élimination d’une molécule d’eau.
L’élongation également est permise par la présence de facteurs d’élongation (EF pour Elongation
Factor) : EF-Tu ; EF-Ts et EF-G.
Pour chaque liaison peptidique formée on peut caractériser 3 étapes : la réaction de couplage, la
formation de la liaison peptidique et la translocation.

a) Réaction de couplage
L’étape de couplage correspond au transfert de l’acide aminé complexé à l’ARNt sur la chaîne
protéique en voie d’élongation. On peut faire la remarque que durant la traduction c’est l’extrémité
N-terminal (fonction amine) qui sort en premier du ribosome. Ainsi c’est l’extrémité C-terminale
(fonction carboxyle) du premier acide-aminé qui permettra la formation de la liaison peptidique avec
la fonction amine du deuxième acide-aminé. Ainsi le deuxième complexe aa-ARNt arrive dans le site
A, la f-Met étant positionnée dans le site P.

BOUZAHAR.DEFFAR K 24
PRODUCTION DE PROTÉINES RECOMBINANTES

b) Formation de la liaison peptidique et libération du premier ARNt


La liaison riche en énergie qui lie le premier ARNt avec la f-Met se rompt amenant l’énergie pour
permettre la formation de la liaison peptidique, ceci étant uniquement possible à ce moment-là car la
fonction COOH était jusqu’alors engagée dans la liaison à l’ARNt. L’ARNt est alors expulsé vers le
cytoplasme où il sera recyclé, en même temps que la formation de la liaison peptidique, réaction
catalysée par l’activité peptidyl-transférase de la grande sous-unité.

c) Translocation
Comme dit précédemment la lecture de l’ARNm se fait de 5’ vers 3’, de ce fait le ribosome se
déplace de 3 nucléotides (ou d’un codon) dans cette direction de telle sorte que l’ARNt portant les
deux premiers nucléotides se retrouve dans le site P, il y a translocation. L’ARNt portant le troisième
peut ensuite prendre place dans le site A à nouveau libre.
Ce cycle de trois étapes va donc se reproduite autant de fois qu’il est nécessaire jusqu’au codon stop.

vii. Réplication virale


1. Virus à ADN enveloppé
- Les glycoprotéines de l'enveloppe virale reconnaissent des récepteurs à la surface de la cellule
hôte et s'y attachent. On observe la fusion des deux membranes.
- Le génome viral ainsi que sa capside pénètrent dans la cellule.
- La capside virale est détruite par les enzymes de l'hôte.
- Le génome viral commence à se répliquer grâce à la machinerie cellulaire.
- Ces réplicats sont transcrits en ARNm.
- La traduction permet alors l'obtention des protéines de la capside ainsi que les glycoprotéines de
surface.
- Les glycoprotéines sont transportées à la surface cellulaire par l'intermédiaire de vésicules de
transport.
- Les capsides se forment dans la cellule hôte.
- Les virions sortent de la cellule identique au virus initial.

BOUZAHAR.DEFFAR K 25
PRODUCTION DE PROTÉINES RECOMBINANTES

Figure 1. La réplication des virus à ARN.

2. Rétrovirus ou Adénovirus

- Le génome viral pénètre dans la cellule cible après fusion de sa membrane avec la membrane
plasmique de l'hôte. Les protéines de la capside sont ensuite digérées par la cellule hôte.
- L'ADN est synthétisé de la matrice virale ARN par la Transcriptase Inverse.
- Le brin d'ADN néoformé sert de à son tour de matrice pour la synthèse d'un second brin viral
complémentaire au premier brin.
- L'ADN bicaténaire s'intègre dans le génome de l'hôte à la manière d'un provirus.
- Les gènes proviraux sont alors tanscrits.
- Les protéines virales sont synthétisées dans le cytoplasme de la cellule. L'ARN transcrit sert de
génome pour les nouvelles copies virales.
- Les capsides se forment.
- Nouveaux virus sortent de la cellule pour aller infecter d'autres cellules.

BOUZAHAR.DEFFAR K 26
PRODUCTION DE PROTÉINES RECOMBINANTES

Figure 2. La réplication des virus à ARN.

(Références : Jacqueline, 2000 ; Malacinski, 2002 ; Robert, 2002 ; Desmond, 2008 ;


http://www.takween.com/biologie-moleculaire-genie-genetique.html ;
http://www.cours-pharmacie.com/biologie-moleculaire/transcription-de-ladn.html).

BOUZAHAR.DEFFAR K 27
PRODUCTION DE PROTÉINES RECOMBINANTES

3. Clonages, dessin des amorces et analyses des vecteurs

i. Clonage
Le terme clonage est l'opération faisant appel au génie génétique et permettant la production d'un
clone. À partir de cellules isolées, il s'agit d'obtenir une lignée (plusieurs cellules similaires appelées
clones) dérivant d'un seul ancêtre. La spécificité de ce processus est le fait d'avoir un patrimoine
génétique rigoureusement identique. Autrement dit le clonage permet d'obtenir un grand nombre de
copies absolument identiques soit d'une cellule et l'on parle alors de clonage cellulaire soit d'un
fragment d'ADN et l'on parle alors de clonage moléculaire.

1. Principe du clonage
Le principe du clonage est simple. Il consiste à insérer un segment d'ADN étranger dans une petite
molécule capable de se répliquer de façon autonome. Ce type de molécule d'ADN est appelé un
vecteur de clonage. Un vecteur de clonage courant est le plasmide bactérien. L'ADN du plasmide est
coupé par une enzyme de restriction et lié in vitro au fragment d'ADN étranger coupé par la même
enzyme de restriction ou une enzyme qui donne des extrémités compatibles. Lorsqu'un transformant
stable a été obtenu, la séquence est dite clonée.

2. Étapes résumant le clonage


 Isolement de l’ADN à partir de cellules humaines/ou autre source et amplification de cet ADN
par la PCR (polymerase chain reaction).
 Action des enzymes de restriction.
 Action de la ligase.
 Transformation du l’ADN recombinant dans les cellules hôtes.
 Identification des clones positifs.

A. Isolement de l’ADN à partir de cellules humaines el amplification de cet ADN


par la PCR
1. On peut isoler l’ADN génomique et l’ARN par l’utilisation des produits chimiques (visiter ce
lien :
http://www.protocol-
online.org/prot/Molecular_Biology/DNA/DNA_Extraction_Purification/index.html

BOUZAHAR.DEFFAR K 28
PRODUCTION DE PROTÉINES RECOMBINANTES

2. Polymerase Chain Reaction


La «Polymerase Chain Reaction» ou PCR (ou Amplification en Chaîne par Polymérase), est une
technique de réplication ciblée in vitro. Elle permet d'obtenir, à partir d'un échantillon complexe et
peu abondant, d'importantes quantités d'un fragment d'ADN spécifique et de longueur définie.
L'ordre de grandeur à retenir est celui du million de copies en quelques heures. C'est, généralement
suffisant pour une utilisation ultérieure.

a. Principe
La réaction PCR permet d'amplifier in vitro une région spécifique d'un acide nucléique donné afin
d'en obtenir une quantité suffisante pour le détecter et l’étudier.
Pour se faire, une série de réactions permettant la réplication d’une matrice d’ADN double brin est
répétée en boucle. Ainsi, au cours de la réaction PCR, les produits obtenus à la fin de chaque cycle
servent de matrice pour le cycle suivant, l’amplification est donc exponentielle.
Pour avoir réplication d’un ADN double brin, il faut agir en trois étapes. (1) Il faut dénaturer l’ADN
pour obtenir des matrices simple brin ; (2) borner et amorcer la réplication de la séquence à amplifier
à l’aide d’oligonucléotides amorces spécifiques ; (3) réaliser la réaction de polymérisation du brin
complémentaire. A la fin de chaque cycle, les produits sont sous forme d'ADN double brin.

b. Amorces
Dans la mise au point de la réaction PCR, le choix des amorces est crucial. Elles vont avoir un
double rôle : en s'hybridant à l'ADN matrice, elles délimitent la région d’ADN à amplifier (étape 2
du cycle) et avec leur extrémité 3' OH libre servir d’amorce pour l’ADN polymérase (étape 3 du
cycle).
Les oligonucléotides amorces s’hybrident aux extrémités de la séquence qui va être amplifiée, il
faut donc connaître les séquences nucléotidiques des extrémités de la région ADN amplifiée. C'est en
effet au niveau de ces extrémités que les oligonucléotides amorces vont s'hybrider. Pour faciliter le
choix des séquences des deux amorces, des logiciels d’analyse de séquences permettent de vérifier
les points suivants :
 des Tm comparables. Les oligonucléotides amorces doivent s’hybrider à l'ADN matrice dans
les mêmes conditions de température.
 des séquences qui ne soient pas complémentaires entre elles (en particulier dans la région 3’),
 des séquences qui ne contiennent pas de séquences répétées inversées (pas de repliement
intramoléculaire).

BOUZAHAR.DEFFAR K 29
PRODUCTION DE PROTÉINES RECOMBINANTES

Il est alors possible de faire synthétiser les deux oligonucléotides (d'une vingtaine de bases). La
synthèse chimique d'ADN permet d'obtenir des oligonucléotides dont l'extrémité 5' n'est pas
phosphorylée (5'OH) contrairement aux ADN "dits" naturels. Ainsi, tous les fragments d'ADN
amplifiés par PCR sont déphosphorylés à leurs extrémités 5'.

c. Températures
Les trois étapes, constituant un cycle de PCR, sont effectuées à des températures
différentes permettant de contrôler l’activité enzymatique :
 l’étape de dénaturation, est réalisée à environ 95°C, pour une dissociation complète des
deux brins d’ADN.
 l’étape d’hybridation se fait à une température qui sera définie selon la nature des amorces
(cette température varie de 50 à 60°C). Cette température va déterminer la stabilité des
hybrides une fois que l’appariement amorces / matrice est réalisé.
 l’étape de polymérisation est à environ 72°C, température de « travail » de l’ADN
polymérase thermorésistante utilisée. Au cours de cette étape, les brins complémentaires
d’ADN sont synthétisés à partir des extrémités 3’OH libre des amorces hybridées.
Les températures de dénaturation et de polymérisation sont fixes, seule la température
d’hybridation devra être calculée pour chaque nouvelle PCR. Cette température d’hybridation
dépend de la composition en bases des oligonucléotides amorces. Elle est légèrement inférieure
(environ de 5°C) au Tm qui est la température de demi-dénaturation.
Pour calculer le Tm d’un oligonucléotide inférieur à 30 nucléotides, on utilise la relation suivante :
Tm = 2 (A + T) + 4 (G + C) (où A, T, G et C sont respectivement le nombre de chacune de ces bases
dans l’oligonucléotide).

d. ADN matriciel
En théorie une copie ADN de la séquence recherchée est suffisante pour avoir une amplification,
il faut cependant tenir compte de la probabilité de « rencontre » des molécules d’ADN matrice avec
les amorces. Dans la pratique plusieurs copies sont nécessaires pour avoir un résultat correct. Mais
attention, la mauvaise qualité et/ou une quantité trop importante d’ADN matrice peut conduire à une
amplification aspécifique, voire à une inhibition enzymatique. Il est possible d’expliquer cette
inhibition par la présence de contaminants provenant de l’échantillon ou des réactifs utilisés dans les
protocoles d’extraction d’ADN.

BOUZAHAR.DEFFAR K 30
PRODUCTION DE PROTÉINES RECOMBINANTES

e. ADN polymérase
Les premières ADN polymérases utilisées provenaient d'une bactérie thermophile (résistante à des
températures très élevées), comme par exemple Thermus aquaticus (Taq polymérase). De nos jours,
les enzymes utilisées sont dites recombinantes, ce qui simplifie considérablement leur obtention, et
leurs propriétés ont été largement modifiées pour les rendre plus efficaces et plus fidèles.

f. Tampon
Le tampon utilisé pour la réaction PCR sert à maintenir stable le pH du milieu réactionnel au
niveau optimal pour la Taq polymérase (TrisHCl à pH basique 8,5 à 9). Il contient des cations
bivalents Mg2+, cofacteurs indispensables pour la réaction de polymérisation avec la Taq polymérase.
La présence dans le milieu réactionnel des cations bivalents Mg 2+ et de cations monovalents (K+ ou
NH4+) vont neutraliser les charges négatives des groupements phosphates au niveau de l’ADN et
ainsi stabiliser les hybrides ADN/ADN. En pratique, la concentration en sel doit cependant rester
compatible avec l’activité de l’ADN polymérase.

g. Conditions expérimentales
En début d’expérience il y a un large excès d’oligonucléotides amorces ainsi que des dNTP en
quantité suffisante pour synthétiser les copies d’ADN. La concentration en ADN est très faible. La
difficulté au début d’expérience se situera essentiellement au niveau de la probabilité de rencontre
des amorces avec l’ADN matrice. Au fur et à mesure de l'avancée de la PCR, les copies d’ADN
s’accumulent. Cette augmentation de la quantité d'ADN s'accompagne de modification du milieu
réactionnel. La viscosité du milieu réactionnel augmente, les quantités d’oligonucléotides amorces et
de dNTP diminuent. De plus, la synthèse d’ADN est accompagnée de la libération d’ions
pyrophosphates qui en concentration élevée inhibent l’activité de la Taq polymérase. En fin
d'expérience PCR, les conditions expérimentales auront changé jusqu'à devenir de plus en plus
défavorables à une bonne activité enzymatique. On peut comprendre alors que le nombre de cycles
lors d'une expérience PCR soit limité (généralement entre 30 et 40 cycles).

h. Aspects quantitatifs de la réaction PCR


Le nombre de cycle est défini par l’expérimentateur selon le degré d’amplification souhaité, dans
la plupart des cas, ce nombre est d’environ 30. En théorie (et seulement en théorie!) il y a un facteur
d’amplification de l’ordre de 230 soit un facteur d'un milliard. Nous avons vu dans le paragraphe
précédent qu'en pratique les conditions expérimentales évoluent au fur et à mesure de l’avancée des

BOUZAHAR.DEFFAR K 31
PRODUCTION DE PROTÉINES RECOMBINANTES

cycles, le rendement de la réaction de polymérisation évolue de même, on peut espérer obtenir avec
30 à 40 cycles, un facteur d’amplification de l’ordre de 10 5 à 106.

 Reverse Transcriptase PCR


La RT-PCR est une technique qui associe une transcription inverse (RT) suivie d’une PCR. Elle
permet de synthétiser le brin complémentaire d’un ARN avec des désoxyribonucléotides en utilisant
une ADN polymérase ARN dépendante (transcriptase inverse). Ce cDNA est généralement destiné à
être amplifié par PCR (le cDNA étant plus stable, il permet plus de liberté que les ARN pour les
analyses suivantes).

BOUZAHAR.DEFFAR K 32
PRODUCTION DE PROTÉINES RECOMBINANTES

L'une des difficultés de cette méthode concerne la préparation des ARN qui peuvent être très
facilement dégradés et contaminés par de l'ADN génomique.

B. Action des enzymes de restriction

Une enzyme de restriction est une protéine en biologie moléculaire qui peut couper un fragment
d'ADN au niveau d'une séquence de nucléotides caractéristique nommée site de restriction. Chaque
enzyme de restriction reconnait ainsi un site spécifique. Plusieurs centaines d'enzymes de restriction
sont aujourd'hui connues, on en retrouve naturellement dans la plupart d'espèces de bactéries. Ces
enzymes, naturellement présentes chez les bactéries, sont devenues des outils indispensables en génie
génétique.

a. Rôle biologique
Les enzymes de restriction sont produites par des bactéries et forment un mécanisme de défense
contre les infections par les bactériophages, des virus spécifiques des bactéries. Quand le virus
injecte son ADN dans le micro-organisme, ce dernier est coupé par l'enzyme de restriction au niveau
de ses sites spécifiques. La destruction du génome du virus bloque ainsi l'infection. Le nom d'enzyme
de restriction provient de ce mécanisme, en effet la présence de ces enzymes dans les bactéries
restreint l'infectiosité des bactériophages.
Pour éviter que l'enzyme de restriction ne coupe l'ADN de son propre génome, la bactérie produit
aussi une deuxième enzyme nommée méthylase qui reconnaît aussi le site de restriction. La
méthylase ne coupe pas l'ADN, mais le modifie en lui rajoutant un groupement méthyle sur un ou
plusieurs nucléotides du site. Cette méthylation empêche la coupure par l'enzyme de restriction. Ce
mécanisme de défense, nommé dispositif de restriction/modification, associe toujours ces deux
enzymes, l'une de coupure et l'autre de protection.

b. Propriétés
Les enzymes de restrictions appartiennent à la classe des endonucléases, c'est-à-dire des enzymes
capables de cliver les liaisons phosphodiester entre deux nucléotides au sein de la chaîne d'un acide
nucléique. Les endonucléases changent des exonucléases, dans la mesure où elles peuvent cliver les
brins d'ADN de manière interne, tandis que les exonucléases n'attaquent la molécule d'ADN qu'au
niveau de ses extrémités.

BOUZAHAR.DEFFAR K 33
PRODUCTION DE PROTÉINES RECOMBINANTES

Les enzymes de restriction sont capables de reconnaître particulièrement une courte séquence de
l'ADN de 4 à 10 paires de bases, et de cliver les deux brins du duplex d'ADN au site reconnu. Cette
propriété a depuis longtemps été utilisée en biologie moléculaire, dans la mesure où elles permettent
de fragmenter l'ADN en segments de taille réduite en coupant à des sites définis.
Selon la relation spatiale entre la séquence reconnue et le lieu de coupure, il est envisageable de
distinguer trois types d'enzymes de restriction. Les enzymes de type I et de type III reconnaissent une
séquence d'ADN spécifique et coupent en un lieu aléatoire, d'une distance d'environ 1000 paires de
bases (pb) pour le type I et de 25 pb pour le type III plus loin que le site de restriction. Ces 2 types
ont aussi une activité méthylasique en plus de leur activité endonucléasique, ce qui les différencie du
type II. Les enzymes de type II, les plus utilisées, reconnaissent une séquence spécifique et coupent
en un lieu spécifique de cette séquence. Quelques exemples de ces enzymes figurent ci-dessous.
Généralement, les enzymes de restriction sont bloquées par le monoazide d'éthidium.

c. Exemples d'enzymes de type II

BOUZAHAR.DEFFAR K 34
PRODUCTION DE PROTÉINES RECOMBINANTES

d. Nomenclature des enzymes de restriction


Le nom de chaque enzyme de restriction est dérivé de la souche bactérienne à partir de laquelle
elle a été isolée. La nomenclature suivante est utilisée :
 La première lettre en majuscule indique le nom du genre de la bactérie.
 Les secondes et troisièmes, en minuscule, définissent l’espèce à laquelle appartient la bactérie.
 Une quatrième lettre peut être affectée pour préciser la souche bactérienne.
 Enfin, un chiffre romain indique l’ordre d’identification et de caractérisation de cette enzyme.

C. Action de la ligase
L'ADN ligase est une enzyme qui rétablit une liaison covalente entre les fragments de restriction :
Quand l'ADN se réplique in vivo, l'ADN ligase catalyse la formation phosphodiesters 3'‐5' entre les
courts segments du brin d'ADN synthétisé de façon discontinue au niveau de fourche de réplication.
On tire profit de cette ligase purifiée, pour recombiner des fragments de restriction in vitro. Au
moment où les bouts sont appariés, cet enzyme catalyse la formation de liaisons phosphodiesters 3'‐5'
entre l'extrémité 3'‐OH du brin d'un fragment et le phosphate 5'‐terminal du brin d'un autre fragment
de restriction. Il suffit d'ajouter ADN ligase et de l'ATP à la solution de fragments de restriction à
bouts collants pour que ceux‐ci s'unissent de façon covalente par des liaisons phosphodiester 3'‐5'
propre aux acides nucléiques. Certaines enzymes de restriction incisent 2 brins d'ADN au milieu du
site de reconnaissance en formant des fragments à bouts francs, dans ce cas l'ADN ligase purifiée est
utilisée pour lier covalemment les extrémités d'un fragment de restriction à celles d'un ADN vectoriel
et le fragment qui leurs sont complémentaires. L'ADN vectoriel et le fragment de restriction sont liés
covalemment grâce aux liaisons phosphodiester 3'‐5' standards d'ADN.

D. Transformation du l’ADN recombinant dans les cellules hôtes


(Voir le premier cours)

E. Identification des clones positifs


Les méthodes les plus utilisées sont la digestion enzymatique et la PCR par l’utilisation de l’ADN
recombinant, de quelques clones après la transformation, pour déterminer les clones positifs qui
contiennent le gène d’intérêt. Et ça se fait par l’application de la PCR et digestion enzymatiques dans
les mêmes conditions avant la transformation.

BOUZAHAR.DEFFAR K 35
PRODUCTION DE PROTÉINES RECOMBINANTES

ii. Vecteurs de clonage et l’analyse des vecteurs


Les vecteurs transfèrent le fragment d’ADN d’intérêt dans les cellules hôtes.

1. Propriétés des vecteurs de clonage


Parmi les caractéristiques connus pour être de bons vecteurs de clonage c'est que :
‐ Capables de réplication autonome dans une cellule hôte donnée (origine de réplication de type
procaryotique et/ ou eucaryotique).

‐ Ils doivent porter des marqueurs génétiques particuliers, comme des gènes de résistance aux
antibiotiques ou le gène codant la ß galactosidase.
‐ Ils doivent porter un ou plusieurs sites de restriction uniques dans une région qui n'est pas
essentielle pour la réplication des plasmides.

‐ Et si possible, ils doivent avoir des sites de restriction uniques dans des gènes codant des marqueurs
sélectifs. Ces marqueurs sont inactivés lorsqu'on y insère un fragment d'ADN étranger.
- Ils supportent l’insertion d’un fragment d’ADN plus ou moins grand .
Il y a cinq types principaux de vecteurs utilisés pour l’expression de protéines recombinantes :

BOUZAHAR.DEFFAR K 36
PRODUCTION DE PROTÉINES RECOMBINANTES

2. Types de vecteurs en fonction des cellules hôtes

a. Plasmides
Molécule d’ADN circulaire et de taille réduite, d'origine bactérienne. Peut être considérée comme
un minichromosome capable de réplication autonome. Confère la résistance à un ou plusieurs
antibiotiques.

b. Phages lambda
Les phages sont des viruses qui affectent les bactéries. L’avantage majeur de ces phages est
l’efficacité de leurs transformations.

BOUZAHAR.DEFFAR K 37
PRODUCTION DE PROTÉINES RECOMBINANTES

Génome de phage 

Recombinaison de
l’ADN

Assemblage

Infection

Cellules d’E. coli

c. Cosmides
Un cosmide est la combinaison d’un plasmide avec le site Cos aui permet l’insertion de l’ADN
d’intérêt dans la tête lambda. Il a des avantages :
- L’efficasité de transformation.
- L’insertion de longue fragmenr d’ADN environ 45kb.

d. Vecteurs de type YAC (Yeast artificial chromosome)


Ils sont capable de transporeter une longue fragment d’ADN (plus de 2 Mb) mais l’effecacité de
leur transformation est faible. Un YAC contient un centromères CEN, telomères Tel, une séquence
de réplication autonome ARS pour la proléfiration dans les cellules hôtes, un gène de résistance à
l’Ampicilline, des marqueurs TRP1 et URA3, des sites de restriction Eco RI et Bam HI.

BOUZAHAR.DEFFAR K 38
PRODUCTION DE PROTÉINES RECOMBINANTES

Clonage dans un vecteur YAC.

iii. Dessin des amorces


Les amorces (sens et anti sens) doivent contenir de 20-25 nucléotides, 80% de ces nucléotides
sont de C et G, la température d’hybridation de ces amorces est de l’ordre de 50-60°C et chaque
amorce doit contenir un site de restriction dans l’extrémité 5’ (les enzymes de restrictions utilisées
pour couper au niveau des extrémités sont choisies de façon que ces enzymes ne coupent pas l’ADN
codant pour la protéine cible). Le Primier premier 5 et Primer express programmes sont utilisés pour
dessiner les amorces.

Exemple :
5’GTGTGCATGTATATTGAAGCATTGGACAAGTATGCATGCGAGGGCGGCAGCCTGGCCGCGCTGACCGCGCACCAGG
CCTGCCACCTGCCGCTGGAGACTTTCACCCGTCATCGCCAGCCGCGCGGCTGGGAACAACTGGAGCAGTGCGGCTATC
CGGTGCAGCGGCTGATCGCCCTCTACCTGGCGGCGCGACTGTCATGGAACCAGGTCGACCAGGTGATCCGCAACGCCA
GTCTCCAGCAATCCTGTCTGCATCTCCAGGGGAGAAGGTCACAATGACTTGCAGGGCCAGCTCAAGTGTAAGTTACATG
TGGTACCAGCAGAAGCCAGGATCCTCCCCCAAACCCTGGATTTATGCCACATCCAACCTGGCTTCTGGAGTCC CGGTTC
AGGAGGTGGCTCTGGCGGAGGTGGCTCTCAGGTGAAGCTGCAGCAGTCAGGGGGAGGCTTAGTGAGCCGATTCACCA
TCTCCAGAGACAATGCCAGGAACACCCTGTACCTGCAAATGAGCAGTCTGAGGTCTGAGGACACGGCCTTGTATACTGT
GCAAGACGAGGTGGTAACTACGCCTGGTTTGCTTACTGGGGCCAAGGGACCACGGTCACCGTCTCCTCATAG 3’

BOUZAHAR.DEFFAR K 39
PRODUCTION DE PROTÉINES RECOMBINANTES

Amorce sense 5’ CCGGAATTCGTGTGCATGTATATT 3’


Eco RI
Tm=2(A+T) + 4(G+C)

Tm= 68 °C

Ta= Tm-5

Ta= 63 °C

Amorce antisense 5’ CCCAAGCTTCTATGAGGAGACG 3’


Hind III
Tm=2(A+T) + 4(G+C)

Tm= 68 °C

Ta= Tm-5

Ta= 63 °C

(Références : Jacqueline, 2000 ; Housset et Raisonnier, 2002 ; Desmond, 2008 ; ABRF 2009 ;
Deffar, 2009 ; Potocki-Veronese, 2009 ; http://www.web-books.com/MoBio/Free/Chap9.htm).

BOUZAHAR.DEFFAR K 40
PRODUCTION DE PROTÉINES RECOMBINANTES

4. Stratégies de clonage

i. Introduction
1. Principe

2. Besoins de cette technologie

Stratégies de clonage

Matériels : Méthodes :
ADN d’intérêt Extraction des acides nucléiques
Enzymes de restriction PCR ; RT-PCR
ADN ligase Digestion enzymatique
Vecteurs de clonage/d’expression Ligation
Souches de clonage/d’expression Transformation/transfection
Séquençage d’ADN

BOUZAHAR.DEFFAR K 41
PRODUCTION DE PROTÉINES RECOMBINANTES

ii. Avantages et défauts de chaque système d’expression

1. Expression chez les procaryotes

Avantages Inconvénients
- Croissance rapide et peu onéreuse. - Influence du vecteur sur le taux de
- Non pathogène pour l’homme. croissance cellulaire, la consommation
- Système génétique bien connu. d’énergie.
nombreuses souches améliorées. - Pas de modification post-traductionnelle,
- Expression des gènes contrôlable. activité biologique différente de la
- Nombreux vecteurs d’expression. protéine native.
disponibles, facilité de transfection dans - Corps d’inclusion : protéines insolubles
les cellules hôtes. ou mal repliée.
- Bons rendements de production des - Sécrétion dans l’espace périplasmique :
protéines (plusieurs dizaines de gramme rendement moins important.
par litre de culture). - Présence d’endotoxine bactérienne.
- Corps d’inclusion cytoplasmique : facilité
de purification.

2. Expression chez la levure

Avantages Inconvénients
- Petit génome eucaryote facilement manipulable - Hypoglycolysation.
et bien caractérisé. - N-glycosylation : immunogène pour
- Absence d’endotoxine. l’homme.
- Fermentation peu couteuse. - Mauvais repliement de la protéine
- Bons rendements (quelques grammes par litre produite.
de culture).
- Modifications post traductionnelles simples.
- Possibilité de sécrétion de la protéine d’intérêt.

BOUZAHAR.DEFFAR K 42
PRODUCTION DE PROTÉINES RECOMBINANTES

3. Expression dans les cellules d’insectes

Avantages Inconvénients
- Croissance rapide des cellules en suspension. - Systèmes de fermentations
- Bons rendements de production (qql centaines de particuliers (sans apport CO2,
mg/L de culture). 22°C).
- Modifications traductionnelles poussées : - Glycosylation.
- Reconnaissance de signaux d’adressage hétérologue, - Production couteuse (mort
- Clivage des pro-peptides et peptide signal, des cellules si infection par
- Assemblage de complexe oligomérique, baculovirus).
- Formation de ponts dissulfure,
- Repliement.
- Modifications chimiques.

4. Expression dans les cellules de mammifères


Avantages :
- Nombreux vecteurs d’expression disponibles.
- Maturation proche de la protéine native, profil de glycosylation complet si utilisation de cellules
humaines.
Inconvénients :
- Culture des cellules difficile et couteuse.
- Croissance lente.
- Cellules recombinées peu stable (perte de vecteurs).
- Faible rendement (de l'ordre de 10 mg/ L de culture).
- Peu de recul sur la sécurité virale (lignée cellulaire transformées).
Ce système devient de plus en plus poussé et efficace, mais en contrepartie, de plus en plus dure de
mettre en place.

BOUZAHAR.DEFFAR K 43
PRODUCTION DE PROTÉINES RECOMBINANTES

iii. Comparaison des systèmes d’expression

(Références : Dyck, 2003 ; ABRF 2009 ; http://biotech-btk.wifeo.com/proteine-heterologue.php).

BOUZAHAR.DEFFAR K 44
PRODUCTION DE PROTÉINES RECOMBINANTES

5. Différentes approches de la protéomique

i. Protéome
Le protéome est l'ensemble des protéines exprimées dans une cellule, une partie d'une cellule
(membranes, organites) ou un groupe de cellules (organe, organisme, groupe d'organismes) dans des
conditions données et à un moment donné. Il a été inventé en 1994 par Mark Wilkins de l'université
Macquarie de Sydney. Il provient de la contraction de protéine et génome car le protéome est aux
protéines ce que le génome est pour les gènes. Alors que les gènes codent des instructions, les
protéines les exécutent pour assurer le fonctionnement cellulaire.
Le protéome est de nature dynamique : à la différence du génome qui est plus ou moins stable
dans les cellules d'un organisme, le protéome varie temporellement et spatialement. La taille et la
complexité du protéome est plus importante que celle du génome car un gène peut coder plusieurs
protéines. Ceci est dû à des modifications de la maturation des ARNm, mais aussi à des
modifications post-traductionnelles des protéines comme les phosphorylations et les glycosylations.
L'étude du protéome, la protéomique, permet une meilleure compréhension du fonctionnement
cellulaire à partir de l'expression protéique dans un contexte global.

ii. Protéomique
La protéomique désigne la science qui étudie les protéomes, c'est-à-dire l'ensemble des protéines
d'une cellule, d'une organite, d'un tissu, d'un organe ou d'un organisme à un moment donné et sous
des conditions données.
Dans la pratique, la protéomique s'attache à identifier de manière globale les protéines extraites
d'une culture cellulaire, d'un tissu ou d'un fluide biologique, leur localisation dans les compartiments
cellulaires, leurs éventuelles modifications post-traductionnelles ainsi que leur quantité.
Elle permet de quantifier les variations de leur taux d'expression en fonction du temps, de leur
environnement, de leur état de développement, de leur état physiologique et pathologique, de
l'espèce d'origine. Elle étudie aussi les interactions que les protéines ont avec d'autres protéines, avec
l'ADN ou l'ARN, avec des substances. La protéomique fonctionnelle étudie les fonctions de chaque
protéine. La protéomique étudie enfin la structure primaire, secondaire et tertiaire des protéines.

BOUZAHAR.DEFFAR K 45
PRODUCTION DE PROTÉINES RECOMBINANTES

iii. Pourquoi le protéome ?


Les grosses protéines ont souvent une structure spatiale complexe, où des sous-unités compactes
sont reliées entre elles par des chaînes flexibles qui jouent un rôle dans les interactions entre
protéines ou avec d'autres substances. L'analyse de la structure des protéines aux rayons X montre
qu'elles sont bâties autour d'un réseau cristallin rigide, qui empêche ou réduit la flexibilité des sous-
unités.
La somme d'informations issue de l'analyse génomique ne répond pas à toutes les questions que
vise l'analyse protéomique (difficile et coûteuse). Des événements clés ont conduire du stock
d’informations que constitue le génome à la production des molécules qui vont déterminer et réguler
la vie cellulaire, les protéines. En théorie, la séquence de chaque gène sera transcrite (ou non) en un
ARN messager (ARNm), lui-même traduit en protéine. En fait, les gènes des cellules eucaryotes sont
souvent morcelés et contiennent des régions (introns) absentes de l’ARNm. Une transcription
partielle sera permise par l’épissage d’un ARN précurseur, copie du gène, pouvant donner naissance
à différents ARNm, chacun de ceux-ci pouvant aboutir à plusieurs protéines. On peut donc avancer
une série de raisons plaidant en faveur du développement de l'analyse protéomique :
L'identification et l'estimation des taux de protéines sont cruciales pour obtenir une image
complète de nombreux processus biologiques. Or, l'abondance des protéines à l'intérieur de la cellule
n'est pas seulement régulée à un niveau transcriptionnel, mais aussi aux niveaux traductionnels et
post-traductionnels, de telle sorte qu'aucune relation simple ne peut être établie entre taux d'ARNm et
de protéines. Le fait qu’un gène unique, et même un ARNm unique, puisse conduire à plusieurs
protéines distinctes par leur(s) fonction(s) rend hasardeuse cette corrélation. Enfin, certaines
protéines ont une durée de vie longue, c’est-à-dire que même synthétisées à faible vitesse elles
peuvent s’accumuler dans la cellule en demeurant fonctionnelles, alors que d’autres - à durée de vie
brève - sont rapidement éliminées. Donc, même si leur synthèse est rapide et elles se retrouveront à
un faible taux.
Une protéine selon son état cellulaire (différenciation, prolifération, apoptose) se retrouvera dans
un compartiment donné (cytoplasme, noyau, mitochondrie) ou sera secrétée par la cellule. Sans
l’analyse du protéome, une modification de localisation de la protéine nécessaire à son activité
biologique passera inaperçue.
La plupart des protéines ne deviennent biologiquement active qu'après des étapes de maturation
co- et post-traductionnelles (telles que glycosylation, phosphorylation, déamination...). Elles sont
également les indicateurs de l’état de la machinerie cellulaire.

BOUZAHAR.DEFFAR K 46
PRODUCTION DE PROTÉINES RECOMBINANTES

Finalement, les enjeux et résultats de projets de séquençage (du génome humain notamment)
justifient une étude approfondie du protéome. La découverte « surprenante » que ce génome
contenait bien moins de gènes que prédits démontre l'importance des protéines comme acteurs
centraux des processus biologique.

iv. Étapes principales de la Protéomiques


Les étapes principales de la Protéomiques sont : 1. Extraction des protéines et préparation des
échantillons (extraction des protéines), 2. Séparation des protéines (électrophorèse bidimensionnelle,
Chromatographie liquide), 3. Détection et quantification des protéines et 4. Identification des
protéines par spectrométrie de masse (Figure 1).

Figure 1. Les grandes étapes de la protéomique.

1. Extraction des protéines et préparation des échantillons


La protéomique exige l’utilisation d'échantillons biologiques de qualité. L'extraction de protéines
à partir de tissus, de cellules isolées ou de liquides physiologiques est réalisée à l'aide de tampons
appropriés, mis au point en considérant la nature des protéines à étudier (protéines cytosoliques,
membranaires, nucléaires…).
Les tampons d'extraction à pH bien déterminé, sont constitués dans des proportions variables, de
mélanges d'agents réducteurs, de détergents, voire de solvants organiques. Ils sont généralement
supplémentés d'inhibiteurs de protéases. Les protocoles expérimentaux doivent éviter les
contaminations par des acides nucléiques, des lipides et les sels.

BOUZAHAR.DEFFAR K 47
PRODUCTION DE PROTÉINES RECOMBINANTES

Ces contaminants peuvent perturber la séparation des protéines par électrophorèse bidimensionnelle
ou par chromatographie liquide. Les protéines hydrophobes telles que les protéines membranaires
sont difficiles à solubiliser. De même, les protéines très basiques, telles que les histones et les
protéines ribosomales, sont peu visibles sur un gel 2D après une isoélectrofocalisation.
De façon générale, la protéomique fait appel à l'utilisation de l'électrophorèse bidimensionnelle
(2D) hautement résolutive et la spectrométrie de masse qui associée à l'analyse informatisée des gels,
permet de visualiser et de mesurer des variations de quantité de protéines entre différents
échantillons. Les protéines identifiées par spectrométrie de masse sont comparées aux protéines des
banques de données disponibles sur internet.
L’étape d’extraction est cruciale : une mauvaise extraction peut produire la dégradation des
protéines et compliquer, voir rendre impossible, l'identification des protéines. Les protéines
membranaires, comportant de nombreux acides aminées hydrophobes et donc peu soluble, restent
difficiles à étudier.
Certaines techniques ne nécessitent pas d'extraire les protéines du tissu étudié. Dans
l'immunolocalisation, le tissu est fixé puis découpé en fines lamelles de quelques microns d'épaisseur.
Les protéines sont ensuite détectées in situ par des anticorps marqués. Dans l'imagerie par
spectrométrie de masse, des coupes de tissus sont analysées directement par un spectromètre de
masse de type MALDI-TOF.
Pour simplifier l'analyse, l'extraction est souvent réalisée en éliminant les modifications post-
traductionnelles. Seule la structure primaire des protéines, c'est-à-dire leurs séquences, est conservée.
Mais si le sujet de l'analyse est l'étude de ces modifications post-traductionnelles, il convient de
prendre les précautions nécessaires pour les garder.

2. Séparation des protéines par électrophorèse bidimensionnelle (2D)


L'électrophorèse 2D est la méthode de choix pour séparer les protéines puisqu'elle permet de
séparer simultanément plusieurs milliers de polypeptides d'un mélange complexe en fonction de
deux propriétés différentes : la charge électrique et le poids moléculaire (Figure 2).
Dans la première dimension, les protéines sont soumises à une électrophorèse dans un gel
présentant un gradient de pH continu. Au cours de cette étape, appelée isoélectrofocalisation (IEF),
elles migrent dans le gel jusqu'à une position où la valeur du pH est égale à celle de leur point
isoélectrique (pI) où leur charge globale devient nulle. Cette première séparation est délicate et
dépend beaucoup de la préparation des échantillons biologiques qui doit permettre une solubilisation
maximale des protéines et empêcher leur agrégation et leur dégradation. Dans la deuxième

BOUZAHAR.DEFFAR K 48
PRODUCTION DE PROTÉINES RECOMBINANTES

dimension, les protéines sont séparées par la technique SDS-PAGE (sodium-dodécyl sulfate-
polyacrylamide gel electrophoresis). La résolution s'effectue sur un gel réticulé constitué de
polyacrylamide en présence d'un agent dénaturant, le sodium-dodécyl sulfate (SDS).
Grâce à la réticulation plus ou moins importante du gel de polyacrylamide, les protéines sont
séparées par tamisage moléculaire, leur vitesse de migration dans le gel étant inversement corrélée à
leur taille. Comme pour l'IEF, plus le gel de deuxième dimension est grand, plus la résolution (et
donc le nombre de spots séparés) augmente.

Figure 2. Electrophorèse en double dimension.

3. Détection et quantification des protéines


Après électrophorèse bidimensionnelle, les protéines séparées sont détectées par coloration des
gels. Plusieurs procédés de sensibilité différente existent et sont choisis en fonction de l'utilisation
ultérieure des gels 2D : le bleu de coomassie permet de détecter un minimum de 100 ng de protéine
par spot et présente l'avantage de donner une intensité de coloration proportionnelle à la quantité de
protéines. Etant mille fois plus sensible que le bleu de coomassie, la coloration au nitrate d'argent
permet de détecter des spots contenant 0,1 ng de protéines. Elle présente néanmoins certains
inconvénients : la stœchiométrie de la coloration n'est pas totalement linéaire, la reproductibilité est
difficile à obtenir et certaines protéines sont peu ou pas colorées par cette méthode. Plus récemment,
la détection des spots par fluorescence (Sypro Orange, Sypro Red, Sypro Ruby) a été développée,
avec une sensibilité et une linéarité d'intensité de coloration équivalente à celle de l'argent, mais avec

BOUZAHAR.DEFFAR K 49
PRODUCTION DE PROTÉINES RECOMBINANTES

une reproductibilité, une facilité et une rapidité meilleures que celles de la coloration au nitrate
d'argent.
En dernier lieu, notons que l'autoradiographie des gels 2D après incorporation dans les protéines
d'isotopes radioactifs comme le 35S ou le 32P/33P est extrêmement sensible. En effet, elle permet de
visualiser des quantités très faibles de protéines (de l'ordre de 1 à 100 pg). Depuis les années 1970,
les méthodes d'analyse des gels ont évolué grâce aux progrès combinés de l'informatique et de
l'analyse d'images. La digitalisation des gels consiste en une transformation de l'image expérimentale
en une information numérique utilisable par l'ordinateur.

4. Identification des protéines


a. Spectrométrie de masse et recherche dans les banques de données
L'avancée majeure en termes d'identification des protéines des gels 2D (1993-1994) correspond à
l'utilisation conjointe de la spectrométrie de masse et des banques de données. En s'adaptant à la
biologie structurale, la spectrométrie de masse a permis de déterminer avec une sensibilité et une
précision extrêmes la masse des molécules. Un spectromètre de masse se compose d'une source où
s'effectuent l'ionisation et la désorption des ions, d'un analyseur où les ions sont séparés en fonction
de leur rapport masse sur charge (m/z) et d'un détecteur permettant l'enregistrement et la
quantification des ions.
Pour l'étude des composés peptidiques, deux modes d'ionisation sont principalement utilisés :
- la désorption/ionisation laser assistée par matrice (Maldi-Tof) qui permet de réaliser une empreinte
peptidique après digestion protéolytique (empreintes peptidiques).
- la spectrométrie de masse en tandem en mode nanospray (MS-MS) qui permet d'obtenir une
microséquence en acides aminés.

b. Interactions protéiques

Elle étudie aussi les interactions que les protéines ont avec d'autres protéines, avec l'ADN ou
l'ARN, avec des substances.
Une autre manière de considérer les interactions protéiques est de faire du double hybride. En
criblant une banque d'ADNc avec sa protéine en tant qu'appât on peut déceler tous les interractants
dans un organisme ou un tissu spécifique (animal ou végétal). Correctement utilisée, cette technique
est très efficace. La qualité des résultats dépend souvent de la qualité de la banque et de l'efficacité
de la transformation de la levure ou de la bactérie.

BOUZAHAR.DEFFAR K 50
PRODUCTION DE PROTÉINES RECOMBINANTES

v. Protéomique fonctionnelle
La protéomique fonctionnelle étudie les fonctions de chaque protéine.

vi. Protéomique structurale


La protéomique étudie enfin les structures primaires, secondaires et tertiaires des protéines. On
distingue quatre niveaux stades structuraux chez les protéines, de la structure primaire à la structure
quaternaire.
(1) Structure primaire : ordre des acides aminés le long de la chaîne polypeptidique.
(2) Structure secondaire : repliement local des acides aminés en hélices, en feuillets, ou en d'autres
formes similaires. (3) Structure tertiaire : agencement stable dans l'espace de ces hélices et feuillets.
(4) Structure quaternaire : agencement des sous-unités entre elles, quand la protéine est constituée de
plusieurs sous-unités indépendantes (comme l'est par exemple l'hémoglobine).

Figure 3. Structure des protéines.

(Référence : http://www.takween.com/techniques/proteomique.html).

BOUZAHAR.DEFFAR K 51
PRODUCTION DE PROTÉINES RECOMBINANTES

6. Production en système bactérien (Escherichia coli)

i. Introduction
Escherichia coli, également appelé colibacille ou E. coli découverte en 1885 par Théodore
Escherich, dans des selles de nourrissons, E. coli est un bacille gram-négatif radiorésistant de la
famille des Enterobacteriaceae pesant 110 femtogrammes (Figure 1). C’est un hôte commun de la
microflore commensale intestinale de l’homme et des animaux à sang chaud (mammifères et
oiseaux). Le patrimoine génétique de la souche E. coli de laboratoire non pathogène a été
entièrement séquencé en 1997. Son génome comprend 4,6 millions de paires de bases codant environ
4200 protéines. E. coli a été très étudié depuis les années 60, si bien que c'est un des organismes
actuellement les mieux connus. L'ensemble de ces connaissances en biochimie, génétique et biologie
moléculaire a été exploité pour exprimer des protéines en grande quantité. Au début des années 80,
l’insuline fut la première protéine recombinante humaine produite par l’utilisation d’E. coli. Cette
bactérie a plusieurs propriétés intéressantes pour être utilisée pour exprimer des protéines : elle est
facile à manipuler, elle pousse vite dans des milieux relativement peu cher et les souches de
laboratoires sont inoffensives. De plus tous les laboratoires de biologie moléculaire utilisent E. coli
pour d’autres expériences (clonage, séquence…). Cette facilité en a fait le système d'expression le
plus populaire.

a b

Figure 1. a. La classification d’E. coli ; b. La forme d’E. coli.

ii. Avantages et défauts du système

Jusqu’au milieu des années 90, la bactérie était l’hôte de choix pour produire une protéine
recombinante. Cette position dominante découlait essentiellement de ses propriétés de croissance
rapide, de son faible coût de production, de sa génétique très étudiée, et des règles de sécurité
imposées pour la manipulation de l’ADN recombinant, mais ce système de production a des défauts.

BOUZAHAR.DEFFAR K 52
PRODUCTION DE PROTÉINES RECOMBINANTES

Les avantages et les inconvénients de la production en système bactérien sont résumés dans le
tableau 1.

Tableau 1. Les avantages et les inconvénients du système bactérien.

Avantages Inconvénients
 Croissance rapide et peu onéreuse.  Influence du vecteur sur le taux de
 Non pathogène pour l’homme. croissance cellulaire, la consommation
 Système génétique bien connu, d’énergie.
nombreuses souches améliorées.  Pas de modification post-traductionnelle,
 Expression des gènes contrôlable. activité biologique différente de la
 Nombreux vecteurs d’expression protéine native.
disponibles, facilité de transformation  Corps d’inclusion : protéines insolubles
dans les cellules hôtes. ou mal repliée
 Bons rendements de production des  Sécrétion dans l’espace périplasmique :
protéines (plusieurs dizaines de gramme rendement moins important.
par litre de culture).
 Corps d’inclusion cytoplasmique :
facilité de purification.

iii. Construction des souches

Principe de la préparation de cellules artificiellement compétentes


Les cellules d'E. coli sont cultivées jusqu'en phase exponentielle puis concentrées par
centrifugation. Ces cellules sont rendues compétentes pour la transformation par resuspension dans
une solution de chlorure de calcium. En présence d'ions calcium, les cellules sont capables d'ingérer
des petites molécules d'ADN recombinant.
1) Une culture bactérienne d’E. coli à DO600nm = 0,4 de volume « Vi » (volume initial).
2) Centrifuger cette suspension bactérienne 5 min à 3000 rpm à 4 °C. Jeter le surnageant stérilement
et délicatement.
3) Resuspendre délicatement le culot bactérien par la moitié du vol. initial de culture (1/2 Vi) par du
CaCl2 50 mM pré-refroidi à 4°C.
Attention : les cellules doivent toujours rester à 4°C jusqu’à la transformation.
4) Incuber dans la glace pendant 20 min.
5) Centrifuger 5 min à 3000 rpm à 4°C. Jeter le surnageant stérilement et délicatement.

BOUZAHAR.DEFFAR K 53
PRODUCTION DE PROTÉINES RECOMBINANTES

6) Resuspendre délicatement le culot bactérien par le dixième du vol. initial de la culture (1/10 Vi)
par du CaCl2 50 mM (4°C) et stocker au froid jusqu’à utilisation pour la transformation.
La souche la plus utilisée pour le clonage seulement est E. coli DH5α, les souches les plus
utilisées pour l’expression d’une protéine recombinante sont résumées dans le tableau 2.

Tableau 2. Souches disponibles aux laboratoires.

iv. Analyse et construction des vecteurs d’expression

Pour exprimer un gène dans E. coli, il doit être inséré dans un vecteur qui contient plusieurs
éléments: 1) une origine de réplication, un gène de résistance à un antibiotique (ATB) et un
polylinker, 2) un promoteur si possible contrôlable dont l'induction produira une grande quantité
d’ARNm à partir du gène cloné, 3) les séquences responsables de la traduction telle qu'une séquence
de liaison au ribosome (RBS), ces séquences doivent être bien positionnées. 4) une étiquette ou tag
généralement insérer dans le polylinker qui permettra une protéine de fusion facilement détectable et
purifiable, souvent par chromatographie d’affinité. Cette étiquette peut être placée en N ou C
terminale.

a) Origine de réplication
Le gène doit être répliqué dans la bactérie, autrement, on va le perdre très rapidement. La méthode
générale consiste à l’insérer dans un plasmide qui porte une origine de réplication. L’utilisation de

BOUZAHAR.DEFFAR K 54
PRODUCTION DE PROTÉINES RECOMBINANTES

plasmides pour exprimer un gène dans E. coli est brevetée, ceci a amené l’utilisation d’une autre
origine de réplication, celle du chromosome bactérien. Le gène d’intérêt est ici incorporé au
chromosome bactérien.
b) Promoteurs
Deux domaines en amont du site d'initiation de la transcription sont importants dans les
promoteurs procaryotes. Le domaine à -10 (la boite, 5' T-A-T-A-A 3') et un domaine à -35 (5' T-T-
G-A-C-A 3'). Ces deux domaines sont en contact avec la RNA polymérase lors de l'initiation de la
transcription.
Deux caractéristiques des promoteurs sont importantes pour l’expression des protéines, la force du
promoteur et son inductibilité.
 La force du promoteur, les promoteurs bactériens sont relativement faibles du moins pour
les besoins de production. Pour les améliorer, des mutations ponctuelles ou des petites délétions ont
été effectuées au sein de ces promoteurs, ce qui a permis d'augmenter la transcription.
 L’inductibilité, c’est à dire son contrôle : le plus souvent on désire utiliser un promoteur
inductible par exemple lorsque la protéine est très toxique pour la bactérie. Dans ce cas, la protéine
est produite en début de la culture et inhibe la croissance cellulaire. En utilisant un promoteur
inductible, on cherchera à inhiber la production au début de la phase de croissance des bactéries puis
à l’approche de la phase stationnaire, on induira la production.

c) Séquences responsables de la traduction


Chez les procaryotes, l'initiation s'effectue par reconnaissance d'une séquence particulière (RBS,
ribosome binding site). Cette séquence est composée d’une séquence riche en purine et du codon
d'initiation qui doit être proche, idéalement l'extrémité 3' du RBS doit être à 6 bases de l'ATG. Donc,
si on veut exprimer un clone provenant d'une cellule eucaryote dans une bactérie, il faudra incorporer
cette séquence en amont de l'ATG d'initiation. Généralement, on mutagenèse la séquence du gène
d'intérêt au niveau de l'ATG en y incorporant un site de restriction tel que Nde I (CATATG). Ce site
est présent sur le vecteur 8 nucléotides en aval d'un site de liaison au ribosome.

d) Séquences responsables de l’arrêt de la transcription


On peut dans certains cas ajouter en 3' du gène des séquences responsables de l'arrêt de la
transcription. Au niveau d'un signal de terminaison, la polymérase libère la matrice et l'ARN
monocaténaire néosynthétisé. Extrémité 3’ de l’ARNUUUUUU arrêt de la transcription. Chez E.
coli, il y a deux sortes de terminaison, une terminaison intrinsèque et une terminaison dépendante

BOUZAHAR.DEFFAR K 55
PRODUCTION DE PROTÉINES RECOMBINANTES

d’une protéine, la protéine ρ. Dans la terminaison intrinsèque, la polymérase s'arrête quand elle
synthétise une série de résidus U dans la mesure où elle a d'abord synthétisée une séquence
autocomplémentaire capable de se replier. C'est le repliement, l'hélice en épingle à cheveux, qui se
forme rapidement dans cette région, qui est cruciale pour l'arrêt de la transcription. La séquence de la
région autocomplémentaire peut varier. Lors de la terminaison ρ dépendante, la protéine ρ reconnaît
une séquence sur l’ARN néosynthétisé et catalyse l’arrêt de la transcription.
Dans certains cas, on ajoute une séquence de terminaison ρ indépendante en 3’ du gène, il y a
formation d’une boucle qui termine la transcription. Cette boucle a un autre avantage, elle stabilise
l’ARN en inhibant l’activité des 3’ 5’ exonucléases qui ne dégradent que l’ARN simple brin.
Toutefois ces séquences ne sont indispensables et sont inefficaces pour l’arrêt de transcription dans
le cas d’une production utilisant la T7 RNA polymérase.

Parmi les vecteurs les plus utilisés selon leur promoteur :


1. Promoteur du phage T5 comme le pQE (Qiagen) Figure 2.
2. Promoteur du phage T7 comme le pET (Novagen) Figure 3 ; le pALTER-ex (Promega)
et le pGEMEX (Promega).
3. Promoteur Ptac comme le pMAL (NEB).

Exemple 1 : Le pQE (Qiagen)

Figure 2. Le système pQE.

BOUZAHAR.DEFFAR K 56
PRODUCTION DE PROTÉINES RECOMBINANTES

Exemple 2 : Le pET (Novagen)

Figure 3. Le système pET.

v. Choix d’un système d’induction


L’expression de protéines hétérologues se fait la plupart du temps après une première étape de
croissance de la bactérie :
- 1er raison : production de biomasse. La machinerie cellulaire étant recrutée par la production
de la protéine endogène ou homologue. Ainsi, lors de l’induction, cette même machinerie
sera presque exclusivement utilisée pour la production de la protéine d’intérêt.
- 2nd raison : cette induction a un moment précis permet de protéger les bactéries ou les
cellules contre la toxicité fréquente des protéines hétérologues accumulées. On tente donc de
limiter le plus possible leur expression pendant la première phase de croissance.

Tableau 3. Les différents systèmes d’induction d’expression.

BOUZAHAR.DEFFAR K 57
PRODUCTION DE PROTÉINES RECOMBINANTES

Le système d’induction le plus utilisé est l’induction par l'isopropyl β-D thiogalactoside (IPTG est
un réactif en biologie moléculaire. Ce composé est utilisé comme un équivalent de l'allolactose, un
métabolite du lactose qui entraine la transcription de l'opéron lactose. Contrairement à l'allolactose,
l'atome de souffre de l'IPTG crée un pont chimique qui n'est pas hydrolysable par la cellule, ce qui
rend sa concentration constante.

En laboratoire, l'IPTG est utilisé pour le clonage. Les


colonies de bactéries qui ont été transformées avec un plasmide recombinant doivent être
différenciées des bactéries qui n'ont pas incorporé ce plasmide avec l'insert. Le X-Gal est une
substance qui peut être métabolisé par les β-galactosidases pour produire un composé bleu. Ainsi, les
cellules qui produisent des β-galactosidases induites par l'IPTG, en présence d'X-Gal, vont devenir
bleues. En revanche, les cellules ayant incorporé un fragment ADN, qui va se situer au niveau du
LacZ dans le plasmide, l'un des gènes codant pour la β-galactosidase, ne vont pas pouvoir produire
ce composé bleu et vont rester blanches).
On peut utiliser des répresseurs :
Exemple du promoteur du gène lac Z. Une des inductions les plus utilisée est celle du promoteur du
gène lac Z. (Plac). LacI est un répresseur qui se positionne en aval du promoteur et inhibe la

transcription (Figure 4). La transcription est induite par un analogue du galactose, l'isopropyl β-D
thiogalactoside (IPTG) qui se fixe sur lac I, induit un changement de conformation de lacI qui ne fixe
plus sur l’opérateur. Pour augmenter l’efficacité du répresseur, on peut d’une part surproduire le
répresseur en ajoutant un gène le codant dans le plasmide et d’autre part augmenter le nombre
d’opérateur (lac O) en aval du promoteur du gène d’intérêt. LacI agit directement sur la transcription
du gène d’intérêt ou indirectement en contrôlant la transcription de la T7 RNA polymérase.
On peut utiliser des inhibiteurs de la RNA polymérase. La T7 RNA polymérase est inhibée par le
lysozyme. Si on introduit le gène codant pour le lysozyme sur un plasmide, la production de
lysozyme inhibera le peu de T7 RNA polymérase produite en l’absence d’induction. Par contre en
présence d’induction, l’inhibiteur sera en trop faible quantité comparativement à la T7 RNA
polymérase surproduite.
On peut ajouter l’ARN polymérase au moment de la production. Dans certains cas la protéine à
exprimer est toxique pour la bactérie. Or tous les promoteurs inductibles ont une activité basale
même faible, si bien que la protéine est produite en faible quantité en l'absence d'induction (on dit
que le promoteur fuit). Si la protéine est très toxique, on peut utiliser une autre stratégie pour
produire la T7 RNA polymérase en utilisant un phage M13 produisant la T7 RNA polymérase. On

BOUZAHAR.DEFFAR K 58
PRODUCTION DE PROTÉINES RECOMBINANTES

fait pousser les bactéries puis avant de produire, on infecte les bactéries par le virus. Le virus produit
la T7 RNA polymérase puis le gène d'intérêt est transcrit.

Figure 4. Le système d’expression du phage T7.

vi. Choix d’un système de purification


De plus en plus, la purification est effectuée par chromatographie d’affinité à l’aide de TAG sur
des protéines de fusion.
Protéine de fusion : c’est une protéine qui est issu d’un gène chimère (combinaison de deux gènes
différents) et différents cadres de lecture sont liés de façon à ce que leur séquence codante soit en
phase. La construction résultante est transcrite puis traduite comme un seul gène produisant une
seule protéine.

vii. Choix de la localisation subcellulaire de la protéine exprimée


1. Corps d’inclusion

Pour remplir leur fonction, les protéines doivent adopter une conformation tridimensionnelle
précise, l’état natif, acquise au cours du repliement cellulaire (Figure 5). La synthèse des protéines au
niveau des ribosomes est un processus universellement conservé, ce qui permet à une bactérie de
produire des protéines humaines, par exemple. Cependant, de nombreuses protéines ne sont pas
produites dans leur état natif, mais s’agrègent dans un état le plus souvent biologiquement inactif,
que l’on appelle corps d’inclusion (Figure 6). Ce phénomène d’agrégation est le principal obstacle à
la production de protéines et, contrairement à ce qui est couramment admis, la formation des corps
d’inclusion n’est pas l’apanage des systèmes bactériens, mais s’observe également dans des cellules
eucaryotes.

BOUZAHAR.DEFFAR K 59
PRODUCTION DE PROTÉINES RECOMBINANTES

Le mécanisme moléculaire de l’agrégation des protéines recombinantes suggère que les chaînes
polypeptidiques naissantes, adoptant des conformations partiellement repliées et instables (les
intermédiaires de repliement), peuvent emprunter deux voies alternatives et compétitives, selon une
partition cinétique : le repliement correct, qui conduit à la forme native, ou le repliement incorrect,
qui conduit à l’agrégation. Les corps d’inclusion sont des agrégats protéiques non ordonnés,
relativement homogènes et denses ; ils sont de plus en plus considérés comme des systèmes en
équilibre dynamique entre association et dissociation d’espèces partiellement ou incorrectement
repliées. La concentration très élevée des chaînes polypeptidiques naissantes dans une cellule
recombinante favorise les réactions d’agrégation aux dépens de la réaction productive vers l’état
natif.

Dans le contexte cellulaire, le repliement est facilité par un ensemble d’acteurs : les chaperons,
qui assistent les protéines en cours de repliement des catalyseurs, qui interviennent sur les étapes
lentes de ce processus, les oxydoréductases, qui catalysent la formation des ponts disulfures, et les
peptidyl-prolyl isomérases, qui catalysent l’isomérisation cis-trans des liaisons peptidiques. En
agissant sur les conformations intermédiaires, les protéines chaperons contrôlent directement le
processus de repliement, en collaboration avec les protéases cellulaires. En effet, les protéines
incorrectement repliées sont également les substrats cellulaires de systèmes de dégradation en
assurant l’élimination rapide. Dans certains cas, l’agrégation résulte de la disponibilité limitée des
chaperons et induit une réponse au stress dans la cellule qui produit des quantités non physiologiques
d’une protéine inutile. Cependant, la formation des corps d’inclusion peut avoir un effet bénéfique en
protégeant la protéine recombinante de la dégradation par les protéases cellulaires.

On peut purifier ses corps d’inclusion par lyse de la culture bactérienne, puis par centrifugation à
basse vitesse (500 à 1000 g), suivit ensuite par une solubilisation par des détergents (attention au
cout de ces derniers), purifié par dialyse ou diafiltration. La dernière étape, si elle a lieu, est la
renaturation de la protéine.

Les avantages sont qu’il y a pas de protéolyse de la protéine agrégée, il n’y a pas de toxicité de la
protéine vis-à-vis de la cellule, la purification est simple et peu couteuse, et de grandes quantités sont
accumulées. Le principal inconvénient survient si l’on doit renaturer la protéine in vitro : les
rendements sont inversement proportionnels à la concentration de la protéine.

BOUZAHAR.DEFFAR K 60
PRODUCTION DE PROTÉINES RECOMBINANTES

Figure 5. Voies de repliement cellulaire des protéines. Dans son contexte cellulaire, le repliement
des protéines est plus complexe que dans un tube à essais. La compartimentation cellulaire, qui est
une source de complexité rarement mimée dans les études de repliement in vitro, impose un
contrôle précis du repliement des protéines qui doivent s’insérer ou franchir une membrane
lipidique au cours de leur biogenèse.

a b

Figure 6. a, Les corps d’inclusion ; b, Formation des corps d’inclusion. Illustration,


à partir d’une chaîne polypeptidique naissante, des différentes réactions conduisant à
la distribution cellulaire des protéines entre les états repliés, agrégés ou dégradés.

2. Soluble dans le cytoplasme


Il faut pour cela utilisé des vecteurs comportant des promoteurs thermo-régulés (ex : cspA). Pour
la production, il y a une première phase d’expansion de la bactérie à 37°C, suivit d’une phase
d’induction de la production entre 15 et 25°C. Il doit aussi y avoir une surexpression de protéines-
chaperon.
3. Expression dans le périplasme (4% des protéines bactériennes)
Il faut pour cela l’ajout d’une séquence signal procaryote (phoA, OmpA) en 5’ de la protéine
exprimée. L’avantage principal est que l’environnement est oxydant, et permet donc la formation de

BOUZAHAR.DEFFAR K 61
PRODUCTION DE PROTÉINES RECOMBINANTES

ponts disulfure. Cependant, les mécanismes de translocation sont mal connus, et les rendements sont
faibles.

viii. Optimisation de la synthèse


1. Renaturation des protéines in vitro
La purification des corps d’inclusion est rarement une étape critique, dans la mesure où ces
agrégats sont facilement isolés par centrifugation après lyse cellulaire et contiennent la protéine
recombinante à un degré de pureté très élevé. L’étape suivante de solubilisation est en revanche
souvent plus délicate, car elle nécessite la dénaturation chimique complète de la protéine agrégée par
des dénaturants forts comme l’urée 8 M ou la guanidine 6 M, éventuellement en présence d’un agent
réducteur. Enfin, intervient l’étape critique d’élimination du dénaturant qui, réalisée par dialyse ou
forte dilution, favorise la renaturation de la protéine. À cette étape, certaines petites molécules
peuvent être additionnées à la solution de renaturation, comme des détergents, des alcools, des
amides, ou de l’arginine. En général, ces additifs, dont le mécanisme d’action est souvent peu
documenté, diminuent l’agrégation des protéines en inhibant leurs interactions intermoléculaires. De
même, les paramètres de température et de concentration de protéine sont contrôlés pour favoriser le
repliement correct aux dépens de l’agrégation. Pour les protéines possédant une séquence
polyhistidine, la chromatographie de chélation métallique constitue un troisième moyen permettant
l’élimination du dénaturant tout en maintenant la protéine fixée. Cette méthode permet une
séparation physique des protéines lors de la renaturation sur la colonne, et limite donc les réactions
d’agrégation.
Les inconvénients de ces diverses techniques de renaturation in vitro sont souvent les faibles taux
de renaturation obtenus, les difficultés d’optimisation des conditions expérimentales spécifiques de
chaque protéine et la précipitation de la protéine renaturée. Pour ces raisons, il est souvent
souhaitable d’intervenir en amont, sur le système d’expression ou sur le gène codant pour la protéine,
afin de promouvoir le repliement cellulaire.

2. Minimiser l’agrégation in vivo


Les méthodes d’optimisation du repliement productif des protéines recombinantes peuvent être
schématiquement présentées en deux catégories. Dans la première, les facteurs cellulaires et les
paramètres de culture qui influencent l’expression et le repliement des protéines sont
systématiquement testés. Parmi ceux-ci, citons le contexte génétique de la cellule recombinante, la

BOUZAHAR.DEFFAR K 62
PRODUCTION DE PROTÉINES RECOMBINANTES

composition du milieu culture, la température de croissance des cellules, le nombre de copies du


gène recombinant par cellule et son niveau de transcription ou de traduction, la surexpression des
chaperons et l’inactivation des gènes codant pour les protéases. En règle générale, l’élévation de
température augmente la vitesse d’agrégation, puisque cette réaction multimoléculaire est dominée
par les interactions hydrophobes. En diminuant la température de croissance et le niveau de
production, le repliement correct de la protéine sera donc favorisé. La variation de ces deux
paramètres donne souvent des résultats encourageants. Cependant, la manipulation de ces facteurs
extrinsèques n’est pas toujours suffisante, et l’on peut recourir à une stratégie qui modifie
génétiquement la séquence de la protéine recombinante, par l’ingénierie des protéines paramètres de
température et de concentration de protéine sont contrôlés pour favoriser le repliement correct aux
dépens de l’agrégation.
La première approche, utilisée le plus souvent pour faciliter leur purification, est la construction
d’une protéine de fusion. Il est fréquemment observé qu’une protéine fusionnée à une protéine
d’intérêt par son extrémité amino-terminale a une influence positive sur le repliement de cette
dernière. Pour cette application, les systèmes de protéines de fusion les plus utilisées sont la protéine
affine du maltose (MBP), la glutathion S-transférase ou encore NusA pour l’expression chez E. coli.
Cette stratégie augmente la stabilité intracellulaire de la protéine recombinante et simplifie sa
purification, qui est réalisée en une simple étape chromatographique sur une colonne d’affinité
contenant le ligand immobilisé de la protéine de fusion. Cependant, la conservation de ces propriétés
bénéfiques n’est pas toujours assurée après purification et clivage du partenaire de fusion.

ix. Autres bactéries utilisées en production de protéines


Parmi les bactéries Gram-positives, les Bacillus ont été et sont toujours très utilisés pour produire
des protéines pour plusieurs raisons :
- Ils sont depuis longtemps utilisés par l'industrie pour produire des protéines. La subtilisine, protéase
incorporée aux lessives, est produite à partir de Bacillus. Il existe donc de nombreuses souches
modifiées pour les contingences industrielles. Toutefois ces souches ne sont généralement pas
disponibles.
- On les connaît bien au niveau génétique et leur manipulation par les techniques de biologie
moléculaire est bien développée. En effet, si à priori on peut prendre n'importe qu'elle bactérie, il faut
quand même que l'on ait isolé une origine de réplication efficace, un promoteur, etc. De plus on doit
avoir mis au point un système de transformation efficace. Des promoteurs forts sont connus et des

BOUZAHAR.DEFFAR K 63
PRODUCTION DE PROTÉINES RECOMBINANTES

peptides signaux responsables de la sécrétion sont disponibles. Par exemple le peptide signal d'une
subtilisine de Bacillus amyloliquefasciens de 30 acides aminés a été utilisé avec succès.
- Le Bacillus ne sont pas pathogènes et ne produisent pas d'endotoxine.
- Ils sécrètent un grand nombre de protéines, leur système de sécrétion est donc bien développé. Ce
sont des bactéries Gram-positives, si bien que les protéines n'ont à traverser que la membrane
cytoplasmique.

(Références : Betton et Chaffotte, 2005 ; Bellalou, 2006 ; Desmond, 2008 ; ABRF 2009 ; Deffar,
2009 ; Potocki-Veronese, 2009 ; Boublik, 2013).

BOUZAHAR.DEFFAR K 64
PRODUCTION DE PROTÉINES RECOMBINANTES

7. Production chez Saccharomyces cerevisiae

i. Introduction
Saccharomyces cerevisiae est un micro-organisme, une levure particulière parmi tous les
ferments, levures, etc. utilisés depuis l'aube de l'humanité dans l'élaboration du pain, du kéfir, des
yaourts, du vin et de la bière de fermentation haute. Elle a été découverte, isolée et identifiée au
milieu du XIXe siècle, elle est appelée « levure de boulanger » ou « levure de bière ». Dû à son mode
de reproduction, elle est également nommée « levure à bourgeon » (ou « levure bourgeonnante »
(Figure 1). S. cerevisiae se divise par bourgeonnement. Le bourgeonnement résulte dans la formation
de deux cellules de taille inégale. Le cycle de vie n’est pas indéfini. Les cellules mères vieillissent
puis meurent (la durée de vie moyenne est de 30 à 40 divisions). Les cellules ont une structure de
type eucaryote avec une paroi de glucan, mannan, protéines, un espace périplasmique, une
membrane en bicouche lipidique, un noyau avec un nucléole des vacuoles, un appareil de sécrétion
(RE, golgi, vésicules de sécrétion) et des mitochondries.
Saccharomyces peut produire l'énergie nécessaire à sa survie et à sa reproduction de deux manières
différentes, en fonction du milieu ambiant. Ces deux modes de production d'énergie sont :
 la voie aérobie : respiration, transformation du glucose en gaz carbonique et ATP à l'aide de
l'oxygène ou utilisation de l'éthanol avec consommation d'O2 (transition diauxique).
 la voie anaérobie : la fermentation alcoolique du glucose.
Une température de 32 degrés est optimale pour sa reproduction. Sa taille varie de 6 à 12 µm pour
la longueur et de 6 à 8 µm pour la largeur
S. cerevisiae est également très utilisée comme organisme modèle en biologie cellulaire et en
génétique. En 1996, ce fut le premier eucaryote dont le génome a été séquencé. Son génome de 16
chromosomes est composé de 13 millions de paires de bases et de 6 275 gènes. On estime que
l'homme partage 23 % de son génome avec cette levure. L'ensemble des données génomiques
concernant S. cerevisiae sont rassemblées sur Saccharomyces Genome Database.
a b

Figure 1. a. La classification de S. cerevisiae ; b. La forme de S. cerevisiae.

BOUZAHAR.DEFFAR K 65
PRODUCTION DE PROTÉINES RECOMBINANTES

ii. Avantages et défauts du système


La levure présente deux avantages : d'une part, on dispose de vecteurs qui peuvent se maintenir
dans les cellules comme des plasmides bactériens, et d'autre part on peut facilement intégrer un gène
par recombinaison dans le chromosome.
De plus on dispose de plusieurs méthodes pour faire rentrer un ADN dans la levure. On peut
utiliser soit une transformation chimique avec le l'acétate de lithium, soit une transformation avec du
CaCl2 sur des sphéroblastes (les sphéroblastes sont obtenus par une lyse de la paroi des levures par
une lyticase), soit par électroporation.
Tableau 1. Les avantages et les défauts du système.
Avantages Inconvénients
- Petit génome eucaryote facilement - N-glycosylation : immunogène pour
manipulable et bien caractérisé. l’homme.
- Absence d’endotoxine. - Mauvais repliement de la protéine
- Pas toxique. produite.
- Bons rendements (quelques grammes par - Fermentation peu couteuse.
litre de culture). - Hypoglycosylation.
- Modifications post traductionnelles simples. - Mal sécrétion des protéines sauf petits
- Capables de synthétiser des protéines polypeptides, ou sécrétion possible mais
complexes. avec rendement diminué.

iii. Vecteurs d’expression

1. Origine de réplication
L'origine de réplication de l'épisome 2-ƒÊm est le plus souvent utilisé, il permet d'avoir entre 10 et
40 copies du plasmide par cellule. Ce nombre est très variable et on peut perdre le plasmide au cours
des divisions cellulaires. Aussi, pour obtenir des copies plus nombreuses, on utilise un marqueur de
sélection faible et on augmente la sélection. Toutefois il n'est pas aussi évident que l'augmentation du
nombre de copies augmente la production de protéine. En effet on a souvent remarqué qu'un grand
nombre de copies affecte la croissance des levures et donc la production. Les levures utilisables avec
cette origine de réplication doivent être dépourvues de l'épisome 2-ƒÊm.

BOUZAHAR.DEFFAR K 66
PRODUCTION DE PROTÉINES RECOMBINANTES

Le problème est que ces vecteurs sont peu stables, lorsqu'ils contiennent uniquement une origine
de réplication, ils sont vite perdus en l'absence de sélection ce qui est diffèrent des plasmides d'E.
coli. En effet il n'y a pas comme dans la bactérie de découplage entre la réplication du plasmide et du
chromosome. Pour pallier à cette perte on peut ajouter une séquence centromérique (CEN) qui
permet la ségrégation des plasmides dans les cellules filles. L'inconvénient est que dans ce cas, si on
gagne en stabilité on perd en nombre de copies, il y a en effet 1 ou 2 copies du plasmide par cellule.
Un autre moyen pour augmenter la stabilité consiste à intégrer le plasmide dans le génome, on
profite alors de la séquence centromérique du chromosome. On transforme alors un ADN linéaire
contenant le gène d'intérêt et un marqueur de sélection flanque des séquences d'un gène non essentiel.
Il y a intégration dans ce gène non essentiel.

2. Marqueurs de sélection
De nombreuses souches de laboratoire sont auxotrophes pour des acides aminés ou des
nucléotides, c'est à dire qu'elles ne peuvent pas pousser en l'absence du compose dans le milieu. On
peut donc utiliser la complémentation des enzymes entrant dans les voies de biosynthèse. Les plus
utilisés sont les gènes URA3 ou LEU2 responsables de la synthèse de l'uracile ou de la leucine. Mais
il existe d'autres systèmes de complémentation. L'inconvénient de ce système est qu'il faut utiliser
des milieux biochimiquement définis or dans ces milieux, les levures poussent moins bien et de ce
fait, la production est moins bonne. De plus les milieux définis sont plus chers à fabriquer qu'un
milieu non défini comportant par exemple de l'extrait de levure et de la peptone comme un milieu de
culture.
Aussi, on préfère souvent utiliser des marqueurs de sélection qui donnent la résistance a des
drogues, la tunicamycine (TUN) ou l'hygromycine (Hgm), mais il y a toujours un risque d'apparition
de résistance spontanée dans la souche utilise et donc de perte du plasmide.

3. Promoteur
On peut utiliser des promoteurs inductibles. La régulation des gènes utilises pour la
métabolisation du galactose a été très étudiée chez la levure. Ce système a donc été utilisé pour
l'expression des protéines. Il y a deux protéines régulatrices principales (GAL4 et GAL80) qui
contrôlent l'expression des gènes de structures GAL1 (une kinase), GAL2 (une perméase) GAL7
(une transférase), GAL10 (une épimérase) et MEL1 (une galactosidase).

BOUZAHAR.DEFFAR K 67
PRODUCTION DE PROTÉINES RECOMBINANTES

Lorsque le galactose est présent dans le milieu, GAL4 s'accroche sur un UAS (Upstream Activation
Site, équivalent d'un enhancer pour les autres eucaryotes) et ainsi favorise la transcription du gène en
aval. En l'absence de galactose, GAL80 s'accroche sur l'extrémité C terminale de GAL4 l'empêchant
de s'accrocher sur l'UAS. A cote de ce système il y a comme pour E. coli un système de répression
lorsqu'il y a du glucose dans le milieu. On peut donc utiliser le galactose pour induire la synthèse, le
lactose pour la diminuer (il n'y a pas d'induction) et le glucose pour la réprimer. Ce promoteur est
très fort : en présence de galactose, la kinase GAL1 est augmentée de 1000 fois et représente 0.8%
des protéines totales de la levure.
Tableau 2. Les vecteurs utilisés pour l’expression des protéines recombinantes par S. cerevisiae.

Abbreviations : CUP1, copper-binding metallothionein; GPD1, glyceraldehyde-3-phosphate


dehydrogenase; MF-α1, α-factor; PGK1, 2-phosphoglycerate kinase; PHO5, acid phosphatase;
rDNA, ribosomal DNA; tPA, tissue plasminogen activator; Ty-δ, δ sequences of Ty transposable
elements.

iv. Souches

Tableau 3. Les souches de S. cerevisiae utilisées pour la production des protéines


recombinantes.

BOUZAHAR.DEFFAR K 68
PRODUCTION DE PROTÉINES RECOMBINANTES

v. Système de sécrétion
Les peptides signaux hétérologues fonctionnent pour la plupart dans la levure, il n'est donc pas
nécessaire d'en changer lorsqu'on veut exprimer une protéine habituellement sécrétée. Dans le cas de
l'expression d'une protéine cytoplasmique, il suffit de faire une fusion avec un peptide signal d'une
protéine de la levure tel que celui de l'invertase.
Toutefois, il est difficile de produire des protéines sécrétées dans S. cerevisiae.
- En étudiant la glycosylation des protéines, il est apparu qu'il existe une étape limitante dans cette
maturation quelque part entre le réticulum endoplasmique et l'appareil de Golgi. Une première
technique consiste à changer d'espèce et utiliser Pichia pastoris. Cette dernière permet l'expression
de protéines membranaires qui sont difficiles à obtenir avec S. cerevisiae.
- La sécrétion ne s'effectue que pendant la phase de croissance exponentielle, pour une protéine
sécrétée, il est donc préférable d'utiliser un promoteur constitutif.

vi. Modifications post-traductionnelles

La plupart des modifications post-traductionnelles sont effectuées par S. cerevisiae. Toutefois la


N-glycosylation est très différente de celle observée pour les autres eucaryotes. Les sites sont les
mêmes (N-X-S/T), mais les sucres ajoutés sont différents et en très grand nombre. On compte par
exemple de 50 à 150 résidus mannose dans chaque chaîne.

(Références : Romanos et al., 1992 ; Strausberg and Strausberg, 1995 ; Geiser, 2005 ; Ferndahl et
al., 2010 ; Boublik, 2013).

BOUZAHAR.DEFFAR K 69
PRODUCTION DE PROTÉINES RECOMBINANTES

8. Production chez Pichia pastoris

i. Introduction
Pichia pastoris est une levure qui a été développée dans les années 70 pour utiliser le méthanol
qui était alors un sous-produit de l'industrie pétrolière. Elle est en effet capable de se développer sur
du méthanol comme seule source de carbone. Ce méthanol était converti par P. pastoris en protéines
et donc en aliment pour bétail. Avec la crise pétrolière, la difficulté de concurrencer les aliments tels
que le soja a amené à l'abandon de P. pastoris. Puis P. pastoris a été utilisé pour la production des
protéines recombinantes.

ii. Avantages du système


- La production de protéine est de 10 à 100 fois plus importante qu'avec S. cerevisiae.
- Elle permet l'expression de protéines membranaires qui sont difficiles à obtenir avec S. cerivisiae.
- Comparé à S. cerevisiae, les protéines sécrétées sont moins glycosylées, il n'y a en effet moins de
résidus mannose ajoutés dans chaque N glycosylation (8 à 14 par chaîne alors que S. cerevisiae en
comporte de 50 à 150).
13 13
- On peut utiliser un marquage des protéines au C utile pour les études en RMN. On utilise du C
13
méthanol qui est métabolisé et le C est incorporé dans les protéines.
- Possibilité de l’intégration du gène d’intérêt dans le génome ce qui offre une transformation stable.

BOUZAHAR.DEFFAR K 70
PRODUCTION DE PROTÉINES RECOMBINANTES

iii. Étapes d’expression d’une protéine chez Pichia pastoris


L’insertion du gène d’intérêt dans un vecteur
d’expression. Linéarisation de l’ADN recombinant.

La transformation de l’ADN recombinant linéaire


dans les cellules de Pichia pastoris.

La culture de ces cellules dans un milieu contenant


un antibiotique.

La sélection de 10-20 colonies pour l’expression à


petite échelle.

L’utilisation des colonies de plus haut expression


pour l’expression à grande échelle.

iv. Vecteurs d’expression


La première étape de la métabolisation du méthanol est une oxydation par le produit du gène
AOX1 (le produit d'un deuxième gène, AOX2 est aussi impliqué, mais AOX1 est responsable de la
majeure part de l'oxidation). L'expression d’AOX1 est régulée au niveau transcriptionel.
Le vecteur typique contient un gène de résistance à un antibiotique et une origine de réplication
pour la propagation dans E. coli. Il contient, en outre, le promoteur d’AOX1 et la partie terminale (3')
d’AOX1. Ces deux parties sont interrompues par un site de clonage multiple suivi au besoin d'une
séquence codant pour un peptide signal pour insérer le gène d'intérêt. Comme moyen de sélection, on
utilise soit un gène codant pour une histidinol dehydrogenase permettant la synthèse d'histidine
(HIS4) soit un gène bactérien procurant la résistance à la kanamycine et procurant chez la levure la
résistance au G418, soit un gène de résistance à la zéocine (Figure 1).

BOUZAHAR.DEFFAR K 71
PRODUCTION DE PROTÉINES RECOMBINANTES

Figure 1.

Ce plasmide est introduit dans P. Pastoris soit par électroporation soit par transformation de
sphéroblastes comme pour S. cerivisae.
Il y a plusieurs possibilités d'intégration dans le chromosome : Le remplacement de
gène ou insertion oméga. Dans ce cas il y a deux crossing over entre les promoteurs de l’AOX1 et la
s s
partie 3' de l’AOX1, les recombinants ont le phénotype Mut . (Mut signifie que la levure n'est plus
capable d'oxyder le méthanol et donc plus capable d'utiliser cet alcool comme seule source de
carbone). Dans ce cas, le plasmide est coupé en deux endroits avant la transformation (Figure 2).

Figure 2. L’insertion de gène par deux crossing over (l’insertion oméga).

BOUZAHAR.DEFFAR K 72
PRODUCTION DE PROTÉINES RECOMBINANTES

L'insertion de gène s'effectue par un seul crossing over entre le locus AOX1 du chromosome et
une des séquences d'AOX1 présente sur le vecteur (région 5' ou région 3'). On a dans ce cas insertion
d'un plasmide en amont ou en aval d’AOX1 qui peut demeurer fonctionnel. Le phénotype de tels
+
transformant est Mut (Figure 3). Plusieurs copies peuvent ainsi s'intégrer en tandem. De telles
insertions multiples peuvent être sélectionnées en utilisant la résistance au G418 ou à la zéomycine.
Chaque gène entraîne une faible résistance, en augmentant la dose d’antibiotique, on sélectionne les
recombinants qui ont le plus de copies.

Figure 3. L’insertion de gène par un seul crossing over.


Tableau 1. Les vecteurs d’expression.

BOUZAHAR.DEFFAR K 73
PRODUCTION DE PROTÉINES RECOMBINANTES

v. Souches
Tableau 2. Les souches de P. pastoris utilisées pour la production des protéines
recombinantes.

vi. Système de sécrétion


La sécrétion des protéines produites par P. pastoris est complexe, elle dépend de plusieurs
facteurs (le facteur de sécrétion, le nombre de copies de vecteur intégré dans le génome de la levure
et la protéolyse).

vii. Modification post-traductionnelles


Les protéines subissent d'abondantes modifications covalentes pendant et après leur synthèse.
Celles-ci vont de la simple protéolyse contrôlée à l'ajout covalent de groupements énormes.
Ces modifications peuvent servir :
(a) à la régulation de l'activité des protéines,
(b) à leur étiquettage pour qu'elles soient reconnues par des partenaires métaboliques ou par des
systèmes de dégradation,
(c) à les ancrer dans une membrane,
(d) à les faire participer à des cascades de signalisation,
(e) à leur adressage pour qu'elles se rendent au bon endroit dans la cellule,
(f) à définir une identité immunologique (comme les groupes sanguins) etc. Les différentes
modifications post-traductionnelles qu'on peut rencontrer dans une protéine sont résumées dans le
tableau 3.

BOUZAHAR.DEFFAR K 74
PRODUCTION DE PROTÉINES RECOMBINANTES

Tableau 3. Les modifications post-traductionnelles.


L’avantage majeur de P. pastoris est sa capacité d’entrainer quelques modifications post-
traductionnelles comme la formation des ponts disulfures, l’O-glycosylation, la N-glycosylation, et
l’ajout de quelques lipides.

(Références : Romanos et al., 1992 ; Romanos, 1995 ; Cereghino and Cregg, 2000 ; Zhang et al.,
2000 ; Daly and Hearn, 2005 ; Boublik, 2013;
http://miller-lab.net/MillerLab/wp-content/uploads/pichia_system.pdf;
https://tools.thermofisher.com/content/sfs/manuals/pich_man.pdf;
http://tools.thermofisher.com/downloads/PichiaBrochureP40.pdf ).

BOUZAHAR.DEFFAR K 75
PRODUCTION DE PROTÉINES RECOMBINANTES

9. Production en cellules d’insectes et en cellules animales

i. Introduction

Les cellules d'insecte du système baculovirus a été montré à une excellente expression, c’est un
système capable de fournir de grandes quantités de protéines recombinantes biologiquement actives.
Il prévoit la construction d'un nucléopolyédrovirus recombinant contenant le gène étranger d'intérêt
sous le contrôle du promoteur polyédrine fin même, qui est exceptionnellement forte. Lors de
l'infection par le baculovirus recombinant les cellules expriment souvent des niveaux élevés de
même de la protéine recombinante avec toutes les modifications post-traductionnelles nécessaires.
Les cellules de mammifères comme les cellules CHO (Chinese Hamster ovary), les cellules de
HEK 293 (Human Embryonic Kidney), les cellules de Hela (carcinome du col de l’utérus) et les
cellules HepG2 (cellules d'origine hépatique) sont utilisée pour produire des protéines hétérologues.
L’expression de protéines en système mammifère présente l’avantage de générer des protéines
correctement foldées et avec des modifications post traductionnelles parfaites. Les N- glycosylations
sont complexes et se terminent par un acide sialique. C’est donc un système de choix pour la
production de glycoprotéines. Ce système a d’ailleurs longtemps été utilisé pour la production de
molécules thérapeutique même si les innovations récentes relancent les systèmes de levure. En effet,
l’inconvénient majeur des cellules de mammifères est leur rendement de production plus faible que
les autres systèmes et leur vitesse de croissance plus longue. Ce système est donc parfaitement
adapté à la production d’anticorps, de protéines glycosylées, de protéines à utiliser comme standard
en ELISA ou en spectrométrie de masse par exemple.

ii. Avantages et les inconvénients de chaque système


1. Cellules d’insectes
a. Avantages
Ce système de production en infectant soit des insectes soit des cellules d'insectes présente
plusieurs avantages :
‐ Fonctionnalité des protéines recombinantes : Les insectes sont des eucaryotes et ils sont
capables d'effectuer tous les repliements des protéines avec les bons ponts disulfures et les bonnes
oligomérisations, ce qui n'est pas le cas de bactéries ou des levures.

BOUZAHAR.DEFFAR K 76
PRODUCTION DE PROTÉINES RECOMBINANTES

‐ Modifications post-traductionelles : La plupart des modifications post-traductionelles sont


effectuées en baculovirus aux sites où on les trouve dans les protéines natives. Toutefois, ce système
produit une très grande quantité de protéine et on observe parfois une saturation du système.
‐ Haut niveau d'expression : Le record de l'expression mentionnée avec baculovirus est de 1
gramme de protéine recombinante pour 109 cellules.
b. Inconvénients
‐ Coûts élevé de la production.
‐ Systèmes de fermentations spéciaux (22 °C, CO2).

2. Cellules de mammifères
a. Avantages
- Nombreux vecteurs d’expression sont disponibles.
- Maturation proche de la protéine native, profil de glycosylation.
- Possibilité de culture de masse en bioréacteurs.
b. Inconvénients
- Culture des cellules difficile et couteuse.
- Croissance lente.
- Cellules recombinées peu stable (perte de vecteurs).
- Faible rendement (de l'ordre de 10 mg/ L de culture).
Ce système devient de plus en plus poussé et efficace, mais en contrepartie, de plus en plus dure de
mettre en place.

iii. Étapes de production d’une protéine recombinante


1. En cellules d’insectes
a) Baculovirus

Les baculovirus sont responsables de polyédroses nucléaires des insectes en particulier des
lépidoptères. Ce sont de gros virus dont le génome est constitué d'ADN d'environ 100 kb. Ces
virus forment à la fin de l'infection des corps d'inclusion dans la cellule : des polyèdres. Ces
polyèdres sont constitués principalement d'une protéine, la polyédrine, d'environ 30 kDa, qui
protège les virions (Figure 1). Dans la nature, ces polyèdres sont ingérés par les insectes,
dégradés par les protéases du tube digestif, les virions sont libérés et vont se fixer sur les

BOUZAHAR.DEFFAR K 77
PRODUCTION DE PROTÉINES RECOMBINANTES

microvillosités des cellules épithéliales de l'intestin moyen et ils traversent les cellules
intestinales. Ils se multiplient dans les hémocytes et dans le tissu adipeux. Les virions sont
transmis de cellules à cellules par exocytose. En fin de cycle, les noyaux renferment de très
nombreux polyèdres, ces polyèdres constituent donc le mode de transmission d'insecte à insecte.
Depuis quelques années on sait utiliser le baculovirus pour produire des protéines in vitro. En
fin de cycle le virus produit une très grande quantité de polyédrine. L 'astuce a donc été de
remplacer la partie codante du gène codant pour la polyédrine par celui qui nous intéresse (figure
2). On transfecte des cellules. Le virus au lieu de produire une très grande quantité de polyédrine
produit la protéine voulue. A côté de ce promoteur (promoteur polyédrine), il existe un autre
promoteur tardif qui est très fort le promoteur de P10. On peut cloner derrière ce promoteur.
Dans ce cas, la lyse des cellules est retardée ce qui a pour effet d'augmenter la production.
L'utilisation des deux promoteurs, P10 et polyédrine permet en outre de coproduire deux
protéines, une protéine exprimée à partir du promoteur de la polyédrine et une autre exprimée à
partir de P10.

Figure 1. La formation des polyèdres dans les cellules d’insectes par les
baculovirus.

Figure 2. Construction de baculovirus Recombinant.

BOUZAHAR.DEFFAR K 78
PRODUCTION DE PROTÉINES RECOMBINANTES

b) Cellules d’insecte ayant intégré le gène d’intérêt dans leur génome

Toutes les lignées cellulaires (la lignée Sf9, Sf21) ont la propriété intéressante de pouvoir
intégrer de l'ADN dans leurs chromosomes. Si on transfecte une cellule avec un plasmide on a
tout d'abord expression transitoire à partir du plasmide puis dans un deuxième temps
établissement d'une culture cellulaire exprimant la protéine d'une manière stable puisque le
plasmide s'est intégré dans le génome. Des centaines de copies du plasmide se retrouvent dans le
génome.
 Le promoteur : pour obtenir ces lignées stables on a besoin d’un promoteur reconnu par
la machinerie transcriptionelle de la cellule et d’un agent de sélection. On connaît un très grand
nombre de promoteurs chez les insectes. On utilise soit un promoteur constitutif soit un
promoteur inductible. Dans ce dernier cas, on peut utiliser le promoteur de la metallothionéine
qui est inductible par le sulfate de cuivre. Une autre alternative est d'utiliser un promoteur viral
précoce. Ainsi le promoteur OpIE2 du baculovirus d’Orgyia pseudotsugata est utilisé car il est
fonctionnel dans un grand nombre de cellules d'insecte différentes.
 La sélection : le facteur limitant est la transfection, si une cellule incorpore de l'ADN,
elle incorpore un grand nombre de molécules présentes dans le milieu. Une première technique
consiste à faire une cotransfection avec un plasmide comportant un gène de résistance. Les
cellules ayant incorporé des plasmides dans leur génome seront hygromycine résistante, les
autres seront sensibles et seront éliminées. Une deuxième technique consiste à intégrer le gène de
sélection au plasmide. On augmente la pression de sélection pour sélectionner les cellules qui
sont les plus résistantes, ces cellules comportent plus de plasmide, ainsi plus de copies du gène
d’intérêt et donc produiront plus de protéines. En augmentant graduellement la sélection, on peut
espérer sélectionner des lignées produisant un grand nombre de copies par recombinaison.

2. En cellules de mammifères
Les étapes principales de produire une protéine recombinante en cellules de mammifères sont :
Phase I : Clonage de l’ADNc en vecteur d’expression

Cette étape consiste à intégrer l’ADNc dans un ou plusieurs vecteurs d’expression en cellules
mammifères contenant un tag qui permettra de purifier la protéine sur colonne puis transférer l’ADN
recombinant dans les cellules hôtes par l’électroporation ou la lipofection.

BOUZAHAR.DEFFAR K 79
PRODUCTION DE PROTÉINES RECOMBINANTES

a. Électroporation
Brève impulsion électrique provoquant l’ouverture temporaire et la formation de pores laissant entrer
l’ADN.
b. Lipofection
Formation d’un complexe ADN/lipide qui entre par fusion avec la membrane plasmique.

Phase II : Evaluation de l’expression transitoire de la protéine recombinante et purification

 Evaluation de l’expression et optimization à partir de faibles volumes de culture.


 Expression pilote suivi d’une étape de purification.
Phase III : Scale-up de la production et purification de protéine

 Préparation des semences, fais la production en bioréacteur, récolte et clarification.


 Une étape de purification par chromatographie d’affinité.
 Contrôle qualité par Gel SDS-PAGE et/ou Western blot.

iv. Vecteurs d’expression


Cellules de mammifères
Les vecteurs d’expression en cellules de mammifères sont des vecteurs contient des promoteurs
forts d’origine virale (Cytomégalovirus -CMV-), des systèmes inductibles, des Tags pour la détection
et la purification des protéines exprimées, et des séquences de localisation : peptide signal de
sécrétion, ou peptide transmembranaire (Figure 3).

Figure 3. Plasmide d’expression pour les cellules de


mammifères.

BOUZAHAR.DEFFAR K 80
PRODUCTION DE PROTÉINES RECOMBINANTES

v. Modifications post-traductionnelles
Les protéines produites par des cellules d’insectes ont un pliage approprié, la formation de ponts
disulfure et oligomérisation. Les modifications post-traductionnelles, comme acylation, amidation,
carboxyméthylation, glycosylation, isoprénylation, phosphorylation, clivage du peptide signal et le
clivage protéolytique ont été rapportés.
L’expression de protéine en système mammifère présente l’avantage de générer des protéines
correctement foldées et avec des modifications post traductionnelles parfaites. Les N-glycosylations
sont complexes et se terminent par un acide sialique. C’est donc un système de choix pour la
production de glycoprotéines.

(Références : Wurm, 2004 ; ABRF 2009 ; Boublik, 2013 ;


http://tools.thermofisher.com/content/sfs/manuals/insectselpiz_man.pdf;
http://tools.thermofisher.com/content/sfs/manuals/virapower_lentiviral_system_man.pdf ).

BOUZAHAR.DEFFAR K 81
PRODUCTION DE PROTÉINES RECOMBINANTES

10. Production dans un organisme métazoaire

i. Introduction
Plusieurs espèces d’animaux transgéniques peuvent produire des protéines recombinantes mais
actuellement deux systèmes ont commencé à être exploités. Le premier est le lait des animaux de
ferme transgéniques qui sont étudiés depuis 20 ans. Ce système a permis à une protéine,
l’antithrombine III humaine, de recevoir l’autorisation de mise sur le marché par l’EMEA (European
Agency for the Evaluation of Medicinal Products) en 2006. Le second système est le blanc d’œuf de
poulets transgéniques qui est devenu récemment plus attractif après que les méthodes de préparation
d’oiseaux transgéniques aient été améliorées. Deux anticorps monoclonaux ont été obtenus dans le
blanc d’œuf de poulets. Une grande variété de protéines recombinantes a été préparée à titre
expérimental avec ces deux systèmes et quelques autres. Ces protéines comprennent des anticorps
monoclonaux, des vaccins, des facteurs sanguins, des hormones, des facteurs de croissance, des
cytokines, des enzymes, des protéines du lait, du collagène, du fibrinogène et d’autres encore.

ii. Sécrétion de protéines recombinantes dans le lait des animaux


transgéniques (comme exemple)

Le message contenu dans le gène codant la protéine est associé aux éléments régulateurs d’un
gène de protéine du lait. Le gène hybride s’exprime dans la glande mammaire des animaux
transgéniques et la protéine correspondante est sécrétée dans le lait (Figure 1).

iii. Intérêt de la production de protéine dans le lait


‐ Grande quantité.
‐ Pas de maladie induite chez l’animal.
‐ Purification facile à cause de la composition simple du lait.

BOUZAHAR.DEFFAR K 82
PRODUCTION DE PROTÉINES RECOMBINANTES

Gène de protéine Gène étranger


du lait
Région régulatrice Région codante

Gène hybride

Lait

Protéine recombinante

Figure 1. La sécrétion de protéines recombinantes dans le lait d’animaux


transgéniques.

iv. Comment crier une lignée transgénique?


1. Micro-injection dans le pronucléus
‐ Injecter ADN dans le noyau d'un œuf fertilisé.
‐ Implanter l'œuf dans une femelle porteuse.
‐ Cribler les animaux pour la présence d’ADN étrangers.
‐ Établir par croissements les nouvelles lignées transgéniques (Figure 2 et 3).

Figure 2. La micro-injection de l’ADN étranger dans le pronucléus.

BOUZAHAR.DEFFAR K 83
PRODUCTION DE PROTÉINES RECOMBINANTES

Inconvénients
‐ Faible efficacité (<5%) pour 1000 œufs injectés on obtiendra 30-50 animaux transgéniques.
‐ 66% des œufs survivent à l'injection.
‐ 25% des œufs se développent.
‐ 25% des descendants sont transgéniques.
‐ Dans beaucoup de cas ce transgène ne s'exprime pas.
‐ Le transgène s'intégré au hasard.
‐ Expression très variable.
‐ Pas de gène de sélection requis.

Gène
étudié

Promoteur de la
β-lactoglobuline Obtention du lait des animaux
transgénique
L’ADN est injecté dans Le produit du gène concerné est
le pronucléus sécrété dans le lait

Les protéines du lait sont fractionnées


Pipette
maintenant
Ovocyte
de brebis l’ovocyte
Implantation chez la mère porteuse

La descendante transgénique est identifiée par PCR

L’expression du gène concerné est limitée


au tissu mammaire

Produit du gène étudié

Figure 3. Microinjection chez les brebis.

2. Transfection de cellule embryonnaire souches (ES)


‐ Capacité à participer à tous les tissus.
‐ Il est possible de les cultiver en continu.
o Introduction de l’ADN par transfection ou infection virale.
o Sélection par marqueurs usuels (G418 par exemple).
o Propice à la recombinaison homologue.
‐ Cellules ES recombinantes introduites dans les blastocytes ----->embryon chimérique (Figure 4).

BOUZAHAR.DEFFAR K 84
PRODUCTION DE PROTÉINES RECOMBINANTES

Cellules SE
Donneur de
blastocyte
Cellule SE

Blastocyte
récipient
Implantation dans
une femelle
L’animal
transgénique

Figure 4. La transfection dans des cellules embryonnaires souches.

v. Avantages et inconvénients du système


a. Avantages
‐ Modifications post-traductiommelles très proche de la protéine native.
‐ Sécrétion de la protéine recombinante dans les fluides biologiques (lait, sérum et les urines).
‐ Purification rapide.
‐ Production de grosses protéines recombinantes complexes (protéines humaines, anticorps etc…)

b. Inconvénients
‐ Coût élevé de la production.

‐ Difficulté d’obtenir des animaux transgéniques.

‐ Problèmes bioéthiques.

(Références : Babinet et Morello, 1986 ; Houdebine, 2001 ; Dyck et al., 2003 ; Desmond, 2008 ;
Houdebine, 2009 ; Boublik, 2013).

BOUZAHAR.DEFFAR K 85
PRODUCTION DE PROTÉINES RECOMBINANTES

Liste des abréviations


2D : Double dimensions
A : Adénine
aa : Acide aminé
ADN : Acide désoxyribonucléique
AOX : Alcool oxydase
ARN : Acide ribonucléique
ARNm : Acide ribonucléique messager
ARNr : Acide ribonucléique ribosomique
ARNt : Acide ribonucléique de transfert
ATB : Antibiotique
ATP : Adénosine triphosphate
BAC : Bacterial artificial chromosome
BM : Biologie moléculaire
C : Cytosine
13 : Carbone 13
C
CaCl2 : Chlorure de calcium
cDNA : Acide désoxyribonucléique complémentaire
CEN : Séquence centromérique
CHO : Chinese Hamster Ovary
CMV : Cytomégalovirus
CTD : Carboxy-terminal domain
E. coli : Escherichia coli
EF : Elongation Factor
EGF : Epidermal growth factor
ELISA : Enzyme-linked immunosorbent assay
G : Guanine
G-CSF : Granulocyte colony stimulating factor
GTP : Guanosine triphosphate
HEK : Human Embryonic Kidney
Hgm : Hygromycine
HIS : Histidine
IEF : Focalisation isoélectrique
IF : Initiation factor
Kb : Kilobase
kDa : Kilodalton
Mg+2 : Magnésium
min : Minute
ng : Nanogramme
P : Phosphore
pb : Paire de base
PCR : Polymerase chaine reaction
Pg : Picogramme
pH : Potentiel hydrogène
PI : Point isoélectrique
PM : Poids moléculaire
RBS : Séquence de liaison au ribosome
RE : Réticulum endoplasmique
rHGH : Hormone de croissance recombinante humaine
rNTP : Ribonucléotides triphosphate

BOUZAHAR.DEFFAR K 1
PRODUCTION DE PROTÉINES RECOMBINANTES

RT-PCR : Reverse transcriptase polymerase chaine reaction


S : Svedberg
SDS : Sodium-dodécyl sulfate
SDS-PAGE : Sodium-dodécyl sulfate-polyacrylamide gel electrophoresis
T : Thymine
Taq : Thermus aquaticus
TF : Transcription Factor
Tm : Temperature de fusion
TNF : Tumor necrosis factor
TUN : Tunicamycine
Vi : Volume initial
YAC : Yeast Artificial Chromosome

BOUZAHAR.DEFFAR K
PRODUCTION DE PROTÉINES RECOMBINANTES

Références Bibliographiques
1) ABRF. Protein Expression Research Group Recombinant Protein Laboratory.February
Children’s Research Hospital. PERG Workshop, 2009.
2) Babinet C et Morello D. Animaux transgéniques : une voie nouvelle pour l'étude du
développement. Médecine/sciences, 2: 253-259, 1986.
3) Bellalou J. Production de Protéines, Recombinantes dans E.coli, Aspects technologiques et
protocoles validés pour des cultures en milieux à haute densité. 3ème journée du Réseau
Montpelliérain de protéines Recombinantes. Institut Pasteur, 2006.
4) Betton JM and Chaffotte A. Repliement et production de protéines recombinantes.
Médecine/Science, 21(6) : 613-617, 2005.
5) Boublik Y. Production de protéines recombinnates, ProRec Montpellier, 2013.
6) Cereghino JL and Cregg JM. Heterologous protein expression in the methylotrophic yeast Pichia
pastoris. FEMS Microbiology Reviews 24: 45-66, 2000.
7) Cold Spring Harbor Laboratory Press. Molecular Cloning, 2001.
8) Daly R and Hearn MTW. Expression of heterologous proteins in Pichia pastoris: a useful
experimental tool in protein engineering and production: a review. Journal of molecular
recognition, 18: 119-138, 2005.
9) Deffar K. The roles of the single-chain variable fragment specific for human acidic fibroblast
growth factor. Thèse du Magister, Northeast Normal University, Changchun, China, 2009.
10) Desmond STN. An Introduction to Genetic Engineering, Third Edition, Cambridge University
Press, ISBN: 978-0-511-39858-2 (eBook), 2008.
11) Dyck MK, Lacroix D, Pothier F and Sirard MA. Making recombinant proteins in animals –
different systems, different applications .TRENDS in Biotechnology, 21 (9): 394-399, 2003.
12) Ferndahl C, Bonander N, Logez Ch, Wagner R, Gustafsson1 L, Larsson1 Ch, Hedfalk K, Darby
RAJ and Bill RM. Increasing cell biomass in Saccharomyces cerevisiae increases recombinant
protein yield: the use of a respiratory strain as a microbial cell factory. Microbial Cell Factories,
9 (47): 1-11, 2010.
13) Geiser RJ. Recombinational cloning vectors for regulated expression in Saccharomyces
cerevisiae. BioTechniques, 38:378-382, 2005.
14) Houdebine LM. La production de médicaments par les OGM. Conférence, 1-8, 2001.
15) Houdebine LM. Production of pharmaceutical proteins by transgenic animals. Comparative
Immunology, Microbiology and Infectious Diseases, 32: 107-121, 2009.
16) Housset C et Raisonnier A. Biologie Moléculaire. Faculté de Médecine, Université Paris VI,
2006.
17) Jacqueline E. Biochimie génétique Biologie moléculaire, 6 ème Édition. Masson, Paris. ISBN : 2-
294-000420, 2000.

BOUZAHAR.DEFFAR K
PRODUCTION DE PROTÉINES RECOMBINANTES

18) Malacinski GM and Freifelder D. Essentials of Molecular Biology, Third Edition. ISBN: 7-03-
010312-2, 2002.
19) Potocki-Veronese G. Produire une protéine recombinante, Principes et Méthodes de Biologie
Moléculaire. Laboratoire Biotechnologie-Bioprocédés Toulouse, 2009.
20) Robert FW. Molecular Biology, Second Edition, University of Kasnas, ISBN: 7-03-010549-4,
2002.
21) Romanos MA, Scorer CA and JJ. Clare. Foreign Gene Expression in Yeast: a Review. Wiley,
Yeast 8: 423-488, 1992.
22) Romanos M. Advances in the use of Pichia pastoris for high-level gene expression. Current
Opinion in Biotechnology, 6:527-533, 1995.
23) Strausberg RL and Strausberg SL. Overview of Protein Expression in Saccharomyces
cerevisiae.Current Protocols in Protein Science, Wiley: 5.6.1-5.6.7, 1995.
24) Wurm FM. Production of recombinant protein therapeutics in cultivated mammalian cells. Nat
Biotechnol, 22: 13931398, 2004.
25) Zhang W, Inan M and Meagher MM. Fermentation Strategies for Recombinant Protein
Expression in the Methylotrophic yeast Pichia pastoris. Biotechnol. Bioprocess Eng, 5: 275-287,
2000.
26) http://www.accessexcellence.org/AB/GG/plasmide.html
27) http://biotech-btk.wifeo.com/proteine-heterologue.php
28) http://www.takween.com/techniques/proteomique.html
29) http://www.takween.com/gene-genie-genetique-cours.html
30) http://www.web-books.com/MoBio/Free/Chap9.htm
31) http://tools.thermofisher.com/content/sfs/manuals/insectselpiz_man.pdf
32) http://tools.thermofisher.com/content/sfs/manuals/virapower_lentiviral_system_man.pdf
33) http://miller-lab.net/MillerLab/wp-content/uploads/pichia_system.pdf
https://tools.thermofisher.com/content/sfs/manuals/pich_man.pdf
34) http://tools.thermofisher.com/downloads/PichiaBrochureP40.pdf
35) http://www.cours-pharmacie.com/biologie-moleculaire/transcription-de-ladn.html

BOUZAHAR.DEFFAR K
PRODUCTION DE PROTÉINES RECOMBINANTES

BOUZAHAR.DEFFAR K 0

Vous aimerez peut-être aussi