Vous êtes sur la page 1sur 232

5)µ4&

&OWVFEFMPCUFOUJPOEV

%0$503"5%&-6/*7&34*5²%&506-064&
%ÏMJWSÏQBS
Université Toulouse 3 Paul Sabatier (UT3 Paul Sabatier)

Si vous êtes en cotutelle internationale, remplissez ce champs en notant : Cotutelle internationale avec
"nom de l'établissement", sinon effacer ce texte pour qu'il n'apparaisse pas à l'impression

1SÏTFOUÏFFUTPVUFOVFQBS
Huan NGUYEN-KIM
le vendredi 17 juillet 2015
5JUSF


Recherche de la fonction de protéines riches en hydroxyproline


dans les parois végétales

²DPMF EPDUPSBMF et discipline ou spécialité  


ED SEVAB : Développement des plantes

6OJUÏEFSFDIFSDIF
Laboratoire de Recherche en Sciences Végétales (LRSV), UMR 5546 UPS/CNRS

%JSFDUFVSUSJDF T
EFʾÒTF

Mme Elisabeth JAMET et Mme Cécile ALBENNE

Jury :

M. Azeddine DRIOUICH - Professeur, Université de Rouen


M. Pierre VAN CUTSEM - Professeur, Université de Namur
M. Simon HAWKINS - Professeur, Université de Lille 1
Mme Chantal TEULIERES - Professeur, Université de Toulouse III
Mme Elisabeth JAMET - Directeur de recherche, CNRS
Mme Cécile ALBENNE - Maître de conférence, Université de Toulouse III
THÈSE
En vue de l’obtention du

DOCTORAT DE L’UNIVERSITÉ DE TOULOUSE


Délivré par l’Université Toulouse III - Paul Sabatier
Discipline ou spécialité : Développement des plantes

Présentée et soutenue par


Huan NGUYEN-KIM

Le 17 Juillet 2015

Titre :
Recherche de la fonction de protéines riches en hydroxyproline
dans les parois végétales

JURY
M. Azeddine DRIOUICH - Professeur, Université de Rouen
M. Pierre VAN CUTSEM - Professeur, Université de Namur
M. Simon HAWKINS - Professeur, Université de Lille 1
Mme Chantal TEULIERES - Professeur, Université de Toulouse III
Mme Elisabeth JAMET - Directeur de recherche, CNRS
Mme Cécile ALBENNE - Maître de conférence, Université de Toulouse III

Ecole doctorale : Sciences Ecologiques, Vétérinaires, Agronomiques et Bioingénieries (SEVAB)


Unité de recherche : Laboratoire de Recherche en Sciences Végétales (LRSV),
UMR 5546 UPS/CNRS
Directeur(s) de thèse : Mme Elisabeth JAMET et Mme Cécile ALBENNE
Rapporteurs : M. Azeddine DRIOUICH, M. Simon HAWKINS et M. Pierre VAN CUTSEM
Remerciements

REMERCIEMENTS

Au terme de ces quatre années de thèse passées au LRSV, j’ai le plaisir d’exprimer ma
reconnaissance et mes remerciements à tous ceux qui ont contribué de près ou de loin au bon
déroulement de ma thèse.

Tout d’abord, mes remerciements s’adressent à mes directrices de thèse, Elisabeth Jamet
et Cécile Albenne, pour leur accueil, leur aide et leur encouragement prodigués tout au long
de ce travail de recherche, ainsi que pour leur grande disponibilité, leur rigueur scientifique,
leur enthousiasme et leurs précieux conseils qui m’ont permis de travailler dans les
meilleures conditions. Je les remercie aussi pour leur confiance, leur gentillesse ainsi que
pour leur regard avisé sur mes travaux.

Je tiens aussi à remercier ceux qui m’ont fait l’honneur de juger ce travail : M. Azeddine
Driouich, M. Simon Hawkins et M. Pierre Van Cutsem pour avoir accepté de juger ce
travail et qui ont assumé la tâche de rapporteur de cette thèse, ainsi que les autres membres
du jury pour avoir bien voulu prendre part à ce jury. Je tiens également à remercier les
membres des comités de thèse M. Christophe Dunand et M. Jérôme Pelloux pour m’avoir
donné leurs précieux conseils et leurs suggestions utiles.

J’adresse mes sincères remerciements à l’ensemble des membres de mon équipe d’accueil
pour ses hautes compétences scientifiques qui m’ont été d’une aide très précieuse pour
avancer dans ma thèse. Je le remercie pour toutes les discussions, suggestions et précieux
conseils. Merci à David Roujol qui m’a apporté un grand soutien, à Philippe Ranocha qui
m’a appris le français, à Christophe Ringli qui a créé le mutant lrx1, et à Luis Valledor qui
nous a donné les séquences génomiques des pins.

Un grand merci aux services communs du laboratoire, à la plateforme de microscopie et à


la plate-forme PAPPSO de la ferme du Moulon.

Mes remerciements les plus profonds vont à ma famille. Merci à ma femme Lê pour son
soutien et ses encouragements et mes enfants Huấn et Trâm pour leur patience face à un
papa étudiant. Merci à mes beaux-parents et mes parents qui m’ont offert la possibilité de
poursuivre et de terminer mes études.

Pour finir, il m’est très agréable d’exprimer toute ma gratitude, ma reconnaissance et mes
remerciements au Ministère de l'Education et de la Formation du Vietnam et à l’Université de
Quy Nhon qui m’ont soutenu financièrement.

Page 1
Sommaire

SOMMAIRE
REMERCIEMENTS ........................................................................................................... 1
SOMMAIRE ........................................................................................................................ 2
ABREVIATIONS ................................................................................................................ 6
1. INTRODUCTION ........................................................................................................... 9
1.1. Les parois des cellules végétales...................................................................................... 9
1.1.1. Composition ............................................................................................................ 10
1.1.1.1. La cellulose ...................................................................................................... 10
1.1.1.2. Les hémicelluloses........................................................................................... 11
1.1.1.3. Les pectines ..................................................................................................... 15
1.1.1.4. Les lignines ...................................................................................................... 17
1.1.1.5. Les protéines .................................................................................................... 18
1.1.1.6. Quelques interactions entre les réseaux de polymères pariétaux .................... 20
1.1.2. Principales fonctions des parois .............................................................................. 21
1.1.2.1. La croissance et l’adaptation des parois des plantes ....................................... 21
1.1.2.2. La signalisation................................................................................................ 23
1.1.3. Des algues aux végétaux supérieurs : les grandes étapes de l’évolution des parois 26
1.1.3.1. La composition des parois des algues et des plantes ....................................... 27
1.1.3.2. L’apparition de la multicellularité ................................................................... 28
1.1.3.3. La terrestrialisation .......................................................................................... 28
1.1.3.4. La vascularisation ............................................................................................ 28
1.2. Les HRGP ...................................................................................................................... 29
1.2.1. Les extensines (EXT) .............................................................................................. 29
1.2.2. Les protéines à arabinogalactanes (AGP) ............................................................... 30
1.2.3. Les protéines riches en Pro (PRP)........................................................................... 31
1.2.4. Participation des HRGP à des réseaux covalents ou non covalents dans les parois 31
1.3. Les LRR Extensines (LRX) ........................................................................................... 32
1.4. La famille des protéines de type Arabinogalactan Protein (AGP) 31........................... 35
1.4.1. AGP31 ..................................................................................................................... 35
1.4.2. Les protéines homologues à AGP31 ....................................................................... 37
1.5. Les objectifs de la thèse ................................................................................................. 38
2. MATERIELS ET METHODES ................................................................................... 40
2.1. Matériel .......................................................................................................................... 40
2.1.1. Matériel végétal ....................................................................................................... 40
2.1.1.1. Plantes.............................................................................................................. 40

Page 2
Sommaire

2.1.1.2. Conditions de culture....................................................................................... 40


2.1.2. Matériel bactérien.................................................................................................... 44
2.1.2.1. Plasmides et vecteurs de clonage .................................................................... 44
2.1.2.2. Souches bactériennes ....................................................................................... 47
2.1.2.3. Conditions de culture....................................................................................... 49
2.1.3. Antibiotiques ........................................................................................................... 49
2.2. Méthodes ........................................................................................................................ 50
2.2.1. Expression des protéines recombinantes chez E. coli ............................................. 50
2.2.1.1. Clonage dans le vecteur pBAD-TOPO............................................................ 50
2.2.1.2. Production des protéines.................................................................................. 50
2.2.2. Expression des protéines recombinantes chez N. benthamiana .............................. 51
2.2.2.1. Clonage dans les vecteurs binaires .................................................................. 51
2.2.2.2. Transformation d’A. tumefaciens .................................................................... 52
2.2.2.3. Transformations transitoires des cellules des feuilles de N. benthamiana ...... 53
2.2.3. Extraction de protéines totales ................................................................................ 54
2.2.4. Extraction des protéines pariétales .......................................................................... 54
2.2.5. Extraction des protéines recombinantes d’E. coli ................................................... 55
2.2.6. Techniques d’analyse des protéines ........................................................................ 55
2.2.6.1. Dosage des protéines ....................................................................................... 55
2.2.6.2. Séparation et détection des protéines .............................................................. 56
2.2.6.3. Identification des protéines par spectrométrie de masse MALDI-TOF .......... 59
2.2.6.4. Identification des protéines par Chomatographie liquide (LC) – MS/MS ...... 59
2.2.6.5. Egalisation des protéines par la technologie ProteoMiner™ .......................... 61
2.2.6.6. Analyse de profil d’expession des protéines ................................................... 61
2.2.7. Purification des protéines ........................................................................................ 62
2.2.7.1. Purification par le système FPLC (Fast Protein Liquid Chromatography) .... 62
2.2.7.2. Chromatographie d’affinité sur colonne Ni-NTA à pression atmosphérique . 63
2.2.7.3. Chromatographie d’affinité sur colonne d’anti-V5 ......................................... 63
2.2.7.4. Analyse des protéines par dot-blot .................................................................. 65
2.2.8. Tests d’interactions protéines/polysaccharides ....................................................... 65
2.2.8.1. Préparation des polysaccharides ...................................................................... 65
2.2.8.2. Mise en œuvre des tests d’interaction sur membrane ...................................... 67
2.2.9. Analyse des transcrits .............................................................................................. 67
2.2.9.1. Extraction des ARN totaux.............................................................................. 67
2.2.9.2. Traitement DNase I ......................................................................................... 68

Page 3
Sommaire

2.2.9.3. Réaction de transcription inverse (RT)............................................................ 69


2.2.9.4. Réaction de polymérisation en chaîne (PCR).................................................. 70
2.2.9.5. Analyse par restriction..................................................................................... 71
2.2.9.6. Séquençage ...................................................................................................... 71
2.2.10. Bioinformatique .................................................................................................... 71
2.2.10.1. Annotation des protéines identifiées par spectrométrie de masse ................. 71
2.2.10.2. Phylogénie de la famille des protéines pariétales à domaine PAC ............... 72
3. ANALYSE DU PROTEOME PARIETAL RACINAIRE D’A. thaliana SAUVAGE
ET DU MUTANT lrx1 ........................................................................................................... 74
3.1. Introduction .................................................................................................................... 74
3.2. Mise au point et validation du protocole de production de racines en quantité suffisante
pour la protéomique ................................................................................................................. 74
3.3. Le protéome pariétal des racines sauvages d’A. thaliana .............................................. 75
3.4. Comparaison protéomes pariétaux sauvage/mutant lrx1 ............................................. 119
3.4.1. Phénotype des racines en culture hydroponique ................................................... 119
3.4.2. Caractérisation moléculaire du mutant lrx1 .......................................................... 120
3.4.3. Extraction de protéines de parois de racines du mutant lrx1 ................................ 120
3.4.4. Recherche des différences entre les protéomes pariétaux de plantes sauvages et de
plantes mutantes lrx1 .............................................................................................................. 121
3.4.4.1. Extraits totaux de protéines pariétales ........................................................... 121
3.4.4.2. Extraits de protéines traités par la technologie CPLL ................................... 126
3.4.5. Régulation de la transcription des gènes correspondant aux protéines présentes
seulement ou en plus grande quantité dans les racines sauvages ........................................... 128
3.5. Discussion .................................................................................................................... 129
4. EVOLUTION DES PROTEINES PARIETALES A DOMAINE PAC ................. 131
4.1. Choix des organismes clefs au cours de l’évolution pour l’étude des protéines à
domaine PAC ......................................................................................................................... 131
4.1.1. Phylogénie des plantes vertes................................................................................ 131
4.1.2. Choix des organismes d'intérêt ............................................................................. 132
4.2. Définition du domaine PAC pour la recherche dans les bases de données génomiques
................................................................................................................................................ 134
4.2.1. Première recherche de protéines à domaine PAC ................................................. 134
4.2.2. Recherche de séquences manquantes .................................................................... 136
4.3. Présence de protéines apparentées aux protéines à domaine PAC chez les algues ..... 137
4.4. Répertoire des protéines à domaine PAC chez les plantes terrestres .......................... 138
4.5. Evolution des familles de protéines à domaine PAC par duplication de gènes ........... 141

Page 4
Sommaire

4.6. Les protéines à domaine PAC non canonique ............................................................. 143


4.7. Phylogénie des domaines PAC canoniques ................................................................. 147
4.8. Recherche de motifs conservés dans les 10 clades regroupant les domaines PAC
canoniques .............................................................................................................................. 150
4.9. Conclusions .................................................................................................................. 156
5. RECHERCHE DE PARTENAIRES DES DOMAINES PAC DANS LES PAROIS
................................................................................................................................................ 158
5.1. Mise au point d’un protocole de production et de purification des domaines PAC .... 159
5.1.1. Production des protéines d’intérêt dans N. benthamiana et purification .............. 159
5.1.1.1. Production des protéines................................................................................ 159
5.1.1.2. Extraction des protéines pariétales ................................................................ 162
5.1.1.3. Purification des protéines d’intérêt ................................................................ 163
5.1.2. Optimisation de la production et de la purification des protéines d’intérêt dans E.
coli .......................................................................................................................................... 165
5.1.2.1. Production des protéines de fusion PAC/V5/6xHis ...................................... 165
5.1.2.2. Purification des protéines .............................................................................. 166
5.1.2.3. Validation du protocole de purification par la mise en œuvre des premiers tests
d’interaction entre les domaines PAC et des polysaccharides commerciaux ........................ 169
5.2. Etude fonctionnelle des 7 domaines PAC d’intérêt ..................................................... 171
5.2.1. Purification des 7 domaines PAC et du contrôle négatif ...................................... 171
5.2.2. Tests d’interaction ................................................................................................. 173
5.2.2.1. Extraction et validation des fractions de polysaccharides pariétaux ............. 173
5.2.2.2. Recherche de partenaires des protéines PAC dans les parois végétales ........ 175
5.3. Discussion .................................................................................................................... 180
6. CONCLUSIONS ET PERSPECTIVES .................................................................... 184
REFERENCES ................................................................................................................ 190
ANNEXE .......................................................................................................................... 210

Page 5
Abréviations

ABREVIATIONS
ACC : 1-aminocyclopropane-1-carboxylic acid
ABA : Acide abscissique
ADNc : ADN complémentaire
ADN-T : ADN de transfert
AG : Arabinogalactane
AGP : Protéine à arabinogalactanes (arabinogalactan protein)
APAP1 : Arabinoxylan pectin arabinogalactan protein 1
Api : Apiose
Ara : Arabinose
ARNm : ARN messager
ARNr : ARN ribosome
A. thaliana : Arabidopsis thaliana
ATP : Adénosine triphosphate
A. tumefaciens : Agrobacterium tumefaciens
BCIP : 5-bromo-4-chloro-3-indolyl phosphate
B. distachyon : Brachypodium distachyon
BET : Bromure d’ethidium
BSA : Sérum albumine bovine
CaMV : Virus de la mosaïque du chou-fleur (Cauliflower mosaic virus)
CDS : Séquence codante (coding sequence)
CDTA : Cyclohexane diamine tétraacétate
CE : Carbohydrate esterase
CEA : Chromatographie d’échange d’anions
CEC : Chromatographie d’échange de cations
CESA : Cellulose-synthase
CGA : Charophycean green algae
CIII Prx : Class III peroxidase
Col 0 : Ecotype Columbia 0 d’A. thaliana
CPLL : Combinatorial peptide ligand library
CWP : Cell wall protein
1D-E : Electrophorèse monodimensionnelle
(One-dimensional electrophoresis)
DEPC : Diéthylpyrocarbonate
Dha : Acide 2-keto-3-deoxy-D-lyxo-heptulosarique
DIG : Digoxigénine
DMF : Diméthylformamide
DMSO : Diméthylsulfoxyde
DNase : Déoxyribonuclease
dNTP : Désoxyribonucléotide triphosphate (dATP, dCTP, dGTP, dTTP)
DO : Densité optique
DTT : Dithiothréitol
DUF : Domain of unknown function

Page 6
Abréviations

ER : Réticulum endoplasmique (Endoplasmic reticulum)


EDTA : Ethylène diamine tétra-acétate
E. coli : Escherichia coli
EXT : Extensine
FLA : fasciclin-like AGP
FPLC : Fast protein liquid chromatography
Fuc : Fucose
Gal : Galactose
GalA : Acide galacturonique
GAX : Glucuronoarabinoxylane
GDSL motif : Séquence consensus d'acides aminés Gly, Asp, Ser et Leu
GFP : Green fluorescent protein
GH : Glycoside hydrolase
Glc : Glucose
GlcA : Acide glucuronique
GNA : Galanthus nivalis lectin
GPI : Glycosyl-phosphatidyl-inositol
GRP : Protéine riche en glycine
GUS : Glucuronidase
HCD : Higher-energy C-trap dissociation
HEPES : Acide N-(2-hydroxyéthyl) pipérazine-N'-2-éthane sulfonique
HG : Homogalacturonane
H/PRP : Protéine riche en proline et hydroxyproline
(hydroxyproline/proline-rich protein)
HRGP : Glycoprotéine riche en hydroxyproline
(hydroxyproline-rich glycoprotein)
IgG : Immunoglobulines G
kDa : Kilo dalton
Kdo : 2-keto-3-deoxy-D-manno-octulosonate
kpb : Kilo paires de bases
LRX : Leucine-rich repeat extensin
LC : Chomatographie en phase liquide (Liquid chromatography)
LC-MS/MS : LC coupled to tandem mass spectrometry
LRR : Leucine-rich repeat
LTP : Protéine de transfert des lipides (lipid transfer protein)
MALDI-TOF : Matrix-assisted laser desorption ionization-Time of flight
Man : Mannose
MBP : Maltose binding protein
MES : 4-morpholino-éthane-sulfonate
MOPS : 3-(N-morpholino)propanesulfonic acid
MLG : Mixed-linkage β-glucan
MS : Spectrométrie de masse (mass spectrometry)
NAC : Chromatographie d’affinité sur colonne de Nickel
N. benthamiana : Nicotiana benthamiana
NBT : Nitro bleu de tétrazolium

Page 7
Abréviations

OGA : Oligogalacturonide
PAC : PRP and AGP containing cysteine
PAGE : Polyacrylamide gel electrophoresis
PBS : Phosphate buffered saline
pb : Paire de bases
PCR : Réaction de polymérisation en chaîne
PG : Polygalacturonase
PGA : Acide polygalacturonique
PL : Polysaccharide lyase
PME : Pectine méthylestérase (pectin methylesterase)
PMEI : Inhibiteur de pectine méthylestérase (Pectin methyl esterase inhibitor)
PMF : Peptide mass fingerprinting
PNA : Lectine de Peanut Agglutinin
P. patens : Physcomitrella patens
PR-proteins : Pathogenesis-related proteins
PRP : Protéine riche en proline (proline-rich protein)
PTM : Modification post-traductionnelle (Post-translational modification)
PVDF : Polyfluorure de vinylidène
RG I : Rhamnogalacturonane I
RG II : Rhamnogalacturonane II
Rha : Rhamnose
RLK : Receptor-like kinase
RNAse : Ribonucléase
ROS : Reactive oxygen species
RT-PCR : Reverse transcriptase PCR
RT-Q-PCR : RT-PCR quantitative
SDS : Dodécyl sulfate de sodium
TBS : Tris-buffered saline
TBST : TBS Tween
TEMED : N,N,N’,N’- Tétraméthyl éthylène diamine
Tris : Trishydroxyméthylaminométhane ou 2-amino-2-hydroxyméthyl-1,3-
propanediol
UHQ : Ultra high quality
UPLC : Ultra performance liquid chromatography
vol : volume
WT : Wild-type (sauvage)
XG : Xyloglucane
XGA : Xylogalacturonane
XTH : Xyloglucane endotransglucosylase/hydrolase
Xyl : Xylose

Page 8
Chapitre 1

1. INTRODUCTION
1.1. Les parois des cellules végétales

Les cellules végétales sont entourées par des parois cellulaires. La structure et la
composition de ces parois sont constamment modifiées au cours de la croissance, du
développement des plantes, et en réponse aux contraintes environnementales (Knox, 2008;
Lee et al., 2011; Roppolo et Geldner, 2012). Ainsi, les parois contribuent à la forme des
cellules et au port dressé des plantes terrestres et assurent la communication entre les cellules
(Wojtaszek, 2000). De plus, elles contribuent à l’adaptation des plantes à leur environnement
et à leur protection contre les stress environnementaux (Somerville et al., 2004; Keegstra,
2010; Albersheim et al., 2011).

La paroi se forme dès la division cellulaire au niveau de la plaque cellulaire, puis de la


mise en place de la lamelle moyenne (Samuels et al., 1995). On parle de paroi primaire lors de
la croissance, puis de paroi secondaire lorsque la croissance est terminée. Les structures et
compositions des parois primaires et secondaires sont différentes. Les parois primaires
subissent des modifications pour accompagner la croissance tandis que la forme des parois
secondaires n’est pas modifiée. Les parois primaires sont principalement composées de
polysaccharides (90-95% de leur masse) et de protéines (5-10%) (Voragen et al., 2009). Il
existe différents types de parois secondaires, par exemple des parois secondaires lignifiées
(Zhong et Ye, 2015) et des parois secondaires essentiellement constituées de cellulose comme
celles des graines de coton (Kim et Triplett, 2001).

A titre d’exemple, voici la description des parois observables sur des coupes de tissus
lignifiés (Carpita et McCann, 2000). De l’intérieur vers l’extérieur, on voit ainsi la paroi
secondaire directement en contact avec la membrane plasmique, la paroi primaire, puis la
lamelle moyenne (Figure 1.1) :

- La lamelle moyenne est une interface entre les parois primaires de cellules voisines qui
est mise en place lors de la mitose, à la suite de la fusion de vésicules golgiennes au niveau du
phragmoplaste (Samuels et al., 1995). La lamelle moyenne est principalement composée de
pectines et dépourvue de cellulose. Elle assure la cohésion entre les cellules voisines.

- La paroi primaire est un réseau hydraté qui se forme après la formation de la lamelle
moyenne et est renforcée pendant la croissance cellulaire (Carpita et Gibeaut, 1993). Elle est
constituée de cellulose, d’hémicelluloses, de pectines et de protéines. Elle est à la fois
extensible et résistante. Son épaisseur est faible relativement à l’épaisseur totale de la paroi.

- La paroi secondaire est formée en fin de croissance par ajout de couches successives sur
la face interne de la paroi primaire (Wang et Dixon, 2012). Elle est située entre la membrane
cytoplasmique et la paroi primaire. Elle est de composition différente de la paroi primaire : le

Page 9
Chapitre 1

réseau de polymères est moins hydraté, il y a davantage de cellulose (structure solide et non
extensible) et peu de pectines et elle est beaucoup plus épaisse que la paroi primaire (Roland,
1980). Elle peut être renforcée par des dépôts hydrophobes de lignines qui débutent dans la
lamelle moyenne et la paroi primaire.

Figure 1.1 : Un exemple de parois cellulaires végétales (Carpita et McCann, 2000)


A- Représentation schématique.
B- Coupe observée en microscopie électronique.
ML : lamelle moyenne; CW1 : paroi primaire; S1, S2, S3 : paroi secondaire lignifiée.

1.1.1. Composition

Comme mentionné plus haut, les parois sont constituées de polysaccharides, de protéines et
d’autres composés tels que la lignine. Les polysaccharides sont de longues chaînes de
molécules de sucres. Ils se répartissent en trois catégories : la cellulose, les hémicelluloses et
les pectines.

1.1.1.1. La cellulose

Une molécule de cellulose est constituée de quelques centaines à plus de 10 000 unités de
molécules β-(1,4)-D-glucopyranose (Glc), dont le cellobiose (dimère de Glc) est le motif
répétitif (Figure 1.2). La cellulose extraite du bois a des longueurs de chaînes typiques entre
300 et 1 700 monomères ; les fibres de coton ont des longueurs de chaîne allant de 800 à 10
000 molécules (Klemm et al., 2005). La cellulose est une molécule stable et insoluble. Les
molécules de cellulose sont disposées parallèlement les unes aux autres, et sont reliées entre
elles par des liaisons hydrogène. L’existence de liaisons hydrogène inter-chaînes conduit à la
formation de fibres, ce qui favorise l’établissement d’un état solide. La cellulose est le
composé qui donne de la rigidité aux cellules (Carpita et Gibeaut, 1993).

Page 10
Chapitre 1

Figure 1.2 : Structure moléculaire de la cellulose (n = degré de polymérisation)


(Klemm et al., 2005)

La cellulose est synthétisée et organisée en microfibrilles par des complexes enzymatiques


appelés rosettes. Une rosette est formée des six sous-unités de cellulose-synthases (CESA)
contenant des membres différents de la famille des CESA renfermant au total 36 CESA
(Doblin et al., 2002). Notamment, chez Arabidopsis thaliana, les sous-unités CESA1,
CESA3, et CESA6 participent à la synthèse de la cellulose dans les parois primaires
(Gonneau et al., 2014) et les sous-unités CESA4, CESA7, et CESA8 y participent dans les
parois secondaire (Hill et al., 2014). Les complexes de cellulose-synthase sont localisés dans
la membrane plasmique où ils synthétisent les molécules de cellulose à partir de résidus UDP-
D-Glc. Le dépôt des microfibrilles est effectué de manière orientée et peut changer au cours
de la formation de la paroi secondaire (Emons et Mulder, 2000).

Dans les parois, les microfibrilles de cellulose sont entourées et reliées entre elles par des
hémicelluloses et ennoyées dans une matrice de pectines (Carpita et Gibeaut, 1993).

La cellulose est synthétisée par des organismes aussi différents que les bactéries, les
champignons et les plantes y compris les mousses telles que Physcomitrella patens (Moller et
al., 2007; Nothnagel et Nothnagel, 2007; Goss et al., 2012).

1.1.1.2. Les hémicelluloses

Les hémicelluloses comprennent les xylanes, les xyloglucanes, les mannanes, les
glucomannanes et les β-(1,3)(1,4)-glucanes. Ces types d'hémicelluloses sont présents dans les
parois cellulaires de toutes les plantes terrestres, à l'exception des β-(1,3)(1,4)-glucanes, qui
sont limitées aux Poales et quelques autres groupes. La structure détaillée des hémicelluloses
et leur abondance varie considérablement entre les différents espèces et les types de cellules.
Le rôle biologique le plus important des hémicelluloses est leur contribution au renforcement
de la paroi cellulaire par des interactions avec les microfibrilles de cellulose et avec la lignine
par des liaisons non covalentes (Scheller et Ulvskov, 2010). Les hémicelluloses peuvent aussi
établir des liaisons covalentes avec les pectines (Thompson et Fry, 2000).

Les xyloglucanes (XG)

Les XG sont constitués d’un squelette de β-(1,4)-D-Glc. Jusqu’à 75% de ces Glc peuvent
être substitués en α-(1,6) par des résidus D-xylose (Xyl). Ils présentent une structure
conservée, basée sur la répétition de motifs constitués de 7 à 10 monomères (Figure 1.3). Le

Page 11
Chapitre 1

motif répétitif des XG se compose plus précisément de 4 résidus Glc, dont 3 sont substitués
en α-(1,6) par des résidus Xyl, eux-mêmes substitués par des résidus variés (Vincken et al.,
1997).

Figure 1.3 : Structure de l'unité XLFG des XG (Brennan et Harris, 2011)


Nomenclature suivant Fry et al. (Fry et al., 1993) :
X = α-D-Xyl-(1,6)-β-D-Glc, L = X- β-D-Gal-(1,2), F = L- α-L-Fuc-(1,2)

Les XG forment une famille de polysaccharides trouvés en proportions variables dans les
parois non lignifiées des plantes terrestres, y compris les mousses tels que P. patens (Popper
et Fry, 2003; Moller et al., 2007). Ils constituent habituellement 20 à 25% de la masse des
parois primaires des dicotylédones, mais seulement 1 à 5% des parois primaires des
graminées (Vogel, 2008; Hsieh et al., 2009; Scheller et Ulvskov, 2010). Ils peuvent former
des liaisons avec les microfibrilles de cellulose formant un réseau XG-cellulose solide, mais
extensible (Fry, 1989; Hsieh et al., 2009; Schultink et al., 2014). Ces liaisons sont supposées
contraindre une hypertrophie des cellules et donc jouer un rôle dans le contrôle de
l'élargissement de la cellule (Rose et al., 2002; Fry, 2004; Bootten et al., 2009; Hsieh et al.,
2009; Schultink et al., 2014).

Les xylanes

Les xylanes sont constituées d'un polymère linéaire de résidus β-(1,4)-Xyl et substitués par
les résidus d’acétyle, d'acide glucuronique (GlcA), d'acide 4-O-methylglucuronique (Me-
GlcA), et d'arabinose (Ara) (Figure 1.4) (Han et al., 2012; Rennie et Scheller, 2014). Il existe
une variation dans les structures de xylanes entre les différentes espèces et même entre les
différents tissus de la même espèce.

Les xylanes peuvent être liés avec des microfibrilles de cellulose et avec d'autres
polymères (lignine, pectines, protéines) par des liaisons hydrogènes et par des liaisons
covalentes pour augmenter la résistance de la paroi cellulaire (Balakshin et al., 2011; Bromley
et al., 2013; Tan et al., 2013).

Page 12
Chapitre 1

Figure 1.4 : Structure générale des xylanes (Rennie et Scheller, 2014)

Les xylanes sont parmi les polysaccharides les plus abondants dans la nature (Derba-
Maceluch et al., 2015). Chez les dicotylédones, ils sont prédominants dans les parois
secondaires, mais peu représentés dans les parois primaires (environ 5%). Chez les
monocotylédones, les xylanes sont le principal polysaccharide non cellulosique dans les
parois primaires (20 à 40%) (Vogel, 2008; Scheller et Ulvskov, 2010; Hao et Mohnen, 2014).
Chez les mousses, les xylanes ont été aussi détectés par des études d’immunomarquage ou par
CoMPP (Comprehensive Microarray Polymer Profiling) (Carafa et al., 2005; Moller et al.,
2007; Kulkarni et al., 2012).

Les β-(1,4)(1,3)-glucanes

Les β-(1,4)(1,3)-glucanes aussi appelés MLG (mixed-linkage β-glucans) sont des


polymères non ramifiés de Glc qui contiennent en moyenne 30% de liaisons β-(1,3) et 70% de
liaisons β-(1,4). Les chaînes sont constituées d’une répétition d’un motif de base de 3 à 4 Glc
liés en β-(1,4) séparés par des liaisons β-(1,3) isolées altérant la rigidité de la chaîne. Les β-
(1,3)(1,4)-glucanes sont considérés comme des hémicelluloses, mais ils sont assez facilement
extraits sans traitement alcalin.

Figure 1.5 : Exemple de β-(1,4)(1,3)-glucanes (Vannucci et al., 2013)

Ces glucanes se trouvent principalement dans les parois primaires des graminées,
particulièrement dans l'albumen amylacé des grains, où ils peuvent contribuer jusqu'à 70% en
masse des parois de l'orge, du seigle et de l'avoine (Burton et Fincher, 2009). Cependant, leur

Page 13
Chapitre 1

existence a aussi été décelée chez le lin par Goubet et al. (1995). Chez les dicotylédones et les
bryophytes, ils sont apparemment absents (Popper et Fry, 2003; Vogel, 2008).

Les mannanes

Les mannanes présentent un squelette contenant des résidus mannose (Man) ou une
combinaison de résidus Glc et Man liés en β-(1,4) (Ebringerova et al., 2005; Liepman et al.,
2007) (Figure 1.6). En outre, le squelette de mannanes peut être substitué par des chaînes
latérales de résidus Gal liés en α-(1,6) (Moreira et Filho, 2008; Zhang et al., 2014). Ainsi, les
mannanes peuvent être classés en quatre sous-familles : les mannanes linéaires,
les glucomannanes, les galactomannanes, et les galactoglucomannanes (Petkowicz et al.,
2001).

Figure 1.6 : Exemples de structures de mannanes (Gullón et al., 2009)

Les mannanes sont relativement abondants dans les parois de certaines plantes terrestres
non angiospermes, telles que la mousse P. patens (Popper et Fry, 2003; Popper, 2008). Ils
sont également présents dans les parois primaires des dicotylédones (2 à 10%). Cependant, ils
sont minoritaires dans les parois primaires des monocotylédones (Liepman et al., 2007;
Vogel, 2008; Scheller et Ulvskov, 2010; Popper et al., 2011).

Les mannanes présentent un rôle structural, agissant en tant qu’hémicelluloses se liant avec
la cellulose et en tant que fibrilles cristallines chez les algues qui n’ont pas des parois à base
de cellulose. En outre, ils peuvent avoir une fonction de stockage des glucides non amidonnés
ou de molécules de signalisation au cours de la croissance et du développement des plantes
(Liepman et al., 2007).

Page 14
Chapitre 1

1.1.1.3. Les pectines

Les pectines sont des composants majeurs de la paroi cellulaire des plantes et sont les
polysaccharides les plus complexes trouvés dans la nature (Mohnen, 2008; Voragen et al.,
2009). Différents polysaccharides pectiques peuvent être détectés dans les parois primaires :
l’homogalacturonane (HG), le xylogalacturonane (XGA), l’apiogalacturonane, le
rhamnogalacturonane de type I (RG I) et le RG II (Willats et al., 2006; Burton et al., 2010;
Harholt et al., 2010).

L'homogalacturonane (HG)

Le polysaccharide pectique le plus abondant est HG, un homopolymère linéaire d'acides


galacturoniques (GalA) liés en α-(1,4) qui représente environ 65% des pectines des parois
primaires. HG est partiellement méthylestérifié en position C6 et peut être O-acétylé en
position O2 et/ou O3 (Ralet et al., 2005; Mohnen, 2008; Sénéchal et al., 2014).

Le rhamnogalacturonane I (RG I)

Le RG I représente 20 à 35% des pectines des parois primaires. Il est constitué d’un
squelette comportant la répétition d’une centaine de motifs disaccharidiques α-(1,4)-GalA-α-
(1,2)-Rha (Lerouge et al., 1993; Mohnen, 1999; Gorshkova et al., 2013). Entre 20 et 80% des
residus Rha du RG I peuvent être substitués en position O4 par des chaînes latérales de sucres
neutres (Gorshkova et al., 2013). Ces chaînes latérales sont principalement constituées des
résidus de α-L-Ara et β-D-Gal seuls, linéaires ou ramifiés. Les chaînes latérales incluent les
arabinogalactanes, les α-(1,5)-arabinanes et les β-(1,4)-galactanes (Ridley et al., 2001;
Paulsen et Barsett, 2005; Mohnen, 2008; Gorshkova et al., 2013). Les chaînes latérales
peuvent également contenir des résidus α-L-Fuc, β-D-GlcA et 4-O-Meβ-D-GlcA (Mohnen,
2008).

Le rhamnogalacturonane II (RG II)

Le RG II est la molécule la plus complexe des pectines. Elle représente jusqu’à 10% des
pectines de la paroi primaire (O'Neill et al., 2004). Sa structure est très conservée dans toutes
les espèces de plantes et se compose d'un squelette de HG d'au moins 8 (et probablement
plus) résidus de α-D-GalA liés en 1,4 décorés avec des branches latérales composées d’au
moins 12 types de sucres différents reliés par plus de 20 types de liaisons différentes (O'Neill
et al., 2004; Scheller et al., 2006; Mohnen, 2008). Certains monosaccharides sont rarement
trouvés dans d'autres polysaccharides, tels le D-apiose (Api), le L-acerate (AceA), le 2-O-
méthyl L-Fuc, le 2-O-méthyl D-Xyl, le L-Gal, l'acide 2-keto-3-deoxy-D-lyxo-heptulosarique
(Dha), et le 2-keto-3-deoxy-D-manno-octulosonate (Kdo) (Scheller et al., 2006). Le RG II
existe principalement sous forme de dimères qui sont liés de manière covalente par des
diesters de borate. Le fait que les mutations qui provoquent des modifications même mineures
de la structure du RG II entraînent une diminution de la formation de dimère de RG II et des

Page 15
Chapitre 1

défauts de croissance tels que le nanisme suggère que la dimérisation du RG II dans les parois
est essentielle pour la croissance et le développement des plantes (Mohnen, 2008; Gorshkova
et al., 2013).

Les galacturonanes substitués

Le HG substitué par un résidu β-D-Xyl en position O3 des GalA est appelé


xylogalacturonane (XGA) (Schols et al., 1995; Renard et al., 1997; Vincken et al., 2003), ou
par un résidu β-D-Api en position O2 et O3 des GalA est appelé apiogalacturonane (Ridley et
al., 2001; Mohnen, 2008). Le résidu Xyl des XGA a parfois été trouvé substitué en position
O4 par un résidu de β-D-Xyl supplémentaire (Zandleven et al., 2006). Le XGA est un
constituant mineur des parois (moins de 10% de la masse). Le XGA est plus fréquent dans les
tissus reproducteurs, bien qu’ayant également été détecté dans les tiges et les feuilles d'A.
thaliana (Zandleven et al., 2007; Mohnen, 2008). Les apiogalacturonanes ont été décrits
uniquement dans les parois de monocotylédones aquatiques des genres Lemna et Zostera
(Golovchenko et al., 2002; Mohnen, 2008).

Il existe différents modèles décrivant les pectines. En fait, les différents polysaccharides
pectiques ne seraient pas des molécules distinctes, mais plutôt des domaines liés de façon
covalente (Willats et al., 2001; Vincken et al., 2003; Harholt et al., 2010). Jusqu'à présent, il a
été accepté que les domaines RG et HG constituent le squelette de polymères pectiques
(Figure 1.7) (Scheller et al., 2006; Harholt et al., 2010). Cependant, une structure alternative a
aussi été proposée dans lequel le HG est une longue chaîne latérale de RG I (Figure 1.8)
(Willats et al., 2006).

Figure 1.7 : Un modèle de structure des pectines


(Scheller et al., 2006; Harholt et al., 2010)

Page 16
Chapitre 1

Figure 1.8 : Un modèle alternatif de structure des pectines


(Willats et al., 2006)

Les pectines représentent approximativement 20 à 35% de la paroi primaire des


dicotylédones et 2 à 10% de la paroi primaire des graminées (Ishii, 1997; O'Neill et al., 2004;
Vogel, 2008; Voragen et al., 2009). Elles sont minoritaires dans les parois secondaires
(Morvan et al., 1989; Vogel, 2008; Krishnamoorthy et al., 2014). Des épitopes des pectines, y
compris l’homogalacturonane (HG) méthylés on non, les β-(1,4)-galactanes, les α-(1,5)-
arabinanes et le rhamnogacturonane I (RG I) ont également été détectés dans les parois
cellulaires de P. patens (Moller et al., 2007; Kulkarni et al., 2012). Toutefois, ces polymères
n'ont pas été isolés en quantité suffisante pour une caractérisation structurale.

Les rôles des pectines sont très nombreux au cours du développement et en réponse aux
contraintes de l’environnement. En effet, elles forment un réseau adapté à l’expansion
cellulaire du fait de son caractère hydrophile qui rend la paroi plastique. Elles régulent
également la porosité, le pH et la charge globale des parois et assurent l’adhésion entre les
cellules. Les pectines sont également impliquées dans les mécanismes de défense et de
signalisation (Darvill et al., 1992; Carpita et Gibeaut, 1993; Voragen et al., 2009; Kaya et al.,
2014).

1.1.1.4. Les lignines

Les lignines constituent le second polymère majeur après la cellulose dans la paroi
secondaire des plantes. Les lignines sont des hétéropolymères complexes racémiques d’unités
aromatiques principalement dérivées de phénylalanine (Whetten et Sederoff, 1995). Ces
unités sont principalement des monomères d'alcools hydroxycinnamyl appelés monolignols
qui diffèrent entre eux par leur degré de méthoxylation sur leur cycle aromatique. Les lignines
contiennent principalement des unités p-hydroxyphényl (H), guaiacyl (G) et syringyl (S),

Page 17
Chapitre 1

résultant des alcools p-coumarylique, coniférylique et sinapylique respectivement et d'autres


composés apparentés (Boerjan et al., 2003). La quantité, la structure et la composition des
lignines varient selon les taxa, les types cellulaires, et les couches de la paroi et également en
réponse à des signaux développementaux et environnementaux. Les lignines des
dicotylédones se composent principalement des unités G et S et de traces d’unités H, alors que
les lignines des gymnospermes sont principalement composées d'unités G avec des niveaux
faibles d'unités H. Les lignines de graminées intègrent des unités G et S à des niveaux
comparables, et davantage d'unités H que les dicotylédones (Baucher et al., 1998).

Les lignines liées de façon covalente à des hémicelluloses, offrent une résistance et une
rigidité à la paroi cellulaire, et une hydrophobicité au système vasculaire (Déjardin et al.,
2010). Elles sont essentielles pour l'intégrité structurale de certaines parois ainsi que pour le
transport de l'eau et des solutés dans le système vasculaire, et jouent un rôle dans la protection
des plantes contre les pathogènes.

1.1.1.5. Les protéines pariétales

Depuis le début des années 2000, le développement de la protéomique a permis d’enrichir


la connaissance des protéines des parois cellulaires végétales. Dans ce mémoire, nous
définissons les protéines pariétales comme des protéines physiquement présentes dans la
paroi. Parmi celles-ci, se trouvent des protéines enzymatiques, structurales ou dont le rôle
n’est pas connu. Plus de 50 articles ont été publiés décrivant des protéomes pariétaux de plus
de 15 espèces végétales différentes (Albenne et al., 2013; Albenne et al., 2014). La moitié de
ces articles concerne A. thaliana dont le génome était disponible dès l’année 2000
(Arabidopsis Genome Initiative, 2000). Actuellement environ 500 protéines pariétales ont été
identifiées dans le protéome pariétal d’A. thaliana, ce qui correspond à environ un quart des
2000 protéines prédites pour être secrétées (Jamet et al., 2006; Jamet et al., 2008). Le
deuxième protéome le plus documenté est celui de Brachypodium distachyon, une plante
modèle monocotylédone (Douché et al., 2013; Francin-Allami et al., 2015).

Des analyses bioinformatiques permettant la prédiction de domaines fonctionnels ont


permis de proposer la distribution de ces protéines en neuf classes fonctionnelles (Jamet et al.,
2008). Elles sont rassemblées dans la base de données WallProtDB (San Clemente et Jamet,
2015).

La classe des protéines agissant sur les polysaccharides est la plus peuplée. Elle
représente environ 25% des protéomes pariétaux. Elle renferme notamment les glycoside
hydrolases (GH) qui sont les plus représentées, les carbohydrates estérases/lyases et les
expansines. L'importance de ces protéines n’est pas surprenante puisque les polysaccharides
constituent la fraction la plus importante des parois cellulaires et sont constamment soumis à
des remodelages au cours du développement des plantes ou en réponse aux contraintes
environnementales (cf § 1.1.2.1.).

Page 18
Chapitre 1

La classe des oxydo-réductases comporte les peroxydases, les multicopper oxidases, les
berberine-bridge oxido-reductases et les blue copper binding proteins (entre 15 et 20% des
protéomes pariétaux). Les peroxydases sont des protéines très importantes impliquées dans les
remaniements des réseaux de polymères pariétaux (cf § 1.1.2.1.). Par contre, les fonctions des
protéines de type berberine-bridge oxidases et blue copper binding proteins ne sont pas
connues (Nersissian et Shipp, 2002).

La classe des protéases comporte des Asp-protéases, des Cys-protéases, des Ser-protéases
et des Ser-carboxypeptidases (environ 12% des protéomes pariétaux). Ces protéines
pourraient intervenir dans la maturation des protéines pariétales, leur dégradation ou encore la
libération de signaux peptidiques (Van der Hoorn, 2008; Albenne et al., 2009).

La classe des protéines à domaines d’interaction comporte des protéines interagissant


avec les sucres (lectines), des protéines interagissant avec d’autres protéines grâce à des
domaines LRR (leucine-rich repeat) et des inhibiteurs d’enzymes.

La classe des protéines de signalisation comprend principalement les protéines à


arabinogalactanes (AGP), des fasciclin-like AGP (FLA) et des récepteurs de type lectine
récepteurs kinases ou LRR récepteurs kinases identifiés grâce à leur domaine extracellulaire
(Shiu et Bleecker, 2001; Seifert et Roberts, 2007). Outre leur rôle dans la signalisation
(Seifert et Blaukopf, 2010), les AGP pourraient contribuer aux propriétés mécaniques de la
paroi cellulaire (Seifert et Roberts, 2007).

La classe des protéines liées au métabolisme des lipides comporte des protéines
homologues aux lipases/acylhydrolases de type GDSL et des protéines de transfert de lipides
(LTP). Les LTP pourraient jouer un rôle dans le transport des lipides à travers les parois
hydrophiles, tandis que les lipases/acylhydrolases pourraient participer à la formation des
liaisons entre lipides dans la cuticule (Samuels et al., 2008; Yeats et Rose, 2013). Les LTP
pourraient également être impliquées dans l'extension de la paroi cellulaire en interagissant
avec le réseau cellulose/xyloglucane (Nieuwland et al., 2005).

La classe des protéines structurales est peu représentée dans les protéomes pariétaux. Elle
rassemble seulement quelques protéines riches en résidus proline (Pro) (PRP), des protéines
riches en résidus glycine (Gly) (GRP), et des leucine-rich repeat extensins (LRX). Les LRX
pourraient également être classées dans la classe de protéines à domaines d'interaction du fait
de leur domaine LRR qui pourrait être impliqué dans des interactions protéine/protéine
(Baumberger et al., 2001; Leiber et al., 2010). Les stratégies habituellement utilisées pour la
protéomique pariétale sont inefficaces pour solubiliser des protéines liées de manière
covalente comme les protéines structurales (Albenne et al., 2014). Une approche récente a
cependant conduit à l’identification de protéines structurales de type extensine (Chen et al.,
2015). Les glycoprotéines riches en hydroxyproline (Hyp) (HRGP) seront décrites en détail
dans le paragraphe §1.2 puisque certaines d’entre elles ont fait l’objet d’études dans le cadre
de cette thèse.

Page 19
Chapitre 1

La classe des protéines de diverses familles comprend toutes les protéines qui ne sont pas
assez nombreuses pour former une classe fonctionnelle (environ 12% des protéomes
pariétaux). Quelques familles de protéines émergent de ce groupe telles que les purple acid
phosphatases (Wang et al., 2011), les phosphate-induced proteins (Farrar et al., 2003) et les
germines (Membré et al., 2000).

La classe des protéines de fonctions inconnues (environ 12% des protéomes pariétaux)
correspond à des protéines sans domaine fonctionnel prédit ou ayant un domaine prédit de
fonction inconnue (Domain of unknown function, DUF). Cependant, des études récentes
apportent des informations sur ces protéines. En particulier, il a été montré que des protéines
de la famille DUF642 interagissent avec la cellulose (Vasquez-Lobo et al. 2012). Des
protéines de la famille DUF579 pourraient être impliquées dans la biosynthèse des xylanes
(Brown et al., 2011; Jensen et al., 2011; Urbanowicz et al., 2012). Des membres de la famille
DUF231 d’A. thaliana (AXY4 et AXY4L) sont nécessaires pour la O-acétylation des XG
(Gille et al., 2011), d’autres (TBR et TBL3) contribuent à la maintenance de l'état de
méthylestérification de polymères pectiques, ce qui semble conditionner la synthèse de la
cellulose de la paroi secondaire (Bischoff et al., 2010).

1.1.1.6. Quelques interactions entre les réseaux de polymères pariétaux

Les polymères pariétaux ne sont pas juxtaposés dans les parois. Ils peuvent être liés entre
eux par des liaisons covalentes et/ou interagir par des liaisons non covalentes pour former des
réseaux (Fry, 1986). Les hémicelluloses interagissent avec les molécules de cellulose par des
liaisons hydrogène et peuvent former des liaisons covalentes avec les pectines (Rizk et al.,
2000; Cumming et al., 2005; Popper et Fry, 2008). Des dimères de RG II sont formés grâce à
des liaisons diester de borate (O'Neill et al., 2004) tandis que les HG deméthylestérifiés sont
réticulés entre eux par des ponts Ca2+ pour former des structures en « boîtes à œufs » (Powell
et al., 1982). Dans les parois des monocotylédones et dans les parois secondaires, des liaisons
phénoliques ou éther de benzyle relient entre eux des polysaccharides et des composés
aromatiques (Fry et al., 2000).

Certaines protéines pariétales participent à la formation de réseaux supramoléculaires en se


liant à des hémicelluloses ou des pectines par des liaisons covalentes comme dans le cas de la
protéine APAP1 (Tan et al., 2013; Griffiths et al., 2014). Par ailleurs, les glycoprotéines
basiques interagissent par des liaisons ioniques avec des polysaccharides acides (Fry, 2004).
Les extensines (EXT) peuvent également former des liaisons covalentes avec les pectines
pariétales (Qi et al., 1995; Cassab, 1998; Nunez et al., 2009). Enfin, récemment, Hijazi et al.
(2014b) ont montré qu’AGP31, une AGP chimérique, pourrait former des réseaux non
covalents dans les parois en interagissant avec elle-même ou avec des polysaccharides
pariétaux.

Page 20
Chapitre 1

Ces réseaux de polymères pariétaux peuvent être modifiés au cours de la croissance des
plantes et en réponse aux facteurs biotiques et abiotiques de l’environnement grâce à l’action
de protéines (cf § 1.1.2.1.).

1.1.2. Principales fonctions des parois

Les parois cellulaires végétales sont des structures dynamiques jouant un rôle important
dans la croissance, la différenciation, et l'adaptation des plantes aux facteurs biotiques (les
herbivores et les pathogènes) et abiotiques (la submersion, l'ombre, la sécheresse, la
température) de l’environnement. Les parois sont aussi à la fois une source et un site de
perception de signaux. En période de ressources limitées, les parois peuvent être une source
d'hydrates de carbone.

1.1.2.1. La croissance et l’adaptation des parois des plantes

Les cellules végétales se développent en agrandissant leurs parois cellulaires. Cette


augmentation de taille et de volume peut être impressionnante : la longueur des vaisseaux de
xylème peut ainsi augmenter de 30 000 fois ; les cellules ciliées situées à la surface de jeunes
graines de coton s’allongent environ 1000 fois (Cosgrove, 2005). Cette croissance est
accomplie grâce à l'absorption d'eau dans la vacuole et à l'extension irréversible des parois.
Les parois souples de cellules en croissance sont sous une tension énorme, équivalente à 100-
1000 atmosphères. La tension pariétale résulte de l'étirement de polymères pariétaux lorsqu'ils
résistent à la pression de turgescence des cellules. Cette tension fournit l'énergie mécanique
nécessaire pour agrandir la paroi cellulaire. La croissance des parois s’effectue par un
mécanisme de glissement des polymères soigneusement contrôlé, dans lequel les liaisons
entre les composants pariétaux sont sélectivement réarrangées (Cosgrove, 1999, 2005; Marga
et al., 2005). L'expansion de la paroi doit être simultanément compensée par la synthèse et
l'intégration de nouveaux matériaux pariétaux. Ces polymères sont synthétisés au niveau de la
membrane plasmique (microfibrilles de cellulose) ou dans l’appareil de Golgi (hémicellulose
et pectines) (Figure 1.9) (Cosgrove, 2005). Une fois que les molécules de la matrice sont
sécrétées dans la paroi, elles s’associent entre elles pour former des réseaux à la fois solides et
extensibles. L’ensemble des mécanismes mis en jeu lors de ces processus d’assemblage n’est
pas connu en détail, mais fait intervenir des protéines enzymatiques (Fry, 2004; Frankova et
Fry, 2013).

Les modifications des parois permettent également aux plantes de s’adapter aux
changements environnementaux. Par exemple, la croissance accélérée des pousses lorsque les
plantes sont immergées ou exposées à un ombrage permet à certaines plantes d’échapper à ces
conditions défavorables. La croissance peut être modulée en période de sécheresse,
notamment au niveau des racines pour une adaptation au déficit d’eau. Les plantes tolérantes
au froid ajustent leurs propriétés pariétales pour empêcher la déshydratation induite par la
congélation et utilisent la paroi comme une barrière contre la propagation des cristaux de
glace. Enfin, l'architecture de la paroi cellulaire est un déterminant important de la résistance

Page 21
Chapitre 1

des plantes aux stress biotiques. Une paroi cellulaire rigide peut résister à une attaque
pathogène en formant une barrière physique impénétrable. Par ailleurs, des fragments de
polysaccharides libérés lors de la modification de la paroi peuvent contribuer à la
signalisation conduisant à la mise en place de réactions de défense des plantes (cf § 1.1.2.2.).

Figure 1.9 : Représentation schématique de la biogenèse des parois primaires


(Cosgrove, 2005)

Pour plus de clarté, le réseau hémicellulose-cellulose est indiqué sur la partie gauche de la paroi sans
pectines, qui sont soulignées sur la partie droite de la figure. Dans la plupart des espèces végétales,
l'hémicellulose principale est le XG (bleu), tandis que les hémicelluloses telles que les arabinoxylanes (gris) et
les mannanes (non représentés) se trouvent dans des quantités moindres. Les principaux polysaccharides
pectiques comprennent le HG et le RG I, avec de petites quantités de XGA et de RG II.

Parmi les protéines impliquées dans les remaniements des réseaux de polysaccharides
figurent les expansines (McQueen-Mason et al., 1992), les xyloglucane
endotransglycolase/hydrolase (XTH), les endo-(1,4)-β-D-glucanases, les pectin
methylesterases (PME), les peroxydases et les invertases (Roitsch et Gonzalez, 2004).

Les expansines pourraient perturber des liaisons non covalentes entre les microfibrilles de
cellulose et les hémicelluloses (McQueen-Mason et Cosgrove, 1994; 1995), mais leur
mécanisme d’action n’a pas été décrit en détail. Les XTH contribueraient aux remaniements
des réseaux d’hémicelluloses en effectuant des coupures et des religations de fragments de
molécules (Rose et al., 2002). Les endo-(1,4)-β-D-glucanases (Libertini et al., 2004), en

Page 22
Chapitre 1

hydrolysant la cellulose, provoqueraient la libération des XG interagissant avec les


microfibrilles de cellulose (Ohmiya et al., 1995; 2000). Elles pourraient donc jouer un rôle
dans l'élongation cellulaire (Nicol et al., 1998; Zhou et al., 2006; Buchanan et al., 2012). Les
PME sont des enzymes qui catalysent la coupure de groupements méthyle des fonctions
carboxyliques en C6 des résidus GalA esterifiés des HG. Le degré et le profil d'estérification
des HG affectent la structure et les propriétés des parois. Ainsi, les PME sont impliquées
directement et indirectement dans divers processus physiologiques tels que la germination des
graines, la maturation des fruits, la séparation cellulaire, l’élongation des racines et des tubes
polliniques et la croissance des tiges (Pelloux et al., 2007), la relaxation et le raidissement de
la paroi (Moustacas et al., 1991; Al-Qsous et al., 2004) et la résistance aux pathogènes
(Lionetti et al., 2012).

Les peroxydases sont notamment impliquées dans l’élongation cellulaire ou son arrêt
(Passardi et al., 2004; Passardi et al., 2005; Francoz et al., 2015). Elles participent à la
formation de réseaux covalents de protéines structurales telles que les extensines (cf § 1.2.1.).
De plus, les peroxydases sont capables de générer des radicaux libres réactifs tels que OH et
HOO, mais peuvent aussi réguler le niveau de H2O2, contribuer à des réactions non
enzymatiques de coupure de polysaccharides et à la signalisation.

De telles réactions participent également aux remaniements des polysaccharides pariétaux.


Le radical OH• est une forme très active de ROS (reactive oxygen species). Il pourrait être
produit non enzymatiquement grâce à la réduction d’ions Cu2+ en Cu+, ou Fe3+ en Fe+, faisant
intervenir l’ascorbate (Fry, 1998; Schopfer, 2001), ou encore par des peroxydases (Passardi et
al., 2004; Francoz et al., 2015) dans les parois à partir de l'anion superoxyde (O2-) et du
peroxyde d'hydrogène (H2O2). Il peut cliver des liaisons covalentes des polymères de la paroi
cellulaire par élimination d'un atome d'hydrogène des polysaccharides. Il pourrait donc jouer
un rôle dans la relaxation de la paroi cellulaire.

Les invertases sont des enzymes qui catalysent le clivage hydrolytique du saccharose en
hexoses (Roitsch et Gonzalez, 2004). Les plantes possèdent trois types d’invertases, qui sont
situés dans l'apoplaste (cell wall invertase, CWI), le cytoplasme (alkaline/neutral invertases,
A/NInv) et la vacuole (vacuolar invertase, VI), respectivement (Tauzin et Giardina, 2014).
Au cours de la résistance des plantes aux pathogènes, les CWI libèrent des molécules de
glucose et de fructose. Ces hexoses jouent un rôle dans le métabolisme en redistribuant les
sucres disponibles entre les compartiments cellulaires, mais aussi dans la signalisation (Proels
et Huckelhoven, 2014).

1.1.2.2. La signalisation

La communication entre la matrice extracellulaire et l'intérieur de la cellule est essentielle


pour tous les organismes. Pour contrôler la croissance, mais aussi pour répondre aux
perturbations environnementales, l'état des parois est constamment surveillé et l’information
doit être transmise à l'intérieur des cellules pour leur permettre de s’adapter. Seuls quelques

Page 23
Chapitre 1

composants impliqués dans ces processus ont été identifiés. Il s’agit de molécules de
signalisation dérivées de la paroi et de récepteurs kinases associées à la paroi. Pour illustrer ce
point, l’exemple de la perception de l’intégrité pariétale sera particulièrement développé.

Des molécules de signalisation dérivées de la paroi

Les réponses cellulaires spécifiques peuvent être provoquées par des molécules résultant
de la fragmentation ou de l’hydrolyse de constituants pariétaux qui sont donc considérés
comme des molécules de signalisation. Par exemple, les OGA (oligogalacturonides), des
produits de dégradation du HG avec une chaîne de 9 à 15 résidus GalA, peuvent causer des
changements dans l’expression des gènes, la fermeture des stomates, la production d'éthylène,
le renforcement des parois, et la production de ROS (Wolf et al., 2012). Les oligosaccharides
de XG pourraient également jouer un rôle dans la signalisation (York et al., 1984).

Par ailleurs, des peptides extracellulaires constituent une classe importante de molécules de
signalisation chez les plantes. Par exemple, il a été montré que deux peptides de sécrétion
putatifs d'A. thaliana, EPF1 (epidermal patterning factor 1) et EPF2, régulent la densité et la
distribution des stomates des feuilles (Hara et al., 2007; Hara et al., 2009; Hunt et Gray,
2009). Par ailleurs, SDD1 (stomatal density and distribution 1), code une protéase putative
dont l’activité régule la densité et la distribution des stomates des feuilles (Berger et Altmann,
2000; Von Groll et al., 2002). Il a été proposé que cette protéase libère un peptide de
signalisation. Ces peptides interagiraient avec des récepteurs membranaires dont certains ont
été caractérisés (Le et al., 2014).

Des récepteurs à la surface cellulaire

Les récepteurs kinases localisés dans la membrane plasmique ayant un domaine


extracellulaire sont des protéines importantes pour la perception et la transduction de signaux.
Parmi 610 RLK (receptor-like kinase) identifiés chez A. thaliana (Shiu et Bleecker, 2001),
quelques uns ont été étudiés et se sont avérés impliqués dans la signalisation associée aux
parois (Gouget et al., 2006; Hématy et al., 2007; Xu et al., 2008). D’autres RLK interagissent
avec des carbohydrates, et semblent jouer un rôle dans la signalisation lors des réactions de
défense (Wang et al., 1996; Madsen et al., 2003; Radutoiu et al., 2003; Kaku et al., 2006;
Shimizu et al., 2010).

Les WAK (wall-associated kinases) sont caractérisées par un domaine de Ser-Thr kinase
intracellulaire et un domaine extracellulaire qui contient au moins deux répétitions de EGF-
like (epidermal growth factor-like) (Kohorn, 2001). Le domaine extracellulaire de WAK1 se
lie étroitement aux pectines (Wagner et Kohorn, 2001). Récemment, Brutus et al. (2010) ont
démontré que WAK1 est le récepteur d’OGA (oligogalacturonides) chez A. thaliana. Par
ailleurs, d’autres études ont montré que des protéines WAK et WAK-like sont impliquées
dans l'élongation cellulaire et le développement des plantes, la tolérance à la salinité, la

Page 24
Chapitre 1

réponse aux métaux lourds et aux pathogènes (He et al., 1996; Lally et al., 2001; Wagner et
Kohorn, 2001; Hou et al., 2005; Kohorn et al., 2006).

Les canaux ioniques (stretch-activated ion channels ou MCA1) sont capables de détecter la
déformation membranaire induite par un stress mécanique affectant les parois (Nakagawa et
al., 2007).

Figure 1.10 : Le rôle des parois cellulaires dans les processus de signalisation
(Wolf et al., 2012)

La voie de signalisation via les parois peut être activée par plusieurs contraintes, notamment les forces
mécaniques et les changements dans la structure ou la composition des parois au cours du développement ou en
réponse aux contraintes environnementales. La perturbation de l'intégrité des parois est perçue par plusieurs
types de capteurs situés dans la membrane plasmique; la déformation membranaire induite par le stress
mécanique peut être détectée par les canaux stretch-activated calcium (appelés MCA1 chez A. thaliana), mais
aussi par une variété de récepteurs qui peuvent sonder différents constituants de la paroi. Plusieurs familles de
récepteurs-like kinases pourraient jouer le rôle de capteur d'intégrité de la paroi, telles que la famille CrRLK1-
like et les kinases associées à la paroi (WAK). La signalisation en aval est effectuée à travers les Rho-GTPases.
Les cellules végétales répondent à la perturbation des parois par une inhibition de la croissance associée à la
production de ROS, ACC (1-aminocyclopropane-1-carboxylic acid), et jasmonate et par le renforcement leurs
parois cellulaires à travers des dépôts de lignine et la formation des liaisons entre les polymères pariétaux.

Page 25
Chapitre 1

Les membres de la famille des protéines RLK1 de Catharanthus roseus (CrRLK1)-like ont
récemment émergé comme des candidats intéressants pour les capteurs de signalisation de la
paroi. Cette famille comporte 17 membres chez A. thaliana (Hématy et Höfte, 2008).
THESEUS1 (THE1) a été identifié comme un suppresseur du phénotype associé au mutant
cesa6/procuste1 déficient en cellulose (Hématy et al., 2007). Des mutations affectant THE1
atténuent l'inhibition de croissance et réduisent la lignification ectopique chez les mutants
cesa6 sans pour autant modifier le niveau de synthèse de cellulose. Parmi les gènes sur-
exprimés dans le mutant cesa6, un petit nombre de gènes dépend de la signalisation via
THE1. Certains gènes codent des enzymes de détoxication des ROS, des extensines et une
peroxydase, suggérant un rôle dans l’auto-assemblage de la paroi. D'autres gènes codent des
enzymes impliquées dans la synthèse de glucosinolates et d'autres protéines de défense,
indiquant un rôle dans la défense contre les pathogènes. L’ensemble de ces données suggère
un rôle pour THE1 dans la transduction des réponses aux perturbations pariétales.

D’autres membres de la famille CrRLK1-like d'A. thaliana sont aussi impliqués dans le
contrôle de la croissance cellulaire dans différents contextes biologiques (Hématy et Höfte,
2008; Boisson-Dernier et al., 2011; Cheung et Wu, 2011). Plus particulièrement, le récepteur
kinase FERONIA (FER), en association avec THE1 et HERCULES1, est nécessaire pour
l'élongation cellulaire normale (Guo et al., 2009). FER est largement exprimé au cours du
développement des plantes et est nécessaire pour l'élongation des cellules, y compris celle des
poils absorbants (Guo et al., 2009; Duan et al., 2010). ANXUR1/2, les deux paralogues les
plus proches de FER, sont exprimés dans le pollen et sont nécessaires pour la croissance du
tube pollinique (Boisson-Dernier et al., 2009; Miyazaki et al., 2009).

Evénements de signalisation en aval de la perception des dommages des parois

Plusieurs travaux montrent l'implication des ROS et des phytohormones (éthylène,


jasmonate, et acide salicylique) dans les événements de signalisation en aval de la perception
des dommages de la paroi cellulaire. En outre, de nombreuses études ont démontré la
convergence ou le chevauchement avec les voies de signalisation de la défense (Vogel et al.,
2004; Hernandez-Blanco et al., 2007). Par exemple, le mutant cev1 (cesa3) présente une
production accrue d’éthylène et de jasmonate et montre une meilleure résistance à l'égard de
divers agents pathogènes (Ellis et al., 2002), tandis que le traitement avec l’isoxabène induit
la synthèse de jasmonate et d'acide salicylique (Hamann et al., 2009). Fait intéressant, des
études récentes ont démontré une implication d’ACC (acide 1-aminocyclopropane-1-
carboxylique), le précurseur direct de l'éthylène, dans la régulation de la réponse aux
dommages des parois (De Cnodder et al., 2005; Xu et al., 2008; Tsang et al., 2011).

1.1.3. Des algues aux végétaux supérieurs : les grandes étapes de l’évolution
des parois

Les plantes terrestres ont évolué à partir des CGA (charophycean green algae). Celles-ci
ont conquis l’habitat d'eau douce après leur séparation d’anciennes algues vertes chlorophytes

Page 26
Chapitre 1

il y a 480 à 360 millions d’années environ (Kenrick et Crane, 1997; Lewis et McCourt, 2004;
Becker et Marin, 2009). Des recherches récentes sur la biochimie des parois des algues et des
plantes ont montré que les modifications de la composition des parois entre ces organismes
sont considérables, permettant l’adaptation aux différentes pressions évolutives (Popper et
Fry, 2003; Carafa et al., 2005; Van Sandt et al., 2007; Fry et al., 2008; Sørensen et al., 2010).
Ces dernières années, une attention particulière s’est portée sur l'évolution des composants
des parois cellulaires (Popper, 2008; Sarkar et al., 2009; Popper et Tuohy, 2010; Sørensen et
al., 2010). Dans cette partie, nous discutons de différents événements majeurs dans l'évolution
des lignées de plantes et d'algues, notamment la multicellularité, la terrestrialisation et la
vascularisation, en précisant le rôle des parois cellulaire.

1.1.3.1. La composition des parois des algues et des plantes

La diversité observée dans la composition des parois entre les taxons est étroitement
associée à l'évolution des organismes. L’apparition des différents constituants a pu être
retracée grâce à des analyses biochimiques (Niklas, 2004; Popper, 2008; Sørensen et al.,
2008; Popper et Tuohy, 2010; Sørensen et al., 2010) et bioinformatiques portant sur
l’évolution de familles de gènes impliquées dans la biosynthèse des polymères pariétaux (Del
Bem et Vincentz, 2010). Les principales observations sont résumées dans le tableau 1.1.
Brièvement, les CGA ont des parois cellulaires qui sont très similaires en composition à celles
des plantes terrestres, et semblent donc être à une position centrale dans l'évolution des parois.

Taxon Chloroplastida
Rhodophyta Phaeophyceae
Polysaccharides Embryophyceae Charophyceae Chlorophyta
Cellulose
Polysaccharides (1,4)-β-D-mannane
Cellulose Cellulose Cellulose Cellulose
cristallines (1,4)-β-D-xylane
(1,3)-β-D-xylane
Xyloglucane Xyloglucane Xyloglucane Xylofucoglucane
Glucomannane
Mannanes Mannanes Mannanes sulfaté
MLG sulfaté
Hemicelluloses Xylanes Xylanes Glucuronane Xylofucoglucuronane
(1,3),(1,4)-β-D-
MLG sulfaté
xylane
(1,3)-β-glucane (1,3)-β-glucane (1,3)-β-glucane (1,3)-β-glucane

Polysaccharides
Pectines Pectines Ulvanes — Alginates
acides

Agars
Polysaccharides
Ulvanes Carrageenanes Homofucanes
sulfatés
Porphyrane

Tableau 1.1 : Les principaux polymères des parois présents dans différents taxons de
plantes et d’algues (Popper et al., 2011).

MLG : mixed-linkage β-glucan [β-(1,3)(1,4)-glucane]

Page 27
Chapitre 1

1.1.3.2. L’apparition de la multicellularité

La transition d’une organisation unicellulaire à multicellulaire simple a été trouvée de


manière indépendante dans au moins 25 taxons. Cependant, les organismes multicellulaires
complexes n’ont évolué que dans six groupes d’eucaryotes : les animaux, les champignons,
les algues brunes, les algues rouges, les algues vertes et les plantes. Ainsi, l'évolution de la
complexité multicellulaire semble être une transition rare et difficile (Grosberg et Strathmann,
2007). Niklas et Kutschera (2010) ont affirmé que la multicellularité des plantes terrestres,
avec les spécificités de leur cycle de vie, est héritée de leurs derniers ancêtres communs, les
CGA. La multicellularité chez les plantes et les algues implique l'évolution de parois ou de
matrices extracellulaires puisque les groupes de cellules qui constituent un organisme
multicellulaire fonctionnel doivent être capables de se reconnaître, d'adhérer et de
communiquer entre eux (Domozych et Domozych, 2014). Cette matrice contient, par
exemple, des HRGP chez Volvox, des polysaccharides sulfatés chez certaines algues et des
pectines chez les plantes.

1.1.3.3. La terrestrialisation

La terrestrialisation a été précédée par une divergence entre les Chlorophytes et les
Streptophytes. Ceci est fortement corrélé avec un changement d'habitat d’eau saline à douce
(Becker et Marin, 2009). Ces transitions se sont accompagnées d’une altération importante de
la composition en polysaccharides des parois. Par exemple, la majorité des Chlorophytes
marines contient des polysaccharides sulfatés dans leurs parois (Lahaye et Robic, 2007), mais
ces polymères sont largement absents chez les CGA d'eau douce et leurs descendants (voir
Tableau 1.1). Il faut noter que les polysaccharides sulfatés sont aussi présents dans d'autres
organismes : dans les parois des angiospermes et des algues marines (voir Tableau 1.1) et
chez des invertébrés marins. Il a été suggéré que la présence de polysaccharides sulfatés dans
des taxons phylogénétiquement éloignés, mais vivant dans le milieu marin est un cas
d'adaptation convergente à un environnement fortement ionique (Aquino et al., 2005).

Afin de coloniser avec succès l'habitat terrestre, les ancêtres des plantes terrestres ont dû
mettre en place des stratégies efficaces pour faire face à un environnement nouveau. La
multicellularité confère une tolérance à la dessiccation en permettant d'augmenter la taille des
organismes. De manière concomitante, des composés phénoliques (les lignines des plantes et
les lignines-like des CGA) sont déposés dans les parois pour la protection contre la
dessiccation. En outre, les parois forment un endosquelette les renforçant mécaniquement
contre les effets de mouvement de l'eau ou de l'air (Sarkar et al., 2009).

1.1.3.4. La vascularisation

La multicellularité requiert un transport d’eau et de métabolites à longue distance. La


différenciation de systèmes vasculaires et leur renforcement par des composés phénoliques a
permis la mise en place d’un tel dispositif qui est présent chez les plantes supérieures ainsi

Page 28
Chapitre 1

que chez quelques algues brunes complexes (Lobban, 1978; Schmitz, 1979). Il permet le
mouvement des photosynthétats (mannitol chez les algues brunes, saccharose et autres sucres
chez les plantes vasculaires) des organes où ils sont synthétisés (sources) vers ceux où ils sont
consommés ou stockés (puits).

Cependant, sur la base de données actuellement disponibles, il est pratiquement impossible


de déterminer la façon dont les parois cellulaires des algues ont changé au cours de
l'évolution. Ainsi, les interactions entre les composants de la paroi doivent être comprises plus
complètement et les constituants des parois doivent être davantage caractérisés pour
contribuer à répondre à cette grande question.

1.2. Les HRGP

Dans notre classification des protéines pariétales (cf § 1.1.1.5), les glycoprotéines riches en
hydroxyproline (HRGP) font partie de la classe des protéines structurales ou de celle des
protéines de signalisation. Elles ont été classées en trois catégories en fonction de leurs O-
glycosylations : les EXT modérément glycosylées, les protéines à arabinogalactanes (AGP)
fortement glycosylées et les protéines riches en Pro (PRP) peu glycosylées. Des protéines
hybrides ou chimériques associant différents domaines existent également (Showalter et al.,
2010).

1.2.1. Les extensines (EXT)

Les EXT se caractérisent par une richesse en Hyp et en Ser, mais aussi en d’autres acides
aminés comme Val, Tyr, Lys et His. Elles sont caractérisées par la présence du motif Ser-
(Hyp)n (n≥2) qui peut représenter jusqu’à 60 % de la chaîne polypeptidique (Showalter, 1993).
Les O-glycanes peuvent représenter jusqu’à 60 % de la masse moléculaire de ces protéines.
Cette O-glycosylation est représentée en majorité (90-97 %) par des courtes chaînes latérales
d’arabinose (Ara) liées aux résidus Hyp, allant de 1 à 5 Ara [Hyp-(Ara)1-5] (Velasquez et al.,
2011b; Ogawa-Ohnishi et al., 2013; Nguema-Ona et al., 2014), et par 1 résidu Gal lié sur des
résidus Ser (Lamport et al., 1973). Les EXT subissent plusieurs modifications post-
traductionnelles (PTM) : (i) le clivage du peptide signal (dans le réticulum endoplasmique),
(ii) l’hydroxylation des résidus Pro en Hyp par des prolyl hydroxylases et la O-glycosylation
sur les résidus Ser et Hyp (dans le reticulum endoplasmique et l’appareil de Golgi) et enfin
(iii) l’établissement de liaisons éther entre leurs résidus Tyr pour former des isodityrosine,
pulcherosine ou di-isodityrosine et ainsi créer un réseau covalent (dans les parois) (Brady et
al., 1998). Comme mentionné dans le paragraphe §1.1.1.5, les EXT peuvent également être
liées à des polysaccharides pariétaux par des liaisons covalentes.

L’étude du mutant rsh (root-, shoot-, hypocotyl-defective) d'A. thaliana, déficient en une
EXT (EXT3) a montré que cette protéine joue un rôle important lors de la cytocinèse, en
contrôlant le positionnement de la plaque cellulaire (Hall et Cannon, 2002; Cannon et al.,
2008). Par ailleurs, les EXT sont impliquées dans de nombreux processus physiologiques et

Page 29
Chapitre 1

développementaux chez les plantes y compris la germination et la croissance du tube


pollinique (Wu et al., 2001; Hijazi et al., 2014a), l’abscission et la sénescence
(Merkouropoulos et Shirsat, 2003), la croissance des poils absorbants racinaires (Velasquez et
al., 2011a; 2011b). Les EXT jouent également un rôle important dans la défense des plantes et
la protection contre les pathogènes (Shanmugam, 2005; Xie et al., 2011; Plancot et al., 2013).

Des domaines EXT peuvent exister dans le contexte de protéines chimériques telles que les
arabinogalactanes EXT (Lind et al., 1994), les lectines EXT (Kieliszewski et al., 1994), les
LRR EXT (Rubinstein et al., 1995). La protéine LRX1, appartenant à cette deuxième
catégorie, sera décrite en détail dans le paragraphe § 1.3.

1.2.2. Les protéines à arabinogalactanes (AGP)

Dans le génome d’A. thaliana, 85 AGP ont été identifiées par une apporche
bioinformatique et classées en plusieurs groupes (Showalter et al., 2010) : AGP classiques,
AGP riches en Lys, AG peptides, AGP de type fasciclin-like (FLA), AGP plastocyanines et
AGP chimériques. Elles sont caractérisées par des motifs répétitif X(Pro)n dans lesquels X est
surtout Ala ou Ser (Tan et al., 2010). Elles contiennent une grande proportion de sucres,
jusqu'à 90-98% de leur masse molaire (Tan et al., 2012). La partie glycanique est composée
majoritairement de O-glycanes liés aux Hyp. Le principal glycane est un arabinogalactane de
type II (AG II) (Bacic et al., 1987). Les AG II contiennent un squelette de β-D-Galp formé par
une succession de trois D-Galp lié en β-(1,3) interrompu par une liaison β-(1,6). Les résidus
Gal des chaînes latérales peuvent être substitués par α-L-Araf, α-L-Rhap ou Me-GlcpA (Tan
et al., 2010; Tryfona et al., 2012). Les AG II sont différents (Figure 1.11) des AG I qui
constituent des branches latérales du RG I (Voragen et al., 2009), des AG III trouvés sur
certaines protéines allergènes (Leonard et al., 2005) et des O-glycanes riches en Gal/Ara
rencontrés sur la protéine AGP31 (Hijazi et al., 2012).

Figure 1.11 : Trois principaux types d’AG (Hijazi et al., 2014a)

Les AGP sont impliquées dans la croissance et le développement des plantes (Majewska-
Sawka et Nothnagel, 2000; Gaspar et al., 2001; Van Hengel et Roberts, 2003; Acosta-Garcia

Page 30
Chapitre 1

et Vielle-Calzada, 2004; Coimbra et al., 2009; Coimbra et al., 2010; Huang et al., 2013;
Seifert et al., 2014).

Il a été supposé que les AGP pourraient former des liaisons covalentes avec les réseaux de
polysaccharides pariétaux. Plusieurs études ont suggéré des associations fortes entre les AGP
et les pectines (Keegstra et al., 1973; Pellerin et al., 1995; Mollet et al., 2002; Immerzeel et
al., 2006; Tan et al., 2013). Cependant, à ce jour, une seule étude structurale approfondie a
permis de décrire en détail des interactions covalentes entre une AGP isolée et des pectines et
hémicelluloses formant le complexe APAP1 (Tan et al., 2013).

Des protéines chimériques contenant des domaines AGP pourraient également interagir
avec des polysaccharides. En particulier, SOS5 (SALT-OVERLY SENSITIVE 5), une AGP
de type fasciclin-like (FLA), a été supposée interagir avec les pectines, comme un médiateur
de l’adhérence du mucilage (Griffiths et al., 2014). Récemment, Hijazi et al. (2014a; 2014b)
ont montré qu’AGP31 pourrait contribuer à la formation de réseaux non covalents dans les
parois avec des protéines et des polysaccharides. Cette protéine sera décrite en détail dans le
paragraphe § 1.4.

1.2.3. Les protéines riches en Pro (PRP)

Les PRP représentent une classe de HRGP caractérisée par la présence du motif
pentamérique répétitif (Pro-Hyp-Val-Tyr-Lys)n ou ses variants (Cassab, 1998) et contenant
des quantités équimolaires de Pro et d’Hyp (Datta et al., 1989). Peu de données sur leurs
glycosylations et leurs interactions avec des polysaccharides sont disponibles dans la
littérature.

Les gènes codant pour des PRP sont régulés au cours du développement. Chez le soja, ces
gènes sont induits durant le développement de l’hypocotyle et de l’enveloppe de la graine
(Wyatt et al., 1992) et chez A. thaliana lors du développement des poils absorbants
(Bernhardt et Tierney, 2000). L’expression de ces gènes peut également être induite lors de
stress d’origine biotique tels que ceux causés par des éliciteurs fongiques (Sheng et al., 1991)
ou lors de stress environnementaux tels que la blessure (Sheng et al., 1991) et le stress
hydrique (Battaglia et al., 2007).

Les PRP peuvent être insolubilisées dans les parois (Datta et al., 1989; Brisson et al.,
1994). Elles sont supposées former des liaisons dans les parois cellulaires, mais la preuve
directe n’a pas été apportée (Bradley et al., 1992; Brisson et al., 1994).

1.2.4. Participation des HRGP à des réseaux covalents ou non covalents dans
les parois

Récemment, Hijazi et al. (2014a) ont proposé un modèle de structure des parois dans
lequel les HRGP joueraient un rôle en tant qu’agents de réticulation, reliant les
polysaccharides non cellulosiques grâce à des liaisons covalentes ou non covalentes (Figure

Page 31
Chapitre 1

1.12). Pour plus de clarté, ce modèle ne représente pas toute la complexité des réseaux de
polysaccharides. Les AGP sont représentées avec des liaisons covalentes avec les pectines et
les hémicelluloses, comme proposé par Tan et al. (2013) pour le complexe APAP1. Les EXT
sont attachées de manière covalente avec les pectines comme proposé par Qi et al. (1995).
Enfin, les réseaux non covalents entre les HRGP chimériques et les polysaccharides sont
représentés selon Hijazi et al. (2014b) pour AGP31. Des lectines supposées interagir aves les
O-glycanes riches en Gal/Ara d’AGP31 sont également intégrées dans le modèle. Beaucoup
de travaux restent encore à réaliser pour valider un modèle de ce type. Mais, il permet de
formuler de nouvelles hypothèses dont certaines ont été explorées au cours de ce travail de
thèse.

Figure 1.12 : Représentation schématique des interactions entre les HRGP et les
polysaccharides pariétaux in muro (Hijazi et al., 2014a)

1.3. Les LRR Extensines (LRX)

Les LRX sont des protéines chimériques extracellulaires contenant un domaine LRR en N-
terminal et un domaine EXT en C-terminal (Rubinstein et al., 1995; Baumberger et al.,
2003b). La protéine la mieux caractérisée est LRX1 d'A. thaliana. LRX1 (At1g12040)
comporte un peptide signal en N-terminal, un domaine LRR (domaine d’interaction
protéine/protéine) en position centrale, et un domaine EXT en C-terminal (Figure 1.13). Une
recherche bioinformatique dans la séquence du génome d'A. thaliana réalisée avec le domaine
LRR de LRX1 a identifié 10 gènes codant pour des protéines LRX putatives (Baumberger et

Page 32
Chapitre 1

al., 2003b). Il s’agit de LRX2 (At1g62440), LRX3 (At4g13340), LRX4 (At3g24480), LRX5
(At4g18670) LRX6 (At3g22800), LRX7 (At5G25550), PEX1 (Pollen-specific LRR EXT 1)
(At3g19020), PEX2 (At1g49490), PEX3 (At2g15880) et PEX4 (At4g33970). Parmi ces
protéines, la protéine LRX2 est la plus proche de LRX1 (82% d’identité).

Les LRX sont supposées être O-glycosylées dans leur domaine EXT par des Gal sur des
Ser et des Ara sur des Hyp au niveau de motifs Ser(Hyp)n (Baumberger et al., 2003a). Cela a
été confirmé par Ringli (2010).

Figure 1.13 : Structure de la protéine LRX1


A. Représentation schématique montrant les différents domaines de la protéine. B. Séquence en acides
aminés. La séquence de la protéine se lit de haut en bas et de gauche à droite.

Une fonction biologique dans le développement des poils racinaires a été proposée pour les
protéines LRX1 et LRX2. En effet, la morphologie des poils absorbants racinaires du mutant
lrx1 est fortement modifiée, et celle du double mutant lrx1/lrx2 l’est encore davantage,
probablement en raison de défauts dans la structure de leurs parois (Baumberger et al., 2001;
Diet et al., 2006).

La protéine LRX1 est insolubilisée dans la paroi, une propriété qui est attribuée au
domaine EXT. La complémentation du mutant lrx1 par une construction codant une version
tronquée de LRX1 dépourvue du domaine EXT n’a pas permis la restauration du phénotype
sauvage. En outre, l’introduction de cette construction dans les plantes sauvages a conduit à
un phénotype de poils absorbants similaire à ceux des mutants lrx1. Ceci suggère que le

Page 33
Chapitre 1

domaine LRR concurrence et bloque les partenaires d'interaction de la protéine LRX1


endogène. De plus, il a été montré que le domaine EXT est essentiel pour la fonction de
LRX1 (Baumberger et al., 2001; Ringli, 2010).

Figure 1.14 : Phénotypes racinaires des mutants lrx1 et lrx1/lrx2 d’A. thaliana
(Baumberger et al., 2001; Diet et al., 2006)
A, E. Phénotype racinaire des plantes sauvages.
B, F. Phénotype racinaire du mutant lrx1.
C. Phénotype racinaire du double mutant lrx1/lrx2.

Le domaine EXT de LRX1 a été étudié in vivo par complémentation du mutant lrx1 afin
d’identifier des motifs et des acides aminés importants pour la fonction de la protéine. Les
différents motifs répétitifs dans le domaine EXT se sont révélés être fonctionnellement
redondants. La plus courte version de LRX1 fonctionnelle pour la complémentation du
mutant lrx1 comporte les 90 premiers acides aminés du domaine EXT. Pour évaluer le rôle de
ses résidus Tyr, LRX1 a été mutagénéisée de sorte que les sept codons Tyr ont été remplacés
par les codons Phe ou Leu (voir Figure 1.13) afin d’empêcher la formation de liaisons
dityrosine ou iso-dityrosine (cf § 1.2.2.1.). Ces protéines ne sont pas capables de
complémenter le phénotype de lrx1 démontrent que les résidus Tyr sont indispensables pour
la fonction de la protéine LRX1.

Pour tester si le domaine EXT est requis pour l'insolubilisation de LRX1 dans les parois,
des parois de racines de plantes exprimant des versions tronquées de LRX1 (14 ou 90 acides
aminés) ont été intensivement lavées pour éliminer les protéines solubles. Par
immunolocalisation, seule la version comportant 90 acides aminés du domaine EXT a été
détectée. Cette analyse indique que le domaine EXT de LRX1 est responsable de
l'insolubilisation de LRX1 dans les parois. Par contre, les résidus Tyr ne sont pas impliqués
dans cette insolubilisation car les versions dans lesquelles les résidus Tyr ont été remplacés
par des résidus Phe ou Leu sont insolubilisées (Ringli, 2010).

La recherche de mutants suppresseurs du phénotype lrx1 a conduit à l’identification de


gènes impliqués dans la synthèse des pectines tels que RHM codant une UDP-L-rhamnose
synthase (Diet et al., 2006). Dans ce mutant, la transcription de plusieurs gènes impliqués

Page 34
Chapitre 1

dans la biogenèse des parois est également modifiée, ce qui suggère des interactions entre
LRX1 et d’autres constituants pariétaux.

1.4. La famille des protéines de type Arabinogalactan Protein (AGP) 31

1.4.1. AGP31

La protéine AGP31 est codée par le gène At1g28290. Elle est très abondante dans les
parois des hypocotyles étiolés (Irshad et al., 2008) et est facilement extraite de leurs parois
(Hijazi et al., 2012). AGP31 est une AGP chimérique qui présente une association de
domaines (Figure 1.15). Elle comporte un court domaine de type AGP en N-terminal, un
domaine riche en His, un domaine central très répétitif de type PRP et un domaine C-terminal
appelé PAC (PRP and AGP containing Cysteine) qui comporte 6 Cys à des positions
particulières (Baldwin et al., 2000). Du fait de la réactivité de la protéine avec le réactif β-D-
glucosyl Yariv, le nom d’AGP a été attribué à cette protéine (Liu et Mehdy, 2007).

B Peptide signal MGFIGKSVLVSLVALWCFTSSVFT

Domaine AGP EEVNHKTQTPSLAPAPAP

Domaine His-rich YHHGHHHPHPPHHHHPHPHPHPHPPA

KSOVKPOVKAOVSOOAKPOVKPOVYPOT
KAOVKPOTKPOVKPOVSOOAKPOVKPOVYPOT
Domaine Pro/Hyp-rich KAOVKPOTKPOVKPOVYPOTKAOVKPOTKPOVKPOVYPOT
(SOO : motif de type extensine)
KAOVKPOTKPOVKPOVSOOAKPOVKPOVYPOT
KAOVKPOVSOOTKPOVTPOVYPPK

FNRSLVAVRGTVYCKSCKYAAFNTLLGAKPIEGAT
Domaine PAC VKLVCKSKKNITAETTTDKNGYFLLLAPKTVTNFGF
(6 Cys conservées)
RGCRVYLVKSKDYKCSKVSKLFGGDVGAELKPEKKL
(2 sites de N-glycosylation)
GKSTVVVNKLVYGLFNVGPFAFNPSCPK

Figure 1.15 : Structure de la protéine AGP31


A. Représentation schématique montrant les différents domaines fonctionnels.
B. Séquence en acides aminés. La séquence se lit de haut en bas et de gauche à droite.

La structure d’AGP31 a été partiellement caractérisée. Tout d’abord, la présence de résidus


Hyp (O) sur le domaine PRP a pu être démontrée par spectrométrie de masse MALDI-TOF.
Des motifs répétitifs de type KAOV, KSOV, KPOT, KPOV, TPOV et YPOT, ainsi que
quelques motifs de type EXT (SOO) ont été identifiés (Hijazi et al., 2012). Ce domaine peut
donc être qualifié de domaine riche en Pro et Hyp (H/PRP). De plus, des résidus
glycosidiques (hexoses et pentoses) ont été identifiés sur ce domaine, avec une hétérogénéité
importante. Les résidus hexose ont pu être localisés. Ces données, associées à des analyses
biochimiques de composition en monosaccharides, ont permis de montrer que le domaine
H/PRP portait des O-glycanes au niveau des résidus Hyp, riches en Gal et Ara. La présence

Page 35
Chapitre 1

d’Ara-oligosaccharides est également supposée au niveau des motifs EXT. Ces structures sont
reconnues par une lectine exogène, PNA (Peanut Agglutinin) mais pas par le réactif β-D-
glucosyl Yariv, spécifique des motifs arabinogalactane de type II (AG II). Le marquage de la
protéine par ce réactif est probablement dû à la présence de motifs AG II au niveau de son
court domaine AGP.

La localisation pariétale d’AGP31 a été montrée par analyse d’une protéine fusion AGP31-
GFP (Liu et Mehdy, 2007). Ces expériences ont été corroborées par la présence d’AGP31
parmi des protéines extraites de parois purifiées (Irshad et al., 2008). AGP31 est exprimé dans
tous les tissus vasculaires, mais à un niveau particulièrement élevé dans les racines et les
fleurs (Liu et Mehdy, 2007).

La protéine AGP31 a été récemment proposée interagir in vitro de manière non covalente
avec d’autres constituants pariétaux : le domaine riche en His (chargé positivement dans les
parois, pH environ 5) avec des HG (chargés négativement dans les parois) par des interactions
ioniques ; le domaine riche en Pro/Hyp avec des lectines pariétales (de la même manière
qu’avec PNA) ; le domaine PAC avec les O-glycanes riches en Gal/Ara du domaine riche en
Pro/Hyp et/ou des galactanes du RG I. Ainsi, les molécules d’AGP31 pourraient former entre
elles des réseaux non covalents dans les parois, contribuant ainsi au renforcement des parois
cellulaires des organes en croissance rapide tels que les hypocotyles étiolés (Hijazi et al.,
2014b) (Figure 1.16).

Figure 1.16 : Modèle d'interactions d’AGP31 avec des composants pariétaux


(Hijazi et al., 2014b)
AGP31 est schématisée selon Hijazi et al. (2012), avec des arabinogalactanes (AG) sur son domaine AGP et
des motifs riches en Gal/Ara et Ara-oligosaccharides sur son domaine riche en Pro/Hyp. Les interactions non
covalentes entre AGP31 et ses partenaires sont représentées par des lignes pointillées.

Page 36
Chapitre 1

1.4.2. Les protéines homologues à AGP31

La recherche de protéines homologues à AGP31 dans A. thaliana et d’autres plantes a


permis d’identifier 12 protéines (Tableau 1.2). Ces protéines renferment toutes un domaine
PRP avec des motifs répétitifs tels que ceux d’AGP31. Toutefois, ces protéines ne comportent
pas toutes des domaines riches en His et/ou AGP. Beaucoup d'entre elles ont été montrées
réagir avec le réactif β-D-glucosyl Yariv. Les protéines homologues d’AGP31 déjà décrites
sont AGP30 d’A. thaliana (Van Hengel et Roberts, 2003), DcAGP1 de Daucus carota
(Baldwin et al., 2001), GhAGP31 de Gossypium hirsutum (Gong et al., 2012), transmitting
tissue-specific 1 (TTS-1), TTS-2 et pistil extensin-like proteins (PELPs) de Nicotiana
tabacum (Goldman et al., 1992; Cheung et al., 1993; 1995), NaPRP4 (GaRSGP), NaPRP5 et
NaTTS de Nicotiana alata (Lind et al., 1994; Sommer-Knudsen et al., 1996; Schultz et al.,
1997; Wu et al., 2001), PvPRP1 de Phaseolus vulgaris (Sheng et al., 1991), CaPRP1 de
Capsicum annuum (Mang et al., 2004) et PhPRP1 de Petunia hybrida (Twomey et al., 2013).

Protéines domaine His a motifs AGP b Yariv c motifs X(P)n≥2X domaine PAC d

AGP31 + + + + +
AGP30 - + + + +
DcAGP1 + ++ nd + +
GhAGP31 + + nd + +
TTS-1/TTS-2 + ++ + + +
NaTTS nd nd + nd nd
PELPs - + nd + +
NaPRP4 + (4 His) +++ faible + +
NaPRP5 + (3 His) - (EXT) - + +
PvPRP1 + + nd + + (4)
CaPRP1 + (3 His) + nd + +
PhPRP1 + + nd + +

Tableau 1.2 : Caractéristiques structurales communes


aux protéines homologues à AGP31 (Hijazi et al., 2014b)
Dans le tableau, nd signifie non déterminé, + signifie présence et - signifie absence.
a. Le nombre de résidus His est mentionné lorsque le domaine est très court.
b. Présence d'au moins une série de résidus Pro non contigus dans le motif (XP)n où X peut être Ala, Ser ou
Thr. ++ signifie que ces motifs sont présents à la fois en N- et en C-terminal du domaine His. +++ signifie
qu’un troisième motif AGP est trouvé en C-terminal du domaine riche en Pro. EXT signifie que les motifs
de type EXT (Ser-Pron) sont présents en N-terminal du domaine riche en Pro.
c. Précipitation ou coloration avec le réactif β-glucosyl Yariv.
d. (4) signifie que seulement 4 résidus Cys au lieu des 6 habituellement conservés sont présents.

Page 37
Chapitre 1

Le domaine PAC est aussi présent dans d’autres protéines d’A. thaliana. En effet, 13
protéines ont en commun la présence d’un peptide signal prédit et de 6 Cys à des positions
conservées. Il s’agit d’At2g33790 (AGP30), At2g34700, At4g08685, At1g29140, At1g78040,
At5g10130, At5g45880, At4g18596, At5g05500, At3g09925, At5g54855, At5g15780 et
At2g16630.

AGP30 intervient dans la régénération des racines in vitro et détermine le moment de la


germination des graines (Van Hengel et Roberts, 2003). Le mutant agp30 n’est pas sensible à
l’acide abscissique (ABA) et présente des modifications de l’expression de gènes régulés par
l’ABA. Il a été suggéré qu’AGP30 pourrait médier la réponse à l’ABA. L’analyse de
l’expression d’AGP30 en regardant la localisation d’une protéine de fusion AGP30-GFP et
par des immunolocalisations a montré la présence d’AGP30 dans les atrichoblastes et les
cellules épidermiques qui se différencient à partir de ceux-ci dans les racines (Van Hengel et
al., 2004). AGP30 pourrait contribuer à la rigidification de leurs parois de concert avec PRP3.

At2g34700 ne comporte que le domaine PAC. Des expériences d’hybridation in situ ont
montré que At2g34700 est exprimé seulement dans le tégument extérieur de l’inflorescence et
pourrait intervenir dans l’expansion cellulaire et la maturation de ces téguments (Skinner et
Gasser, 2009).

A l’exception de NaPRP4 dont la O-glycosylation a été caractérisée (Sommer-Knudsen et


al., 1996), les protéines homologues à AGP31 n’ont pas encore été décrites au niveau
structural et leurs interactions avec des polysaccharides pariétaux n’ont pas été étudiées. En
utilisant des techniques de microscopie, il a été montré que TTS-1, TTS-2 et DcAGP1 ont une
forme ellipsoïdale et s’auto-assemblent en structures d'ordre supérieur (Baldwin et al., 2000;
2001; Wu et al., 2001). La déglycosylation des protéines TTS-1 et -2 perturbe leurs capacités
d’auto-assemblage, suggérant une régulation de cet auto-assemblage par le niveau de O-
glycosylation (Wu et al., 1995).

Plusieurs protéines homologues à AGP31 sont présentes dans les tissus de transmission du
pistil et le tube pollinique et semblent stimuler la croissance du tube pollinique (Wu et al.,
2001; Twomey et al., 2013). Les transcrits de PvPRP1 s’accumulent dans des organes tels que
les hypocotyles, les racines et les jeunes feuilles (Sheng et al., 1991). GhAGP31 semble
impliquée dans la réponse au stress froid (Gong et al., 2012). L’ensemble de ces résultats
suggère que les protéines de la famille d’AGP31 pourraient contribuer au renforcement des
parois dans des tissus en croissance rapide et/ou soumis à des stress.

1.5. Les objectifs de la thèse

Les parois cellulaires végétales contiennent une grande variété de macromolécules formant
des réseaux complexes organisés en une architecture supramoléculaire. Nous nous intéressons
à la place particulière de protéines riches en Pro/Hyp dans ces réseaux et à la recherche de
leurs partenaires dans les parois. Répondre à ces questions est un vrai défi pour mieux

Page 38
Chapitre 1

comprendre l'architecture et la dynamique de la paroi cellulaire végétale. Deux familles de


protéines ont été plus particulièrement étudiées : (i) les protéines de type LRX, en particulier
la protéine lrx1 qui joue un rôle dans la formation des poils racinaires, et (ii) les protéines à
domaine PAC.

Trois axes de recherche ont été développés dans ce travail de thèse :

- La recherche de protéines pouvant jouer un rôle dans la formation des poils absorbants
racinaires. Il s’agissait de réaliser une analyse comparative de protéomes pariétaux de plantes
sauvages et du mutant lrx1 affecté dans la morphologie des poils absorbants. Ces travaux sont
décrits dans le chapitre 3 et font l’objet d’un article soumis pour publication.

- L’identification de protéines à domaine PAC dans le règne végétal et l’analyse


phylogénique pour comprendre l’évolution de leur organisation et de leur rôle en lien avec
l’évolution de la composition et de la structure des parois. L’ensemble des résultats ainsi
obtenus est présenté dans le chapitre 4.

- La recherche de la spécificité d’interaction de domaines PAC avec des polysaccharides


pariétaux in vitro. Différents domaines PAC d’A. thaliana, de B. distachyon et de P. patens
ont été produits dans des systèmes procaryotes et eucaryotes et testés avec des extraits
enrichis en certains polysaccharides pariétaux ou avec des polysaccharides purifiés. Ces
résultats sont décrits dans le chapitre 5.

Page 39
Chapitre 2

2. MATERIELS ET METHODES
2.1. Matériel

2.1.1. Matériel végétal

2.1.1.1. Plantes

Arabidopsis thaliana
Nous avons utilisé des plantes sauvages d’A. thaliana Col-0 (Columbia) et des plantes
mutantes lrx1 qui avaient été caractérisées par Christophe Ringli (Université de Zurich). Des
lignées transgéniques dans un fond génétique Col-0 ont également été utilisées. Il s'agit de
lignées ayant intégré dans leur génome des constructions promoteur des gènes candidats
spécifiques aux poils absorbants::gènes rapporteurs (GFP et GUS) qui ont été obtenues au
laboratoire par David Roujol.

Nicotiana benthamiana
Les expériences de production transitoire de protéines à domaine PAC dans un système
eucaryote ont été réalisées sur N. benthamiana à un stade de 5-6 feuilles (30 à 35 jours après
le semis des graines).

Physcomitrella patens
Nous avons extrait les ARN totaux de Physcomitrella patens pour réaliser une construction
afin de produire une protéine à domaine PAC dans des cellules procaryotes.

Brachypodium distachyon
Deux constructions ont été réalisées à partir d’ARNm extraits de jeunes feuilles de
Brachypodium distachyon.

2.1.1.2. Conditions de culture

2.1.1.2.1. Conditions de culture d’A. thaliana

Conditions de culture hydroponique

Stérilisation des graines


Pour la culture in vitro d’A. thaliana, un maximum de 50 µL de graines placées dans un
tube Eppendorf sont stérilisées par trois fois 1 mL d'eau de javel à 0,4% de chlore actif dans
l’éthanol 80% et contenant du Triton X-100 à 0,05%. Les graines sont ensuite rincées deux
fois avec 1 mL d’éthanol à 96%. Après le dernier rinçage, les graines sont séchées pendant 1
h sous hotte à flux laminaire avant leur utilisation.

Page 40
Chapitre 2

Milieu de culture in vitro


Les graines d’A. thaliana stériles sont semées sur milieu Murashige et Skoog (MS), 0,8%
d’agar, pH 5,7, additionné de 1% de saccharose. Pour préparer 1 L de milieu, 4,4 g de poudre
MS incluant les vitamines (Sigma M5519), additionné de 10 g de saccharose sont dissous
dans de l'eau UHQ. Puis le pH est ajusté à 5,7 avec du KOH à 0,1 N. Enfin, 8 g d’agar
(Sigma A1296) sont ajoutés.

Cultures in vitro
Les graines stérilisées sont semées dans des boîtes de Pétri carrées. Elles sont ensuite
placées à 4°C et à l’obscurité pendant 48 h pour lever la dormance et obtenir une germination
homogène et synchronisée. Enfin, elles sont placées dans une logette de culture à 22°C
lumière/20°C obscurité, à une humidité de 40%, et en conditions de jours longs (16 h
lumière/8 h obscurité) pendant 21 jours.

A B

Figure 2.1 : Plantules in vitro d’A. thaliana après 21 jours de germination


A. Sauvage. B. Mutant lrx1.

Cultures hydroponiques
Les plantules in vitro sont transférées après 21 jours de croissance sur des dispositifs de
cultures hydroponiques Araponics (http://www.araponics.com/). Nous avons utilisé la Flora
Series (FloraGro, FloraMicro, FloraBloom) de GHE (General Hydroponics Europe, Liège,
Belgique) pour la préparation de la solution nutritive. Pour préparer 2 L de solution, 1 mL de
FloraMicro, 1,6 mL de FloraGro et 1,4 mL de FloraBloom sont dilués dans de l'eau. La
solution nutritive est aérée grace à une pompe. Les plantes sont placées dans les conditions
suivantes : jours courts (9 h lumière/15 h obscurité), température contrôlée (22°C
lumière/20°C obscurité) et à une humidité de 70%. Les racines sont récoltées après 18 jours
de croissance et conservées à -80°C.

Page 41
Chapitre 2

A B

Figure 2.2 : Passage des plantules en culture hydroponique


A - Système de culture hydroponique B- Plante après 18 jours de croissance

Conditions de culture en terre

Semis des graines


Les graines d’A. thaliana sont directement semées sur des pastilles de tourbe Jiffy® (Jiffy
Products International AS) préalablement imbibées d’eau pendant 30 min environ. Les pots
sont recouverts d’un film en plastique afin de maintenir une atmosphère saturée en eau
pendant 8 à 10 jours. Après 20 à 30 jours, les plantules sont transplantées et cultivées dans des
pots sur du terreau Tref (Jiffy Products International AS).

Conditions en salle de culture


Les plantules et plantes d’A. thaliana sont cultivées en conditions de jours courts (9 h
lumière/ 15 h obscurité), de température contrôlée (22°C lumière/ 20°C obscurité), à une
humidité de 70% jusqu’à leur floraison. Elles sont ensuite transférées dans la serre.

Conditions en serre
La température de la serre est 20°C, la photopériode est 14 h lumière/10 h obscurité. Les
plantes sont cultivées dans la serre jusqu’à la récolte des graines.

Stockage des graines


Après la récolte, les graines sont conservées à 4°C jusqu’à leur utilisation.

2.1.1.2.2. Conditions de culture de N. benthamiana


Les graines de N. benthamiana sont d’abord semées sur terreau. Après 14 jours environ de
croissance, les plantules sont repiquées dans des pots sur du terreau Tref. Les plantules et
plantes de N. benthamiana sont cultivées dans les conditions suivantes : jours longs (16 h
lumière/8 h obscurité), température contrôlée (25°C lumière/22°C obscurité) et à une humidité
de 80%.

Page 42
Chapitre 2

2.1.1.2.3. Conditions de culture de Physcomitrella patens

Milieu de culture
Les spores et le tissu protonémal de P. patens sont cultivées sur milieu PpNH4 (Benito et
Rodriguez-Navarro, 2003), 0,7% d’agar, additionné d’ammonium tartrate à 0,5 mg/ml. Les
plantes entières de P. patens sont cultivées sur milieu PpNH4, 0,7% d’agar sans ammonium
tartrate.

Figure 2.3 : Tissu protonémal de P. patens 10 jours après ré-ensemencement

Préparation du milieu PpNH4


Les solutions ci-dessous sont préparées, autoclavées et conservées à 4 °C
Macro - éléments
Pour 100 mL de solution 100X:
Ca(NO3)2.4H2O 8g
MgSO4.7H2O 2,5 g
FeSO4.7H2O 0,125 g
Micro - éléments
Pour 100 mL de solution 1000X
CuSO4.5H2O 5,5 mg
ZnSO4.7H2O 5,5 mg
H3BO3 61,4 mg
MnCl2.4H2O 38,9 mg
CoCl2.6H2O 5,5 mg
KI 2,8 mg
Na2MoO4.2H2O 2,5 mg
Tampon phosphate
Pour 100 mL de solution 1000X
KH2PO4 25 g
pH 7 avec KOH
Ammonium tartrate
Pour 100 mL de solution 1M
MW = 194,15 19,415 g

Page 43
Chapitre 2

Pour préparer 500 mL de milieu solide, il faut 5 mL de solution macro-éléments 100X; 0,5
mL de solution micro-éléments 1000X; 0,5 mL de solution phosphate 1000X, 1,35 mL
d’ammonium tartrate 1 M et 3,5 g d’agar.

Culture in vitro
Les spores de P. patens sont ensemencées sur une boîte de culture recouverte de
cellophane en conditions stériles et sont laissées à pousser jusqu’à ce que les clones aient une
taille de ½ cm de diamètre. Les clones sont ensuite dissociés, homogénéisés et repiqués sur de
nouvelles boîtes. Après 10 jours, le tissu protonémal est collecté, rincé avec de l’eau stérile,
homogénéisé avec un homogénéiseur (Polytron PT1200) pour obtenir des fragments de 3 à 4
cellules et ré-ensemencé sur des boîtes Agar-PpNH4 recouvertes de cellophane additionnés de
céfotaxime à 0,2 mg/ml. Les boîtes sont entourées avec du sparadrap 3M Micropore™ (Ref
1530-0) et incubées dans les conditions suivantes : jours longs (16 h lumière/8 h obscurité),
température contrôlée (25°C lumière/22°C obscurité) et à une humidité de 80%.

2.1.2. Matériel bactérien

2.1.2.1. Plasmides et vecteurs de clonage

Le vecteur pBAD TOPO® (Invitrogen K4300-01)

Figure 2.4 : Carte du vecteur pBAD – TOPO


Les séquences d’intérêt sont sous le contrôle du promoteur araBAD (PBAD).
Ampicillin : gène de résistance à l’ampicilline.
araC : régulateur du promoteur PBAD
pBR322 ori : origine de réplication plasmidique de type pBR322

Page 44
Chapitre 2

Ce vecteur permet d’exprimer des protéines fusionnées en N-terminal à une étiquette EK et


en C-terminal à deux étiquettes (tags): épitope V5 et 6xHis. Les gènes hybrides comportant la
région codante EK site ::PAC::tag V5::6xHis sont sous la dépendance du promoteur araBAD,
assurant une expression très contrôlée et dose-dépendante en présence de L-arabinose. Ce
vecteur est utilisé pour sur-exprimer des protéines dans la souche Escherichia coli BL21-AI.
Les transformants sont sélectionnés par leur résistance à l’ampicilline (Figure 2.4).

Le vecteur pK7WG2D,1
Le vecteur binaire pK7WG2D,1 (http://gateway.psb.ugent.be/vector/show/pK7WG2D/)
(Karimi et al., 2002) (Figure 2.5), portant les constructions promoteur CaMV 35S::région
codante PAC::tag V5::6xHis est utilisé pour transformer la souche d’Agrobacterium
tumefaciens LBA4404 et sur-exprimer des protéines dans des feuilles de N. benthamiana. Il
contient également la cassette de sélection des plantes et des bactéries transformées conférant
la résistance à la kanamycine et à la spectinomycine respectivement.

Figure 2.5 : Carte du vecteur de destination pK7WG2D,1 utilisé pour la


surexpression des protéines
En rouge : la séquence qui va être remplacée, après la réaction LR, par les constructions contenant les
séquences codantes des protéines fusion.
attR1 et attR2 : sites de recombinaison
p35S : promoteur 35S du CaMV
T35S : terminateur 35S du CaMV
SpR : gène de résistance à la spectinomycine
Kan : gène de résistance à la kanamycine
RB et LB : bordures droite et gauche respectivement de l’ADN-T
EgfpER : partie de la construction permettant l’expression de la gfp (green fluorescent protein) sous contrôle
du promoteur rolD
Les sites de restriction uniques sont indiqués en gris

Page 45
Chapitre 2

Le vecteur pEAQ-HT-DEST1
Pour améliorer le rendement de production de protéines et faciliter la manipulation, les
constructions ont été transférées dans le vecteur binaire pEAQ-HT-DEST1 (Sainsbury et al.,
2009) qui comporte le gène codant la protéine p19 qui permet de limiter la co-suppression de
l’expression des gènes.

Figure 2.6 : Carte du vecteur de destination pEAQ-HT-DEST1 utilisé pour la


surexpression des protéines dans les feuilles de N. benthamiana
A. Représentation schématique de la région d'ADN-T des vecteurs pEAQ-HT. Les boîtes noires représentent
les bordures droite et gauche de l’ADN-T; les flèches vertes, les promoteurs; et les flèches rouges, les
terminateurs. B. Représentation schématique de la cassette d'expression du vecteur de destination pEAQ-HT-
DEST1. Les boîtes noires représentent des sites de recombinaison; la flèche verte, le promoteur; et la flèche
rouge, le terminateur. C. Carte de restriction du plasmide pEAQ

Page 46
Chapitre 2

Le vecteur pUNI 51
Nous avons commandé des clones d’E. coli contenant le vecteur pUNI 51 et l’ADNc
codant les protéines à domaine PAC d’A. thaliana à l’ABRC (Arabidopsis Biological
Resource Centre - https://abrc.osu.edu/).

Figure 2.7 : Carte du vecteur pUNI 51


A. Carte de restriction du vecteur pUNI 5Z : Kan : gène de résistance à la kanamycine, R6Kγ : origine de
réplication R6Kγ. B. Cassette de clonage (Le clonage est realisé entre les sites SfiI-A/SfiI-B)

2.1.2.2. Souches bactériennes


La souche d’E. coli PIR1
Cette souche est utilisée avec des vecteurs qui contiennent l'origine de réplication R6Kγ.
Le gène pir code pour la protéine de réplication π, qui est nécessaire pour maintenir et
répliquer des plasmides contenant l'origine R6Kγ (e.g. vecteur pUNI 51).

Page 47
Chapitre 2

La souche d’E. coli TOP10 (Invitrogen)


Cette souche est utilisée pour cloner, amplifier un plasmide ou exprimer une protéine
recombinante. Elle est déficiente dans la biosynthèse d’arabinose, et peut être utilisée en
combinaison avec des vecteurs de type pBAD présentant un promoteur araBAD dans le cas
d’une expression inductible au L-arabinose. Son génotype est le suivant: F- mcrA ∆
(mrrhsdRMS-mcrBC) φ80lacZ∆M15 ∆lacX74 recA1 araD139 ∆(ara-leu)7697 galU galK
rpsL (StrR) endA1 nupG.

La souche d’E. coli DH5α (Invitrogen)


Cette souche utilisée pour l'amplification des plasmides lors des clonages permet de limiter
les risques de recombinaison (recA1). Son génotype est le suivant: F- φ80lacZ∆M15
∆(lacZYA-argF)U169 recA1 endA1 hsdR17(rk-, mk+) phoA supE44thi-1 gyrA96 relA1 tonA.

La souche d’E. coli BL 21-AI (Invitrogen)


La souche E. coli BL21-AI ™ est dérivée de la souche BL21 (Grodberg et Dunn, 1988) ;
elle ne contient pas la protéase lon. Elle est également déficiente en protéase de la membrane
externe, OmpT. L'absence de ces protéases réduit la dégradation de protéines exprimées dans
cette souche. Elle est donc adaptée pour l’expression des protéines recombinantes. Son
génotype est le suivant: F- ompT hsdSB (rB-mB-) gal dcm araB::T7RNAPtetA.

La souche d’A. tumefaciens LBA4404


La souche LBA4404 contient un plasmide Ti (Tumor Inducing) pAL 4404 "désarmé", car
délété de ses gènes oncogènes, et ne porte que les gènes de virulence (vir) nécessaires au
transfert de l'ADN-T dans le génome de la cellule végétale (Hellens et al., 2000). Elle
présente une résistance à la rifampicine et la streptomycine. Cette souche a été utilisée pour la
transformation transitoire des cellules des feuilles de N. benthamiana.

La souche d’A. tumefaciens P19


Cette souche est utilisée associée à la souche LBA4404 pour augmenter la production de
protéines recombinantes en expression transitoire dans les feuilles de N. benthamiana. Le
suppresseur viral P19 a été choisi car il s’agit du suppresseur le mieux caractérisé
actuellement (Voinnet et al., 1999), les suppresseurs viraux étant connus pour augmenter la
productivité en protéines des feuilles agroinfiltrées (Voinnet et al., 2003).

Page 48
Chapitre 2

2.1.2.3. Conditions de culture


Les bactéries sont cultivées en boîtes de Pétri sur milieux gélosés ou en milieu liquide sous
agitation, à 37°C pour les souches d’E. coli et à 28°C pour les souches d’A .tumefaciens.

Milieu Luria-Bertani (LB)


Les souches bactériennes d’E. coli et d’A. tumefaciens sont cultivées sur milieu LB (10 g/L
tryptone, 5 g/L extrait de levures, 10 g/L NaCl, pH ajusté à 7 avec du NaOH) contenant 15
g/L d’agar (pour les cultures en boîte de Pétri) et les antibiotiques appropriés.
Milieu SOC (Super Optimal broth with Catabolic repressor)
Le milieu SOC est utilisé en incubation après un choc thermique dans les réactions de
transformation pour augmenter leur efficacité. Ce milieu contient : 2% de peptone, 0,5%
d’extrait de levures, 10 mM de NaCl, 2,5 mM de KCl, 10 mM de MgCl2, 10 mM de MgSO4,
20 mM de glucose.
Milieu 2xYT Broth (2x Yeast extract and Tryptone)
Pour produire les protéines recombinantes, les souches bactériennes d’E. coli sont cultivées
sur milieu 2xYT (16 g/L tryptone, 10 g/L extrait de levures, 5 g/L NaCl) incluant les
antibiotiques appropriés.
Milieu YEB (Yeast Extract Broth)
Ce milieu est utilisé pour la culture des agrobactéries. Il contient 0,5% d'extrait de boeuf,
0,1% d’extrait de levures, 0,1% de bacto-peptone et 0,5% de bacto-tryptone ainsi que 0,5% de
saccharose. Le pH est ajusté à 7,4, et après autoclavage, 1 mM de MgSO4 est ajouté.
Les différents milieux sont stérilisés par autoclavage à 120°C, 2 bars durant 30 min puis
additionnés d'antibiotique si nécessaire.

2.1.3. Antibiotiques
Différents antibiotiques ont été utilisés pour la sélection:
- Ampicilline à 100 µg/mL
- Streptomycine à 50 µg/mL ou 100 µg/mL
- Spectinomycine à 100 µg/mL
- Kanamycine à 25 µg/mL ou 50 µg/mL
- Rifampicine à 50 µg/mL
- Gentamycine à 10 µg/mL
- Céfotaxime à 200 µg/mL

Page 49
Chapitre 2

2.2. Méthodes

2.2.1. Expression des protéines recombinantes chez E. coli

2.2.1.1. Clonage dans le vecteur pBAD-TOPO


Pour les protéines à domaine PAC de P. patens et de B. distachyon, les ADNc sont
synthétisés à partir d’ARN totaux; pour les protéines à domaine PAC d’A. thaliana, nous
avons commandé les clones ADNc à l’ABRC. Les séquences codantes (CDS) ont ensuite été
amplifiés par PCR avant de réaliser une réaction de topo-clonage dans le vecteur pBAD-
TOPO pour ajouter un épitope V5 (possibilité de détecter les protéines par western blot avec
des anticorps commerciaux) et une séquence 6xHis en C-terminal (possibilité de purifier les
protéines par chromatographie d’affinité sur colonne de Nickel).

Nous mettons en place des constructions contenant un domaine PAC suivie de deux tags
épitope V5 et 6xHis. Pour préparer ces constructions, les CDS codant pour les PAC ont été
obtenus par PCR à partir des ADNc avec deux oligonucléotides adéquats (Tableaux 2.1 et
2.4). Les fragments obtenus à l’aide de la Pfu® DNA polymerase (Promega) ont été purifiés
avec le GeneJET™ PCR Purification Kit (Fermentas) et sont ensuite rallongés d’une adénine
en 3’ à l’aide de la GoTaq® Flexi DNA Polymerase (Promega) avant de cloner dans le
vecteur d’expression pBAD-TOPO (Invitrogen). Ceux obtenus à l’aide de la AccuPrime®
Taq DNA Polymerase (Invitrogen) sont clonés directement dans le vecteur d’expression
pBAD-TOPO (Invitrogen) grace à la topoisomérase I du virus Vaccinia lié au vecteur. Ces
constructions sont ensuite introduites dans des cellules compétentes E. coli TOP10
(Invitrogen) ou DH5α (Invitrogen) par choc thermique (pendant 30 s, à 42°C). La bonne
intégration des séquences et le cadre de lecture ouvert ont été confirmés par PCR et
séquençage effectué sur la plateforme Génomique et Transcriptomique (JeT,
http://get.genotoul.fr/).

Ensuite, nous avons transféré les constructions dans E. coli BL21-AI (Invitrogen) par choc
thermique (30 s, à 42°C) pour produire les protéines d’intérêt après induction par de
l’arabinose.

2.2.1.2. Production des protéines


Après incubation pendant une nuit à 37°C à partir de stocks en glycérol, les clones
bactériens contenant le vecteur d’expression pBAD-TOPO recombinant sont étalés sur
milieux agar avec ampiciline à 100 µg/mL en boîte de Pétri, puis mis en préculture une nuit à
37°C sous agitation à partir de quelques colonies dans 1 mL de milieu LB additionné
d’ampicilline à 100 µg/mL. Ces précultures permettent d’ensemencer des cultures de 100 mL
de milieu 2xYT additionné d’ampicilline à 100 µg/mL.

Page 50
Chapitre 2

Afin d’optimiser la production, différentes conditions d’expression ont été testées en jouant
sur différents paramètres au cours de l’induction : concentration en arabinose (0%, 0,2%,
0,5%), température (20°C, 28°C, 37°C) pendant 3 h sous agitation. L’inducteur est introduit
quand la DO600nm de culture est 0,7 environ.

2.2.2. Expression des protéines recombinantes chez N. benthamiana

2.2.2.1. Clonage dans les vecteurs binaires

Les constructions contenant un peptide signal et un domaine PAC suivie de deux tags
épitope V5 et 6xHis dans le vecteur pBAD-TOPO ont été réalisées de la même manière que
celle pour produire les protéines dans E. coli (cf § 2.2.1.1.). Ces constructions ont ensuite été
transférées dans E. coli TOP 10 et réalisées avec la technologie de Gateway® dans le vecteur
binaire pK7WG2D,1.

Nom de l'amorce Séquence (5' vers 3') Utilisation


pBAD-forward ATGCCATAGCATTTTTATCC Vérification des inserts dans
pBAD-reverse GATTTAATCTGTATCAGG le vecteur pBAD-TOPO
pDONR-forward TCGCGTTAACGCTAGCATGGATCTC Vérification des inserts dans
pDONR-reverse GTAACATCAGAGATTTTGAGACAC le vecteur pDONR 207
pUNI-51-forward CTGTTGGTGTGTCTATTAAATCG Vérification des inserts dans
pUNI-51-reverse TGGCTGGCAACTAGAAGGCAC le vecteur pUNI - 51
At2g34700-S1 ATGGGTCTGGTAACAAAAGCTCT
At2g34700-S2 GCTTCTCCAATGACTCCACC
At2g34700-R1 AAGAGCACAGGCAGGCTCA
Amplification des fragments
At5g05500-S1 ATGGACTCAAGAGCCTTACCCT d’intérêt pour les cloner dans
At5g05500-S2 GCTTACACTCCTCCTCCTCCTC le vecteur pBAD-TOPO. Les
paires d’amorces S1- R1 sont
At5g05500-R1 GTAAGTGGGTGGTGCAGTCG
utilisées pour amplifier les
At5g10130-S1 ATGGCTAAATCATTTGTACCTCTCAT séquences des protéines PAC
entières. Les paires
At5g10130-S2 GTTGGAACGCCATTCCAC
d’amorces S2 - R1 sont
At5g10130-R1 AATAGCCCGGTTATCGCC utilisées pour amplifier les
séquences de protéines PAC
At5g45880-S1 ATGGCTTCCAAAGCTATCTTCTTC
sans peptide signal.
At5g45880-S2 GATGCTGACGACTTCGATCG
At5g45880-R1 GAATGTTACGTCAGGGACAATACC
At1g28290-S2 TTCAACCGTAGTCTAGTCGCCG
Amplification des fragments
attB1-At2g34700 GGAGATAGAACCATGGGTCTGGTAACAAAAGCTCT
d’ADN d’intérêt pour les
cloner dans le vecteur
attB1-At5g05500 GGAGATAGAACCATGGACTCAAGAGCCTTACCCT
pDONR 207. Les paires
attB1-At5g10130 GGAGATAGAACCATGGCTAAATCATTTGTACCTCTCAT d’amorces attB1, 10-in-attB2
sont utilisées pour produire
attB1-At5g45880 GGAGATAGAACCATGGCTTCCAAAGCTATCTTCTTC
les produits PCR internes. La
10-int-attB2 CAAGAAAGCTGGGTCTCAATGGTGATGGTGATGATGA paire d’amorces universal

Page 51
Chapitre 2

GGGGACAAGTTTGTACAAAAAAGCAGGCTTCGAA attB1, universal-attB2 est


universal-attB1 GGAGATAGAACCATG utilisée pour obtenir les
universal-attB2 GGGGACCACTTTGTACAAGAAAGCTGGGTC produits PCR externes.
pEAQ_HT_DEST1_F2 GCTGATTGGTTCTATAAGAAATCTAGTATTTTC Vérification des inserts dans
pEAQ_HT_DEST1_R2 CGCTCACCAAACATAGAAATGC le vecteur pEAQ-HT-DEST1
pK7WG2D-F CGCACAATCCCACTATCCTT Vérification des inserts dans
pK7WG2D-R CCAAACGTAAAACGGCTTGT le vecteur pK7WG2D
Bradi5g04630-S2 GCGTCCGTCGTGGTCG
Bradi5g04630-R1 CGTGGCCGACGCGC
Bradi3g21000-S2 GCGTCGGTCGTCGTCG Amplification des séquences
Bradi3g21000-R1 GGTGGCTGATGCGCATACC codant des domaines PAC.
Pp1s79_182V6-S2 GAGGAGCAAGCATTTGCGC
Pp1s79_182V6-R1 CTTCGGCTTGGAGCAGAATTC

Tableau 2.1 : Amorces nucléotidiques utilisées pour les clonages.


F = forward = sens ; R = reverse = anti-sens

La technologie Gateway® est une méthode de clonage universelle basée sur les propriétés
de recombinaison site spécifique du bactériophage lambda pour permettre un transfert rapide
et efficace d’un gène d’une séquence d’ADN d’intérêt vers différents plasmides. Pour
exprimer un gène d'intérêt dans les plantes en utilisant la technologie Gateway®, il suffit de
cloner ce gène dans un vecteur d'entrée Gateway®, de transférer l’insert présent dans ce
vecteur d'entrée vers un vecteur de destination Gateway® en réalisant une réaction de
recombinaison et d’introduire cette construction dans des cellules végétales grâce à A.
tumefaciens afin de produire la protéine recombinante.

La Pfu® DNA polymerase (Promega), le GeneJET™ PCR Purification Kit (Fermentas), le


QIAEX II Gel Extraction Kit (QIAEX), le Gateway® BP Clonase™ II enzyme mix
(Invitrogen), le One Shot® TOP10 Chemically Competent E. coli Kit (Invitrogen), le
GeneJET™ Plasmid Miniprep Kit (Fermentas), le One Shot® MAX Efficiency® DH5α™-T1R
® ™
Competent Cells (Invitrogen), le Gateway LR Clonase II enzyme mix (Invitrogen) ont été
utilisés pour ce clonage.

Ensuite, nous avons transféré ces constructions dans A. tumefaciens LBA 4404 pour sur-
exprimer transitoirement les protéines dans N. benthamiana.

2.2.2.2. Transformation d’A. tumefaciens

Préparation d’agrobactéries chimiocompétentes


Quelques colonies d’A. tumefaciens sont inoculées dans du milieu LB liquide supplémenté
d’antibiotiques appropriés, et incubées à 28°C sous agitation pendant 1 nuit. Cette culture est
ensuite dosée au spectrophotomètre à 600 nm afin d’ajuster la DO finale à environ 0,75 (entre
0,5 et 1). Après une centrifugation de 6 min à 1000 g et à 4°C, le culot de 1,5 mL de culture

Page 52
Chapitre 2

est repris délicatement dans 100 µL de CaCl2 20 mM. Cette suspension bactérienne est
finalement utilisée pour la transformation ou congelée rapidement dans l’azote liquide et
stockée à -80°C jusqu’à son utilisation.

Transformation d’A. tumefaciens


L’ADN plasmidique est extrait en utilisant le kit d’extraction de plasmides GeneJET™
Plasmid Miniprep Kit (Fermentas). Un µg d’ADN plasmidique et 100 µL d’agrobactéries
compétentes sont mis en présence pendant 5 min dans la glace. Un double choc thermique (1
min dans l’azote liquide, puis 4 min à 37°C) achève la transformation. Un mL de LB est alors
ajouté, et la suspension est incubée à 28°C pendant 4 h sous agitation afin d’initier la
réplication du plasmide. Les bactéries sont ensuite étalées sur milieu LB gélosé contenant les
antibiotiques de sélection de la souche et l’antibiotique de sélection du plasmide recombinant
exogène, puis incubées à 28°C jusqu’à l’apparition des colonies (48 h environ).

Pour améliorer le rendement de production de protéines et faciliter la manipulation, ces


constructions ont ensuite été transférées dans le vecteur binaire pEAQ-HT-DEST1 qui
comporte le gène codant la protéine p19 permettant de limiter la co-suppression de
l’expression de gènes (Sainsbury et al., 2009). Ce travail a été principalement réalisé par
David Roujol, Martin Gonzalez et moi-même.

2.2.2.3. Transformations transitoires des cellules des feuilles de N. benthamiana


Les transformations sont dites transitoires lorsqu’elles n’affectent pas les cellules
reproductrices et le patrimoine héréditaire, l’ADN exogène introduit n’est donc pas transmis à
la descendance. Cette technique de transformation transitoire par A. tumefaciens consiste à
infiltrer des bactéries par les stomates de l’épiderme inférieur des feuilles de N. benthamiana.

Une culture de 100 mL d’A. tumefaciens LBA 4404 portant les constructions promoteur Ca
MV 35S::région codante PAC::tag V5::tag 6xHis dans le vecteur pK7WG2D,1 est
ensemencée à partir de quelques colonies bactériennes dans le milieu LB additionné
d’antibiotiques appropriés, et incubée pendant une nuit, à 28°C sous agitation. Une souche
d’agrobactérie P19 est mise en culture de la même manière. Après une sédimentation par une
centrifugation lente de 5 min à 4600 g à température ambiante, les culots sont lavés avec 20
mL d’agromix (MgCl2 10 mM; MES 10 mM, pH 5,6; acétosyringone 150 µM), puis
centrifugés 10 min à 4600 g. Chaque culot bactérien est finalement repris dans 20 mL
d’agromix. La suspension est dosée au spectrophotomètre à 600 nm afin d’ajuster la DO
finale à 0,7. Après avoir laissé reposer pendant 3 h à 28°C sous agitation, les deux cultures
sont mélangées (vol/vol) et infiltrées dans les feuilles à l’aide d’une seringue stérile de 1 mL
appliquée perpendiculairement contre la face inférieure de la feuille. Le tampon d’infiltration
utilisé place les bactéries dans des conditions iso-osmotiques et l’acétosyringone augmente la
virulence de la souche, réunissant ainsi des conditions propices à la transformation de cellules
végétales. Un échantillon de feuilles infiltrées est analysé après 60 h d’infiltration.

Page 53
Chapitre 2

L’expresion de protéines d’intérêt est vérifiée sous la loupe binoculaire en utilisant la GFP
présente dans le vecteur pK7WG2D,1.

Les A. tumefaciens LBA 4404 portant les constructions promoteur Ca MV 35S::région


codante PAC::tag V5::6xHis dans le vecteur pEAQ-HT-DEST1 sont transférées toutes seules
(pas de souche d’agrobactérie P19) dans des feuilles de N. benthamiana de la même manière.

2.2.3. Extraction de protéines totales


Les feuilles de N. benthamiana sont finement broyées dans un mortier à l’aide d’azote
liquide. On récupère 50 mg de poudre à laquelle on ajoute 200 µL (4 µL pour 1 mg de
poudre) de tampon d’extraction (urée 6 M, glycérol 10%, β-mercaptoéthanol 10%, SDS 5%).
L’échantillon est centrifugé brièvement à 18000 g pendant 15 min à 4°C. Ensuite, 42 µL de
surnageant sont dénaturés par 14 µL de tampon Laemmli 4X (250 mM Tris-HCl pH 6,8,
glycérol (vol/vol) 40%, β-mercaptoéthanol 20%, SDS 8% (p/v), bleu de Bromophénol 0,04%)
et déposés sur gel de polyacrylamide dénaturant. Cette méthode est très rapide et efficace pour
effectuer un contrôle qualitatif des protéines.

2.2.4. Extraction des protéines pariétales

Préparation de parois végétales


Une préparation de parois est réalisée en suivant le protocole décrit par Feiz et al. (Feiz et
al., 2006). Ce même protocole est adapté pour l’extraction des parois des racines d’A. thaliana
et des feuilles de N. benthamiana. Le matériel végétal est lavé sur tamis métallique (taille des
pores : 1 mm2) avec du tampon acétate de sodium 5 mM pH 4,6 (2 L de tampon pour 5 g de
matière fraîche), puis avec du tampon acétate de sodium 5 mM pH 4,6 / 0,4 M saccharose (0,3
L de tampon pour 5 g de matière fraîche). Il est ensuite transféré dans un mixer contenant du
tampon acétate de sodium 5 mM pH 4,6 / 0,4 M saccharose additionné de cocktail
d’inhibiteurs de protéases (Sigma, ref : P-9599) (1 mL pour 30 g de matière fraîche) et de
Polyclar (Sigma, ref : P-6755) (1 g pour 10 g de matière fraîche). La mixture est broyée en
chambre froide 8 fois 1 min, en effectuant des pauses de 30 s entre chaque cycle. Les parois
sont ensuite séparées du matériel cytoplasmique par centrifugation à 1000 g, pendant 15 min
et à 4°C. Le culot est récupéré, puis lavé successivement par du tampon acétate de sodium 5
mM pH 4,6 additionné de 0,6 M de saccharose puis à nouveau par ce même tampon
additionné de 1 M de saccharose. Après la dernière centrifugation, le culot est lavé sur tamis
de nylon (taille des pores : 25 µm2) avec du tampon acétate de sodium 5 mM pH 4,6 (2 L de
tampon pour 5 g de matière fraîche), puis broyé dans l’azote liquide à l’aide d’un mortier et
d’un pilon ou d’un broyeur à bille Dangoumeau (Prolabo, ref : 63749) afin d’obtenir une
poudre homogène qui est lyophilisée jusqu’à dessiccation complète (environ 48 h). Les parois
lyophilisées sont stockées à -20°C jusqu’à leur utilisation.

Page 54
Chapitre 2

Extraction des protéines pariétales


L’extraction de protéines pariétales est réalisée en suivant le protocole décrit par Irshad et
al. (Irshad et al., 2008). Les protéines sont solubilisées dans du tampon acétate de sodium 5
mM pH 4,6 / 0,2 M CaCl2 (10 mL pour 1 g de parois lyophilisées), auquel on ajoute 15 µL/g
de cocktail d’inhibiteurs de protéases (Sigma). Après avoir vortexé et laissé agir dans la glace
10 min environ, on centrifuge à 40000 g (18000 rpm), à 4°C pendant 15 min et le surnageant
est récupéré. Le culot obtenu est ensuite successivement repris par du tampon acétate de
sodium 5 mM pH 4,6 / 0,2 M CaCl2 (5 mL de tampon pour 1 g de parois), puis par du tampon
acétate de sodium 5 mM pH 4,6 / 4 M LiCl (5 mL de tampon pour 1 g de parois) en présence
de 10 µL/g de cocktail d’inhibiteurs de protéases et enfin par 5 mL/g de parois de ce même
tampon acétate à 2 M LiCl. Les surnageants contenant les protéines extraites sont récupérés à
chaque étape, puis ils sont rassemblés. Après filtration par seringue (Terumo Europe N.V.),
filtre 0,2 µm (Dominique Dutscher), dessalage sur colonne Econo-Pac 10DG (BIO-RAD) et
dosage de protéines, la solution protéique est concentrée par lyophilisation (lyophilisateur
Alpha 1-4 LSC CHRIST).

L’extraction des protéines pariétales a également été tentée avec d’autres tampons
d’extraction tels que: NaCl 1 M; EDTA 50 mM; tampon de Laemmli 1X (Tris 62,5 mM,
glycérol 10%, β-mercaptoéthanol 5%, SDS 2%, bleu de Bromophénol 0,01%) ou tampon
d’extraction des protéines totales (urée 6 M, glycérol 10%, β-mercaptoéthanol 0,5%, SDS
2%) pendant 1 h sous agitation.

2.2.5. Extraction des protéines recombinantes d’E. coli


Après surexpression des protéines recombinantes PAC/V5/6xHis, les culture bactériennes
de 400 mL sont centrifugées à 4000 g, pendant 10 min à 4°C. Les culots cellulaires sont repris
dans 15 mL de tampon de lyse (50 mM NaH2PO4, 500 mM NaCl, 10 mM imidazole, 1 mM
DTT, pH 8). Les cellules resuspendues sont soumises à une sonication dans la glace 8 x 15 s à
une intensité de 80% (sonicateur Bandelin Sonoplus – HD 2070 avec une sonde de diamètre 3
mm). Les lysats acellulaires sont centrifugés à 9000 g, pendant 20 min à 4°C. Les surnageants
obtenus constituent les fractions de protéines solubles qui contiennent les protéines d’intérêt.

2.2.6. Techniques d’analyse des protéines

2.2.6.1. Dosage des protéines


La quantité de protéines est estimée selon la méthode mise au point par Bradford (1976)
modifiée en utilisant le CooAssay Protein Determination Kit (Uptima) ou le Protein
Quantitation Kit (Interchim) contenant le réactif Coomassie protein assay reagent et la serum
albumine bovine (BSA) comme standard, selon les recommandations du fournisseur.

Page 55
Chapitre 2

2.2.6.2. Séparation et détection des protéines

Séparation des protéines par 1D-électrophorèse en gel de polyacrylamide en


conditions dénaturantes (1D-SDS-PAGE)

Préparation du gel de polyacrylamide


La séparation par 1D-SDS-PAGE (Sodium Dodecyl Sulfate - Polyacrylamide Gel
Electrophoresis) est réalisée à l’aide d’un gel de séparation à 12,5% ou à 14% d’acrylamide
(ratio 35 acrylamide : 1 bis-acrylamide). Un gel de concentration (stacking gel) à 4,0%
d’acrylamide est coulé au-dessus du gel de séparation pour permettre une entrée homogène de
l'échantillon dans le gel de séparation (Tableau 2.2). Des gels de taille de 10 x 12 x 0,15 cm
sont utilisés. Les échantillons de protéines à séparer sont dilués dans du tampon de Laemmli
puis dénaturés pendant 5 min à 100°C. En conditions non dénaturantes, les échantillons de
protéines sont dilués dans du tampon de charge en absence de β-mercaptoéthanol (agent
réducteur qui réduit les ponts disulfures) et de SDS (détergent anionique fort qui déplie les
chaînes polypeptidiques) et sont déposés sur gel sans chauffage préalable.

Gel de séparation Gel de


Solution
12,5% 14% concentration 4%
Acrylamide 40% 3,04 mL 3,27 mL 486 µL
Bis-Acrylamide 2% 1,67 mL 1,88 mL 268 µL
Tris-HCl 1,5 M pH 8,8 2,5 mL 2,5 mL -
Tris-HCl 1,25 M pH 6,8 - - 0,5 mL
SDS 10% (p/v) 100 µL 100 µL 50 µL
Eau UHQ 2,64 mL 2,2 mL 3,68 mL
Persulfate d’ammonium
50 µL 50 µL 25 µL
100 mg/mL
TEMED 5 µL 5 µL 5 µL
Total 10 mL 5 mL

Tableau 2.2 : Composition des gels de polyacrylamide-SDS utilisés pour la séparation


des protéines par 1D-SDS-PAGE

Séparation des protéines


L’électrophorèse est réalisée dans un tampon de migration (Tris 25 mM ; Glycine
192 mM ; SDS 0,1% p/v), à 30 mA et 500 V jusqu’à ce que le front de migration visualisé par
du bleu de Bromophénol arrive au bord du gel en utilisant un système d’électrophorèse Mini-
PROTEAN® System (BIO-RAD). Après séparation, les protéines peuvent être colorées ou

Page 56
Chapitre 2

transférées sur une membrane de nitrocellulose pour une immunodétection. En conditions non
dénaturantes, le SDS doit être enlevé du tampon de migration.

Coloration des protéines au bleu de Coomassie


Après 3 lavages de 5 min par de l’eau UHQ, le gel est coloré par le bleu de Coomassie
PageBlue™ Protein Staining Solution (Fermentas) une nuit sous agitation lente à température
ambiante. Le gel est ensuite décoloré par de l’eau UHQ pendant une journée sous agitation à
température ambiante et conservé à 4°C dans une solution d'acide acétique 1 %.

Coloration des protéines au nitrate d’argent


Le protocole de Shevchenko est utilisé (Shevchenko et al., 1996). Cette technique est
compatible avec des analyses en spectrométrie de masse. Elle est moins sensible que les
techniques utilisant la glutaraldéhyde, qui doit être évité lorsque l’on veut réaliser par la suite
des analyses par spectrométrie de masse.

Le gel de polyacrylamide est d’abord mis à tremper dans la solution de fixation (éthanol
45%, acide acétique 5%, H2O 55%) pendant 30 min. Après 3 rinçages de 10 min avec de
l’éthanol 30% et 3 rinçages de 10 min avec de l’eau UHQ, il est ensuite sensibilisé avec
0,02% de thiosulfate de sodium (Sigma) pendant 1 min. Après 2 rinçages avec de l’eau, le gel
est incubé dans une solution de nitrate d’argent 0,1% pendant 30 min à 4°C. La coloration est
développée avec la solution de développement (0,04% formadéhyde ; 0,2% Na2CO3) pendant
2 à 5 min environ. Lorsque la coloration est suffisante, la coloration est arrêtée avec une
solution d’acide acétique à 1%.

Electrotransfert des protéines


Après électrophorèse, les protéines sont électrotransférées sur membrane de nitrocellulose
(HybondTM-C Extra, Amersham Biosciences) afin de permettre une immunodétection des
protéines d’intérêt.

La membrane de nitrocellulose est équilibrée 10 min dans le tampon de transfert (48 mM


Tris ; 39 mM glycine ; SDS 0,0375% ; méthanol 20%). Après équilibration, les protéines du
gel sont alors électrotransférées dans un système semi-sec Trans-Blot SD Semi-Dry Transfer
Cell (BIO-RAD) pendant 1 h, sous voltage constant de 20 V, et à 800 mA constant.

Immunodétection des protéines recombinantes

Saturation de la membrane
Afin de saturer les sites de fixation non spécifiques, la membrane est placée dans une
solution de saturation composée de 10% de lait écrémé repris dans du tampon TBST (TBS
1X : 20 mM Tris-HCl pH 7,5, 150 mM NaCl additionné de 0,05% Tween 20) additionné de
0,02% d’azide de sodium sous agitation pendant une nuit à 4°C.

Page 57
Chapitre 2

Incubation de la membrane avec l’anticorps primaire


La membrane est rincée 3 fois 5 min dans du TBST, puis incubée dans la solution
d’anticorps primaire anti-V5 (Invitrogen) dilué à 1/10000ème dans du TBST-BSA 1% pendant
2 h à température ambiante.

Incubation de la membrane avec l’anticorps secondaire


Après 3 rinçages de 10 min dans du TBST, la membrane est incubée pendant 2 h à
température ambiante dans la solution d’anticorps secondaire anti-souris (Promega) (anticorps
dilué au 1/10000ème dans du TBST-BSA 1%) dirigé contre les immunoglobulines G de
l’anticorps primaire et couplé à la phosphatase alcaline.

Révélation
Après incubation avec l’anticorps secondaire, la membrane est rincée 3 fois 10 min avec
du tampon TBST. La présence de phosphatase alcaline est révélée par incubation de la
membrane avec un substrat chromogène spécifique : 5-bromo-4-chloro-3-indolyl phosphate
(BCIP) (Sigma) à 50 mg/mL et nitro bleu de tétrazolium (NBT) (Sigma) à 50 mg/mL dans du
DMF 70% (diméthylformamide). La révélation se fait par ajout de 33 µL de BCIP additionné
de 33 µL de NBT dans 10 mL de TBS à pH 9,5. Après révélation, la membrane est rincée
dans de l’eau UHQ, séchée et photographiée. Différents temps d’exposition sont réalisés
jusqu’à l’obtention de bandes d’intensité satisfaisante, mais non saturante.

Détection des glycoprotéines par lectin-blot


Les glycoprotéines fixées sur la membrane sont détectées par la lectine PNA (Peanut
Agglutinin) ou GNA (Galanthus nivalis lectin) en utilisant le kit DIG Glycan Differentiation
Kit (Roche). Tous les réactifs utilisés sont fournis par le kit sauf le TBS 1X, le tampon 1 (TBS
1X, 1 mM MgCl2, 1 mM MnCl2, 1 mM CaCl2, pH 7,5) et le tampon 2 (0,1 M Tris, 0,1 M
NaCl, 0,05 M MgCl2, pH 9,5). Après transfert ou dépôt direct des échantillons sur la
membrane, celle-ci est bloquée pendant une nuit à 4°C sous agitation par environ 20 mL de
solution de blocage (Blocking reagent) fournie dans le kit. Les étapes suivantes se font à
température ambiante, sous agitation, dans les conditions préconisées par le fournisseur.
Après le blocage, la membrane est lavée 2 x 10 min dans du TBS 1X et 1 x 10 min dans le
tampon 1. La membrane est ensuite incubée pendant 1 h sous agitation par 10 mL de lectine
PNA ou GNA couplée à la digoxigénine (DIG) diluée au 1/100ème (cas de PNA) ou au
1/1000ème (cas de GNA) dans le tampon 1. Après incubation, la membrane est lavée 3 x 10
min dans environ 50 mL de TBS 1X, puis incubée 1 h dans 10 mL d’anticorps anti-DIG
couplé à la phosphatase alcaline dilué au 1/1000ème dans du TBS. La membrane est de
nouveau lavée 3 x 10 min dans environ 50 mL de TBS 1X. La révélation se fait par ajout de
200 µL de NBT/BCIP préparés extemporanément dans 10 mL de tampon 2. Après apparition
du signal (environ 3-5 min), la membrane est rincée à l’eau UHQ pour arrêter la réaction.

Page 58
Chapitre 2

2.2.6.3. Identification des protéines par spectrométrie de masse MALDI-TOF

Préparation des échantillons et digestion trypsique


Les bandes d’intérêt visualisées sur les gels de polyacrylamide sont excisées à l’aide d’une
pipette Pasteur ou d’un scalpel. Les morceaux de gel (3 par échantillon) sont ensuite lavés 2
fois 10 min par ajout de 100 µL d’une solution de 50% bicarbonate 25 mM, 50% acétonitrile,
puis séchés 20 min dans un SpeedVac SPD 111V (Thermo Scientific) à 45°C. Dix µL d’une
solution de trypsine (Promega) à 10 ng/µL sont ajoutés dans chaque tube. Les échantillons
sont ensuite placés à l’étuve à 37°C pour la nuit. Après digestion trypsique, 1 µL
d’acétonitrile est ajouté à chaque échantillon. Les échantillons sont ensuite vortexés 5 min,
puis soniqués pendant 5 min et centrifugés rapidement avant être déposés sur une plaque
d’analyse pour spectrométrie de masse (MALDI Sample plate SS, Applied Biosystems).

Analyse par spectrométrie de masse (SM) MALDI-TOF


Il s’agit d’un spectromètre de masse couplant une source d'ionisation laser assistée par une
matrice MALDI (Matrix-Assisted Laser Desorption/Ionisation) et un analyseur à temps de vol
TOF (Time-Of-Flight). Un volume de 1 µL d’échantillon issu de la digestion trypsique
additionné de 1 µL de matrice (6 mg/mL d’acide α-cyano-4-hydroxycinnamique dans
acétonitrile 50% ; additionné de 0,1% d’acide trifluoroacétique) est déposé par puits sur la
plaque d’analyse. Les analyses sont effectuées sur la plateforme de spectrométrie de masse de
l’IPBS (http://proteomique.ipbs.fr/plateforme/plateforme.htm) à l’aide d’un spectromètre de
masse MALDI-TOF (Voyager-DeTM STR, Applied Biosystems), en mode réflectron avec les
paramètres suivants: tension d’accélération 20 kV, tension de la grille 68%, délai 200 ns. Une
calibration externe est réalisée avec un mélange de peptides de masses mono-isotopiques
connues (Applied Biosystems). L’intervalle d’acquisition est de 700 à 4000 m/z. Les données
de SM MALDI-TOF sont ensuite traitées à l’aide du logiciel Data Explorer (Applied
Biosystems). Ensuite, nous effectuons l’identification des protéines en utilisant le serveur
ProteinProspector (http://prospector.ucsf.edu/prospector/mshome.htm). Les analyses de
modifications post-traductionnelles des protéines sont réalisées en utilisant ProTerNyc
(Albenne et al., 2009) (http://www.polebio.lrsv.ups-tlse.fr/ProTerNyc/).

2.2.6.4. Identification des protéines par Chomatographie liquide (LC) – MS/MS

Electrophorèse en gel de polyacrylamide pour l’analyse LC – MS/MS


Pour chaque répétition biologique, 40 µg de protéines pariétales sont déposées sur un gel
de polyacrylamide. Après une séparation courte (5 mm) par 1D-SDS-PAGE, et coloration au
bleu de Coomassie pendant 1 nuit suivie d’une décoloration dans l’eau UHQ (cf § 2.2.6.2.),
les pistes du gel sont découpées en morceaux de 2mm x 1 mm x 1,5 mm (Figure 2.8) qui sont
placés dans les puits d’une plaque 96 puits (ThermoFast 96 puits Low Profile non jupée,
Thermo Scientific, ref : AB-0700) (la plaque est percée pour être directement utilisée par le
robot de digestion). Les prélevements sont faits en duplicats : une plaque est envoyée à la

Page 59
Chapitre 2

plateforme d’analyse protéomique PAPPSO (http://pappso.inra.fr/) pour identification et


quantification des protéines. L’autre est stockée à 4°C au laboratoire.
découpes découpes découpes découpes découpes découpes

6
mm

Figure 2.8 : Découpe des échantillons pour analyse LC – MS/MS

Préparation des échantillons


La préparation des échantillons est réalisée sur la plateforme de protéomique PAPPSO
(http://pappso.inra.fr/). Les protéines contenues dans les morceaux de gels sont réduites et
alkylées à l’aide du robot ProGest (Genomic Solutions®). Le dépôt de trypsine et l’extraction
des peptides après digestion sont manuellement réalisés. Après digestion, les échantillons sont
séchés au SpeedVac jusqu’à évaporation complète.

Analyse par spectrométrie de masse LC – MS/MS


Les échantillons de peptides trypsiques sont repris dans 30 µL de tampon de reprise (2%
acétonitrile; 0,5% acide formique; 0,5% acide trifluoroacétique). La séparation
chromatographique se fait avec une nanoUPLC (nanoLC-Ultra 2D, Eksigent) sur une colonne
de 75 µm de diamètre à 300 nL/min. Le volume d’injection de nos échantillons est de 4 µL.
Le programme appliqué consiste en un gradient d’acétonitrile de 5 à 35% en 28 min, puis de
35 à 95% d’acétonitrile en 3 min et enfin 95% pendant 5 min.

Après séparation, les échantillons sont injectés dans le spectromètre de masse Orbitrap, Q
ExactiveTM (ThermoFinnigan). Cet appareil utilise une fragmentation de type HCD (Higher-
energy collisional dissociation).

Identification et paramétrage des données MS-MS


!Xtandem (http://www.thegpm.org/tandem/index.html) est utilisé pour l’identification des
protéines et !Xtandem Pipeline est utilisé pour le traitement des données MS. Les principaux
paramètres pour l’identification sont le clivage tryptique obligatoire et un clivage manquant
autorisé par peptide. La banque de données utilisée est Tair10.fasta (banque de données issue
de http://www.arabidopsis.org/). Les contaminants usuels sont éliminés à l’aide d’une banque
dédiée disponible sur la plateforme PAPPSO. Lors de l’identification des protéines, seules les
protéines indentifiées par au moins deux peptides spécifiques sont sélectionnées.

Analyses des résultats


Les résultats finaux sont rassemblés à l’aide du logiciel Microsoft Office Excel. Nous
avons validé des protéines qui ont au moins deux peptides spécifiques dans un échantillon et
sont identifiées dans au moins deux répétitions biologiques.

Page 60
Chapitre 2

2.2.6.5. Egalisation des protéines par la technologie ProteoMiner™


La technologie ProteoMiner™ (BIO-RAD) a été employée. Il s’agit d’une méthode de
préparation d'échantillon permettant de réduire la gamme dynamique des protéines dans des
échantillons complexes. La présence de protéines abondantes dans des échantillons
biologiques complexes rend la détection de protéines faiblement abondantes extrêmement
difficile. Le kit d’égalisation ProteoMiner™ permet de réduire la concentration des protéines
les plus abondantes, ce qui permet d’enrichir en protéines faiblement concentrées et d’ainsi
élargir la connaissance du protéome.

La technologie ProteoMiner™ est basée sur l'interaction des échantillons de protéines


complexes avec une bibliothèque d’hexapeptides de grande diversité liés sur un support
chromatographique. En théorie, chaque hexapeptide se lie uniquement à une protéine.
Puisque la capacité des billes limite la capacité de liaison, les protéines abondantes saturent
rapidement leurs ligands et les protéines en excès ne se fixent plus. En revanche, les
protéines peu abondantes sont concentrées sur leurs ligands spécifiques. Cela permet de
réduire la gamme dynamique en protéines tout en maintenant les représentants de toutes les
protéines dans l'échantillon d'origine (http://www.bio-rad.com/).

Préparation des billes ProteoMiner™


Un volume (vol) des billes ProteoMiner™ est d’abord rehydraté dans au moins 20 vol de
billes d’éthanol 10% sous agitation pendant 15 min. Les billes sont ensuite equilibrées par 10
vol de tampon PBS 10X (1,4 M NaCl, 27 mM KCl, 100 mM Na2HPO4, 20 mM KH2PO4, pH
7,4) pendant 15 min, puis équilibrées 2 fois 15 min par 10 vol de tampon PBS 1X. Après
centrifugation pour éliminer le surnageant, un vol de tampon PBS 1X est ajouté pour obtenir
une suspension à 50% de billes. Cette suspension 50% est utilisée pour traiter les
échantillons.

Traitement par ProteoMiner™


Environ 1 mg de protéines pariétales de racines d’A. thaliana sauvage et mutante solubilisé
dans 75 µL de tampon PBS est chargé sur une colonne de 5 µL de billes (la capacité des billes
est de 10 mg/mL, nous avons surchargé 20X). Les protéines sont fixées sur les billes pendant
4,5 h à 4°C sous agitation. Les protéines non fixées sont récupérées par centrifugation 1000 g,
5 min et à 4°C. Les billes sont lavées par 3 fois 50 µL de PBS avant d’éluer les protéines avec
40 µL de tampon de Laemmli à 95°C pendant 4 min.

2.2.6.6. Analyse de profil d’expession des protéines


Nous avons effectué des recherches de profil d’expression dans les racines des gènes
codant pour des protéines trouvées spécifiquement dans le sauvage ou en plus grande quantité
dans le sauvage en utilisant le site www.bar.utoronto.ca/.

Page 61
Chapitre 2

2.2.7. Purification des protéines


Diverses techniques sont utilisées pour purifier les protéines d’intérêt, à savoir la
chromatographie d’échange d’ions, la chromatographie d’affinité sur colonne de Nickel
(NAC) ou encore la chromatographie d’affinité sur colonne d’anti-V5.

2.2.7.1. Purification par le système FPLC (Fast Protein Liquid Chromatography)


Un appareil de chromatographie automatisé (AKTA®, GE Healthcare) réfrigéré à 4°C est
utilisé. Il contient deux pompes permettant l’injection de tampon A (tampon d’équilibration et
de lavage) et de tampon B (tampon d’élution).

Chromatographie d’échange de cations (CEC)


La CEC est effectuée sur une colonne SP-sepharose, HiTrap (GE Healthcare, 1 mL) mise
en œuvre sur l’automate de chromatographie FPLC. La colonne est activée préalablement par
10 mL de tampon d’élution B (50 mM MES, 1,6 M NaCl, pH 5,6) à 1 mL/min, puis
équilibrée par 10 mL de tampon de charge A (50 mM MES, pH 5,6) à 1 mL/min. Pour les
protéines produites dans les feuilles de N. benthamiana, entre 1 et 2,2 mg de protéines
pariétales lyophilisées sont solubilisées dans du tampon de charge (1 g/10 mL). Pour les
protéines produites dans E. coli, l’extrait protéique soluble obtenu à partir de 400 mL de
culture bactérienne (cf § 2.2.5.) est dilué 5X dans le tampon A. Elles sont ensuite déposées à
un débit de 0,5 mL/min sur la colonne et l’effluent est récupéré. Après lavage avec 3 mL de
tampon A à un débit de 1 mL/min, l’élution est réalisée par un gradient continu de 0 à 50% de
tampon d’élution, à 1 mL/min pendant 24 min, suivi d’un palier à 50% de tampon d’élution
pendant 3 min à 1 mL/min puis de deux autres, l’un à 75% et l’autre à 100% de tampon B
réalisés pendant 3 min chacun à 1 mL/min. Les fractions d’élution de 1 mL sont collectées
puis rassemblées par 3. Un aliquot de chaque mélange de fractions est prélevé pour le dosage
des protéines et leur analyse par dot-blot (Bio-DotTM Apparatus, BIO-RAD). Le reste des
mélanges contenant la protéine d’intérêt est dilué dans du tampon adéquat pour la deuxième
étape de purification de protéines.

Chromatographie d’échange d’anions (CEA)


La CEA est effectuée sur une colonne Q-sepharose, HiTrap (GE Healthcare, 1 mL) mise en
œuvre sur l’automate de chromatographie FPLC. La colonne est activée préalablement par 10
mL de tampon d’élution B (20 mM Bis-Tris, 1,6 M NaCl, pH 6,5) à 1 mL/min, puis équilibrée
par 10 mL de tampon de charge A (20 mM Bis-Tris, pH 6,5) à 1 mL/min. 2,2 mg de protéines
pariétales lyophilisées solubilisées dans 22 mL de tampon de charge sont déposées sur la
colonne. Le programme chromatographique utilisé est le même que celui mis en œuvre pour
la CEC (voir paragraphe précédent).

Page 62
Chapitre 2

Purification des protéines par chromatographie sur colonne de Nickel


La NAC est mise en œuvre en première étape avec une colonne HisTrap FF crude de 1 mL
(GE Healthcare) en utilisant l’étiquette 6xHis. La colonne est équilibrée par le tampon A (20
mM Na2HPO4-NaH2PO4 pH 7,4, 500 mM NaCl, 50 mM imidazole). L’extrait protéique
soluble obtenu à partir de 400 mL de culture bactérienne (cf § 2.2.5.) dilué 3x dans le tampon
A est déposé sur la colonne (débit : 0,5 mL/min). Des lavages (10 vol de colonne) sont
effectués avec du tampon A contenant 50 mM d’imidazole pour éliminer les protéines fixées
de manière non spécifique. L’élution des protéines est effectué par gradient de 0% à 100% de
tampon B (tampon A additionné de 500 mM imidazole) en 15 min à 1 mL/min. Un aliquot de
chaque fraction d’élution est prélevé pour le dosage des protéines et la détection des protéines
en dot -blot. Le reste des fractions contenant la protéine d’intérêt est dilué dans du tampon
adéquat pour la deuxième étape de purification de protéines.

2.2.7.2. Chromatographie d’affinité sur colonne Ni-NTA à pression


atmosphérique
Le kit Ni-NTA fast start (QIAGEN) est utilisé. Les fractions d’intérêt issues de la
purification par chromatographie d’échange d’anions sont diluées 2 fois dans le tampon de
charge sans NaCl (50 mM NaH2PO4, 10 mM imidazole, pH 8) pour obtenir la condition
optimale, puis passées par gravité sur une colonne Ni-NTA de 0,5 mL. L’effluent est récupéré
et rechargé 3 fois sur le support. La colonne est ensuite lavée par 2 fois 4 mL de tampon de
lavage (50 mM NaH2PO4, 300 mM NaCl, 20 mM imidazole, pH 8). Enfin, l’élution est
réalisée par 4 fractions de 1 mL de tampon d’élution (50 mM NaH2PO4, 300 mM NaCl, 250
mM imidazole, pH 8).

2.2.7.3. Chromatographie d’affinité sur colonne d’anti-V5


Les anticorps anti-V5 ont été obtenus après injection du peptide V5 dans des lapins par la
société Millegen (Labège). Les immunoglobulines anti-V5 sont purifiées à partir du sérum de
ces lapins. Ces immunoglobulines anti-V5 sont ensuite fixées à un support
chromatographique afin de former un immuno-adsorbant, permettant de purifier les protéines
à domaines PAC recombinantes via leur épitope V5.

Purification des immunoglobulines d’un sérum de lapin


Le sérum de lapin est dilué au 1/10ème dans de l’eau UHQ avant précipitation des protéines
au sulfate d’ammonium. Une quantité de sulfate d’ammonium permettant une saturation de
40% est ajoutée au sérum dilué. Le pH de la solution est ajusté à 7 avec de l’ammoniaque, la
solution est ensuite placée sous agitation pendant 1 nuit à 4°C. La solution est centrifugée à
10000 g pendant 30 min à 4°C. Le culot, contenant les immunoglobulines, est lavé deux fois
avec une solution de sulfate d’ammonium 40%, puis dissous dans de l’eau UHQ (3 mL/200
mL de sérum dilué). Un dessalage pour changer le tampon est ensuite effectué sur colonne
Econo-Pac 10DG columns (BIO-RAD). Les immunoglobulines sont ainsi placées dans 4 mL

Page 63
Chapitre 2

de Binding Buffer (NaH2PO4/Na2HPO4 100mM, pH 7,2, NaCl 150mM) requis pour la


purification d’affinité sur colonne de protéine A.

La protéine A possède une grande affinité pour la partie Fc des immunoglobulines et


particulièrement celles des immunoglobulines G (IgG). La purification est réalisée en utilisant
le support PierceTM Chromatography Cartridges Protein A (Thermo Scientific). La colonne 1
mL de protéine A est équilibrée avec 10 mL de Binding Buffer. L’échantillon (4 mL),
contenant les immunoglobulines, est ensuite introduit dans la colonne à un débit de 1 mL/min.
La colonne est lavée avec 10 mL de Binding Buffer. Les immunoglobulines anti-V5 sont
éluées avec 4 mL de tampon d’élution (0,1 M glycine, pH 3 (HCl)), des fractions de 500 µL
sont collectées et neutralisées rapidement avec 50 µL de tampon de neutralisation (Tris-HCl 1
M, pH 8). La colonne est enfin régénérée par passage de 5 mL de tampon d’élution suivi de
10 mL de Binding Buffer. Les fractions d’élution sont dosées en mesurant la DO à 280 nm.
Les fractions contenant les immunoglobulines anti-V5 pures sont réunies et le volume ajusté
à 3 mL.

Greffage des immunoglobulines à un support chromatographique


Les immunoglobulines anti-V5 sont ensuite déssalés à l’aide des colonnes Econo-Pac
10DG contre un tampon MOPS (MOPS 100 mM, citrate de sodium 600 mM, pH 7,5) requis
pour la fixation sur un support chromatographique (UltraLink Biosupport, Thermo Scientific).
Les immunoglobulines anti-V5 sont fixées à des billes de bisacrylamide activées par un
groupement azlactone (125 mg de billes correspond à 1 mL de colonne et à environ 10 mg
d’IgG à fixer) (Figure 2.9) pendant 1 h sous agitation. Après fixation des immunoglobulines,
les groupements actifs non utilisés sont bloqués par passage d’une solution de saturation
(éthanolamine 3 M, pH 9). Les protéines fixées non spécifiquement sont éliminées par lavage
avec du NaCl 1 M.

Figure 2.9 : Représentation schématique du principe de fixation des


immunoglobulines sur le support UltraLink
Le support solide réagit très rapidement avec des nucléophiles via une réaction ouvrant le noyau aromatique
pour attacher le groupement amine du ligand par des liaisons covalentes.

Chromatographie d’affinité sur colonne d’anti-V5


Une chromatographie d’affinité sur colonne d’anti-V5 est réalisée avec le support immuno-
adsorbant préparé. Les fractions d’intérêt issues de la purification par chromatographie

Page 64
Chapitre 2

d’affinité sur colonne de Nickel sont diluées 2 fois dans le tampon PBS (140 mM NaCl, 2,7
mM KCl, 10 mM Na2HPO4, 2 mM KH2PO4, pH 7,4) pour obtenir la condition optimale, puis
passées par gravité sur la colonne d’anti-V5 de 0,5 mL. L’effluent est récupéré et rechargé 3
fois sur le support. La colonne est ensuite lavée par 10 mL de tampon PBS. Enfin l’élution est
réalisée par 6 fractions de 0,5 mL de tampon d’élution (100 mM acide citrique, pH 3). Les
fractions de 500 µL sont neutralisées rapidement avec 100 µL de solution de neutralisation
(Tris-HCl 1 M, pH 8,5).

2.2.7.4. Analyse des protéines par dot-blot


Une membrane de nitrocellulose est trempée dans du tampon TBST 1X 5 min et laissée
sécher pendant 30 min. Les solutions de protéines purifiées sont déposées (2 µL par dépôt) sur
la membrane grâce au système Bio-Dot (BIO-RAD) sous vide modéré. Après dépôt, on laisse
sécher la membrane 10 min. La membrane est ensuite saturée par une solution de saturation
composé de 10% de lait écrémé repris dans du tampon TBST pendant 1 nuit à 4°C sous
agitation. Suite à 3 lavages dans du TBST, la membrane est incubée dans 5 mL d’anticorps
primaire anti-V5 (Invitrogen) dilué au 1/10000ème dans du TBST-BSA 1% pendant 2 h sous
agitation douce. Les anticorps non fixés sont éliminés par 3 lavages dans du TBST avant
incubation dans 5 mL d’anticorps secondaire anti-souris (Promega) dilué au 1/10000ème dans
du TBST-BSA 1%. Après 2 h d’incubation sous agitation douce, les anticorps secondaires en
excès sont éliminés par 3 lavages dans du TBST avant d’être révélés par une solution de
révélation (16,5 µg/mL NBT; 16,5 µg/mL BCIP dans du TBS pH 9,5).

2.2.8. Tests d’interactions protéines/polysaccharides

2.2.8.1. Préparation des polysaccharides


Des solutions de polysaccharides commerciaux sont préparées (Tableau 2.3). Les poudres
sont diluées (concentration finale 10 mg/mL) dans de l’eau, sauf la cellulose qui est dissoute
dans du cadoxen, le mannane qui est dissout dans du NaOH 8% et le PGA d’orange (P2) qui
est dissoute dans du NaOH 1%.

Page 65
Chapitre 2

Nom
Nom Référence Origine
abrégé
Acide polygalacturonique
SIGMA P3850 P1 Agrume
(PGA)
PGA SIGMA P3889 P2 Orange
Pectine méthylée Fluka 76282 P3 Pomme
Megazyme
Galactane P5 Pomme de terre
P-GALPOT
Rhamnogalacturonane I Megazyme P-RHAM1 P6 Potato pectic fibre
Arabinogalactane Megazyme P-ARGAL P7 Bois de mélèze
Xyloglucane Megazyme P-WYGLN H1 Tamarin
Arabinoxylane Megazyme P-WAXYL H5 Blé
Mannane Megazyme P-MANIV H6 Ivory nut
Cellulose SIGMA C6413 C Coton
Pectines extraites Pectines extraites des parois de
de B. distachyon jeunes feuilles de B. distachyon
Pectines extraites Pectines extraites des parois de tissu
de P. patens protonémal de P. patens
Pectines extraites Pectines extraites des parois
d’A. thaliana d’hypocotyls d’A. thaliana
Hémicelluloses extraites Hémicelluloses extraites des parois
de B. distachyon de feuilles matures de B. distachyon
Hémicelluloses extraites Hémicelluloses extraites des parois
de P. patens de tissu protonémal de P. patens
Hémicelluloses extraites Hémicelluloses extraites des parois
d’A. thaliana d’hypocotyles d’A. thaliana
Cellulose extraite Cellulose extraite des parois de
de B. distachyon feuilles matures de B. distachyon
Cellulose extraite Cellulose extraite des parois de tissu
de P. patens protonémal de P. patens
Cellulose extraite Cellulose extraite des parois
d’A. thaliana d’hypocotyles d’A. thaliana

Tableau 2.3 : Polysaccharides utilisés pour les tests d’interaction


avec les protéines d’intérêt

Des polysaccharides pariétaux sont également extraites (Tableau 2.3). Le protocole


d’extraction a été mis au point d’après les publications de Moller et al. (2007) et Fry et al.
(2000). A partir de parois de jeunes feuilles de B. distachyon, d’hypocotyles étiolés d’A.

Page 66
Chapitre 2

thaliana ou de tissu protonémal de P. patens ayant subi une extraction des protéines par des
tampons contenant du CaCl2 0,2 M et du LiCl 4 M (Feiz et al., 2006), 50 mg de matière
fraîche sont pesés dans un tube Eppendorf. Trois cents µL de CDTA 50 mM (pH 7,5) sont
ajoutés et le mélange est laissé 1 h sous agitation. Après centrifugation 10 min à 2500 g, le
surnageant qui constitue la fraction enrichie en pectines est récupéré. De la même manière, à
partir du nouveau culot, les hémicelluloses sont extraites par 300 µL d’une solution de 4 M
NaOH additionnée de 1% NaBH4 (m/v). Enfin, à partir du dernier culot, la cellulose est
extraite par 300 µL de cadoxen (1,2-diaminoéthane 31% (vol/vol), 0,78 M oxyde de
cadmium).

2.2.8.2. Mise en œuvre des tests d’interaction sur membrane


Le protocole mis au point (Hijazi et al., 2014b) a été adapté de la publication de Moller et
al. (2007). Les solutions de sucre préparées sont déposées (2 µL par dépôt sauf cellulose : 0,5
µL) sur une membrane de nitrocellulose grâce au système Bio-Dot (BIO-RAD) sous vide
modéré. Après dépôt, on laisse sécher les membranes 10 min à température ambiante. Les
membranes sont ensuite saturées par de la BSA à 3% dans du tampon TBS pendant 1 h sous
agitation. Elles sont ensuite rincées dans du tampon TBS (3 fois 5 min). Les protéines
d’intérêt purifiées sont préparées à une concentration minimale finale de 7 µg/mL. Chaque
membrane est incubée avec 2 mL de solution de protéine dans du tampon TBS pendant une
nuit à 4°C sous agitation. Pour la révélation, suite à 3 lavages dans du TBS, les membranes
sont incubées dans 5 mL d’anticorps primaire anti-V5 (Invitrogen) dilué au 1/10000ème dans
du TBS-BSA 1% pendant 2 h sous agitation douce. Les anticorps non fixés sont éliminés par
3 lavages dans du TBS avant incubation dans 5 mL d’anticorps secondaire anti-souris
(Promega) dilué au 1/10000ème dans du TBS-BSA 1%. Après 2 h d’incubation sous agitation
douce, les anticorps secondaires en excès sont éliminés par 3 lavages successifs dans du TBS
avant d’être révélés par une solution de révélation (16,5 µg/mL NBT; 16,5 µg/mL BCIP dans
du TBS pH 9,5).
L’analyse des polysaccharides déposés est réalisée par immunodétection. Le protocole
suivi est le même que celui décrit ci-dessus excepté que la révélation est faite après saturation
et lavage des membranes avec des anticorps monoclonaux (PlantProbes, Leeds, UK) dilués au
1/40ème dans du TBS-BSA 1% : JIM5 (anti-homogalacturonanes), LM5 (anti-β-(1,4)-
galactanes), LM6 (anti-α-(1,5)-arabinanes), LM11 (anti-xylanes/arabinoxylanes), LM15 (anti-
xyloglucanes) et LM21 (anti-β-(1,4)-mannanes). La révélation se poursuit comme décrit ci-
dessus.

2.2.9. Analyse des transcrits

2.2.9.1. Extraction des ARN totaux


Les ARN totaux sont préparés à partir de tissu protonémal de P. patens ou de racines d’A.
thaliana en utilisant le kit SV Total RNA Isolation System (Promega), selon le protocole décrit
par le fournisseur. Le matériel végétal (A. thaliana et P. patens) est broyé dans un mortier en

Page 67
Chapitre 2

présence d’azote liquide. Environ 300 mg de poudre sont homogénéisés dans 1,75 mL de
tampon de lyse (4 M guanidine thiocyanate, 10 mM Tris, 0,97% β-mercaptoéthanol, pH 7,5),
puis dilués 3 fois dans le tampon de dilution, agités au vortex et centrifugés 10 min à 14000 g
pour éliminer les débris cellulaires. Après addition de 2 mL d’éthanol 95% et agitation, le
mélange est transféré dans des micro-colonnes équipées d’un filtre (Spin Column Assembly,
Promega) puis centrifugé 1 min à 13000 g ce qui permet de fixer les ARN sur la colonne. Les
ARN sont ensuite lavés avec de la solution de lavage (60 mM acétate de potassium, 10 mM
Tris, pH 7,5, 60% éthanol), puis traités avec le mix d’incubation DNase (40 µL de Yellow
Core Buffer, 5 µL de 0,09M MnCl2 et 5 µL de l’enzyme DNase I par échantillon) et
finalement élués avec de l’eau ultrapure stérile. La qualité des ARN totaux est contrôlée par
électrophorèse en gel d’agarose à 1% où les ARNr 25S et 18S apparaissent comme deux
bandes intenses. La bande correspondant aux ARNr 25S doit être approximativement deux
fois plus intense que celle correspondant aux ARNr 18S. La quantité d’ARN totaux est
évaluée par la mesure de l’absorbance d’une fraction de 1 µL au Nanodrop (Labtech
International Ltd). Le rapport de la mesure à des longueurs d’onde de 260 nm et 280 nm doit
être supérieur à 1,8 pour une bonne qualité de purification. Afin d’éliminer les éventuelles
traces d’ADN génomique qui parasiteraient les réactions PCR (Polymerase Chain Reaction),
les échantillons sont soumis à un traitement supplémentaire à la DNase I après recherche par
PCR d’éventuelles traces d’ADN résiduel.

2.2.9.2. Traitement DNase I


Le premier protocole utilisé est donné par le fournisseur du kit RQ1 RNase-Free DNase
(Promega). Aux ARN obtenus précédemment (4 µL correspondant à 1,2 µg) sont ajoutés 1 µL
de tampon 10X, 1,2 µL de DNase I (1 U/µL) et 3,8 µL d’eau UHQ stérile. Le mélange ainsi
obtenu est placé 30 min à 37°C. Après ce traitement, l’enzyme est inactivée par addition de 1
µL de solution DNase Stop Solution et incubation pendant 10 min à 65°C. L’efficacité du
traitement a été vérifiée en comparant les résultats d’amplification des acides nucléiques entre
l’échantillon traité d’ARN par la DNase I et un extrait d’ADN génomique.

Le deuxième protocole utilisé est donné par le fournisseur du kit TURBO DNA –freeTM Kit
(Ambion). Aux ARN obtenus précédemment sont ajoutés du tampon TURBO DNase buffer
10X et 1 µL de DNase. Le mélange ainsi obtenu est incubé 30 min à 37°C. Après ce
traitement, l’enzyme est inactivée par addition de la suspension de micro-billes DNase
Inactivation Reagent et incubation pendant 5 min à température ambiante. Après une
centrifigation de 1,5 min à température ambiante, le surnageant contenant les ARN est prélevé
et conservé à -80°C jusqu’à l’utilisation. L’efficacité du traitement a été vérifiée en comparant
les résultats d’amplification des acides nucléiques entre l’échantillon traité d’ARN par la
DNase et un extrait d’ADN génomique.

Page 68
Chapitre 2

2.2.9.3. Réaction de transcription inverse (RT)


Le kit High-Capacity cDNA Reverse Transcription Kit (Applied Biosystems) est utilisé
pour A. thaliana et B. distachyon. Entre 0,5 µg et 2 µg d’ARN totaux, sont rétrotranscrits
selon le protocole décrit par le fournisseur. Les ARN totaux sont rétrotranscrits grâce à
l’action d’une enzyme multifonctionnelle, la transcriptase inverse. Dix µL de 2X RT Master
Mix (2 µL de tampon RT 10X, 0,8 µL de dNTP à 100 mM, 2 µL de RT Random Primers
10X, 1 µL d’enzyme transcriptase inverse, 1 µL d’inhibiteur RNase, 3,2 µM d’eau Nuclease-
free) sont mixés avec 10 µL d’ARN à 50 - 200 ng/µL. Le mélange réactionnel est incubé 10
min à 25°C, puis est incubé 120 min à 37°C. L’enzyme est inactivée par chauffage à 85°C
durant 5 min. Une fraction de la réaction est ensuite utilisée pour analyser par PCR la quantité
de transcrits des gènes d’intérêt avec les deux amorces adéquates (Tableau 2.4), le reste est
conservé à -20°C. L’amorce Oligo (dT)15 est également testé de la même manière en mettant
2 µL d’amorce oligo (dT)15 à 500 µg/mL (Promega) à la place de RT Random Primers 10X.

Les amorces sont désignées en utilisant ProbeFinder (http://qpcr.probefinder.com/) ou/et


Primer3 (http://bioinfo.ut.ee/primer3-0.4.0/primer3/). Elles sont ensuite vérifiées par
OligoAnalyzer 3.1 (http://eu.idtdna.com/calc/analyzer).

La synthèse d’ADNc (1er brin) de P. patens est réalisée à l’aide de la Reverse Transcriptase
Superscript II (Invitrogen). Un tube Eppendorf 1,5 ml stérile contenant 13 µL de mélange (9,3
µL de solution d’ARN totaux traités à la DNase, 1 µL d’Oligo (dT)15 primer à 500µg/ml
(Promega, ref : C1101), 1 µL de dNTP mix à 10 mM chaque, 1,7 µL de DMSO pur) est
chauffé pendant 10 min à 70°C afin de dénaturer les ARN et est mis immédiatement dans la
glace. Il est ensuite incubé pendant 2 min à 40°C après avoir rajouté 4 µL de 5X First Strand
Buffer (Invitrogen), 2 µL de DTT à 0,1 M (Invitrogen) et 1 µL de RNasin Plus RNase
Inhibitor à 40 u/µl (Promega, ref : 2611). Après avoir rajouté dans le tube 1 µL de Super
Script II Reverse Transcriptase à 200 u/µl (Invitrogen, ref : 18064), le mélange réactionnel est
incubé 1 h au bain-marie à 40°C. L’enzyme est dénaturée par chauffage pendant 15 min à
70°C. Une fraction de la réaction est ensuite utilisée pour analyser par PCR la quantité de
transcrits des gènes d’intérêt avec les deux oligonucléotides adéquats (Tableau 2.4), le reste
est conservé à -20°C.

Page 69
Chapitre 2

Nom de l'amorce Séquence (5' vers 3') Fragment amplifié


LRX_1_Q-PCR_F CGATGCCAAGCGTCTCATA Amplicons de 106 pb en 3’ du transcrit du
LRX_1_Q-PCR_R GTAGTCTCGTTAATCATAAGGCAATG gène At1g12040 (LRX1)
LRX_2_Q-PCR_F TCAGGCCTTGACGGATTTT Amplicons de 110 pb en 5’ du transcrit du
LRX_2_Q-PCR_R TCATCATCATCATCATCTCCTCTAA gène At1g62440 (LRX2)
LRX_1_Q-PCR_F2 CAACCGATTCGTCGGTAAGT Amplicons de 77 pb en 5’ du transcrit du
LRX_1_Q-PCR_R2 CGTTGTAGCGGAGATCCAAG gène At1g12040 (LRX1)
LRX_2_Q-PCR_F2 CACCACCACTATCACCACCA Amplicons de 184 pb en 3’ du transcrit du
LRX_2_Q-PCR_R2 TCCCTTGGTGAAGGAGTTTG gène At1g62440 (LRX2)
criblage_mutant_LRX1_F TCACGTTTAACCGCATGAAG Séquences de 584 pb autour de
criblage_mutant_LRX1_R AGCTGCGCATATAGGAGGAC l’insertion/excision du gène At1g12040
criblage_mutant_LRX2_F TCGGTACAACGAGTTTGAAGG Séquences de 849 pb autour de
criblage_mutant_LRX2_R GGAGGAGGATACGCCTTGAC l’insertion/excision du gène At1g62440
Actine 8-F CACCCGAGAGGAAGTACAGTG Séquences de 93 pb (ADNc)/199 pb (ADN
Actine 8-R CATACTCTGCCTTAGAGATCCACA génomique) du gène At1g49240
CDS-At1g80240-F1 ATGATGTACCAAGAAGCAGCACTCCTC
Séquences de 1277 pb du gène At1g80240
CDS-At1g80240-R1 TCCTCGGAGTTTCCCAACCGC
Bradi5g04630-S2 GCGTCCGTCGTGGTCG Séquences de 363 pb (ADNc)/460 pb
Bradi5g04630-R1 CGTGGCCGACGCGC (ADN génomique) du gène Bradi5g04630
Bradi3g21000-S2 GCGTCGGTCGTCGTCG Séquences de 345 pb (ADNc)/457 pb
Bradi3g21000-R1 GGTGGCTGATGCGCATACC (ADN génomique) du gène Bradi3g21000
Pp1s79_182V6-S2 GAGGAGCAAGCATTTGCGC Séquences de 426 pb (ADNc)/604 pb
Pp1s79_182V6-R1 CTTCGGCTTGGAGCAGAATTC (ADN génomique) du gène Pp1s79_182V6

Tableau 2.4 : Amorces oligonucléotidiques utilisées pour l'analyse des transcrits

2.2.9.4. Réaction de polymérisation en chaîne (PCR)


La technique de PCR décrite par Saiki et al. (Saiki et al., 1985) permet d’amplifier des
séquences d’ADN grâce à plusieurs cycles d’amplification comprenant trois étapes : la
dénaturation thermique de l’ADN matriciel bicaténaire, l’hybridation des amorces sur l’ADN
matriciel, et la synthèse, à partir des amorces, d’ADN complémentaire grâce à une ADN
polymérase thermo résistante. Les réactions de PCR sont réalisées dans un mélange
réactionnel de 25 µL ou 50 µL comprenant le tampon de l’ADN polymérase, une
combinaison de deux amorces (0,2 µM chaque) encadrant la séquence d'intérêt, les dNTP (0,2
mM chaque) et 1 U d’ADN polymérase (GoTaq® DNA Polymerase ou Pfu DNA polymerase,
Promega). Les différents couples d’amorces utilisés au cours de cette étude sont présentés
dans les tableaux 2.1 et 2.4. Les réactions d’amplification sont réalisées dans un
thermocycleur (GeneAmp® PCR System 9700, Applied Biosystems ou MyCycler™ Thermal
Cycler, BIO-RAD). Les échantillons sont soumis à une dénaturation préalable à 95°C pendant
2-5 min, puis à plusieurs cycles d’amplification comprenant une étape de dénaturation à 95°C
pendant 1 min, une étape d’hybridation des amorces sur la matrice à la température adéquate
pendant 1 min, et une étape de synthèse d'ADN à 72°C dont la durée varie en fonction de la

Page 70
Chapitre 2

taille du fragment à amplifier et du type d’enzyme utilisé. Une extension finale à 72°C
pendant 5 min termine le programme de PCR.

2.2.9.5. Analyse par restriction


Les cartes de restriction de séquences codantes des protéines PAC ont été analysées en
utilisant NEBcutter V2.0 (http://nc2.neb.com/NEBcutter2/). Les enzymes de restriction Hind
III (Promoga) et EcoR I (Promoga) sont utilisées. Entre 160 ng et 240 ng d’ADN plasmidique
purifié sont digérés pendant 2,5 h à 37°C selon le protocole décrit par le fournisseur. Les
digests ensuite sont analysés par électrophorèse en gel d’agarose 1% dans du tampon TAE
0,5X (20 mM Tris-Acétate, 0,5 mM EDTA).

2.2.9.6. Séquençage
400 ng ADN plasmidique ou 40 ng de produits PCR purifiés par échantillon dans un
volume final de 8 µL additionné de 0,5 µL d’amorce à 10µM sont envoyés à la plateforme
Génomique et Transcriptomique (JeT, http://get.genotoul.fr/) pour séquençage. Après
séquençage, les séquences brutes ont été vérifiées en comparant avec les chromatogrammes
visualiés par logiciel BioEdit (Biological Sequence Alignment Editor). Les séquences brutes
obtenues à l’aide d’amorces anti-sens ont été au préalable inversées en utilisant Manipulate
and Display a DNA Sequence (http://www.vivo.colostate.edu/molkit/manip/) ou DNA Reverse
and Complementary Sequence Generator
(http://www.bugaco.com/calculators/dna_reverse_complement.php). Elles ont ensuite été
alignées avec la séquence brute obtenue par l’amorce sens et la séquence théorique attendue
en utilisant Multiple Sequence Alignment by CLUSTALW
(http://www.genome.jp/tools/clustalw/).

2.2.10. Bioinformatique

2.2.10.1. Annotation des protéines identifiées par spectrométrie de masse

Les protéines sont identifiées par spectrométrie de masse (cf § 2.2.6.4.). Leur localisation
sub-cellulaire et leurs domaines fonctionnels ont été déterminés en utilisant la base de
données ProtAnnDB (Protein Annotation DataBase) (http://www.polebio.lrsv.ups-
tlse.fr/ProtAnnDB/) (San Clemente et Jamet, 2015). Les protéines ayant un peptide signal
prédit et ne comportant pas de domaine de rétention intracellulaire ni de domaines trans-
membranaires ont été appelées protéines pariétales. Elles ont été groupées en classes
fonctionnelles et finalement importées dans la base de données WallProtDB
(http://www.polebio.lrsv.ups-tlse.fr/WallProtDB/) par Hélène San Clemente (Service
commun de Bioinformatique du LRSV).

Page 71
Chapitre 2

2.2.10.2. Phylogénie de la famille des protéines pariétales à domaine PAC

La constitution d’un répertoire de protéines à domaine PAC a été effectuée en utilisant un


script dédié basé sur la présence d’un peptide signal prédit, la présence de 6 Cys, leur
espacement, la présence d’un intron entre les Cys 2 et 3 a été réalisée avec l’aide d’H San
Clemente. Différentes bases de données génomiques ont été utilisées (Tableau 2.5). La
présence d’un peptide signal prédit a été effectuée par SignalP
(http://www.cbs.dtu.dk/services/SignalP/) ou TargetP
(http://www.cbs.dtu.dk/services/TargetP/). Les pI des protéines ont été calculés à l’aide de
l’outil Compute pI/Mw (http://web.expasy.org/compute_pi/).

Dans certains cas, notamment lorsque les prédictions de structure de gènes étaient
incorrectes, il a été nécessaire de réaliser des recherches complémentaires dans les différentes
bases de données en utilisant l’outil BLAST (Altschul et al., 1990). Lorsque nécessaire, les
séquences d'acides nucléiques ont été traduites en séquences peptidiques grâce à EMBOSS
Transeq (http://www.ebi.ac.uk/Tools/st/emboss_transeq/).

Les séquences des domaines PAC ont été alignées par alignement multiple avec MUSCLE
(http://www.ebi.ac.uk/Tools/msa/muscle/) ou/et avec Clustal Omega
(http://www.ebi.ac.uk/Tools/msa/clustalo/). L’alignement a ensuite été visualisé à l’aide du
logiciel BioEdit (http://www.mbio.ncsu.edu/bioedit/bioedit.html) pour vérifier la cohérence
des alignements.

Des arbres phylogéniques ont été construits en utilisant : ClustalW2 Phylogeny


(http://www.ebi.ac.uk/Tools/phylogeny/clustalw2_phylogeny/), ou/et le site Phylogeny.fr
(http://phylogeny.lirmm.fr/phylo_cgi/index.cgi) ou/et le logiciel MEGA6 (Tamura et al.,
2011; Hall, 2013). Les arbres ont été visualisés à l’aide du logiciel FigTree
(http://tree.bio.ed.ac.uk/software/figtree/).

La recherche de motifs conservés à l’intérieur des clades a été effectuée avec l’outil
MEME-Suite 4.10.1 (http://meme-suite.org/tools/meme) (Bailey et al., 2009).

Page 72
Chapitre 2

Organismes Source des génomes


A. thaliana
A. lyrata
Brachypodium distachyon
Capsella rubella
Chlamydomonas reinhardtii
Eucalyptus grandis
Gossypium raimondii
Linum usitatissimum Phytozome
Oryza sativa (http://www.phytozome.net)
Ostreococcus lucimarinus
Panicum virgatum
Physcomitrella patens
Populus trichocarpa
Selaginella moellendorffii
Setaria italica
Sorghum bicolor
Vitis vinifera
Volvox carteri
Amborella Genome Database
Amborella trichopoda
(http://www.amborella.org/)
ftp://ftp.ensemblgenomes.org/pub/plants/releas
Hordeum vulgare
e-21/gff3/hordeum_vulgare/
NCBI : assemblage transcriptome 454+Sanger
Penium margaritaceum
(GenBank : JO204623 - JO233842)
ftp://ftp.genomics.org.cn/from_BGISZ/201301
Phalaenopsis equestris
20/02.annotation/02.gene/
Pinus taeda (Luis Valledor, Université d’Oviedo, Espagne,
P. pinaster communication personnelle)

Tableau 2.5 : Source des génomes des organismes étudiés

Page 73
Chapitre 3

3. ANALYSE DU PROTEOME PARIETAL RACINAIRE


D’A. thaliana SAUVAGE ET DU MUTANT lrx1
3.1. Introduction

Dans ce travail, nous souhaitions obtenir deux types d’informations. D’une part, il
s’agissait d’élargir la connaissance du protéome pariétal des racines d’A. thaliana. A ce jour,
un seul protéome racinaire a été publié, celui des racines d’A. thaliana (Basu et al., 2006). Il
comporte 36 protéines prédites pour être sécrétées (WallProtDB,
http://www.polebio.scsv.ups-tlse.fr/WallProtDB/), ce qui correspond à un protéome de petite
taille. D’autre part, il s’agissait de rechercher des protéines jouant un rôle dans la formation
des poils absorbants racinaires en comparant des plantes sauvages et des plantes mutantes lrx1
(cf § 1.3.). Comme mentionné, LRX1 est une protéine chimérique extracellulaire comportant
un peptide signal en N-terminal, un domaine LRR suivi par un domaine riche en Cys en
position centrale, et un domaine EXT en C-terminal (Figure 1.13). Cette protéine a été
proposée jouer un rôle dans le développement des poils racinaires. En particulier, les poils
racinaires des plantes lrx1 sont moins abondants que ceux des plantes sauvages et leur
morphologie est altérée (Figure 1.14).

Pour ce travail, il a été nécessaire de mettre en place un protocole de production de racines


en quantité suffisante pour les analyses protéomiques, et une méthode pour augmenter la
couverture du protéome pariétal. Ceci a permis d’identifier des différences, parfois subtiles,
entre nos deux échantillons, sauvage et mutant lrx1. Par ailleurs, l’examen attentif des
données de spectrométrie de masse a permis de révéler un résultat inattendu : nous avons mis
en évidence la présence de résidus Hyp dans des séquences de peroxydases.

3.2. Mise au point et validation du protocole de production de racines en


quantité suffisante pour la protéomique

Les graines ont été semées in vitro. Les plantules ont été transférées après 21 jours de
croissance sur des dispositifs de cultures hydroponiques Araponics. Les racines ont été
récoltées après 18 jours de croissance et conservées à -80°C. Chaque préparation de parois a
été réalisée à partir de 5 g de matériel frais. Les protocoles de purification des parois (Feiz et
al., 2006) et d’extraction des protéines de ces parois avec des solutions salines (CaCl2 0,2 M
et LiCl 2M) (Irshad et al., 2008) avaient été mis au point au laboratoire sur d’autres matériels.
Il fallait les tester sur les racines.

Nous avons réussi à obtenir des quantités suffisantes de protéines (quelques dizaines de
microgrammes par échantillon). Les protéines ont été séparées par électrophorèse 1D et
quelques bandes majeures ont été analysées en spectrométrie de masse MALDI-TOF
(résultats non montrés). Les profils n’ont pas montré de dégradation des protéines. Nous
avons identifié quelques protéines qui font partie des familles de protéines trouvées

Page 74
Chapitre 3

habituellement dans les protéomes de parois (e.g. peroxydases, lectines, multicopper


oxidases), ce qui a permis de valider le protocole de préparation des extraits de protéines
pariétales.

3.3. Le protéome pariétal des racines sauvages d’A. thaliana

Trois répétitions biologiques ont été réalisées. Les échantillons de protéines extraites des
parois des racines ont permis l’analyse du protéome pariétal des racines sauvages d’A.
thaliana. L’ensemble des résultats a été intégré dans une publication actuellement soumise à
la revue Proteomics, dont le manuscrit est présenté ci-après.

Une partie de ce travail de protéomique a par ailleurs été valorisée dans le cadre d’un
article de revue consacré aux peroxydases qui sont particulièrement abondantes dans les
racines : Francoz E, Ranocha P, Nguyen-Kim H, Jamet E, Burlat V, Dunand C (2015) Roles
of cell wall peroxidases in plant development. Phytochemistry 112 : 15-21.

Page 75
Chapitre 3

Arabidopsis thaliana root cell wall proteomics: increasing the proteome


coverage using a combinatorial peptide ligand library
and description of unexpected Hyp in peroxidase amino acid sequences

Huan Nguyen-Kim 1,2, Hélène San Clemente 1,2, Thierry Balliau 3,4, Michel Zivy 3,4,
Christophe Dunand 1,2, Cécile Albenne 1,2, Elisabeth Jamet 1,2

1.
Université de Toulouse; UPS; UMR 5546, Laboratoire de Recherche en Sciences
Végétales; BP 42617, F-31326 Castanet-Tolosan, France

2.
CNRS; UMR 5546; BP 42617, F-31326 Castanet-Tolosan, France

3.
CNRS, PAPPSO, UMR 0320 / UMR 8120 Génétique Végétale, F-91190 Gif sur Yvette,
France

4.
INRA, PAPPSO, UMR 0320 / UMR 8120 Génétique Végétale, F-91190 Gif sur Yvette,
France

Note to the referees:

Login and password to the WallProtDB version including the A. thaliana root proteomics
data are the following:

http://www.polebio.lrsv.ups-tlse.fr/WallProtDBAtRootsRef

login: wallprot

pasword: W31!aPrT

Correspondence: Dr Elisabeth Jamet, UMR 5546 UPS/CNRS, Laboratoire de


Recherche en Sciences Végétales; BP 42617, F-31326 Castanet-Tolosan, France

E-mail: jamet@lrsv.ups-tlse.fr

Fax: +33(0)534 32 38 02

Page 76
Chapitre 3

Keywords: Arabidopsis thaliana / Bioinformatics / Cell wall / Combinatorial peptide


ligand library / Hydroxyproline / Proteome / ProteoMiner / Root

Abbreviations: CIII Prx, class III peroxidase; CE, carbohydrate esterase; CWP, cell
wall protein; CPLL, combinatorial peptide ligand library; 1D-E, one-dimensional
electrophoresis; FLA, fasciclin arabinogalactan protein; GH, glycoside hydrolase; HRGP,
hydroxyproline-rich glycoprotein; LTP, lipid transfer protein; PAP, purple acid phosphatase;
PL, polysaccharide lyase, PME, pectin methylesterase.

Abstract

Plant cell walls contain a large proportion of polysaccharides (90-95% of cell wall mass)
and proteins (5-10%) which play major roles in cell wall plasticity during development and in
response to environmental cues. Here we present cell wall proteomics data of Arabidopsis
thaliana roots. Plants were cultivated in hydroponic conditions. Cell wall protein extracts
were prepared and analyzed in two different ways in order to enlarge the coverage of the root
cell wall proteome: proteins were analyzed either directly or following an affinity
chromatography on a combinatorial peptide ligand library (CPLL) to reduce the concentration
dynamic range. Proteins were identified by LC-MS/MS and bioinformatics. Altogether, 424
proteins having predicted signal peptides have been identified (CWPs). CPLL permitted to
identify low abundant CWPs never described before, thus enlarging the coverage of the root
cell wall proteome. The root CWP profile is distinct from those of other organs previously
described. The proportion of oxido-reductases is particularly high and includes a large
collection of CIII peroxidases (CIII Prxs). For the first time, hydroxyproline (Hyp) residues
were localized at conserved positions in CIII Prx amino acid sequences.

Page 77
Chapitre 3

1 Introduction

Plant cell walls are mainly composed of polymers which are polysaccharides (90-95% of
cell wall mass) and proteins (5-10%) in primary cell walls [1] and polysaccharides (60%),
proteins (5-10%) and lignins in lignified secondary walls [2]. Polysaccharides are of three
types: cellulose microfibrils, hemicelluloses which wrapp cellulose microfibrils, and pectins.
The plant cell walls are continuously assembled and modified to follow cell growth and
differentiation and allow them to adapt to their changing environment [3-5]. Cell wall proteins
(CWPs) play a great role in performing all these modifications and in transducing signals to
allow cell-to-cell communication. Numerous CWP families have been described for a long
time like glycoside hydrolases, expansins [6], pectin methylesterases (PMEs) [7] and class III
peroxidases (CIII Prxs) [8]. However, plant cell wall proteomics has brought a larger vision of
the CWP content by providing information on the presence of many different types of
proteins at specific stages of development or in response to environmental cues. It has
emerged about fifteen years ago thanks to the availability of genomic sequences and on the
progresses made in mass spectrometry (MS) and bioinformatics [9].

One of the next challenges of plant cell wall proteomics consists in increasing the coverage
of the proteomes. Until now, the largest organ cell wall proteomes usually comprised less than
200 different CWPs identified in a single experiment [9, 10]. The most documented plant
organ cell wall proteome is the most recently published, i.e. that of Brachypodium distachyon
grain with 299 CWPs [11]. In addition to the limitations due to the difficulties encountered to
extract proteins from cell walls and to identify recalcitrant proteins [9, 10, 12], the great
dynamic range of protein concentration renders challenging the identification of low abundant
proteins [13]. The combinatorial peptide ligand library (CPLL) technology was developed to
overcome this problem. It consists in beads carrying a hexapeptide ligand library. The
principle relies on the fact that each protein in a sample can specifically interact at least with
one hexapeptide. Highly abundant proteins should quickly saturate their ligand(s) whereas
low abundant species should be completely bound. Thus, using chromatography on a CPLL
resin should result in a narrower dynamic range of protein concentration in the elution
fraction [14]. To date, this strategy was successfully used mostly in human and animal fields
[15], as well as for a variety of food products [16]. Interesting data on plant proteomics were
also reported using the CPLL technology, thus highlighting the efficiency of this approach to
gain insight into plant proteomes [17]. Results were obtained with proteins extracted from
diverse plant materials, such as (i) leaves of Arabidopsis thaliana [18], spinash [19] and
Mahonia bealei [20], (ii) seeds of olive [21], (iii) latex of Hevea brasiliensis [22], and (iv)
fruits of pomegranate [23], mango [24], avocado [25], olive [21] and banana [26]. However,
the CPLL technology has not yet been used for plant cell wall proteomics.

Secreted proteins undergo post-translational modifications (PTMs) in the endoplasmic


reticulum and in the Golgi apparatus. In particular, N- and O-glycosylations are major PTMs
[27]. O-glycosylations require the hydroxylation of proline (Pro) into hydroxyproline (Hyp)
residues [28]. Finally, Hyp residues can be O-glycosylated in different ways, depending on

Page 78
Chapitre 3

the primary amino sequence of the protein. A code for O-glycosylation of Hyp has been
elaborated, based on the available information [29-31]. Several types of O-glycosylations
have been described in hydroxyproline-rich glycoproteins (HRGPs) such as extensins,
arabinogalactan proteins (AGPs), proline-rich proteins (PRPs) and allergens [32-35]. They all
include arabinose (Ara) and galactose (Gal) residues, but display a great variety of structures
[36]. However, the molecular mechanisms responsible for these PTMs are still partially
understood and the repertoire of proteins undergoing such PTMs is still probably incomplete.
Besides, the question of the presence of non-glycosylated Hyp residues and of their possible
roles has not been addressed.

Because of the early availability of its genome sequence, A. thaliana has been the first
dicot plant on which cell wall proteomics was performed [37]. Then, soon after the release of
the first monocot genomes, Oryza sativa and B. distachyon, cell wall proteomics data became
available for these plants [38-41]. Today, the cell wall proteomes of several plant organs as
well as those of cell suspension cultures have been studied in various plants and the
availability of CWP atlas can be foreseen [10, 42]. In particular, cell wall proteomes of leaves
and stems are well described in A. thaliana, poplar, Solanum tuberosum and B. distachyon
[38, 43-47]. However, there are less data on roots, probably because it is more difficult to get
sufficient amount of plant material. Only two root cell wall proteomes are available in A.
thaliana and O. sativa [48, 49]. They respectively comprise 36 and 18 proteins predicted to be
secreted [48]. In order to enlarge the coverage of the root cell wall proteome of A. thaliana,
we have analyzed a new one from roots of plants grown in hydroponic conditions. The root
cell wall proteome has been enlarged to 445 proteins predicted to be secreted by combining a
classical approach and the CPLL technology. Altogether, 424 and 190 CWPs have been
newly identified in root and in A. thaliana proteomes respectively. In addition, we have
observed for the first time events of hydroxylation of Pro into Hyp residues in some CIII Prxs.

2 Material and methods

2.1 Plant material

Seeds of A. thaliana Col0 were sterilized and sowed on Petri dishes and maintained in the
dark in a wet chamber at 4°C during 48 h to favor homogeneous germination. They were put
for 21 days in a growth chamber with the following day/night conditions: 16 h/8 h –
22°C/20°C and 40% humidity. Then, the plantlets were transferred to Araponics hydroponics
systems (http://www.araponics.com) (Supporting Information Fig. 1SA). Nutritive solutions
have been prepared using the Flora series : FloraGro, FloraMicro, FloraBloom (General
Hydroponics Europe, Araponics, Liège, Belgium). One mL FloraMicro, 1.6 mL FloraGro and
1.4 mL FloraBloom have been diluted in 2 L of water. The plants were put in the following
day/night conditions: 9 h light/15 h dark – 22°C/20°C and 70% humidity. Roots have been
collected after 18 days of culture and kept frozen at -80°C (Supporting Information Fig. 1SB).

Page 79
Chapitre 3

A B
Supporting Information Fig. S1. Sampling for LC-MS/MS analyses: hydroponic cultures
of A. thaliana.
A. Overview of the device and of the aerial parts of the plantlets at the time of harvesting.
B. A focus on the roots which have been taken for the proteomics study after 18 days of culture.

2.2 Extraction and separation of cell wall proteins

Typically, 5 g of roots were used for each sample. Cell walls were prepared as previously
described [50]. About 0.35 g of lyophilized cell walls was obtained. Proteins were extracted
from cell walls with CaCl2 0.2 M and LiCl 2 M solutions as described [51]. CaCl2 and LiCl
protein extracts were combined, desalted and lyophilized. Protein quantification was
performed with the CooAssay Protein Assay kit (Interchim, Montluçon, France) according to
a modified Bradford method [52]. About 0.8 mg of proteins per g of lyophilized cell walls
was extracted. To check the quality of the extract, proteins were separated by one-dimensional
electrophoresis (1D-E) and stained with Coomassie blue [51]. Three biological repeats were
performed.

2.3 Separation of proteins by affinity CPLL

Proteins have been separated using the ProteoMinerTM Protein Enrichment Kit (Bio-Rad,
Life Science, Marnes-la-Coquette, France). ProteoMinerTM beads have been rehydrated in 20
vol of beads of 10% ethanol under shaking during 15 min. They were equilibrated with 10 vol
of beads of PBS 10 x (1.4 M NaCl, 27 mM KCl, 100 mM Na2HPO4, 20 mM KH2PO4, pH 7.4)
for 15 min, and then twice with 10 vol of beads of PBS 1 x. After centrifugation, 1 vol of
beads of PBS has been added to get a suspension of beads ready for use. About 1 mg of root
proteins extracted from cell walls in 75 µL of PBS 1 x was put in contact with 5 µL of
ProteoMinerTM beads, corresponding to a 20 x saturation of the resin (capacity of 10 mg/mL).
Incubation was performed for 4.5 h at 4°C under gentle shaking. Non-retained proteins were
eliminated by a centrifugation at 1000 g for 5 min at 4°C. The beads were washed by
incubating for 10 min thrice with 50 µL PBS 1 x before elution for 4 min at 95°C with 40 µL
of Laemmli buffer (Tris 62.5 mM, glycerol 10%, β-mercaptoethanol 5%, SDS 2%,
bromophenol blue 0,01%) [53].

Page 80
Chapitre 3

2.4 Identification of proteins by mass spectrometry

Prior to MS analysis, 40 µg of proteins were separated by a short-run 1D-E (about 5 mm).


Each sample was cut into three pieces of about 1.7 mm thickness. Tryptic digestion was
performed as described [38]. The samples were put in 30 µL of buffer (2% acetonitrile, 0.1%
formic acid). For each sample, 4 µL of peptide mixture have been separated on a Biosphere
C18 column (NanoSeparation, Nieuwkoop, Netherlands) using a nanoUPLC (nanoLC-Ultra
2D, Eksigent). The separation was performed using 0.1% formic acid and the following
acetonitrile gradient: 5 to 35% in 40 min, then 35 to 95% in 3 min, and 98% during 10 min.
After separation, the peptides were injected in a mass spectrometer (Orbitrap, QexactiveTM,
ThermoFinnigan, Gif sur Yvette, France). The X!Tandem software was used for protein
identification [54] and the X!Tandem Pipeline (Release 2010.12.01.1) for MS data
processing. Only proteins identified with at least two different peptides in the same sample
and found in at least two biological repeats were validated. Hyp residues were systematically
searched for by MS data mining with +15.99491 mass modifications, each of them
corresponding to the hydroxylation of one Pro residue.

2.5 Bioinformatic analyses of proteins

Identified proteins were analyzed with different bioinformatics software to predict their
sub-cellular localization and their functional domains using the ProtAnnDB pipeline [55].
WallProtDB [42] was completed with the proteomic data of this work including the LC-
MS/MS data (http://www.polebio.lrsv.ups-tlse.fr/WallProtDB/). The 3D-structures of CIII
Prxs were downloaded from the PDB site (http://www.rcsb.org/pdb/home/home.do) and
visualized using the Discovery Studio Visualizer software (Accelrys, BioVia, San Diego, CA,
USA). Seventy-three sequences of A. thaliana CIII prxs, available from the PeroxiBase [56]
have been aligned with ClustalW (http://www.ebi.ac.uk/Tools/msa/) using default parameters
[57]. The alignment was manually adjusted. From the resulting alignment, a graphical
consensus was obtained using the WebLogo 3.4 tool with the relative frequency of each
amino as the unit of Y-axis [58].

3 Results

3.1 Identification of proteins by LC-MS/MS

Cell walls of roots grown in hydroponic conditions have been purified. Proteins have been
extracted with two different buffers containing either CaCl2 0.2 M or LiCl 2 M. Both protein
extracts have been combined. The experiment has been repeated thrice. These proteins have
been analyzed in two different ways: (i) the three biological repeats have been directly
analyzed by LC-MS/MS (untreated extract); (ii) or the proteins of the three biological repeats
have been pooled and separated using the CPLL technology to decrease the dynamic range of
concentration within the sample (CPLL extract). All the protein samples have been separated
by 1D-E using about 40 µg of proteins per lane to check the quality of the proteins.

Page 81
Chapitre 3

The comparison of the 1D-E profiles of proteins extracted from the three batches of roots
showed no protein degradation and a good reproducibility of the experiment (Fig. 1A). The
three protein samples exhibited the same protein bands after staining with Coomassie blue.
Range of molecular masses was from 95 kDa to 15 kDa as usually observed for cell wall
protein extracts [38, 51]. These three protein extracts were combined to reach a total amount
of 1 mg of proteins and get enough material to load on the ProteoMinerTM column in
saturating conditions (20 x). After loading (lane U in Fig. 1B), the column was washed in
order to remove the most abundant proteins which were supposed to saturate their ligands
present on the beads (lane FT in Fig. 1B). The proteins retained by the column were eluted
(lane E in Fig. 1B). As expected, the same pattern was observed in lane U (Fig. 1B) and in
lanes 1-3 (Fig. 1A). These bands corresponded to the most abundant proteins of the extract.
The pattern of lane FT was the same, showing that a great part of the most abundant proteins
of the extract has not been retained by the ProteoMinerTM beads. Finally, lane E showing the
proteins eluted from the column (Fig. 1B) displayed a different pattern with bands of higher
intensity than in lane U (black arrows) and the disappearance of some of the major protein
bands of lane U (grey arrows), in accordance with an equalization of the protein
concentrations in our sample.

A MM 1 2 3 B MM U FT E
170
170 130
130 95
95 72
72 55

55 43

43 34

34 26

26

17
17

Fig. 1. 1D-E patterns of A. thaliana proteins extracted from purified root cell walls by
CaCl2 0.2 M and LiCl 2 M solutions (A) and separated by affinity chromatography using
the CPLL technology (B).

Fourty µg of proteins of each sample (1, 2, 3: biological repeats 1, 2 and 3 respectively; U: untreated protein
extract from purified cell walls; FT: flow through; E: elution fraction). The proteins have been separated by 1D-
E and stained with Coomassie blue. Molecular mass (MM) markers are indicated in kDa.

Page 82
Chapitre 3

Predicted sub- Protein Protein Protein Different proteins


cellular extract 1 extract 2 extract 3 in at least 2 CPLL technology
a a a
localization biological repeats
Intracellular
240 227 201 246 1072
proteins

Secreted proteins 268 239 249 270 386

Total number of
508 466 450 516 1458
proteins
Percentage of
proteins
52 26
predicted to be
secreted

Table 1. Comparison of the number of proteins identified in cell wall extracts from roots
of A. thaliana. The sub-cellular localization of proteins was predicted as described in Material
and methods.
a. Protein extracts 1-3 correspond to the untreated samples (three biological repeats).

The three untreated protein extracts and the CPLL extract were then separated by a short-
run of 1D-E to get three samples for each of them. These samples were analyzed by LC-
MS/MS and proteins were identified by bioinformatics (Supporting Information Tables S1-
S2). Altogether, 516 and 1458 proteins have been identified in the untreated protein extract
and in the CPLL samples respectively (Table 1). As expected, the number of proteins
identified in the CPLL sample was much higher (2.8-fold) than that obtained in the untreated
protein extract. Altogether, 1532 proteins were identified, including 440 proteins identified
with the two strategies and 1016 proteins only identified with the CPLL strategy. The average
number of peptides per identified protein (between 6 and 10) was the same using both
strategies (Fig. 2A). However, the reduction of the concentration dynamic range in the CPLL
sample was illustrated by (i) the decrease of the percentage of proteins identified with only
two specific peptides, (ii) the increase of the percentage of proteins identified with more than
10 specific peptides and (iii) the decrease of the percentage of proteins identified with more
than 70 specific peptides (Fig. 2A).

Page 83
Chapitre 3

A 25
percentage of identified proteins untreated sample
CPLL technology
20

15

10

number of peptides (n) per identified protein

B 100% intracellular
proteins
80%
identified proteins

CWPs
60%

40%

20%

0%

number of peptides (n) per identified protein

Fig. 2. Evaluation of the efficiency of the CPLL technology.


A. The percentages of proteins identified with a given number of specific peptides are compared between the
untreated protein extract (dark grey bars) and the CPLL sample (white bars). B. The numbers of peptides (n)
allowing the identification of proteins have been compared between the proteins predicted to be intracellular and
proteins predicted to be secreted (CWPs).

A bioinformatic analysis of the identified proteins was performed using the ProtAnnDB
tool [55] in order to predict their sub-cellular localization (Supporting Information Tables
S3A-B). In the untreated protein extracts, the proportion of proteins predicted to be secreted
was of 52% whereas it was of only 26% in the CPLL sample (Table 1). The higher proportion
of identified proteins predicted to be intracellular in this sample could be related to the fact
that such proteins are usually present in minor amounts in protein extracts from purified cell
walls. Thus, the CPLL technology allowed their identification with lower numbers of specific

Page 84
Chapitre 3

peptides as shown in Fig. 2B and nearly 80% of the proteins identified with two to five
specific peptides were predicted to be intracellular.

Altogether, 270 and 386 proteins predicted to be secreted were identified by the two
methods, without and with CPLL chromatography, respectively. They corresponded to 424
different proteins: 232 proteins were identified with both methods, 38 proteins only in the
untreated protein extract and 154 only in the CPLL sample. Among the 38 proteins only
identified in the untreated extract, 80% were identified with less than five specific peptides,
suggesting that they were not abundant proteins.

In the following, only the 424 proteins predicted to be secreted will be considered and
called cell wall proteins (CWPs). Among these proteins, 15 were found in a previous root cell
wall proteome of 18-day old seedlings [48]. On the contrary, 21 proteins previously identified
were not present in this new proteome. All the MS experimental data concerning CWPs have
been made available online in the WallProtDB database (http://www.polebio.lrsv.ups-
tlse.fr/WallProtDB/) which is dedicated to plant cell wall proteomics. It contains only proteins
identified in cell wall extracts, in apoplast or in culture medium and having a predicted signal
peptide [42].

3.2 Analysis of the root proteome

The functional annotation of proteins was done using the ProtAnnDB tool [55] as well as
literature data. Using functional domains as defined in the PROSITE [59], Pfam [60] and
InterproScan [61] databases, proteins were distributed in nine functional classes (Fig. 3 and
Supporting Information Tables S3-S4): proteins acting on polysaccharides (PAC), oxido-
reductases, proteases, proteins possibly related to lipid metabolism, proteins with interaction
domains (with proteins or polysaccharides), proteins possibly involved in signaling, structural
proteins, miscellaneous proteins and proteins of unknown function. The root cell wall
proteome showed an atypical distribution of CWPs into these functional classes as compared
to an average A. thaliana cell wall proteome (Fig. 3) [9]. It had higher proportions of oxido-
reductases (17.1%), proteases (15.4%) and miscellaneous proteins (14.5%). On the contrary,
it had a lower proportion of proteins with interaction domains (7.1%) and proteins of
unknown function (7.8%). The proportion of proteins acting of polysaccharides was as
expected (26.4%).

Page 85
Chapitre 3

A 40 B
OR P 35
17.1% 15.4%

number of proteins
30
25
LM
20
7.1%
15
ID
PAC 10
7.1%
26.4%
5
0
M
UF
14.5%
7.8%
S
SP 3.8%
0.7%
C
16
14
12
number of proteins

10
8
6
4
2
0

Fig. 3. Distribution of the root CWPs in functional classes (A), and in protein families
inside the oxido-reductase (B) and protein acting on polysaccharides (C) functional classes.
In panel A: PAC, stands for proteins acting on polysaccharides; OR, for oxido-reductases; P, for proteases;
LM, for proteins related to lipid metabolism; ID for proteins with interacting domains with proteins or
polysaccharides; S, for signaling; SP, for structural proteins; M, for miscellaneous; UF, for proteins of yet
unknown function.

In the oxido-reductase functional class (Supporting Information Table S4, Fig. 3B), 38 CIII
Prxs represented more than half of the 72 identified proteins and of the 73 CIII Prxs predicted
in the A. thaliana genome. They are also among the most abundant proteins of the root
proteome with 8 of them among those identified with more than 30 specific peptides
(Supporting Information Table S1). Among other oxido-reductases, there were multicopper
oxidases (9 SKU5/SKS proteins), berberine-bridge oxido-reductases (8), blue copper binding
proteins (5) and laccases (3). Among the proteins acting on polysaccharides, there were
glycoside hydrolases (GHs) of the GH1 (10 proteins), GH17 (14), GH19 (7), GH28 (8)
families, carbohydrate esterases (CE) of the CE8 and CE13 families, polysaccharide lyases
(PL) and expansins (11). Among proteins related to lipid metabolism, there were 14 GDSL
lipases. Pectin methyl esterase inhibitors (PMEIs) were well-represented among proteins with
interaction domains (6 proteins). An unusually high number of receptor kinases (13) could be
identified with peptides belonging to their extracellular domain (leucine-rich repeat or lectin

Page 86
Chapitre 3

domains). These proteins were not extracellular proteins, but rather trans-membrane domain
proteins. They have been conserved in this cell wall proteome because their identification
might be of interest for studying signaling pathways involving cell wall components. The
miscellaneous category comprises many proteins of interest for the specific metabolism of
roots: defense proteins such as thaumatins (5 proteins), ribonucleases (4), and pathogenesis-
related proteins (PR-proteins) (7); proteins possibly involved in phosphate metabolism such
as phosphate-induced (phi) proteins 1 (4 proteins), acid phosphatases (2 proteins) and purple
acid phosphatases (PAPs, 10 proteins). Seven dirigent proteins have also been identified.
Finally, a low proportion of proteins of unknown function have been identified among which
DUF642 (7), DUF538 (4) and MATH domain (4) proteins.

Among the 424 CWPs identified in this study, 232 were already identified in one of the A.
thaliana cell wall proteome (WallProtDB data). It means that the root cell wall proteome
brought 192 new CWPs, thus increasing the size of the known cell wall proteome of A.
thaliana to 687 CWPs. The root cell wall proteome was then compared to previously studied
A. thaliana cell wall proteomes (WallProtDB data) and with Brassica oleracea xylem sap
proteome (Fig. 4 and Supporting Information Table S4). It had the highest number of
common proteins (134) with the cell wall proteome of etiolated hypocotyls. It shared 98
proteins with the cell suspension cultures proteomes and 75 with the B. oleracea xylem sap
proteome. Sixteen CWPs are common to all four materials. The numbers of proteins shared
with the leaf and the stem cell wall proteomes were lower (58). Finally, the A. thaliana root
cell wall proteome shared some features with the known Oryza sativa root cell wall proteome
[49]. Among 18 CWPs, 5 were CIII Prxs and 3 were GH17.

etiolated hypocotyls cell suspension cultures


(134 out of 226) (98 out of 170)

73 48
62 11 10
210 33
roots 34 3 xylem sap
(421) (75 out of 126)
16
40 5
8 22
29

Fig. 4. Comparison of the cell wall proteome of A. thaliana roots with those of A. thaliana
etiolated hypocotyls and cell suspension cultures as well as with the proteome of the B.
oleracea xylem sap.
A Venn diagram has been drawn using the cell wall proteomics data indexed in WallProtDB. The numbers
between brackets indicate the number of CWPs shared with the root proteome and the total number of CWPs in
each cell wall proteome.

Page 87
Chapitre 3

3.3 Observation of Hyp residues in CIII Prxs

The abundance of CIII Prxs in the root proteome opened the possibility to observe a new
type of PTM not yet described for such proteins. Indeed, Hyp residues have been located by
MS/MS at several positions on different tryptic peptides resulting from the proteolytic
digestion of CIII Prxs followed by MS fragmentation (Supporting Information Table S5). In
particular, three positions conserved between 90% of the A. thaliana CIII Prx amino acid
sequences [62] were affected by this PTM: Cys-Pro (amino-acids 14-15, motif 1), Gly-Pro
(124-125, motif 2) and Leu-Pro-X-Pro (149-152, motif 3) (Fig. 5A, Supporting Information
Table S5). Additional Hyp have been observed in less conserved sequences (Supporting
Information Table S5). Another puzzling feature is that a variable percentage of Hyp residues
has been found at each of the observed positions (from 2.5% to 100%). Besides, some Pro
residues have never been found to be hydroxylated.

Since the observation of Hyp residues in CIII Prx sequences was not previously described,
we wanted to localize the corresponding Pro residues on the available 3D-structures of Class
III Prxs. Four such structures have been determined by X-ray crystallography for native CIII
Prxs bearing N-glycans, i.e. from peanut [63], royal palm tree [64], banyan tree [65] and
Raphanus sativus (Gil-Rodriguez et al., unpublished data). We have chosen that of R. sativus
because this plant is a Brassicaceae like A. thaliana (PDB code 4A5G,
http://www.rcsb.org/pdb/home/home.do). Pro/Hyp residues of motifs 1 and 2 were located at
the surface of the protein, on the opposite side of the active site (Fig. 5B). This position
suggested a possible occupancy by O-glycans. On the contrary, Pro/Hyp residues of motif 3
were located within the substrate binding site, at the edge of the groove where the heme is
bound (Fig. 5) [65]. The other observed Hyp residues in less conserved motifs were located at
the surface of the R. sativus CIII Prx (data not shown). It should also be noted that the
corresponding Pro residues were located at similar position on the 3D-structures of the
available A. thaliana Prxs which are non-glycosylated recombinant proteins (data not shown).

Page 88
Chapitre 3

180°

Fig. 5. Observation of Hyp residues in the A. thaliana CIII Prx sequences.


A. WebLogo representation of the 180 first amino acids of the mature A. thaliana CIII Prx proteins
highlighting conserved Cys residues (black) and Pro residues (orange). The positions at which Hyp have been
observed are framed: motif 1 (blue), motif 2 (pink) and motif 3 (red). B. 3D-structure of a CIII Prx of R. sativus
(PDB code 4A5G) showing the location of Hyp, as observed in the A. thaliana CIII Prxs. The two opposite sides
of the protein are shown. The color code used to show the localization of Pro residues is the same as in A. N-
glycans are shown. The peptides sequenced by MS/MS are listed in Supporting Information Table S5.

Page 89
Chapitre 3

4 Discussion

This study extends the knowledge of the root cell wall proteomes of A. thaliana.
Altogether, 516 and 1458 different proteins were identified using a classical strategy or the
CPLL technology respectively. Among these proteins, 270 and 386 respectively had predicted
signal peptides and corresponded to 424 different CWPs. This new root proteome is much
larger than the previously published one [48]. However, the methods employed did not allow
to identify as many HRGPs as a recent study using hydrogen fluoride deglycosylated cell wall
fractions, followed by the in muro tryptic digestion of proteins [12]. With these new data, the
A. thaliana cell wall proteome is the best documented one with 687 CWPs, followed by that
of B. distachyon which comprises to date 460 CWPs [11]. The root cell wall proteome shares
a great proportion of CWPs with three others of A. thaliana, i.e. those of etiolated hypocotyls
(32%), cell suspension cultures (23%) and xylem sap (18%). Some features common to roots
and to these organs or cell suspension cultures can be highlighted. In roots and hypocotyls,
the secondary tissues are arranged in the same way, i.e. the procambium forms a continuous
ring of cells [66]. Cell suspension cultures and roots grown in hydroponic conditions both
grow in liquid medium and the xylem sap mostly contains proteins originating from roots
[67]. Finally, we could show the presence of Hyp residues at conserved positions on several
CIII Prxs and in unusual amino acid sequence motifs, compared to those observed in HRGPs
[68].

This is the first plant cell wall proteomics study using the CPLL technology. The protein
concentrations could be equalized by reducing their dynamic range in the sample. In
agreement with the modifications observed on 1D-E protein profiles, MS data confirmed the
equalization in the CPLL extract. These data corroborated spectral counting data already
reported for CPLL analyses [69]. The number of identified proteins was 2.8-fold higher with
the CPLL experiment than with the untreated protein extract. This ratio decreased to 1.4-fold
when only CWPs were considered. This indicated that a great proportion of low-abundant
proteins newly identified with the CPLL experiment consisted in intracellular contaminants.
However, the CPLL technology permitted to identify 154 additional CWPs, corresponding to
an increase of 57% of the cell wall proteome size explored in this study. In other studies on
plants, this technology allowed a 26% to 124 % increase of the proteome sizes [18]. Among
the 154 proteins specific to the CPLL extract, 110 had never been identified in any cell wall
proteomes so far, highlighting the efficiency of this approach to enlarge the coverage of
proteomes. Besides, these 154 low-abundant CWPs were distributed into the 9 functional
classes, indicating that the hidden proteome concerned all the categories of CWPs [55]. It
should be noted that CPLL strategy depleted some proteins since 38 CWPs were only
identified in the untreated protein extract. This feature, already reported in a number of
studies, revealed that CPLL beads did not permit the capture of all the proteins [18, 69].

Page 90
Chapitre 3

Since the root cell wall proteome is a very large one, the discussion is focused on some
protein families particularly well-represented. This is the case of several GHs, CEs and PLs
classified as proteins acting on polysaccharides. All those identified in the root proteome,
except GH18, GH19 and GH20, have been described as enzymes able to “cut and paste” plant
cell wall polysaccharides [70]. GH18 and GH19 could be involved in the processing of
glycoprotein N-or O-glycans [71]. GH20 were predicted to be β-hexosaminidases, but their
role in plant cell walls has not been clearly shown [72]. Altogether, seven protein families of
GHs, CEs and PLs were represented by at least 6 members in the root proteome: GH1 were
shown to degrade mannans, galactomannans, or glucogalactomannans [73]; GH17 which
were predicted to be β-1,3 glucanases hydrolysing callose have been associated to plant
defense mechanisms [74]; as mentioned above, GH19 could be involved in the processing of
the glycoprotein glycan moieties [71]; GH28 were shown to be polygalacturonases degrading
pectic homogalacturonans [74]; CE8 (PMEs), CE13 (PAEs) and PLs were shown to modify
homogalacturonans by methylesterification (CE8), acylesterification (CE13) or β-elimination
(PL) [75]. It should be noted that a GH17 (At4g16260) was the CWP identified with the
highest number of specific peptides (Supporting Information Table S1). GH17 were also
identified in the rice root cell wall proteome [49]. The high number of PMEIs suggested fine
tuning of PME enzymatic activities as shown for AtPME5 for the control of phyllotaxis [76].
Finally, 11 expansins and expansin-like proteins known to loosen cell walls via a non-
enzymatic mechanism inducing slippage of cellulose microfibrils were identified [6]. The
presence of so many proteins contributing to the remodelling of cell wall polysaccharides is
consistent with the great plasticity of the root cell walls and probably with other roles in
defense [70, 77, 78].

With regard to oxido-reductases, CIII Prxs represent the most important protein family.
These enzymes have been extensively studied and have been shown to contribute to cell wall
remodelling during development and defense reactions either by loosening through the
generation of free radicals, or stiffening through cross-linking of cell wall compounds such as
lignin precursors or structural proteins [8]. The elevated number of CIII Prxs identified, and
their abundance in the root proteome are in accordance with both the high level of CIII Prx
gene expression and of total CIII Prx enzymatic activity detected in roots [8]. CIII Prx are
also well represented in the rice cell wall proteome [49]. Eight multicopper oxidase-like
proteins homologous to SKU5 (SKEWED5) have been identified out of the 19 predicted in
the A. thaliana genome [79]. SKU5 was shown to play a role in the control of root directional
growth and SKS6 to be up-regulated in roots in response to several hormones [79, 80]. Three
laccases have been identified. Such enzymes have been recently shown to complement CIII
Prxs for the polymerization of lignin monomers [81]. LAC3, LAC5 and LAC7 have been
shown to be expressed in roots by analysis of the expression of promoter::β-glucuronidase
constructs, but their precise function has not been demonstrated [82]. The role of berberine-
bridge oxido-reductases in cell walls has not been elucidated. However, such a protein have
been recently identified as secreted proteins in a Vitis vinifera cell suspension culture elicited
with different hormones [83] and a role in plant defense has been proposed.

Page 91
Chapitre 3

Roots have developed strategies to protect themselves against pathogen attacks [84]. In
addition to the proteins mentioned above, other types of defense proteins have been identified
in the root proteome as well as proteins possibly involved in the formation of protective cell
layers such as endodermis and peridermis. Fourteen lipase acylhydrolases of the GDSL
family, a non-specific lipid transfer protein (LTP5) and eight dirigent proteins have been
identified in the root proteome. GDSL lipases have been proposed to be cutin synthases
playing a role in the formation of the cuticle of the tomato fruit [85]. In roots, GDSL lipases
could contribute to the formation of Casparian strips and suberin lamellae in the endodermis
and in the peridermis [84]. They could work together with dirigent proteins which have been
shown to be involved in the formation of Casparian strips [86]. Besides, three pathogenesis-
related proteins PR1, five thaumatins (PR5 family) and twelve germins have been identified.
Several PR1 and PR5 have been shown to exhibit an antifungal activity [87]. Germins and
germin-like proteins have been associated to the plant response to biotic or abiotic
environmental cues [88, 89].

Nutrition through root absorption is crucial for plants. Proteins playing roles in phosphate
scavenging or recycling have been found in response to phosphate starvation either in roots or
in cell suspension cultures [90-93]. In the root cell wall proteome, 10 PAPs, four phosphate-
induced proteins, two acid phosphatases and four ribonucleases T2 have been identified.
AtPAP12 and AtPAP26 have been shown to be the main PAPs secreted by roots and to
contribute to phosphate scavenging from organophosphates in soils [91]. The phi proteins
have been identified for the first time in tobacco cell suspension cultures deprived of
phosphate, but their role has not been demonstrated [90]. Recently, the EgPHI-1 protein of
Eucalyptus has been shown to increase the osmotic stress tolerance [94]. Finally, the
ribonucleases T2 were assumed to contribute to phosphate remobilization from nucleic acids
[92, 93]. Besides, proteases, and especially Cys proteases, secreted by roots have been
assumed to play a role in creating a pool of accessible nitrogen by digesting proteins [95]. So
the many proteases identified in the root proteome could play such a role in addition to those
already described in protein maturation, degradation or signaling by releasing peptides [96].

Our data constitute the first report of the presence of Hyp residues in CIII Prx amino acid
sequences. This feature has been observed in a variable percentage of cases, and particularly
in three motifs conserved between 90% of the A. thaliana CIII Prxs. The location of these
Hyp on the available 3D-structures of a R. sativus CIII Prx showed that some of them were
located at the surface of the protein whereas others were located within the active site. We
cannot exclude that some Hyp residues were present in the R. sativus protein, but could not be
assigned in 3D-structures because of too weak electron density signals. We assume that the
presence of a hydroxyl group on a Pro residue located within the active site could modify the
binding of substrates and consequently the enzyme specificity. Even though CIII Prxs were
only reported to be N-glycosylated so far, the presence of O-glycans cannot be excluded. A
report on a CIII Prx from oil palm leaf has mentioned a particularly high carbohydrate content
as well as an unexpected molecular mass of 200 kDa, corroborating possible O-glycosylations
[97]. However, additional experiments would be necessary to demonstrate this feature. The

Page 92
Chapitre 3

possibility for CIII Prxs to carry Hyp and possibly O-glycans raises the question of the
biological relevance of these PTMs. Is Pro hydroxylation on a limited proportion of Pro
residues at a given position an accidental event or a well-directed one like in the case of the
well-known HRGPs? In CIII Prxs, the amino acid sequences around the Hyp residues are
different from those described for HRGPs [68], with the exception of some Ser-Pro and Ala-
Pro motifs. Only the specificity of two different A. thaliana prolyl 4-hydroxylases out of 13
has been determined [28]. They have Pro residues of extensins or arabinogalactan proteins as
substrates in Ser-(Pro)n or (XPro)n motifs. Other prolyl 4-hydroxylases could be involved in
the hydroxylation of Pro residues of CIII Prx sequences. In addition, the structure of O-
glycans, if present, should be analyzed in detail since different patterns of O-glycosylation
have been described [98]. Until now, only N-glycosylations of CIII Prxs have been
demonstrated, with some variability in N-glycan structures [99]. The presence of O-glycans
would create a new degree of heterogeneity whose function should be determined.

In conclusion, this new cell wall proteome provides a great amount of information, both as
the largest overview of the CWP content, but also as the source of new information on CWP
PTMs. The CPLL strategy appeared as an efficient way to perform in-depth analyses of cell
wall proteomes and could be applied to other plant materials to document the plant cell wall
proteomics atlas. It paves the way to a better understanding of the biology of root cell walls
by bringing new candidates for performing essential functions such as polysaccharide
remodeling, plant defense and phosphate absorption. The description of a new PTM on CIII
Prxs opens new perspectives to describe their structure, and eventually the regulation of their
enzymatic activities in muro.

Acknowledgements
The authors are thankful to Université Paul Sabatier (Toulouse, France) and CNRS for
supporting their research work. This work was also supported by the French Laboratory of
Excellence project entitled "TULIP" (ANR-10-LABX-41; ANR-11-IDEX-0002-02). HNG-K
has been supported by the Vietnamese Ministry of Education and Training for his PhD grant.
LC-MS/MS analyses were performed on the Plateforme d'Analyse Protéomique de Paris Sud-
Ouest (PAPPSO). The authors also wish to thank Pr Christoph Ringli and Pr. Jérôme Pelloux
for stimulating discussions.

The authors have declared no conflict of interest.

Page 93
Chapitre 3

References
[1] Carpita, N. C., Gibeaut, D. M., Structural models of primary cell walls in flowering plants, consistency of
molecular structure with the physical properties of the walls during growth. Plant J 1993, 3, 1-30.
[2] Déjardin, A., Laurans, F., Arnaud, D., Breton, C., et al., Wood formation in Angiosperms. CR Biol 2010,
333, 325-334.
[3] Lee, K., Marcus, S., Knox, J., Cell wall biology: perspectives from cell wall imaging. Mol Plant 2011, 4,
212-219.
[4] Roppolo, D., Geldner, N., Membrane and walls: who is master, who is servant? Curr Opin Plant Biol 2012,
15, 608-617.
[5] Knox, J. P., Revealing the structural and functional diversity of plant cell walls. Curr Opin Plant Biol 2008,
11, 308-313.
[6] Sampedro, J., Cosgrove, D. J., The expansin superfamily. Genome Biol 2005, 6, 242.
[7] Sénéchal, F., Wattier, C., Rustérucci, C., Pelloux, J., Homogalacturonan-modifying enzymes: structure,
expression, and roles in plants. J Exp Bot 2014, 25, 5125-5160.
[8] Francoz, E., Ranocha, P., Nguyen-Kim, H., Jamet, E., et al., Roles of cell wall peroxidases in plant
development. Phytochemistry 2015, 112, 15-21.
[9] Albenne, C., Canut, H., Jamet, E., Plant cell wall proteomics: the leadership of Arabidopsis thaliana. Front
Plant Sci 2013, 4, 111.
[10] Albenne, C., Canut, H., Hoffmann, L., Jamet, E., Plant cell wall proteins: a large body of data, but what
about runaways? Proteomes 2014, 2, 224-242.
[11] Francin-Allami, M., Merah, K., Albenne, C., Rogniaux, H., et al., Cell wall proteomics of Brachypodium
distachyon grains: A focus on cell wall remodeling proteins. Proteomics 2015, DOI:
10.1002/pmic.201400485.
[12] Chen, Y., Ye, D., Held, M. A., Cannon, M. C., et al., Identification of the abundant hydroxyproline-rich
glycoproteins in the root walls of wild-type Arabidopsis, an ext3 mutant line, and its phenotypic revertant.
Plants 2015, 4, 85-111.
[13] Corthals, G. L., Wasinger, V. C., Hochstrasser, D. F., Sanchez, J. C., The dynamic range of protein
expression: a challenge for proteomic research. Electrophoresis 2000, 21, 1104-1115.
[14] Righetti, P. G., Boschetti, E., The ProteoMiner and the FortyNiners: searching for gold nuggets in the
proteomic arena. Mass Spectrom Rev 2008, 27, 596-608.
[15] Righetti, P. G., Fasoli, E., Boschetti, E., Combinatorial peptide ligand libraries: the conquest of the 'hidden
proteome' advances at great strides. Electrophoresis 2011, 32, 960-966.
[16] Boschetti, E., Chung, M. C., Righetti, P. G., "The quest for biomarkers": are we on the right technical track?
Proteomics Clin Appl 2012, 6, 22-41.
[17] Fröhlich, A., Lindermayr, C., Deep insights into the plant proteome by pretreatment with combinatorial
hexapeptide ligand libraries. J Proteomics 2011, 74, 1182-1189.
[18] Fröhlich, A., Gaupels, F., Sarioglu, H., Holzmeister, C., et al., Looking deep inside: detection of low-
abundance proteins in leaf extracts of Arabidopsis and phloem exudates of pumpkin. Plant physiol 2012,
159, 902-914.
[19] Fasoli, E., D'Amato, A., Kravchuk, A. V., Boschetti, E., et al., Popeye strikes again: The deep proteome of
spinach leaves. J Proteomics 2010, 74, 127-136.
[20] Zhang, L., Zhu, W., Zhang, Y., Yang, B., et al., Proteomics analysis of Mahonia bealei leaves with
induction of alkaloids via combinatorial peptide ligand libraries. J Proteomics 2014, 14, 59-71.

Page 94
Chapitre 3

[21] Esteve, C., D'Amato, A., Marina, M. L., García, M. C., et al., Identification of olive (Olea europaea) seed
and pulp proteins by nLC-MS/MS via combinatorial peptide ligand libraries. J Proteomics 2012, 2396-2403.
[22] D'Amato, A., Bachi, A., Fasoli, E., Boschetti, E., et al., In-depth exploration of Hevea brasiliensis latex
proteome and "hidden allergens" via combinatorial peptide ligand libraries. J Proteomics 2010, 73, 1368-
1380.
[23] Capriotti, A. L., Caruso, G., Cavaliere, C., Foglia, P., et al., Proteome investigation of the non-model plant
pomegranate (Punica granatum L.). Anal Bioanal Chem 2013, 405, 9301-9309.
[24] Fasoli, E., Righetti, P. G., The peel and pulp of mango fruit: a proteomic samba Biochim Biophys Acta
2013, 1834, 2539-2545.
[25] Esteve, C., D'Amato, A., Marina, M. L., García, M. C., Righetti, P. G., Identification of avocado (Persea
americana) pulp proteins by nano-LC-MS/MS via combinatorial peptide ligand libraries. Electrophoresis
2012, 33, 2799-2805.
[26] Esteve, C., D'Amato, A., Marina, M. L., García, M. C., Righetti, P. G., In-depth proteomic analysis of
banana (Musa spp.) fruit with combinatorial peptide ligand libraries. Electrophoresis 2013, 34, 207-214.
[27] Faye, L., Boulaflous, A., Benchabane, M., Gomord, V., Michaud, D., Protein modifications in the plant
secretory pathway: current status and practical implications in molecular pharming. Vaccine 2005, 23, 1770-
1778.
[28] Velasquez, S. M., Salgado Salter, J., Petersen, B. L., Estevez, J. M., Recent advances on the post-
translational modifications of EXTs and their roles in plant cell walls. Front Plant Sci 2012, 3, 93.
[29] Kieliszewski, M. J., The latest hype on Hyp-O-glycosylation codes. Phytochemistry 2001, 57, 319-323.
[30] Tan, L., Qiu, F., Lamport, D. T., Kieliszewski, M. J., Structure of a hydroxyproline (Hyp)-arabinogalactan
polysaccharide from repetitive Ala-Hyp expressed in transgenic Nicotiana tabacum. J Biol Chem 2004, 279,
13156-13165.
[31] Estevez, J. M., Kieliszewski, M. J., Khitrov, N., Somerville, C., Characterization of synthetic
hydroxyproline-rich proteoglycans with arabinogalactan protein and extensin motifs in Arabidopsis. Plant
physiol 2006, 142, 458-470.
[32] Tan, L., Varnai, P., Lamport, D. T., Yuan, C., et al., Plant O-hydroxyproline arabinogalactans are composed
of repeating trigalactosyl subunits with short bifurcated side chains. J Biol Chem 2010, 285, 24575-24583.
[33] Tryfona, T., Liang, H. C., Kotake, T., Tsumuraya, Y., et al., Structural characterization of Arabidopsis leaf
arabinogalactan polysaccharides. Plant physiol 2012, 160, 563-666.
[34] Léonard, R., Petersen, B. O., Himly, M., Kaar, W., et al., Two novel types of O-glycans on the mugwort
pollen allergen Art v 1 and their role in antibody binding. J Biol Chem 2005, 280, 7932-7940.
[35] Hijazi, M., Durand, J., Pichereaux, C., Pont, F., et al., Characterization of the arabinogalactan protein 31
(AGP31) of Arabidopsis thaliana: new advances on the Hyp-O-glycosylation of the Pro-rich domain. J Biol
Chem 2012, 287, 9623-9632.
[36] Hijazi, M., Velasquez, S., Jamet, E., Estevez, J., Albenne, C., An update on post-translational modifications
of hydroxyproline-rich glycoproteins: toward a model highlighting their contribution to plant cell wall
architecture. Front Plant Sci 2014, 5, 395.
[37] The Arabidopsis Genome Initiative, Analysis of the genome sequence of the flowering plant Arabidopsis
thaliana. Nature 2000, 408, 796-805.
[38] Douché, T., San Clemente, H., Burlat, V., Roujol, D., et al., Brachypodium distachyon as a model plant
toward improved biofuel crops: Search for secreted proteins involved in biogenesis and disassembly of cell
wall polymers. Proteomics 2013, 13, 2438-2454.

Page 95
Chapitre 3

[39] Jung, Y. H., Jeong, S. H., Kim, S. H., Singh, R., et al., Systematic secretome analyses of rice leaf and seed
callus suspension-cultured cells: Workflow development and establishment of high-density two-dimensional
gel reference maps. J Proteome Res 2008, 7, 5187-5210.
[40] Cho, W. K., Chen, X. Y., Chu, H., Rim, Y., et al., The proteomic analysis of the secretome of rice calli.
Physiol. Plant. 2009, 135, 331-341.
[41] Chen, X. Y., Kim, S. T., Cho, W. K., Rim, Y., et al., Proteomics of weakly bound cell wall proteins in rice
calli. J Plant Physiol 2008, 166, 665-685.
[42] San Clemente, H., Jamet, E., WallProtDB, a database resource for plant cell wall proteomics. Plant Methods
2015, 11, 2.
[43] Boudart, G., Jamet, E., Rossignol, M., Lafitte, C., et al., Cell wall proteins in apoplastic fluids of
Arabidopsis thaliana rosettes: Identification by mass spectrometry and bioinformatics. Proteomics 2005, 5,
212-221.
[44] Haslam, R. P., Downie, A. L., Raventon, M., Gallardo, K., et al., The assessment of enriched apoplastic
extracts using proteomic approaches. Ann Appl Biol 2003, 143, 81-91.
[45] Minic, Z., Jamet, E., Negroni, L., der Garabedian, P. A., et al., A sub-proteome of Arabidopsis thaliana
trapped on Concanavalin A is enriched in cell wall glycoside hydrolases. J. Exp. Bot. 2007, 58, 2503-2512.
[46] Pechanova, O., Hsu, C. Y., Adams, J. P., Pechan, T., et al., Apoplast proteome reveals that extracellular
matrix contributes to multistress response in poplar. BMC Genomics 2010, 11, 674.
[47] Lim, S., Chisholm, K., Coffin, R. H., Peters, R. D., et al., Protein profiling in potato (Solanum tuberosum
L.) leaf tissues by differential centrifugation. J Proteome Res 2012, 11, 2594-2601.
[48] Basu, U., Francis, J. L., Whittal, R. W., Stephens, J. L., et al., Extracellular proteomes of Arabidopsis
thaliana and Brassica napus roots: analysis and comparison by MUdPIT and LC-MS/MS. Plant Soil 2006,
286, 357-376.
[49] Zhou, L., Bokhari, S. A., Dong, C. J., Liu, J. Y., Comparative proteomics analysis of the root apoplasts of
rice seedlings in response to hydrogen peroxide. PLoS One 2011, 6, e16723.
[50] Feiz, L., Irshad, M., Pont-Lezica, R. F., Canut, H., Jamet, E., Evaluation of cell wall preparations for
proteomics: a new procedure for purifying cell walls from Arabidopsis hypocotyls. Plant Methods 2006, 2,
10.
[51] Irshad, M., Canut, H., Borderies, G., Pont-Lezica, R., Jamet, E., A new picture of cell wall protein dynamics
in elongating cells of Arabidopsis thaliana: confirmed actors and newcomers. BMC Plant Biol 2008, 8, 94.
[52] Bradford, M. M., Rapid and sensitive method for quantification of microgram quantities of protein utilizing
principle of protein-dye binding. Anal Biochem 1976, 72, 248-254.
[53] Laemmli, U. K., Cleavage of the structural proteins during the assembly of the head of bacteriophage T4.
Nature 1970, 227, 680-685.
[54] Craig, R., Beavis, R., TANDEM: matching proteins with tandem mass spectra. Bioinformatics 2004, 20,
1466-1467.
[55] San Clemente, H., Pont-Lezica, R., Jamet, E., Bioinformatics as a tool for assessing the quality of sub-
cellular proteomic strategies and inferring functions of proteins: plant cell wall proteomics as a test case.
Bioinform Biol Insights 2009, 3, 15-28.
[56] Fawal, N., Li, Q., Savelli, B., Brette, M., et al., PeroxiBase: a database for large-scale evolutionary analysis
of peroxidases. Nucleic Acids Res 2003, 41(Database issue), D441-444
[57] Thompson, J. D., Gibson, T. J., Higgins, D. G., Multiple sequence alignment using ClustalW and ClustalX.
Curr Protoc Bioinformatics 2002, Chapter 2, Unit 2.3.

Page 96
Chapitre 3

[58] Crooks, G. E., Hon, G., Chandonia, J. M., Brenner, S. E., WebLogo: a sequence logo generator. Genome
Res. 2004, 14, 1188-1190.
[59] Sigrist, C. J. A., de Castro, E., Cerutti, L., Cuche, B. A., et al., New and continuing developments at
PROSITE. Nucleic Acids Res 2013, 41(Database issue), D344-D347.
[60] Finn, R. D., Bateman, A., Clements, P., Coggill, P., et al., The Pfam protein families database. Nucleic
Acids Res 2014, 42 (database issue), D222-D230.
[61] Jones, P., Binns, D., Chang, H. Y., Fraser, M., et al., InterProScan 5: genome-scale protein function
classification. Bioinformatics 2014, 30, 1236-1240.
[62] Tognolli, M., Penel, C., Greppin, H., Simon, P., Analysis and expression of the class III peroxidase large
gene family in Arabidopsis thaliana. Gene 2002, 288, 129-138.
[63] Schuller, D. J., Ban, N., Huystee, R. B., McPherson, A., Poulos, T. L., The crystal structure of peanut
peroxidase. Structure 1996, 4, 311-321.
[64] Watanabe, L., de Moura, P. R., Bleicher, L., Nascimento, A. S., et al., Crystal structure and statistical
coupling analysis of highly glycosylated peroxidase from royal palm tree (Roystonea regia). J Struct Biol
2010, 169, 226-242.
[65] Palm, G. J., Sharma, A., Kumari, M., Panjikar, S., et al., Post-translational modification and extended
glycosylation pattern of a plant latex peroxidase of native source characterized by X-ray crystallography.
FEBS J 2004, 281, 4319-4333.
[66] Ragni, L., Hardtke, C. S., Small but thick enough-the Arabidopsis hypocotyl as a model to study secondary
growth. Physiol Plant 2014, 151, 164-171.
[67] Ligat, L., Lauber, E., Albenne, C., San Clemente, H., et al., Analysis of the xylem sap proteome of Brassica
oleracea reveals a high content in secreted proteins. Proteomics 2011, 11, 1798-1813.
[68] Kieliszewski, M. J., Lamport, D. T. A., Extensin: repetitive motifs, functional sites, post-translational codes,
and phylogeny. Plant J 1994, 5, 157-172.
[69] Di Girolamo, F., Righetti, P. G., Soste, M., Feng, Y., Picotti, P., Reproducibility of combinatorial peptide
ligand libraries for proteome capture evaluated by selected reaction monitoring. J Proteomics 2013, 89, 215-
226.
[70] Frankova, L., Fry, S. C., Biochemistry and physiological roles of enzymes that "cut and paste" plant cell-
wall polysaccharides. J Exp Bot 2013, 64, 3519-3550.
[71] Minic, Z., Physiological roles of plant glycoside hydrolases. Planta 2008, 227, 723-740.
[72] Intra, J., Pavesi, G., Horner, D. S., Phylogenetic analyses suggest multiple changes of substrate specificity
within the glycosyl hydrolase 20 family. BMC Evol Biol 2008, 8, 214.
[73] Xu, Z., Escamilla-Treviño, L., Zeng, L., Lalgondar, M., et al., Functional genomic analysis of Arabidopsis
thaliana glycoside hydrolase family 1. Plant Mol Biol 2004, 55, 343-367.
[74] Henrissat, B., Coutinho, P. M., Davies, G. J., A census of carbohydrate-active enzymes in the genome of
Arabidopsis thaliana. Plant Mol. Biol. 2001, 47, 55-72.
[75] Sénéchal, F., Wattier, C., Rustérucci, C., Pelloux, J., Homogalacturonan-modifying enzymes: structure,
expression, and roles in plants. J Exp Bot 2014, 65, 5125-5160.
[76] Peaucelle, A., Louvet, R., Johansen, J. N., Höfte, H., et al., Arabidopsis phyllotaxis is controlled by the
methyl-esterification status of cell-wall pectins. Curr Biol 2008, 18, 1943-1948.
[77] Freshour, G., Clay, R. P., Fuller, M. S., Albersheim, P., et al., Developmental and tissue-specific structural
alterations of the cell-wall polysaccharides of Arabidopsis thaliana roots. Plant physiol 1996, 110, 1413-
1429.

Page 97
Chapitre 3

[78] Sasidharan, R., Voesenek, L. A. C. J., RPierik, R., Cell wall modifying proteins mediate plnat
acclimatization to biotic and abiotic stresses. Crit Rev Plant Sci 2011, 30, 548-562.
[79] Sedbrook, J. C., Carroll, K. L., Hung, K. F., Masson, P. H., Somerville, C. R., The Arabidopsis SKU5 gene
encodes an extracellular glycosyl phosphatidylinositol-anchored glycoprotein involved in directional root
growth. Plant Cell 2002, 14, 1635-1648.
[80] Jacobs, J., Roe, J. L., SKS6, a multicopper oxidase-like gene, participates in cotyledon vascular patterning
during Arabidopsis thaliana development. Planta 2005, 222, 652-666.
[81] Zhao, Q., Nakashima, J., Chen, F., Yin, Y., et al., Laccase is necessary and nonredundant with peroxidase
for lignin polymerization during vascular development in Arabidopsis. Plant Cell 2013, 25, 3976-3987.
[82] Turlapati, P. V., Kim, K. W., Davin, L. B., Lewis, N. G., The laccase multigene family in Arabidopsis
thaliana: towards addressing the mystery of their gene function(s). Planta 2011, 233, 439-470.
[83] Belchí-Navarro, S., Almagro, L., Sabater-Jara, A. B., Fernández-Pérez, F., et al., Induction of trans-
resveratrol and extracellular pathogenesis-related proteins in elicited suspension cultured cells of Vitis
vinifera cv Monastrell. J Plant Physiol 2013, 170, 258-264.
[84] Nawrath, C., Schreiber, L., Franke, R. B., Geldner, N., et al., Apoplastic diffusion barriers in Arabidopsis.
The Arabidopsis Book 2013, 11, e0167.
[85] Girard, A. L., Mounet, F., Lemaire-Chamley, M., Gaillard, C., et al., Tomato GDSL1 is required for cutin
deposition in the fruit cuticle. Plant Cell 2002, 24, 3119-3134.
[86] Hosmani, P. S., Kamiya, T., Danku, J., Naseer, S., et al., Dirigent domain-containing protein is part of the
machinery required for formation of the lignin-based Casparian strip in the root. Proc Natl Acad Sci USA
2013, 110, 14498-14503.
[87] Stintzi, A., Heitz, T., Prasad, V., Wiedemann-Merdinoglu, S., et al., Plant pathogenesis-related proteins and
their role in defense against pathogens. Biochimie 1993, 75, 687-706.
[88] Wang, T., Chen, X., Zhu, F., Li, H., et al., Characterization of peanut germin-like proteins, AhGLPs in plant
development and defense. PLoS One 2013, 8, e61722.
[89] Hurkman, W. J., Tanaka, C. K., Effect of salt stress on germin gene expression in barley roots. Plant physiol
1996, 110, 971-977.
[90] Sano, T., Kuraya, Y., Amino, S., Nagata, T., Phosphate as a limiting factor for the cell division of tobacco
BY-2 cells. Plant Cell Physiol 1999, 40, 1-8.
[91] Tran, H. T., Qian, W., Hurley, B. A., She, Y. M., et al., Biochemical and molecular characterization of
AtPAP12 and AtPAP26: the predominant purple acid phosphatase isozymes secreted by phosphate-starved
Arabidopsis thaliana. Plant Cell Environ 2010, 33, 1789-1803.
[92] Rojas, H. J., Roldan, J. A., Goldraij, A., NnSR1, a class III non-S-RNase constitutively expressed in styles,
is induced in roots and stems under phosphate deficiency in Nicotiana alata. Ann Bot 2013, 112, 1351-1360.
[93] Nurnberger, T., Abel, S., Jost, W., Glund, K., Induction of an extracellular ribonuclease in cultured tomato
cells upon phosphate starvation. Plant physiol 1990, 92, 970-976.
[94] Sousa, A. O., Assis, E. T., Pirovani, C. P., Alvim, F. C., Costa, M. G., Phosphate-induced-1 gene from
Eucalyptus (EgPHI-1) enhances osmotic stress tolerance in transgenic tobacco. Genet Mol Res 2014, 13,
1579-1588.
[95] Adamczyk, B., Smolander, A., Kitunen, V., Godlewski, M., Proteins as nitrogen sources for plants. A short
story about exudation of proteases by plant roots. Plant Signal Behav 2010, 5, 817-819.
[96] Van der Hoorn, R., Plant proteases: from phenotypes to molecular mechanisms. Annu Rev Plant Biol 2008,
59, 191-223.

Page 98
Chapitre 3

[97] Deepa, S. S., Arumughan, C., Purification and characterization of soluble peroxidase from oil palm (Elaeis
guineensis Jacq) leaf. Phytochemistry 2002, 61, 503-511.
[98] Taylor, C. M., Karunaratne, C. V., Kie, N., Glycosides of hydroxyproline: Some recent, unusual
discoveries. Glycobiology 2012, 22, 575-767.
[99] Harthill, J. E., Ashford, D. A., N-glycosylation of horseradish peroxidase from cell culture. Biochem Soc
Trans 1992, 20, 113S.

Supporting Information

Supporting Information Fig. S1. Sampling for LC-MS/MS analyses: hydroponics cultures of A. thaliana.

Supporting Information Table S1. Identification by LC-MS/MS of proteins extracted from roots of A. thaliana
(data of untreated sample, biological repeats 1, 2, 3)

Supporting Information Table S2. Identification by LC-MS/MS of proteins extracted from roots of A. thaliana
(data of the CPLL experiment)

Supporting Information Table S3. Predicted sub-cellular localization and functional annotation of the proteins
extracted from cell walls.

Supporting Information Table S4. CWPs identified among the proteins extracted with salt solutions from
purified A. thaliana root cell walls: functional annotation, distribution into functional classes and comparison to
previously studied cell wall proteomes.

Supporting Information Table S5. MS data regarding the localization of Hyp residues in CIII Prx amino acid
sequences.

Page 99
Chapitre 3

Supporting Information Table S4. CWPs identified among the proteins extracted with salt solutions from purified A. thaliana root
cell walls: functional annotation, distribution into functional classes and comparison to previously studied cell wall proteomes.

The bioinformatic predictions of sub-cellular localization and of function have been performed using ProtAnnDB (http://www.polebio.lrsv.ups-tlse.fr/ProtAnnDB/). All
the CWPs have been put in WallProtDB together with the corresponding mass spectrometry data (http://www.polebio.lrsv.ups-tlse.fr/WallProtDB/).

PAC stands for Proteins acting on polysaccharides, OR for oxido-reductases, P for proteases, PL for proteins possible related to lipid metabolism, IR for proteins with
interaction domains (with proteins or polysaccharides), S for signaling, M for miscellaneous proteins, UF for proteins of unknown function.

The presence of the proteins in different A. thaliana cell wall proteomes is indicated by "1" in the relevant columns: roots (this work and Basu et al. 2006), cell
suspension cultures (see WallProtDB)and etiolated hypocotyls (see WallProtDB). In addition, the presence of homologous proteins in the B. oleracea xylam sap
proteome is indicated (Ligat et al. 2012).

Root proteome Xylem Cell


(Nguyen-Kim et al. this Root Etiolated All
sap suspension
work) proteome hypocotyls proteomes Accession Functional
proteome cultures Protein family (Putative) function
Basu et al. WallProtDB WallProtDB number class
CPLL Untreated Ligat et al. WallProtDB
(2006) (03.2015) (03.2015)
experiment extract (2011) (03.2015)
Proteins acting on
polysaccharides (PAC)
1 1 AT1G47600.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 1 1 AT3G09260.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 1 AT1G51470.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 1 AT1G66280.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 AT1G61820.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 AT1G66270.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 1 1 1 AT2G44450.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 AT3G03640.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 1 1 1 1 AT3G18080.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 AT3G60130.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 1 - GH1 (beta-glucosidase)
1 1 1 1 AT5G10560.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 3 - GH3
1 1 1 1 AT5G20950.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 3 - GH3

Page 100
Chapitre 3

1 AT3G47040.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 3 - GH3


glycoside hydrolase family 3 - GH3 (beta xylosidase 1)
1 AT5G49360.1 PAC glycoside hydrolase (GH)
(AtBXL1)
glycoside hydrolase family 3 - GH3 (beta-xylosidase)
1 1 AT1G78060.1 PAC glycoside hydrolase (GH)
(AtBXL7)
glycoside hydrolase family 5 - GH5 (glucan-1,3-beta
1 AT5G01930.1 PAC glycoside hydrolase (GH)
glucosidase)
glycoside hydrolase family 9 - GH9 (endo-1,3(4)-beta-
1 AT4G02290.1 PAC glycoside hydrolase (GH)
glucanase)
glycoside hydrolase family 16 - GH16 (endoxyloglucan
1 1 1 1 1 AT2G06850.1 PAC glycoside hydrolase (GH)
transferase) (At-XTH4)
glycoside hydrolase family 16 - GH16 (endoxyloglucan
1 1 1 AT1G65310.1 PAC glycoside hydrolase (GH)
transferase) (At-XTH17)
glycoside hydrolase family 16 - GH16 (endoxyloglucan
1 AT4G30280.1 PAC glycoside hydrolase (GH)
transferase) (At-XTH18)
1 1 AT1G64760.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 AT3G55430.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 AT4G29360.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 AT5G42100.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 AT5G42720.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 AT1G66250.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 AT2G01630.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 AT3G07320.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 1 AT3G13560.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 1 AT4G16260.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 AT4G31140.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 AT5G56590.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 AT1G11820.2 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 1 1 1 AT5G58090.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 17 - GH17 (beta-1,3-glucosidase)
1 AT4G19720.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 18 - GH18
1 AT4G19750.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 18 - GH18
1 1 1 1 1 AT4G19810.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 18 - GH18
1 1 1 1 AT1G02360.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 19 - GH19
1 1 AT1G56680.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 19 - GH19
1 1 1 AT2G43610.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 19 - GH19
1 1 1 1 1 AT3G12500.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 19 - GH19
1 1 1 1 AT4G01700.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 19 - GH19

Page 101
Chapitre 3

1 1 1 AT3G04720.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 19 - GH19


1 1 1 AT2G43590.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 19 - GH19
glycoside hydrolase family 20 - GH20 (N-acetyl-beta-
1 1 1 1 1 AT3G55260.1 PAC glycoside hydrolase (GH)
glucosaminidase)
glycoside hydrolase family 20 - GH20 (N-acetyl-beta-
1 1 1 1 AT1G65590.1 PAC glycoside hydrolase (GH)
glucosaminidase)
glycoside hydrolase family 27 - GH27 (alpha-
1 1 1 1 AT3G56310.1 PAC glycoside hydrolase (GH)
galactosidase/melibiase)
glycoside hydrolase family 27 - GH27 (alpha-
1 1 1 1 1 AT5G08380.1 PAC glycoside hydrolase (GH)
galactosidase/melibiase)
glycoside hydrolase family 27 - GH27 (alpha-
1 1 1 1 AT5G08370.1 PAC glycoside hydrolase (GH)
galactosidase/melibiase)
glycoside hydrolase family 27 - GH27 (alpha-
1 1 AT5G19100.1 PAC glycoside hydrolase (GH)
galactosidase/melibiase)
1 1 1 AT3G62110.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 1 1 AT4G23500.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 1 AT5G14650.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 1 1 AT3G06770.2 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 1 1 AT3G16850.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 AT1G05660.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 1 AT1G80170.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 AT3G57790.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 1 1 AT2G28100.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 29 - GH29 (alpha-L-fucosidase)
glycoside hydrolase family 31 - GH31 (alpha-xylosidase)
1 1 1 1 1 AT1G68560.1 PAC glycoside hydrolase (GH)
(XYL1)
glycoside hydrolase family 31 - GH31 (alpha-glucosidase)
1 1 1 AT5G11720.1 PAC glycoside hydrolase (GH)
(AGLU1)
glycoside hydrolase family 32 - GH32
1 1 1 AT1G55120.1 PAC glycoside hydrolase (GH)
(fructosidase/invertase) (AtcwINV3, FRUCT5)
glycoside hydrolase family 32 - GH32
1 AT5G11920.1 PAC glycoside hydrolase (GH)
(fructosidase/invertase) (AtcwINV6)
glycoside hydrolase family 32 - GH32
1 1 1 1 1 AT3G13790.1 PAC glycoside hydrolase (GH)
(fructosidase/invertase) (AtcwINV1)
glycoside hydrolase family 35 - GH35 (beta-galactosidase)
1 1 1 1 AT5G63810.1 PAC glycoside hydrolase (GH)
(BGAL10)
glycoside hydrolase family 35 - GH35 (beta-galactosidase)
1 1 AT5G63800.1 PAC glycoside hydrolase (GH)
(BGAL6)
1 1 AT2G32810.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 35 - GH35 (beta-galactosidase)

Page 102
Chapitre 3

(BGAL9)
1 1 1 1 AT3G26720.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 38 - GH38 (alpha-mannosidase)
1 1 1 1 AT5G13980.1 PAC glycoside hydrolase (GH) glycoside hydrolase family 38 - GH38 (alpha-mannosidase)
glycoside hydrolase family 51 - GH51 (alpha-
1 1 1 1 1 AT3G10740.1 PAC glycoside hydrolase (GH)
arabinofuranosidase)
glycoside hydrolase family 79 - GH79 (endo-beta-
1 1 1 1 AT5G34940.2 PAC glycoside hydrolase (GH)
glucuronidase/heparanase)
glycoside hydrolase family 79 - GH79 (endo-beta-
1 1 1 1 1 AT5G07830.1 PAC glycoside hydrolase (GH)
glucuronidase/heparanase)
glycoside hydrolase family 79 - GH79 (endo-beta-
1 AT5G61250.1 PAC glycoside hydrolase (GH)
glucuronidase/heparanase)
Peptide-N4-(N-acetyl-beta-glucosaminyl)asparagine amidase
1 1 1 1 AT3G14920.1 PAC PNGase A
A
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 1 1 1 AT1G11580.1 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 AT3G10720.2 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 1 1 AT3G43270.1 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 AT1G02810.1 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 AT2G47550.1 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 1 1 1 AT1G53830.1 PAC carbohydrate esterase (CE)
PME) (AtPME2)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 1 1 1 AT3G14310.1 PAC carbohydrate esterase (CE)
PME) (AtPME3)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 AT2G45220.1 PAC carbohydrate esterase (CE)
PME) (AtPME17)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 AT1G05310.1 PAC carbohydrate esterase (CE)
PME) (AtPME8)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 AT2G43050.1 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 AT4G02330.1 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 AT5G04970.1 PAC carbohydrate esterase (CE)
PME)
carbohydrate esterase family 8 - CE8 (pectin methylesterase -
1 1 AT5G09760.1 PAC carbohydrate esterase (CE)
PME)

Page 103
Chapitre 3

carbohydrate esterase family 13 - CE13 (pectin acylesterase -


1 1 1 1 AT4G19410.1 PAC carbohydrate esterase (CE)
PAE)
carbohydrate esterase family 13 - CE13 (pectin acylesterase -
1 1 1 1 AT5G45280.2 PAC carbohydrate esterase (CE)
PAE)
carbohydrate esterase family 13 - CE13 (pectin acylesterase -
1 AT1G57590.1 PAC carbohydrate esterase (CE)
PAE)
carbohydrate esterase family 13 - CE13 (pectin acylesterase -
1 AT3G05910.1 PAC carbohydrate esterase (CE)
PAE)
carbohydrate esterase family 13 - CE13 (pectin acylesterase -
1 AT3G09410.1 PAC carbohydrate esterase (CE)
PAE)
carbohydrate esterase family 13 - CE13 (pectin acylesterase -
1 AT5G26670.1 PAC carbohydrate esterase (CE)
PAE)
1 AT1G67750.1 PAC polysaccharide lyase (PL) polysaccharide lyase family 1 - PL1 (pectate lyase)
1 1 AT4G24780.1 PAC polysaccharide lyase (PL) polysaccharide lyase family 1 - PL1 (pectate lyase)
1 AT3G07010.1 PAC polysaccharide lyase (PL) polysaccharide lyase family 1 - PL1 (pectate lyase)
1 1 AT5G48900.1 PAC polysaccharide lyase (PL) polysaccharide lyase family 1 - PL1 (pectate lyase)
1 AT1G04680.1 PAC polysaccharide lyase (PL) polysaccharide lyase family 1 - PL1 (pectate lyase)
homologous to A. thaliana PMR5 (Powdery Mildew
1 AT2G31110.2 PAC
Resistant) (carbohydrate acylation)
homologous to A. thaliana PMR5 (Powdery Mildew
1 AT2G42570.1 PAC
Resistant) (carbohydrate acylation)
1 1 1 1 AT2G39700.1 PAC expansin alpha-expansin (ATHEXP ALPHA 1.6) (AtEXPA4)
1 1 1 AT2G28950.1 PAC expansin alpha-expansin (ATHEXP ALPHA 1.8) (AtEXPA6)
1 1 1 1 1 AT5G02260.1 PAC expansin alpha-expansin (ATHEXP ALPHA 1.10) (AtEXPA9)
1 1 1 1 AT1G20190.1 PAC expansin alpha-expansin (ATHEXP ALPHA 1.14) (AtEXPA11)
1 AT5G56320.1 PAC expansin alpha-expansin (AtEXPA14)
1 AT2G03090.1 PAC expansin alpha-expansin (ATHEXP ALPHA 1.3) (AtEXPA15)
1 1 AT4G01630.1 PAC expansin alpha-expansin (AtEXPA17)
1 AT1G65680.1 PAC expansin beta-expansin (ATHEXP BETA 1.4) (AtEXPB2)
1 AT4G28250.1 PAC expansin beta-expansin (AtEXPB3)
1 1 1 1 1 AT3G45970.1 PAC expansin expansin-like A (ATHEXP BETA 2.1) (AtEXLA1)
1 1 1 1 AT3G45960.1 PAC expansin expansin-like A (ATHEXP BETA 2.3) (AtEXLA3)
Oxido-reductases (OR)
1 1 1 1 AT1G05240.1 OR peroxidase peroxidase (AtPrx01)
1 1 1 1 1 AT1G05260.1 OR peroxidase peroxidase (AtPrx03)
1 1 AT1G14540.1 OR peroxidase peroxidase (AtPrx04)
1 AT1G14550.1 OR peroxidase peroxidase (AtPrx05)

Page 104
Chapitre 3

1 1 1 1 1 1 AT1G71695.1 OR peroxidase peroxidase (AtPrx12)


1 1 1 1 AT2G18150.1 OR peroxidase peroxidase (AtPrx15)
1 1 AT2G18980.1 OR peroxidase peroxidase (AtPrx16)
1 1 1 1 AT2G22420.1 OR peroxidase peroxidase (AtPrx17)
1 1 1 AT2G37130.1 OR peroxidase peroxidase (AtPrx21)
1 1 1 1 AT2G38380.1 OR peroxidase peroxidase (AtPrx22)(ATPEA)
1 1 1 1 AT2G38390.1 OR peroxidase peroxidase (AtPrx23)
1 1 AT2G43480.1 OR peroxidase peroxidase (AtPrx26)
1 1 1 AT3G01190.1 OR peroxidase peroxidase (AtPrx27)(ATP12a)
1 1 AT3G03670.1 OR peroxidase peroxidase (AtPrx28)
1 1 1 1 1 AT3G21770.1 OR peroxidase peroxidase (AtPrx30)(ATP7a)
1 1 1 1 AT3G28200.1 OR peroxidase peroxidase (AtPrx31)
1 1 1 1 1 1 AT3G32980.1 OR peroxidase peroxidase (AtPrx32)(ATP16A)
1 1 1 AT3G49110.1 OR peroxidase peroxidase (AtPrx33)
1 1 1 1 1 1 AT3G49120.1 OR peroxidase peroxidase (AtPrx34)
1 1 1 1 1 1 AT4G08770.1 OR peroxidase peroxidase (AtPrx37)(ATP38)
1 1 1 1 AT4G08780.1 OR peroxidase peroxidase (AtPrx38)
1 1 1 1 1 AT4G11290.1 OR peroxidase peroxidase (AtPrx39)
1 AT4G21960.1 OR peroxidase peroxidase (AtPrx42)
1 1 AT4G26010.1 OR peroxidase peroxidase (AtPrx44)
1 1 1 1 AT4G30170.1 OR peroxidase peroxidase (AtPrx45)(ATP8a)
1 1 AT4G33420.1 OR peroxidase peroxidase (AtPrx47)
1 1 1 1 AT4G36430.1 OR peroxidase peroxidase (AtPrx49)(ATP31)
1 1 AT4G37520.1 OR peroxidase peroxidase (AtPrx50)
1 1 1 AT4G37530.1 OR peroxidase peroxidase (AtPrx51)
1 1 AT5G15180.1 OR peroxidase peroxidase (AtPrx56)
1 1 1 1 1 AT5G17820.1 OR peroxidase peroxidase (AtPrx57)(ATP13a)
1 1 AT5G19890.1 OR peroxidase peroxidase (AtPrx59)
1 AT5G24070.1 OR peroxidase peroxidase (AtPrx61)
1 1 1 1 AT5G42180.1 OR peroxidase peroxidase (AtPrx64)
1 1 1 1 1 AT5G64100.1 OR peroxidase peroxidase (AtPrx69)(ATP3a)
1 1 1 1 1 AT5G64120.1 OR peroxidase peroxidase (AtPrx71)(ATP15a)
1 1 1 1 AT5G66390.1 OR peroxidase peroxidase (AtPrx72)(ATP6a)
1 AT5G67400.1 OR peroxidase peroxidase (AtPrx73)
1 1 AT1G71040.1 OR multicopper oxidase LPR2 (LOW PHOSPHATE ROOT2)
1 1 1 1 AT4G25240.1 OR multicopper oxidase multicopper oxidase (AtSKS1, homologous to SKU5)

Page 105
Chapitre 3

1 1 AT4G37160.1 OR multicopper oxidase multicopper oxidase (AtSKS15, homologous to SKU5)


1 AT2G23630.1 OR multicopper oxidase multicopper oxidase (AtSKS16, homologous to SKU5)
1 1 1 AT5G66920.1 OR multicopper oxidase multicopper oxidase (AtSKS17, homologous to SKU5)
1 1 1 AT4G22010.1 OR multicopper oxidase multicopper oxidase (AtSKS4, homologous to SKU5)
1 1 1 1 1 1 AT1G76160.1 OR multicopper oxidase multicopper oxidase (AtSKS5, homologous to SKU5)
1 1 1 1 1 AT1G41830.1 OR multicopper oxidase multicopper oxidase (AtSKS6, homologous to SKU5)
1 1 1 1 1 AT4G12420.1 OR multicopper oxidase multicopper oxidase (AtSKU5)
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 1 AT1G30720.1 OR
reductase reductase
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 1 1 1 AT1G30730.1 OR
reductase reductase
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 1 1 1 AT4G20860.1 OR
reductase reductase
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 1 1 1 1 AT5G44380.1 OR
reductase reductase
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 AT1G26380.1 OR
reductase reductase
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 AT1G30700.1 OR
reductase reductase
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 1 1 AT4G20830.1 OR
reductase reductase
berberine-bridge oxido- berberine-bridge enzyme (S)-reticulin:oxygen oxido-
1 AT5G11540.1 OR
reductase reductase
early nodulin AtEN14 homologous to blue copper binding
1 1 1 1 AT3G20570.1 OR blue copper binding protein
protein
early nodulin AtEN20 homologous to blue copper binding
1 1 1 AT4G12880.1 OR blue copper binding protein
protein
early nodulin AtEN22 homologous to blue copper binding
1 1 1 1 1 1 AT5G15350.1 OR blue copper binding protein
protein
1 1 1 1 1 AT2G02850.1 OR blue copper binding protein plantacyanin (blue copper binding protein) (AtPNC)
1 1 1 1 1 AT2G44790.1 OR blue copper binding protein uclacyanin II (blue copper binding protein) (AtUCC2)
1 1 1 1 AT2G30210.1 OR laccase laccase (AtLAC3)
1 AT2G40370.1 OR laccase laccase (AtLAC5)
1 1 AT3G09220.1 OR laccase laccase (AtLAC7)
1 AT1G62810.1 OR copper amine oxidase
1 1 AT4G14940.1 OR copper amine oxidase
1 AT1G21090.1 OR expressed protein (cupredoxin domain)
1 1 AT1G20225.1 OR expressed protein (thioredoxin fold)

Page 106
Chapitre 3

1 AT1G21750.1 OR expressed protein (thioredoxin fold)


1 AT4G29740.1 OR , expressed protein (FAD binding domain)
1 AT1G14185.1 OR GMC OR
1 AT3G56060.1 OR GMC OR
1 1 1 1 AT1G07080.1 OR thiol reductase (GILT family)
Proteases (P)
Asp protease (pepsin family) (Peptidase family A01.A03,
1 AT4G04460.1 P Asp protease
MEROPS)
1 AT1G11910.1 P Asp protease Asp protease
Asp protease (pepsin family) (Peptidase family A01.A09,
1 1 1 AT3G18490.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A45,
1 1 AT3G51350.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A47,
1 1 1 1 1 AT3G52500.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A48,
1 1 1 1 1 1 AT3G54400.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A05,
1 1 1 AT1G01300.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A11,
1 1 1 AT3G25700.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A43,
1 AT3G51330.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A27,
1 AT4G33490.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A01.A15,
1 1 1 1 AT5G10770.1 P Asp protease
MEROPS)
Asp protease (pepsin family) (Peptidase family A1,
1 1 1 1 AT1G09750.1 P Asp protease
subfamily A1B unassigned peptidases, MEROPS)
Asp protease (pepsin family) (Peptidase family A1,
1 1 1 1 AT3G61820.1 P Asp protease
subfamily A1B unassigned peptidases, MEROPS)
Asp protease (pepsin family) (Peptidase family A1,
1 1 1 1 1 AT5G07030.1 P Asp protease
subfamily A1B unassigned peptidases, MEROPS)
Asp protease (pepsin family) (Peptidase family A1,
1 1 1 1 1 1 AT1G03220.1 P Asp protease subfamily A1B, non peptidase homologues, MEROPS)
(homologous to carrot EDGP and tomato XEGIP)
Asp protease (pepsin family) (Peptidase family A1,
1 1 1 1 1 AT1G03230.1 P Asp protease subfamily A1B, non peptidase homologues, MEROPS)
(homologous to carrot EDGP and tomato XEGIP)

Page 107
Chapitre 3

Asp protease (pepsin family) (Peptidase family A1,


1 1 1 1 AT5G19110.1 P Asp protease subfamily A1B, non peptidase homologues, MEROPS)
(homologous to carrot EDGP and tomato XEGIP)
Asp protease (pepsin family) (Peptidase family A1,
1 1 AT5G48430.1 P Asp protease subfamily A1B, non peptidase homologues, MEROPS)
(homologous to carrot EDGP and tomato XEGIP)
Cys proteinase (cathepsin B family) (Peptidase family
1 1 AT1G02305.1 P Cys protease
C01.049, MEROPS)
Cys proteinase (cathepsin B family) (Peptidase family
1 1 1 1 1 AT4G01610.1 P Cys protease
C01.144, MEROPS)
1 1 1 AT4G35350.1 P Cys protease Cys proteinase (cathepsin family)
1 AT4G39090.1 P Cys protease Cys proteinase (cathepsin family)
Cys proteinase (cathepsin family) (Peptidase family C01.162
1 1 1 1 AT3G45310.1 P Cys protease
MEROPS)
Cys proteinase (cathepsin family) (XCP2, XYLEM
1 1 1 1 AT1G20850.1 P Cys protease CYSTEINE PEPTIDASE 2) (Peptidase family C01.121,
MEROPS)
1 1 AT3G19390.1 P Cys protease Cys proteinase (papain family)
Cys proteinase (papain family) (Peptidase family C01.163
1 1 1 1 AT5G60360.1 P Cys protease
MEROPS)
Cys proteinase (papain family) (RD21 peptidase) (Peptidase
1 1 1 1 1 1 AT5G43060.1 P Cys protease
family C01.A12 MEROPS)
Cys proteinase (papain family) (RD21A) Peptidase family
1 1 1 1 1 1 AT1G47128.1 P Cys protease
C01.064 MEROPS)
1 1 AT4G32940.1 P Cys protease peptidase family C13 (legumain family, clan CD, MEROPS).
1 1 AT1G78680.1 P Peptidase C26 Peptidase C26
1 AT5G19740.1 P Peptidase M28 Peptidase M28
Ser carboxypeptidase (AtSCPL1) (Peptidase family S10,
1 AT5G36180.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL3) (Peptidase family S10,
1 AT1G73280.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL8) (Peptidase family S28.A41,
1 AT2G22990.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase C (SCPL11) (Peptidase family S10,
1 1 AT2G22970.1 P Ser carboxypeptidase
S10.004, MEROPS)
Ser carboxypeptidase C (SCPL12) (Peptidase family S10,
1 1 AT2G22920.1 P Ser carboxypeptidase
S10.004, MEROPS)
Ser carboxypeptidase (AtSCPL15) (Peptidase family S10,
1 AT3G12240.1 P Ser carboxypeptidase
MEROPS)

Page 108
Chapitre 3

Ser carboxypeptidase (AtSCPL24, BRS1, Brassinosteroid-


1 1 1 AT4G30610.1 P Ser carboxypeptidase Insensitive BRI suppressor 1) (Peptidase family S10.015,
MEROPS)
Ser carboxypeptidase (AtSCPL25) (Peptidase family S10,
1 1 1 AT3G02110.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL26) (Peptidase family S10,
1 AT2G35780.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL27) (Peptidase family S10,
1 AT3G07990.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL28) (Peptidase family S10,
1 1 AT2G35770.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL29) (Peptidase family
1 1 AT4G30810.1 P Ser carboxypeptidase
S28.A32, MEROPS)
Ser carboxypeptidase (AtSCPL34) (Peptidase family
1 1 1 1 AT5G23210.1 P Ser carboxypeptidase
S10.A39, MEROPS)
Ser carboxypeptidase (AtSCPL40) (Peptidase family
1 1 AT3G63470.1 P Ser carboxypeptidase
S28.A41, MEROPS)
Ser carboxypeptidase (AtSCPL42) (Peptidase family
1 1 AT5G42240.1 P Ser carboxypeptidase
S10.A21, MEROPS)
Ser carboxypeptidase (AtSCPL45) (Peptidase family
1 1 1 AT1G28110.1 P Ser carboxypeptidase
S10.A24, MEROPS)
Ser carboxypeptidase (AtSCPL48) (Peptidase family S10,
1 1 AT3G45010.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL49) (Peptidase family S10,
1 1 AT3G10410.1 P Ser carboxypeptidase
MEROPS)
Ser carboxypeptidase (AtSCPL50) (Peptidase family S10,
1 1 AT1G15000.1 P Ser carboxypeptidase
S10.003, MEROPS)
Ser carboxypeptidase (AtSCPL51) (Peptidase family S10,
1 1 AT2G27920.1 P Ser carboxypeptidase
MEROPS)
1 AT5G65760.1 P Ser carboxypeptidase Ser carboxypeptidase (Peptidase family S28.A02, MEROPS)
1 1 1 AT4G36195.1 P Ser carboxypeptidase Ser carboxypeptidase (Peptidase family S28.A26, MEROPS)
Ser protease (subtilisin) (AtSBT1.4) (Peptidase family
1 1 1 AT3G14067.1 P Ser protease
S08.A28, MEROPS)
Ser protease (subtilisin) (AtSBT1.6) (Peptidase family
1 1 1 AT4G34980.1 P Ser protease
S08.A39, MEROPS)
Ser protease (subtilisin) (AtSBT1.7, ARA12) (Peptidase
1 1 1 1 1 1 1 AT5G67360.1 P Ser protease
family S8.112, MEROPS)
Ser protease (subtilisin) (AtSBT1.8, AF70) (Peptidase family
1 1 1 1 1 AT2G05920.1 P Ser protease
S08.A24, MEROPS)

Page 109
Chapitre 3

Ser protease (subtilisin) (AtSBT2.1, ALE1) (Peptidase family


1 1 AT1G30600.1 P Ser protease
S08.A03, MEROPS)
Ser protease (subtilisin) (AtSBT2.3) (Peptidase family
1 AT5G44530.1 P Ser protease
S08.A04, MEROPS)
Ser protease (subtilisin) (AtSBT2.5) (Peptidase family
1 AT2G19170.1 P Ser protease
S8.A02, MEROPS)
Ser protease (subtilisin) (AtSBT3.6) (Peptidase family
1 1 AT4G10550.1 P Ser protease
S08.A43, MEROPS)
Ser protease (subtilisin) (AtSBT3.8) (Peptidase family
1 AT4G10540.1 P Ser protease
S08.A45, MEROPS)
Ser protease (subtilisin) (AtSBT4.12) (Peptidase family
1 1 1 1 AT5G59090.1 P Ser protease
S08.A20, MEROPS)
Ser protease (subtilisin) (AtSBT4.14, XSP1, XYLEM
1 1 1 AT4G00230.1 P Ser protease SERINE PROTEINASE 1) (Peptidase family S08.A14,
MEROPS)
Ser protease (subtilisin) (AtSBT5.3, AIR3) (Peptidase family
1 1 AT2G04160.1 P Ser protease
S08.119, MEROPS)
Proteins possibly related to lipid metabolism (PL)
1 1 1 1 AT1G54000.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 1 1 AT1G54010.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 1 1 AT1G54030.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 1 1 AT3G14220.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 AT3G27950.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 AT4G30140.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 AT5G03610.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 AT1G09390.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 AT1G28580.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 1 AT1G29670.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 AT1G53940.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 AT2G19060.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 AT3G50400.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 AT3G62280.1 PL GDSL family lipase acylhydrolase (GDSL family)
1 1 1 AT5G05960.1 PL lipid transfer protein (LTP) lipid transfer protein/trypsin-alpha amylase inhibitor
1 1 AT3G51600.1 PL lipid transfer protein (LTP) non-specific lipid-transfer protein 5 (LTP5)
1 1 1 1 AT2G22170.1 PL expressed protein (lipase/lipooxygenase domain, PLAT/LH2)
expressed protein (lipase/lipooxygenase domain, PLAT/LH2)
1 AT2G41475.1 PL
(ATS3 embryo-specific protein 3)
1 1 AT1G45015.1 PL expressed protein (MD-2-related lipid-recognition (ML)

Page 110
Chapitre 3

domain)
expressed protein (MD-2-related lipid-recognition (ML)
1 1 AT2G16005.1 PL
domain)
expressed protein (MD-2-related lipid-recognition (ML)
1 1 1 AT3G44100.1 PL
domain)
expressed protein (MD-2-related lipid-recognition (ML)
1 1 1 AT5G23830.1 PL
domain)
expressed protein (MD-2-related lipid-recognition (ML)
1 1 1 1 AT5G23820.1 PL
domain)
expressed protein (MD-2-related lipid-recognition (ML)
1 AT3G11780.1 PL
domain)
expressed protein (phospholipase C, phosphatidylinositol-
1 AT4G36945.1 PL
specific, X domain)
1 AT3G51730.1 PL expressed protein (saposin domains)
1 AT5G01800.1 PL expressed protein (saposin domains)
1 1 AT1G74210.1 PL glycerophosphodiesterase
1 1 1 1 AT5G55480.1 PL glycerophosphodiesterase (GPDL1)
glycerophosphodiesterase (MRH5, MORPHOGENESIS OF
1 1 1 1 1 AT4G26690.1 PL
ROOT HAIR) (GPDL2)
Proteins with interaction domains (with proteins or polysaccharides) (IR)
1 1 AT1G52060.1 IR lectin jacalin
1 1 1 1 AT1G52070.1 IR lectin jacalin
1 1 1 AT1G52050.1 IR lectin jacalin
1 1 1 1 1 1 AT1G78830.1 IR lectin lectin (curculin-like)
1 1 1 1 1 1 AT1G78850.1 IR lectin lectin (curculin-like)
1 1 1 1 1 AT1G78860.1 IR lectin lectin (curculin-like)
1 1 1 1 AT5G18470.1 IR lectin lectin (curculin-like)
1 1 1 1 1 AT1G53070.1 IR lectin lectin (legume lectin domain)
1 1 1 1 AT3G15356.1 IR lectin lectin (legume lectin domain)
1 1 1 1 1 AT1G33590.1 IR LRR protein expressed protein (LRR domains)
1 1 1 1 AT3G20820.1 IR LRR protein expressed protein (LRR domains)
1 1 1 1 AT5G12940.1 IR LRR protein expressed protein (LRR domains)
1 1 1 1 AT5G23400.1 IR LRR protein expressed protein (LRR domains)
1 AT4G06744.1 IR LRR protein expressed protein (LRR domains)
1 1 1 AT1G33610.1 IR LRR protein expressed protein (LRR domains)
1 1 1 1 AT2G17120.1 IR expressed protein (LysM domain)
1 1 AT4G12390.1 IR pectin methyl esterase inhibitor plant invertase/pectin methylesterase inhibitor (PMEI)

Page 111
Chapitre 3

(PMEI)
pectin methyl esterase inhibitor
1 1 AT5G62350.1 IR plant invertase/pectin methylesterase inhibitor (PMEI)
(PMEI)
pectin methyl esterase inhibitor
1 AT1G62770.1 IR plant invertase/pectin methylesterase inhibitor (PMEI)
(PMEI)
pectin methyl esterase inhibitor
1 AT2G47670.1 IR plant invertase/pectin methylesterase inhibitor (PMEI)
(PMEI)
pectin methyl esterase inhibitor
1 AT3G49330.1 IR plant invertase/pectin methylesterase inhibitor (PMEI)
(PMEI)
pectin methyl esterase inhibitor
1 1 1 AT4G25260.1 IR plant invertase/pectin methylesterase inhibitor (PMEI)
(PMEI)
1 1 1 AT2G02100.1 IR protease inhibitor homologous to gamma thionin (defensin)
1 AT2G02130.1 IR protease inhibitor homologous to gamma thionin (defensin)
1 AT5G63660.1 IR protease inhibitor homologous to gamma thionin (defensin)
inhibitor family I18 (family I18 unassigned peptidase
1 1 AT2G43535.1 IR protease inhibitor
inhibitor homologues, MEROPS)
inhibitor family I25 (cystatin family) (subfamily I25B
1 1 1 1 AT4G16500.1 IR protease inhibitor
unassigned peptidase inhibitor homologues, MEROPS)
inhibitor family I3 (Kunitz-P family) (subfamily I3
1 AT3G04320.1 IR protease inhibitor
unassigned peptidase inhibitor homologues, MEROPS)
inhibitor family I3 (Kunitz-P family) (subfamily I3A
1 1 1 1 1 AT1G17860.1 IR protease inhibitor
unassigned peptidase inhibitor homologues, MEROPS)
inhibitor family I3 (Kunitz-P family) (subfamily I3A
1 1 1 1 1 AT1G73260.1 IR protease inhibitor
unassigned peptidase inhibitor homologues, MEROPS)
Proteins possibly involved in signaling (S)
fasciclin-like arabinogalactan
1 1 1 1 1 1 AT5G55730.1 S fasciclin-like arabinogalactan protein (FLA1)
protein (FLA)
fasciclin-like arabinogalactan
1 1 1 1 1 AT4G12730.1 S fasciclin-like arabinogalactan protein (FLA2)
protein (FLA)
fasciclin-like arabinogalactan
1 1 1 1 1 AT2G04780.1 S fasciclin-like arabinogalactan protein (FLA7)
protein (FLA)
fasciclin-like arabinogalactan
1 1 1 1 1 AT2G45470.1 S fasciclin-like arabinogalactan protein (FLA8)
protein (FLA)
1 1 AT3G17840.1 S LRR-RLK leucine-rich repeat receptor protein kinase
1 1 AT5G37450.1 S LRR-RLK leucine-rich repeat receptor protein kinase
1 AT3G28450.1 S LRR-RLK leucine-rich repeat receptor protein kinase
1 AT2G14510.1 S LRR-RLK leucine-rich repeat receptor protein kinase (LRR I subfamily)
leucine-rich repeat receptor protein kinase (LRR I sub-
1 1 AT1G51850.1 S LRR-RLK
family)

Page 112
Chapitre 3

leucine-rich repeat receptor protein kinase (LRR I sub-


1 1 AT5G59680.1 S LRR-RLK
family)
leucine-rich repeat receptor protein kinase (LRR I sub-
1 AT1G51890.1 S LRR-RLK
family)
1 AT2G28960.1 S lectin receptor protein kinase (malectin domain)
leucine-rich repeat receptor protein kinase (LRR I sub-
1 AT2G28990.1 S LRR-RLK
family)
leucine-rich repeat receptor protein kinase (LRR VIII sub-
1 AT5G49760 S LRR-RLK
family)
leucine-rich repeat receptor protein kinase (LRR III
1 1 1 1 1 AT3G02880.1 S LRR-RLK
subfamily)
1 AT1G70520.1 S lectin receptor protein kinase
1 AT4G21410.1 S lectin receptor protein kinase
Structural proteins (SP)
leucine-rich repeat extensin
1 AT3G22800.1 SP LRR-extensin (AtLRX6)
(LRX)
1 AT2G33790.1 SP proline-rich protein (PRP) AGP/proline-rich protein (AtAGP30)
1 1 1 1 AT1G28290.1 SP proline-rich protein (PRP) AGP/proline-rich protein (AtAGP31)
Miscellaneous proteins (M)
1 AT4G11210.1 M dirigent protein dirigent protein (AtDIR14)
1 AT4G11190.1 M dirigent protein dirigent protein (AtDIR13)
1 AT3G13650.1 M dirigent protein dirigent protein (AtDIR7)
1 AT5G42510.1 M dirigent protein dirigent protein (AtDIR1)
1 1 AT1G55210.1 M dirigent protein dirigent protein (AtDIR20)
1 1 AT1G64160.1 M dirigent protein dirigent protein (AtDIR5)
1 1 1 1 1 AT4G23690.1 M dirigent protein dirigent protein (AtDIR6)
1 1 1 1 AT5G42500.1 M dirigent protein dirigent protein (AtDIR2)
gibberellic acid-stimulated
1 1 1 1 AT1G75750.1 M gibberellic acid-stimulated Arabidopsis (AtGASA1) protein
Arabidopsis (GASA) protein
gibberellic acid-stimulated
1 1 1 AT5G15230.1 M gibberellic acid-stimulated Arabidopsis (AtGASA4) protein
Arabidopsis (GASA) protein
gibberellic acid-stimulated
1 AT3G02885.1 M gibberellic acid-stimulated Arabidopsis (AtGASA5) protein
Arabidopsis (GASA) protein
gibberellic acid-stimulated
1 1 1 1 AT5G14920.1 M gibberellic acid-stimulated Arabidopsis (AtGASA14) protein
Arabidopsis (GASA) protein
1 1 1 1 1 AT1G13750.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP1)
1 1 1 AT1G13900.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP2)
1 1 1 1 AT1G25230.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP4)

Page 113
Chapitre 3

1 1 AT2G03450.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP9)


1 1 1 1 AT2G27190.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP12)
1 1 1 1 1 AT3G07130.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP15)
1 AT3G52820.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP22)
1 1 1 1 1 AT5G34850.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP26)
1 AT5G50400.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP27)
1 AT5G63140.1 M purple acid phosphatase (PAP) purple acid phosphatase (AtPAP29)
1 1 AT1G18250.1 M thaumatin thaumatin
1 1 1 1 1 AT2G28790.1 M thaumatin thaumatin
1 1 AT5G40020.1 M thaumatin thaumatin
1 1 1 1 AT1G73620.1 M thaumatin thaumatin (PR5, ATLP1)
1 1 1 1 1 AT4G11650.1 M thaumatin thaumatin (PR5, ATOSM34)
1 1 1 1 AT4G29270.1 M acid phosphatase (class B)
1 AT5G44020.1 M acid phosphatase (class B)
1 1 1 1 1 AT4G25900.1 M aldose-1-epimerase
1 1 1 AT3G47800.1 M aldose-1-epimerase
1 1 AT1G18980.1 M germin
1 1 AT3G05950.1 M germin
1 1 AT5G39110.1 M germin
1 1 1 1 1 AT1G18970.1 M germin (GLP1) (GLP4)
1 1 1 1 1 1 AT3G62020.1 M germin (GLP10)
1 1 AT5G39160.1 M germin (GLP2a, GLP5a)
1 1 AT4G14630.1 M germin (GLP9)
1 1 1 AT5G38930.1 M germin (subfamily 1 member 10)
1 1 1 AT5G38940.1 M germin (subfamily 1 member 11)
1 1 1 1 AT5G39120.1 M germin (subfamily 1 member 15)
1 1 1 1 AT1G02335.1 M germin (subfamily 2 member 2)
1 1 1 1 1 AT1G09560.1 M germin (subfamily 2, member 1, GLP5)
pathogenesis-related protein (PR) 1 / Cys-rich secretory
1 1 AT4G33720.1 M
protein (SCP)
pathogenesis-related protein (PR) 1 / Cys-rich secretory
1 1 AT5G26130.1 M
protein (SCP)
pathogenesis-related protein (PR) 1 / Cys-rich secretory
1 1 1 1 AT5G66590.1 M
protein (SCP)
1 1 1 1 1 AT4G08950.1 M phosphate-induced (phi) protein 1
1 1 1 1 AT5G09440.1 M phosphate-induced (phi) protein 1

Page 114
Chapitre 3

1 1 1 1 1 AT5G64260.1 M phosphate-induced (phi) protein 1


1 1 1 AT5G51550.1 M phosphate-induced (phi) protein 1
1 1 AT4G29690.1 M phosphodiesterase/phosphate transferase
1 1 AT4G29700.1 M phosphodiesterase/phosphate transferase
1 1 1 AT4G24340.1 M phosphorylase
1 AT4G28940.1 M phosphorylase
quinoprotein glucose dehydrogenase (weakly hedgehog
1 1 1 AT1G74790.1 M
interacting protein HIPL1)
quinoprotein glucose dehydrogenase (weakly hedgehog
1 1 1 AT5G62630.1 M
interacting protein HIPL2)
1 1 1 1 AT1G14210.1 M ribonuclease T2
1 1 AT1G14220.1 M ribonuclease T2
1 1 1 AT1G26820.1 M ribonuclease T2
1 1 1 1 AT2G39780.1 M ribonuclease T2
1 AT1G24450.1 M ribonuclease III
1 AT1G74020.1 M strictosidine synthase
Proteins of unknown function (UF)
1 1 AT3G11800.1 UF expressed protein
1 1 1 AT3G15950.1 UF expressed protein
1 1 1 1 AT5G19230.1 UF expressed protein
1 1 1 AT4G28100.1 UF expressed protein
1 1 AT1G21680.1 UF expressed protein
1 1 1 AT5G18860.1 UF expressed protein
1 AT5G50200.1 UF expressed protein
1 AT5G12200.1 UF expressed protein (amidohydrolase domain)
1 AT4G35220.1 UF expressed protein (cyclase domain)
1 AT3G07460.1 UF expressed protein (DUF538)
1 AT3G07470.1 UF expressed protein (DUF538)
1 AT1G02816.1 UF expressed protein (DUF538)
1 AT4G02370.1 UF expressed protein (DUF538)
1 AT5G19860.1 UF expressed protein (DUF538)
1 1 1 1 AT1G80240.1 UF expressed protein (DUF642)
1 1 1 1 AT2G41800.1 UF expressed protein (DUF642)
1 1 AT2G41810.1 UF expressed protein (DUF642)
1 1 1 1 1 AT3G08030.1 UF expressed protein (DUF642)
1 1 1 1 AT4G32460.1 UF expressed protein (DUF642)

Page 115
Chapitre 3

1 1 1 1 1 AT5G11420.1 UF expressed protein (DUF642)


1 1 1 1 1 1 AT5G25460.1 UF expressed protein (DUF642)
expressed protein (Gnk2-homologous domain, antifungal
1 AT1G61750.1 UF
protein of Ginkgo seeds)
expressed protein (Gnk2-homologous domain, antifungal
1 1 1 AT5G41290.1 UF
protein of Ginkgo seeds)
expressed protein (Gnk2-homologous domain, antifungal
1 1 1 1 1 AT5G48540.1 UF
protein of Ginkgo seeds)
expressed protein (Gnk2-homologous domain, antifungal
1 1 1 AT3G22060.1 UF
protein of Ginkgo seeds)
1 1 1 1 AT2G04690.1 UF expressed protein (human brain CREG protein domain)
1 1 1 1 AT3G20370.1 UF expressed protein (MATH domain)
1 1 1 1 1 AT5G26260.1 UF expressed protein (MATH domain)
1 1 1 1 AT5G26280.1 UF expressed protein (MATH domain)
1 AT1G58270.1 UF expressed protein (MATH domain)
1 1 AT5G10130.1 UF expressed protein (Ole e1 allergen domain)
1 AT4G29520.1 UF expressed protein (saposin domain)
1 AT5G57655.2 UF expressed protein (xylose isomerase-like TIM barrel)
1 1 1 1 1 1 AT2G15220.1 UF Plant Basic Secretory Protein (BSP)
386 270 15 75 98 134 229

Page 116
Chapitre 3

Supporting Information Table S5. Occurrence of Hyp in Prxs identified in the A. thaliana root proteome

Different colors correspond to different Prx sequence sub-families. Underlined amino acid sequences are conserved between 90% of the A. thaliana Prxs.

Peptide sequence Accession Peroxibase Observed Hyp (O)/Pro (P) Amino acid Position on the WebLogo
Peroxidases (Prxs) number annotation ratio context sequence (see Fig. 5)
Conserved motifs
motif 1 CP/ONVTNIVRETIVNELR At3g49120 AtPrx34 3O/0P CPN 14-15 (CP)
LSP/OSFYDKTCP/OQVFDIATTTIVNALR, 1 OP / 1 OO / 0 PP
TCPQVFDIATTTIVNALR* At4g08770 AtPrx37 6P SPS, CPQ 14-15 (CP)
TCP/OP/OIFNIIGDTIVNELR At3g38390 AtPrx23 1 OO / 30 PP CPP 14-15 (CP)
YYAHSCP/OQVNEIVR At4g36430 AtPrx49 2O/0P CPQ 14-15 (CP)
VGFYSQSCP/OQAETIVR At5g17820 AtPrx57 1 O / 15 P CPQ 14-15 (CP)

motif 2 TVSCADILTIAAQQAVNLAGGP/OSWR At3g32980 AtPrx32 11 O / 65 P GPS 124-125 (GP)


TVSCADLLAIAAQESVVLAGGP/OSWR At4g08770 AtPrx37 2 O / 38 P GPS 124-125 (GP)
ESIVLAGGP/OSWMVPNGR At4g08780 AtPrx38 3 O / 11 P GPS 124-125 (GP)
EVVVLTGGP/OSYPVELGR At4g30170 AtPrx45 3 O / 58 P GPS 124-125 (GP)
DVVATGGP/OSWSVP/OTGR At3g21770 AtPrx30 11 OP / 3 OO / 27 PP GPS, VPT 124-125 (GP)
DVVFTGGP/ONWSVPTGR At1g05260 AtPrx03 3O/7P GPN 124-125 (GP)
DSIVAIGGP/OTWNVP/OTGR At4g11290 AtPrx27 3 OP/ 1 OO / 5 PP GPT , VPT 124-125 (GP)

motif 3 DSLQAFFALANTNLP/OAPFFTLP/OQLK At3g32980 AtPrx32 10 OP / 1 PO / 56 PP LPA, LPQ 150-152 (P)


GFMDLANDNLP/OAP/OFFTLNQLK At4g08770 AtPrx37 5 OP / 1 PO / 45 PP LPA, APF 150-152 (P)
ISQASDVNLPGP/OSDSVAK At5g64100 AtPrx69 3 O / 53 P GPS 152
RDSVEAFFALANTALP/OSPFSTLTQLK At3g38390 AtPrx23 2 O / 15 P LPS 150 (P)

Page 117
Chapitre 3

Additional observations
IISDHIQNHIHNGP/OSLAAPLIR At3g21770 AtPrx30 1O/4P GPS 33

FQQTFVTAP/OATLR At2g18980 AtPrx16 2 O / 55 P APA 37

DHP/ODDMSLAGDGFDTVVK At4g30170 AtPrx45 8 O / 52 P HPD 74

P/ONCRNKVSCADILALATR At2g18980 AtPrx16 4O/0P DPN 100 (99: conserved C)


QLEAACP/ORTVSCADIVTLATR At4g26010 AtPrx44 7O/1P CPR 100 (99: conserved C)

IYNFSP/OTTR At4g30170 AtPrx45 1O/4P SPT 201

ITSFQGTGRPDPSMDP/OALVTSLR At5g17820 AtPrx57 2 O / 13 P DPA 214

GLIQSDQELFSSP/ODASDTLPLVR At4g08770 AtPrx37 12 O / 91 P SPD 275


GLIQSDQELFSSP/ODAADTLPLVR At4g08780 AtPrx38 4 O / 32 P SPD 275
GLIQSDQEIFSTP/OGADTIP/OLVNQYSSDMSVFFR At3g38380 AtPrx22 3 OP / 3 PO / 10 PP TPG, IPL 275

MGNITP/OLTGTQGQIR At3g32980 AtPrx32 1 O / 21 P TPL 312

* In this case, two types of peptides with partial covering have been listed. Note that the longest one has been obtaiend by partial tryptic cleavage and that the shortest one exhibits no Hyp.

Page 118
Chapitre 3

3.4. Comparaison protéomes pariétaux sauvage/mutant lrx1

3.4.1. Phénotype des racines en culture hydroponique

Il est à noter que le phénotype des racines des plantes lrx1 est plus marqué que celui qui
est décrit (Figure 1.14, Baumberger et al., 2001). Les poils absorbants sont quasiment absents
en culture hydroponique (Figure 3.1). Le phénotype porte essentiellement sur l’élongation des
poils absorbants.

sauvage lrx1

Figure 3.1 : Phénotypes des racines en culture hydroponique


Les racines sont récoltées après 18 jours de croissance en culture hydroponique et observées sous la loupe
binoculaire.

Page 119
Chapitre 3

3.4.2. Caractérisation moléculaire du mutant lrx1

Le mutant lrx1 a été créé par insertion d’un transposon En-1 dans la séquence du gène
LRX1. Des amorces pour amplifier l’ADN autour des sites d’insertion/excision du transposon
ont été synthétisées et des PCR ont été réalisées sur l’ADN génomique (Figure 3.2A). Les
amplifiats ont été séquencés. Les résultats ont montré que nous avions bien un mutant lrx1.
En effet, une excision de six nucléotides a été trouvée dans le génome du mutant étudié à la
position attendue (Baumberger et al., 2001). Cette mutation peut générer une protéine avec
deux acides aminés de moins et un acide aminé modifié (Figure 3.2B). Pour vérifier si la
mutation affecte l’expression du gène lrx1, des RT-PCR ont été effectuées sur des ARN
extraits des plantes sauvages et mutantes. Les résultats ont montré que des transcrits sont
présents dans les plantes sauvages et mutantes. Les deux types de plante pourraient donc
produire la protéine LRX1. L’hypothèse est que la structure de la protéine LRX1 serait
affectée dans son domaine LRR, perturbant ainsi ses interactions avec des protéines
partenaires (C Ringli, communication personnelle).

A lrx1 sauvage B

Ile Pro Ala Gly Gln


Mutant lrx1 ATA CCG G–– –– – –CC GGT CAA
LRX1_ADNc ATA CCG GGA AGT ATC GGT CAA

Sauvage ATA CCG GGA AGT ATC GGT CAA


** * ** * * * ** * ** *
1000 pb
Ile Pro Gly Ser Ile Gly Gln
500 pb

Figure 3.2 : Caractérisation moléculaire du mutant lrx1


A. Les réactions PCR réalisées avec les amorces LRX1 sur l’ADN génomique (tailles attendues : 584 pb)
B. Séquences nucléique et protéique affectées par la mutation

3.4.3. Extraction de protéines de parois de racines du mutant lrx1

Nous avons produit des racines en grande quantité pour réaliser trois répétitions
biologiques pour le mutant. Les trois extraits de protéines à partir des racines de plantes
sauvages (WT1-3) ont été comparés à ceux des racines de plantes mutantes lrx1 (M1-3). Les
protéines ont été séparées par électrophorèse 1D avec 40 µg de protéines par échantillon.
Comme pour les plantes sauvages, les profils ont montré une bonne reproductibilité des
expériences. Par contre, il n’y a pas de différence visible entre les sauvages et les mutants
après coloration des protéines au bleu de Coomassie (Figure 3.3).

Page 120
Chapitre 3

kDa WT1 WT2 WT3 M1 M2 M3

170
130
95
72

55
43

34

26

17

Figure 3.3 : Analyse par electrophorèse 1D des protéines extraites des racines
de plantes sauvages et mutantes
Le gel a été coloré au bleu de Coomassie. Les masses moléculaires (en kDa) et la position des marqueurs
sont indiquées sur la gauche. WT1, WT2, WT3 : 3 répétitions biologiques du sauvage. M1, M2, M3 : 3
répétitions biologiques du mutant lrx1.

Les identifications des protéines ont été effectuées par spectrométrie de masse de type LC-
MS/MS et bioinformatique, à partir des échantillons ayant subi une migration courte en
électrophorèse 1D et une découpe en 3 bandes (résultat non montré). Nous avons validé des
protéines qui ont au moins deux peptides spécifiques dans un échantillon et sont identifiées
dans au moins deux répétitions biologiques. Les résultats complets de ces expériences
peuvent être consultés dans WallProtDB (http://www.polebio.lrsv.ups-
tlse.fr/WallProtDBAtRoots/index.php, login : wallprot / password : r12oo3t;S).

3.4.4. Recherche des différences entre les protéomes pariétaux de plantes


sauvages et de plantes mutantes lrx1

3.4.4.1. Extraits totaux de protéines pariétales

Parmi les protéines identifiées dans les extraits totaux, 270 protéines dans le sauvage et
258 protéines dans le mutant lrx1 sont prédites pour être secrétées. Les protéomes ont été
comparés : 31 protéines spécifiques aux plantes sauvage, 19 protéines spécifiques aux plantes
mutantes lrx1 et 239 protéines communes entre les deux ont été identifiées (Figure 3.4).

Page 121
Chapitre 3

sauvage lrx1
270 258
31 239 19

Figure 3.4 : Comparaison des protéomes des racines sauvages et mutantes lrx1

Les analyses quantitatives basées sur la comparaison des surfaces des pics n’ont pas permis
d’identifier des différences significatives. Pour rechercher des différences, nous nous sommes
basés sur la notion de présence/absence et sur le décompte des spectres spécifiques. Dans le
premier cas, nous sommes conscients que pour la plupart des protéines, la notion d’absence ne
correspond pas à l’absence totale de peptide spécifique, mais plutôt à la présence d’un nombre
insuffisant de spectres spécifiques pour valider une identification. Dans le second cas, nous
n’avons considéré que des différences d’un facteur supérieur à 1,5 entre les nombres de
spectres spécifiques présents dans les deux échantillons. Le tableau 3.1 ne reprend que les
différences observées.

Contrairement à notre attente, les protéines LRX1 et LRX2 spécifiquement exprimées dans
les racines n’ont pas pu être identifiées, même si la recherche de peptides spécifiques a été
effectuée en prenant en compte la présence possible de résidus Hyp.

Parmi les différences observées, on observe, des protéines trouvées spécifiquement (31) ou
en plus grande quantité (8) dans le sauvage. Il s’agit de protéines appartenant aux familles
suivantes : glycosyl hydrolases (GH) (7), pectine acylesterases (PAE) (1), expansin-like A3
(AtEXLA3) (1), blue copper binding protein (1), peroxydases (3), proteases (9), GDSL lipase
(1), lectine récepteur kinase (1), dirigent protéines (3), pathogenesis-related protein 1 (1 PR1
et 2 PR5), purple acid phosphatases (PAP) (3), ribonucléase T2 (1), protéines inconnues (3),
AGP30 et une protéine à domaine PAC. D’autre part, on observe 21 protéines caractéristiques
du mutant, parmi lesquelles 19 sont spécifiques et 2 sont en plus grande quantité. On peut
souligner la présence de 5 leucine-rich receptor kinases identifiés uniquement dans les racines
des plantes mutantes. Cependant, globalement, la plupart des familles de protéines comportent
à la fois des protéines spécifiques au sauvage et au mutant.

La fonction des familles de protéines identifiées par protéomique a été discutée dans
l’article (cf §3.2.). Les différences observées entre les protéomes des plantes sauvages et
mutantes constituent une première piste vers l’identification de protéines qui pourraient
interagir avec LRX1 et contribuer à la formation ou/et à l’élongation des poils racinaires. Il
serait très intéressant maintenant de choisir des gènes candidats, de vérifier l’expression de
ces gènes dans les racines et d’étudier leur fonction.

Page 122
Chapitre 3

identification dans les racines de plantes sauvages seulement


identification dans les racines du mutant lrx1 seulement
davantage de protéines dans les racines de plantes sauvages
davantage de protéines dans les racines de plantes mutantes lrx1

plantes
numéro plantes
mutantes plantes sauvages plantes mutantes lrx1 annotation fonctionnelle
d’accès sauvages
lrx1

identification (1) répétitions répétitions


pas d'identification (0) biologiques biologiques

1 2 3 moyenne écart-type 1 2 3 moyenne écart-type


AT5G48070 0 1 0 1 1 0 2 2 2,0 0,0 glycoside hydrolase family 16 (endoxyloglucan transferase) (AtXTH20)
AT2G06850 1 1 9 10 9 9,3 0,6 3 6 5 4,7 1,5 glycoside hydrolase family 16 (endoxyloglucan transferase) (AtXTH4)
AT4G31140 1 0 2 1 3 2,5 0,7 0 2 1 glycoside hydrolase family 17 (beta-1,3-glucosidase)
AT2G43610 1 1 74 47 43 54,7 16,9 24 33 49 35,3 12,7 glycoside hydrolase family 19
AT5G08370 1 0 4 0 2 3,0 1,4 1 0 0 glycoside hydrolase family 27 (alpha-galactosidase/melibiase)
AT5G08380 1 0 5 2 0 3,5 2,1 0 1 0 glycoside hydrolase family 27 (alpha-galactosidase/melibiase)
AT3G06770 1 0 5 3 6 4,7 1,5 1 1 4 glycoside hydrolase family 28 (polygalacturonase)
AT1G23460 0 1 2 1 1 1 3 2 2,5 0,7 glycoside hydrolase family 28 (polygalacturonase)
AT3G26720 1 0 4 2 1 3,0 1,4 1 0 1 glycoside hydrolase family 38 (alpha-mannosidase)
AT5G45280 1 0 10 4 2 5,3 4,2 0 4 1 carbohydrate esterase family 13 (pectin acylesterase - PAE)
AT3G45960 1 0 4 2 1 3,0 1,4 1 1 0 expansin-like A (ATHEXP BETA 2.3) (AtEXLA3)
AT1G26380 0 1 0 0 0 9 2 3 4,7 3,8 berberine-bridge enzyme (S)-reticulin:oxygen oxido-reductase
AT4G12880 1 0 2 0 2 2,0 0,0 1 0 1 early nodulin AtEN20 homologous to blue copper binding protein
AT1G21090 1 0 2 2 2 2,0 0,0 1 1 0 expressed protein (cupredoxin domain)

Page 123
Chapitre 3

AT4G29740 0 1 1 0 2 3 0 3 3,0 0,0 expressed protein (FAD binding domain)


AT1G05240 1 0 3 2 4 3,0 1,0 0 0 1 peroxidase (AtPrx01)
AT2G18980 1 1 14 16 16 15,3 1,2 11 9 9 9,7 1,2 peroxidase (AtPrx16)
AT3G32980 1 1 106 89 100 98,3 8,6 134 157 152 147,7 12,1 peroxidase (AtPrx32)
AT4G08770 1 1 109 94 135 112,7 20,7 189 176 175 180,0 7,8 peroxidase (AtPrx37)
AT4G30170 1 1 140 168 163 157,0 14,9 76 94 117 95,7 20,6 peroxidase (AtPrx45)
AT5G05340 0 1 0 0 0 2 5 4 3,7 1,5 peroxidase (AtPrx52)
AT1G78670 1 0 2 2 1 2,0 0,0 0 1 0 peptidase C26
AT1G78680 1 0 4 4 0 4,0 0,0 1 3 1 peptidase C26
AT2G43070 0 1 1 1 2 2 1 2 2,0 0,0 peptidase family A22 (AtSPPL3) (presenilin family )
AT4G32940 1 0 4 4 3 3,7 0,6 1 0 3 peptidase family C13 (legumain family, clan CD)
AT4G30810 0 1 1 2 1 0,0 0,0 2 3 2 2,3 0,6 Ser carboxypeptidase (AtSCPL29)
AT3G63470 1 0 3 0 4 3,5 0,7 1 1 0 Ser carboxypeptidase (AtSCPL40)
AT5G42240 0 1 1 0 2 2 1 2 2,0 0,0 Ser carboxypeptidase (SCPL42)
AT2G22920 1 0 5 3 3 3,7 1,2 1 1 2 0,0 0,0 Ser carboxypeptidase C (SCPL12)
AT5G23210 1 0 4 2 2 2,7 1,2 2 1 1 Ser carboxypeptidase D (SCPL34)
AT3G10410 1 0 5 2 1 3,5 2,1 2 1 1 Ser carboxypeptidase C (SCPL49)

AT4G00230 1 0 6 2 1 4,0 2,8 1 4 1 Ser protease (subtilisin) (AtSBT44, XSP1, XYLEM SERINE PROTEASE 1)
AT1G47128 1 1 11 9 10 10,0 1,0 8 5 5 6,0 1,7 Cys proteinase (papain family) (RD21A)
AT1G52050 0 1 6 0 1 0 3 2 2,5 0,7 jacalin
AT2G28960 0 1 0 0 1 3 0 2 2,5 0,7 lectin (malectin) receptor kinase
AT5G06860 0 1 2 1 1 2 2 2 2,0 0,0 PGIP1 (LRR domains)
AT5G23840 0 1 2 1 0 3 2 1 2,5 0,7 expressed protein (ML domain - MD-2-related lipid recognition domain)
AT3G27950 1 0 4 1 2 3,0 1,4 0 0 2 lipase acylhydrolase (GDSL family)
AT4G21410 1 0 2 2 3 2,3 0,6 1 1 1 lectin receptor kinase
AT1G56145 0 1 0 0 0 2 1 3 2,5 0,7 leucine-rich repeat receptor protein kinase
AT5G58300 0 1 0 1 1 0 2 4 3,0 1,4 leucine-rich repeat receptor protein kinase
AT3G08680 0 1 0 0 1 1 2 2 2,0 0,0 leucine-rich repeat receptor protein kinase (LRR III subfamily)

Page 124
Chapitre 3

AT2G26730 0 1 0 0 1 1 3 2 2,5 0,7 leucine-rich repeat receptor protein kinase (LRR III subfamily)
AT5G16590 0 1 0 0 2 1 3 3 3,0 0,0 leucine-rich repeat receptor protein kinase (LRR III subfamily)
AT2G33790 1 0 4 2 2 2,7 1,2 1 1 3 AGP/Pro-rich protein (AtAGP30)
AT4G11210 1 0 1 2 5 3,5 2,1 1 0 5 dirigent protein
AT5G42500 1 0 2 2 2 2,0 0,0 3 1 1 dirigent protein
AT5G38940 1 1 40 36 24 33,3 8,3 16 17 31 21,3 8,4 germin
AT5G26130 1 0 2 2 2 2,0 0,0 0 0 0 pathogenesis-related protein (PR) 1 / Cys-rich secretory protein (SCP)
AT2G27190 1 0 2 2 2 2,0 0,0 0 0 1 purple acid phosphatase (AtPAP12)
AT5G34850 1 1 18 17 13 16,0 2,6 8 7 9 8,0 1,0 purple acid phosphatase (AtPAP26)
AT2G03450 1 0 3 1 2 2,5 0,7 1 1 1 purple acid phosphatase (AtPAP9)
AT2G39780 1 0 5 7 6 6,0 1,0 5 1 1 ribonuclease T2
AT1G18250 1 0 2 2 2 2,0 0,0 0 1 1 thaumatin (PR5)
AT5G40020 1 0 2 1 2 2,0 0,0 1 1 1 thaumatin (PR5)
AT1G74000 0 1 2 0 1 1 2 2 1,7 0,6 strictosidine synthase
AT1G61900 0 1 1 1 3 3 1 3 3,0 0,0 expressed protein
AT3G11800 1 0 2 2 3 2,3 0,6 1 1 1 expressed protein
AT5G26280 1 1 120 97 34 83,7 44,5 26 53 46 41,7 14,0 expressed protein (MATH domain)
AT5G10130 1 0 2 2 3 2,3 0,6 0 0 2 expressed protein (Ole e1 allergen domain, PAC domain)

Tableau 3.1. Différences entre les protéomes des plantes sauvages et mutantes lrx1 (comparaison du nombre de peptides spécifiques)

Page 125
Chapitre 3

3.4.4.2. Extraits de protéines traités par la technologie CPLL

Pour affiner ces résultats, la technologie CPLL (chromatographie d’affinité sur des ligands
peptidiques combinatoires) permettant de réduire la gamme dynamique des protéines et
d’ainsi enrichir en protéines minoritaires a également été mise en œuvre. L’objectif était de
rechercher des différences plus ténues entre les protéomes des racines sauvages et mutantes.
Au total, 386 protéines prédites pour être sécrétées ont été identifiées dans les racines
sauvages et 387 dans les racines mutantes lrx1, avec 26 protéines spécifiques aux racines
sauvages et 27 spécifiques aux racines mutantes (Figure 3.5). Ces données, associées à celles
obtenues à partir des extraits totaux, porte à 424 le nombre de protéines prédites pour être
sécrétées dans les racines sauvages et à 434 dans les racines mutantes lrx1.

sauvage lrx1
386 387
26 360 27

Figure 3.5 : Comparaison des protéomes des racines sauvages et mutantes lrx1
obtenus avec la technologie CPLL

Les différences observées ne sont pas les mêmes que celles mises en évidence avec les
extraits totaux de protéines (Tableau 3.2). Seules 3 protéines présentent le même profil :
At5g26130 (PR1), At1g23460 (GH28) et At5g16590 (leucine-rich receptor kinase). AGP30
est identifiée dans les racines de plantes mutantes seulement avec la technologie CPLL alors
qu’elle n’était identifiée que dans les plantes sauvages avec l’extrait total. Enfin, une protéine
de la famille LRX (LRX3) est identifiée.

Ces résultats parfois contradictoires n’ont permis qu’une interprétation qualitative. En


effet, il semble que la technologie CPLL ne permet pas d’assurer que les résultats obtenus
préservent les quantités relatives des différentes protéines présentes dans les échantillons
initiaux. Globalement, la couverture du protéome pariétal des racines des plantes mutantes
lrx1 a été augmentée comme dans le cas des plantes sauvages (cf § 3.2.).

Page 126
Chapitre 3

s lrx1 numéro d’accès annotation fonctionnelle


1 0 AT3G62110 glycoside hydrolase family 28 - GH28 (polygalacturonase)
1 0 AT1G57590 carbohydrate esterase family 13 - CE13 (pectin acylesterase - PAE)
1 0 AT1G05310 carbohydrate esterase family 8 - CE8 (pectin methylesterase - PME) (AtPME8)
1 0 AT4G02330 carbohydrate esterase family 8 - CE8 (pectin methylesterase - PME)
1 0 AT5G09760 carbohydrate esterase family 8 - CE8 (pectin methylesterase - PME)
1 0 AT4G30280 glycoside hydrolase family 16 - GH16 (endoxyloglucan transferase) (At-XTH18)
1 0 AT2G43590 glycoside hydrolase family 19 - GH19
1 0 AT5G49360 glycoside hydrolase family 3 - GH3 (beta xylosidase 1) (AtBXL1)
1 0 AT2G43480 peroxidase (AtPrx26)
1 0 AT5G67400 peroxidase (AtPrx73)
1 0 AT4G14940 copper amine oxidase
1 0 AT3G56060 GMC oxido-reductases
1 0 AT5G10770 Asp protease (pepsin family) (Peptidase family A1, MEROPS)
1 0 AT2G35770 Ser carboxypeptidase (AtSCPL28) (Peptidase family S10, MEROPS)
1 0 AT2G19170 Ser protease (subtilisin) (AtSBT2.5) (Peptidase family S8.A02, MEROPS)
1 0 AT5G18470 lectin (curculin-like)
1 0 AT3G49330 plant invertase/pectin methylesterase inhibitor (PMEI)
1 0 AT3G28450 leucine-rich repeat receptor protein kinase
1 0 AT5G37450 leucine-rich repeat receptor protein kinase
1 0 AT5G63140 homologous to purple acid phosphatase (AtPAP29)
1 0 AT1G18980 germin
1 0 AT5G26130 pathogenesis-related protein (PR) 1 / Cys-rich secretory protein (SCP)
1 0 AT1G14220 ribonuclease T2
1 0 AT1G26820 ribonuclease T2
1 0 AT4G02370 expressed protein (DUF538)
1 0 AT5G11420 expressed protein (DUF642)

0 1 AT1G23460 glycoside hydrolase family 28 - GH28 (polygalacturonase)


0 1 AT4G23500 glycoside hydrolase family 28 - GH28 (polygalacturonase)
0 1 AT5G34940 glycoside hydrolase family 79 - GH79 (endo-beta-glucuronidase/heparanase)
0 1 AT5G36890 glycoside hydrolase family 1 - GH1 (beta-glucosidase)
0 1 AT1G13130 glycoside hydrolase family 5 - GH5 (glucan-1,3-beta glucosidase)
0 1 AT2G34790 berberine-bridge enzyme (S)-reticulin:oxygen oxido-reductase
0 1 AT3G12230 Ser carboxypeptidase (AtSCPL14) (Peptidase family S10, MEROPS)
0 1 AT1G16905 lectin (D-mannose)
0 1 AT2G43535 inhibitor family I18 (family I18 unassigned peptidase inhibitor homologues, MEROPS)
0 1 AT1G07550 leucine-rich repeat receptor protein kinase (LRR I subfamily)
0 1 AT3G46330 leucine-rich repeat receptor protein kinase (LRR I subfamily)
0 1 AT5G16590 leucine-rich repeat receptor protein kinase (LRR III subfamily)
0 1 AT4G13340 LRR-extensin (AtLRX3)
0 1 AT2G33790 AGP/proline-rich protein (AtAGP30)
0 1 AT2G37870 lipid transfer protein/trypsin-alpha amylase inhibitor

Page 127
Chapitre 3

0 1 AT3G18280 lipid transfer protein/trypsin-alpha amylase inhibitor


0 1 AT3G60340 palmitoyl protein thioesterase
0 1 AT4G29260 acid phosphatase (class B)
0 1 AT1G35140 phosphate-induced (phi) protein 1
0 1 AT3G59930 expressed protein
0 1 AT4G11393 expressed protein
0 1 AT5G19230 expressed protein
0 1 AT5G39570 expressed protein
0 1 AT5G41290 expressed protein (DUF26)
0 1 AT3G07470 expressed protein (DUF538)
0 1 AT1G70690 expressed protein (Gnk2-homologous domain, antifungal protein of Ginkgo seeds)
0 1 AT3G20380 expressed protein (MATH domain)

Tableau 3.2 : Différences entre les protéomes des plantes sauvages (s) et mutantes lrx1
(technologie CPLL)
Les différences déjà observées dans l’extrait total de protéines sont indiquées en caractères gras.

3.4.5. Régulation de la transcription des gènes correspondant aux protéines


présentes seulement ou en plus grande quantité dans les racines sauvages

Dans l’idée d’identifier des protéines candidates pour la formation des poils absorbants,
nous avons recherché le profil d’expression des gènes correspondant à chacune des protéines
présentes ou en quantité plus importante dans les racines des plantes sauvages en nous basant
sur les résultats obtenus à partir des extraits totaux de protéines pariétales (cf § 3.3.4.1.). Pour
cela, nous avons utilisé les données de transcriptomique de la base de données Arabidopsis
eFP Browser 2.0 (www.bar.utoronto.ca/). Le résultat est résumé sur la figure 3.6.

Parmi les 39 gènes qui sont exprimés seulement chez le sauvage ou en plus grande
quantité, 25 ont un profil d’expression racinaire d’après les données disponibles dans les
banques. Trois groupes de gènes peuvent être distingués parmi ces 25 gènes : ceux ayant des
profils « épiderme », « trichoblastes » (cellules formant les poils absorbants) ou
« atrichoblastes ». Les transcrits de ces gènes ont été trouvés soit dans les trois zones de
différenciation des racines (méristématique, élongation ou maturation), soit dans une ou deux
de ces zones. Les poils racinaires se différencient dans la zone de maturation.

Il faut noter que AGP30 (cf § 1.4.2.) est un gène spécifiquement exprimé dans les
atrichoblastes et les cellules épidermiques qui se différencient à partir de ceux-ci dans les
racines (Van Hengel et al., 2004). At5g10130 code une protéine à domaine PAC (cf Chapitre
4) et est exprimé dans les atrichoblastes de la zone méristématique. Les gènes potentiellement
intéressants pour comprendre le phénotype des mutants lrx1 seraient ceux qui sont transcrits
spécifiquement dans les trichoblastes.

Page 128
Chapitre 3

Zones de racines épiderme atrichoblastes trichoblastes

At1g47128 (Cys proteinase)

At1g05240 (AtPrx01)
At4g32940 (peptidase C13)

At2g03450 (AtPAP9)
At5g08380 (GH27)
At3g26720 (GH38)

At1g78680 (peptidase C26)


At5g26280 (MATH)
maturation

At3g11800 (unknown)
At5g34850 (AtPAP26)
At3g10410 (Ser carboxypeptidase C-SCPL49)
At5g26130 (pathogenesis-related protein 1)

At3g27950 (lipase acylhydrolase)


At5g45280 (pectin acylesterase - PAE)

At2g39780 (RNAse T2)

At1g78670 peptidase C26


At3g06770 (GH28)

At4g30170 (AtPrx45)
élongation
At2g27190 (AtPAP12)

At4g12880 (unknown)

At3g63470 (AtSCPL40)
At2g18980 (AtPrx16)
At2g33790 (AGP30)
At2g43610 (GH19)
At5g10130 (PAC)

méristématique

Figure 3.6 : Profil d’expression des gènes codant pour des protéines
seulement identifiées ou plus abondantes dans les racines sauvages

3.5. Discussion

Cette étude étend la connaissance du protéome de la paroi cellulaire des racines d’A.
thaliana. En particulier, le protéome racinaire d’A. thaliana a été analysé et 424/434 protéines
pariétales ont été identifiées dans les racines sauvages/mutantes lrx1, respectivement. Ces
protéines appartiennent aux mêmes familles que dans les autres protéomes. Dans le protéome
pariétal racinaire, la proportion des oxydo-réductases (17%), des protéases (15,4%) et des
protéines de diverses familles (14,5%) est plus importante que dans les protéomes pariétaux
d’A. thaliana précédemment analysés, mais la proportion des protéines à domaines
d’interaction (7%) et des protéines de fonctions inconnues (7,8%) est plus faible (Albenne et
al., 2013). Les protéines structurales, famille à laquelle appartiennent les LRX, sont sous-
représentées comme dans la plupart des protéomes pariétaux décrits à ce jour. Seules les
protéines LRX3, AGP30 et AGP31 ont été identifiées dans cette étude comme protéine
structurale. Nous n’avons en effet pas mis en œuvre de stratégie spécifique pour les extraire
(Chen et al., 2015).

Par ailleurs, ce travail constitue la première étude protéomique de la paroi végétale faisant
appel à une chromatographie de type CPLL (technologie ProteoMiner™). Cette approche a
permis d’élargir 1,4 fois la taille du protéome pariétal des racines d’A. thaliana. Malgré ce
gain d’efficacité, les différences entre les protéomes pariétaux de plantes sauvage et mutantes

Page 129
Chapitre 3

sont restées subtiles. Elles pourraient corespondre à des différences quantitatives et/ou
d’extractabilité des protéines. Il nous a paru délicat d’effectuer des comparaisons quantitatives
dans la mesure où les différences quantitatives ne sont probablement pas conservées dans les
échantillons traités par CPLL.

Au cours de ces expériences, nous avons obtenu un résultat inattendu. En effet, nos
données constituent le premier rapport de la présence des résidus Hyp dans les séquences
d'acides aminés des peroxydases de classe III des plantes. L’hydroxylation des résidus Pro
n’est cependant pas systématique (en moyenne 10% des résidus Pro à une position donnée).
En utilisant des structures 3D de peroxydases de classe III natives disponibles dans la PDB
(http://www.rcsb.org/pdb/home/home.do), nous avons pu localiser la position des résidus Pro
correspondant aux Hyp identifiées dans cette étude. Certaines sont localisées à la surface de la
protéine, suggérant que ces peroxydases pourraient subir des O-glycosylations. Cependant,
des expériences supplémentaires seraient nécessaires pour démontrer la présence de telles
modifications post-traductionnelles. Par ailleurs, des résidus Hyp seraient localisés dans la
poche du site actif, laissant penser que la spécificité de substrat des peroxydases de classe III
pourrait être modulée par la présence de ces fonctions hydroxyles.

Des protéines candidates pouvant jouer un rôle dans la formation et/ou l’élongation des
poils racinaires ont été identifiées. Des analyses complémentaires seront nécessaires pour voir
si les gènes codant pour ces protéines sont effectivement transcrits dans les poils absorbants.
Par ailleurs, l’étude de mutants affectés dans l’expression de ces gènes permettrait de mettre
en évidence un rôle éventuel dans la formation des poils absorbants.

Page 130
Chapitre 4

4. EVOLUTION DES PROTEINES PARIETALES A


DOMAINE PAC

AGP31 est une AGP chimérique comportant plusieurs domaines depuis son extrémité N-
terminale jusqu’à son extrémité C-terminale : un peptide signal, un domaine AGP, un
domaine riche en His, un domaine riche en Pro et Hyp (H/PRP) et un domaine PAC qui
comporte 6 Cys à des positions conservées (Baldwin et al., 2000). Plusieurs articles ont déjà
décrit des protéines à domaine PAC chez différentes plantes mais sans apporter d’élément
précis sur la fonction de ces domaines (cf chapitre 1 § 1.4). Chez A. thaliana, May Hijazi
avait identifié plusieurs protéines comportant des domaines PAC associés ou non à d’autres
domaines (Hijazi, 2011).

Dans le cadre de ma thèse, il s’agissait de répertorier les protéines à domaine PAC chez
des plantes au cours de l’évolution et d’analyser leur phylogénie. Plusieurs questions étaient
posées : dans quels organismes ancestraux sont-elles présentes? A quels domaines les
domaines PAC sont-ils associés? Est-il possible d’établir des liens entre l’évolution de la
famille de protéines à domaines PAC et l’évolution de la composition et de la structure des
parois, notamment du fait de la terrestrialisation des plantes?

Pour atteindre nos objectifs, nous avons mis en place une stratégie en plusieurs étapes :
- identifier des organismes clefs au cours de l’évolution.
- définir le domaine PAC en utilisant le fait qu’il comporte 6 résidus Cys à des positions
conservées.
- effectuer un criblage informatique sur les génomes des organismes choisis en prenant en
compte différents critères pour identifier une protéine à domaine PAC : la présence d’un
peptide signal prédit, la conservation des 6 résidus Cys et la présence d’un intron entre les
résidus Cys2 et Cys3.
- répertorier les protéines par organisme et domaines associés.
- construire une phylogénie pour regrouper les protéines en clades et éventuellement
identifier des motifs conservés à l’intérieur de ces clades.

4.1. Choix des organismes clefs au cours de l’évolution pour l’étude des
protéines à domaine PAC

4.1.1. Phylogénie des plantes vertes


Les études phylogénétiques ont montré que la lignée des plantes vertes (Viridiplantae) a
pour origine monophylétique les algues vertes charophycées et est apparue voici 700 à 1500
millions d’années environ (Kenrick et Crane, 1997; Ruhfel et al., 2014). Par ailleurs, en
analysant 78 gènes codés par le génome chloroplastique de 360 différents taxa, des algues
vertes aux angiospermes, Ruhfel et al. (2014) ont proposé une phylogénie robuste (Figure

Page 131
Chapitre 4

4.1). En particulier, les plantes vertes sont clairement séparées du groupe frère des algues
d’eau douce, et les plantes vasculaires des plantes non vasculaires. Enfin, les
Zygnematophyceae sont positionnées comme un groupe frère des plantes terrestres.

Figure 4.1 : Phylogénie simplifiée des plantes vertes


(Davis et al., 2014) d’après Ruhfel et al.(2014)
Les branches en pointillés indiquent les noeuds phylogénétiques non résolus. Les relations bien résolues,
mais faisant encore l’objet de débats sont en rouge.

4.1.2. Choix des organismes d'intérêt


Pour notre étude, nous avons choisi des espèces représentatives de nœuds importants au
cours de l’évolution des plantes vertes (Figure 4.2) et dont les génomes étaient séquencés.

Page 132
Chapitre 4

Figure 4.2 : Choix des organismes d'intérêt


La phylogénie est celle établie par Ruhfel et al. (2014). Les ordres dans lesquels des espèces ont été choisies
sont indiqués avec un disque rouge sur la droite. Les nœuds qui ont été importants pour cette étude sont repérés
avec un disque vert.

Page 133
Chapitre 4

Les 21 organismes suivants ont été choisis :


- parmi les chlorophytes, une espèce appartenant aux Prasinophyceae (Ostreococcus
lucimarinus) et deux espèces appartenant aux Chlorophyceae, une monocellulaire
(Chlamydomonas reinhardtii) et une pluricellulaire (Volvox carteri);
- parmi les Zygnematophyceae, Penium margaritaceum car ses parois primaires ont des
caractéristiques similaires à celles des plantes supérieures (Domozych et al., 2014;
Rydahl et al., 2015);
- une mousse (Physcomitrella patens, Bryophyta) (Hornblad et al., 2013; McCarthy et
al., 2014) ;
- une fougère (Selaginella moelendorffii, Selaginellales) (Carey et al., 2013) ;
- deux gymnospermes (Pinus taeda, Pinus pinaster, Pinales) ;
- une plante ancêtre des angiospermes (Amborella trichopoda, Amborellales)
(Amborella Genome Project, 2013) ;
- parmi les monocotylédones, cinq graminées appartenant à l’ordre des Poales
(Brachypodium distachyon, Oryza sativa, Sorghum bicolor, Setaria italica, Panicum
virgatum) et une espèce appartenant à l’ordre des Asparagales (Phalaenopsis
equestris) ;
- parmi les dicotylédones, des plantes dont les parois secondaires présentent des
caractéristiques différentes (Kim et Triplett, 2001; Neutelings, 2011) : trois plantes à
parois secondaires lignifiées (Vitis vinifera et Populus trichocarpa de l’ordre des
Vitales et Eucalyptus grandis de l’ordre des Myrtales), une plante dont les tiges
comportent des cellules à parois secondaires hypolignifiées (Linum usitatissimum de
l’ordre des Malpighiales) et une plante dont les parois secondaires des trichomes des
graines sont cellulosiques (Gossypium raimondii de l’ordre des Malvales). En outre,
trois Brassicales (A. thaliana, A. lyrata et Capsella rubella) ont été étudiées, dont la
plante modèle A. thaliana.

4.2. Définition du domaine PAC pour la recherche dans les bases de


données génomiques

4.2.1. Première recherche de protéines à domaine PAC

Tout d’abord, nous avons effectué une recherche de protéines homologues au domaine
PAC d’AGP31 dans le génome A. thaliana par BLAST. Ceci a permis d’identifier 14
protéines à domaines PAC (Tableau 4.1).

Page 134
Chapitre 4

Caractéristiques des protéines Numéro d’accession

multidomaines à domaine PAC N-terminal At5g15780, At2g16630

multidomaines à domaine PAC C-terminal AGP31, At2g33790 (AGP30),


At2g34700, At5g05500

domaine PAC seul At4g08685, At1g29140, At1g78040,


At5g10130, At5g45880, At4g18596,
At3g09925, At5g54855

Tableau 4.1 : Protéines à domaine PAC d’A. thaliana


Le domaine PAC d’AGP31 a été utilisé pour rechercher d’autres protéines à domaine PAC dans le génome
d’A. thaliana par BLAST.

Les domaines PAC des 14 protéines comportent 6 Cys à des positions particulières avec les
espacements suivants (précisés entre parenthèses) : [Cys1 (2) Cys2 (20,22) Cys3 (33,41) Cys4
(11,15) Cys5 (39,46) Cys6]. L’ensemble de ces protéines comporte un peptide signal prédit.
Enfin, les gènes correspondants comportent un intron situé entre les séquences codant les
résidus Cys2 et Cys3, sauf dans le cas d’At5g05500.

Ensuite, nous avons recherché et trouvé des protéines à domaines PAC dans d’autres
génomes (cf § 4.1.2.) par BLAST en utilisant les séquences des domaines PAC d’A. thaliana.
Ce résultat était attendu puisque de telles protéines avaient déjà été décrites (cf chapitre 1 §
1.4.2.). En comparant les protéines à domaines PAC de cette première série, nous avons
trouvé des points communs et redéfini les caractéristiques des domaines PAC : (i) la présence
d’un peptide signal prédit dans la protéine comportant le domaine PAC ; (ii) la présence de 6
Cys avec des espacements de longueurs variables [Cys1 (2) Cys2 (10,30) Cys3 (20,50) Cys4
(8,20) Cys5 (25,60) Cys6] ; (iii) les résidus Cys1 et Cys2 sont toujours séparés par deux
acides aminés ; (iv) un résidu Gly se trouve habituellement en position -4 par rapport au
résidu Cys1 ; et (v) un intron se trouve habituellement entre les résidus Cys2 et Cys3.

Ceci nous a permis de poursuivre la recherche systématique des protéines à domaine PAC
dans les bases de données génomiques de tous les organismes d’intérêt (cf § 4.1.2.). Au
passage, ces recherches ont également été effectuées sur les génomes de Xanthomonas
campestris pv. campestris, Phytophthora infestans, Saccharomyces cerevisiae et Mus
musculus, mais n’ont pas permis de trouver de protéines à domaine PAC chez ces organismes.

Page 135
Chapitre 4

4.2.2. Recherche de séquences manquantes

A l’issue de ce premier travail, nous avons commencé à construire la phylogénie des


domaines PAC. Les séquences des domaines PAC de chaque groupe de plantes étroitement
apparentées ont été alignées en utilisant les outils d’alignement multiple MUSCLE ou Clustal
Omega. L’alignement a ensuite été visualisé à l’aide du logiciel BioEdit pour voir si les
séquences avaient été bien alignées. Des arbres phylogéniques de type Maximum likehood
tree ont été construits en utilisant les programmes bioinformatiques MEGA6, Phylogeny
et/ou ClustalW2 Phylogeny.

Nous avons remarqué que certains organismes n’étaient pas représentés dans certains
clades. Nous avons donc effectué des recherches complémentaires en utilisant des séquences
des domaines PAC de ces clades pour une recherche par BLAST
(http://blast.ncbi.nlm.nih.gov/Blast.cgi). Nous avons effectivement trouvé des protéines à
domaine PAC supplémentaires : il s’agissait de gènes dont la structure était mal annotée, ou
bien de protéines ne comportant que 5 résidus Cys, ou au contraire en comportant 7 ou 8. A
titre d’exemple, une protéine à domaine PAC supplémentaire a été identifiée chez A. lyrata,
par homologie avec les protéines At1g29140 et Carubv10012122m, d’A. thaliana et C.
rubella, respectivement (Figure 4.3). Ainsi, les membres des familles de protéines à domaine
PAC de ces trois Brassicales sont tous homologues entre eux.

Ces différentes recherches ont permis (i) d’identifier chez les algues des protéines
présentant des caractéristiques similaires aux protéines à domaine PAC, (ii) d’obtenir des
répertoires de protéines à domaine PAC dans les génomes des plantes terrestres, depuis les
mousses jusqu’aux angiospermes, et (iii) d’identifier des familles de protéines proches des
protéines à domaine PAC. Pour établir la phylogénie des domaines PAC, nous nous sommes
cependant centrés sur les domaines PAC répondant aux critères précisément définis ci-dessus
(cf § 4.2.1.), et nous appellerons « domaines PAC canoniques ».

Page 136
Chapitre 4

A B

Figure 4.3 : Arbre phylogénique des domaines PAC des Brassicales


Cet arbre a été construit avec l’outil bioinformatique MEGA6. A. Arbre initial permettant de repérer la
probable absence d’une séquence dans le génome d’A. lyrata (flèche rouge) B. Arbre construit avec une
séquence supplémentaire d’A. lyrata identifiée avec l’outil BLAST en utilisant les séquences At1g29140 ou
Carubv10012122m (flèche rouge). AT : A. thaliana, Aly : A. lyrata, Car : C. rubella.

4.3. Présence de protéines apparentées aux protéines à domaine PAC


chez les algues

La recherche de protéines à domaine PAC chez les algues O. lucimarinus, V. carteri, C.


reinhardtii et P. margaritaceum n’a pas permis d’identifier de protéine répondant à
l’ensemble des critères que nous avons définis (cf § 4.2.1.). Aucune séquence n’a été trouvée
dans le génome d’O. lucimarinus. Par contre, deux séquences présentant des particularités les
rapprochant de celles des domaines PAC ont été trouvées dans le génome de V. carteri,
Vocar20000513m et Vocar20006048m. Vocar20000513m comporte 6 résidus Cys, mais les
espacements entre elles sont différents de ceux définis pour les domaines PAC. Il y a par
exemple 5 acides aminés entre Cys1 et Cys2. Vocar20006048m comporte également 6

Page 137
Chapitre 4

résidus Cys, mais un domaine différent de ceux habituellement rencontrés dans les protéines à
domaine PAC est inséré entre le domaine riche en Pro et le domaine riche en Cys. Chez C.
reinhardtii, 14 protéines comportent des domaines apparentés au domaine PAC. Plusieurs de
ces protéines ont une organisation originale consistant en des domaines PAC intercalés avec
des domaines ayant des motifs de type SPXPP. Ces protéines peuvent être de très grande
taille. L’exemple de la protéine g11927.t1 qui comporte 3209 acides aminés est donné sur la
figure 4.4.

domaine présentant des caractéristiques communes avec les domaines PAC


motifs (SPXPP) domaine riche en His

Figure 4.4 : Structure de la protéine g11927.t1 de C. reinhardtii


X peut être n’importe quel acide aminé, mais dans la plupart de cas, il s’agit d’un résidu Ser.

Chez P. margaritaceum, les recherches bioinformatiques ont été difficiles du fait de la


qualité insuffisante du génome. Deux protéines présentant quelques caractéristiques
communes avec les protéines à domaine PAC ont été identifiées : JO204874.1 et JO206023.1.
La protéine JO204874.1 ne comporte que le domaine PAC. La protéine JO206023.1 comporte
un domaine PAC en N-ter et un autre domaine en C-ter différent de ceux habituellement
rencontrés dans les protéines à domaine PAC. La question de l’existence de protéines à
domaine PAC canoniques chez P. margaritaceum devra cependant être revue lorsque les
données de séquençage seront de meilleure qualité.

4.4. Répertoire des protéines à domaine PAC chez les plantes terrestres

L’ensemble de ces recherches bioinformatiques a permis la constitution d’un répertoire de


protéines à domaine PAC canoniques présentes dans les organismes suivants : la mousse P.
patens (2 protéines), la fougère S. moellendorffi (12), les gymnospermes (48), A. trichopoda
(11) ancêtre des angiospermes, et les angiospermes monocotylédones (128) et les
dicotylédones (120). Au total, 321 protéines à domaine PAC canonique ont été identifiées à
partir des données génomiques de 19 plantes terrestres (Tableau 4.2 et Annexe 1). Il faut noter
que la plupart des protéines à domaine PAC sont annotées dans les bases de données comme
«Pollen proteins Ole e1» (domaine PROSITE PS00925) (Villalba et al., 1993). Le motif
Pollen proteins Ole e 1 définissant la signature de cette famille particulière de protéines
d’allergènes est caractérisé par la séquence d'acides aminés [EQT]-G-X-V-Y-C-D-[TNP]-C-
R, où X peut être n’importe quel acide aminé. Toutefois, cette famille de protéines comprend
également des protéines ayant un nombre variable de Cys. De plus, le motif « Pollen proteins
Ole e1» ne prend en compte que les deux premiers résidus Cys du domaine PAC ainsi que les
acides aminés adjacents.

Page 138
Chapitre 4

Une classification des protéines à domaine PAC a pu être effectuée sur les bases
suivantes : (i) la présence/absence de domaines associés au domaine PAC ; (ii) la position de
domaines associés par rapport au domaine PAC (N- ou C-terminal) ; (iii) la présence d’un
intron entre les résidus Cys2 et Cys3. Les domaines associés au domaine PAC étaient de cinq
types : riche en His, PRP, AGP, EXT ou autre domaine. Toutes les protéines comportent un
peptide signal prédit en N-terminal.

Quatre types de protéines à domaine PAC ont ainsi été distingués (Figure 4.5) :
- Les protéines de type 1 comportent un domaine PAC. Les gènes codant les protéines
de type 1.1 ont un intron inséré entre les séquences des résidus Cys2 et Cys3. Les
gènes codant les protéines de type 1.2 sont dépourvus d’intron.
- Les protéines de type 2 comportent un domaine PAC en N-terminal de la protéine
mature, suivi d’un ou plusieurs domaines qui peuvent être : un domaine riche en
motifs [(XPn≥2X) où X peut être n’importe quel acide aminé sauf Pro] (2.2), un
domaine riche en résidus His (2.1 et 2.4), ou encore un autre domaine (2.3).
- Les protéines de type 3 comportent un domaine PAC en C-terminal précédé d’un ou
plusieurs domaines qui peuvent être : un domaine riche en résidus His (3.1), un
domaine riche en motifs [(XPn≥2X) où X peut être n’importe quel acide aminé sauf
Pro] (3.2 et 3.3). Les gènes codant les protéines de type 3.3 ne comportent pas
d’intron dans leur région codante.
- Les protéines de type 4 comportent un domaine PAC et deux domaine(s) de type
extensine (EXT) comportant des motifs (SPn≥2).

Protéines de type 1 Protéines de type 3


1.1 3.1.
1.2 3.2.
3.3.

Protéines de type 2 Protéines de type 4


2.1 4

2.2

2.3
2.4

peptide signal motifs Pro (XPn≥2X)


domaine PAC (+ intron) motifs extensine (SPn≥2)
domaine PAC Autre domaine

domaine riche en His

Figure 4.5 : Représentation schématique de la structure des protéines à domaine PAC


Les domaines ne sont pas représentés proportionnellement à leur taille.

Page 139
Chapitre 4

Certaines des protéines à domaine PAC comportent également des domaines AGP comme
AGP30 et AGP31. Cependant, ces domaines sont très courts et il est difficile de les identifier
avec certitude. Seule la reconnaissance de ces protéines par le réactif de Yariv démontrée pour
AGP 30 et AGP31 permettrait de confirmer la présence de motifs effectivement O-glycosylés
comme ceux des AGP (cf chapitre 1 §1.2.2.). Faute de preuves expérimentales, la présence
d’un tel domaine n’a pas été retenue pour notre classification des protéines à domaine PAC.

La distribution des types de protéines à domaine PAC chez les plantes terrestres étudiées
est résumée dans le tableau 4.2. Seulement deux protéines à domaine PAC ont été identifiées
chez la mousse P. patens. Par contre, chez la fougère S. moellendorffii, le nombre de
protéines à domaine PAC (12) est comparable à celui trouvé chez une plante ancêtre des
angiospermes A. trichopoda, une plante monocotylédone non Poales (P. equestris), et chez
plusieurs plantes dicotylédones (Virtales, Myrtales et Brassicales). Par contre, les protéines à
domaine PAC sont particulièrement nombreuses chez les gymnospermes (28 chez P. taeda et
20 chez P. pinaster), les plantes monocotylédones Poales (entre 18 et 35) ainsi que chez L.
usitatissimum (19), une plante dicotylédone.

A l’exception des monocotylédones Poales, les protéines à domaine PAC de type 1, i.e. à
domaine PAC seul, sont les mieux représentées. Chez les Poales, ce sont les protéines à
domaine PAC de type 2 (domaine PAC N-terminal) qui sont les plus nombreuses. Les
protéines de type 4 (domaine PAC associé à deux domaines EXT) sont les plus rares, n’étant
présentes que chez quelques plantes, A. trichopoda, une plante monocotylédone non Poale (P.
equestris), et deux plantes dicotylédones (L. usitatissimum et G. raimondii).

Il est remarquable qu’A. trichopoda ne comporte pas de protéine à domaine PAC associé à
un domaine riche en His. Dans la configuration 2.1, le domaine riche en His est présent chez
une fougère (S. moellendorffii), une plante gymnosperme (P. taeda), chez les
monocotylédones Poales et chez deux plantes dicotylédones (L. usitatissimum et G.
raimondii). Par ailleurs, la présence d’un domaine riche en His n’est pas très fréquente dans la
configuration 3.1, cette structure n’étant trouvée que chez les plantes dicotylédones étudiées.

Cette analyse montre que le domaine PAC a été associé à plusieurs autres domaines au
cours de l’évolution. Tous les organismes étudiés comportent des protéines de type 1. Ensuite,
les types de protéines à domaine PAC se diversifient, le domaine PAC se trouvant associé à
différents autres domaines, le domaine se trouvant ainsi localisé en N- ou en C-terminal des
protéines matures secrétées dans les parois sauf dans le cas des protéines de type 4 où le
domaine PAC est en sandwich entre deux domaines riches en motifs de type EXT.

Page 140
Chapitre 4

Type de protéine 1.1 1.2 2.1 2.2 2.3 2.4 3.1 3.2 3.3 4 nd total

Bryophyta P. patens 2 2

Selaginellales S. moellendorffii 4 3 4 1 12

P. taeda 10 1 17 28
Pinales
P. pinaster 12 8 20

Amborellales A. trichopoda 6 1 2 1 1 11
Asparagales P. equestris 3 4 1 1 1 10

B. distachyon 5 4 7 4 20
Mono- Poales O. sativa 2 1 2 15 5 1 26
cotylédones
P. virgatum 9 2 4 11 6 2 1 35
S. bicolor 4 2 6 2 5 19
S. italica 4 1 5 3 1 3 1 18

V. vinifera 4 1 4 1 1 11
Vitales
P. trichocarpa 6 2 5 1 1 1 16

Malpighiales L. usitatissimum 9 3 1 2 2 1 1 19

Di- Myrtales E. grandis 5 1 3 1 2 12


cotylédones
Malvales G. raimondii 10 1 1 2 1 1 2 2 20
A. thaliana 8 1 1 1 2 1 14
Brassicales
A. lyrata 8 1 1 2 1 1 14
C. rubella 8 1 1 1 2 1 14

Tableau 4.2 : Distribution des types de protéines à domaine PAC dans les génomes
des plantes terrestres
Les types de gènes codant pour les protéines à domaine PAC (première ligne) sont décrits dans la figure 4.5.
nd : structure des protéines non déterminée du fait de séquences incomplètes.

4.5. Evolution des familles de protéines à domaine PAC par duplication


de gènes

La duplication des gènes a joué un rôle majeur dans l'évolution de la complexité des
organismes supérieurs (Ohta, 1987) car elle permet à une copie de gène de muter et
d'accumuler librement des mutations tandis que l'autre copie continue à réaliser la fonction
d'origine (Behe et Snoke, 2004). Nous avons pu mettre en évidence ce phénomène dans les
familles de protéines à domaine PAC des plantes terrestres étudiées.

La figure 4.6 montre quelques exemples de duplication de gènes en tandem chez les
plantes monocotylédones Poales (B. distachyon et O. sativa) et des plantes dicotylédones (G.
raimondii et A. thaliana). Il existe également des duplications de gènes dans les génomes des
gymnospermes, mais elles sont difficiles à répertorier car nous n’avons pas encore toutes les
données de l’organisation des génomes. Dans chaque groupe de gènes dupliqués, les protéines

Page 141
Chapitre 4

codées sont du même type. On note cependant une évolution entre les deux gènes dupliqués
d’A. thaliana At2g33790 et At2g34700. La longueur de la séquence codante d’At2g34700 est
beaucoup plus courte que celle d’At2g33790 ce qui correspond à une réduction drastique de la
longueur du domaine riche en motifs (XPn≥2X) et à une disparition des résidus His. Par
ailleurs, les gènes dupliqués en tandem peuvent être disposés en orientation similaire, ou tête-
bêche.

B. distachyon A

Bradi2g48670.1 Bradi2g48680.1 Bradi3g20970.1, 20980.1, 21000.1, 21010.1, 21030.1

O. sativa

LOC_Os01g52650.1 LOC_Os01g52660.1

LOC_Os05g45460.1 LOC_Os05g45480.1 LOC_Os10g05790.1, 05820.2, 05860.1, 05880.1, 05910.1,


05930.1, 05950.1, 05970.1, 05980.1, 05990.1, 06000.1

G. raimondii B

Gorai.009G368100.1 Gorai.009G368200.1 Gorai.001G206700.1 Gorai.001G206900.1

Gorai.002G193500.1 Gorai.002G193700.1
A. thaliana

At2g33790 At2g34700

Figure 4.6 : Exemples de duplications de gènes codant des protéines à domaine PAC
chez des plantes monocotylédones (A) ou dicotylédones (B)
Les flèches jaunes correspondent à des protéines de type 1 (domaine PAC seul), les flèches roses à des
protéines de type 2 (domaine PAC à l’extrémité N-terminale des protéines matures) et les flèches vertes à des
protéines de type 3 (domaine PAC à l’extrémité C-terminale des protéines matures). Le sens des flèches indique
l’orientation des gènes extrémité 5’, vers extrémité 3’, suivant le sens de la transcription).

Le nombre de gènes dupliqués est beaucoup plus important chez les plantes
monocotylédones que chez les plantes dicotylédones, pouvant aller jusqu’à 11 gènes en
tandem (Figure 4.6). Ces nombreuses duplications expliquent certainement le nombre élevé
de gènes codant des protéines à domaine PAC dans ces génomes. Ces familles de gènes en
tandem peuvent être interrompues par la présence de gènes de familles différentes. Ce trait
particulier a été noté dans l’analyse du génome du riz, puisque 29% des gènes du riz sont
organisés de cette manière (International Rice Genome Sequencing Project, 2005). Par
comparaison, seulement 17% des gènes d’A. thaliana sont organisés en tandem (Arabidopsis
Genome Initiative, 2000).

Page 142
Chapitre 4

4.6. Les protéines à domaine PAC non canonique

Comme mentionné plus haut (cf § 4.2.2.), nous avons identifié des protéines ayant des
caractéristiques communes avec les protéines à domaine PAC, mais ayant un nombre plus
faible (5) ou plus élevé de résidus Cys (7 ou 8) que nous appelons domaines PAC « non
canoniques ». La présence de telles protéines a été notée chez la plupart des plantes étudiées,
mais en particulier chez les plantes monocotylédones. La situation rencontrée chez P.
virgatum, S. italica et A. thaliana est décrite dans le tableau 4.3 et des exemples de séquences
sont donnés dans la figure 4.7. La position du résidu Cys manquant est systématiquement
Cys6. Par contre les résidus Cys supplémentaires peuvent être intercalés à toutes les positions
entre Cys3 et Cys6, et même en aval de Cys6.

L’existence de ces protéines posait la question de leur prise en compte pour établir la
phylogénie des domaines PAC. Dans un premier temps, les séquences des domaines PAC non
canoniques ont été intégrées à l’étude. A titre d’exemples, les figures 4.8 et 4.9 montrent
qu’elles se répartissent dans différents clades (cf § 4.7.), de la même manière que les
séquences des domaines PAC canoniques.

Page 143
Chapitre 4

Nombre de protéines

Type de protéine 1 2 3
P. virgatum 4 7
+ 1 Cys : + 1 Cys :
Cys5-Cys6/après Cys6 après Cys6
1
+ 2 Cys :
Cys5-Cys6/après Cys6

S. italica 1 5 1
- 1 Cys : + 1 Cys : + 1 Cys :
Cys6 après Cys6 Cys3/Cys4
2
+ 1 Cys :
Cys2-Cys3/Cys3-Cys4
1
+ 2 Cys :
Cys3-Cys4/Cys4-Cys5/
après Cys6

A. thaliana 2 1
+2 Cys : + 1 Cys :
Cys5-Cys6/après Cys6 Cys5-Cys6

Tableau 4.3 : Exemples de protéines à domaine PAC non canonique chez P. virgatum,
S. italica et A. thaliana

Les nombres de protéines de chaque type sont indiqués pour chaque plante (1 : domaine PAC seul ; 2 :
domaine PAC en N-terminal de la protéine mature ; 3 : domaine PAC en C-terminal de la protéine mature). Le
nombre de résidus Cys en plus ou en moins ainsi que la position du(des) résidu(s) Cys supplémentaire(s) ou
manquant sont indiqués.

Page 144
Chapitre 4

>Si005202m -1
MAPISRVLGCGLALVIFAVGCLPSRVSAMGLPRPQPNLNFTIGVEGVVWCKGCRYRGYIQSRDASPLRNVSALLRCRHGRRRA
LSVWGATNSRGYFLIETGAQAAPFTSKDCRVYVPRSPARGCRVDVSPGRNRGLPLRFRRFVTRPDGLQGRYVAGSFTFAPQTG
PSADPVNWTLALLLRLVGL* (2,22,35,11,40)
>Si031179m +1
MLLLRRRAAAALLLVFAAAAAMEEASSLPVVEPMELYFSPAELARIAGYGEEPVSSVSVSGQVACELCLRPGSDLLAFELPGAKV
AVLCETECPNDQAANSALATTDEFGNFTIDLPSQLHATANLERACTVKVLQLPADSSCRLRHQPSTTYGLMLASQEDGVRAYT
TGVIRLQNNDTPHGKCVSVEERTGRR*
(2,20,3,36,12,40)

>Si037746m +2
MARIRGMPMLALLAAAVVIAAAARAEARVPDYHPSTFTVTGQVQCQDCTKNWNAYAYNARPIPGSVVGITCKDDRERPVYY
GSDATDGQGVFNVEVPSKVNGCDLTASRCLVRLASSGDPGCAVPTNFNGGTAGEKPSRLTHFSPDRATYAVGPYYYTLPRCDV
KDDAAACSSGY*
(2,22,31,6,11,39,8)

Figure 4.7 : Trois exemples de protéines à domaine PAC non canonique chez S. italica
(Si005202m, Si031179m et Si037746m)
Les résidus Cys du domaine PAC non canonique sont en rouge. Les résidus Cys surnuméraires sont indiqués
en vert et repérés par une flèche verte. Leur position n’est pas nécessairement bien définie du fait de la variabilité
de la longueur des espacements. Les espacements entre les résidus Cys sont indiqués entre parenthèses. La
séquence en acides aminés codée par le premier exon est soulignée.

Clade B
C3-C4
C5-C6 +C3-C4
C3-C4
C5-C6

Figure 4.8 : Les domaines PAC non canoniques associés au clade B


Le calcul de l’arbre phylogénétique a été effectué en prenant en compte les domaines PAC non canoniques
qui sont repérés par des flèches de couleur (bleu : domaine à 7 résidus Cys ; rose : domaine à 8 résidus Cys). La
position des résidus Cys surnuméraires est indiquée en face de chaque domaine PAC (C3-C4 signifie que le
résidu Cys surnuméraire est localisé entre les résidus Cys3 et Cys4). Noter sur cet arbre la présence du domaine
PAC de S. italica (Si037746m) décrit sur la figure 4.7. Le clade B est décrit au § 4.7.

Page 145
Chapitre 4

Clade F

C3-C4

C5-C6

C5-C6

Figure 4.9 : Les domaines PAC non canoniques associés au clade F


Le calcul de l’arbre phylogénétique a été effectué en prenant en compte les domaines PAC non canoniques
qui sont repérés par des flèches de couleur (bleu : domaine à 7 résidus Cys). La position des résidus Cys
surnuméraires est indiquée en face de chaque domaine PAC (C3-C4 signifie que le résidu Cys surnuméraire est
localisé entre les résidus Cys3 et Cys4). Le clade F est décrit au § 4.7.

L’existence de ces domaines PAC non canoniques pourrait témoigner d’une évolution des
domaines PAC vers un nombre supérieur ou inférieur de résidus Cys. Elle pourrait aussi
signifier que la fonctionnalité des domaines PAC ne dépend pas strictement de leur nombre de
résidus Cys.
Au fur et à mesure que nos recherches étaient étendues à l’ensemble des génomes, nous
nous sommes rendu compte qu’il serait difficile de prendre en compte toutes les séquences
non canoniques dans ce premier travail de phylogénie. Une recherche exhaustive serait
nécessaire pour voir si de nouveaux clades regroupant des domaines PAC non canoniques
pourraient être générés. Nous avons donc décidé de nous restreindre aux domaines PAC
canoniques. Les protéines qui comportent un résidu Cys en aval du résidu Cys6 ont également
été retenues, mais seul le domaine PAC canonique a été pris en compte.

Page 146
Chapitre 4

4.7. Phylogénie des domaines PAC canoniques

Comme mentionné plus haut (cf § 4.3.), la mousse P. patens est l’un des premiers
organismes au cours de l’évolution qui contient des protéines à domaine PAC canoniques.
La phylogénie des domaines PAC a été étudiée en détail avec l’ensemble des plantes
terrestres choisies, à l’exception d’A. lyrata et C. rubella dont les protéines étaient exactement
homologues à celles d’A. thaliana (cf § 4.2.2.). Les domaines PAC ont été délimités par
rapport aux 6 résidus Cys conservés. Comme nous avions remarqué que les 4 résidus situés en
amont du résidu Cys1 étaient également bien conservés, nous avons choisi de travailler avec
des séquences en acides aminés allant de -4 par rapport au résidu Cys1 jusqu’au résidu Cys6.
La conservation de ces 4 acides aminés avait déjà été notée lors de la définition du motif
Pollen proteins Ole e1 présent dans la plupart des domaines PAC (cf § 4.4.). Les séquences
comportant un nombre de résidus Cys (i) inférieur à 6 ou (ii) supérieur à 6 à l’exception de
celles ayant un septième résidu Cys en aval du résidu Cys6 ont été écartées de cette analyse.
L’arbre phylogénique a donc été construit avec 287 domaines PAC et en utilisant l’outil
bioinformatique MEGA6 et il a été visualisé avec l’outil Figtree. Ainsi, les domaines PAC ont
été groupés en 10 clades (A-J, Figure 4.10). La position de ces clades a été déterminée en
fonction des valeurs des bootstraps. Sept d’entre elles sont de bonne qualité, i.e. 0,470 à 1
pour les clades A, C, D, E, F, I et J. Deux sont de qualité moyenne, 0,178 et 0,104 pour les
clades B et G respectivement. La valeur du clade H est médiocre, 0,040. Ces valeurs de
moindre qualité sont dues au fait que ces clades comportent des domaines PAC de S.
moellendorffii dont les séquences sont les plus divergentes. Si ces séquences étaient écartées,
les valeurs de bootstraps seraient de 0,576 et 0,372 pour les clades G et H respectivement.

L’observation de la composition des 10 clades (Tableau 4.4) a permis de montrer que 7


d’entre eux contient des domaines PAC appartenant aux mêmes types de protéines à domaine
PAC. En particulier, les clades B, E, F et I contiennent des domaines PAC appartenant à des
protéines de type 1 (domaine PAC seul). Les clades G et J contiennent des domaines PAC
appartenant à des protéines de type 2 (domaine PAC en N-terminal de la protéine mature). Le
clade A ne contient que des domaines PAC appartenant à des protéines de type 3 (domaine
PAC en C-terminal de la protéine mature). Les 3 autres clades sont composites : le clade C
contient des domaines PAC appartenant à des protéines de type 1 ou 3 ; le clade D, des
domaines PAC appartenant à des protéines de type 2 ou 4 (protéines à domaine PAC associé à
un domaine EXT) ; et le clade H, des domaines PAC appartenant à des protéines de type 1 ou
2. Il est remarquable que la présence ou non d’un intron ne détermine pas l’appartenance à un
clade particulier, ce qui suggère une perte tardive des introns dans différents clades (protéines
de type 1.2 et 3.3).

La taille des domaines PAC varie de 101 à 130 acides aminés. A l’intérieur de chaque
clade, la taille des domaines PAC est assez homogène, les plus grands écarts étant observés
dans les clades G (106-126 acides aminés) et J (101-124 acides aminés) et le clade présentant
le moins de variabilité étant le clade D (121-125 acides aminés).

Page 147
Chapitre 4

0,786
Clade A

0,178
Clade B
0,470 Clade C
0,996
Clade D
1,000
Clade E

0,802
Clade F

0,104
Clade G

0,040
Clade H

0,910
Clade I

0,490
Clade J

Figure 4.10 : Arbre phylogénique des domaines PAC canoniques des plantes terrestres
La phylogénie a été construite avec l’ensemble des 287 domaines PAC identifiés chez les plantes terrestres
étudiées. Il s’agit d’une représentation simplifiée. Le détail des séquences des domaines PAC est donné en
annexe 1.

Concernant la distribution des domaines PAC des plantes étudiées entre les différents
clades, elle est variable d’une plante à l’autre. En particulier, le clade G comporte des
domaines PAC de toutes les plantes. Le clade H comporte des domaines PAC de toutes les
plantes, à l’exception de P. patens. P. taeda et P. pinaster n’ont pas de représentant dans les
clades A, D et I, tandis que P. equestris n’en a pas dans les clades A et C.

Page 148
Chapitre 4

Type de
Clade Plante
protéine

(nombre de P. S. P. taeda P.
A. trichopoda Poales Dicotylédones
membres) patens moellendorffii P. pinaster equestris

+
A (36) 3.1/3.2 + +
Am068.122

+
B (14) 1.1 + + + + +
Am019.72

1.1/1.2 +
C (19) + + +
3.2/3.3 Am153.4

+
D (12) 2.2/4.2 + + +
Am066.9

+
E (14) 1.1 + + +
Am062.88

+
F (57) 1.1/1.2 +* + + +
Am061.7

+
G (18) 2.2/2.3 + + + + + +
Am041.161

1.1 +
H (43) + +* + + +
2.1/2.2 Scaffold00047

+
I (9) 1.1 + + +
Am047.45

+
J (65) 2.1/2.2 + Am019.68 + +* +
Am041.169

Tableau 4.4 : Distribution des domaines PAC dans les différents clades
Le nombre de membres de chaque clade est indiqué entre parenthèses dans la première colonne. Les types de
protéines à domaine PAC sont indiqués dans la deuxième colonne (cf Figure 4.5). + indique la présence de
domaines PAC de la plante considérée dans un clade donné. * indique la présence de nombreux gènes de la
plante correspondante. Les numéros d’accès des protéines d’A. trichopoda sont indiqués.

Par ailleurs, seules A. trichopoda, les monocotylédones Poales et les dicotylédones ont des
domaines PAC dans tous les clades (Tableau 4.4). Cette constatation est vraie globalement,
mais pas nécessairement pour chacune des plantes de ces familles. Ainsi, le cas particulier
d’A. trichopoda est remarquable. Ses 11 domaines PAC sont répartis dans les 10 clades, les
clades A à I comporte chacun 1 domaine PAC et le clade J en comportant 2. Ceci est à
rapprocher du fait que cette plante fait partie des ancêtres des plantes angiospermes.

Page 149
Chapitre 4

Enfin, la taille des clades est très hétérogène (Tableau 4.4). Certains clades comportent de
nombreux membres (clades A, F, H et J). Ceci peut être dû à un nombre important de plantes
différentes représentées ou à des expansions des familles de protéines à domaine PAC
notamment par duplication de gènes en tandem, en particulier dans les clades F et H (P. taeda
et P. pinaster) et le clade J (Poales) (cf § 4.5.).

4.8. Recherche de motifs conservés dans les 10 clades regroupant les


domaines PAC canoniques

Nous avons ensuite effectué des recherches de motifs conservés à l’intérieur de chaque
clade. Nous souhaitions en effet trouver des caractéristiques spécifiques à chaque clade au-
delà de celles que nous avions employées pour constituer le répertoire des protéines à
domaine PAC canonique. Les groupes de domaines PAC appartenant aux 10 clades A-J ont
donc été comparés à l’aide de l’outil MEME-SUITE.

Seuls les motifs présentant des scores de bonne qualité ont été conservés (Tableau 4.5).
Pour chaque clade, il existe des motifs qui rassemblent toutes les protéines. Le score de
meilleure qualité obtenu concerne le clade E dans lequel les domaines PAC ont des séquences
extrêmement proches les unes des autres (clade E, motif 1). Ce résultat est d’autant plus
remarquable que ce clade rassemble des domaines PAC de plantes très différentes : Pinales
(P. pinaster), A. trichopoda, angiospermes monocotylédones (B. distachyon, O. sativa, P.
virgatum, S. bicolor, S. italica), et dicotylédones (A. thaliana, G. hirsutum, L. usitatissimum,
P. trichocarpa, V. vinifera).

Clade Motif Nombre de séquences Score (E-value)


A 36
1 34 6,2 e-557
2 36 1,5 e-282
3 34 4,3 e-259
4.1 (dicotylédones) 11 4,2 e-057
4.2 (monocotylédones) 9 5 ,8 e-120
4.2 (monocotylédones) 11 3,3 e-197
B 14
1 14 1,6 e-049
2 10 1,3 e-170
3 14 7,0 e-162
4 8 4,6 e-066
C 19
1 19 1,8 e-092
2 18 1,5 e-350
3 18 2,9 e-336
4 14 3,9 e-354
D 12
1 12 2,9 e-339
2 12 4,1 e-144
3 12 6,1 e-059
E 14
1 14 2,8 e-1002
2 14 1,6 e-075

Page 150
Chapitre 4

F 57
1 55 2,5 e-1274
2 57 1,6 e-605
3 57 1,1 e-380
G 18
1 17 3,2 e-359
2 16 1,2 e-207
3 17 3,2 e-072
4 16 6,0 e-138
H 43
1 43 9,0 e-364
2 38 3,9 e-389
3 43 3,5 e-366
4 41 6,2 e-293
5 37 6,8 e-569
I 9
1 9 5,5 e-016
2 9 4,3 e-140
3 9 1,2 e-072
J 65
1.1 (Am019.68) 8 3,3 e-062
1.2 (Am041.169) 51 1,9 e-964
2.1 (Am019.68) 9 1,6 e-036
2.2 (Am041.169) 56 3,0 e-627
3.1 (Am019.068) 9 1,8 e-042
3.2 (Am041.169) 51 1,3 e-431
4 55 2,1 e-388
5 (Am019.68) 9 5,0 e-032

Tableau 4.5 : Scores montrant la qualité des motifs conservés dans les différents
clades rassemblant les domaines PAC canoniques des plantes terrestres
Les scores (E-value) ont été déterminés par l’outil bioinformatique MEME-SUITE. Les motifs sont
numérotés pour chaque clade depuis l’extrémité N-terminal des domaines PAC jusqu’à leur extrémité C-
terminale (cf Figures 4.11-13). Le nombre de séquences de domaines PAC pris en compte pour la détermination
des motifs est indiqué.

Globalement, nous avons trouvé trois régions présentant des motifs conservés que nous
avons appelées : sous-domaine N-terminal (Figure 4.11), sous-domaine central (Figure 4.12)
et sous domaine C-terminal (Figure 4.13).

Comme attendu, nous avons retrouvé les éléments du domaine Pollen proteins Ole e1 à
l’extrémité N-terminale du sous-domaine N-terminal dans tous les clades (Figure 4.11). Il
s’agit d’un motif bien conservé autour des résidus Cys1 et Cys2. Un résidu Pro est conservé
en aval du résidu Cys2 dans les clades A, B, C, D, E et G. Un second motif présent dans tous
les clades se dégage en amont du résidu Cys3 ([VA]X[VIL]XC). Un troisième motif
comportant des acides aminés acides (T[DE][DE]) situé entre les résidus Cys3 et Cys4 est
présent dans les clades A, B, C, H, I et J.

Page 151
Chapitre 4

sous-domaine N-terminal
C1(2)C2 (10,30) C3 (20,50) C4 (8,20)C5
[EQT]GxVYCC D[TNP]C
CR Pollen proteins Ole eI family signature (PS00925)

Clade A 1 2

Clade B 1 2

Clade C 1 2

Clade D 1

Clade E 1

Clade F 1

Clade G 1

Clade H 1 2 3

1 2
Clade I
1.1 2.1
Am019.68
Clade J
1.2 2.2 Am041.169

Figure 4.11 : Acides aminés conservés dans le sous-domaine C-terminal des domaines
PAC canoniques
La position des résidus Cys des domaines PAC est rappelée en haut de la figure ainsi que les espacements
entre eux entre parenthèses. La séquence du motif Pollen proteins Ole e1(PS00925) est également rappelée.
Dans le clade J, deux motifs correspondant aux deux séquences d’A. trichopoda qui en font partie sont proposés.
Les scores de qualité de ces différents domaines sont indiqués dans le tableau 4.5.

Concernant le domaine central des domaines PAC (Figure 4.12), il contient les résidus
Cys4 et Cys5. En amont du résidu Cys4, un résidu Pro est conservé dans les clades C, E, G, I
et J. Entre les résidus Cys4 et Cys5, un résidu Pro est conservé dans tous les clades sauf le
clade G et le motif [SK]SP est trouvé dans les clades A, B, C, F et H.

Page 152
Chapitre 4

sous-domaine central
C1(2)C2 (10,30) C3 (20,50) C4 (8,20) C5 (25,60)

Clade A 3

Clade B 3

Clade C 3

Clade D 3

Clade E 1

Clade F 2

Clade G 2 3

Clade H 4

Clade I 3

Am019.68 3.1
Clade J
Am041.169 3.2 4

Figure 4.12 : Acides aminés conservés dans le sous-domaine central des domaines
PAC canoniques
La position des résidus Cys des domaines PAC est rappelée en haut de la figure ainsi que les espacements
entre eux entre parenthèses. Dans le clade J, deux motifs correspondant aux deux séquences d’A. trichopoda qui
en font partie sont proposés. Les scores de qualité de ces différents domaines sont indiqués dans le tableau 4.5.

De manière générale, les scores de qualité des motifs trouvés dans le sous-domaine C-
terminal des domaines PAC sont inférieurs à ceux trouvés pour les motifs du sous-domaine
N-terminal à l’exception du clade C. Il a été nécessaire de regrouper les domaines PAC du
clade A en trois ensembles pour faire émerger des motifs significatifs. En outre, dans le clade
J, seulement 9 séquences parmi les 65 du clade permettent de proposer un motif. Il semble
que le sous-domaine C-terminal soit le plus variable. Globalement, 2 ou 3 résidus Pro sont
conservés dans tous les clades en amont du résidu Cys6. Il est possible de trouver des résidus
Phe (1 ou 2) également en amont du résidu Cys6 dans les clades A, B et J.

Page 153
Chapitre 4

sous-domaine C-terminal
(25,60) C6
dicotylédones 4.1

Clade A monocotylédones 4.2

4.3

Clade B 4

Clade C 4

Clade D 3

Clade E 2

Clade F 3

Clade G 4

Clade H 5

Clade I 5

Clade J Am019.68 5

Figure 4.13 : Acides aminés conservés dans le sous-domaine C-terminal des domaines
PAC canoniques
La position des résidus Cys des domaines PAC est rappelée en haut de la figure ainsi que les espacements
entre eux entre parenthèses. Dans le clade A, trois motifs correspondant à trois groupes de domaines PAC ont été
identifiés (ceux des dicotylédones d’une part, et deux de monocotylédones d’autre part). Concernant le clade J,
seul le domaine PAC de la protéine Am019.68 d’A. trichopoda comporte le motif identifié. Les scores de qualité
de ces différents motifs sont indiqués dans le tableau 4.5.

Cette analyse nous a conduits à rechercher d’autres caractéristiques des protéines,


notamment à calculer leur pI (Figure 4.14). Nous avons noté que les clades F et G contiennent
des domaines PAC acides tandis que les clades A, B, C, D, I et J contiennent des domaines
PAC basiques. Les clades E, H et J contiennent deux populations de domaines PAC, acides ou
basiques. Le caractère acide ou basique des protéines secrétées avait pu être mis en lien avec
leur localisation sub-pariétale lors d’études protéomiques, les protéines acides étant plutôt
apoplastiques et les protéines basiques plutôt insérées dans les réseaux de polysaccharides
(Jamet et al., 2006).

Page 154
Chapitre 4

nombre de protéines Clade A Clade F

nombre de protéines
20 20
16 16
12 12
8 8
4 4
0 0

pI pI

Clade B Clade G
nombre de protéines

nombre de protéines
8 12

6
8
4
4
2

0 0

pI pI

Clade C Clade H
nombre de protéines

nombre de protéines

12 12

8 8

4 4

0 0

pI pI

Clade D Clade I
nombre de protéines

nombre de protéines

5 3
4
3 2

2
1
1
0 0

pI pI

Clade E Clade J
nombre de protéines

nombre de protéines

8 28
24
6 20
16
4
12
2 8
4
0 0

pI pI

Figure 4.14 : Distribution des pI des domaines PAC dans chaque clade
Les pI des domaines PAC ont été calculés avec l’outil bioinformatique d’ExPASy
(http://web.expasy.org/compute_pi/). En blanc, les pI inférieurs à 7, en noir les pI supérieurs à 7.

Page 155
Chapitre 4

4.9. Conclusions

Dans ce travail, nous avons recherché la présence de domaines PAC dans les génomes de
la lignée verte après avoir défini un motif remarquable basé sur la présence de 6 résidus Cys à
des espacements définis et la présence d’un peptide signal prédit. Nous avons montré que des
domaines apparentés au domaine PAC canonique sont présents chez des algues vertes
Chlorophyceae et Zygnematophyceae. Par contre, nous n’avons trouvé aucune séquence
apparentée chez une Prasinophyceae (O. lucimarinus) non plus que chez des bactéries, des
champignons ou des mammifères.

Ainsi, les protéines à domaine PAC ont été trouvées chez toutes les plantes terrestres
étudiées. Il est donc proposé que l’apparition de protéines à domaine PAC canonique soit
associée à la terrestrialisation des plantes. Elle succèderait à l’apparition des mannanes, serait
concomitante à celle des xyloglucanes et précèderait celle des lignines (Popper et al., 2001;
Popper et Fry, 2008; Sarkar et al., 2009). Cette apparition est également postérieure à
l’acquisition de la multicellularité complexe (Domozych et Domozych, 2014).

L’observation des protéines à domaine PAC a permis de les classer en quatre types suivant
la position du domaine PAC dans la protéine mature et/ou son association à d’autres
domaines. Il est remarquable que la plupart des domaines PAC sont codés par deux exons,
l’intron étant positionné dans la séquence séparant les résidus Cys2 et Cys3. Quelques
domaines PAC sont codés par un exon unique, cette structure de gène semblant être apparue
de manière ponctuelle dans les clades C et F. L’association du domaine PAC à des séquences
en acides aminés riches en motifs (XPn≥2X) où X peut être n’importe quel acide aminé sauf
Pro est celle qui est le plus fréquemment rencontrée. C’est le cas pour les protéines comme
AGP31 dont la structure est très complexe. Le domaine riche en motifs (XPn≥2X) d’AGP31
est O-glycosylé avec des motifs riches en Ara et Gal et interagit in vitro avec le domaine PAC
(Hijazi et al., 2012; 2014b). L’association du domaine PAC avec des motifs de type EXT
(SPn≥2) est plus rare et n’a été trouvée que chez A. trichopoda, une plante monocotylédone
non Poales (P. equestris), et deux plantes dicotylédones (L. usitatissimum et G. raimondii). La
présence d’un domaine riche en His n’est pas très fréquente. Enfin, la position du domaine
PAC dans les protéines à domaine PAC est variable. On note cependant, que dans un même
clade, un domaine PAC peut être seul (clades B, E, F et I) ou associé soit en N- (clade H),
soit en C-terminal (clade C) à un ou d’autres domaines. Les clades ayant leur racine en
position la plus proche de celle de l’arbre phylogénique contiennent des protéines de structure
1 ou 2. Il y a certainement eu des événements de gain ou de perte de domaines dans
l’évolution de la famille de gènes codant les protéines à domaine PAC.

En constituant le répertoire des domaines PAC, des protéines apparentées ont été
identifiées. Ces protéines comportent soit seulement 5 résidus Cys, soit 1 ou 2 résidus Cys
supplémentaires. Cette recherche systématique n’a cependant pas été menée de manière
exhaustive. Les quelques domaines PAC non canoniques pris en compte lors des premières
études de phylogénie s’inséraient dans la phylogénie des domaines PAC canoniques. Il

Page 156
Chapitre 4

pourrait s’agir d’une évolution tardive des domaines PAC. Cette étude devrait être reprise de
manière systématique pour évaluer cette hypothèse en incluant des approches fonctionnelles
pour évaluer le rôle des Cys conservées. Par ailleurs, il se pourrait que ces protéines fassent
partie d’autres familles de protéines ou de peptides à résidus Cys conservés (Silverstein et al.,
2007). Les protéines GASA (Giberellic Acid-Stimulated Arabidopsis) ont 12 résidus Cys
conservés et peuvent avoir des domaines riches en motifs (XPn≥2X) (Rubinovich et Weiss,
2010). Parmi les protéines à 8 résidus Cys conservés se trouvent les HyPRP (Hybrid Proline-
rich Proteins) et les LTP (Lipid Transfer Proteins) (Baud et al., 1993; Dvorakova et al., 2007;
Yeats et Rose, 2008).

L’étude phylogénique restreinte aux domaines PAC canoniques a permis de définir 10


clades dont un clade remarquable, le clade E, qui contient des domaines PAC extrêmement
bien conservés. Dans chacun de ces clades, on trouve un ou au plus deux types de protéines à
domaine PAC : domaine PAC seul, domaine PAC en N- ou en C-terminal de la protéine
mature ou domaine PAC associé à un domaine EXT. Dans tous les clades, le domaine PAC a
pu être subdivisé en trois sous-domaines : N-terminal, central et C-terminal. Le domaine le
plus conservé est le domaine N-terminal qui a déjà fait l’objet d’une annotation dans la base
de motifs PROSITE (Pollen proteins Ole e1). Pour chacun de ces clades, il a été possible de
définir des motifs communs ou spécifiques. En dehors des résidus Cys conservés, des acides
aminés particuliers ont été repérés. Ces acides aminés pourraient être étudiés dans le cadre
d’une analyse fonctionnelle des domaines PAC. Si comme le domaine PAC d’AGP31, les
domaines PAC interagissent avec des polysaccharides pariétaux, il est possible d’envisager
des spécificités différentes (cf chapitre 5).

Enfin, le fait que les domaines PAC aient des pI allant de 4 à 11 permet d’envisager des
localisations sub-pariétales différentes, soit dans l’apoplaste, soit au cœur des réseaux de
polysaccharides. Pour le démontrer, il faudrait envisager des expériences de localisation in
vivo soit avec des protéines marqueurs fluorescentes comme la RFP (Red Fluorescent
Protein) bien adaptée aux parois dont le pH est légèrement acide, soit des marquages
immunocytochimiques (Douché et al., 2013; Albenne et al., 2014).

Page 157
Chapitre 5

5. RECHERCHE DE PARTENAIRES DES DOMAINES


PAC DANS LES PAROIS
Un des objectifs de cette thèse concerne la caractérisation fonctionnelle des domaines
PAC. Il s’inscrit dans la poursuite des travaux de thèse de May Hijazi qui avait montré des
interactions in vitro entre le domaine PAC d’AGP31 et des galactanes trouvés sur le RG I,
ainsi qu’entre ce domaine et la protéine AGP31 via les O-glycanes du domaine H/PRP (Hijazi
et al., 2014b). Suite à ces résultats, un modèle d’assemblage supramoléculaire, dans lequel
AGP31 interagit avec elle-même et avec différents constituants pariétaux a été proposé
(Hijazi et al., 2014b). Ces résultats ont constitué la première mise en évidence expérimentale
de la capacité des domaines PAC à interagir avec des polysaccharides pariétaux.

L’analyse phylogénique présentée dans le chapitre 4 a permis de révéler que ces domaines
PAC sont trouvés dans un grand nombre d’espèces végétales, des plus primitives aux plus
évoluées, renforçant ainsi l’intérêt qui leur est porté. Nous avons donc choisi d’entreprendre
la caractérisation fonctionnelle de certains de ces domaines. Notre choix s’est porté sur 7
domaines PAC, à savoir cinq domaines PAC d’A. thaliana, un de B. distachyon et un de P.
patens. Nous avons ainsi un représentant d’une mousse, un d’une monocotylédone et
plusieurs d’une dicotylédone, permettant d’apprécier à la fois la diversité entre espèces
végétales distantes et au sein d’une même plante.

Les 7 protéines à domaine PAC appartiennent à 5 clades différents tels que définis dans le
chapitre 4 (Figure 5.1). Les domaines PAC d’AGP31 et d’At2g34700 appartiennent au clade
A, At5g05500 au clade C, At5g10130 et At5g45880 au clade F. Les domaines PAC de
Pp1s79_182V6 et de Bradi3g21000 sont trouvés dans les clades G et J, respectivement.

L’objectif est d’identifier par des tests d’interaction in vitro les interactants de ces
domaines PAC, afin de les corréler à la composition en polysaccharides des parois des
différentes plantes étudiées.

Page 158
Chapitre 5

AGP31
Clade A
At2g34700
Clade B
Clade C At5g05500
Clade D
Clade E
At5g10130
Clade F At5g45880

Clade G Pp1s79_182V6

Clade H

Clade I

Clade J Bradi 3g21000

Figure 5.1 : Positionnement des domaines PAC choisis pour une étude fonctionnelle
dans l’arbre phylogénique des domaines PAC (cf chapitre 4)

5.1. Mise au point d’un protocole de production et de purification des


domaines PAC

Pour entreprendre l’étude fonctionnelle relative à la capacité de liaison des domaines PAC
aux polysaccharides, nous avons tout d’abord utilisé le protocole préalablement mis au point
au laboratoire pour la production et la purification du domaine PAC d’AGP31 (Hijazi et al.,
2014b). La production des protéines était effectuée par transformation transitoire de feuilles
de N. benthamiana. Après préparation des parois et extraction des protéines pariétales, la
protéine d’intérêt était purifiée par deux étapes successives de chromatographie, une
échangeuse de cations (CEC) suivie d’une affinité sur colonne de Nickel (NAC).

5.1.1. Production des protéines d’intérêt dans N. benthamiana et purification

5.1.1.1. Production des protéines

Les séquences codant les domaines PAC des gènes d’intérêt ont été clonées en fusion N-
terminale avec la séquence codant pour le peptide signal et en fusion C-terminale avec les
étiquettes V5 et 6xHis. Ces étiquettes ont été choisies afin de faciliter la détection et la
purification des protéines recombinantes, respectivement. Les masses moléculaires des
domaines PAC d’intérêt, sous formes native et recombinante produits dans N. benthamiana et

Page 159
Chapitre 5

E. coli, sont rassemblées dans le tableau 5.1. Le nombre de sites putatifs de N-glycosylation
est également indiqué.

Masse moléculaire théorique (kDa) Nombre de sites


Protéines PAC + étiquettes PAC+ étiquettes putatifs de
PAC N-glycosylation
(N. benthamiana) (E. coli)
Pp1s79_182V6 15,5 18,6 19,9 0

Bradi3g21000 12,4 15,5 16,8 0

AGP31 14,8 17,9 19,2 2

At5g10130 15,5 18,6 19,9 0

At5g05500 17,9 21,0 22,3 0

At2g34700 15,9 19,0 20,3 1

At5g45880 16,2 19,3 20,6 1

Tableau 5.1 : Caractéristiques des domaines PAC recombinants


produits dans N. benthamiana ou E. coli
Les masses moléculaires ont été calculées en tenant compte des étiquettes V5 et 6xHis (+3,11 kDa) pour les
protéines recombinantes produites dans N. benthamiana ou V5, 6xHis et le site de reconnaissance de
l’entérokinase (+4,40 kDa) pour celles qui sont produites dans E. coli. Le nombre de sites putatifs de N-
glycosylation a été prédit en utilisant la base de motifs PROSITE.

Dans un premier temps, nous avons entrepris la production des 5 domaines PAC d’A.
thaliana. Les souches d’A. tumefaciens contenant les constructions codant les protéines de
fusion ont été infiltrées dans les feuilles de N. benthamiana. Afin de s’assurer de l’efficacité
de la transformation, nous avons utilisé comme contrôle positif la protéine fluorescente GFP
portée par le même vecteur de transformation que la construction d’intérêt et sous contrôle
d’un promoteur fort (rolB).

Des prélèvements de feuilles ont été effectués après 60 h de transformation et regardés


sous la loupe à fluorescence. Nous avons observé l’expression de la protéine GFP en vert dans
les feuilles infiltrées, comme illustré sur la figure 5.2 pour la construction portant le domaine
PAC d’At5g05500 et la GFP. Ainsi, nous pouvions supposer que les protéines d’intérêt
étaient également produites.

Page 160
Chapitre 5

A B

Figure 5.2 : Observation des feuilles de N. benthamiana infiltrées avec une


construction permettant la production du domaine PAC d’At5g05500 ainsi que celle de
la GFP
A. Contrôle négatif (feuille non infiltrée). B. Feuille infiltrée avec la construction d’intérêt.

Par ailleurs, l’analyse par western-blot d’un extrait total de protéines extraites de feuilles
de N. benthamiana a permis de révéler, à l’aide d’un anticorps anti-V5, des bandes intenses,
confirmant la production des protéines d’intérêt. Notons cependant que certaines protéines, en
particulier le domaine PAC d’At5g45880, sont trouvées à une masse moléculaire apparente
supérieure à celle attendue, indiquant un comportement électrophorétique particulier (Figure
5.3A). De plus, nous pouvons également observer, pour les trois domaines PAC qui possèdent
des sites putatifs de N-glycosylation (AGP31, At2g34700, At5g45880, cf Tableau 5.1), la
présence d’une bande additionnelle au-dessus de la bande principale, suggérant la présence de
N-glycosylations (Figure 5.3A). L’état de N-glycosylation de la protéine At2g34700 a
d’ailleurs été vérifié par lectin-blot après sa purification (cf § 5.1.1.3.) en utilisant la lectine
GNA qui reconnaît les résidus mannosyles des N-glycanes (Figure 5.3B). Enfin, une bande
de faible intensité est observée sous la bande principale correspondant aux domaines PAC
d’AGP31 et d’At5g05500, suggérant de possibles dégradations. L’identité des protéines a été
vérifiée par spectrométrie de masse MALDI-TOF. Les données de spectrométrie de masse
n'ont cependant pas permis de détecter la présence des N-glycosylations.

Page 161
Chapitre 5

A B

At2g34700

Figure 5.3 : Contrôle de la production de domaines PAC recombinants


dans des feuilles de N. benthamiana
La production des protéines a été induite par infiltration de feuilles avec des souches d’A. tumefaciens portant
les constructions d’intérêt. A. Des extraits totaux de protéines solubles ont été réalisés, puis séparés par 1D-SDS-
PAGE. Les protéines ont été transférées sur membrane de nitrocellulose et révélées avec des anticorps anti-V5.
Les masses moléculaires des marqueurs (M) sont indiquées à droite. Les bandes correspondant aux protéines
d’intérêt sont repérées par des triangles noirs (protéines non N-glycosylées), des disques noirs (protéines
possiblement N-glycosylées), ou un triangle évidé (possible produits de dégradation). B. L’état de N-
glycosylation de la protéine At2g34700 a été vérifié par lectin-blot : 26 ng de protéine purifiée (cf § 5.1.1.3.) ont
été déposés sur membrane de nitrocellulose et révélés avec la lectine GNA couplée à la digoxigénine.

5.1.1.2. Extraction des protéines pariétales

La production des protéines d’intérêt ayant été confirmée, nous avons entrepris leur
purification. Les parois des cellules des feuilles de N. benthamiana sur-exprimant les
protéines d’intérêt ont été purifiées (Feiz et al., 2006) et les protéines pariétales extraites par
des solutions salines (Irshad et al., 2008). L’analyse par 1D-SDS-PAGE de ces extraits
montre la présence des protéines d’intérêt, comme illustré sur la figure 5.4 pour les domaines
PAC d’AGP31 et d’At2g34700. Leur identification a été confirmée par spectrométrie de
masse MALDI-TOF. Notons que la masse moléculaire apparente du domaine PAC
d’At2g34700 est supérieure à celle attendue comme montré précédemment.

Page 162
Chapitre 5

kDa M
170
130
95
72
55

43

34

26

17

10

Figure 5.4 : Contrôle de la production de domaines PAC recombinants


dans des feuilles de N. benthamiana
La production des protéines a été induite dans des feuilles de N. benthamiana. Des extraits de protéines
pariétales ont été réalisés, puis séparés par 1D-SDS-PAGE. Les protéines ont été colorées au bleu de Coomassie.
Les masses moléculaires des marqueurs (M) sont indiquées à gauche. Les bandes correspondants aux protéines
d’intérêt sont repérées par des triangles noirs (protéines non N-glycosylées) ou des disques noirs (protéines
possiblement N-glycosylées).

5.1.1.3. Purification des protéines d’intérêt

Un protocole de purification des protéines adapté de Hijazi et al. (2014b) a été utilisé. Les
résultats obtenus pour le domaine PAC d’At1g34700 sont illustrés sur la figure 5.5. La
première étape consistait à éliminer un maximum de protéines pariétales par CEC en utilisant
le fait que le pI des protéines d’intérêt est basique, ou par chromatographie d’échange
d’anions (CEA) pour At5g45880 qui a un pI acide. Après la première étape de purification
(Figure 5.5A), un aliquot de chaque mélange de fractions d’élution a été prélevé pour le
dosage et l’analyse des protéines par dot-blot (Figure 5.5B). Après dilution des fractions
contenant la protéine d’intérêt dans un tampon adéquat, la seconde étape de NAC, basée sur
l’interaction avec l’étiquette 6xHis, a été mise en œuvre. Les fractions chromatographiques
ont été analysées par dot-blot (Figure 5.5C) et l’élution par 1D-SDS-PAGE (Figure 5.5D).
Cette dernière analyse fait apparaître deux bandes, supposées correspondre aux formes non-
glycosylées et N-glycosylées du domaine PAC d’At2g34700. L’identité de la protéine a été
vérifiée par spectrométrie de masse MALDI-TOF.

Page 163
Chapitre 5

B C D

Figure 5.5 : Purification du domaine PAC d’At2g34700 en deux étapes (CEC + NAC)
A. Etape de CEC. Profil d’élution des protéines par un gradient de NaCl. B. Analyse par dot-blot révélé par
un anticorps anti-V5 du contenu de différentes fractions : charge, effluent, lavage, et fractions 1 à 5 collectées
pendant l’élution par le gradient de NaCl. C. Etape de NAC. Analyse par dot-blot révélé par un anticorps anti-V5
de différentes fractions : charge, effluent, lavage, et fractions 1 à 3 collectées pendant l’élution par l’imidazole.
D. Analyse par 1D-SDS-PAGE de la fraction d’élution 2. Les bandes d’intérêt sont repérées par un triangle noir
(protéine non N-glycosylée) ou un disque noir (protéines possiblement N-glycosylée).

Ce protocole a permis, pour les domaines PAC d’AGP31 et d’At2g34700, d’obtenir une
quantité de protéines faible, mais suffisante pour réaliser des tests d’interaction in vitro (cf §
5.1.2.3.). Pour ces protéines, le rendement de purification était d’environ 10 µg de protéines à
partir de 2,5 g de paroi lyophilisée. Par contre, les trois autres domaines PAC d’A. thaliana
produits dans des feuilles N. benthamiana n’ont pas pu être purifiés en quantité suffisante

Page 164
Chapitre 5

pour la mise en œuvre des essais, ce qui nous a conduits à envisager un protocole de
production et de purification alternatif.

5.1.2. Optimisation de la production et de la purification des protéines


d’intérêt dans E. coli

Ainsi, nous avons utilisé un système d’expression procaryote. Notons que des données
préliminaires obtenues par May Hijazi au cours de sa thèse avaient suggéré que le domaine
PAC d’AGP31 produit dans E. coli gardait sa capacité à lier les polysaccharides in vitro,
laissant penser que les N-glycosylations ne seraient pas requises pour cette activité. La
stratégie de clonage qui avait été réalisée à cette période (fusion avec une étiquette Maltose
Binding Protein (MBP)) n’a pas été retenue car la présence de l’étiquette MBP générait un
bruit de fond important lors des tests d’interaction avec les polysaccharides. Nous avons donc
choisi de réaliser de nouvelles constructions pour tous les domaines PAC, sans peptide signal
et en fusion C-terminale avec les étiquettes V5 et 6xHis.

5.1.2.1. Production des protéines de fusion PAC/V5/6xHis

Le premier système d’expression utilisé pour la production des domaines PAC était E. coli
BL21-AI transformées par le vecteur pBAD-TOPO contenant les séquences codant les
protéines d’intérêt. Après induction de la production de protéines, les fractions de protéines
solubles ont été analysées par 1D-SDS-PAGE (Figure 5.6). Deux situations ont été observées
pour la production des domaines PAC : (i) apparition de bandes dans deux échantillons
induits (AGP31 et At5g10130); (ii) pas de bande supplémentaire visible dans le cas des 5
autres protéines, suggérant un niveau de production assez faible.

Pp1s79_182V6 Bradi3g21000 AGP31 At5g45880 At2g34700 At5g05500 At5g10130


+ - + - M + - + - M + - + - + - M kDa
170
130
95
72
55
43

34

26

17

Figure 5.6 : Contrôle de la production de domaines PAC recombinants dans E. coli


La production des protéines a été induite dans E. coli. Des extraits totaux de protéines solubles ont été
réalisés à partir de 300 µL de culture bactériennes induites (+) ou non induites (-) puis séparés par 1D-SDS-
PAGE. Les protéines ont été colorées au bleu de Coomassie. Les masses moléculaires des marqueurs (M) sont
indiquées à droite. Les bandes visibles correspondant aux protéines d’intérêt sont repérées par des triangles noirs.

Par contre, toutes les protéines d’intérêt ont été révélées par western-blot avec des
anticorps anti-V5 à des masses moléculaires apparentes égales ou supérieures aux masses

Page 165
Chapitre 5

moléculaires théoriques (Tableau 5.1 et Figure 5.7). Nous pouvons noter la présence d’un
bruit de fond important sur ces membranes, du fait d’interactions non-spécifiques entre
l’anticorps anti-V5 et les protéines bactériennes.

Pp1s79_182V6 Bradi3g21000 AGP31 At5g45880 At2g34700 At5g05500 At5g10130

+ - + - M + - + - M + - + - + - M kDa
130
95
72
55
43
34

26

17

Figure 5.7 : Contrôle de la production de domaines PAC recombinants dans E. coli


La production des protéines a été induite dans E. coli. Des extraits totaux de protéines solubles ont été
réalisés à partir de 300 µL de culture bactériennes induites (+) ou non induites (-), puis séparés par 1D-SDS-
PAGE et transférés sur membrane de nitrocellulose. Les protéines ont été révélées par des anticorps anti-V5. Les
masses moléculaires des marqueurs (M) sont indiquées à droite. Les bandes correspondant aux protéines
d’intérêt sont repérées par des triangles noirs.

Ces données indiquaient que toutes les constructions étaient fonctionnelles et permettaient
d’envisager la purification des protéines d’intérêt.

5.1.2.2. Purification des protéines

La première étape de purification des protéines a été réalisée par NAC en utilisant
l’étiquette 6xHis. Nous avons tout d’abord mis en œuvre un protocole en présence
d’imidazole à 10 mM pour les étapes de fixation et de lavage. A titre d’illustration, les
résultats obtenus pour le domaine PAC d’AGP31 sont présentés sur la figure 5.8. Cette étape
a conduit à la présence de nombreux contaminants dans les fractions d’élution contenant nos
protéines d’intérêt (Figure 5.8B).

Page 166
Chapitre 5

A B
500

kDa M
170

imidazole (mM) ( )
130

-
95
DO280nm

72
55
43

34

26
F1-F8

10 17

fractions (mL)

Figure 5.8 : Purification du domaine PAC d’AGP31 en une étape (NAC)


A. Profil d’élution des protéines par un gradient d’imidazole après fixation en présence de 10 mM imidazole.
B. Analyse par 1D-SDS-PAGE de différentes fractions : charge, effluent, lavage, et fractions d’élution 1 à 8
(F1-F8). Les protéines ont été colorées au bleu de Coomassie. Les bandes d’intérêt sont repérées par un triangle
noir. Les masses moléculaires des marqueurs (M) sont indiquées sur la gauche.

Une amélioration notable de cette étape de purification a été obtenue en réalisant la


fixation des protéines sur la colonne en présence de 50 mM d’imidazole (Figure 5.9A et
5.9B). L’analyse par 1D-SDS-PAGE des fractions éluées par un gradient d’imidazole montre
cependant la présence de trois contaminants majeurs dans les fractions d’élution (Figure
5.9B). Une analyse par spectrométrie de masse MALDI-TOF a permis d’identifier ces 3
contaminants majeurs qui sont des protéines d’E. coli. Il s’agit de : (1) NAD dependent
epimerase/dehydratase (MM: 73097 Da, pI : 6,4, NCBI Reference Sequence:
ZP_16825586.1); (2) 50S ribosomal protein L2 (MM : 27917 Da, pI : 10,8, NCBI Reference
Sequence: YP_001436153.1) ; et (3) FKBP-type peptidyl-prolyl cis-trans isomerase slyD
(MM : 20349 Da, pI : 4,8, NCBI Reference Sequence: ZP_12249356.1). Nous pouvons
souligner que ces 3 protéines renferment dans leur séquence des motifs riches en His ou un
nombre de résidus His élevé, ce qui explique le fait qu’elles aient été retenues sur la colonne
de Nickel. Deux de ces protéines bactériennes ont un pI plus acide que celui des protéines à
domaine PAC d’intérêt (excepté At5g45880), ce qui devrait permettre de poursuivre la
purification par une étape de CEC.

Page 167
Chapitre 5

A B
500

M kDa

imidazole (mM) ( )
170

-
130
95
1 72
DO280nm

55
43
34
2
26
3
F1-F8

17
50

fractions (mL)

Figure 5.9 : Purification du domaine PAC d’AGP31 en une étape (NAC)


A. Profil d’élution des protéines par un gradient d’imidazole après fixation en présence de 50 mM imidazole.
B. Analyse par 1D-SDS-PAGE de différentes fractions : charge, effluent, lavage, et fractions d’élution 1 à 8
(F1-F8). Les protéines ont été colorées au bleu de Coomassie. Les bandes d’intérêt sont repérées par un triangle
noir. Les 3 contaminants majeurs sont notés de 1 à 3. Les masses moléculaires des marqueurs (M) sont indiquées
sur la droite

Une étape supplémentaire de purification par CEC a donc été effectuée. Les protéines sont
éluées par un gradient linéaire de NaCl de 0 à 1,6 M. L’analyse par 1D-SDS-PAGE des
fractions d’élution n’a pas permis d’observer les protéines d’intérêt, attestant d’une perte
importante de celles-ci (résultat non montré).

Différentes stratégies de purification ont alors été essayées et comparées :

- Une étape de CEC, suivie par une étape de NAC.


- Une seule étape de chromatographie d’affinité sur colonne d’anticorps anti-V5 (support
immunoadsorbant préparé au laboratoire).
- Une étape de NAC, suivie d’une étape de chromatographie d’affinité sur colonne
d’anticorps anti-V5.

Malgré de nombreux efforts de mise au point, tous ces essais sont restés insuffisants pour
améliorer significativement le rendement et la pureté des protéines d’intérêt. A titre
d’illustration, les résultats obtenus avec le domaine PAC d’AGP31 en enchaînant une NAC et
une chromatographie d’affinité sur colonne anti-V5 sont montrés sur la figure 5.10.

Page 168
Chapitre 5

M kDa
130
95
72
55
43
34
26

17

10

Figure 5.10 : Purification du domaine PAC d’AGP31 en deux étapes (NAC +


chromatographie d’affinité sur colonne d’anticorps anti-V5)
La première étape de purification est décrite dans la figure 5.9. Puis, les fractions contenant le domaine PAC
d’AGP31 ont été rassemblées et utilisées pour la deuxième étape de chromatographie. La fraction d’élution de la
colonne d’affinité anti-V5 a été séparée par 1D-SDS-PAGE. La bande d’intérêt est repérée par un triangle noir.
Les masses moléculaires des marqueurs (M) sont indiquées sur la droite.

A l’issue de ces 2 étapes, la protéine d’intérêt a été observée mais des contaminants étaient
toujours présents. Le rendement de purification était seulement de 8 à 16 µg de protéines à
partir de 800 mL de culture.

5.1.2.3. Validation du protocole de purification par la mise en œuvre des


premiers tests d’interaction entre les domaines PAC et des polysaccharides
commerciaux

Finalement, il nous est apparu que nous n’étions pas en mesure de purifier efficacement
nos protéines d’intérêt produites dans E. coli. Par conséquent, nous avons décidé de
poursuivre l’étude des domaines PAC à partir de fractions enrichies. Il nous fallait donc
vérifier que ces fractions pouvaient être utilisées pour les essais d’interaction avec les
polysaccharides. Pour cela, nous avons réalisé des essais préliminaires avec le domaine PAC
de la protéine AGP31 produit dans E. coli et enrichi soit par une seule étape de NAC, soit en
combinant une étape de NAC et une chromatographie anti-V5 (cf § 5.1.2.2.). Un témoin
négatif contenant uniquement les contaminants d’E. coli a été utilisé comme contrôle. Ce
contrôle a été obtenu à partir d’une construction contenant uniquement les étiquettes V5 et
6xHis exprimées dans le même vecteur (pBAD-TOPO) et dans la même souche d’E. coli (BL
21-AI) et préparée de la même manière que les autres constructions exprimant les protéines
d’intérêt. Les essais ont également été réalisés à partir de fractions de cette même protéine

Page 169
Chapitre 5

produite dans N. benthamiana et purifiée en 2 étapes (cf § 5.1.1.3.) afin d’évaluer l’influence
des N-glycosylations sur les interactions avec les polysaccharides.

Les essais d’interaction ont été réalisés selon le protocole établi par May Hijazi (2014b).
Des solutions de polysaccharides commerciaux à 10 mg/mL ont été préparées. Des solutions
de PGA d’agrume (P1), de pectine méthylée (P3), de galactane (P5), de RG I (P6),
d’arabinogalactane (P7), de xyloglucane (H1), d’arabinoxylane (H5) et de cellulose (C) ont
été déposées sur une membrane de nitrocellulose à raison de 2 µL, sauf pour la cellulose pour
laquelle le volume est abaissé à 0,5 µL. Les fractions enrichies en domaine PAC, à une
concentration estimée à environ 4-8 µg/mL dans 2 mL de tampon TBS, ont été mises en
contact avec la membrane pendant une nuit. La révélation des signaux a été effectuée avec un
anticorps anti-V5 (Hijazi et al., 2014b). Les résultats des tests d’interaction sont résumés sur
le tableau 5.2.

Système d’expression et
Protéine P1 P3 P5 P6 P7 H1 H5 C
procédé de purification
N. benthamiana
- - + + - - - -
(CEC + NAC)
PAC E. coli
nr - + + - - - -
d’AGP31 (NAC + V5)
E. coli
- - + + - - - -
(NAC)
Témoin E. coli
- - - - - - - -
négatif (NAC)

Tableau 5.2 : Tests d’interaction entre le domaine PAC d’AGP31 produit


dans N. benthamiana ou dans E. coli et des polysaccharides commerciaux
Les protéines produites dans N. benthamiana ont été purifiées par CEC + NAC. Les protéines produites
dans E. coli ont été purifiées soit par NAC + chromatographie d’affinité sur colonne anti-V5, soit par une seule
étape de NAC. Le témoin négatif d’E. coli a été obtenu après une étape de NAC. (+) : signal positif (interaction),
(-) : signal négatif (pas d’interaction), (nr) : essai non réalisé

Ces résultats étaient en accord avec ceux obtenus par May Hijazi. En effet, nous avons pu
confirmer que le domaine PAC d’AGP31 interagit avec les polysaccharides pariétaux et plus
particulièrement avec des chaînes de β-(1,4)-galactane qui constituent des ramifications du
RG I. Les résultats étaient reproductibles pour les trois échantillons de protéines testés. Le
domaine PAC produit dans E. coli présentait, in vitro, la même capacité de liaison aux
polysaccharides que celui obtenu dans N. benthamiana, démontrant que cette activité ne
requiert pas de modifications post-traductionnelles. De plus, les préparations enrichies en
domaine PAC obtenues dans E. coli après une seule étape de purification par NAC génèraient
des résultats comparables à ceux obtenus à partir de préparations de protéines plus pures suite
à deux étapes chromatographiques. Le témoin négatif ne génèrait aucun signal.

Page 170
Chapitre 5

Compte-tenu de ces résultats, nous avons décidé de poursuivre l’étude des 7 domaines
PAC d’intérêt en les produisant dans E. coli et en les purifiant en une seule étape de NAC. Le
protocole de production et de purification utilisé pour le domaine PAC d’AGP31 a pu être mis
en œuvre sans difficulté particulière pour les 6 autres protéines.

5.2. Etude fonctionnelle des 7 domaines PAC d’intérêt

5.2.1. Purification des 7 domaines PAC et du contrôle négatif

Nous avons purifié les 7 protéines d’intérêt produites dans E. coli en utilisant le protocole
simplifié en une étape décrit précédemment (cf § 5.1.2.3.). Le protocole a été standardisé en
utilisant 20 mg de protéines solubles obtenues après lyse des bactéries, sauf pour le domaine
Bradi3g21000 et le contrôle négatif pour lesquels 45 mg de protéines solubles ont dû être
utilisés pour obtenir suffisamment de protéines d’intérêt.

Les profils 1D-SDS-PAGE des fractions de protéines utilisées pour les tests d’interaction
avec les polysaccharides sont présentés sur la figure 5.11. Les concentrations en protéines ont
été déterminées entre 10 et 32 µg/mL (Tableau 5.3). Les résultats obtenus montrent une bonne
reproductibilité de la purification des domaines PAC. Les 3 contaminants majeurs identifiés
lors de l’optimisation du protocole (cf § 5.1.2.2.) sont trouvés dans la plupart des fractions
enrichies. Certaines préparations, telles que celle du PAC de Ps1s79_182V6, semblent plus
pures alors que d’autres laissent apparaître des contaminants supplémentaires (PAC
d’At5g10130, d’At2g34700 et d’At5g45880) (Figure 5.11). D’après les profils des gels
(Figure 5.11), la pureté des protéines d’intérêt est estimée entre 20% (cas du domaine PAC de
P. patens) et 50% (cas des domaines PAC d’A. thaliana), ce qui a permis de déterminer que
les quantités de protéines d’intérêt dans les fractions utilisées sont de l’ordre de 5 à 10 µg.
Cette quantité, bien que faible, s’est avérée suffisante pour la mise en œuvre des tests
d’interaction (§ 5.2.2.2.).

Des contrôles négatifs ont été préparés à partir d’une souche transformée par un vecteur ne
comportant aucune insertion. Ceux-ci montrent la présence des mêmes contaminants que dans
les préparations contenant les protéines d’intérêt, notamment les 3 majeurs précédemment
mentionnés.

Page 171
Chapitre 5

contrôle négatif PP1s79_182V6 Bradi3g21000 AGP31


F4 M F5 F6 F6 F7 M F5 F6 M F6 F7 M kDa
170
130
95
1 72
55
43

34
2
26
3

17

At5g45880 At2g34700 At5g05500 At5g10130


F6 M F7 M F6 F7 M F6 M kDa
170
130
95
72
55

43

34

26

17

Figure 5.11 : Purification des domaines PAC produits dans E. coli en une étape (NAC)
Les fractions de protéines bactériennes solubles ont été séparées par NAC après une fixation en présence de
50 mM imidazole et une élution par un gradient d’imidazole (50 à 500 mM). Les fractions contenant les
protéines d’intérêt ont été séparées par 1D-SDS-PAGE et les protéines colorées au bleu de Coomassie. Le
contrôle négatif consiste en une culture de bactéries non induites. Les numéros des fractions d’élution utilisées
pour les tests d’interactions in vitro avec les polysaccharides pariétaux sont indiqués (F). Les protéines d’intérêt
sont repérées par des triangles noirs. Les masses moléculaires des marqueurs (M) sont indiquées sur la droite.

Page 172
Chapitre 5

Contrôle négatif Ps1s79_182V6 Bradi3g21000

Fractions F4 F5 F6 F6 F7 F5 F6
Concentration
65 40 19 19 13 32 19
(µg/mL)

AGP31 At5g45880 At2g34700 At5g05500 At5g10130

Fractions F6 F7 F6 F7 F6 F7 F6
Concentration
15 10 16 20 19 10 31
(µg/mL)

Tableau 5.3 : Concentrations en protéines des fractions utilisées


pour les tests d’interaction in vitro
Les fractions de protéines bactériennes solubles ont été séparées par NAC après une fixation en présence de
50 mM imidazole et une élution par un gradient d’imidazole (50 à 500 mM). Les concentrations en protéines ont
été déterminées par dosage de Bradford.

5.2.2. Tests d’interaction

5.2.2.1. Extraction et validation des fractions de polysaccharides pariétaux

Des fractions de polysaccharides enrichies en pectines, hémicelluloses et cellulose ont été


obtenues à partir de parois déprotéinées de tissu protonémal de P. patens, de jeunes feuilles de
B. distachyon et d’hypocotyles étiolés d’A. thaliana selon un protocole précédemment décrit
(Moller et al., 2007; Hijazi et al., 2014b). Ces plantes ont été utilisées afin de disposer d’une
grande variété de polysaccharides, en accord avec l’origine des domaines PAC testés. Pour
vérifier la qualité des extraits, ces fractions ont été révélées par différents anticorps
monoclonaux spécifiques de certains polysaccharides. Les spécificités des anticorps testés
sont rassemblées dans le tableau 5.4.

Anticorps Spécificité Référence


JIM5 PGA pas ou peu méthyl-estérifiés (Clausen et al., 2003)
(Verhertbruggen et al., 2009)
LM5 β-(1,4)-galactanes (RG I) (Jones et al., 1997)
LM6 α-(1,5)-arabinanes (RG I) (Willats et al., 1998)
LM11 xylanes / arabinoxylanes (AX) (Willats et al., 1998)
LM15 Xyloglucanes (XG) (Marcus et al., 2008)
LM21 β-(1,4)-mannanes (Marcus et al., 2010)

Tableau 5.4 : Spécificités des anticorps employés pour la détection des


polysaccharides pariétaux

Page 173
Chapitre 5

Nous avons également testé ces anticorps sur des préparations commerciales de
polysaccharides afin de valider leur spécificité. L’ensemble des résultats obtenus est présenté
sur la figure 5.12. Nous devons préciser que les dépôts des fractions de polysaccharides
pariétaux enrichies en hémicelluloses et en cellulose génèrent une tâche claire qui ne
correspond pas à un signal, mais qui est due au NaOH ou au cadoxène qui solubilisent
partiellement la nitrocellulose.

Figure 5.12 : Caractérisation des fractions de polysaccharides pariétaux avec des


anticorps monoclonaux
Trois fractions de polysaccharides pariétaux ont été extraites séquentiellement de tissu protonémal de P.
patens, de jeunes feuilles de B. distachyon et d’hypocotyles étiolés d’A. thaliana : pectines, hémicelluloses et
cellulose. Elles ont été déposées sur membrane de nitrocellulose (2 µL par fraction pectines ou hémicelluloses et
0,5 µL par fraction cellulose). De même des polysaccharides commerciaux correspondant aux spécificités des
différents anticorps testés ont été déposés (20 µg). Les polysaccharides ont été révélés par des anticorps
monoclonaux (JIM5, LM5, LM15, LM6, LM11, LM21).

Ces résultats montraient que :


- L’anticorps JIM5 reconnaît toutes les fractions de polysaccharides pariétaux enrichies
en pectines ainsi que la pectine methylestérifiée alors qu’il est plustôt décrit comme
reconnaissant les pectines peu méthylesterifiées (cf Tableau 5.4).
- L’anticorps LM5 reconnaît, en plus du contrôle galactane, les fractions de
polysaccharides pariétaux enrichies en pectines, mais avec un signal plus intense pour les
fractions de B. distachyon et d’A. thaliana. Un signal faible est également obtenu avec celles
enrichies en hémicelluloses de B. distachyon et d’A. thaliana. Ceci montre que le RG I

Page 174
Chapitre 5

ramifié par des chaînes de galactanes est principalement extrait dans la fraction « pectines »,
mais qu’il reste des traces de ce composé dans la fraction « hémicelluloses ».
- L’anticorps LM15, réactif sur le xyloglucane, révèle les fractions de polysaccharides
pariétaux enrichies en hémicelluloses et en cellulose de B. distachyon et d’A. thaliana,
suggérant qu’une partie du xyloglucane reste associé à la cellulose. LM15 reconnaît aussi la
fraction enrichie en cellulose de P. patens, mais avec un signal faible, témoignant de la faible
quantité de xyloglucane chez cette plante.
- L’anticorps LM6 reconnaît les fractions de polysaccharides pariétaux enrichies en
pectines, attestant de la présence de RG I ramifié par des arabinanes. De façon plus
surprenante, il reconnaît également les fractions enrichies en cellulose de B. distachyon et de
P. patens.
- L’anticorps LM11, testé sur l’arabinoxylane, reconnaît uniquement les fractions de
polysaccharides pariétaux de B. distachyon, avec une intensité plus forte avec la fraction
enrichie en hémicelluloses. Ceci est en accord avec la présence de xylanes et
d’arabinoxylanes chez les monocotylédones, chez lesquelles ils constituent le principal
polysaccharide non cellulosique dans les parois primaires (20 à 40%) (Vogel, 2008; Scheller
et Ulvskov, 2010; Hao et Mohnen, 2014). Ce composé semble difficile à séparer des autres
polysaccharides puisqu’un signal est observé dans chacune des trois fractions.
- L’anticorps LM21 reconnaît, en plus du contrôle mannane, les trois fractions de P.
patens. Il génère aussi des signaux de plus faible intensité avec les fractions enrichies en
hémicelluloses et en cellulose d’A. thaliana et de B. distachyon.

Ces résultats étaient en accord avec ceux décrits précédemment (Moller et al., 2007; Hijazi
et al., 2014b) et confirmaient que nous travaillions avec des fractions enrichies en différents
polysaccharides. Sur la base de ces résultats de validation des fractions de polysaccharides,
nous avons poursuivi notre étude par la recherche de partenaires des domaines PAC dans les
parois végétales.

5.2.2.2. Recherche de partenaires des protéines PAC dans les parois végétales

Il a précédemment été démontré que le domaine PAC d’AGP31 interagit in vitro avec le
galactane rencontré sur les chaînes latérales du RG I et avec la protéine AGP31, probablement
via les O-glycanes riches en Gal/Ara de son domaine H/PRP (Hijazi et al., 2014b). Un des
objectifs de cette thèse était de déterminer si d’autres domaines PAC étaient également
capables de se lier aux polysaccharides et avec quelle spécificité. Les 7 domaines PAC
d’intérêt produits dans E. coli et enrichis par NAC (cf § 5.2.1) ont donc été utilisés pour des
tests d’interaction avec des polysaccharides. Dans un premier temps, des essais ont été
réalisés avec des extraits de polysaccharides, puis dans un deuxième temps, avec des
préparations commerciales afin d’identifier plus précisément les interactants.

Page 175
Chapitre 5

5.2.2.2.1. Interactions entre les domaines PAC et les extraits de polysaccharides


pariétaux

Ces tests ont été réalisés pour savoir s’il existait des interactions homologues entre les
domaines PAC et les fractions enrichies en pectines, hémicelluloses et cellulose extraites de
parois. Pour cela, les différents domaines PAC ont été mis en présence des extraits issus des
plantes correspondantes. Ainsi, la membrane contenant les fractions de P. patens a été
incubée avec le domaine PAC de Pp1s79_182V6, celle contenant les fractions de B.
distachyon avec le domaine PAC de Bradi3g21000 et celle contenant les fractions d’A.
thaliana avec le domaine PAC d’AGP31. Pour chaque essai, une membrane contrôle était
réalisée par incubation avec un extrait d’E. coli préparé à partir d’une souche transformée par
un vecteur vide. Aucun signal n’a été observé pour ces témoins négatifs (Figure 5.13).

Après incubation des protéines d’intérêt et révélation par l’anticorps anti-V5, un signal a
été détecté dans les fractions enrichies en pectines pour chacun des trois domaines PAC,
suggérant que ces domaines sont impliquées dans la liaison avec un (ou plusieurs) constituant
des pectines (Figure 5.13). Ceci corroborait les résultats précédemment obtenus avec le
domaine PAC d’AGP31 pour lequel des interactions avec les galactanes du RG I (un des
constituants des pectines) avaient été démontrées (Hijazi et al., 2014b). Notons que lors des
précédents essais, ce composé était préalablement contenu dans la fraction enrichie en
hémicelluloses alors qu’il semble ici avoir été extrait dans la fraction pectique. Ceci atteste
d’une meilleure extraction, probablement due à une adaptation du protocole consistant en
l’utilisation de tubes d’un volume supérieur.

Les domaines PAC d’AGP31 et de Bradi3g21000 ne génèraient pas de signal avec les
fractions enrichies en hémicelluloses et en cellulose (Figure 5.13). A l’inverse, les essais
réalisés avec le domaine PAC de Pp1s79_182V6 montraient des signaux avec les fractions
enrichies en hémicelluloses et en cellulose de P. patens, suggérant que ce domaine PAC
reconnait d’autres constituants contenus dans ces fractions (Figure 5.13).

Page 176
Chapitre 5

Pp1s79_182V6 Bradi3g21000 AGP31


+ - + - + -
Pectines

B. distachyon
Pectines Pectines

A. thaliana
P. patens
Hémicelluloses Hémicelluloses Hémicelluloses

Cellulose Cellulose Cellulose

Figure 5.13 : Interactions in vitro entre des domaines PAC de P. patens


(Pp1s79_182V6), B. distachyon (Bradi3g21000) et A. thaliana (AGP31) et des fractions
polysaccharidiques extraites de parois végétales
Trois fractions de polysaccharides pariétaux ont été extraites séquentiellement de tissu protonémal de P.
patens, de jeunes feuilles de B. distachyon et d’hypocotyles étiolés d’A. thaliana : pectines, hémicelluloses et
cellulose. Elles ont été déposées sur membrane de nitrocellulose (2 µL par fraction pectines ou hémicelluloses et
0,5 µL par fraction cellulose). Trois domaines PAC produits dans E. coli ont été testés pour révéler des
interactions avec des polysaccharides extraits de leurs plantes d’origine (interactions homologues). Les
interactions ont été révélées avec des anticorps anti-V5. Pour chaque membrane, un contrôle négatif (-) réalisé
avec un extrait bactérien non induit est réalisé.

5.2.2.2.2. Spécificité des interactions entre les domaines PAC et des


polysaccharides pariétaux

Afin de vérifier la spécificité des interactions observées, nous avons réalisé des tests
d’interaction hétérologue entre les domaines PAC et les polysaccharides pariétaux extraits de
de plantes différentes de leur plante d’origine. Ces expériences ont été réalisées avec trois
domaines PAC, i.e. ceux de Pp1s79_182V6, de Bradi3g21000 et d’AGP31. Les essais
suivants ont été réalisés :

- Le domaine PAC de Pp1s79_182V6 a été testé avec les fractions des polysaccharides
pariétaux extraits de B. distachyon et d’A. thaliana.

- Le domaine PAC de Bradi3g21000 a été testé avec les fractions extraites de P. patens et
d’A. thaliana.

- Le domaine PAC d’AGP31 a été testé avec les fractions extraites de B. distachyon et de
P. patens.

Les résultats de ces tests sont présentés sur la figure 5.14.

Page 177
Chapitre 5

Pp1s79_182V6 Bradi3g21000 AGP31

Pectines Pectines Pectines

A. thaliana

P. patens

P. patens
Hémicelluloses Hémicelluloses Hémicelluloses

Cellulose Cellulose Cellulose

Pectines Pectines Pectines


B. distachyon

B. distachyon
A. thaliana
Hémicelluloses Hémicelluloses Hémicelluloses

Cellulose Cellulose Cellulose

Figure 5.14 : Interactions in vitro entre des domaines PAC de P. patens (Pp1s79_182V6),
de B. distachyon (Bradi3g21000) et d’A. thaliana (AGP31)
et des fractions polysaccharidiques extraites de parois
Trois fractions de polysaccharides pariétaux ont été extraites séquentiellement de tissu protonémal de P.
patens, de jeunes feuilles de B. distachyon et d’hypocotyles étiolés d’A. thaliana : pectines, hémicelluloses et
cellulose. Elles ont été déposées sur membrane de nitrocellulose (2 µL par fraction pectines ou hémicelluloses et
0,5 µL par fraction cellulose). Trois domaines PAC produits dans E. coli ont été testés pour révéler des
interactions avec des polysaccharides extraits des deux autres plantes (interactions hétérologues). Ces
interactions ont été révélées avec des anticorps anti-V5.

Ces résultats montraient que :

- Le domaine PAC de Pp1s79_182V6 interagit avec les fractions enrichies en pectines


d’A. thaliana et de B. distachyon, ainsi qu’avec les fractions enrichies en hémicelluloses
et en cellulose d’A. thaliana.

- Le domaine PAC de Bradi3g21000 a un profil d’interaction avec les fractions issues de


P. patens et A. thaliana similaire à celui observé avec les fractions de B. distachyon (cf
§ 5.2.2.2.1.). Il interagit avec la fraction enrichie en pectines, suggérant que sa cible soit
un constituant pectique présent chez ces trois plantes.

- Le domaine PAC d’AGP31 interagit avec les fractions enrichies en pectines de P.


patens et de B. distachyon, comme avec celle issue d’A. thaliana (cf § 5.2.2.2.1.). Là
encore, il semble qu’il reconnaisse un composant des pectines présent dans chacune de
ces fractions.

Page 178
Chapitre 5

5.2.2.2.3. Interactions entre les domaines PAC et les polysaccharides


commerciaux

Les résultats obtenus ont permis de montrer pour trois domaines PAC issus de différentes
plantes des interactions, homologues ou hétérologues, avec des fractions pariétales enrichies
en différents polysaccharides. Cependant, comme montré par l’analyse en immunodétection,
ces fractions contenaient des mélanges de constituants. Leur composition exacte n’était pas
connue, rendant difficile l’interprétation des résultats. Afin de préciser les spécificités
d’interactions des différents domaines PAC, nous avons mis en œuvre, pour les 7 domaines
PAC choisis, des essais d’interaction avec des préparations commerciales de polysaccharides
reflétant la diversité des constituants des parois.

Les résultats des tests d’interaction sont présentés sur la figure 5.15. Ces tests montrent que
tous les domaines PAC testés interagissent avec le galactane (P5) et avec le RG I (P6) pour
lequels des signaux nets sont observés. La faiblesse des signaux obtenus avec le galactane
provient d’un problème de conservation de cette solution. Les 7 domaines PAC ont donc tous
la capacité à se lier au RG I, probablement via les branches de β-(1,4)-galactanes. Cette
spécificité correspond à celle déjà décrite pour le domaine PAC d’AGP31 (Hijazi et al.,
2014b).

P1: PGA P1 P1

P3 : PGAm P3 P3

P5 : galactane P5 P5

P6 P6
P6 : RG I

P7 P7
P7 : AG

H1 H1
H1 : XG
H5 : AX H5

H6 : mannane H6 H6

C : cellulose C C

Figure 5.15 : Interactions in vitro entre des domaines PAC de P. patens


(Pp1s79_182V6), de B. distachyon (Bradi3g21000) et d’A. thaliana (AGP31, At5g45880,
At2g34700, At5g05500, At5g10130) et des polysaccharides commerciaux
Des solutions de polysaccharides commerciaux ont été déposées sur des membranes de nitrocellulose (20
µg/spot). Sept domaines PAC produits dans E. coli ont été testés pour rechercher des interactions. Les protéines
en interaction ont été révélées avec des anticorps anti-V5. Le contrôle négatif (-) consiste en un extrait bactérien
non induit.

Page 179
Chapitre 5

Sur les 5 domaines PAC d’A. thaliana testés, 4 présentaient le même comportement que
celui d’AGP31, avec pour seule spécificité celle vis-à-vis du galactane/RG I. Ce
comportement a été également observé pour le domaine PAC de Bradi3g21000.

Par ailleurs, des spécificités supplémentaires ont été observées pour deux domaines PAC.
De façon remarquable, le domaine PAC d’At5g05500 interagit très nettement avec le XG, la
cellulose et le β-(1,4)-mannane. Le domaine PAC de P. patens (Pp1s79_182V6) interagit
aussi avec le mannane.

5.3. Discussion

Les données présentées dans ce chapitre concernent la mise en place des outils pour la
production et la purification des domaines PAC ciblés et la réalisation des expériences
d’interaction in vitro afin d’identifier leurs partenaires polysaccharidiques. Les résultats
obtenus ont permis d’apporter des résultats nouveaux concernant les spécificités
d’interaction des domaines PAC avec des polysaccharides pariétaux.

L’étude des différents domaines PAC sélectionnés a d’abord consisté à réaliser les
constructions contenant leurs séquences codantes en fusion avec deux épitopes, V5 et 6xHis,
à produire ces protéines dans deux systèmes différents (N. benthamiana et E. coli) et à les
purifier. Les essais de mise au point ont été longs, mais après de multiples protocoles testés,
nous avons choisi (i) de produire les protéines d’intérêt dans un système bactérien, et (ii) de
les enrichir en seule étape de NAC afin de disposer de quantités suffisantes pour les tests
d’interaction avec des polysaccharides.

Le choix d’E. coli s’est opéré puisque les essais réalisés avec le domaine PAC d’AGP31
ont permis de montrer qu’il présentait les mêmes spécificités d’interaction, qu’il soit produit
dans E. coli ou N .benthamiana. Ceci suggère que les N-glycosylations ne participent pas aux
interactions in vitro. Par ailleurs, face aux problèmes de pertes de protéines lors de
l’enchaînement de plusieurs étapes chromatographiques, nous avons opté pour un procédé
d’enrichissement en une seule étape. Ce procédé robuste et reproductible a permis d’obtenir
des quantités de protéines faibles, mais suffisantes pour réaliser des tests d’interaction. La
présence de contaminants n’a pas gêné la mise en œuvre de ces essais qui ont permis de
reproduire les résultats précédemment obtenus par May Hijazi sur le domaine PAC d’AGP31
produit dans N. benthamiana et purifié en deux étapes (Hijazi et al., 2014b), validant notre
mode opératoire.

Les essais d’interaction sur membrane ont ainsi pu être réalisés avec succès pour les 7
domaines PAC sur des extraits de polysaccharides et/ou sur des préparations commerciales.
Les résultats obtenus ont permis de révéler 3 types de spécificités vis-à-vis des
polysaccharides pariétaux (Tableau 5.5).

Page 180
Chapitre 5

Spécificité vis-à-vis des


Spécificité vis-à-vis des
Spécificité Domaine PAC Clade polysaccharides
polysaccharides pariétaux
commerciaux
AGP31 A

At5g10130 F
β-(1,4)-galactane
SI At2g34700 A Fractions enrichies en pectines *
RG I
At5g45880 F
Bradi3g21000 J

β-(1,4)-galactane Fractions enrichies en pectines

RG I Fractions enrichies en
SII Pp1s79_182V6 G hemicelluloses d’A. thaliana et
P. patens
mannane
Fractions enrichies en cellulose
d’A. thaliana et P. patens

β-(1,4)-galactane
RG I

SIII At5g05500 C xyloglucane Non testé


mannane

cellulose

Tableau 5.5 : Spécificités d’interaction avec les polysaccharides mises en évidence


pour les 7 domaines PAC considérés dans cette étude
Les composés des pectines et des hémicelluloses apparaissent sur fond vert et bleu, respectivement. * Les
essais sur les polysaccharides extraits des parois ont été réalisés seulement avec les domaines PAC d’AGP31
et de Bradi3g21000.

- La spécificité SI correspond à une reconnaissance unique des β-(1,4)-galactanes du RG


I. Parmi les 7 domaines PAC testés, 5 présentent ce profil, à savoir ceux d’AGP31,
At5g10130, At2g34700, At5g45880 et Bradi3g21000. Les signaux obtenus sur les
fractions enrichies en pectines sont en accord avec cette spécificité, les RG I étant l’un
des constituants des pectines.

- La spécificité SII est définie par le domaine PAC de Pp1s79_182V6. Celui-ci reconnaît,
comme les domaines PAC de spécificité SI, les β-(1,4)-galactanes du RG I contenus
dans les fractions enrichies en pectines. De plus, il reconnaît le mannane. Ceci est en
accord avec les signaux observés en présence des fractions enrichies en hémicelluloses
de P. patens (cf Figure 5.13). En effet, les mannanes sont des hémicelluloses abondantes

Page 181
Chapitre 5

dans les parois des plantes terrestres non-angiospermes (Popper et Fry, 2003; Popper,
2008). En accord avec la détection avec LM21, un anti-mannanes (Figure 5.12), ces
composés sont également présents dans la fraction enrichie en cellulose, ce qui explique
les signaux obtenus avec cette fraction.

Les signaux observés à partir des fractions enrichies en hémicelluloses et en cellulose


d’A. thaliana sont probablement aussi dus à la présence de mannanes dans ces fractions,
comme révélé par la détection avec LM21 (Figure 5. 12). Ceci corrobore les données de
la littérature indiquant que les mannanes peuvent représenter de 2 à 10% des parois
primaires des dicotylédones (Liepman et al., 2007; Vogel, 2008; Scheller et Ulvskov,
2010; Popper et al., 2011). Les mannanes sont très minoritaires dans les parois
primaires des graminées, ce qui est en accord avec l’absence de signal en présence des
fractions enrichies en hémicelluloses de B. distachyon. De façon surprenante, les
signaux obtenus avec LM21 indiquent la présence de mannanes dans les fractions de B.
distachyon, peut-être en quantité trop faible pour être reconnus par le domaine PAC de
Pp1s79_182V6.

- La spécificité SIII correspond au domaine PAC d’At5g05500. Il partage la spécificité


des domaines PAC de spécificité SI, mais est aussi capable de se lier au xyloglucane, à
la cellulose et au mannane. Il est donc moins spécifique que les 4 autres domaines PAC
d’A. thaliana.

Nos résultats apportent donc des éléments nouveaux sur la fonction des domaines PAC.
Les tests d’interaction in vitro ont permis de montrer que les 7 domaines testés ont en
commun la capacité à interagir avec les β-(1,4)-galactanes du RG I, révélant une convergence
fonctionnelle pour ces domaines PAC. De plus, nos travaux ont également permis de révéler
des spécificités propres à certains domaines PAC. De manière intéressante, les spécificités des
domaines PAC appartenant aux mêmes clades, A (AGP31, At2g34700) et F (At5g10130,
At5g45880), sont identiques (spécificité SI). Les domaines PAC ayant des spécificités SII et
SIII appartiennent à des clades différents (G et C, respectivement).

Au regard de l’ensemble des résultats obtenus, nous pouvons suggérer que les domaines
PAC sont des protéines impliquées dans des réseaux d’interactions non covalents avec des
polysaccharides pariétaux. Ils viendraient renforcer les interactions non covalentes entre
protéines et polysaccharides, telles que celles déjà suggérées pour la protéine multidomaine
AGP31 (Hijazi et al., 2014b). Les domaines PAC pourraient donc constituer des éléments
structurants des parois et contribuer à l’assemblage supramoléculaire de cette matrice
composite complexe.

D’un point de vue mécanistique, il serait utile de poursuivre la caractérisation des


interactions au travers de tests plus poussés, mettant en œuvre des méthodes quantitatives,
telles que la thermophorèse, la résonance plasmonique de surface ou encore la
microcalorimétrie. Un effort conséquent devra être réalisé afin d’améliorer le niveau de
production des protéines d’intérêt afin de disposer de quantités et de niveaux de pureté

Page 182
Chapitre 5

suffisants pour la réalisation de tels essais. Il serait alors possible de mesurer des constantes
d’affinités vis-à-vis de différents ligands afin de mieux comprendre les bases moléculaires des
interactions. Des expériences de mutagénèse dirigée pourraient aussi être entreprises afin
d’évaluer le rôle de certains acides aminés. Les 6 résidus Cys qui sont très conservés dans
toutes les séquences des domaines PAC constituent des cibles intéressantes. Ils pourraient être
remplacés par des résidus Ala afin d’évaluer le rôle de possibles ponts disulfure dans la
capacité de liaison des domaines PAC aux polysaccharides (Xiaojie Ma, Bachelor, Université
de Chongqing, Chine ; travail en cours). D’autres mutants, définis sur la base d’alignements
de séquences issus de l’analyse phylogénétique, pourraient aussi être construits et
caractérisés.

Enfin, pour mieux comprendre la fonction des domaines PAC dans la lignée verte, il serait
utile d’entreprendre la caractérisation d’autres domaines PAC, issus d’autres clades. La
mutagenèse dirigée de motifs conservés repérés au cours de l’analyse phylogénique (cf
chapitre 4, § 4.8.), associée à des expériences de modélisation moléculaire, permettrait de
progresser vers une meilleure compréhension des bases moléculaires de leur spécificité. Ces
approches devraient permettre de décrire les relations structure/fonction qui gouvernent les
domaines PAC, apportant ainsi des éléments nouveaux sur l’architecture et l’évolution des
parois végétales.

Page 183
Chapitre 6

6. CONCLUSIONS ET PERSPECTIVES

Parmi les protéines pariétales, les HRGP constituent une famille de protéines pariétales très
diversifiées, tant d’un point de vue structural que fonctionnel. Etudiées depuis de nombreuses
années, elles ne sont encore que partiellement caractérisées et constituent un champ de
recherches encore très prometteur dans lequel se situe ce travail de thèse.

Un objectif majeur de ce travail de thèse consistait à rechercher des partenaires


d’interaction de LRX1 et des domaines PAC dans les parois végétales. En effet, les
protéines de type LRX et AGP31 ont en commun leur potentialités de liaison à d’autres
constituants pariétaux, qu’il s’agisse de protéines (domaine LRR de LRX) ou de
polysaccharides (domaine PAC d’AGP31). La protéine LRX1 (At1g12040) comporte un
domaine LRR (domaine d’interaction protéine/protéine) en N-terminal et un domaine EXT en
C-terminal. Elle joue un rôle dans le développement des poils absorbants racinaires car la
morphologie des poils absorbants du mutant lrx1 est fortement modifiée (Baumberger et al.,
2001; Diet et al., 2006). La recherche de mutants suppresseurs du phénotype lrx1 a conduit à
l’identification de gènes impliqués dans la synthèse des pectines tels que RHM codant une
UDP-L-rhamnose synthase (Diet et al., 2006). Chez lrx1, la transcription de plusieurs gènes
impliqués dans la biogenèse des parois est modifiée, ce qui suggère des interactions entre
LRX1 et d’autres constituants pariétaux. La protéine AGP31 (At1g28290) comporte un court
domaine de type AGP en N-terminal, un domaine riche en His, un domaine central riche en
Pro/Hyp et un domaine PAC en C- terminal. Le domaine PAC d’AGP31 interagit in vitro de
manière non covalente avec les O-glycanes riches en Gal/Ara du domaine riche en Pro/Hyp
d’AGP31 et/ou des galactanes du RG I (Hijazi et al., 2014b). Le domaine PAC est aussi
présent dans d’autres protéines, mais sa fonction reste largement méconnue.

Afin d’identifier des protéines pariétales pouvant interagir avec LRX1 et potentiellement
impliquées dans la morphogenèse des poils absorbants racinaires, nous nous sommes
intéressés au protéome pariétal des racines d’A. thaliana, plantes sauvages vs plantes lrx1.
Deux stratégies de préparation d’extraits de protéines pariétales ont été mises en œuvre, la
première correspondant à celle couramment employée au laboratoire (Irshad et al., 2008;
Douché et al., 2013), la seconde basée sur une réduction de la gamme dynamique des
protéines par la technologie ProteoMiner™ (Righetti et Boschetti, 2008). Les extraits obtenus
ont été analysés par spectrométrie de masse de type LC-MS/MS. Au total, 424/434 protéines
pariétales des racines d’A. thaliana sauvage/mutante lrx1 ont été identifiées, respectivement.
Avec ces nouvelles données, le protéome de la paroi d’A. thaliana est le mieux documenté à
ce jour avec 687 protéines pariétales. La technologie ProteoMiner™ a permis d’élargir d’1,4
fois la taille du protéome pariétal des racines. Ce travail a permis de révéler une remarquable
efficacité de cette technologie qui pourrait être utilisée pour élargir la couverture d’autres
protéomes pariétaux. Des hydroxylations de résidus Pro des Prx de classe III ont aussi été
mises en évidence pour la première fois. Par ailleurs, la comparaison des protéomes de racines
de plantes sauvages ou mutantes a permis de révéler des différences subtiles. En effet, des

Page 184
Chapitre 6

protéines trouvées spécifiquement ou en plus grande quantité dans le sauvage, et dans le


mutant lrx1 ont été identifiées. Au total, 25 protéines pouvant jouer un rôle dans la
formation et/ou l’élongation des poils absorbants ont été mises en évidence et constituent
des candidats intéressants pour des études fonctionnelles. En particulier, des analyses seront
nécessaires pour voir si les gènes codant pour ces protéines sont transcrits dans les poils
absorbants. De plus, l’étude de mutants permettrait de mettre en évidence un rôle éventuel
dans la formation des poils absorbants. Cette partie de la thèse a donc permis d’élargir la
connaissance du protéome pariétal d’A. thaliana et d’identifier des protéines candidates
pouvant jouer un rôle dans la formation et/ou l’élongation des poils racinaires.

Le travail effectué sur les domaines PAC des protéines pariétales a comporté deux
volets. D’une part, nous avons effectué une recherche bioinformatique systématique de
domaines PAC dans la lignée verte après avoir défini un domaine PAC canonique et nous
avons construit une phylogénie. D’autre part, nous avons réalisé des tests d’interaction in
vitro entre des domaines PAC recombinants et des polysaccharides pariétaux.

Nous avons établi que des domaines PAC canoniques sont présents chez toutes les
plantes terrestres étudiées. Chez les algues, nous avons trouvé des domaines apparentés au
domaine PAC canonique, mais présentant des différences d’organisation, soit au niveau du
nombre de résidus Cys, soit au niveau de l’organisation des protéines en domaines. Ainsi,
l’apparition des protéines à domaine PAC canonique peut être reliée à la terrestrialisation des
plantes. L’apparition de ce domaine succèderait à celle des mannanes, serait concomitante à
celle des xyloglucanes et précèderait celle des lignines (Figure 6.1) (Popper et al., 2001;
Popper et Fry, 2008; Sarkar et al., 2009; Steemans et al., 2009; Umen, 2014). Il faudra
cependant vérifier l’absence de domaine PAC canonique chez P. margaritaceum, lorsque la
qualité de sa séquence génomique sera améliorée.

Les domaines PAC ont été groupés en 10 clades, dont chacun comporte 1 (clades A-I)
ou 2 protéines (clade J) d’A. trichopoda, une plante ancêtre des angiospermes. Le clade E est
remarquable car il comporte des protéines très homologues. Outre les 6 résidus Cys qui
définissent le domaine PAC canonique, certains motifs d’acides aminés ont pu être repérés
dans différents clades. Globalement, il semble que le sous-domaine N-terminal des domaines
PAC est mieux conservé que les sous-domaines centraux et C-terminal. Certains domaines
PAC sont acides et d’autres basiques, ce qui suggère des localisations sub-pariétales
différentes, apoplastiques ou en association plus étroite avec les polysaccharides pariétaux
(Jamet et al., 2006).

Page 185
Chapitre 6

A. thaliana
P. equestris G. raimondii
E. grandis
B. distachyon L. usitatissimum
β-(1,3)(1,4 )glucanes O. sativa V. vinifera
P. virgatum P. trichocarpa
acide férulique
(parois primaires) S. bicolor
dicotylédones
S. italica

monocotylédones
P. taeda
P. pinaster

β-(1,3)(1,4 )glucanes gymnospermes


A. trichopoda
S. moellendorffii lignine GS
O. lucimarinus P. patens fougères lignine G
Prasinophyceae mousses
lignines
P. margaritaceum
V. carteri Zygnematophyceae - 435 MA : trachéides (parois secondaires)
C. reinhardtii
Chlorophyceae xyloglucanes

- 465 MA : terrestrialisation
- 500 MA : multicellularité complexe
protéines à domaine
mannanes PAC canonique

Figure 6.1 : Apparition des protéines à domaine PAC canonique


au cours de l’évolution de la lignée verte
Les principales étapes de l’évolution de la lignée verte sont retracées sur le schéma. Les organismes étudiés
sont indiqués, ainsi que le moment d’apparition de quelques constituants pariétaux (d’après (Popper et al., 2001;
Popper et Fry, 2003; Sarkar et al., 2009; Steemans et al., 2009; Umen, 2014)).

Les études fonctionnelles réalisées avec les domaines PAC ont permis de révéler des
spécificités de liaison différentes aux polysaccharides qui pourraient avoir évolué
parallèlement à l’évolution des plantes (Tableau 6.1). D’abord, le spectre d’interactants aurait
été large comme celui du domaine PAC de P. patens (spécificité SII), reconnaissant à la fois
des domaines pectiques (β-1,4-galactanes/RG I) et des hémicelluloses (mannanes). Cette
spécificité multiple pourrait s’expliquer par le fait que seulement 2 domaines PAC ont été
identifiés chez cet organisme. Par la suite, les domaines PAC auraient pu (i) se spécialiser en
réduisant le spectre de leurs interactants (spécificité SI) en ne reconnaissant plus que des
domaines pectiques (β-1,4-galactanes/RG I), ou (ii) au contraire accroître leur spectre
d’interactants (spécificité SIII) en reconnaissant, en plus de ces domaines pectiques, d’autres
hémicelluloses (mannanes, xyloglucane) et la cellulose. Ces événements auraient pu se
produire du fait de l’évolution de la composition des parois végétales. En effet, les parois de
P. patens sont particulièrement riches en mannanes (Popper et Fry, 2003; Popper, 2008). Les
parois des dicotylédones sont riches en xyloglucanes (Vogel, 2008; Hsieh et al., 2009;
Scheller et Ulvskov, 2010) tout en contenant également des mannanes (Liepman et al., 2007;
Vogel, 2008; Scheller et Ulvskov, 2010; Popper et al., 2011). L’évolution de la composition
des parois aurait été parallèle à l’augmentation du nombre de protéines à domaine PAC,
conduisant à une spécialisation de certaines d’entre elles.

Page 186
Chapitre 6

Un autre élément intéressant des domaines PAC concerne leur possible association à
d’autres domaines. En effet, un domaine PAC peut être associé à des domaines AGP, des
domaines riches en His, en motifs XP(n>2)X ou S(P)n>2 (EXT), ou encore à des domaines
non caractérisés à ce jour. Il est à noter que l’association ou non à d’autres domaines ne
semble pas être liée à une spécificité particulière (Tableau 6.1). Il est donc probable que le
domaine PAC a une activité biologique qui lui est propre. On peut souligner le fait que
l’association avec un domaine riche en Pro est un élément souvent observé dans la grande
famille des protéines ayant un domaine riche en Cys conservées (de 4 à 12), suggérant des
fonctionnalités similaires (Baud et al., 1993; Dvorakova et al., 2007; Silverstein et al., 2007;
Yeats et Rose, 2008; Rubinovich et Weiss, 2010).

Organisation
Domaine PAC Organisme Clade Spécificité
structurale
AGP31 A. thaliana A 3.1 SI

At2g34700 A. thaliana A 3.2 SI

At5g10130 A. thaliana F 1.1 SI

At5g45880 A. thaliana F 1.1 SI

Bradi3g21000 B. distachyon J 2.2 SI

At5g05500 A. thaliana C 1.2 SIII

Pp1s79_182V6 P. patens G 2.3 SII

Tableau 6.1 : Propriétés et caractéristiques des domaines PAC étudiés

Nos résultats confortent l’hypothèse d’un rôle des domaines PAC dans la formation de
réseaux non covalents entre protéines et polysaccharides à travers des interactions
protéines/polysaccharides, comme précédemment démontré pour le domaine PAC d’AGP31
de spécificité SI (Hijazi et al., 2014a; 2014b). Ainsi, les domaines PAC pourraient
constituer des éléments structurants des parois et contribuer à l’assemblage
supramoléculaire de cette matrice composite complexe. La capacité de liaison aux sucres des
domaines PAC nous laisse penser que ces domaines pourraient constituer une nouvelle
famille de domaines lectines de plantes (Vijayan et Chandra, 1999; Van Damme et al., 2008).
Ces domaines forment un groupe diversifié interagissant avec les sucres de manière
spécifique. Les protéines qui les contiennent peuvent être classées en différentes familles sur
la base de la séquence de leur domaine de reconnaissance de sucres (Van Damme et al.,
2008), de leur spécificité de liaison aux sucres (Jiang et al., 2010) ou de leur structure
tridimensionnelle (Pérez et al., 2015). Chez les plantes, certaines lectines sont synthétisées
avec un peptide signal et sont dirigées vers la voie de sécrétion, tandis que d’autres résident
dans le noyau ou le cytoplasme (Lannoo et Van Damme, 2010). Les lectines sont proposées
jouer un rôle dans plusieurs processus biologiques importants tels que la défense en réponse à
différents stress biotiques (Nagadhara et al., 2004; Keyaerts et al., 2007; Sadeghi et al., 2008)

Page 187
Chapitre 6

et abiotiques (Zhang et al., 2000; Babosha, 2008), et la signalisation (Van Holle et Van
Damme, 2015). Il est intéressant de souligner qu’une lectine, PNA, spécifique des résidus Gal
(Jeyaprakash et al., 2005), est capable de reconnaître les O-glycanes riches en Gal/Ara du
domaine riche en Pro/Hyp d’AGP31 (Hijazi et al., 2014b), suggérant une fonction proche des
domaines PAC de spécificité SI. La poursuite de l’étude des protéines à domaine PAC
permettra de les caractériser finement et d’apporter des éléments justifiant ou non la création
d’une nouvelle famille de lectines. A plus long terme, il s’agira d’identifier les bases
moléculaires responsables des spécificités d’interaction des domaines PAC.

Lectines
Cellulose Arabinogalactane de type II

XG Domaine de type AGP PAC de spécificité SI


Mannanes Domaine riche en His PAC de spécificité SII
HG Domaine PRP
PAC de spécificité SIII

RG I O-glycanes riches en Gal/Ara


Liaisons non-covalentes
RG II O-glycanes putatifs

Figure 6.2 : Représentation schématique des interactions entre les protéines à


domaine PAC et les polysaccharides pariétaux in muro
Ce modèle propose une vue globale des interactions possibles entre les protéines à domaine PAC étudiées et
des polysaccharides pariétaux. Les interactions entre les domaines d’AGP31 ont été démontrées in vitro (Hijazi
et al., 2014a), ainsi que les interactions entre des domaines PAC de différentes spécificités (SI-III) (ce travail).
Les éléments prédictifs de cette représentation concernent les interactions avec les lectines et l’auto-assemblage
des protéines de type 2.

Page 188
Chapitre 6

L’ensemble des données obtenues permet de compléter le modèle d’interactions entre


protéines riches en Pro/Hyp à domaine PAC et polysaccharides pariétaux précédemment
proposé (Hijazi et al., 2014a). La figure 6.2 en propose une version modifiée et focalisée sur
les interactions avec les polysaccharides proposées pour les protéines à domaine PAC :
(i) les domaines PAC de spécificité SI, qu’ils soient de type 1.1 (At5g10130, At5g45880 et
Bradi3g21000), 3.1 (AGP31) ou 3.2 (At2g34700) sont représentés en interaction avec des
galactanes du RG I ; (ii) les domaines PAC de spécificité SII et de type 2.3 (Pp1s79_182V6)
sont montrés en interaction avec les galactanes du RG I ainsi qu’avec les mannanes ; (iii) les
domaines PAC de spécificité SIII et de type 1.2 (At5g05500) apparaissent liés aux galactanes
du RG I, aux mannanes, au XG, à la cellulose ou à l’interface mannanes/cellulose ou
XG/cellulose. L’ensemble de ces interactions contribuerait à former des réseaux non
covalents dans les parois végétales entre protéines à domaine PAC et polysaccharides (Figure
6.2). On peut aussi souligner la possibilité pour les protéines possédant un domaine PAC
associé à un domaine riche en Pro/Hyp O-glycosylé de s’auto-assembler. Ce mécanisme
d’auto-assemblage, proposé pour AGP31, pourrait exister pour l’ensemble des protéines de
type 2 et 3. Il faudra confirmer cette hypothèse qui repose sur la présence sur les domaines
riches en Pro/Hyp de O-glycanes capables de se lier aux domaines PAC. Il conviendra donc
de poursuivre la caractérisation des O-glycosylations. On peut penser qu’une telle association
de domaines serait apparue au cours de l’évolution pour renforcer l’architecture pariétale.
Notons que le modèle proposé pourra être modifié et enrichi au fur et à mesure que des
données fonctionnelles sur des protéines à domaines PAC de différents types seront
disponibles. En particulier, il n’est pas exclu que des complexes hétérotypes entre protéines
multidomaines puissent exister, renforçant encore l’assemblage supramoléculaire des
protéines à domaines PAC et lui donnant une grande plasticité.

Page 189
Références

REFERENCES

Acosta-Garcia G, Vielle-Calzada JP (2004) A classical arabinogalactan protein is essential for the


initiation of female gametogenesis in Arabidopsis. Plant Cell 16: 2614-2628
Adamczyk B, Smolander A, Kitunen V, Godlewski M (2010) Proteins as nitrogen sources for
plants. A short story about exudation of proteases by plant roots. Plant Signal Behav 5: 817-819
Albenne C, Canut H, Boudart G, Zhang Y, San Clemente H, Pont-Lezica R, Jamet E (2009)
Plant cell wall proteomics: mass spectrometry data, a trove for research on protein
structure/function relationships. Mol Plant 2: 977-989
Albenne C, Canut H, Hoffmann L, Jamet E (2014) Plant cell wall proteins: a large body of data, but
what about runaways? Proteomes 2: 224-242
Albenne C, Canut H, Jamet E (2013) Plant cell wall proteomics: the leadership of Arabidopsis
thaliana. Front Plant Sci 4: 111
Albersheim P, Darvill A, Roberts K, Sederoff R, Staehelin A (2011) Plant cell walls: from
chemistry to biology. Garland Science, New York
Al-Qsous S, Carpentier E, Klein-Eude D, Burel C, Mareck A, Dauchel H, Gomord V, Balange
AP (2004) Identification and isolation of a pectin methylesterase isoform that could be involved in
flax cell wall stiffening. Planta 219: 369-378
Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) Basic local alignment search tool. J
Mol Biol 215: 403-410
Amborella Genome Project (2013) The Amborella genome and the evolution of flowering plants.
Science 342: 1241089
Aquino RS, Landeira-Fernandez AM, Valente AP, Andrade LR, Mourao PA (2005) Occurrence
of sulfated galactans in marine angiosperms: evolutionary implications. Glycobiology 15: 11-20
Arabidopsis Genome Initiative (2000) Analysis of the genome sequence of the flowering plant
Arabidopsis thaliana. Nature 408: 796-815
Bacic A, Churms S, Stephen A, Cohen P, Fincher G (1987) Fine structure of the arabinogalactan-
protein from Lolium multiflorum. Carbohydr Res 162: 85–93
Bailey TL, Boden M, Buske FA, Frith M, Grant CE, Clementi L, Ren J, Li WW, Noble WS
(2009) MEME SUITE: tools for motif discovery and searching. Nucleic Acids Res 37: W202-208
Balakshin M, Capanema E, Gracz H, Chang HM, Jameel H (2011) Quantification of lignin-
carbohydrate linkages with high-resolution NMR spectroscopy. Planta 233: 1097-1110
Baldwin TC, Domingo C, Schindler T, Seetharaman G, Stacey N, Roberts K (2001) DcAGP1, a
secreted arabinogalactan protein, is related to a family of basic proline-rich proteins. Plant Mol Biol
45: 421-435
Baldwin TC, Van Hengel AJ, Roberts K (2000) The C-terminal PAC domain of a secreted
arabinogalactan-protein from carrot defines a family of basic proline-rich proteins. In EA
Nothnagel, A Bacic, AE Clarke, eds, Cell and developmental biology of arabinogalactan proteins.
Springer US, New York, pp 43-49
Basu U, Francis JL, Whittal RM, Stephens JL, Wang Y, Zaiane OR, Goebel R, Muench DG,
Good AG, Taylor GJ (2006) Extracellular proteomes of Arabidopsis thaliana and Brassica napus
roots: analysis and comparison by MudPIT and LC-MS/MS. Plant and Soil 286: 357-376
Battaglia M, Solorzano RM, Hernandez M, Cuellar-Ortiz S, Garcia-Gomez B, Marquez J,
Covarrubias AA (2007) Proline-rich cell wall proteins accumulate in growing regions and phloem
tissue in response to water deficit in common bean seedlings. Planta 225: 1121-1133

Page 190
Références

Baucher M, Monties B, Van Montagu M, Boerjan W (1998) Biosynthesis and genetic engineering
of lignin. Crit Rev Plant Sci 17: 125-197
Baud F, Pebay-Peyroula E, Cohen-Addad C, Odani S, Lehmann MS (1993) Crystal structure of
hydrophobic protein from soybean; a member of a new cysteine-rich family. J Mol Biol 231: 877-
887
Baumberger N, Doesseger B, Guyot R, Diet A, Parsons RL, Clark MA, Simmons MP, Bedinger
P, Goff SA, Ringli C, Keller B (2003b) Whole-genome comparison of leucine-rich repeat
extensins in Arabidopsis and rice. A conserved family of cell wall proteins form a vegetative and a
reproductive clade. Plant Physiol 131: 1313-1326
Baumberger N, Ringli C, Keller B (2001) The chimeric leucine-rich repeat/extensin cell wall protein
LRX1 is required for root hair morphogenesis in Arabidopsis thaliana. Genes Dev 15: 1128-1139
Baumberger N, Steiner M, Ryser U, Keller B, Ringli C (2003a) Synergistic interaction of the two
paralogous Arabidopsis genes LRX1 and LRX2 in cell wall formation during root hair
development. Plant J 35: 71-81
Becker B, Marin B (2009) Streptophyte algae and the origin of embryophytes. Ann Bot 103: 999-
1004
Behe MJ, Snoke DW (2004) Simulating evolution by gene duplication of protein features that require
multiple amino acid residues. Protein Sci 13: 2651-2664
Belchí-Navarro S, Almagro L, Sabater-Jara AB, Fernández-Pérez F, Bru R, Pedreno MA (2013)
Induction of trans-resveratrol and extracellular pathogenesis-related proteins in elicited suspension
cultured cells of Vitis vinifera cv Monastrell. J Plant Physiol 170: 258-264
Benito B, Rodriguez-Navarro A (2003) Molecular cloning and characterization of a sodium-pump
ATPase of the moss Physcomitrella patens. Plant J 36: 382-389
Berger D, Altmann T (2000) A subtilisin-like serine protease involved in the regulation of stomatal
density and distribution in Arabidopsis thaliana. Genes Dev 14: 1119-1131
Bernhardt C, Tierney ML (2000) Expression of AtPRP3, a proline-rich structural cell wall protein
from Arabidopsis, is regulated by cell-type-specific developmental pathways involved in root hair
formation. Plant Physiol 122: 705-714
Bischoff V, Nita S, Neumetzler L, Schindelasch D, Urbain A, Eshed R, Persson S, Delmer D,
Scheible WR (2010) TRICHOME BIREFRINGENCE and its homolog AT5G01360 encode plant-
specific DUF231 proteins required for cellulose biosynthesis in Arabidopsis. Plant Physiol 153:
590-602
Boerjan W, Ralph J, Baucher M (2003) Lignin biosynthesis. Annu Rev Plant Biol 54: 519-546
Boisson-Dernier A, Kessler SA, Grossniklaus U (2011) The walls have ears: the role of plant
CrRLK1Ls in sensing and transducing extracellular signals. J Exp Bot 62: 1581-1591
Boisson-Dernier A, Roy S, Kritsas K, Grobei MA, Jaciubek M, Schroeder JI, Grossniklaus U
(2009) Disruption of the pollen-expressed FERONIA homologs ANXUR1 and ANXUR2 triggers
pollen tube discharge. Development 136: 3279-3288
Bootten TJ, Harris PJ, Melton LD, Newman RH (2009) Solid-state 13C NMR study of a composite
of tobacco xyloglucan and Gluconacetobacter xylinus cellulose: molecular interactions between the
component polysaccharides. Biomacromolecules 10: 2961-2967
Boschetti E, Chung MC, Righetti PG (2012) "The quest for biomarkers": are we on the right
technical track? Proteomics Clin Appl 6: 22-41
Boudart G, Jamet E, Rossignol M, Lafitte C, Borderies G, Jauneau A, Esquerré-Tugayé M-T,
Pont-Lezica R (2005) Cell wall proteins in apoplastic fluids of Arabidopsis thaliana rosettes:
Identification by mass spectrometry and bioinformatics. Proteomics 5: 212-221
Bradford MM (1976) Rapid and sensitive method for quantification of microgram quantities of
protein utilizing principle of protein-dye binding. Anal Biochem 72: 248-254

Page 191
Références

Bradley DJ, Kjellbom P, Lamb CJ (1992) Elicitor- and wound-induced oxidative cross-linking of a
proline-rich plant cell wall protein: a novel, rapid defense response. Cell 70: 21-30
Brady JD, Sadler IH, Fry SC (1998) Pulcherosine, an oxidatively coupled trimer of tyrosine in plant
cell walls: its role in cross-link formation. Phytochemistry 47: 349-353
Brennan M, Harris PJ (2011) Distribution of fucosylated xyloglucans among the walls of different
cell types in monocotyledons determined by immunofluorescence microscopy. Mol Plant 4: 144-
156
Brisson LF, Tenhaken R, Lamb C (1994) Function of oxidative cross-linking of cell wall structural
proteins in plant disease resistance. Plant Cell 6: 1703-1712
Bromley JR, Busse-Wicher M, Tryfona T, Mortimer JC, Zhang Z, Brown DM, Dupree P (2013)
GUX1 and GUX2 glucuronyltransferases decorate distinct domains of glucuronoxylan with
different substitution patterns. Plant J 74: 423-434
Brown D, Wightman R, Zhang Z, Gomez LD, Atanassov I, Bukowski JP, Tryfona T, McQueen-
Mason SJ, Dupree P, Turner S (2011) Arabidopsis genes IRREGULAR XYLEM (IRX15) and
IRX15L encode DUF579-containing proteins that are essential for normal xylan deposition in the
secondary cell wall. Plant J 66: 401-413
Brutus A, Sicilia F, Macone A, Cervone F, De Lorenzo G (2010) A domain swap approach reveals
a role of the plant wall-associated kinase 1 (WAK1) as a receptor of oligogalacturonides. Proc Natl
Acad Sci USA 107: 9452-9457
Buchanan M, Burton RA, Dhugga KS, Rafalski AJ, Tingey SV, Shirley NJ, Fincher GB (2012)
Endo-(1,4)-beta-glucanase gene families in the grasses: temporal and spatial co-transcription of
orthologous genes. BMC Plant Biol 12: 235
Burton RA, Fincher GB (2009) (1,3;1,4)-beta-D-glucans in cell walls of the poaceae, lower plants,
and fungi: a tale of two linkages. Mol Plant 2: 873-882
Burton RA, Gidley MJ, Fincher GB (2010) Heterogeneity in the chemistry, structure and function of
plant cell walls. Nat Chem Biol 6: 724-732
Cannon M, Terneus K, Hall Q, Tan L, Wang Y, Wegenhart B, Chen L, Lamport D, Chen Y,
Kieliszewski M (2008) Self-assembly of the plant cell wall requires an extensin scaffold. Proc Natl
Acad Sci USA 105: 2226-2231
Capriotti AL, Caruso G, Cavaliere C, Foglia P, Piovesana S, Samperi R, Laganà A (2013)
Proteome investigation of the non-model plant pomegranate (Punica granatum L.). Anal Bioanal
Chem 405: 9301-9309
Carafa A, Duckett JG, Knox JP, Ligrone R (2005) Distribution of cell-wall xylans in bryophytes
and tracheophytes: new insights into basal interrelationships of land plants. New Phytol 168: 231-
240
Carey RE, Hepler NK, Cosgrove DJ (2013) Selaginella moellendorffii has a reduced and highly
conserved expansin superfamily with genes more closely related to angiosperms than to
bryophytes. BMC Plant Biol 13: 4
Carpita N, Gibeaut D (1993) Structural models of primary cell walls in flowering plants: consistency
of molecular structure with the physical properties of the walls during growth. Plant J 3: 1-30
Carpita N, McCann M (2000) The cell walls. In B Buchanan, W Gruissem, R Jones, eds,
Biochemistry and Molecular Biology of Plants. American Society of Plant Biology, Beltsville, pp
52-108
Cassab G (1998) Plant cell wall proteins. Annu Rev Plant Physiol Plant Mol Biol 49: 281-309
Chen XY, Kim ST, Cho WK, Rim Y, Kim S, Kim SW, Kang KY, Park ZY, Kim JY (2008)
Proteomics of weakly bound cell wall proteins in rice calli. J Plant Physiol 166: 665-685
Chen Y, Ye D, Held M, Cannon M, Ray T, Saha P, Frye A, Mort A, Kieliszewski M (2015)
Identification of the abundant hydroxyproline-rich glycoproteins in the root walls of wild-type
Arabidopsis, an ext3 mutant line, and its phenotypic revertant. Plants 4: 85-111

Page 192
Références

Cheung AY, May B, Kawata EE, Gu Q, Wu HM (1993) Characterization of cDNAs for stylar
transmitting tissue-specific proline-rich proteins in tobacco. Plant J 3: 151-160
Cheung AY, Wang H, Wu HM (1995) A floral transmitting tissue-specific glycoprotein attracts
pollen tubes and stimulates their growth. Cell 82: 383-393
Cheung AY, Wu HM (2011) THESEUS 1, FERONIA and relatives: a family of cell wall-sensing
receptor kinases? Curr Opin Plant Biol 14: 632-641
Cho WK, Chen XY, Chu H, Rim Y, Kim S, Kim ST, Kim SW, Park ZY, Kim JY (2009) The
proteomic analysis of the secretome of rice calli. Physiol Plant 135: 331-341
Clausen MH, Willats WG, Knox JP (2003) Synthetic methyl hexagalacturonate hapten inhibitors of
anti-homogalacturonan monoclonal antibodies LM7, JIM5 and JIM7. Carbohydr Res 338: 1797-
1800
Coimbra S, Costa M, Jones B, Mendes MA, Pereira LG (2009) Pollen grain development is
compromised in Arabidopsis agp6 agp11 null mutants. J Exp Bot 60: 3133-3142
Coimbra S, Costa M, Mendes MA, Pereira AM, Pinto J, Pereira LG (2010) Early germination of
Arabidopsis pollen in a double null mutant for the arabinogalactan protein genes AGP6 and
AGP11. Sex Plant Reprod 23: 199-205
Corthals GL, Wasinger VC, Hochstrasser DF, Sanchez JC (2000) The dynamic range of protein
expression: a challenge for proteomic research. Electrophoresis 21: 1104-1115
Cosgrove DJ (1999) Enzymes and other agents that enhance cell wall extensibility. Annu Rev Plant
Physiol Plant Mol Biol 50: 391-417
Cosgrove DJ (2005) Growth of the plant cell wall. Nat Rev Mol Cell Biol 6: 850-861
Cosio C, Dunand C (2009) Transcriptome analysis of various flower and silique development stages
indicates a set of class III peroxidase genes potentially involved in pod shattering in Arabidopsis
thaliana. BMC Genomics 11: 528
Craig R, Beavis R (2004) TANDEM: matching proteins with tandem mass spectra. Bioinformatics
20: 1466-1467
Crooks GE, Hon G, Chandonia JM, Brenner SE (2004) WebLogo: a sequence logo generator.
Genome Res 14: 1188-1190
Cumming CM, Rizkallah HD, McKendrick KA, Abdel-Massih RM, Baydoun EA, Brett CT
(2005) Biosynthesis and cell-wall deposition of a pectin-xyloglucan complex in pea. Planta 222:
546-555
D'Amato A, Bachi A, Fasoli E, Boschetti E, Peltre G, Sénéchal H, Sutra JP, Citterio A, Righetti
PG (2010) In-depth exploration of Hevea brasiliensis latex proteome and "hidden allergens" via
combinatorial peptide ligand libraries. J Proteomics 73: 1368-1380
Darvill A, Augur C, Bergmann C, Carlson RW, Cheong JJ, Eberhard S, Hahn MG, Lo VM,
Marfa V, Meyer B, Mohnen D, Oneill MA, Spiro MD, Vanhalbeek H, York WS, Albersheim
P (1992) Oligosaccharins-oligosaccharides that regulate growth, development and defense
responses in plants. Glycobiology 2: 181-198
Datta K, Schmidt A, Marcus A (1989) Characterization of two soybean repetitive proline-rich
proteins and a cognate cDNA from germinated axes. Plant Cell 1: 945-952
Davis CC, Xi Z, Mathews S (2014) Plastid phylogenomics and green plant phylogeny: almost full
circle but not quite there. BMC Biol 12: 11
De Cnodder T, Vissenberg K, Van Der Straeten D, Verbelen JP (2005) Regulation of cell length in
the Arabidopsis thaliana root by the ethylene precursor 1-aminocyclopropane- 1-carboxylic acid: a
matter of apoplastic reactions. New Phytol 168: 541-550
Deepa SS, Arumughan C (2002) Purification and characterization of soluble peroxidase from oil
palm (Elaeis guineensis Jacq) leaf. Phytochemistry 61: 503-511

Page 193
Références

Déjardin A, Laurans F, Arnaud D, Breton C, Pilate G, Leplé JC (2010) Wood formation in


angiosperms. C R Biol 333: 325-334
Del Bem LE, Vincentz MG (2010) Evolution of xyloglucan-related genes in green plants. BMC Evol
Biol 10: 341
Derba-Maceluch M, Awano T, Takahashi J, Lucenius J, Ratke C, Kontro I, Busse-Wicher M,
Kosik O, Tanaka R, Winzell A, Kallas A, Lesniewska J, Berthold F, Immerzeel P, Teeri TT,
Ezcurra I, Dupree P, Serimaa R, Mellerowicz EJ (2015) Suppression of xylan
endotransglycosylase PtxtXyn10A affects cellulose microfibril angle in secondary wall in aspen
wood. New Phytol 205: 666-681
Di Girolamo F, Righetti PG, Soste M, Feng Y, Picotti P (2013) Reproducibility of combinatorial
peptide ligand libraries for proteome capture evaluated by selected reaction monitoring. J
Proteomics 89: 215-226
Diet A, Link B, Seifert GJ, Schellenberg B, Wagner U, Pauly M, Reiter WD, Ringli C (2006) The
Arabidopsis root hair cell wall formation mutant lrx1 is suppressed by mutations in the RHM1 gene
encoding a UDP-L-rhamnose synthase. Plant Cell 18: 1630-1641
Doblin MS, Kurek I, Jacob-Wilk D, Delmer DP (2002) Cellulose biosynthesis in plants: from genes
to rosettes. Plant Cell Physiol 43: 1407-1420
Domozych DS, Domozych CE (2014) Multicellularity in green algae: upsizing in a walled complex.
Front Plant Sci 5: 649
Domozych DS, Sørensen I, Popper ZA, Ochs J, Andreas A, Fangel JU, Pielach A, Sacks C,
Brechka H, Ruisi-Besares P, Willats WG, Rose JK (2014) Pectin metabolism and assembly in
the cell wall of the charophyte green alga Penium margaritaceum. Plant Physiol 165: 105-118
Douché T, Clemente HS, Burlat V, Roujol D, Valot B, Zivy M, Pont-Lezica R, Jamet E (2013)
Brachypodium distachyon as a model plant towards improved biofuel crops: Search for secreted
proteins involved in biogenesis and disassembly of cell wall polymers. Proteomics 13: 2438-2454
Duan Q, Kita D, Li C, Cheung AY, Wu HM (2010) FERONIA receptor-like kinase regulates RHO
GTPase signaling of root hair development. Proc Natl Acad Sci USA 107: 17821-17826
Dvorakova L, Cvrckova F, Fischer L (2007) Analysis of the hybrid proline-rich protein families
from seven plant species suggests rapid diversification of their sequences and expression patterns.
BMC Genomics 8: 412
Ebringerova A, Hromádkova Z, Heinze T (2005) Hemicellulose. Adv Polym Sci 186: 1-67
Ellis C, Karafyllidis I, Wasternack C, Turner JG (2002) The Arabidopsis mutant cev1 links cell
wall signaling to jasmonate and ethylene responses. Plant Cell 14: 1557-1566
Emons AM, Mulder BM (2000) How the deposition of cellulose microfibrils builds cell wall
architecture. Trends Plant Sci 5: 35-40
Esteve C, D'Amato A, Marina ML, García MC, Citterio A, Righetti PG (2012) Identification of
olive (Olea europaea) seed and pulp proteins by nLC-MS/MS via combinatorial peptide ligand
libraries. J Proteomics 75: 2396-2403
Esteve C, D'Amato A, Marina ML, García MC, Righetti PG (2012) Identification of avocado
(Persea americana) pulp proteins by nano-LC-MS/MS via combinatorial peptide ligand libraries.
Electrophoresis 33: 2799-2805
Esteve C, D'Amato A, Marina ML, García MC, Righetti PG (2013) In-depth proteomic analysis of
banana (Musa spp.) fruit with combinatorial peptide ligand libraries. Electrophoresis 34: 207-214
Estevez JM, Kieliszewski MJ, Khitrov N, Somerville C (2006) Characterization of synthetic
hydroxyproline-rich proteoglycans with arabinogalactan protein and extensin motifs in
Arabidopsis. Plant Physiol 142: 458-470
Farrar K, Evans IM, Topping JF, Souter MA, Nielsen JE, Lindsey K (2003) EXORDIUM-a gene
expressed in proliferating cells and with a role in meristem function, identified by promoter
trapping in Arabidopsis. Plant J 33: 61-73

Page 194
Références

Fasoli E, D'Amato A, Kravchuk AV, Boschetti E, Bachi A, Righetti PG (2010) Popeye strikes
again: The deep proteome of spinach leaves. J Proteomics 74: 127-136
Fasoli E, Righetti PG (2013) The peel and pulp of mango fruit: a proteomic samba. Biochim Biophys
Acta 1834: 2539-2545
Fawal N, Li Q, Savelli B, Brette M, Passaia G, Fabre M, Mathé C, Dunand C (2003) PeroxiBase:
a database for large-scale evolutionary analysis of peroxidases. Nucleic Acids Res 41(Database
issue): D441-D444
Faye L, Boulaflous A, Benchabane M, Gomord V, Michaud D (2005) Protein modifications in the
plant secretory pathway: current status and practical implications in molecular pharming. Vaccine
23: 1770-1778
Feiz L, Irshad M, Pont-Lezica RF, Canut H, Jamet E (2006) Evaluation of cell wall preparations
for proteomics: a new procedure for purifying cell walls from Arabidopsis hypocotyls. Plant
Methods 2: 10
Finn RD, Bateman A, Clements P, Coggill P, Eberhardt RY, DEddy SR, Heger A, Hetherington
K, Holm L, Listry J, Sonnhammer ELL, Tate J, Punta M (2014) The Pfam protein families
database. Nucleic Acids Res 42 (database issue): D222-D230
Francin-Allami M, Merah K, Albenne C, Rogniaux H, Pavlovic M, Lollier V, Sibout R, Guillon
F, Jamet E, Larré C (2015) Cell wall proteomic of Brachypodium distachyon grains: A focus on
cell wall remodeling proteins. Proteomics: doi: 10.1002/pmic.201400485
Francoz E, Ranocha P, Nguyen-Kim H, Jamet E, Burlat V, Dunand C (2015) Roles of cell wall
peroxidases in plant development. Phytochemistry 112: 15-21
Frankova L, Fry SC (2013) Biochemistry and physiological roles of enzymes that "cut and paste"
plant cell-wall polysaccharides. J Exp Bot 64: 3519-3550
Freshour G, Clay RP, Fuller MS, Albersheim P, Darvill AG, Hahn MG (1996) Developmental
and tissue-specific structural alterations of the cell-wall polysaccharides of Arabidopsis thaliana
roots. Plant Physiol 110: 1413-1429
Fröhlich A, Gaupels F, Sarioglu H, Holzmeister C, Spannagl M, Durner J, Lindermayr C (2012)
Looking deep inside: detection of low-abundance proteins in leaf extracts of Arabidopsis and
phloem exudates of pumpkin. Plant Physiol 159: 902-914
Fröhlich A, Lindermayr C (2011) Deep insights into the plant proteome by pretreatment with
combinatorial hexapeptide ligand libraries. J Proteomics 74: 1182-1189
Fry SC (1989) The structure and functions of xyloglucan. J Exp Bot 40: 1-11
Fry SC (2004) Primary cell wall metabolism: tracking the careers of wall polymers in living plant
cells. New Phytol 161: 641-675
Fry SC, York W, Albersheim P, Darvill A, Hayashi T, Joseleau J, Kato Y, Lorences E,
Maclachlan G, McNeil M, Mort A, Reid J, Seitz H, Selvendran R, Voragen A, White A (1993)
An unambiguous nomenclature for xyloglucan-derived oligosaccharides. Physiol Plant 89: 1-3
Fry SC (1986) Cross-Linking of matrix polymers in the growing cell walls of Angiosperms. Ann Rev
Plant Physiol 37: 165-186
Fry SC (1998) Oxidative scission of plant cell wall polysaccharides by ascorbate-induced hydroxyl
radicals. Biochem J 332: 507-515
Fry SC, Mohler KE, Nesselrode BH, Frankova L (2008) Mixed-linkage beta-glucan : xyloglucan
endotransglucosylase, a novel wall-remodelling enzyme from Equisetum (horsetails) and
charophytic algae. Plant J 55: 240-252
Fry SC, Willis SC, Paterson AE (2000) Intraprotoplasmic and wall-localised formation of
arabinoxylan-bound diferulates and larger ferulate coupling-products in maize cell-suspension
cultures. Planta 211: 679-692

Page 195
Références

Gaspar Y, Johnson KL, McKenna JA, Bacic A, Schultz CJ (2001) The complex structures of
arabinogalactan-proteins and the journey towards understanding function. Plant Mol Biol 47: 161-
176
Gille S, de Souza A, Xiong G, Benz M, Cheng K, Schultink A, Reca IB, Pauly M (2011) O-
acetylation of Arabidopsis hemicellulose xyloglucan requires AXY4 or AXY4L, proteins with a
TBL and DUF231 domain. Plant Cell 23: 4041-4053
Girard AL, Mounet F, Lemaire-Chamley M, Gaillard C, Elmorjani K, Vivancos J, Runavot JL,
Quemener B, Petit J, Germain V, Rothan C, Marion D, Bakan B (2002) Tomato GDSL1 is
required for cutin deposition in the fruit cuticle. Plant Cell 24: 3119-3134
Goldman MH, Pezzotti M, Seurinck J, Mariani C (1992) Developmental expression of tobacco
pistil-specific genes encoding novel extensin-like proteins. Plant Cell 4: 1041-1051
Golovchenko VV, Ovodova RG, Shashkov AS, Ovodo YS (2002) Structural studies of the pectic
polysaccharide from duckweed Lemna minor L. Phytochemistry 60: 89–97
Gong SY, Huang GQ, Sun X, Li P, Zhao LL, Zhang DJ, Li XB (2012) GhAGP31, a cotton non-
classical arabinogalactan protein, is involved in response to cold stress during early seedling
development. Plant Biol 14: 447-457
Gonneau M, Desprez T, Guillot A, Vernhettes S, Hofte H (2014) Catalytic subunit stoichiometry
within the cellulose synthase complex. Plant Physiol 166: 1709-1712
Gorshkova TA, Kozlova LV, Mikshina PV (2013) Spatial structure of plant cell wall
polysaccharides and its functional significance. Biochemistry 78: 836-853
Goss CA, Brockmann DJ, Bushoven JT, Roberts AW (2012) A CELLULOSE SYNTHASE (CESA)
gene essential for gametophore morphogenesis in the moss Physcomitrella patens. Planta 235:
1355-1367
Goubet F, Bourlard T, Girault R, Alexandre C, Vandevelde MC, Morvan C (1995) Structural
features of galactans from flax fibres. Carbohydr Polym 27: 221–227
Gouget A, Senchou V, Govers F, Sanson A, Barre A, Rouge P, Pont-Lezica R, Canut H (2006)
Lectin receptor kinases participate in protein-protein interactions to mediate plasma membrane-cell
wall adhesions in Arabidopsis. Plant Physiol 140: 81-90
Griffiths JS, Tsai AY, Xue H, Voiniciuc C, Sola K, Seifert GJ, Mansfield SD, Haughn GW
(2014) SALT-OVERLY SENSITIVE5 mediates Arabidopsis seed coat mucilage adherence and
organization through pectins. Plant Physiol 165: 991-1004
Grodberg J, Dunn JJ (1988) ompT encodes the Escherichia coli outer membrane protease that
cleaves T7 RNA polymerase during purification. J Bacteriol 170: 1245-1253
Grosberg RK, Strathmann RR (2007) The evolution of multicellularity: A minor major transition?
Annu Rev Ecol Evol Syst 38: 621-654
Gullón P, Gullón B, Moure A, Alonso JL, Domínguez H, Parajó JC (2009) Manufacture of
prebiotics from biomass sources. In D Charalampopoulos, RA Rastall, eds, Prebiotics and
Probiotics Science and Technology. Springer, New York, pp 535-589
Guo H, Li L, Ye H, Yu X, Algreen A, Yin Y (2009) Three related receptor-like kinases are required
for optimal cell elongation in Arabidopsis thaliana. Proc Natl Acad Sci USA 106: 7648-7653
Hall BG (2013) Building phylogenetic trees from molecular data with MEGA. Mol Biol Evol 30:
1229-1235
Hall Q, Cannon MC (2002) The cell wall hydroxyproline-rich glycoprotein RSH is essential for
normal embryo development in Arabidopsis. Plant Cell 14: 1161-1172
Hamann T, Bennett M, Mansfield J, Somerville C (2009) Identification of cell-wall stress as a
hexose-dependent and osmosensitive regulator of plant responses. Plant J 57: 1015-1026
Han Y, Agarwal V, Dodd D, Kim J, Bae B, Mackie RI, Nair SK, Cann IK (2012) Biochemical and
structural insights into xylan utilization by the thermophilic bacterium Caldanaerobius
polysaccharolyticus. J Biol Chem 287: 34946-34960

Page 196
Références

Hao Z, Mohnen D (2014) A review of xylan and lignin biosynthesis: foundation for studying
Arabidopsis irregular xylem mutants with pleiotropic phenotypes. Crit Rev Biochem Mol Biol 49:
212-241
Hara K, Kajita R, Torii KU, Bergmann DC, Kakimoto T (2007) The secretory peptide gene EPF1
enforces the stomatal one-cell-spacing rule. Genes Dev 21: 1720-1725
Hara K, Yokoo T, Kajita R, Onishi T, Yahata S, Peterson KM, Torii KU, Kakimoto T (2009)
Epidermal cell density is autoregulated via a secretory peptide, EPIDERMAL PATTERNING
FACTOR 2 in Arabidopsis leaves. Plant Cell Physiol 50: 1019-1031
Harholt J, Suttangkakul A, Vibe Scheller H (2010) Biosynthesis of pectin. Plant Physiol 153: 384-
395
Harthill JE, Ashford DA (1992) N-glycosylation of horseradish peroxidase from cell culture.
Biochem Soc Trans 20: 113S
Haslam RP, Downie AL, Raventon M, Gallardo K, Job D, Pallett KE, John P, Parry MAJ,
Coleman JOD (2003) The assessment of enriched apoplastic extracts using proteomic approaches.
Ann Appl Biol 143: 81-91
He ZH, Fujiki M, Kohorn BD (1996) A cell wall-associated, receptor-like protein kinase. J Biol
Chem 271: 19789-19793
Hellens R, Mullineaux P, Klee H (2000) Technical Focus:a guide to Agrobacterium binary Ti
vectors. Trends Plant Sci 5: 446-451
Hématy K, Höfte H (2008) Novel receptor kinases involved in growth regulation. Curr Opin Plant
Biol 11: 321-328
Hématy K, Sado PE, Van Tuinen A, Rochange S, Desnos T, Balzergue S, Pelletier S, Renou JP,
Hofte H (2007) A receptor-like kinase mediates the response of Arabidopsis cells to the inhibition
of cellulose synthesis. Curr Biol 17: 922-931
Henrissat B, Coutinho PM, Davies GJ (2001) A census of carbohydrate-active enzymes in the
genome of Arabidopsis thaliana. Plant Mol Biol 47: 55-72
Hernandez-Blanco C, Feng DX, Hu J, Sanchez-Vallet A, Deslandes L, Llorente F, Berrocal-Lobo
M, Keller H, Barlet X, Sanchez-Rodriguez C, Anderson LK, Somerville S, Marco Y, Molina
A (2007) Impairment of cellulose synthases required for Arabidopsis secondary cell wall formation
enhances disease resistance. Plant Cell 19: 890-903
Hijazi M (2011) Caractérisation structurale et fonctionnelle d'AGP31, une glycoprotéine atypique de
la paroi chez Arabidopsis thaliana. NonPeerReviewed. Université Paul Sabatier, Toulouse
Hijazi M, Durand J, Pichereaux C, Pont F, Jamet E, Albenne C (2012) Characterization of the
arabinogalactan protein 31 (AGP31) of Arabidopsis thaliana: new advances on the Hyp-O-
glycosylation of the Pro-rich domain. J Biol Chem 287: 9623-9632
Hijazi M, Roujol D, Nguyen-Kim H, Del Rocio Cisneros Castillo L, Saland E, Jamet E, Albenne
C (2014b) Arabinogalactan protein 31 (AGP31), a putative network-forming protein in Arabidopsis
thaliana cell walls? Ann Bot 114: 1087-1097
Hijazi M, Velasquez SM, Jamet E, Estevez JM, Albenne C (2014a) An update on post-translational
modifications of hydroxyproline-rich glycoproteins: toward a model highlighting their contribution
to plant cell wall architecture. Front Plant Sci 5: 395
Hill JL, Jr., Hammudi MB, Tien M (2014) The Arabidopsis cellulose synthase complex: A proposed
hexamer of CESA trimers in an equimolar stoichiometry. Plant Cell 26: 4834-4842
Hornblad E, Ulfstedt M, Ronne H, Marchant A (2013) Partial functional conservation of IRX10
homologs in Physcomitrella patens and Arabidopsis thaliana indicates an evolutionary step
contributing to vascular formation in land plants. BMC Plant Biol 13: 3
Hosmani PS, Kamiya T, Danku J, Naseer S, Geldner N, Guérinot ML, Salt DE (2013) Dirigent
domain-containing protein is part of the machinery required for formation of the lignin-based
Casparian strip in the root. Proc Natl Acad Sci USA 110: 14498-14503

Page 197
Références

Hou X, Tong H, Selby J, Dewitt J, Peng X, He ZH (2005) Involvement of a cell wall-associated


kinase, WAKL4, in Arabidopsis mineral responses. Plant Physiol 139: 1704-1716
Hsieh YSY, Paxton M, Ade CP, Harris PJ, Schröder R, Melton LD, Harris PJ, Smith BG,
Schmitt U (2009) Structural diversity, functions and biosynthesis of xyloglucans in angiosperm
cell walls. NZ J Forest Sci 39: 187-196
Huang GQ, Gong SY, Xu WL, Li W, Li P, Zhang CJ, Li DD, Zheng Y, Li FG, Li XB (2013) A
fasciclin-like arabinogalactan protein, GhFLA1, is involved in fiber initiation and elongation of
cotton. Plant Physiol 161: 1278-1290
Hunt L, Gray JE (2009) The signaling peptide EPF2 controls asymmetric cell divisions during
stomatal development. Curr Biol 19: 864-869
Hurkman WJ, Tanaka CK (1996) Effect of salt stress on germin gene expression in barley roots.
Plant Physiol 110: 971-977
Immerzeel P, Eppink MM, Schols HA, Voragen AGJ (2006) Carrot arabinogalactan proteins are
interlinked with pectins. Physiol Plant 128: 18-28
International Rice Genome Sequencing Project (2005) The map-based sequence of the rice
genome. Nature 436: 793-800
Intra J, Pavesi G, Horner DS (2008) Phylogenetic analyses suggest multiple changes of substrate
specificity within the glycosyl hydrolase 20 family. BMC Evol Biol 8: 214
Irshad M, Canut H, Borderies G, Pont-Lezica R, Jamet E (2008) A new picture of cell wall protein
dynamics in elongating cells of Arabidopsis thaliana: confirmed actors and newcomers. BMC
Plant Biol 8: 94
Ishii T (1997) Structure and functions of feruloylated polysaccharides. Plant Sci 127: 111–127
Jacobs J, Roe JL (2005) SKS6, a multicopper oxidase-like gene, participates in cotyledon vascular
patterning during Arabidopsis thaliana development. Planta 222: 652-666
Jamet E, Albenne C, Boudart G, Irshad M, Canut H, Pont-Lezica R (2008) Recent advances in
plant cell wall proteomics. Proteomics 8: 893-908
Jamet E, Canut H, Boudart G, Pont-Lezica RF (2006) Cell wall proteins: a new insight through
proteomics. Trends Plant Sci 11: 33-39
Jensen JK, Kim H, Cocuron JC, Orler R, Ralph J, Wilkerson CG (2011) The DUF579 domain
containing proteins IRX15 and IRX15-L affect xylan synthesis in Arabidopsis. Plant J 66: 387-400
Jones L, Seymour GB, Knox JP (1997) Localization of pectic galactan in tomato cell walls using a
monoclonal antibody specific to (1[->]4)-[beta]-D-galactan. Plant Physiol 113: 1405-1412
Jones P, Binns D, Chang HY, Fraser M, Li W, McAnulla C, McWilliam H, Maslen J, Mitchell A,
Nuka G, Pesseat S, Quinn AF, Sangrador-Vegas A, Scheremetjew M, Yong SY, Lopez R,
Hunter S (2014) InterProScan 5: genome-scale protein function classification. Bioinformatics 30:
1236-1240
Jung YH, Jeong SH, Kim SH, Singh R, Lee JE, Cho YS, Agrawal GK, Rakwal R, Jwa NS (2008)
Systematic secretome analyses of rice leaf and seed callus suspension-cultured cells: Workflow
development and establishment of high-density two-dimensional gel reference maps. J Proteome
Res 7: 5187-5210
Kaku H, Nishizawa Y, Ishii-Minami N, Akimoto-Tomiyama C, Dohmae N, Takio K, Minami E,
Shibuya N (2006) Plant cells recognize chitin fragments for defense signaling through a plasma
membrane receptor. Proc Natl Acad Sci USA 103: 11086-11091
Karimi M, Inze D, Depicker A (2002) GATEWAY vectors for Agrobacterium-mediated plant
transformation. Trends Plant Sci 7: 193-195
Kaya M, Sousa AG, Crépeau M-J, Sørensen SO, Ralet M-C (2014) Characterization of citrus
pectin samples extracted under different conditions: influence of acid type and pH of extraction.
Ann Bot 114: 1319-1326

Page 198
Références

Keegstra K (2010) Plant cell walls. Plant Physiol 154: 483-486


Keegstra K, Talmadge KW, Bauer WD, Albersheim P (1973) The structure of plant cell walls: III.
A model of the walls of suspension-cultured sycamore cells based on the interconnections of the
macromolecular components. Plant Physiol 51: 188-197
Kenrick P, Crane PR (1997) The origin and early evolution of plants on land. Nature 389: 33-39
Kieliszewski MJ (2001) The latest hype on Hyp-O-glycosylation codes. Phytochemistry 57: 319-323
Kieliszewski MJ, Lamport DTA (1994) Extensin: repetitive motifs, functional sites, post-
translational codes, and phylogeny. Plant J 5: 157-172
Kieliszewski MJ, Showalter AM, Leykam JF (1994) Potato lectin: a modular protein sharing
sequence similarities with the extensin family, the hevein lectin family, and snake venom
disintegrins (platelet aggregation inhibitors). Plant J 5: 849-861
Kim HJ, Triplett BA (2001) Cotton fiber growth in planta and in vitro. Models for plant cell
elongation and cell wall biogenesis. Plant Physiol 127: 1361-1366
Klemm D, Heublein B, Fink HP, Bohn A (2005) Cellulose: fascinating biopolymer and sustainable
raw material. Angew Chem Int Ed Engl 44: 3358-3393
Knox JP (2008) Revealing the structural and functional diversity of plant cell walls. Curr Opin Plant
Biol 11: 308-313
Kohorn BD (2001) WAKs; cell wall associated kinases. Curr Opin Cell Biol 13: 529-533
Kohorn BD, Kobayashi M, Johansen S, Riese J, Huang LF, Koch K, Fu S, Dotson A, Byers N
(2006) An Arabidopsis cell wall-associated kinase required for invertase activity and cell growth.
Plant J 46: 307-316
Krishnamoorthy P, Sanchez-Rodriguez C, Heilmann I, Persson S (2014) Regulatory roles of
phosphoinositides in membrane trafficking and their potential impact on cell-wall synthesis and re-
modelling. Ann Bot 114: 1049-1057
Kulkarni AR, Pena MJ, Avci U, Mazumder K, Urbanowicz BR, Pattathil S, Yin Y, O'Neill MA,
Roberts AW, Hahn MG, Xu Y, Darvill AG, York WS (2012) The ability of land plants to
synthesize glucuronoxylans predates the evolution of tracheophytes. Glycobiology 22: 439-451
Laemmli UK (1970) Cleavage of the structural proteins during the assembly of the head of
bacteriophage T4. Nature 227: 680-685
Lahaye M, Robic A (2007) Structure and functional properties of ulvan, a polysaccharide from green
seaweeds. Biomacromolecules 8: 1765-1774
Lally D, Ingmire P, Tong HY, He ZH (2001) Antisense expression of a cell wall-associated protein
kinase, WAK4, inhibits cell elongation and alters morphology. Plant Cell 13: 1317-1331
Lamport DT, Katona L, Roerig S (1973) Galactosylserine in extensin. Biochem J 133: 125-132
Le J, Zou J, Yang K, Wang M (2014) Signaling to stomatal initiation and cell division. Front Plant
Sci 5: 297
Lee KJD, Marcus SE, Knox JP (2011) Cell wall biology: perspectives from cell wall imaging. Mol
Plant 4: 212–219
Leiber RM, John F, Verhertbruggen Y, Diet A, Knox JP, Ringli C (2010) The TOR pathway
modulates the structure of cell walls in Arabidopsis. Plant Cell 22: 1898-1908
Leonard R, Petersen BO, Himly M, Kaar W, Wopfner N, Kolarich D, van Ree R, Ebner C, Duus
JO, Ferreira F, Altmann F (2005) Two novel types of O-glycans on the mugwort pollen allergen
Art v 1 and their role in antibody binding. J Biol Chem 280: 7932-7940
Lerouge P, O'Neill MA, Darvill AG, Albersheim P (1993) Structural characterization of endo-
glycanase-generated oligoglycosyl side chains of rhamnogalacturonan I. Carbohydr Res 243: 359-
371
Lewis LA, McCourt RM (2004) Green algae and the origin of land plants. Am J Bot 91: 1535-1556

Page 199
Références

Libertini E, Li Y, McQueen-Mason SJ (2004) Phylogenetic analysis of the plant endo-beta-1,4-


glucanase gene family. J Mol Evol 58: 506-515
Liepman AH, Nairn CJ, Willats WG, Sørensen I, Roberts AW, Keegstra K (2007) Functional
genomic analysis supports conservation of function among cellulose synthase-like a gene family
members and suggests diverse roles of mannans in plants. Plant Physiol 143: 1881-1893
Ligat L, Lauber E, Albenne C, San Clemente H, Valot B, Zivy M, Pont-Lezica R, Arlat M,
Jamet E (2011) Analysis of the xylem sap proteome of Brassica oleracea reveals a high content in
secreted proteins. Proteomics 11: 1798-1813
Lim S, Chisholm K, Coffin RH, Peters RD, Al-Mughrabi KI, Wang-Pruski G, Pinto DM (2012)
Protein profiling in potato (Solanum tuberosum L.) leaf tissues by differential centrifugation. J
Proteome Res 11: 2594-2601
Lind JL, Bacic A, Clarke AE, Anderson MA (1994) A style-specific hydroxyproline-rich
glycoprotein with properties of both extensins and arabinogalactan proteins. Plant J 6: 491-502
Lionetti V, Cervone F, Bellincampi D (2012) Methyl esterification of pectin plays a role during
plant-pathogen interactions and affects plant resistance to diseases. J Plant Physiol 169: 1623-1630
Liu C, Mehdy MC (2007) A nonclassical arabinogalactan protein gene highly expressed in vascular
tissues, AGP31, is transcriptionally repressed by methyl jasmonic acid in Arabidopsis. Plant
Physiol 145: 863-874
Lobban CS (1978) Translocation of C in Macrocystis pyrifera (Giant Kelp). Plant Physiol 61: 585-
589
Madsen EB, Madsen LH, Radutoiu S, Olbryt M, Rakwalska M, Szczyglowski K, Sato S, Kaneko
T, Tabata S, Sandal N, Stougaard J (2003) A receptor kinase gene of the LysM type is involved
in legume perception of rhizobial signals. Nature 425: 637-640
Majewska-Sawka A, Nothnagel EA (2000) The multiple roles of arabinogalactan proteins in plant
development. Plant Physiol 122: 3-10
Mang HG, Lee JH, Park JA, Pyee J, Pai HS, Lee J, Kim WT (2004) The CaPRP1 gene encoding a
putative proline-rich glycoprotein is highly expressed in rapidly elongating early roots and leaves
in hot pepper (Capsicum annuum L. cv. Pukang). Biochim Biophys Acta 1674: 103-108
Marcus SE, Blake AW, Benians TA, Lee KJ, Poyser C, Donaldson L, Leroux O, Rogowski A,
Petersen HL, Boraston A, Gilbert HJ, Willats WG, Knox JP (2010) Restricted access of
proteins to mannan polysaccharides in intact plant cell walls. Plant J 64: 191-203
Marcus SE, Verhertbruggen Y, Hervé C, Ordaz-Ortiz JJ, Farkas V, Pedersen HL, Willats WG,
Knox JP (2008) Pectic homogalacturonan masks abundant sets of xyloglucan epitopes in plant cell
walls. BMC Plant Biol 8: 60
Marga F, Grandbois M, Cosgrove DJ, Baskin TI (2005) Cell wall extension results in the
coordinate separation of parallel microfibrils: evidence from scanning electron microscopy and
atomic force microscopy. Plant J 43: 181-190
McCarthy TW, Der JP, Honaas LA, dePamphilis CW, Anderson CT (2014) Phylogenetic analysis
of pectin-related gene families in Physcomitrella patens and nine other plant species yields
evolutionary insights into cell walls. BMC Plant Biol 14: 79
McQueen-Mason S, Cosgrove DJ (1994) Disruption of hydrogen bonding between plant cell wall
polymers by proteins that induce wall extension. Proc Natl Acad Sci U S A 91: 6574-6578
McQueen-Mason S, Durachko DM, Cosgrove DJ (1992) Two endogenous proteins that induce cell
wall extension in plants. Plant Cell 4: 1425-1433
McQueen-Mason SJ, Cosgrove DJ (1995) Expansin mode of action on cell walls. Analysis of wall
hydrolysis, stress relaxation, and binding. Plant Physiol 107: 87-100
Membré N, Bernier F, Staiger D, Berna A (2000) Arabidopsis thaliana germin-like proteins:
common and specific features point to a variety of functions. Planta 211: 345-354

Page 200
Références

Merkouropoulos G, Shirsat AH (2003) The unusual Arabidopsis extensin gene atExt1 is expressed
throughout plant development and is induced by a variety of biotic and abiotic stresses. Planta 217:
356-366
Minic Z (2008) Physiological roles of plant glycoside hydrolases. Planta 227: 723-740
Minic Z, Jamet E, Negroni L, der Garabedian PA, Zivy M, Jouanin L (2007) A sub-proteome of
Arabidopsis thaliana trapped on Concanavalin A is enriched in cell wall glycoside hydrolases. J
Exp Bot 58: 2503-2512
Miyazaki S, Murata T, Sakurai-Ozato N, Kubo M, Demura T, Fukuda H, Hasebe M (2009)
ANXUR1 and 2, sister genes to FERONIA/SIRENE, are male factors for coordinated fertilization.
Curr Biol 19: 1327-1331
Mohnen D (1999) Biosynthesis of pectins and galactomannans. In BM Pinto, ed, Carbohydrates and
their derivatives including tannins, cellulose, and related lignins. Elsevier Science Ltd, Oxford, pp
497-527
Mohnen D (2008) Pectin structure and biosynthesis. Curr Opin Plant Biol 11: 266-277
Moller I, Sørensen I, Bernal AJ, Blaukopf C, Lee K, Obro J, Pettolino F, Roberts A, Mikkelsen
JD, Knox JP, Bacic A, Willats WG (2007) High-throughput mapping of cell-wall polymers
within and between plants using novel microarrays. Plant J 50: 1118-1128
Mollet JC, Kim S, Jauh GY, Lord EM (2002) Arabinogalactan proteins, pollen tube growth, and the
reversible effects of Yariv phenylglycoside. Protoplasma 219: 89-98
Moreira LR, Filho EX (2008) An overview of mannan structure and mannan-degrading enzyme
systems. Appl Microbiol Biotechnol 79: 165-178
Morvan O, Jauneau A, Morvan C, Voreux H, Demarty M (1989) Pectin biosynthesis and
differentiation of cellulosic fibers during flax growth. Can J Bot 67: 135-139
Moustacas AM, Nari J, Borel M, Noat G, Ricard J (1991) Pectin methylesterase, metal ions and
plant cell-wall extension. The role of metal ions in plant cell-wall extension. Biochem J 279: 351-
354
Nakagawa Y, Katagiri T, Shinozaki K, Qi Z, Tatsumi H, Furuichi T, Kishigami A, Sokabe M,
Kojima I, Sato S, Kato T, Tabata S, Iida K, Terashima A, Nakano M, Ikeda M, Yamanaka T,
Iida H (2007) Arabidopsis plasma membrane protein crucial for Ca2+ influx and touch sensing in
roots. Proc Natl Acad Sci USA 104: 3639-3644
Nawrath C, Schreiber L, Franke RB, Geldner N, Reina-Pinto JJ, Kunst L (2013) Apoplastic
diffusion barriers in Arabidopsis. Arabidopsis Book 11: e0167
Nersissian AM, Shipp EL (2002) Blue copper-binding domains. Adv Protein Chem 60: 271-340
Neutelings G (2011) Lignin variability in plant cell walls: contribution of new models. Plant Sci 181:
379-386
Nguema-Ona E, Vicre-Gibouin M, Gotte M, Plancot B, Lerouge P, Bardor M, Driouich A (2014)
Cell wall O-glycoproteins and N-glycoproteins: aspects of biosynthesis and function. Front Plant
Sci 5: 499
Nicol F, His I, Jauneau A, Vernhettes S, Canut H, Hofte H (1998) A plasma membrane-bound
putative endo-1,4-beta-D-glucanase is required for normal wall assembly and cell elongation in
Arabidopsis. EMBO J 17: 5563-5576
Nieuwland J, Feron R, Huisman BA, Fasolino A, Hilbers CW, Derksen J, Mariani C (2005)
Lipid transfer proteins enhance cell wall extension in tobacco. Plant Cell 17: 2009-2019
Niklas KJ (2004) The cell walls that bind the tree of life. BioScience 54: 831-841
Niklas KJ, Kutschera U (2010) The evolution of the land plant life cycle. New Phytol 185: 27-41
Nothnagel AL, Nothnagel EA (2007) Primary cell wall structure in the evolution of land plants. J
Integr Plant Biol 49: 1271-1278

Page 201
Références

Nunez A, Fishman ML, Fortis LL, Cooke PH, Hotchkiss AT (2009) Identification of extensin
protein associated with sugar beet pectin. J Agric Food Chem 57: 10951-10958
Nurnberger T, Abel S, Jost W, Glund K (1990) Induction of an extracellular ribonuclease in
cultured tomato cells upon phosphate starvation. Plant Physiol 92: 970-976
Ogawa-Ohnishi M, Matsushita W, Matsubayashi Y (2013) Identification of three hydroxyproline
O-arabinosyltransferases in Arabidopsis thaliana. Nat Chem Biol 9: 726-730
Ohmiya Y, Samejima M, Shiroishi M, Amano Y, Kanda T, Sakai F, Hayashi T (2000) Evidence
that endo-1,4-beta-glucanases act on cellulose in suspension-cultured poplar cells. Plant J 24: 147-
158
Ohmiya Y, Takeda T, Nakamura S, Sakai F, Hayashi T (1995) Purification and properties of wall-
bound endo-1, 4-beta-glucanase from suspension-cultured poplar cells. Plant Cell Physiol 36: 607-
614
Ohta T (1987) Simulating evolution by gene duplication. Genetics 115: 207-213
O'Neill MA, Ishii T, Albersheim P, Darvill AG (2004) Rhamnogalacturonan II: structure and
function of a borate cross-linked cell wall pectic polysaccharide. Annu Rev Plant Biol 55: 109-139
Palm GJ, Sharma A, Kumari M, Panjikar S, Albrecht D, Jagannadham MV, Hinrichs W (2004)
Post-translational modification and extended glycosylation pattern of a plant latex peroxidase of
native source characterized by X-ray crystallography. FEBS J 281: 4319-4333
Passardi F, Cosio C, Penel C, Dunand C (2005) Peroxidases have more functions than a Swiss army
knife. Plant Cell Rep 24: 255-265
Passardi F, Penel C, Dunand C (2004) Performing the paradoxical: how plant peroxidases modify
the cell wall. Trends Plant Sci 9: 534-540
Paulsen BS, Barsett H (2005) Bioactive pectic polysaccharides. Adv Polym Sci 186: 69-101
Peaucelle A, Louvet R, Johansen JN, Höfte H, Laufs P, Pelloux J, Mouille G (2008) Arabidopsis
phyllotaxis is controlled by the methyl-esterification status of cell-wall pectins. Curr Biol 18: 1943-
1948
Pechanova O, Hsu CY, Adams JP, Pechan T, Vandervelde L, Drnevich J, Jawdy S, Adeli A,
Suttle JC, Lawrence AM, Tschaplinski TJ, Séguin A, Yuceer C (2010) Apoplast proteome
reveals that extracellular matrix contributes to multistress response in poplar. BMC Genomics 11:
674
Pellerin P, Vidal S, Williams P, Brillouet JM (1995) Characterization of five type II
arabinogalactan-protein fractions from red wine of increasing uronic acid content. Carbohydr Res
277: 135-143
Pelloux J, Rusterucci C, Mellerowicz EJ (2007) New insights into pectin methylesterase structure
and function. Trends Plant Sci 12: 267-277
Petkowicz C, Reicher F, Chanzy H, Taravel F, Vuong R (2001) Linear mannan in the endosperm of
Schizolobium amazonicum. Carbohydr Polym 44: 107–112
Plancot B, Santaella C, Jaber R, Kiefer-Meyer MC, Follet-Gueye ML, Leprince J, Gattin I, Souc
C, Driouich A, Vicre-Gibouin M (2013) Deciphering the responses of root border-like cells of
Arabidopsis and flax to pathogen-derived elicitors. Plant Physiol 163: 1584-1597
Popper ZA (2008) Evolution and diversity of green plant cell walls. Curr Opin Plant Biol 11: 286-292
Popper ZA, Fry SC (2003) Primary cell wall composition of bryophytes and charophytes. Ann Bot
91: 1-12
Popper ZA, Fry SC (2008) Xyloglucan-pectin linkages are formed intra-protoplasmically, contribute
to wall-assembly, and remain stable in the cell wall. Planta 227: 781-794
Popper ZA, Michel G, Hervé C, Domozych DS, Willats WG, Tuohy MG, Kloareg B, Stengel DB
(2011) Evolution and diversity of plant cell walls: from algae to flowering plants. Annu Rev Plant
Biol 62: 567-590

Page 202
Références

Popper ZA, Sadler IH, Fry SC (2001) 3-O-methyl-D-galactose residues in lycophyte primary cell
walls. Phytochemistry 57: 711-719
Popper ZA, Tuohy MG (2010) Beyond the green: understanding the evolutionary puzzle of plant and
algal cell walls. Plant Physiol 153: 373-383
Powell DA, Morris ER, Gidley MJ, Rees DA (1982) Conformations and interactions of pectins. II.
Influences of residue sequence on chain association in calcium pectate gels. J Mol Biol 155: 517-
531
Proels RK, Huckelhoven R (2014) Cell-wall invertases, key enzymes in the modulation of plant
metabolism during defence responses. Mol Plant Pathol 15: 858-864
Qi X, Behrens BX, West PR, Mort AJ (1995) Solubilization and partial characterization of extensin
fragments from cell walls of cotton suspension cultures. Evidence for a covalent cross-link between
extensin and pectin. Plant Physiol 108: 1691-1701
Radutoiu S, Madsen LH, Madsen EB, Felle HH, Umehara Y, Gronlund M, Sato S, Nakamura Y,
Tabata S, Sandal N, Stougaard J (2003) Plant recognition of symbiotic bacteria requires two
LysM receptor-like kinases. Nature 425: 585-592
Ragni L, Hardtke CS (2014) Small but thick enough-the Arabidopsis hypocotyl as a model to study
secondary growth. Physiol Plant 151: 164-171
Ralet MC, Cabrera JC, Bonnin E, Quemener B, Hellin P, Thibault JF (2005) Mapping sugar beet
pectin acetylation pattern. Phytochemistry 66: 1832-1843
Renard CM, Weightman RM, Thibault JF (1997) The xylose-rich pectins from pea hulls. Int J Biol
Macromol 21: 155-162
Rennie EA, Scheller HV (2014) Xylan biosynthesis. Curr Opin Biotechnol 26: 100-107
Ridley BL, O'Neill MA, Mohnen D (2001) Pectins: structure, biosynthesis, and oligogalacturonide-
related signaling. Phytochemistry 57: 929-967
Righetti PG, Boschetti E (2008) The ProteoMiner and the FortyNiners: searching for gold nuggets in
the proteomic arena. Mass Spectrom Rev 27: 596-608
Righetti PG, Fasoli E, Boschetti E (2011) Combinatorial peptide ligand libraries: the conquest of the
'hidden proteome' advances at great strides. Electrophoresis 32: 960-966
Ringli C (2010) The hydroxyproline-rich glycoprotein domain of the Arabidopsis LRX1 requires Tyr
for function but not for insolubilization in the cell wall. Plant J 63: 662-669
Rizk SE, Abdel-Massih RM, Baydoun EA, Brett CT (2000) Protein- and pH-dependent binding of
nascent pectin and glucuronoarabinoxylan to xyloglucan in pea. Planta 211: 423-429
Roitsch T, Gonzalez MC (2004) Function and regulation of plant invertases: sweet sensations.
Trends Plant Sci 9: 606-613
Rojas HJ, Roldan JA, Goldraij A (2013) NnSR1, a class III non-S-RNase constitutively expressed
in styles, is induced in roots and stems under phosphate deficiency in Nicotiana alata. Ann Bot
112: 1351-1360
Roland J (1980) Visualisation des polysaccharides au niveau ultrastructural. In B Monties, AM
Catesson, JC Roland, F Barnoud, eds, Les polymères végétaux: Polymères pariétaux et alimentaires
non azotés. Gauthier-Villars, Paris, pp 30-45
Roppolo D, Geldner N (2012) Membrane and walls: who is master, who is servant? Curr Opin Plant
Biol 15: 608-617
Rose JK, Braam J, Fry SC, Nishitani K (2002) The XTH family of enzymes involved in xyloglucan
endotransglucosylation and endohydrolysis: current perspectives and a new unifying nomenclature.
Plant Cell Physiol 43: 1421-1435
Rubinovich L, Weiss D (2010) The Arabidopsis cysteine-rich protein GASA4 promotes GA
responses and exhibits redox activity in bacteria and in planta. Plant J 64: 1018-1027

Page 203
Références

Rubinstein AL, Broadwater AH, Lowrey KB, Bedinger PA (1995) Pex1, a pollen-specific gene
with an extensin-like domain. Proc Natl Acad Sci USA 92: 3086-3090
Ruhfel BR, Gitzendanner MA, Soltis PS, Soltis DE, Burleigh JG (2014) From algae to
angiosperms-inferring the phylogeny of green plants (Viridiplantae) from 360 plastid genomes.
BMC Evol Biol 14: 23
Rydahl MG, Fangel JU, Mikkelsen MD, Johansen IE, Andreas A, Harholt J, Ulvskov P,
Jorgensen B, Domozych DS, Willats WG (2015) Penium margaritaceum as a model organism for
cell wall analysis of expanding plant cells. Methods Mol Biol 1242: 1-21
Saiki RK, Scharf S, Faloona F, Mullis KB, Horn GT, Erlich HA, Arnheim N (1985) Enzymatic
amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle
cell anemia. Science 230: 1350-1354
Sainsbury F, Thuenemann EC, Lomonossoff GP (2009) pEAQ: versatile expression vectors for
easy and quick transient expression of heterologous proteins in plants. Plant Biotechnol J 7: 682-
693
Sampedro J, Cosgrove DJ (2005) The expansin superfamily. Genome Biol 6: 242
Samuels AL, Giddings TH, Jr., Staehelin LA (1995) Cytokinesis in tobacco BY-2 and root tip cells:
a new model of cell plate formation in higher plants. J Cell Biol 130: 1345-1357
Samuels L, Kunst L, Jetter R (2008) Sealing plant surfaces: cuticular wax formation by epidermal
cells. Annu Rev Plant Biol 59: 683-707
San Clemente H, Jamet E (2015) WallProtDB, a database resource for plant cell wall proteomics.
Plant Methods 11: 2
San Clemente H, Pont-Lezica R, Jamet E (2009) Bioinformatics as a tool for assessing the quality
of sub-cellular proteomic strategies and inferring functions of proteins: plant cell wall proteomics
as a test case. Bioinform Biol Insights 3: 15-28
Sano T, Kuraya Y, Amino S, Nagata T (1999) Phosphate as a limiting factor for the cell division of
tobacco BY-2 cells. Plant Cell Physiol 40: 1-8
Sarkar P, Bosneaga E, Auer M (2009) Plant cell walls throughout evolution: towards a molecular
understanding of their design principles. J Exp Bot 60: 3615-3635
Sasidharan R, Voesenek LACJ, RPierik R (2011) Cell wall modifying proteins mediate plnat
acclimatization to biotic and abiotic stresses. Crit Rev Plant Sci 30: 548-562
Scheller HV, Jensen JK, Sørensen SO, Harholt J, Geshi N (2006) Biosynthesis of pectin. Physiol
Plant 129: 283-295
Scheller HV, Ulvskov P (2010) Hemicelluloses. Annu Rev Plant Biol 61: 263-289
Schmitz K (1979) Long distance transport in Macrocystis integrifolia: I. Translocation of C-labeled
assimilates. Plant Physiol 63: 995-1002
Schols HA, Bakx EJ, Schipper D, Voragen AGJ (1995) A xylogalacturonan subunit present in the
modified hairy regions of apple pectin. Carbohydr Res 279: 265–279
Schopfer P (2001) Hydroxyl radical-induced cell-wall loosening in vitro and in vivo: implications for
the control of elongation growth. Plant J 28: 679-688
Schuller DJ, Ban N, Huystee RB, McPherson A, Poulos TL (1996) The crystal structure of peanut
peroxidase. Structure 4: 311-321
Schultink A, Liu L, Zhu L, Pauly M (2014) Structural diversity and function of xyloglucan
sidechain substituents. Plants 3: 526-542
Schultz CJ, Hauser K, Lind JL, Atkinson AH, Pu ZY, Anderson MA, Clarke AE (1997)
Molecular characterisation of a cDNA sequence encoding the backbone of a style-specific 120 kDa
glycoprotein which has features of both extensins and arabinogalactan proteins. Plant Mol Biol 35:
833-845

Page 204
Références

Sedbrook JC, Carroll KL, Hung KF, Masson PH, Somerville CR (2002) The Arabidopsis SKU5
gene encodes an extracellular glycosyl phosphatidylinositol-anchored glycoprotein involved in
directional root growth. Plant Cell 14: 1635-1648
Seifert GJ, Blaukopf C (2010) Irritable walls: the plant extracellular matrix and signaling. Plant
Physiol 153: 467-478
Seifert GJ, Roberts K (2007) The biology of arabinogalactan proteins. Annu Rev Plant Biol 58: 137-
161
Seifert GJ, Xue H, Acet T (2014) The Arabidopsis thaliana FASCICLIN LIKE
ARABINOGALACTAN PROTEIN 4 gene acts synergistically with abscisic acid signalling to
control root growth. Ann Bot 114: 1125-1133
Sénéchal F, Wattier C, Rusterucci C, Pelloux J (2014) Homogalacturonan-modifying enzymes:
structure, expression, and roles in plants. J Exp Bot 65: 5125-5160
Shanmugam V (2005) Role of extracytoplasmic leucine rich repeat proteins in plant defence
mechanisms. Microbiol Res 160: 83-94
Sheng J, D'Ovidio R, Mehdy MC (1991) Negative and positive regulation of a novel proline-rich
protein mRNA by fungal elicitor and wounding. Plant J 1: 345-354
Shevchenko A, Wilm M, Vorm O, Mann M (1996) Mass spectrometric sequencing of proteins
silver-stained polyacrylamide gels. Anal Chem 68: 850-858
Shimizu T, Nakano T, Takamizawa D, Desaki Y, Ishii-Minami N, Nishizawa Y, Minami E,
Okada K, Yamane H, Kaku H, Shibuya N (2010) Two LysM receptor molecules, CEBiP and
OsCERK1, cooperatively regulate chitin elicitor signaling in rice. Plant J 64: 204-214
Shiu SH, Bleecker AB (2001) Receptor-like kinases from Arabidopsis form a monophyletic gene
family related to animal receptor kinases. Proc Natl Acad Sci USA 98: 10763-10768
Showalter AM (1993) Structure and function of plant cell wall proteins. Plant Cell 5: 9-23
Showalter AM, Keppler B, Lichtenberg J, Gu D, Welch LR (2010) A bioinformatics approach to
the identification, classification, and analysis of hydroxyproline-rich glycoproteins. Plant Physiol
153: 485-513
Sigrist CJA, de Castro E, Cerutti L, Cuche BA, Hulo N, Bridge A, Bougueleret L, Xenarios I
(2013) New and continuing developments at PROSITE. Nucleic Acids Res 41(Database issue):
D344-D347
Silverstein KA, Moskal WA, Jr., Wu HC, Underwood BA, Graham MA, Town CD,
VandenBosch KA (2007) Small cysteine-rich peptides resembling antimicrobial peptides have
been under-predicted in plants. Plant J 51: 262-280
Skinner DJ, Gasser CS (2009) Expression-based discovery of candidate ovule development
regulators through transcriptional profiling of ovule mutants. BMC Plant Biol 9: 29
Somerville C, Bauer S, Brininstool G, Facette M, Hamann T, Milne J, Osborne E, Paredez A,
Persson S, Raab T, Vorwerk S, Youngs H (2004) Toward a systems approach to understanding
plant cell walls. Science 306: 2206-2211
Sommer-Knudsen J, Clarke AE, Bacic A (1996) A galactose-rich, cell-wall glycoprotein from styles
of Nicotiana alata. Plant J 9: 71-83
Sørensen I, Domozych D, Willats WG (2010) How have plant cell walls evolved? Plant Physiol 153:
366-372
Sørensen I, Pettolino FA, Wilson SM, Doblin MS, Johansen B, Bacic A, Willats WG (2008)
Mixed-linkage (1-->3),(1-->4)-beta-D-glucan is not unique to the Poales and is an abundant
component of Equisetum arvense cell walls. Plant J 54: 510-521
Sousa AO, Assis ET, Pirovani CP, Alvim FC, Costa MG (2014) Phosphate-induced-1 gene from
Eucalyptus (EgPHI-1) enhances osmotic stress tolerance in transgenic tobacco. Genet Mol Res 13:
1579-1588

Page 205
Références

Stintzi A, Heitz T, Prasad V, Wiedemann-Merdinoglu S, Kauffmann S, Geoffroy P, Legrand M,


Fritig B (1993) Plant pathogenesis-related proteins and their role in defense against pathogens.
Biochimie 75: 687-706
Tamura K, Peterson D, Peterson N, Stecher G, Nei M, Kumar S (2011) MEGA5: molecular
evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum
parsimony methods. Mol Biol Evol 28: 2731-2739
Tan L, Eberhard S, Pattathil S, Warder C, Glushka J, Yuan C, Hao Z, Zhu X, Avci U, Miller
JS, Baldwin D, Pham C, Orlando R, Darvill A, Hahn MG, Kieliszewski MJ, Mohnen D (2013)
An Arabidopsis cell wall proteoglycan consists of pectin and arabinoxylan covalently linked to an
arabinogalactan protein. Plant Cell 25: 270-287
Tan L, Qiu F, Lamport DT, Kieliszewski MJ (2004) Structure of a hydroxyproline (Hyp)-
arabinogalactan polysaccharide from repetitive Ala-Hyp expressed in transgenic Nicotiana
tabacum. J Biol Chem 279: 13156-13165
Tan L, Showalter AM, Egelund J, Hernandez-Sanchez A, Doblin MS, Bacic A (2012)
Arabinogalactan-proteins and the research challenges for these enigmatic plant cell surface
proteoglycans. Front Plant Sci 3: 140
Tan L, Varnai P, Lamport DT, Yuan C, Xu J, Qiu F, Kieliszewski MJ (2010) Plant O-
hydroxyproline arabinogalactans are composed of repeating trigalactosyl subunits with short
bifurcated side chains. J Biol Chem 285: 24575-24583
Tauzin AS, Giardina T (2014) Sucrose and invertases, a part of the plant defense response to the
biotic stresses. Front Plant Sci 5: 293
Taylor CM, Karunaratne CV, Kie N (2012) Glycosides of hydroxyproline: Some recent, unusual
discoveries. Glycobiology 22: 575-767
Thompson JD, Gibson TJ, Higgins DG (2002) Multiple sequence alignment using ClustalW and
ClustalX. Curr Protoc Bioinformatics Chapter 2: Unit 2.3
Thompson JE, Fry SC (2000) Evidence for covalent linkage between xyloglucan and acidic pectins
in suspension-cultured rose cells. Planta 211: 275-286
Tognolli M, Penel C, Greppin H, Simon P (2002) Analysis and expression of the class III
peroxidase large gene family in Arabidopsis thaliana. Gene 288: 129-138
Tran HT, Qian W, Hurley BA, She YM, Wang D, Plaxton WC (2010) Biochemical and molecular
characterization of AtPAP12 and AtPAP26: the predominant purple acid phosphatase isozymes
secreted by phosphate-starved Arabidopsis thaliana. Plant Cell Environ 33: 1789-1803
Tryfona T, Liang HC, Kotake T, Tsumuraya Y, Stephens E, Dupree P (2012) Structural
characterization of Arabidopsis leaf arabinogalactan polysaccharides. Plant Physiol 160: 563-666
Tsang DL, Edmond C, Harrington JL, Nuhse TS (2011) Cell wall integrity controls root elongation
via a general 1-aminocyclopropane-1-carboxylic acid-dependent, ethylene-independent pathway.
Plant Physiol 156: 596-604
Turlapati PV, Kim KW, Davin LB, Lewis NG (2011) The laccase multigene family in Arabidopsis
thaliana: towards addressing the mystery of their gene function(s). Planta 233: 439-470
Twomey MC, Brooks JK, Corey JM, Singh-Cundy A (2013) Characterization of PhPRP1, a
histidine domain arabinogalactan protein from Petunia hybrida pistils. J Plant Physiol 170: 1384-
1388
Urbanowicz BR, Pena MJ, Ratnaparkhe S, Avci U, Backe J, Steet HF, Foston M, Li H, O'Neill
MA, Ragauskas AJ, Darvill AG, Wyman C, Gilbert HJ, York WS (2012) 4-O-methylation of
glucuronic acid in Arabidopsis glucuronoxylan is catalyzed by a domain of unknown function
family 579 protein. Proc Natl Acad Sci USA 109: 14253-14258
Van der Hoorn RA (2008) Plant proteases: from phenotypes to molecular mechanisms. Annu Rev
Plant Biol 59: 191-223

Page 206
Références

Van Hengel AJ, Barber C, Roberts K (2004) The expression patterns of arabinogalactan-protein
AtAGP30 and GLABRA2 reveal a role for abscisic acid in the early stages of root epidermal
patterning. Plant J 39: 70-83
Van Hengel AJ, Roberts K (2003) AtAGP30, an arabinogalactan-protein in the cell walls of the
primary root, plays a role in root regeneration and seed germination. Plant J 36: 256-270
Van Sandt VS, Stieperaere H, Guisez Y, Verbelen JP, Vissenberg K (2007) XET activity is found
near sites of growth and cell elongation in bryophytes and some green algae: new insights into the
evolution of primary cell wall elongation. Ann Bot 99: 39-51
Vannucci L, Krizan J, Sima P, Stakheev D, Caja F, Rajsiglova L, Horak V, Saieh M (2013)
Immunostimulatory properties and antitumor activities of glucans. Int J Oncol 43: 357-364
Velasquez SM, Iusem ND, Estevez JM (2011a) Root hair sweet growth. Plant Signal Behav 6: 1600-
1602
Velasquez SM, Ricardi MM, Dorosz JG, Fernandez PV, Nadra AD, Pol-Fachin L, Egelund J,
Gille S, Harholt J, Ciancia M, Verli H, Pauly M, Bacic A, Olsen CE, Ulvskov P, Petersen BL,
Somerville C, Iusem ND, Estevez JM (2011b) O-glycosylated cell wall proteins are essential in
root hair growth. Science 332: 1401-1403
Velasquez SM, Salgado Salter J, Petersen BL, Estevez JM (2012) Recent advances on the post-
translational modifications of EXTs and their roles in plant cell walls. Front Plant Sci 3: 93
Verhertbruggen Y, Marcus SE, Haeger A, Ordaz-Ortiz JJ, Knox JP (2009) An extended set of
monoclonal antibodies to pectic homogalacturonan. Carbohydr Res 344: 1858-1862
Villalba M, Batanero E, Lopez-Otin C, Sanchez LM, Monsalve RI, Gonzalez de la Pena MA,
Lahoz C, Rodriguez R (1993) The amino acid sequence of Ole e I, the major allergen from olive
tree (Olea europaea) pollen. Eur J Biochem 216: 863-869
Vincken JP, Schols HA, Oomen RJ, McCann MC, Ulvskov P, Voragen AG, Visser RG (2003) If
homogalacturonan were a side chain of rhamnogalacturonan I. Implications for cell wall
architecture. Plant Physiol 132: 1781-1789
Vincken JP, York WS, Beldman G, Voragen AG (1997) Two general branching patterns of
xyloglucan, XXXG and XXGG. Plant Physiol 114: 9-13
Vogel J (2008) Unique aspects of the grass cell wall. Curr Opin Plant Biol 11: 301-307
Vogel JP, Raab TK, Somerville CR, Somerville SC (2004) Mutations in PMR5 result in powdery
mildew resistance and altered cell wall composition. Plant J 40: 968-978
Voinnet O, Pinto YM, Baulcombe DC (1999) Suppression of gene silencing: A general strategy used
by diverse DNA and RNA viruses of plants. Proc Natl Acad Sci USA 96: 14147-14152
Voinnet O, Rivas S, Mestre P, Baulcombe D (2003) An enhanced transient expression system in
plants based on suppression of gene silencing by the p19 protein of tomato bushy stunt virus. Plant
J 33: 949-956
Von Groll U, Berger D, Altmann T (2002) The subtilisin-like serine protease SDD1 mediates cell-
to-cell signaling during Arabidopsis stomatal development. Plant Cell 14: 1527-1539
Voragen AGJ, Coenen G-J, Verhoef RP, Schols HA (2009) Pectin, a versatile polysaccharide
present in plant cell walls. Struct Chem 20: 263-275
Wagner TA, Kohorn BD (2001) Wall-associated kinases are expressed throughout plant
development and are required for cell expansion. Plant Cell 13: 303-318
Wang HZ, Dixon RA (2012) On-off switches for secondary cell wall biosynthesis. Mol Plant 5: 297-
303
Wang L, Li Z, Qian W, Guo W, Gao X, Huang L, Wang H, Zhu H, Wu JW, Wang D, Liu D
(2011) The Arabidopsis purple acid phosphatase AtPAP10 is predominantly associated with the
root surface and plays an important role in plant tolerance to phosphate limitation. Plant Physiol
157: 1283-1299

Page 207
Références

Wang T, Chen X, Zhu F, Li H, Li L, Yang Q, Chi X, Yu S, Liang X (2013) Characterization of


peanut germin-like proteins, AhGLPs in plant development and defense. PLoS One 8: e61722
Wang X, Zafian P, Choudhary M, Lawton M (1996) The PR5K receptor protein kinase from
Arabidopsis thaliana is structurally related to a family of plant defense proteins. Proc Natl Acad
Sci USA 93: 2598-2602
Watanabe L, de Moura PR, Bleicher L, Nascimento AS, Zamorano LS, Calvete JJ, Sanz L,
Pérez A, Bursakov S, Roig MG, Shnyrov VL, Polikarpov I (2010) Crystal structure and
statistical coupling analysis of highly glycosylated peroxidase from royal palm tree (Roystonea
regia). J Struct Biol 169: 226-242
Whetten R, Sederoff R (1995) Lignin biosynthesis. Plant Cell 7: 1001-1013
Willats WG, Marcus SE, Knox JP (1998) Generation of monoclonal antibody specific to (1-->5)-
alpha-L-arabinan. Carbohydr Res 308: 149-152
Willats WG, McCartney L, Mackie W, Knox JP (2001) Pectin: cell biology and prospects for
functional analysis. Plant Mol Biol 47: 9-27
Willats WGT, Knox JP, Mikkelsen JD (2006) Pectin: new insights into an old polymer are starting
to gel. Trends Food Sci Technol 17: 97–104
Wojtaszek P (2000) Genes and plant cell walls: a difficult relationship. Biol Rev Camb Philos Soc
75: 437-475
Wolf S, Hematy K, Hofte H (2012) Growth control and cell wall signaling in plants. Annu Rev Plant
Biol 63: 381-407
Wu H, de Graaf B, Mariani C, Cheung AY (2001) Hydroxyproline-rich glycoproteins in plant
reproductive tissues: structure, functions and regulation. Cell Mol Life Sci 58: 1418-1429
Wu HM, Wang H, Cheung AY (1995) A pollen tube growth stimulatory glycoprotein is
deglycosylated by pollen tubes and displays a glycosylation gradient in the flower. Cell 82: 395-
403
Wyatt RE, Nagao RT, Key JL (1992) Patterns of soybean proline-rich protein gene expression. Plant
Cell 4: 99-110
Xie D, Ma L, Samaj J, Xu C (2011) Immunohistochemical analysis of cell wall hydroxyproline-rich
glycoproteins in the roots of resistant and susceptible wax gourd cultivars in response to Fusarium
oxysporum f. sp. Benincasae infection and fusaric acid treatment. Plant Cell Rep 30: 1555-1569
Xu SL, Rahman A, Baskin TI, Kieber JJ (2008) Two leucine-rich repeat receptor kinases mediate
signaling, linking cell wall biosynthesis and ACC synthase in Arabidopsis. Plant Cell 20: 3065-
3079
Xu Z, Escamilla-Treviño L, Zeng L, Lalgondar M, Bevan D, Winkel B, Mohamed A, Cheng CL,
Shih MC, Poulton J, Esen A (2004) Functional genomic analysis of Arabidopsis thaliana
glycoside hydrolase family 1. Plant Mol Biol 55: 343-367
Yeats TH, Rose JK (2008) The biochemistry and biology of extracellular plant lipid-transfer proteins
(LTPs). Protein Sci 17: 191-198
Yeats TH, Rose JK (2013) The formation and function of plant cuticles. Plant Physiol 163: 5-20
York WS, Darvill AG, Albersheim P (1984) Inhibition of 2,4-dichlorophenoxyacetic acid-stimulated
elongation of pea stem segments by a xyloglucan oligosaccharide. Plant Physiol 75: 295-297
Zandleven J, Beldman G, Bosveld M, Schols HA, Voragen AGJ (2006) Enzymatic degradation
studies of xylogalacturonans from apple and potato, using xylogalacturonan hydrolase. Carbohydr
Polym 65: 495–503
Zandleven J, Sørensen SO, Harholt J, Beldman G, Schols HA, Scheller HV, Voragen AJ (2007)
Xylogalacturonan exists in cell walls from various tissues of Arabidopsis thaliana. Phytochemistry
68: 1219-1226

Page 208
Références

Zhang L, Zhu W, Zhang Y, Yang B, Fu Z, Li X, Tian J (2014) Proteomics analysis of Mahonia


bealei leaves with induction of alkaloids via combinatorial peptide ligand libraries. J Proteomics
14: 59-71
Zhang X, Rogowski A, Zhao L, Hahn MG, Avci U, Knox JP, Gilbert HJ (2014) Understanding
how the complex molecular architecture of mannan-degrading hydrolases contributes to plant cell
wall degradation. J Biol Chem 289: 2002-2012
Zhao Q, Nakashima J, Chen F, Yin Y, Fu C, Yun J, Shao H, Wang X, Wang ZY, Dixon RA
(2013) Laccase is necessary and nonredundant with peroxidase for lignin polymerization during
vascular development in Arabidopsis. Plant Cell 25: 3976-3987
Zhong R, Ye ZH (2015) Secondary cell walls: biosynthesis, patterned deposition and transcriptional
regulation. Plant Cell Physiol 56: 195-214
Zhou HL, He SJ, Cao YR, Chen T, Du BX, Chu CC, Zhang JS, Chen SY (2006) OsGLU1, a
putative membrane-bound endo-1,4-beta-D-glucanase from rice, affects plant internode elongation.
Plant Mol Biol 60: 137-151
Zhou L, Bokhari SA, Dong CJ, Liu JY (2011) Comparative proteomics analysis of the root
apoplasts of rice seedlings in response to hydrogen peroxide. PLoS One 6: e16723

Page 209
Annexe

ANNEXE
Annexe 1. Répertoire des domaines PAC classés par clade

Les séquences sont en format FASTA. Le domaine PAC est défini de -4 par rapport au résidu
Cys 1 jusqu’au résidu Cys6. Pour chaque clade, la(les) séquence(s) d’A. trichopoda est(sont)
indiquée(s) en gras. Les numéros d’accès des protéines sont suivis du codage indiquant le type de
protéine (cf § 4.4.).

Clade A
>AmTr_v1.0_068.122.1.1
GVIYCKSCNYSANDTLLGATPLQGATARLECNSSKQVVTAEGKTDKNGYFFIEAPRNKVTNYAFHKCKVFL
ASSPLATCQKATDLHGGITGSPLRFHQVLDSGYPLAVFSTGPLAYAPTNATVC
>Pavir.Ea02646.3.2
GVVWCKSCRYAGYVRAMDASPLPNAAALLRCRREGGRALSVWNATGADGSFLIQADWESAPFKSKDCKVYVPRSPASGC
AAAVRPAARKGAPLKFRRFLPLPGELQARYSASNFTFAPEEPAKC
>Pavir.Ea02645.1.1
GVVWCKGCRYPGYIESRDASPLRNASALLRCRRHGSRQALSVWGATNSRGYFLIQTGAQAAAFTSKDCRVYVPRSPARGC
ANPARRKGLPLRFRRFVTRPDGLQGRYVAGGFTFAPQDRSKC
>Pavir.Eb02971.nd
GVIYCKSCKGDGYNSGINASPLPGATAMMVCYGRKVVNATGTVTDGNGYFLIMFYDMQNFNARTCKMYLVSSPTPQCSKP
YYPPNQWIGLSLVRETRTIPPAGLQGIYTPTSVLFYAPAAKGQC
>Bradi2g48670.3.2
GAVWCQGCRYAGYDKSKNASPLPNAAAQLLCRRGKKWALFASGSTDEGGNFRILTPKQVAPFTSKDCTVYVQRSPVGACG
VALKPSGGKAGSPLKFRKFVPLSDDDLQAIYSAGEFLFGTGPSGKC
>Pavir.Ca01526.3.2
GVVWCKSCRYPGYFPPMDASPLPGAEVYLRCKHGRRAVTVPGRSGPGGYFLIQTSRQVSSFTSQQCRVYVPTSPVRACG
VPAYPSGRNKGLPLKFQEFVNRGNGLQGMYSVGNRLFRPKYPGRC
>Pavir.J05128.3.2
GVVWCKSCRYPGYFPPMDASPLPGAEVFLRCKHGRRVLTVPGQSGPGGYFLIQTSRQVAAFTSQQCRVYVPTSPVRACGV
PAYPSGRNKGLPLKFQEFVNRGNGLQGMYSVGNRLFRPKYPGRC
>Si024185m.3.2
GVVWCKSCRYPGYFAPMDASPLPGAEVYLRCKHGRRALTVPGRSGPGGYFLIQTSQQMSAFTSQQCRVYVPRSPARVCG
VADYPSRANKGLPLKFQEFVKRDNGLQGMYSVGNRLFRPKYPGRC
>Bradi2g18910.3.2
GMAWCKTCHYRGYYAPMDASPLPGAVAYLRCVRGRRGVSVRGVAGKGGYFLIQSAKMASFTSSDCRVVVRASPKRACGA
AEFPAADLEGLPLKFERFLTLGDGIQALYSVGNFLFRPNSPGKC
>Si023339m.3.2
GVIYCKSCKLRGYNSGMDASPLPNATASLVCYGEEESKYRVLNQTSTASDKNGYFIVMVYDVDMFDRHTCRLYLRSSPTAL
CAKPFMPSNPKLGLNLVRDRAATAPRGARSVWHVKTALMYAPSAGGKC
>Pavir.Ca01524.3.2
GVIYCKSCKLRGYNSGMDASPLPNATVSLVCYGDEESGYRVLNQTSTAADRNGYFIVMVYDVDMFDRHTCRLYLRASPTPL
CAAPSVPSNPKLGLTLVRDRAATAPRGARGVYHARTALMYAPGAGGRC
>Pavir.J05129.3.2
GVIYCKSCKLRGYNSGMDASPLPNATVSLVCYGDEDSGYRVLNQTSTAADRNGYFIVMVYDVDMFDRHTCRLYLRSSPTPL
CARPSVPSNPKLGLTLVRDRAATAPRGARGVYHARTALMYAPGAGGSC
>Bradi2g18920.3.2
GVIYCKSCKLANYNSGMDASPLPNATAKLVCEEMGGSGRRALEMTSTATDGNGFFLFMVYDVAAFTRNSGSCKVYLRSSPT
MLCDAPFLPEDPTIGMSLAKEAEEEAEHDIYSIQSGALMYKPRSGVSC
>Pavir.Ea02647.3.2
GVIYCKSCKGNGYNSGIDASPLPGATAMMVCYGRKVVNATGTVTDGNGYFLIMFYDMQNFNAKTCKMYLVSSPTPQCSRP
YYPPSQWIGLSLVRETRTIPPAGLQGIYTPTSVLFYAPGAKGQC
>Si002717m.3.2
GVIYCKSCKGKGYNTGIDASPLPGATAMMVCYGRKVVNATGTVTDGNGYFLIMFYDMQNFNARTCKMYLVSSPTPQCNKPY
YPPNQWIGLSLVRETRTIPPAGLQGIYSPTSVLFYAPGAKGQC
>Bradi2g48680.3.2
GVIYCKPCRSRRYSRDMDASPLQGATAQLVCYGREVVNVTGTVTDERGYFLVMFYDLGNFHPRNCKLYLGTSPTTLCDNPV
YPPNKWIGLSLVRETRTTPPEGLQGIYCPTSVLFYGPTAGQKC
>LOC_Os05g45480.3.2
MVWCKTCRYPGYLAAMDASPLAGAVAYLRCRHGHRRVASIRGVAGSGGYFRIETSQLTSFTSQECRVYVPRSPSRACAVP
GHGRRGLPLKFEEFVKRDNGLQGLYSVGNFVFSPKYPNKC
>Sb03g033360.3.2
GMVWCKSCRYDAPSMDASASPLPNADALLQCQRGDDGRAVSVWNTTDAGGHFLILADWQSAAFKSKDCRVKVYVPRSPA
AGACTVAVKPNPKGAPLKFRRFVPLSGEMQARYSAGDFTFAPEDPAKC
>Sb03g033350.3.2

Page 210
Annexe

GVVWCKSCRYPGYVESRDASPLRNASVLLRCRHGHRALSVWNTTNAQGYFLIQTGTQAAPFTSNNCKVYVPRSPARGCRV
AVSPRRKKGSPLKFRRFVTLTDGLQARYSAGRFTFAPQDPSKC
>Sb03g033370.3.2
GVIYCKSCKGKGYNTGIDASPLQGATAMMICYGRKVVNATGTVTDANGYFLIMFYDVKNFNARTCKMYLLSSPTPQCSKPYY
PPNQWIGLSLVRETRTIPPAGLQGIYTPTSVLFYAPGAKGQC
>Sb09g026500.3.2
GLIYCKSCKLKGYNSGMDASPLPNATASLVCYGDEDSKFRVLNQTSTATDKNGYFLVMVYDVDMFDRHSCRLYLRSSPTPL
CAAPFVPSNPKLGLTLVRDRKATAPRGARGIFHPKTALMYAPATAGKCPPY
>Sb09g026510.3.2
GVVWCKSCRYHGYFAPMDASPLPGAKVYLRCKHGRRAVTVAGQSGASGYFLIQTSQQVSAFTSQQCRVYVPRSPVRACG
VPAYPSGRKGLPLKFQEFVKRGNGLQGMYSVGNRFFRPKYRGKC
>LOC_Os01g52650.3.2
GAVWCKTCRYAGYVKSKDASPLPNAAALLRCRRGKWALSVWGATDARGYFLIQTGTQVAAFTSKDCRVYVPRSPSRAACG
VALQPGRKTGSPLKFRRFVALPDGLQGRYSAGNFVFGPRDPKKC
>LOC_Os05g45460.3.2
GTIYCKSCNLSGYNRYMDASPLPNATAQLVCYGDKVLNMTSTATDKNGYFLVMVYRLDVFRRSRCRVYLGSSPSPLCAAPFI
PSNKWLGLTLERERVASLPKGVRGVYRPKSTLMFGPGTGGKC
>LOC_Os01g52660.3.2
GVVYCKTCKSRGYSSDMDASPLPGATAQLVCYGKKVVNVTGTVTDANGYFLVMFYDLRNFNPRTCKVFLGSSPTSLCDKPV
YPPNKWIGLSLLKETRTVPPVGLQAIYCPTSVLFYGPANAGQC
>Eucgr.E03269.3.1
GVVYCKSCEYTLNGAKPIIGAVVKLWCKNTKYPAWATATTDKNGYFFLEAPKTVSNFATHKCKVFLVSSPIPSCSEPSNLNG
GSSGAPLKFEKLVLGKPLFTLYSVGPLAEPKC
>Gorai.009G168900.3.1
GVVYCKSCKYAGVDTLLGAKPIPRATVRLTCKDAKNELTVQFKTDKNGYFFLQAPITIYNFDLHNCSVSLVSSPLKACSKPSNL
NGGLKGAPLKPEKPSTSKKLPYVLYSVGPFAFEPTC
>Gorai.010G154300.3.1
GVVFCKSCKYAGSDTLLGAKPILGATVKLTCKNTKYKQEATAKTDKNGYFFLQAPKTVTSFGAHKCTVSLVSSPMAKCSKPS
NLHGGLKGATLRPEKPFTANKLPFILYTVGPFAFEPKC
>Eucgr.D00613.3.1
GVVYCKSCKYSGVETLLGATPVLRSCRFDDEVSFFAGAVVKLECNNTKYRPTVQTAKTDKNGYFFLKAPKTITTYAFHKCMA
SLASSPVPSCQKPSALHGGTVGAVLRPEKPVMIDKLPYTVFTVGPFAFEPQC
>AT2G34700.3.2
GMVYCKSCKYSGVDTLLEASPLQGATVKLACNNTKRGVTMETKTDKNGYFFMLAPKKLTTYAFHTCRAWPTNPGPTTATMT
CTVPSKLNNGITGAMLKPSKTINIGEHDYVLFSVGPFAFEPAC
>AT1G28290.3.1
GTVYCKSCKYAAFNTLLGAKPIEGATVKLVCKSKKNITAETTTDKNGYFLLLAPKTVTNFGFRGCRVYLVKSKDYKCSKVSKL
FGGDVGAELKPEKKLGKSTVVVNKLVYGLFNVGPFAFNPSC
>AT2G33790.3.1
GVVYCKACKYAGVNNVQGAKPVKDAVVRLVCKNKKNSISETKTDKNGYFMLLAPKTVTNYDIKGCRAFLVKSPDTKCSKVSS
LHDGGKGSVLKPVLKPGFSSTIMRWFKYSVYNVGPFAFEPTC
>Potri.011G053600.3.1
GVVYCKSCNYSGVDTFLGAKPVPGATVKLQCNNTKYPLEVKATTDKNGYFLAKAPGTITNYGFHKCKVWLVSAPNTACSKIT
DIHGGLAGAILRPEKKPFVDEKKRGYALFSVGPFAFESKC
>Potri.004G044700.3.1
GVVYCKSCNYSGVDTLLGAKPVLGATVKLQCNNTMKPQDVKTTTDKNGYFLIKAPGTITNYGVHKCKVWLVSAPSTACSKIT
NLHGGLTGAMLRPEKKPFVDEKKREFALFSVGPFAFESKC
>Lus10015434.3.1
GVVYCKPCKYSGVDTLLGATPVLGATVKLQCNNSRVPLVFKATTDKNGYFKVKAPKTITNYGVHKCKASLVSSPDAKCSFKS
TLHGGTTGGSLRVDKKFVESNQTYVMFTVGPFAFEPKC
>GSVIVT01007286001.3.1
GVVYCKACKYRGIDTLLGASPLLGATVKLQCNNTKYPLVVLGKTDKNGYFFIQAPKKITTFGAHKCKVSLISSSSPTCNLATDL
HFGLKGAILRPEKPPAGLPPPPYVTFSVGPFAFEPAKKVEC

Clade B
>AmTr_v1.0_019.72.1.1
GKVLCQDCTQGWNEWVHGAKPIKGSKVAVTCMDEQKRTVYYASDETDEQGEFEIPLKKEYVKGKSLSTVG
CLVRLVSSPDPLCNVPTDFGRGHSGVTLEWPSIVYKDLIKHIVGPFYFTSSMC
>Sm422150.1.1
GYVFCQNCYKDWSRHLGVHPGAEVSVECTAISTGKLVALGKGVSRENGYVEIRLDGYDYSSKLKIHRCLAKIVRSRDPSCDY
RTNVNSGYSGAKPQFSGVAGNIAYFTTNAFSFTPMC
>Sm429316.1.1
GFVSCQDCDGNFDKPSPGALVRVECRDGSYGEAASNRDGFFQIKFPQTYKSVYDPPESCKAMILASPDRSCDTATDLGGG
KKGAALEFEKIFMGEAFYKTGPFAFTPYC
>Sm412181.1.1
GIVYCQDCQGHWTKKISDALVSVVCKDKAGLITAYAMDNSDDSGYFQIKVPNYDCLHQENTTCVAQLVTTSDETCNKMTNE
GDGAQGAKLRPFTSYYNEMFFRVGPFAFTPYTC
>Sm407245.1.1

Page 211
Annexe

GIVYCQDCQGHWTKKISDALVSVVCKDKAGLITAYAMDNSDDSGYFQIKVPNYDCLHQENTTCVAQLVTTSDETCNKMTNE
GDGAQGAKLRPFTSYYNEMFFRVGPFAFTPYTC
>Pavir.Ib02444.2.2
GKVQCQDCTKNWNAYAYNARPIPGSVVGVTCVDGRGRAVYHGSDATDGQGVFNIEVPSKAASGADLAPSRCLVRLASSGD
AGCAVLTDFNGGRTGQRPSRLTHSSPDRATYAVGPYYC
>AT3G09925.1.1
GKVMCQDCSLNYDEWINGSEPIKGAVVSITCMDERRRVSYYGSDLTDERGQFDLMVNKVLSHGKVLKPQLCNVRLVSSPDL
SCNIPTNFGNGQTGVKLVRPFTVFRDLVKYVVGPFYYTTPMC
>Lus10023887.1.1
GKVLCQDCQKSYADWVNGERPIKGSKVSLTCMDERKRVIHYDSDTTDDRGQYEMVVSKYINGKLLNEKLCQVRLVSSPDSN
CNVMTDFAGGKSGVKLGQPAYVYRGSTKYEVGSVYFTHPRC
>Gorai.002G160400.1.1
GKVMCQDCTKSYGEWTHGSQPIKGGKVSVTCKDDRSRIIYYASDESDEEGSFNMAVNKYINGKELQPTSCLVRLVSSPHLT
CNIPTNFAGGITGVNLPVRPTVLYRDLVQYQLGTFFYTTPRC
>sp_v3.0_unigene32332
GRVLCRDCTIPDKESPGMEEEVKPIVGAIVSIVCMDQRGRAVYYSRNATEDYGLFELRLHKYRYQKHGLDGCKVLLLSSPHK
SCNVKTNMGGGQSGAGLYQTSVLDRDLVKYIVGPFSFTPHYC
>sp_v3.0_unigene33115
GRVLCRDCTIPDKESPGMEEEVKPIVGAIVSIVCMDQRGRAVYYSRNATEDYGLFELRLHKYRYQKYGLDGCKVLLLSSPRK
SCNVKTNMGGGQSGAGLYQTSVLDRDLVKYIVGPFSFTPHYCA
>PITA_000016621
GRVLCRDCRIPDQESPGMEEEVKPIVGAIVSIVCMDQRGRAVYYSRNATEDYGLFELRLHKYRYQKYGLDGCKVLLSSSPDK
SCNVKTNMGGGQSGAALYQTSVLDSDLVKYMVGPFSFTPHYC
>PEQU_22702
GKVLCQDCSQGWNYWAHAAQPVKGGKVAVTCTDARRRVVYYGSDETDDKGNFDLPVGPATPAPEGCSVRLLSSPDSACN
VLTADFAGGRSGMRLVRPSHVYPGRIKYTVGPFFFTSPMC
>Sb01g030090.1
GKVQCQDCTKNWNAYAYNARPIPRSKVSITCRDKNSRVVYHGSDDTDVQGVFNIEVPKTANVEASRCLVRLASSGDAACAV
FTDFNRGRTGQVPSRLTRASPTKETYAVGPYYC

Clade C
>AmTr_v1.0_153.4.1.2
GMVYCQSCELKGTHSLSEAKPIAGAKVGVACKDEKGRVKWYQAHKTDSYGYFYASVIGFAPSMDALSSCT
AYLLSSPDPECNLLTNINGGFEGSPLRYKGNLKAGKVLLYATGPLAFRPARC
>PITA_000070332.1.1
GVVVCQSCEYLSKNHSLEGFKPISGATVGVSCKDEKDRPVVYAVGKTDEVGYFYVVLEGYEIHDKEEYNPQDFCEVRLVSS
PDKSCAQFTNMNGGLMGGVFRFEREIVHHYHQNFLLYSAGPFAFC
>sp_v3.0_unigene33685.1.1
GVVVCQSCEYLSKNHSLEGSKPISGATVGVSCKDEKDRPVVYAVGKTDEVGYFYVVLEGYEIQDKEEYNPQDFCEVRLVSS
PDKSCAQFTNMNGGLMGGVFRFEREIVHHYHQNFLLYSAGPFAFC
>sp_v3.0_unigene29709.1.1
GVVVCQSCEYLSKNHSLEGSKPISGATVGVSCKDEKDRPVVYAVGKTDEVGYFYVVLEGYEIHDKEEYNPQDFCEVRLVSS
PDKSCAQFTNMNGGLMGGVFRFEREIVHHYHQNFLLYSAGPFAFC
>Pavir.J39494.3.3
GMVLCQSCAQRGSQSLDGAAPLPGAKVTVTCRDKKNRVMSWRSPAADYNGYFHAEFGVERAGDYFGGDPRAACFVRLLS
SPDAKCNGVTNIGGGMEGARIRDEGKRWTDQRGIENVVYAAGPLAFRPAVC
>Pavir.Ea00435.3.3
GLVLCQSCAQQGTQSLAGAAPLPGAKVTVTCRDKKNRVMSWRSPAADYNGYFHSEFGVERAGDYFGKDPRAACFVRLLS
SPDAKCNGVTNIGGGMEGARIRDEGKRWTDHRGIENVVYAAGPLAFRPAVC
>Si004283m.3.3
GLVLCQSCAKRGSPSLDGAAALPGARVTVTCRDRKNRVMAWRSPAADYNGYFLAEFGVERAGDFFGKDPREACFVRLLSS
PDAKCNVVTNINGGMGGASLRDEGKRWTDGRGIENVVYAAGPLAFRPEMC
>LOC_Os01g07060.3.3
GKVYCQSCEHRNSWSLDGARPLRGAEVSVTCRDAKNRAAWWRLAVADESGYFLAEFGVTRASDFLGADPRGACYARLLS
SPDRKCDGLTNINAGMVGAPLRDEGKRWPGQGYDNVVYAAGPLAFRPANC
>LOC_Os01g06960.3.2
GMVYCQSCAQRNTHSLEGAKSLPKAEVSVICHDAKNRAIVRCRRAVADDNGYFRAELDETNVSDFYMGDPRKACYVRLRA
SPDSECNNPTNINYSSIEGAPLRDEGKQWADHDYYNIIILC
>AT5G05500.3.3
GMVYCQSCDKFGSWSLAGAEAIAGAKISIICKNHRQQVSFYKVFRTDSYGHFYGELKGFKMTPHFLDHPLHSCRAKLVSSPR
EDCNLFSNINNALDGAPLRYEEKRLKWTNYEAVIYAAGPLAFRPDHC
>Potri.010G185400.1.2
GMVYCQSCKYSGSWSLTGAKPIPSAKVSVICKNSNKQVTFYKAFETDAYGYFYANLDGFKMSNIVLDHPLHGCHAKLVSSPL
PNCSLLSNINYGLYGAPLRFKNKVLRGTHYEVVIYAAGPLAFRPAQC
>Lus10017440.1.2

Page 212
Annexe

GIVYCQKCQNPGSLTGATPIPYAKVNVNCRNSRHMLTFQKVYTANQHGYFFAQLDGFRLGHGIFDIPPLQACTAKLVSSPLR
SCNVATEINSGPYGATLRSENKVYKYPPYETVIYAAGPLAFRPSNC
>Lus10007515.1.1
GVVYCQKCQNPGSLTGATPIPYAKVNVNCRNLRHMLTFQKVYTANQHGYFFAQLDGFRLGHGIFDIPPLQACNVKLVSSPLR
SCNVATEINSGPYGATLRSENKVYKYPPYETVIYAAGPLAFRPSNC
>Lus10040948.1.2
GVVYCQSCKNSGSWSLSGANPLHSATVSVICKNSHHQVSFYKTYQTNEYGYFYAQLDGFKLGHGILDHPLQACTVKLVSSP
LQTCNIPTNLNYGIKGAKLRFENKVLRFPHYEAVIYAAGPLAFRPSEC
>Lus10009837.1.2
GVVYCQRCHNSGSWSLSGANPLHSATVSVICKNSHNQVSFYKTYQTNEYGYFYAQLDGFKLGHGILDHPLQACTVKLVSSP
LQTCNVPTNLNYGIKGAKLRFENKVLRSPHYEAVIYAAGPLAFRPSEC
>Potri.008G072000.1.2
GMVYCQSCKYSGSWSLTEAEPIPSAKVSVICKNFKKQVTYYKAYETNAYGYFYAQLDDFKMSNNILDHPLHGCHVKLISSSL
ANCSLLSNVNYGLYGAPLRFENKVLRGSHYEAVIYAAGPLAFRPAQC
>GSVIVT01032773001.1.2
GMVYCQSCDQFGSWSLTGAEPIPAAKVSVICKDHKDQVSFYKAFETDGNGYFYAELDGFKMSHNILDHPLHSCHVKLVSSP
LENCNLLSNVNYGLYGSPLRYENKRLFGKHYEAVIYAAGPLAFRPAHC
>Eucgr.G03079.1.2
GMVYCQSCKYFGTWSLDEAKPVGSAKVSVVCKNYKNRVTYYKTFQTEESGYFYAELKGYEMSNPILDHPLHACHVKLVSSP
LEGCNLLSNINYGMYGAPLRYEDKTLYRKEYEVVVYAAGPLAFRPSYC
>Gorai.011G291100.1.2
GMVYCQSCDNYGSWSLSKAKPIASAKVSVICKNQRGQVSYYKASETDGNGYFFAELQGFEMSHLLLDHPLQSCVVKLVESP
LEGCNVLSNINYGLYGSPLRYENKRFYRKDYDVVIYAAGPLAFRPAHC

Clade D
>AmTr_v1.0_066.9.4.2
GKVYCYRCYDWRYPNKSHDKKHLKGAIVEVSCDADGKKVMVYGVTKNNGKFRVNVEGFDYEKWGGAKA
CKAKLYKAPKGSLCSIPTDLHDGKKGASLKVKSKSHEEIVLKAKPFAYAPKTPYHEC

>PEQU_38307.2.1
GSVYCFNCYDWKQPLDSHIKKPLEDAIVKVTCDAGDKTYVSYGKTKHFGKYSVNVKGFPFWKHRARACRVELHAAPKGSKC
KIPTNLNKGAPLKVIVKSHELVVLKAETLAFAPKIPYEDC
>PATC155590 .4.2
GHVYCFKCYNWKHPFDSSHRKLFKGAVVKATCKAGEKEYIGYGKTKAYGKYSINIEGYPYWKYGAEGCKVKLHAAPKGSIC
NIPTKINKGSPLKVEHKSDHEIILRAKSLVFAPSPHKYYEEC
>LOC_Os01g67390.2.2
GKVYCYRCFNEAHPEESHGKEHLKGAMVKVTCQANDQALVGFGYTQDNGKYSVSITGLPLSSTYGADSCKVELHSAPGGS
DCNVPIELNLSGLSVYSKSNEEVVLQANQVMAFASQKTFGFC
>Sb03g042800.2.2
GKVYCYRCFNEAHPDESHGKKHLEGAMVKVTCQANDQALVAFGYTKSNGKYSVILKGLPISNNYGADSCKVELHGAPGGS
DCNVPIELNLSGLSVYSKSSEEVVFKANQIMAFASKNTFGC
>Pavir.J01326.2.2
GKVYCYRCFNEAHPEESHGKKHLEGAMVKVTCQANDQAIVAFGYTKSNGKYSVILKGLSISNNYGADSCKAELHGAPGGSD
CNVPIELNVSGLSVYSKSSDEVVLQANQIMAFASKKTSEC
>Pavir.Ea03551.2.2
GKVYCYRCFNEAHPEESHKKKHLEGAMVKVTCQANDQAIVSFGYTKSNGKYSVILKGLPISNNYGADSCKVELHGAPGGSD
CNVPIELNMSGLSVYSKSSDEVVLQANQIMAFASKKTSEC
>Si004152m.2.2
GKVYCYRCFNEAHPEESHGKRHLEGAMVKVTCQANDQALVAFGYTRSNGKYSVILKGLPISNTYGADSCKVELHGAPGGSD
CNVPIELNLSGLSVYSKSSKEVVLQANQIMAFASKNTLEC
>Bradi2g57740.2.2
GKVYCYRCFNEAHPEESHGKEHLQGAMIKVTCQANDQALVRFGYTESNGKYSVGITDLPLSSAYGADSCKVELHAAPGGSD
CNVPMELNLSGVNVYSKSNKEVVFQANQVMAFGSKKTFAGC
>Gorai.006G227800.4.2
GKVYCYRCYDWSYPAKSHNKKHLKDAVVEVTCKVGEKEITAYGKTKINGKFSITVEGFNYAKYGAEACKAKLHAPPKGSSCN
IATGLHGGNKGAMLTVKSKDKYEVVLKAEPFAYAPKTPYKEC
>Gorai.005G018000.4.2
GKVYCYRCYDSSYPEKSHGKKHLEGATVEVTCKEGEKEITVYGKTKNNGKFAVTVDGFDYGKYGAKACIAKLHAPPKDSSC
NIPMSVHDGIKGAVLKVKSEDKYEVVLRAKPFGYGSKKPYKKC
>Lus10025526.4.2
GKVYCYRCYDWAYPTKSHDKKHLKGAVVEVTCKAGEKEIKAYGKTKINGKYSITVDGFEYGKYGAKACTAKLHAPHKGSKC
SIPTKLHGGNKGAELKVKSKDYHLIVLQAKSFAYAPKKPYAEC

Clade E
>AmTr_v1.0_062.88.1.1
GRVMCDVCADSSIGPEDHILEGAEVAVLCITKSGEVLNYQAFTNSKGVYSVAETMPESNRWDSCLARPISSF
HHHCTQLSNSNRAIHFSYSRPSGYSHSLKPFLYKPNTTPLYC

Page 213
Annexe

>sp_v3.0_unigene29873.1.1)
GRVYCDVCADRSMGPEDYFLEGAEVAVLCLTKSGEVLNYQAFTNSKGTFTVAETMPESNRWDMCLARQISSIHQYCNMPG
DTVSATKFSYSLSSGRSYMVRPFSYQPVKTPMYCR
>Sb07g009530.1.1
GRVVCDVCGDAAIGPEDHALEGAEVAVLCITKSGEVINYQAFTNSKGMYTVAETMPESDRWDSCLARPISSFHLHCTRRGD
AHSGVKFTYNKPSGNSHTVKTFLYKPATAPLYC
>Pavir.Ab01452.1.p.1.1
GRVVCDVCGDAAIGPEDHALEGAEVAVLCITKSGEVINYQAFTNSKGRYSVAETMPESDRWESCLARPISSFHQHCTRRGD
THSGVKFTYSKPSGNSHTVKTFLYKPANAPLYC
>Bradi3g10980.1 .1
GRVVCDVCADSAIGPEDHVLEGAEVAVLCITKSGEVINYQAFTNSKGIYSVAETMPESDRWESCLARPISSFHHHCTRRGDA
HSGVKFTYNKLSGNSHNVKTFLYKPVNVPLYC
>Si018587m.1.1
GRVVCDVCGDAAIGPEDHALEGAEVAVLCITKSGEVINYQAFTNSKGTYTIAETMPESDRWESCLARPISSFHQHCTRRGDA
HSGVKFTYSKPSGNSHTVKTFLYKPVNAPLYC
>LOC_Os02g21280.1.1
GHVVCDVCGDAAIGPEDHVLEGAEVAVLCITRSGEVINYQAFTNSKGVYIVAETMPESDRWESCLARPISSFHQHCTKRGDT
HSGVKFTYSKPSGNSHTVKTFLYKPANAPLYC
>AT5G54855.1
GRVVCDVCADSSIGPEDHVLEGAEVAVLCITKSGEVVNYQAFTNSKGVYTVAETMPESERWDACLARPISSFHTPCNRLHQT
NTGIKFTYNRPSGFFHAVKPFVYRPQYAPSYC
>Gorai.002G087500.1.1
GRVICDVCADSSIGPEDHILEGAEVAVLCITKSGEVVNYQAFTNAKGIYTVAETMPESDRWNTCLARPISSFHDHCNHLGDRS
TGIKFTYSRPSGHFHTVRPFVYQPSTAPSYC
>Gorai.013G160500.1.1
GRVVCDVCADSSIGPEDHVLEGAEVAVLCITKSGEVVNYQAFTNSKGIYTVAETMPESERWDACLARPISSFHDHCNHLGDG
STGIKFTYNHPSGHFHVIRPFVYRPSTAPTYC
>GSVIVT01037612001.1.1
GRVVCDVCGDSSIGPEDHILEGAEVAVLCITKSGEVLNYQAFTDAKGIYRVAETMPESDRWDACLARPISSFHEHCTHLGDG
TSGIKFTYSRPSGYSHTIRPFVYRPANAPLYC
>Potri.011G137100.1.1
GRVVCDVCGDSSIGPEDHVLEGAEVAVLCITKSGEVLNYQAFTNDKGIYTVAETMSESDRWDACLARPISSFHEHCTQLGET
STGVKFSYNRPSGFSHRVKPFVYSPANVPTYC
>Lus10003874.1.1
GRVVCDVCGDSSMGPEDHVLEGAEVAVLCITKSGEVVNYQAFTNAKGIYTVAETMPESDRWDACLARPISSFHEHCSHLGA
SSKGVKFSYKKPSGYSHSVRSFVYRHSSPPSYC
>Lus10001821
GRVVCDVCGDSSIGPEDHVLEGAEVAVLCITKSGEVVNYQAFTNAKGIYTVAETMPESDRWDACLARPISSFHDHCNHLGAS
SKGVKFSYKKPSGYSHSVRPFVYRHSSPPSYC

Clade F
>AmTr_v1.0_061.7.1.1
GRVYCDTCRAGFETSATTYIKGSTVRLECKDRATHQLTYSIEGVTDATGTYRLPVSDDRQHEICEVVVVSSPE
AGCGKAMLGRERARVLLTHNNGIVSNTRYANALAFLKDEPLPRC
>Si011199m.1.1
GRVYCDTCRAGFQTNVTEYIKGAKVRLECKHFGTGAVERAIDGVTDESGFYTIKLKGGHEEDICEVILIESPRKDCAEVPAHS
DRASVLLAKDAGISDDMRFPNPLGYFKDVPLPVC
>Bradi5g08410.1.1
GRVYCDTCRAGFETNVTTYIKGAKVRLECKRFGTEKVERALDGVTDETGTYKIELKDSHPEDICEVVLIQSPLADCNKIQALRD
RARVELTRNIGISDNLRLANSLGYLKDVPLPVC
>Pavir.J02757.1.1
GRVYCDNCRAGFETNVSHNIQGATVSMECRHFEQKLHDKAEATTDAGGWYRMDIGDDHQEEICEVMLVKSPEADCAEVER
FRDRSRVPLTKNNGMEMGGVRYANPIAFFRKEPLQNC
>Pavirv00058074.1.1
GRVYCDNCRAGFETNVSHNIQGATVSMECRHFETQKLHDKAEATTDAGGWYRMDIGDDHQDEICEVMLLKSPEADCAEVE
RFRDRSRVPLTRNNGMEMGGVRYANPIAFFRKEPLQNC
>Pavir.J20326.1.1
GRVYCDNCRAGFETNVSHNIQGATVSMECRHFETQKLHDKAEATTDAGGWYRMDIGDDHQDEICEVMLLKSPEADCAEVE
RFRDRSRVPLTRNNGMEMGGVRYANPIAFFRKEPLQNC
>Pavir.Cb01735.1.1
GRVYCDNCRAGFETNVSHNIQGATVSMECRHFETQKLHDKAEATTDAGGWYRMDIGDDHQDEICEVMLLKSPEADCAEVE
RFRDRSRVPLTRNNGMEMGGVRYANPIAFFRKEPLQNC

Page 214
Annexe

>Si024158m.1.1
GRVYCDNCRAGFETTASHNIAGATVQMECRHFETMQLHDKAEATTDAGGWYRMDIGDDHQEEICEVVLLKSPEADCAEIEQ
FRDRSRIALTRNNGMEQNAVRYANPIAFFRKEPLQNC
>Pavir.Ea00007.1.1
GRVYCDPCRAGFETNVSKSVPGATVEVVCRPFGSTKETLKAEATTDEKGWYKLEIDQDHQEEICEAVLAKSSDPACAEVEE
FRDRARVPLTSNNGIKQQGVRYANPIAFFRKDPLADC
>Pavir.Eb00002.1.1
GRVYCDPCRAGFETNVSKSVPGATVEVVCRPFGSTKETLKAEATTDEKGWYKLEIDQDHQEEICEAVLAKSSDPACAEVEE
FRDRARVPLTSNNGIKQQGVRYANPIAFFRKDPLADC
>Si003764m.1.1
GRVYCDPCRAGFETNVSKSVPGATVEVVCRQFGASKETLKAEATTDEYGWYKLEIDQDHQDEICEAVLAKSSDPACAEVEE
FRDRARVPLTSNNGIKQQGVRYANPIAFFRKDPLKEC
>Bradi2g07610.1.1
GRVYCDPCRAGFETNVSKNIGGATVAVDCRPFNGGDSKLKAEATTDQYGWYKIDIDQDHQEEICEVLLARSPDPACSEIEEF
RDRARVPLTRNNGLKQQGTRYANPIAFFRKEPLKDC
>Pavir.Bb01538.1.2
GSVYCDTCRAGFETNATTPIGGAKVRLECRHYKSASGAVERSAEGSTNATGQYRIELVDNRGAEEVCVVALVSSPMPGCGE
KEVGRDRAPVALLTDAGLATTVRRANPLGFLKEQPLPNC
>Pavir.Ba02853.1.2
GSVYCDTCRAGFETNATTPIAGAKVRLECRHYKSASGAVERSAEGSTNATGQYRIELVDNRGAEEVCVVALVSSPMPGCGE
KEVGRDRAPVALLTDAGLATTVRRANPLGFLKEQPLPNC
>Si032102m.1.2
GSVYCDTCRAGFETNATTPIAGARVRLECRHYMSRSGAVERSAEGATDAAGRYRVELVDNRGAEEVCVVALVSSPLPGCA
EKEAGRDRAPVEPLADDGLATTVRRANPLGFLKDQPLPNC
>Sb06g014740.1.2
GRVYCDTCRAGFVTNVTEYMAGAKVRLECKHFGTGEVERAIDGVTDATGTYTIELKDSHEEDICQVVLVQSPRKDCDQTQP
LRDRAGVLLTRNVGIADSLRPANPLGYFKDVPLPVC
>PEQU_41302.1.1
GRVYCDNCRAGFVTNITEYIEGATVRLECKHFQNDAVEHSIEAVSGADGYYTFIVPNDHEEEICYVKLIKSPRADCAEFVENR
EQARILLTENSGQANNLRYANALGFLKDVALPVC
>PEQU_10665.nd
GRVYCDTCRAGFETNITEYIPGAKVRVECTHFLTNKVEHSNEGVTDSSGSYKITVSNDHADEICEVVLVESPQENCMEIEKGR
DRAQVLLANDGGISGNTRHANSLGFLRNEPLPFC
>LOC_Os09g39950.1 .2
GDVYCDTCRAGFQTNATTAIQGARVRLECRHFMSASGAVERSAEGTTDAAGHYRIELVDNRGAEEVCAVALLSSPDPECHE
TEVGRDRAPVTLVQDAGLATMVRRANPLGFLKTRPLPIC
>Sb02g012930.1.2
GSVYCDTCRAGFETNATTPIAGAKVRLECRHYMSASGAVERSAEGATDAAGRYRIELVDNRGAEEVCSVVLLSSPVPGCAE
KEVGRDRAQVELVTDAGAGLATTVRRANPLGFLKSQPLPNC
>LOC_Os06g36240.1.1
GRVYCDPCRAGFETNVSKSIPGATVSVECRHYGAGRESLKAEATTDEKGWYKVEIDQDHQEEICEVVLDKSSDPACSETEK
TRDRSRVPLTSNNGLKQNGIRYANPIAFFRKEPLADC
>Sb03g001020.1.2
GRVYCDPCRAGFETNVSKSVAGATVEVVCRHFEASKETLKAEATTDDFGWYKLEIDQDHQEEICEVVLKKSPDPACAEIEEQ
RARARVPLTSNNGIKQKGTRYANPIAFFRKDPLKEC
>Potri.002G093100.1.1
GLVYCDTCLAGFETPKTTYIAGSKVKVECRDRKTQDLVYSKEGTTDSTGKYIITVDEDHKDQICDAMLVSSPRKDCSSPSAGR
DRARVILTSYNGLVSTTRYANSMGFMAAQPMSGC
>Gorai.009G282200.1.1
GQVYCDHCRAGFETPKTRNMAGAKVKVVCSNRKTGDVVYEKEGHTDSTGQYKIAVSEDHLDEICDAVLVKSSQPECAEMS
PGRERARVVLTNFNGISSNTRFANAMGFMANKAEAGC
>Gorai.005G093100.1.1
GYVYCDTCRAGFETPKTRSLADAMVRLVCSDRKSGQVVFKKEGYTDKTGKYQIRVSEDHLDQICDAVLVKSSQLGCATMSP
GRERARVILTNFNGISSTTRYANAMGFMVDEPEAGC
>Lus10042201.1.1
GKVYCDTCNFGFETPKSTSIPGATVKIQCRNRKSNELVYEREGETNSEGMYEIHVDEDHMDQVCDAKVVNSPQLDCFKPSA
GRDQARVILTDSNGIVSKVRFANAMGFSKEGTVDGC
>Lus10008615.1.1
GKVYCDTCNFGFETPKSTSIPGATVKIQCRSRKSNELVYEREGTTNSEGMYEIHVDEDHMDQVCDAKVVNSPQLDCFKPSA
GRDQARVILTDSNGMSSKVRFANAMGYSKEGTVDGC
>AT1G78040.1.1
GSTYCDICKFGFETPESSYFIPGATVKLSCKDRKTMEEVYTDKAVSDKEGKYKFIVHDDHRDQMCDVLLVKSSDKTCSKISVG
REKSRVILNHYSGIASQIRHANNMGFEKEVSDVFC
>AT4G08685.1.1
GRVYCDTCLAGFETPASTYISGAVVRLECKDRRTMELTYSHEARTDSTGSYKILVNEDHDEQFCDAMLVRSSQLRCSNVSP
GHDRARVTLTRFNGIASDDRFANNMGFLRDAAMPGC
>Eucgr.F00490.1.1
GKVYCDTCRAGFETPASTYIAGAKVKVECKDRTSMKLLYSQEATTDSTGTYKLFVSEDHQDQLCDAMLLSSPQLNCQKPAA
GRDRARVILTRYNGIVSDTRYANNMGFEMDQPLAGC
>GSVIVT01008996001.1.1
GRVYCDTCRAGFETSATTYIAGAKVRVECKDRNSMQLLYSIEGITDSTGTYKIMVTEDREDQLCDAVLVSSPQSDCASVDPG
RDRAAVILTRYNGIVSDNRYANSMGFLKDHPMSEC

Page 215
Annexe

>Eucgr.H04813.1.1
GSVYCDTCRFGFETPASTHIEGAAVRVECKDSTGTQLDYSIDTVTDSNGKWEVTVEDDHDDQLCSAVLVSSPKAGCQTVDP
GRSKATLILTRSNGAISSRHYANSMGCLTDQPLAEC
>AT5G10130.1.1
GSVYCDTCRFGFETIATQYIRGARVRIVCKDRVTLKSELVGVAVTGPDGKYKVAVRGDRQDQQCLAELVHSPLSRCQEADP
GRSTATVILTRSNGAASTRHYANAMGFFRDEPLRGC
>GSVIVT01006374001.1.1
GRVYCDTCRAGFETSATTYIAGARVRIECKDRNSLQLVYSVEGVTDSTGTYKFSIADDHGDQMCDAVLVKSPQPDCAKVDA
GRDRSRLSLTRSNGLVSDTRFANAMGFMKDEPASGC
>Eucgr.F03264.1.1
GKVFCDTCRVDFETKVSYGLADSKVRLECHNRTSGALTLSAEAVTDKTGEYRLEVEGDHEEEICEVQLIESSEPECSSLLEG
AVHNARVALTNKNGVAQPARFANALAFAKKETLADC
>Potri.011G111300.1.1
GKVYCDTCRVEFQTKISDAIPGAKVKLVCNNRENGTLTYTVEGTTDSSGTYRLPVVGDHEEDICEVRLVESPRADCNEPFKS
VDSARILLTKNVGVVDNLRYANALGYMKKVAQPEC
>Potri.001G392400.1.1
GKVYCDPCRVEFQTKISEGIPAAKVKLVCNNRDNGTETYTVEGATDNSGTYRLPVAGDHEDDICEVRLVESSRPDCNEPFRS
IDSARILLTKNVGVVDKTRYPNALGYMKKEAQPEC
>Gorai.004G272200.1.1
GKIYCDTCRVEFETKLSEPIPGAKVKLECRKQGDETVTYSHEAETDANGVYKIPVEGNHEEQICEVSTVSSPRADCNEKMEA
FEKAQVELTSDDGLAEPSRKANNLGFKKKVAVPGC
>Gorai.009G368100.1
GRVYCDTCRVEFETKISKPIKGASVKLECRNITNEKIVSHSQDVVTDEAGGYKIEVKGDHEDEICEVSLVKSPRADCSEPTEV
WRKARVVLTKADGVSGIYRFANNLGYMKKEALPEC
>Gorai.009G368200.1.1
GHVYCDTCRVEFETKLSEPISGAVVKLECRNRTNEAITFQSKEIVTDNHGDYHVIVEGDYEESDCDVALVRSPRADCSDPTEA
WRKSRVVLTTFDGLSGKLRFANNLGFKKDIALPQC
>Gorai.002G061500.1.1
GKVYCDTCRVEFETKLSQPINAKVHLECKNRTDERIVYSKDAVSDKLGMYSIPVEGDHEDELCEVRLIESPRNNCNEMMESW
RKARVVLTRRDGVTDLTRQTNNLGFKIKPEDVDTKAC
>Lus10001895.1.1
GKVYCDTCRTQFITRLSDFMKDAVVRLECKDREGGSVTFSETAITDEHGVFHIPVTGDHEDEICEINLIKSPRPDCSEIPKQEH
PNDETARISITKHNGMTTGERQANPMGFMVAKPKPEC
>Eucgr.E02748.1.1
GKVYCDTCRTQFITKVSKDMPDAKVRLECKDREGGSVTYSIEGVTDNTGMYRLPVDGEHEEEICEIVLVKSSQPGCEEVSND
PFLRKTARISLTKNNGMATPVRQANPLGYMKNESLPEC
>AT1G29140.1.1
GSVYCDTCRVQFITRISKFLEGAKVKLECKGRENQTVTLTKEAVTDNAGNYQMEVMGDHEEEVCEIVLLQSPDPECGDVNN
QEFLRNAARISLTANDGIVSNETRTINPLGFMRKTPLAEC
>AT5G45880.1.1
GSVYCDTCRVQFVTRLSKFLEGAKVKLECRSRTNGTITLTKEAVTDKTGSYKMEVTGDHEEEVCELVLVQSPDSGCSDVSTE
AYLRNAAKISLTANDGIVSHETRIVNPLGFMVQTPLADC
>AT4G18596.1.1
GSVYCDTCRVQFVTRLSKFLEGAKVKLECRSRTNGTVTLTKEAVTDKTGSYRMEVTGDHEEEVCELVLVESPDSGCSDVSK
EAYLRNAAKISLTANDGIVSHETRIVNPLGFMVQTPSAEC
>GSVIVT01021211001.1.1
GQVYCDTCRIQFITRVSEYVPGAKVRLECRDREGGSVTYSIDGETDETGSYRLPVEGEHEEEVCEVQLIKSSKPECSEISRGV
FARRSARISLASNNGMASSDRLANPLGFLKQESLSEC
>PITA_000025493.1.1
GKVYCDNCAAGFPTRISPAISGATVGVECKDRAGKRLFYNEQHTDNDGLFSISVLGEHEHEACEAFTVSSPTSCNLKTDSSR
GPVYLTHNNGINSDERKTGPFAFRPTTNHPAC
>sp_v3.0_unigene17318.1.1
GKVYCDNCAAGFPTRISPAISGATVGVECKDRAGKRLFYNEQHTDNDGLFSIAVLGEHEHEACEAFTVSSPTSCNLKTDSNR
GPVYLTHNNGINSDERKTGPFAFRPTTNHPAC
>sp_v3.0_unigene208976.1.1
GKVYCDNCAAGFPTRISPAISGATVGVECKDRAGKRLFYNEQHTDNDGLFSIAVLGEHEHEACEAFTVSSPTSCNLKTDSNR
GPVYLTHNNGINSDERKTGPFAFRPTTNHPAC
>sp_v3.0_unigene33411.1.1
GKVYCDNCAAGFPTRISPAISGATVAVECKDPAGKRLFYNEQHTDNDGLFRIAVLGEHEHEACEAFTVSSPTSCNLKTDSNR
GPVYLTHNNGINSDERKTGPFAFRPTTNHPAC
>sp_v3.0_unigene40477.1.1
GKVYCDNCAAGFPTRISPAISGATVAVECKDPAGKRLFYNEQHTDNDGLFSIAVQGEHEHEACEAFTVSSPTSCNLKTDSSR
GPVYLTHNNGINSDERKTGPFSFRSATNDPAC
>PITA_000030491.1.1
GKVYCDNCAAGFPTRISPAISGATVAVECKDPAGKRLFYNVQHTDNDGIFSIAVKGEHEHEACEAFTVSSPTSCNLKTDSSR
GPVYLTHNNGINSDERKTGPFAFRSTTNHPAC
>PITA_000047868.1.1
GKVYCDNCAAGFPTRISPAISGATVAVECKDPSGKRLFYNEQHTDNDGIFSIAVKGEHEHEACEAFTVSSPTSCNLKTDSSR
GPVYLTHNNGINSDERNTGPFAFRSTTNDPAC
>PITA_000047867.1.1
GKVYCDNCAAGFPTRISPAISGATVAVECKDPAGKRLFYNEQHTDNDGLFSIAVKGEHEHEACEAFTVSSPTSCNLKTDSSR
GPVYLTHNNGINWDERKTGPFAFRSTTNDHAC
>sp_v3.0_unigene40476.1.1

Page 216
Annexe

GKVYCDNCAAGFPTRISPAISGATVAVECKDPAGKRLFYNEQHTDNDGLFSIAVKGEHEHEACEAFTVSSPTSCNLKTDSSR
GPVYLTHNNGINSDERKTGPFAFRSTTNDPAC
>PITA_000072543.1.1
GKVYCDNCAAGFPTRISPAISGATVAVECKDRDGKRLFYNEQQTDKDGLFSIAVQGEHEHEACEAFTVRSPTSCNLKTDTSR
GPVYLTHNNGINSDERKTGPFAFRSTTNHPAC

Clade G
>AmTr_v1.0_041.161.2.3
GTVFCDACKDGQRSSFDYPLSGAKVAVACAGNDGQVTVWKEESTNWFGNYGMRFEGSPDLSRCFAQVVA
NPQGSNCGITGGPARGLNLVFDMFGMEMYVVDSLLSQPSQPMAFC
>Pp1s21_221V6.2.3
GKVFCDRCIQNKVFPFAHPMSKAKVSVQCKDWSGRVVGYARTSTNFLGDFIVQFKGKKDLSGCSVYLDGSSDRSCNIIGGG
RRAISLKSKFLFQAFYVADPLFYKPARPMGFC
>Pp1s79_182V6.2.3
GKVFCDQCIQNKVFPYAHPMSKAKVKVECKDASGNVVDYADASTNFLGDFIVSFKGKEDLTGCSVSLAGSPDSKCSIVGGG
GKTVTLKSKFLFKALYVVDPLFYKPALPMEFC
>Sm438958.2.2
GRVFCDRCIEGRFSEYAIFVKGAKVALECTQQDGGIHVVEAVTDSAGAFAIPVDEPGSSCAVKLLSTPTPQCNIAAKHAQTLN
ANMRTKDNVIYVGLLSFRPEEPLPIC
>PITA_000018697.2.2
GNVFCDQCRDGQRSLFDVPIYGAKVGVECRDSDGQMTMSMQETTDLIGDFIMKVDGTPDMSGCSARVIDSPADSGCNITAS
PAQPLKLSLKLFSVELYTVGSLFCQPLKPMASLC
>sp_v3.0_unigene10476_1_1.2.2
GNVFCDQCRDGQRSLFDVPIYGAKVGVECRDSDGQMTMSMQETTDLLGDFIMKVDGTPDMSGCSARVIDSPADSGCNITA
SPAQPLKLSFKLFSVELYIVGSLFCQPLKPMASLC
>PEQU_23858.2.2
GSVFCDQCKDGSRGLFDYPLSGARVAVSCGDQYREESSNILGTYSVRFNGNPDLGGCLARVVRGPDNCSVASGPAQSLKF
IFRMFDMEAYSVDPLLAQPSKVMDFC
>Si019569m.2.3G
GMVFCDQCKDGARGLFDYPLYGARVAIQCGGGDTPLTVRESNTNWFGGFSIRMEGSPDMNRCTARVVQGTGHCGASGAP
PRELTLAFRMLGLALYTVPPLLSQPEEAMDFC
>Pavir.J30775.2.2
GMVFCDQCKDGARGLFDYPLYGARVAIQCGGGDTPLTVRESNTNWFGGFSIRMEGSPDMNRCTARVVQGTGHCGAATAG
APRELTLAFRMLGLALYTVPPLLSQPEEAMDFC
>Pavir.J05239.2.2
GMVFCDQCKDGARGLFDYPLYGARVAIQCGGGDTPLTVRESNTNWFGGFSIRMEGSPDMNRCTARVVQGTGHCGAATAG
APRELTLAFRMLGLALYTVPPLLSQPEEAMDFC
>Gorai.002G193700.2.3
GAVFCDQCKDGQRSLFDYPLSGMKVTVACADGTGQVTMSREETTNVFGNYVMRFDGTPDLSNCNAQVSGSGEGSNDCG
ATAGPAQKLRLMFRMFGMEIYGVDSLLSEPSQPMSFC
>Lus10042394.2.3
GSVFCDQCKDGHLSLFDYPMTGVRVTMACVDENGETLMSREERTNMFGWYNIRFDGTPDLRNCYTQFAPDSSSTGEGSS
SSGGSANSCIAAAGPPQKLRLMFNMFGMEMYSVDSLLSQPAKPMSFC
>Lus10026279.2.3
GSVFCDQCKDGQLSLFDYPMTGVRVTMACVDENGETLMSREERTNMFGWYNIRFDGTPDLRNCYTQFAPDSSSTGEGSS
SGGGSANSCIAAAGPPQKLRLMFNMFGMEMYSVDSLLSQPAKPMSFC
>Eucgr.G01761.2.3
GTVICDQCKDGRMSIFDYPIYGIKVMVACTNSDGQVTMSREETTNWFGNYGMRFEGTPDLSSCHAQVMGGSGQGSMGCS
ASASPAQPLRLTFQMFNMEFYSVDTLLSQPAQPMSFC
>Potri.004G169200.2.3
GTVFCDQCKDGQVSLFDYPIYGIKVTMTCADASGQITMSREETTNWFGNYVMTFDGSPDLSNCYAQVSSSGQGSNACGAA
AGPAQKLRLTFRMFDMEFYAVDSLLTEPSASMSFC
>GSVIVT01024071001.2.3
GTVFCDQCKDGQRSLFDYPLYGIKVTMACANSNGQITMWREETTNWFGTYAMRFDGAPDLTGCYAQISGSGQGSTGCRA
AAGPAQSVRLMFRMFDMEMYAVDSLLSQPAQPMSFC
>AT2G16630.2.3
GSVFCDQCKDGERSLFDFPVSGIKISVTCADENGQVYMSREETTNWLGGYVMRFDGTPDLSNCYAQVSDNGVQQDPSSC
SIASGPAQKLKLMFSFFGIETFAADALLAQPVQPSSFC
>Sobic.004G001700.2.2
GMVFCDQCKDGARGLFDYPLYGARVAIQCGGGDTPLTVRESNTNWFGGFSVRMEGSPDMNRCTARVVQGTGHCGAGAG
AGGGGAPRELTLAFRMLGLALYTVPPLLAQPEEAMDFC

Clade H
>AmTr_v1.0_scaffold00047. 2.2
GTVFCDTCFNGDFSESSHFIQGASVAVECRDRTVKKTFTKEVKTNQHGQFEVKLPFSVSHHIKRIKRCSVKL
VSSSEPYCGVASMAESSSLHLKSKRAGLHIYSAGFFTFKPLKQPDLC
>Sm443385.2.2

Page 217
Annexe

GTVYCDSCLEARLTRNSIVFSEAEIQIECVGSRGNPDHSTVVSTNETGQFQAQIPPQFDACSVQFLSKALDSCATPAAAFATS
ASLDQPRDLVFRPSQALAFC
>Sm409806.2.2
GYAICDTCWEMQITANSISLPNVTAAVECFDAGGRIIFRETSSTDNTGAFRVELPFQIADSVSMLSTCTSRVVRGPLNHLCTYP
LAHAYNPFLSPRSLPDGRQVYGVGPFVFRPRAKLPHC
>Sm405039.2.2
GYVVCDACREKNLTSNSVFLSGMTVSLTCKAVGGQRPFFTAQQATDEQGRFSLDIPSQISGSGDGFKLCAASVAAGEKGITP
LQRSCNVAAMEKSHSSLTPYTTIEGHRIFSTGPFVYTPSKSLQSIKSC
>Potri.017G100600.2.2
GTVFCDTCFQEAFSRNSHFISGASVAVECKDEESRPGFREEVKTDEHGEFKVHLPFSVSKHVKKIKRCSVKLLSSSEPFCAV
ASSATSSSLHLKSRKQGTHIFSSGFFTFKPEKQPILC
>Lus10034365.2.1
GTVYCDTCFQDAGTRFISGASVAVECRRGRFRQEVKTNEQGKFKVKLPFSVSKQVQSIRRCSVKLVSSSDPSCAVTSTANS
TSSLHRINKQGDDLHVFSAGIFTFKPAQHENSLC
>Lus10005086.2.1
GTVYCDTCFHDADTRFISGASVAVECRRGRFRQEVKTNEQGKFKVKLPFSVNKQVQSIRRCSVKLVSSSDPSCAVASTANS
TSSFHRIKNNQGDNLHVFSAGFFTFKPAQHKNSLC
>AT5G15780.2.2
GTVYCDTCFNGAFSKSPNHLISGALVAVECIDENSKPSFRQEVKTDKRGEFKVKLPFSVSKHVKKIKRCSVKLLSSSQPYCSI
ASSATSSSLKRLKSNHHGENTRVFSAGFFTFRPENQPEIC
>Gorai.001G206900.2.2
GTVYCDICFQQDFSKAHHFISGASVAVECKDGDSRPSFRQVAKTNEQGEFKVRLPFSVTKHVKKVKGCSVKLVRSSEPYCA
VASSSTSSSLHPKSTKQGTKVFSAGFLSFKPLKLPNLC
>Gorai.001G206700.2.2
GTVYCDTCFQSDFSRPTHFISGATVAVECKDGKSSRASFRQQVKTNRHGEFKVHLPFSVSKHVKKIEGCEVKLIKSSEPYCA
VASSATSSSLHLKSRKQGTHVFSAGFFTFKPFKQPTLC
>Eucgr.J01410.2.2
GTVYCNTCFTQGFSKASHFIPGASVAVECKDGSAKLSFHKEAKTDEHGEFKVSLPFSIGKHVRRIEGCSVKLISSSEPNCAVA
SPVTSSSLHFKMRKNGDHVFSAGFFTFKPLQRPKLC
>GSVIVT01036543001.2.2
GTVFCDTCFQEDFSKTSHFISGASVVVECGDGSLKPSFQKEAKTNEHGVFKVHLPISVSKHVRKIKRCSVRLISSSEPYCSVA
STATSSSLRLKSRKQGIHIFSAGFFSFKPLKQPYLCN
>Potri.004G114400.2.2
GTVYCDTCFQEYFSRNSHFISGAHVAVECKDEKSRPSFREEAKTDEHGEFKVHLPFSVSKHVKKIKRCSVELLSSSEPYCAV
ASTATSSSLRLKSRKEGTHIFSAGFFTFKPEKEPFLC
>Potri.004G114300.2.2
GTVYCDTCFQEYFSRNSHFISGAHVAVECKDEKSRPSFREEAKTDEHGEFKVHLPFSVSKHVKKIKRCSVELLSSSEPYCAV
ASTATSSSLRLKSRKEGTHIFSAGFFTFKPEKEPFLC
>PEQU_28082.2.2
GTVYCNTCFHQNSSRHNQVLSGASVLVDCNNQITKSGFQNFVKTDKDGVFRVQLPSEISKHIKTIKQCSVKLISSNDPFCAVA
APPTSSSFHLKSTKNKVHVFSSGFFAFRSLNQSELC
>PEQU_26271.2.2
GSVYCDTCSQQEFSTFSHFIPGASVAITCNRIGKDKLSFQEEVKTNNQGAFKIRIPVEVASRTGKEIKSCSVKLVRSSEPFCSV
ASPLTSAVPQLKSIRNSVPVFSAGFLTFRPMKQPDVC
>sp_v3.0_unigene138340.1.1
GSVFCDTCFQRKFTTRSYFLPGVWVAIKCYTRTGGRTTSLGTNGQTNSHGVFRIEVPFSFDSEKEIQTCSAHLLRSSSASCN
VPSIKTKSHFAIKSKMNNNYVYSAGPLSYRPARFPALC
>PITA_000018651.2.2
GNVFCDTCFQQQFSANSYFISGASVALQCRINKEQEPDFSLEAQTNEYGEFKFELPPSIFHSHEQVQRCSATLHKNPQGSC
GVASMAKSSSFSLKSKQGSIYTYSAGSFTYRPPSPPHLC
>sp_v3.0_unigene15799.2.2
GNVFCDTCFQQQFSANSYFISGAFVALQCRINKEQEPDFSLEAQTNEYGEFKFELPPSIFHSHEQVQRCSATLLKNPQGSCK
VASMAKSSAFSLKSKQGSIYTYSAGSFTYRPPSPPQLC
>sp_v3.0_unigene37666.2.2
GNVFCDTCFQQQFSANSYFISGAFVALQCRINKEQEPDFSLEAQTNEYGEFKFELPPSIFHSHEQVQRCSATLLKNPQGSCK
VASMAKSSAFSLKSKQGSIYTYSAGSFTYRPPSPPQLC
>sp_v3.0_unigene30577.1.1
GNVFCDTCLKHQFSQESSHVITGARVILECSINRKTIASSTVAESDEYGDFTVEVPSLFHPEERINRCSVRLLSSPEGLCNAKS
KTVPSKLVLLSNSNGVRTYNAGSLSYHPQNIPGLC
>PITA_000016158.1.1
GNVFCDTCLKHQFSEESSHVITGARVALECSIKRKTIASVTVAESDEYGDFTVEVPSLFHPEERINRCSVRLLSSPEGSCNTP
SKTVPSKLVLLSNSNGVRTYNAGSLSYHPQNIPGLC
>PITA_000091617.1.1
GNVFCDTCLKHQFSEESSHVITGARVALECSIKRKTIASFTVAESDEYGDFTVEVPSLFHPEERINRCSVRLLSSPEGSCNTPS
KTVPSKLVLLSNSNGVRTYNAGSLSYHPQNIPGLC
>PITA_000028265.2.2
GNVFCDACLEGRPSENAYVISSASVAVECRLNKGTMMTVSIRGETDEKGEFKVELPLNIFESADQLSMCSMKLLKSPDKSCG
IPSKSGPASSLTLQSFVNGVLTYSAGSFSYRHETAPGSC
>PITA_000028268.2.2
GNVFCDACLEGRPSENGYVISGASVAVECRLNRKTMMTVSIRGETDEKGEFKVELPLNIFESADQLSMCSVKLLKSPDKSCG
IPSKSTPASSLTLQSSVNGVLTYSAGSFSYRHETAPGSC
>PITA_000085646.2.2

Page 218
Annexe

GNVFCDTCLEGRRSENGYVISGASVALECGLNRKTMMTVSIRGETDEKGEFKVELPLNIFESADQLSMCSVKLLKRTDKSCRI
PSKSAPASSLTLQSFVNGVLTYSAGSFSYRHETAPGSC
>PITA_000048977.2.1
GNVFCDVCAEGRLSENGYGISGASVTVECIFNRKTLTVSVRGETDENGEFKMVLPSNIFQSADQLRNCSVKPLKSPNKSCRI
RSTSRPSSLELQSFDNGVLTYSAGSFSYRPKTIRAEC
>PITA_000041967.1.1
GNVFCDPCLEGRPSQNGYVISGASVAVECSLNRKGTMTVSITGETDENGEFRVAFPSNIFHSAYQLSKCWVKPLKSPHNSC
RIPSKSAPSRLTLQSFSNEVLAYSAGSFSYRHETVPASC
>PITA_000002274.2.2
GNVFCDTCLEHSLSENGYVISGASVALECSLNRKTMTVSITAETDENGEFKVELPSNIFHSADPLNKCSVKPLRSPYDSCSIPS
KSAPSSLTLQSEYNGVLTYNAGSFSYRHETVPAKC
>sp_v3.0_unigene31312.2.2
GNVFCDTCLEHSLSENGYVIAGASVALECSLNRKTMTVSITAETDENGEFKVELPSNIFHSADPLNKCSVKPLRSPYDSCSIPS
KSAPSSLTLQSEYNGVLTYNAGSFSYRHETVPAKC
>PITA_000046580.2.2
GNVFCDTCLEHRLSENGYVISGASVALECSLNRKTTTISITAETDENGEFKMELPSNIFHSADPLKKCSVKPLRSPYDYCSLPS
KSAPSSLTLQSESNGVLTYNAGSFSYRHETVPAKC
>PITA_000036064.2.2
GNVFCDACLEGRPSQNGYVISGASVALECSLNRKTMTVSITAETDENGQFKLKLPSNIFHSADPLNKCWVKPLRSPYDFCRIP
SKSEPSRLTLLSESNGVVTYNAGSFSYRHETVPASC
>PITA_000070108.2.2
GNVFCDACLEGRPSHNDYVISGASVALECSLNRKTMTVSITAETNENGEFKVELPSNIFHSVDPLNKCWVKLLRSPYDFCRIP
SKSAPSSLTLQSESNGVVTYNAGSFSYRHETVPASC
>PITA_000054578.2.2
GKVFCDVCLEGKPSENGYVISGASIAVECNLNRKAMKLSITGETDGNGEFKVELPSSIFPFADQLSSKCSVRPRNSPYDSCRI
PSNSAPSKLTLHSTSNGVLTYSAGSFSYRHESLPPSC
>sp_v3.0_unigene24997.2.2
GKVFCDACLENRLSENGYAISGASIAVECALNRKGMSVSVTGETNKNGEFKVEIPSHILHSADQLNKCWVKPRSSPLDSCKIP
SIPGPTKLTLQSNSNGVLTYSAGPFSYRLESVPPSC
>PITA_000007482.2.2
GKVFCDTCLENRLSGNGYFVSGASIAVECALNRKTMTLSMIGETDENGEFRVELPSSILQSADQLNKCWVTPRNSPLVSCNI
PSTAAPSKLTLQSASNGVVTYSAGLFSYRHETVPPSC
>sp_v3.0_unigene188097.2.2
GKVFCDTCLENRLSGNGYFVSGASVAVECAVNRKTMTLSIIGETDENGEFRVELPSSILQSADQLNKCWVTPRNSPLVSCNI
PSTAAPSKLTLQSASNGVVTYSAGLFSYRHETVPPSC
>PITA_000016159.2.2
GKVFCDTCLEDRLSENGYVISGASIAVECELNRKTMNIYFIGETDENGEFRVELPSNIFQSADQLNNCWVKPRNSPYDSCNIP
RISAPSKLSLQSVSHGVVTYSAGLFSYRHGTVRPSC
>PITA_000016160.2.2
GKVFCDTCLQDRLSENGYVISGAPIAVECELNRKMMSISFLGETDENGEFRVELPSNIFQSADQLNKCWVKPRNSPYDSCDI
PRMTAPSKLSLQSASHGAVTYSAGSFSYRHETVPPSC
>PITA_000016160.2.2.2
GKVFCDTCLDDRLSENGYVISGAPIAVECELNRKMMSISFLGETDENGEFRVELPSNIFQAANQLNNCWVKPRNSPYDSCNI
PRISAPSKLSLQSASHGVVTYSAGSFSYRHETVPPSC
>PITA_000093728.2.2
GKVFCDTCLEDRLSENGYVISGASIAVECELNRKMMTISFLGKTDENGEFRLELPSDIFQSTDQLNNCWARPRNSPYDSCNIP
RISEPPKLSLQSASNGVVTYSAGSFSYRHETVPPSC
>PITA_000044900.2.2
GKVFCDTCLDDRLSDNGYVISGASIAVECDFDRKMMTISFLGKTDENGEFRVELPSDIFQSADQLNNCWVKPRDSPYDSCNI
PIMSAPSKLSLQSASNGVVTYSAGLFSYRHETVPPSC
>PITA_000056936.2.2
GKVFCDTCLQDRLSENGYVISGASIAVECELNRKMMTISFLGKTDGNGEFRVELPSDMFQSADQLSNCWVKPRNSPYDSCN
IPRMSAPSKLSLQSASNGLVTYSAGLFSYRHESVPPSC

Clade I
>AmTr_v1.0_047.45.1.1
GTVTCDACRDTGKSPFVSGATVAVRCQTNGGKRSRHFRVRGKTDEYGDFMIDIPSHMHATPRLENTCHVTV
VQIPENSDCRRNRAGRQAFRLRVSSVGNGIRVYTAGFLHFQPRGAAAIC
>PEQU_11448.1.1
GSLVCEACLSAGSELTVSHVQGAAVAVSCRTEQRRRRRIRYANGTTDEFGEFIIDLPSQLHAIPKLEEACVVRILHMPRNSLC
RHLSRGLNPAAKRIRLSSVGNSIRVYTTGMMRTRSLGTGKLSHHEC
>Sb01g013620.1.1
GQLTCELCLRPGSQLLALDMPGAKVAVTCKSDRTPSNQLDSFAFATTDEYGNFTIDLPPQLHATPDLEKACTVKVLQLPADS
CRLRHRTGDTYGLRLSSVEDGVRAYTAGVIRLQDSDTPSDHC
>Bradi3g15970.1.1
GQILCVLCLRPGSDLLTFQLPGSKVAVTCKSEGPNTSTMAANSAFATTDESGNFTIELPSRLHATPNLEDACSVTVLTLPPDS
ACHAGHSPGSPYRLQPSSSEEDGVRTYTTGSIWLQHNDTPSEEC
>Gorai.010G248800.1.1
GTVLCEACHQRRRRDPQPELRSWPISGALVSVKCETPCKTKSGTTPATTDEYGDFMIDLPSHLHGVADLQKICTVKVIGIPKE
SMCRPAFVKKHEHLRLSSVGNGIRTYTAGRIRFQDIMSKPSKSC

Page 219
Annexe

>Eucgr.E03855.1.1
GSVLCEACLPGDPQLHAWPLSGASVAVNCHADDKESKSSRIHGLTDENGDFFIDLPSELHAVPNLNKRCSVNLVRMPRNSL
CRPAHIRKHKRVRLSSVGNGIRTYEAGTIRLQHSATEPTEAC
>Lus10039078.1.1
GSVVCQACSSTTVDHQDLHQLHEWPVPGAVVAVNCRGKKKHRKSTTQARTVTDEYGDFIIDLPSELHGIADFDKMCSVEVL
RMPKDSACRPAYVQNKHKALKLSSFGNGIRNYSAGKIQFLDTTSKPLQSC
>Potri.016G006200.1.1
GTILCEACLNGGTQLLHAWPVSGALVYVECHTGGKWSKTTSSQAMTDEYGDFLIDLPSHLHGIPNLERTCSVKVLRLPQNSV
CRPAHARKQKALELSSVGNGIRNYSAGEIKFLQVTSKPLQAC
>Potri.006G005600.1.1
GTVLCEACLHGENQLHAWPISGALVNVECHTSTKRSKKSSAQAITDEYGDFLIDLPSHLHGIPHLERICSVKVLRLPQNSVCR
PAHARKQKALKLSSVGNGIRNYSAGEIKFLQVTSKPLQAC

Clade J
>AmTr_v1.0_019.68.1.1
DQISCLDCTKHQAHGVGLVIKCDSEKPILAVTDRTGSFKAEITTSKTSAPLEDTCYASLLGPRNKLCSFKNNQ
ASKFVKSAKYHKDPSSSYYALFTPLSFSSSDC
>AmTr_v1.0_041.169.2.1
GVGECLDCAKKSFPTDHAFSGLHVSIDCKTDGGKFHSKAAGDLDKNGKFLVKLPSDLLNEEGDLTEECFAQ
LHSGPSSPCPSQAGLEAQKIMLKSKEDGKHEFGTKGKLSFSRSTC
>Bradi3g45020.2.2
GSVTCLDCAAGHHLSGVVVAVKCTGGAGLHAAQTDGSGSFDVAVPAASGSRCAARVLGGAEQLCAPQGLAVARVVAAAG
GSYALGSRLAVFTRC
>LOC_Os02g33170.2.2
GYVACLDCAPGHDLSGVVVAVRCGGGDGGVGQLRAAQTDERGGFDVAVPAAGGDDVDSWRSHPRCAARVLGGAEQLCA
PGGLAVAPVVAAGGREKHGSYALASSLAVFTRC
>Si018326m.2.2
GSVACLDCAAGHDLSGVVVAVKCAGDGGGAGALHAAETDGLGAFDMAMPAAVSSSGATPCAARVLGATEHLCAPRGLAV
ARVVPARAPGSSSSSHYALGSRLAVFTRC
>Pavir.Aa01983.2.2
GSVACLDCAAGHDLSGVVVAVRCGAGAGAGILRAAQTDARGAFDVAMPAAAAPTSSSSATPCAARILGATEQLCAPRGLAV
ARVVPARAASPASSYALASPIAFFAARC
>Pavir.J22213.2.2
GSVACLDCSAGHDLSGVVVAVRCAGGAGLLRAAQTDARGAFDVAMPAAAAVPPSSSSSATPCAARVLGAATEQLCAPRGL
AVARVVPGPSYALGSPLAFFTARC
>Bradi5g09480.2.3
GTVACLDCAQQRNLSGVVVAVKCANGTGVRAAETDGQGRFEVAVPASRSKPGSPCAARILGGPEQLCAPPRFAASRVVVA
HARPGGGSYALTSPLGVFTQC
>Sb04g021840.2.1
GSVACLDCAAGHDLSGVVVAVKCAGNGDGGGAGMHAAQTDGGGNFDVAVPGASASSASQPCAARVLGATEQLCAPQRL
TVARVVPARARAPGSAAAASYVLGSRLAFFTRC
>PEQU_14043.2.2
GSVSCMDCSPSHDLSGISLAVNCGGQKTQSYALTNINGQFLISVPNPPPPPSDCSVNLLGARTQLCGFKNSITSKIIAINSSIKS
SNSSYALQTPLAFFTSC
>sp_v3.0_unigene20162.2.2
GTVTCDECTQKHIGTTAALSDIFSVQVKCKRKKEDTNFEYQSSVDFGSLDEKGVFKVEISPHLLNGKGELTHNCYAKLLVKDA
GSHQYHLCSTSTSSNLIFKSKEGHKHIFTTNGNLNLSPSSC
>sp_v3.0_unigene22875.2.2
GTVTCDECTQKHIGTTAALSDIFSVQVKCKRKKEDTNFEYQSSVDFGSLDEKGVFKVEISPHLLNGKGELTHNCYAKLLVKDA
GSHQYHLCSTSTSSNLIFKSKEGHKHIFTTNGNLNLSPSSC
>Potri.004G168600.2.2
GTGECADCAESNIKTVHAFSGLRVTIDCKPENGEFKTRGFGELDEEGKFKVSLPSEVVKDGKLKEECYAQLHSASAAPCPSH
DGLESSKIVLKSKTDEKHTFGLAGKLKFSPVTC
>Potri.009G129900.2.2
GIGECADCAQSNIKTVHAFSGLKVTIDCKPENGEFKTRGVGELDEEGKFKVSLQNDVVKDGKLKEECYAQLHSASAAPCPAH
NGLESSKIVFKSKTDEKHTFGLAGKLKFSPVTC
>Lus10026281.2.2
GFGECADCAKSQLHPSQIFSGLHVTIDCKPHSGEFKTIGSAKLDELGKFSVSLPNGVVAEDGQKLKQECYAQLHSAADGAAP
CAAHGGLESTKVVFNSQKKTFELSGGKIKFSPEVC
>Eucgr.I01377.2.2
GIGECADCKRNNINAKQAFSGIRVSINCLTPKGEYKRRGVGELNEEGKFKVLLPPEIFVEGKSKEECYAQLHSAAATPCPSYG
SPKSSKIVFKPVTHTKRTYGLADKLKFSPATC
>Gorai.012G153300.2.1
GVGECTDCKENNLDTTQAFSGLRVTIDCKPENGDHFKTRGSGKLDKQGNFKVSLPQHLFKDGKLNEHCYAQLRTVSSPQP
CPSINGLESSKLVFKSTTDQKHQFGLKENLKFSPITCV
>Eucgr.L01869.2.2
GAMECSDCAQRNVKLSQAFSGIRVSIECKTAKGKFEHRAVGELDGEGKFQVSLPEEMVEGGKLKEECYAQLHSAQATPCPA
HDGLESSKIVLKSKANGKHTFGLSGKLKIASSTC

Page 220
Annexe

>Gorai.002G193500.2.4
GAGECADCAENNLEISQAFSGLRVSIDCKPENGKNFKTRGSGELDKQGNFKVFVPEDLVENGELKEECYAQLHSVSAAPCP
AHDGLESAKLVLKSRSDGKHEFGLKGKLRFSPLTC
>GSVIVT01024081001.2.2
GIGECADCKQRNIKTSQAFSGLRVTIDCKLANGEFKTRAVGELDEEGKFKVSLPEEIVKDGELKEECFAQLHSASATPCPAHN
GLESSKLILKTKVDGKHTFGPAGKLKFSPATC
>GSVIVT01024076001.2.2
GVVECADCSESRIKASPAFSLGVTIDCKLANGEFKTRAVGDVSNEGKFKVSLPEEMVKDGYQLKEECFAQLHSASAAPCPDA
QSGLEASKIVLKAKTIGKKNVFGPIANLKFSSLTC
>GSVIVT01024076002.2.2
GIVECADCSESHIKASQAFSGLGVTIDCKLANGEFKTRAFGVVSNEGKFKVSLPEEMVKDGYQLKEECFAQLHSASAAPCSD
AQSGLKASKIVLKAKTIGKKNDFGPIENLKFSSLTC
>Si037138m.2.2
GSIKCLDCFPNDINAEDAFKGLQVAIKCKSAADENYDYETKAVGPLDDVGVFRIPLAAELLRDDGNLDRDCYAQLHSAPDTPC
VGQAPPRIAPTQDGTAAATSAIYLAAAADTVFSPVAC
>Pavir.Ib00908.2.2
GSIKCLDCSPSGVNAEDTLQGLQVAIKCRSAADESYETKAVGALDDAGVFRIPLAADLLRDDGSLDGDCFAQLHSAPDTPCV
GQAPPRIAPSLSQDGTADTASATYLEAAADTVFSPVAC
>Sb01g041220.2.2
GCVKCLDCSPNDVNAFKDLQVAIKCKSGAADDESYEMRALGTLDDTGVFRIPLAAELLRDDGSMDRDCFAQLHSSLGTPCV
GQAPPRIAPTTSQSDGGSATSDTTYLAAAADTVLAPVAC
>Bradi1g68400.2.2
GSVRCLDCSPNDVNAEDAFKELQVAIKCKSGAGETYETQSLTHLDGTGAFKIPLAAGLVREDGELDRDCFAQLHSAPDTPCA
GAAPPKIAPAGGLNSEDTANTYLAVTDDTILSPVAC
>LOC_Os03g14140.2.2
GSIKCLDCSPDDVKAEDAFRGLQVGIMCNSGAGEAYETKMLSGLDENGGFSIPLAADLLRDDGELDKDCFAQLHSAPETPCA
GQTPPRIAKAGPGNDTIAAAAADAAPTYLAVSDDTLFSPVAC
>Pavir.Ib02730.2.1
GLAKCADCTRKNMKAEAAFNGLKVAVKCKSADGVFETKALGEVDKSGAFRVPLTADLLREDGELKQDCFAQLHSATNQPCP
GQEPSWIVRPSSDHDEKKKTFVAVAGKMHYSSKEC
>Pavir.Ia02159.2.2
GLAKCADCSRKNMNAEAAFNGLKVAVKCKNADGVFETKALGEVGKSGAFSVPLTADLLREDSELKQDCFAQLHSTTNQPCP
GQEPSWIVRPSSDDDKKKTFVAVAGKMHYSSKEC
>Si037005m.2.1
GLAKCADCTRKNMKAEAAFNGLKVAVKCKNADGMFETKALGEVDKSGAFSVPLAADLLREDGELKQDCFAQLHSATNQPC
PGQEPSWIVRPSRDDDEKKKTFVAVAGKMHYSSKEC
>Sb01g026190.2.1
GLAKCADCSRKNMKPEAVFNGLQVAVKCKNADGVFVTKALGEVDRTGAFSVPLAADLLREDGELKQDCFAQLHSAANQPC
PGQEPSWIVRSATSEYDDDKTKKTFVAVAGKVHYPSKEC
>Bradi3g21030.2.1
GLAKCADCTRKNMKAEAAFKGLKVAVKCKNAAGEYETKTVGDVDKSGAFSLPLGAELLHEDGELKQECFAQLHSAPGHPCP
GQEPSQIVRPSSTDAVDKKTFVAVAGKMHYSSKEC
>LOC_Os10g05750.2.2
GLAKCADCTRKNMKAEAVFKGVRVAIKCKNSNGEYETKATGEVGKSGAFAVPLAADLLGDDGELRQQCFAQLHSAASNQP
CPGQEPSWIVNAAADKKKTFVAVAGDTHFPSSEC
>Bradi1g68390.2.1
GLARCSECTRKNMNAEAAFKGLQVAVKCKNSKGEYESKAVGQVDKSGAFSVPLAADLVGEGGELKLDCFAQLRSASSAPC
PGQEPSRIISAQPPSHDGKMTFVALAGKVHRPSAEC
>Si037169m.2.1
GLAKCSDCARKNMNAEAAFKGLQVAVKCRNSNGEYESTAVGPVDKSGAFSVPLAADLVGDDGELKRECFAQLHSASSEPC
PGQEPSKIVAAPAVQGGGDKTFVALGGEVHRSSSEC
>Sb01g041230.2.1
GLAKCSDCARRNMNAEAAFKGLQVAVKCKNSKGEYESTAVGQVDKSGAFSVPLAADAVGEDGELKSECFAQLHSASSAPC
PGQEPSKIVAAPPGGHDGNEKTFVALGGKVHRSSPEC
>LOC_Os03g14130.2.1
GLAMCSGCTRKNMNAEAAFKGLQVAVKCKNSRGEYDKMAVGKVDKSGAFSVPLAADLVGEDGVLKQDCFARLHSASSAP
CPGQEPSMIVAAQQPGHDGAKTFVALAGKVHRPSAEC
>LOC_Os10g05820.2.2
GQAKCGECTRKNMKAQDAFKGLQVAIKCKNSDGVYESKAIGDLDGDGAFSVPLAADDLHGAADCFAQLHSAASSTPCPGQ
EPSKIVPLSSTTDNGVDKANTFVAVAGKRMYSSTSPAEC
>LOC_Os10g05860.2.2
GQAKCGECTRKNMKAQDAFKGLQVAIKCKNSDGVYESKAIGDLDGDGAFSVPLAADDLHGAADCFAQLHSAASSTPCPGQ
EPSKIVPLSSTTDNGVDKANTFVAVAGKRMYSSTSPAEC
>LOC_Os10g05880.2.2
GQAKCGECTRKNMMAQDAFKGLQVAIKCKNSDGEYESKAVGDLDGDGAFSVPLAADDLHGAADCFAQLHSATSSTPCPG
QEPSKIVPLSSTTDNGGDKANTFVVVAGKRMHSSTSPAEC
>LOC_Os10g05910.2.2
GLAKCGGCSRKNIKAQDAFKGLQVAIKCKNSDGEYESKAVGDLDGDGAFSVPLAADDLHGAAGCFAQLHSAASSAPCPGQ
EPSKIVPLPSTTDNGGNKANTFVAVAGKRMHYSSSAEC
>LOC_Os10g05930.2.2
GLAKCGGCSRKNMKAQDAFKGLQVAIKCRNGDGEYESKAVGDLDGDGAFSVPLAADDLHGAADCFAQLHSAESSTPCPG
QEPSKIVPLSSTTDNGGDKANTFVAVAGKRMRYSSSAEC

Page 221
Annexe

>Bradi3g21010.2.1
GMAQCVHCARKSMDAEATFKGLGVRIKCKNGNGEYESKAMGKLDSSGAFAVPLPADIDLRAAECFAQLHSASSSEPCPGQ
EPSKIVPLSEPDGTFVAMAGKTTELQSHSHHPGSEC
>LOC_Os10g05790.2.2
GAAKCAGCGRKNMDAETAFKGLKVAIKCKNGSSEEYESKAVGELDGAGAFAVPLAADLRGADCVAQLHSAATDAPCPGQE
PSKIEPLSSEGETGTFVAVAGKTHLPSSTSSSPEC
>LOC_Os10g05950.2.2
GLAKCGDCTRKNMKAKAAFKGLRVAIKCKNGADGEYETKAAGKLDGAGAFRVPLAADLRGADCVAQLHSAAHNNAACPGQ
EPSRVMQLSERTFVAVAGKTHYVSPVC
>LOC_Os10g05970.2.2
GTAKCADCTRKNMKAEDAFKNLQVAIKCKNGNGEYESKATGKLDGTGAFSVPLDADLHSSDCIAQLHSATNEPCPGQEPSKI
VPMSEGTFAAVAGKTHYRSALC
>LOC_Os10g05980.2.2
GTAKCADCTRKNMKAEDAFKNLQVAIKCKNGNGEYESKAAGKLDGSGAFSVPLDTDLHSSDCIAQLHSATNEPCPGQEPSK
IVPLSEGTFVTVAGKTSYPSALC
>LOC_Os10g05990.2.2
GTAKCADCTRKNMKAEDAFKNLQVAIKCKNTNGEYESKAAGKLDGTGAFSVPLDADLDSSDCIAQLHSANNEPCPGQEPSKI
VPMSEGTFVAIAGKTHYPSALC
>LOC_Os10g06000.2.2
GTAKCADCTRKNMKAEDAFKNLQVAIKCKNGNGEYESKATGKLDGTGVFSIPLDADLHSSDCVAQLHGATNEPCPGQEPSK
IVPMSEGTFIAVAGQTHYPSALC
>Bradi1g63370.2.2
GLAKCADCGRKNLKAEDAFKGLQVAIKCKNDDNGEYESKAVGELDSTGAFSIPLDTDLHSSDCFAQLHSEENTPCPGQAPS
KIMPLSKGDHDGDVHEKNTFVAVAGKTHYSLSTAC
>Bradi5g04630.2.1
GLAKCADCTRKNMKAEEAFKGLQVAIKCKNSKGEYESKAVGGLDGTGAFSVPLASDNAAADCVAQLHSAASNAPCPGQEP
SKVVPVSKGTFGIVTGAATAKTTTASDAAPEC
>Bradi3g21000.2.2
GLAKCADCTRNNMKAEQAFKGLHVAIKCKNSNDGEYESKAVGTLDGAGAFSVPLASDLHGADCLAQLHSTANGPCPGQEP
SKIVPLSKAGTFGVVAGKTHYPSVVC
>Bradi3g20970.2.2
GLAKCADCTRKNMKAEQAFKGLHVAIKCKNSKGEYESKAVGHLDGTGAFSVPLAADLHGADCLAQLHSAANNAPCPGQEP
SKIVPLSEDTFGVVGGKTQYPSAEC
>Bradi3g20980.2.2
GLAKCADCTRKNMKAEQAFKGVHVAIKCKNSNGDYESKAVGHLDGTGAFSVPLAADLHGADCLAQLHSTANNAPCPGQEP
SKIVPLSEGTFGFVAGKTHYPSAVC
>Sb01g026180.2.1
GLARCADCTRKNMKSEAAFKGLQVAIKCKNTNGEYETKAVSELQSTGAFSVPLAADLHGAECHAQLHSAANAPCPGQEPSR
IAPMSGGTFVAIPGKTHYNPSAEC
>Si037461m.2.1
GLARCADCTRKNMKAETAFKGLQVAIKCKDTNGEYETKAVSELQSSGAFSVPLAADLHGADCHAQLHSAANAPCPGQEPSR
IAPMSGGTFVAIPGKTHYPSAEC
>Pavir.Ia02160.2.2
GLARCADCTRYMKAETAFKGLQVAIKCKNSNGEYETRAISELQSSGTFSVPLAADLHGADCHAQLHSAANAPCPGQEPSKIA
PMSGGTFVAIPGKTHYPSAEC
>Pavir.Ia02662.2.1
GLAKCADCTRKNLKAEAAFKGLQVAIKCKNSKGDYESKAVGELDGSGAFNVPLTTDLHGADCFAQLHSAVGTPCPGQEPSR
IVPQSESHFVVVPGKTNNPSAEC
>Pavir.Ib02663.2.1
GLAKCADCTRKNLKAEAAFKGLQVAIKCKNSKGDYESKAVGELEGSGAFNVPLTTDLHGADCLAQLHSSAGTPCPGQEPSRI
VPQSESHFVVVPGKTNNPSAEC
>Si035412m.2.1
GLAKCADCTRRNMKAEAAFKGLQVAIKCKNSKGDYESKAVGQLDGSGAFSVPLTTDLHGADCLAQLHSAAGTPCPGQEPS
MIVPQSESDFVVVPGKTNNPSAEC
>Sb01g025970.2.1
GLAKCADCTRKNMKAEAAFKGLEVAIKCRNSKGEYESKAIGKLDVSGAFSIPLSTDMHAADCVAQLHSAAGTPCPGQEPSRI
VPQSSDGNFVVVPGKTDYPSAEC
>Sb01g026170.2.1
GLAKCADCTRKNVNAEAAFNGLKVAIKCKNSKGEYESKAVGELQSTGAFSVPVSVNLAGCVAQLHNAAGTPCPGQEPSRIT
PLSDGTFVAIPAGNTQQASSAVC
>Si037230m.2.1
GLAKCADCTRKNMKAEAAFKGLKVAIKCKEGNGEYTSKAVGELQSSGAFSVPVSVDLHGADCLAQLHSAAGTPCPGQEPS
RITPLANGSFVAIPAGNMQVQQPSAVC
>Pavir.Ia02660.1.1
GLAKCADCTRKNMKAEAAFKGLKVAIKCKNNNGEYMSKAVGELESSGAFNVPLSVDLHGAECFAQLHGASGTACPGQEPS
RITPLADGSFVAVPGNMHQPSAEC
>Pavir.Ib02884.2.1
GQAKCADCTRKNMKAEAAFKGLKVAIKCKNSNGEYMSKAVGELESSGAFNVPVSVDLHGAECFAQLHGAAGTPCPGQEPS
RITPLADGSFVAVPGNMQQPSAEC

Page 222
AUTHOR : Huan NGUYEN-KIM
TITLE : RESEARCH OF FUNCTION OF HYDROXYPROLINE-RICH PROTEINS IN PLANT
CELL WALLS
PhD SUPERVISORS : Dr. Elisabeth JAMET and Dr. Cécile ALBENNE

ABSTRACT

The plant primary cell wall is a dynamic envelope involved in development and in response to
environmental constraints. It is composed of networks of polysaccharides and proteins to which
multidomain proteins like LRX (Leucine-Rich repeat Extensin) and PAC (Proline-rich
Arabinogalactan Protein Cys-containing) domain proteins contribute. This work aimed at finding
partners of such proteins in cell walls using different experimental approaches. Proteomics analyses
have been performed on proteins extracted from cell walls of roots of wild type or lrx1 plants. They
have allowed the identification of 424/434 cell wall proteins of wild type/lrx1 roots respectively as
well as of 25 candidate proteins which could interact with LRX1 and/or play a role in root hair
morphogenesis. Besides, PAC domain proteins have been identified in all the studied terrestrial plants
using a bioinformatic approach. The appearance of PAC domain proteins could be associated to
terrestrialisation and has probably been contemporary with that of xyloglucans. A phylogenic analysis
has allowed to group PAC domain proteins in 10 clades, each of them containing a protein of
Amborella trichopoda, an ancestor of angiosperms. In addition to the 6 Cys residues which define the
PAC domain, conserved motifs have been identified in each clade. This finding opens the way to
functional studies. In vitro tests have shown that the tested PAC domains could interact with different
kinds of cell wall polysaccharides. Three types of specificity could be defined towards β(1,4)
galactans/RGI, mannans, xyloglucans and/or cellulose. These results have lead to propose a new
model of molecular interactions in plant cell walls including PAC domain proteins and
polysaccharides.

KEYWORDS: Arabidopsis thaliana, cell wall, glycoprotein, interactions proteins/polysaccharides,


LRX1, PAC domain protein, proteome, root, root hair.
TOPIC: Plant Science
NAME AND ADDRESS OF THE LABORATORY: Plant Science Research Laboratory (LRSV),
UMR 5546 UPS/CNRS, 24 chemin de Borde Rouge - Auzeville, BP 42617, 31326 Castanet-Tolosan
Cedex, France
AUTEUR : Huan NGUYEN-KIM
TITRE : RECHERCHE DE LA FONCTION DE PROTEINES RICHES EN HYDROXYPROLINE
DANS LES PAROIS VEGETALES
DIRECTEURS DE THESE : Dr. Elisabeth JAMET et Dr. Cécile ALBENNE
LIEU ET DATE DE SOUTENANCE : Auzeville, le 17 Juillet 2015

RESUME

La paroi primaire végétale est une enveloppe dynamique impliquée dans le développement ainsi
que la réponse aux contraintes environnementales. Elle est composée de réseaux de polysaccharides et
de protéines dans lesquels interviennent des protéines multidomaines de type LRX (Leucine-Rich
repeat Extensin) et des protéines à domaine PAC (Proline-rich Arabinogalactan Protein Cys-
containing). Ce travail de thèse a consisté à rechercher des partenaires d’interaction de ces protéines
dans les parois par différentes approches expérimentales. Des analyses protéomiques réalisées sur des
extraits de protéines pariétales de racines de plantes sauvages ou mutantes lrx1 d’A. thaliana ont
permis d’identifier 424/434 protéines pariétales de plantes sauvages/lrx1 respectivement et 25
protéines candidates susceptibles d’interagir avec LRX1 et pouvant jouer un rôle dans la
morphogenèse des poils absorbants. Par ailleurs, des protéines à domaine PAC ont été identifiées par
des approches bioinformatiques dans toutes les plantes terrestres étudiées. L’apparition des protéines à
domaine PAC dans la lignée verte a pu être associée à la terrestrialisation et est probablement
concomitante à l’apparition des xyloglucanes dans les parois végétales. Une analyse phylogénique a
permis de grouper les protéines à domaine PAC en 10 clades, chacun comportant une protéine
d’Amborella trichopoda, une plante ancêtre des angiospermes. Outre les 6 résidus Cys caractérisant le
domaine PAC, des motifs conservés ont été repérés dans les différents clades, ouvrant la voie pour des
études fonctionnelles. Des tests in vitro ont montré que les domaines PAC testés interagissent avec
différents types de polysaccharides pariétaux et permis de définir trois types de spécificité vis-à-vis de
polysaccharides tels que les β(1,4) galactanes/RGI, les mannanes, les xyloglucanes et/ou la cellulose.
Ces résultats ont conduit à proposer un nouveau modèle d’interactions supramoléculaires dans les
parois végétales faisant intervenir des protéines à domaine PAC et des polysaccharides pariétaux.

MOTS CLEFS : Arabidopsis thaliana, glycoprotéine, interactions protéines/polysaccharides, LRX1,


paroi, protéome, protéine à domaine PAC, poil absorbant, racine.

DISCIPLINE : Biosciences végétales

INTITULE ET ADRESSE DU LABORATOIRE : Laboratoire de Recherche en Sciences Végétales


(LRSV), UMR 5546 UPS/CNRS, 24 chemin de Borde Rouge - Auzeville, BP 42617, 31326 Castanet-
Tolosan Cedex, France

Vous aimerez peut-être aussi