Vous êtes sur la page 1sur 40

C h a p i t r e

Composition et structure des protines


Cristaux dinsuline humaine. Linsuline est une hormone protique essentielle pour le maintien du taux de glucose sanguin des niveaux appropris. (Ci-dessous) Une chane forme par une squence spcifique daminoacides (la structure primaire) dfinit une protine comme linsuline. Cette chane se reploie en une structure bien dfinie (la structure tertiaire), dans ce cas une seule molcule dinsuline. De telles structures peuvent sassembler avec dautres chanes pour former des rseaux tels que le complexe des six molcules dinsuline reprsent lextrme droite (la structure quaternaire). Il est souvent possible de conduire ces rseaux former des cristaux bien dfinis (photographie de gauche), ce qui permet une description dtaille de ces structures. [Photographie de Alfred Pasieka/Peter Arnold.]
N

Leu
Leu Tyr Gln Leu Glu Asn Tyr

Glu

C Structure primaire Structure secondaire Structure tertiaire Structure quaternaire

es protines sont les macromolcules doues des proprits les plus varies des systmes vivants o elles exercent des fonctions cruciales dans pratiquement tous les processus biologiques. Elles jouent le rle de catalyseurs, transportent et mettent en rserve dautres molcules telles que loxygne, apportent un support mcanique ou une protection immunitaire, crent le mouvement, transmettent les influx nerveux et contrlent la croissance et la diffrenciation. En fait, la plus grande partie de ce livre sera consacre la comprhension de ce que font les protines et sur la faon dont elles y parviennent. Plusieurs proprits cl permettent aux protines de participer un champ aussi tendu de fonctions. 1. Les protines sont des polymres linaires construits partir dunits monomriques appeles aminoacides qui sont lis lun la suite de lautre. En particulier, les protines se reploient spontanment en structures tridimensionnelles dtermines par la squence des aminoacides du polymre protique. La fonction des protines est directement dpendante de cette structure tridimensionnelle (Figure 2.1). Ainsi, les protines sont lincarnation de la transition dun monde de squences une dimension vers un monde de molcules trois dimensions capables dactivits diverses. 2. Les protines contiennent un large ventail de groupes fonctionnels. Parmi ces groupes fonctionnels, figurent des groupes alcool, thiol, thiother, acide carboxylique, carboxamide et toute une srie de groupes basiques. La plupart de ces groupes sont ractifs chimiquement. Combin dans des squences diverses, ce rseau de groupes fonctionnels explique le large spectre de fonctions des protines. Par

Plan
2.1 Les protines sont construites partir dun rpertoire de 20 aminoacides 2.2 Structure primaire : les aminoacides sont unis par des liaisons peptidiques pour former des chanes polypeptidiques 2.3 Structure secondaire : les chanes polypeptidiques peuvent se reployer en structures rgulires telles que lhlice alpha, le feuillet bta, les coudes et les boucles 2.4 Structure tertiaire : les protines hydrosolubles se reploient en des structures compactes prsentant des cores non polaires 2.5 Structure quaternaire : les chanes polypeptidiques peuvent sassembler en des structures multi-sous-unitaires 2.6 La squence des aminoacides dune protine dtermine sa structure tridimensionnelle

25

26
CHAPITRE 2 Composition et structure des protines

Figure 2.1 La structure dicte la fonction. Un composant protique de la machinerie de rplication du DNA entoure un segment de la double hlice de DNA reprsent comme un cylindre. La protine qui est forme de deux sous-units identiques (en rouge et jaune) se comporte comme un clamp qui permet de grands segments de DNA dtre copis sans que la machinerie de rplication se dissocie du DNA. [Dessin daprs 2POL.pdb.]

DNA

exemple, les proprits ractives des enzymes (protines qui catalysent de faon spcifique les ractions chimiques au sein des systmes biologiques) sont essentielles leur fonction, (voir Chapitres 8 10). 3. Les protines peuvent interagir avec dautres protines, ainsi quavec dautres macromolcules biologiques pour former des ensembles complexes. Au sein de ces derniers, elles peuvent agir de faon synergique pour gnrer des proprits nouvelles dont les protines individuelles peuvent tre dpourvues (Figure 2.2). Des exemples de ces ensembles comprennent les machines macromolculaires qui rpliquent le DNA, transmettent les signaux au sein des cellules et assurent un grand nombre dautres processus essentiels.
Figure 2.2 Assemblage complexe dune protine. Une micrographie lectronique dune coupe du muscle de vol dun insecte montre un rseau hexagonal de deux types de filaments protiques. [Autorisation du Dr Michael Reedy.]

4. Certaines protines sont trs rigides, tandis que dautres prsentent une flexibilit considrable. Les units rigides peuvent constituer les lments structuraux du cytosquelette (chafaudage interne des cellules) ou du tissu conjonctif. Les protines ayant une certaine flexibilit peuvent au contraire jouer le rle de charnires, de ressorts ou de leviers, essentiels la fonction des protines, lassemblage des protines avec dautres protines ou dautres molcules dans des units complexes, ou encore la transmission de linformation lintrieur des cellules ou entre ces dernires (Figure 2.3).

Fer

Figure 2.3 Flexibilit et fonction. Aprs fixation de fer, la protine lactoferrine subit un changement substantiel de conformation qui permet dautres molcules de faire la distinction entre les formes dpourvues de fer et les formes lies au fer. [Dessin daprs ILFM.pdp et ILFG.pdb.]

2.1 Les protines sont construites partir dun rpertoire de 20 aminoacides


Les aminoacides sont les units structurales de base des protines. Un -aminoacide est constitu dun atome de carbone central, appel carbone , li un groupe amine, un groupe acide carboxylique, un atome dhydrogne et un groupe R caractristique. Ce dernier est souvent appel chane latrale. Avec quatre groupes diffrents connects latome de carbone ttradrique, les -aminoacides sont des molcules chirales : elles peuvent exister sous lune ou lautre de deux formes, images lune de lautre dans un miroir, qui sont appeles isomre L et isomre D (Figure 2.4).
H R

27
2.1 Un rpertoire de 20 aminoacides

Notation pour distinguer les stro-isomres Les quatre substituants diffrents dun atome de carbone asymtrique sont affects dune priorit en fonction du numro atomique. Le substituant de plus faible priorit, souvent lhydrogne, est dirig loppos de lobservateur. La configuration autour du carbone est appele S (du latin sinister qui signifie gauche ) lorsque la progression de la priorit la plus forte vers la priorit la plus faible se fait dans le sens inverse des aiguilles dune montre. La configuration est appele R (du latin rectus qui signifie droite ) lorsque la progression se fait dans le sens des aiguilles dune montre.

C NH3+
Isomre L

C COO COO
Isomre D

NH3+

Figure 2.4 Les isomres L et D des aminoacides. La lettre R se rfre la chane latrale. Les isomres L et D sont les images lun de lautre dans un miroir.
R
(3)

Seuls les aminoacides L sont des constituants des protines. Pour presque tous les aminoacides, lisomre L possde la configuration absolue S (et non pas R) (Figure 2.5). En dpit defforts considrables pour comprendre pourquoi les aminoacides des protines prsentent une configuration L absolue, aucune explication satisfaisante na t donne. Il semble plausible que la slection de L par rapport celle de D ait t arbitraire, mais quune fois faite, la slection soit demeure constante trs tt dans lhistoire de lvolution. Les aminoacides en solution pH neutre se trouvent essentiellement sous forme dions dipolaires (appels aussi zwitterions). Dans la forme dipolaire dun aminoacide, le groupe amine est proton (NH3 ) et le groupe carboxyle dproton (COO ). Ltat dionisation dun aminoacide dpend du pH (Figure 2.6). En solution acide (par exemple, pH 1), le groupe amine est proton (NH3 ) et le groupe carboxyle nest pas dissoci (COOH). Lorsque le pH augmente, lacide

H (4)

(1)

(2)

NH3+

COO

H
+H N 3

R C COOH

H+
+H 3N

H C

R COO

H+

H C H2N

R COO

Figure 2.5 Seuls les aminoacides L sont rencontrs dans les protines. Presque tous les aminoacides L ont une configuration absolue S (du latin sinister qui signifie gauche ). La direction de la flche dans le sens inverse des aiguilles dune montre, depuis les substituants de plus haute priorit vers les substituants de plus faible priorit, indique que le centre chiral a la configuration S.

Zwitterion Concentration

Les deux groupes sont dprotons

Les deux groupes sont protons

10

12

14

pH

Figure 2.6 tat dionisation en fonction du pH. Ltat dionisation des aminoacides est modifi par un changement de pH. Le zwitterion prdomine aux alentours du pH physiologique.

28
CHAPITRE 2 Composition et structure des protines

carboxylique est le premier groupe donner un proton, tant donn que son pKa est voisin de 2. La forme dipolaire persiste jusqu ce que le pH sapproche de 9, zone dans laquelle le groupe amine proton perd un proton. Vingt types de chanes latrales, qui se diffrencient par leur dimension, leur forme, leur charge, leur capacit contracter des liaisons hydrogne, leur caractre hydrophobe et leur ractivit chimique, sont communment rencontres dans les protines. En fait, toutes les protines de toutes les espces de bactries, darchaebactries et deucaryotes, sont construites partir du mme groupe de 20 aminoacides avec seulement quelques exceptions. Cet alphabet fondamental pour la construction des protines date de plusieurs milliards dannes. Ltendue remarquable de fonctions, dans lesquelles les protines interviennent, rsulte de la diversit et de luniversalit de ces 20 types dlments fondamentaux. La comprhension de la faon dont cet alphabet est utilis pour crer les structures tridimensionnelles complexes qui permettent aux protines deffectuer tant de processus biologiques est un aspect excitant de la biochimie, et lun de ceux sur lesquels nous reviendrons dans la Section 2.6. Examinons le rpertoire daminoacides. Le plus simple est la glycine qui possde un seul atome dhydrogne comme chane latrale. Avec deux atomes dhydrogne lis latome de carbone , la glycine est le seul aminoacide ne pas tre chiral. Lalanine, le plus simple des aminoacides aprs la glycine, possde un groupe mthyle (CH3) comme chane latrale (Figure 2.7).

Glycine (Gly, G)

Alanine (Ala, A)

Figure 2.7 Structures de la glycine et de lalanine. (En haut) Les modles clats prsentent la disposition des atomes et des liaisons dans lespace. (Au milieu) Les formules strochimiques ralistes montrent la disposition gomtrique des liaisons autour des atomes (voir p. 21). (En bas) Dans un souci de simplicit, les projections de Fischer prsentent toutes les liaisons comme perpendiculaires (voir p. 22).

H
+H N 3

H C COO
+H N 3

H C

CH3 COO

H
+H N 3

CH3 COO
+H N 3

C H
Glycine (Gly, G)

C H
Alanine (Ala, A)

COO

Des chanes latrales hydrocarbones plus longues sont rencontres dans la valine, la leucine et lisoleucine (Figure 2.8). La mthionine prsente une chane latrale essentiellement aliphatique, mais qui inclut un groupe thiother (S). La chane latrale de lisoleucine contient un centre chiral supplmentaire. Seul lisomre reprsent dans la Figure 2.8 est rencontr dans les protines. Les chanes latrales aliphatiques les plus longues sont hydrophobes, cest--dire quelles tendent sagglomrer les unes avec les autres au contact de leau. Les structures tridimensionnelles des protines hydrosolubles sont stabilises par cette tendance des groupes hydrophobes venir au contact les uns des autres, appele effet hydrophobe (p. 9). Les dimensions et les formes diffrentes de ces chanes latrales hydrocarbones leur permettent de se rassembler pour former des structures compactes prsentant peu despaces vides. La proline possde, elle aussi, une chane latrale aliphatique, mais elle diffre des autres membres du groupe des 20 aminoacides par le

Valine (Val, V)

Leucine (Leu, L)

Isoleucine (Ile, I)

Mthionine (Met, M)

H3C CH3 H3C H


+

CH C

CH3

HC H
+H N 3

CH3

CH3 H2C H
+H N 3

S H2C H
+H

CH2 C COO

* CH3 C H C COO

CH2 C COO

H3N

COO

3N

CH3 CH3 CH3 H


+H N 3

CH3 CH3 H COO


+H 3N

S CH2 CH3 COO


+H 3N

H CH3 COO
+H 3N

C CH2 C H
Leucine (Leu, L)

CH2 C C H
Isoleucine (Ile, I)

C C H
Valine (Val, V)

CH2 C H
Mthionine (Met, M)

COO

Figure 2.8 Aminoacides possdant des chanes latrales aliphatiques. Le centre chiral supplmentaire de lisoleucine est indiqu par un astrisque.

fait que sa chane latrale est lie la fois latome dazote et latome de carbone Figure 2.9. La proline a une influence considrable dans larchitecture des protines parce que sa structure cyclique la rend plus limite, du point de vue conformation spatiale, que les autres aminoacides. Trois aminoacides possdant des chanes latrales aromatiques relativement simples font partie du rpertoire fondamental (Figure 2.10). La phnylalanine, comme son nom lindique, contient un cycle phnyle la place de lun des hydrognes de lalanine. Le cycle aromatique de la tyrosine contient un groupe hydroxyle. Ce dernier est ractif, contrairement aux chanes latrales plutt inertes des autres aminoacides prsents jusqu prsent. Le tryptophane possde un groupe indole uni un groupe mthylne (CH2) ; le groupe indole lui-mme est constitu de

H2 C H2C

CH2 C COO

H2 C H2C N+ H2 C H CH2 COO

N+ H2

Proline (Pro, P)

Figure 2.9 Structure cyclique de la proline. La chane latrale est unie la fois au carbone et au groupe amine.

29

30
CHAPITRE 2 Composition et structure des protines

Phnylalanine (Phe, F)

Tyrosine (Tyr, Y)

Tryptophane (Trp, W)

H H H H H
+H N 3

H H

H H HN H H C
+H N 3

H H

H H C CH2 COO H
+H N 3

H C

CH2 COO

CH2 COO

H C H C HC HC CH C C H +H N 3 CH2 C H
Phnylalanine (Phe, F) Tyrosine (Tyr, Y)

HO C HC COO

H C CH C C H +H N 3 CH2 C H COO

HC C HN C H C C

CH CH

CH2 C H
Tryptophane (Trp, W)

+H N 3

COO

Figure 2.10 Aminoacides possdant des chanes latrales aromatiques. La phnylalanine, la tyrosine et le tryptophane ont un caractre hydrophobe. La tyrosine et le tryptophane ont aussi des proprits hydrophiles dues leurs groupes OH et NH, respectivement.

deux cycles fusionns contenant un groupe NH. La phnylalanine est purement hydrophobe, tandis que la tyrosine et le tryptophane le sont moins en raison de leurs groupes hydroxyle ou NH. Cinq aminoacides sont polaires, mais non chargs. Deux aminoacides, la srine et la thronine, contiennent des groupes hydroxyle (OH) attachs une chane latrale aliphatique (Figure 2.11). La srine peut tre considre comme une version de lalanine avec un groupe hydroxyle attach, tandis que la thronine ressemble la valine avec un groupe hydroxyle la place de lun des groupes mthyle de la valine. Les groupes hydroxyle de la srine et de la thronine rendent ces aminoacides beaucoup plus hydrophiles (qui aiment leau) et ractifs que lalanine et la valine. La thronine, comme lisoleucine, contient un centre dasymtrie supplmentaire ; nouveau, un seul des isomres est prsent dans les protines. Le rpertoire comprend en outre lasparagine et la glutamine, des drivs non chargs des aminoacides acides aspartate et glutamate (voir Figure 2.15). Chacun de ces deux aminoacides contient une carboxamide terminale la place dun acide carboxylique de laspartate ou du glutamate (Figure 2.12). La chane latrale de la glutamine possde un groupe mthylne de plus que celle de lasparagine.

Srine (Ser, S)

Thronine (Thr, T)

Asparagine (Asn, N)

Glutamine (Gln, Q)

O H CH2 H C +H N COO 3 OH CH2


+H N 3

H O * CH3 H C H C +H N COO 3 OH H C C H
Thronine (Thr, T)
+H +

H2N NH2 O C H C H3N CH2 COO


+H

C H2C
H

CH2 C COO NH2

3N

CH3 COO O C CH2


3N

O C NH2 CH2 CH2 COO


+H

C H
Srine (Ser, S)

COO

+H N 3

C H

3N

C H

COO

Figure 2.11 Aminoacides possdant des groupes hydroxyle aliphatiques. La srine et la thronine contiennent des groupes hydroxyle qui les rendent hydrophiles. Le centre chiral supplmentaire de la thronine est indiqu par un astrisque.

Asparagine (Asn, N)

Glutamine (Gln, Q)

La cystine est structuralement semblable la srine, mais contient un groupe sulfhydryle ou thiol (SH) la place du groupe hydroxyle (OH) (Figure 2.13). Le groupe sulfhydryle est beaucoup plus ractif. Deux groupes sulfhydryle peuvent sunir pour former des liaisons disulfure, qui sont particulirement importantes pour stabiliser certaines protines, comme nous le verrons prochainement.

Figure 2.12 Structure de lasparagine et de la glutamine, aminoacides polaires contenant un carboxamide.

S H C CH2 COO
+H N 3

SH CH2 C H COO

+H N 3

Cystine (Cys, C)

Figure 2.13 Structure de la cystine.

Nous nous tournons maintenant vers les aminoacides possdant des charges compltes qui les rendent trs hydrophiles. La lysine et larginine ont des chanes relativement longues qui se terminent par des groupes chargs positivement pH neutre. La lysine est dote dun groupe amine primaire et larginine dun groupe guanidinium. Lhistidine contient un groupe imidazole, cycle aromatique qui peut tre, lui aussi, charg positivement (Figure 2.14). Avec une valeur de pKa proche de 6, le groupe imidazole peut tre non charg ou charg positivement au voisinage du pH neutre en fonction de son environnement local (Figure 2.15). Lhistidine est souvent rencontre dans les sites actifs des enzymes o son cycle imidazole peut facilement fixer ou librer des protons, au cours des ractions enzymatiques.

NH2
+

C H2N NH2

H C H N

N C C H

Guanidinium

Imidazole

31

32
CHAPITRE 2 Composition et structure des protines

Lysine (Lys, K)

Arginine (Arg, R)

Histidine (His, H)

H2N NH3+ H2C CH2 H2C H C


+H N 3

C HN

NH2 H C N CH2

H N C H

CH2 H2C

CH2 COO
+H N 3

H C
+

H C
+H N 3

COO NH2

COO

NH3+ CH2 CH2 CH2 CH2


+H N 3

H2N

C NH CH2 CH2 CH2 HC N COO


+H N 3

H N CH C CH2 C H
Histidine (His, H)

C H
Lysine (Lys, K)

COO

+H N 3

C H
Arginine (Arg, R)

COO

Figure 2.14 Aminoacides basiques lysine, arginine et histidine.

HC + H N

H N CH C H C CH2 C O
H
+

HC N

H N CH C H C N H C O CH2

H+

N H

Figure 2.15 Ionisation de lhistidine. Lhistidine peut capter ou librer des protons au voisinage du pH physiologique.

La catgorie des aminoacides trs hydrophiles en contient aussi deux ayant des chanes latrales acides : lacide aspartique et lacide glutamique (Figure 2.16). Ces aminoacides sont souvent appels aspartate et glutamate pour insister sur le fait quau pH physiologique leurs chanes latrales sont habituellement dpourvues du proton prsent dans la forme acide et sont donc ngativement charges. Nanmoins, dans certaines protines, ces chanes latrales acceptent des protons et cette capacit est souvent fonctionnellement importante. Sept des 20 aminoacides ont des chanes latrales facilement ionisables. Ces 7 aminoacides sont capables de donner ou daccepter des protons pour faciliter les ractions aussi bien que pour former des liaisons ioniques. Le Tableau 2.1 donne les quilibres et les valeurs du pKa pour lionisation des chanes latrales de la tyrosine, la cystine, larginine, la lysine, lhistidine, ainsi que des acides aspartique et glutamique dans les protines. Deux autres groupes des protines, le groupe -amine terminal et le groupe -carboxyle terminal, peuvent tre ioniss et les valeurs typiques de leur pKa sont, elles aussi, incluses dans le Tableau 2.1. Les aminoacides sont souvent dsigns par une abrviation trois lettres, ou par un symbole une lettre (Tableau 2.2). Les abrviations des aminoacides sont les trois premires lettres de leur nom, lexception de lasparagine (Asn), de la glutamine (Gln), de lisoleucine (Ile) et du tryptophane (Trp). Les symboles de nom-

TABLEAU 2.1 Valeurs typiques du pKa des groupes ionisables dans les protines
Groupe
Groupe -carboxyle terminal

33
pKa* typique

Acide
O C O O C O H N H H

Base
O C O C

2.1 Un rpertoire de 20 aminoacides

3,1

O 4,1

Acide aspartique Acide glutamique

O N

Histidine

6,0 N H N N H 8,0
Aspartate (Asp, D) Glutamate (Glu, E)

+ H

Groupe -amine terminal

H H H

H H

Cystine

S O
+ H

S H O

8,3

Tyrosine

10,9

Lysine

H H

H H H N

10,8

Arginine

H + N H H N C H N H

H N

C H N H

12,5
O

O C H2C CH2 C COO


+H

C H

* Les valeurs du pKa dpendent de la temprature, de la force ionique et du micro-environnement du groupe ionisable.
+H

H
3N

CH2 C

3N

COO O

breux aminoacides sont souvent la premire lettre de leur nom (par exemple G pour la glycine et L pour la leucine) ; les autres symboles ont t admis par convention. Ces abrviations et symboles font partie du vocabulaire courant des biochimistes. Comment ce rpertoire particulier daminoacides sest-il transform en units structurales de base des protines ? Tout dabord, bien que formant un groupe, les aminoacides sont trs divers ; leurs proprits structurales et chimiques sont trs varies, confrant ainsi aux protines luniversalit qui leur permet dassumer un grand nombre de rles fonctionnels. Deuximement, beaucoup de ces aminoacides ont eu vraisemblablement pour origine des ractions prbiotiques, cest--dire des ractions qui se sont passes avant lorigine de la vie. Enfin, les autres aminoacides potentiels ont pu, tout simplement, tre trop ractifs pour faire partie du
TABLEAU 3.2 Abrviations des aminoacides
Aminoacide
Alanine Arginine Asparagine Acide aspartique Cystine Glutamine Acide glutamique Glycine Histidine Isoleucine Leucine Lysine

O O

C CH2 CH2

C CH2

+H

3N

C H

COO

+H

3N

C H

COO

Aspartate (Asp, D)

Glutamate (Glu, E)

Figure 2.16 Aminoacides possdant des chanes latrales carboxylate.

Abrviation trois lettres


Ala Arg Asn Asp Cys Gln Glu Gly His Ile Leu Lys

Abrviation une lettre


A R N D C Q E G H I L K

Aminoacide

Abrviation trois lettres


Met Phe Pro Ser Thr Trp Tyr Val Asx Glx

Abrviation une lettre


M F P S T W Y V B Z

Mthionine Phnylalanine Proline Srine Thronine Tryptophane Tyrosine Valine Asparagine ou acide aspartique Glutamine ou acide glutamique

34
CHAPITRE 2 Composition et structure des protines

Figure 2.17 Ractivit indsirable des aminoacides. Certains aminoacides ne sont pas adapts aux protines en raison dune cyclisation indsirable. Lhomosrine peut se cycliser pour former un cycle stable cinq atomes susceptible de conduire un clivage de la liaison peptidique. La cyclisation de la srine conduirait la formation dun cycle tendu quatre atomes et donc non favorable. X peut tre un groupe amine dun aminoacide voisin ou un autre groupe potentiellement libre.

H C N H

H2 C C O

H2 C O X

H H N H

H2 C C C O

H2 C O + HX

Homosrine

H C N H

H H2 C O X C O N H

H C

H2 C O C O + HX

Srine

rpertoire. Par exemple, des aminoacides tels que lhomosrine et lhomocystine tendent donner des formes cycliques cinq atomes qui limitent leur utilisation dans les protines ; les aminoacides de structure alternative rencontrs dans les protines, la srine et la cystine, ne se cyclisent pas facilement, car leurs formes cycliques sont trop petites (Figure 2.17).

2.2 Structure primaire : les aminoacides sont unis par des liaisons peptidiques pour former des chanes polypeptidiques
Les protines sont des polymres linaires forms par union du groupe -carboxyle dun aminoacide au groupe -amine dun autre aminoacide. Ce type de liaison est appel liaison peptidique (mais aussi liaison amide). La formation dun dipeptide partir de deux aminoacides est accompagne de la perte dune molcule deau (Figure 2.18). Lquilibre de cette raction est trs en faveur de lhydrolyse et non pas de la synthse, dans la plupart des conditions. Par consquent, la biosynthse des liaisons peptidiques ncessite un apport dnergie libre. Nanmoins, les liaisons peptidiques sont trs stables cintiquement parce que leur vitesse dhydrolyse est extrmement lente ; leur dure de vie en solution aqueuse, en labsence de catalyseur, approche 1 000 ans.
R1 C O O +

+H N 3

+H N 3

H C

H C

R2 O C O
+H N 3

H C

R1 C O

H N C

O C H R2

O + H2O

Liaison peptidique

Figure 2.18 Formation de la liaison peptidique. La liaison de deux aminoacides est accompagne de la perte dune molcule deau.

Une chane polypeptidique est forme par de nombreux aminoacides unis par des liaisons peptidiques ; dans un polypeptide, chaque unit drive dun aminoacide est appele rsidu. Une chane polypeptidique a une polarit, parce que ses extrmits sont diffrentes, un groupe -amine est prsent une extrmit et un groupe -carboxyle lautre. Par convention, lextrmit amine est prise comme origine de la chane polypeptidique et la squence des aminoacides dune chane polypeptidique est alors crite partir du rsidu qui possde le groupe amine (rsidu N-terminal).

OH

35
2.2 Structure primaire
CH3 CH3

HC H2C
+H N 3

H C C O

H N C H H

O C N H

H H C C

H N C H O H2C

O H2C C N H

H C C O

Tyr Rsidu N-terminal

Gly

Gly

Phe

Leu Rsidu C-terminal

Figure 2.19 La squence des aminoacides a une direction. Ce schma du pentapeptide Tyr-Gly-Gly-Phe-Leu (YGGFL) montre sa squence de lextrmit N-terminale vers lextrmit C-terminale. Ce pentapeptide, la Leu-enkphaline, est un peptide opiode qui module la perception de la douleur. Le pentapeptide inverse, Leu-Phe-Gly-Gly-Tyr (LFGGY) est une molcule diffrente qui na pas un tel effet.

Ainsi, dans le pentapeptide Tyr-Gly-Gly-Phe-Leu (YGGFL), la tyrosine est le rsidu N-terminal et la leucine est le rsidu qui prsente le groupe carboxyle terminal (C-terminal) (Figure 2.19). Leu-Phe-Gly-Gly-Tyr (LFGGY) est un pentapeptide diffrent, ayant des proprits chimiques diffrentes. Une chane polypeptidique est constitue dune partie rptitive rgulire, appele chane principale ou squelette, et dune partie variable, comportant des chanes latrales spcifiques (Figure 2.20). Le squelette polypeptidique est riche en liaisons hydrogne potentielles. Chaque rsidu contient un groupe carbonyle (CO), qui est un bon accepteur de liaisons hydrogne et, lexception de la proline, un groupe NH, qui est un bon donneur de liaisons hydrogne. Ces groupes entrent en interaction lun avec lautre, ainsi quavec les groupes fonctionnels des chanes latrales pour stabiliser des structures particulires, comme il en sera discut Section 2.3. La plupart des chanes polypeptidiques naturelles contiennent entre 50 et 2 000 rsidus aminoacide et sont habituellement appeles protines. La plus grande protine connue est la protine musculaire titine, qui est constitue de plus de 27 000 aminoacides. Les peptides constitus dun plus petit nombre daminoacides sont appels oligopeptides, ou simplement peptides. Le poids molculaire moyen dun rsidu aminoacide est de 110 g mol 1 environ ; le poids molculaire de la plupart des protines est donc compris entre 5 500 et 220 000 g mol 1. Nous pouvons aussi nous rfrer la masse dune protine, qui est exprime en daltons ; un dalton est gal une unit de masse atomique. Une protine dun poids molculaire de 50 000 a une masse de 50 000 daltons, ou 50 kd (kilodaltons). Dans certaines protines, la chane polypeptidique linaire prsente des liaisons croises. Les plus habituelles sont les liaisons disulfure, formes par loxydation dun

Dalton Unit de masse identique la masse dun atome dhydrogne. Ainsi dnomme en rfrence John Dalton (1766-1844) qui a dvelopp la thorie atomique de la matire.

Kilodalton (kd) Unit de masse gale 1 000 daltons.

H C N H

R1 C O

H N C R2 H

O C N H

R3 C C O

H N C R4 H

O C N H

R5 C C O

Figure 2.20 Constituants dune chane polypeptidique. Une chane polypeptidique est constitue dun squelette constant (reprsent en noir) et de chanes latrales variables (reprsentes en vert).

36
CHAPITRE 2 Composition et structure des protines

O C C H2C H H S

H N

O C C H2C
Oxydation Rduction

H N H S + 2 H+ + 2 e S H CH2 C C O

Cystine

S H

H CH2

C N H C O

N H

Cystine

Cystine

Figure 2.21 Liaisons croises. La formation dune liaison disulfure partir de deux rsidus cystine est une raction doxydation.

couple de rsidus cystine (Figure 2.21). Le bloc form par la liaison de deux cystines est appel cystine. Les protines extracellulaires ont souvent plusieurs liaisons disulfure, tandis que les protines intracellulaires nen ont habituellement pas. Rarement, des liaisons croises autres que des liaisons disulfure et drives dautres chanes latrales sont prsentes dans les protines. Par exemple, les fibres de collagne du tissu conjonctif sont renforces par ces autres types de liaisons croises, de mme que la fibrine des caillots sanguins.

Les protines ont des squences spcifiques daminoacides dtermines par les gnes
En 1953, Frederick Sanger a dtermin la squence des aminoacides de linsuline, une hormone protique (Figure 2.22). Ce travail a t un vnement marquant de la biochimie, car il a montr pour la premire fois quune protine a une squence daminoacides parfaitement dfinie constitue uniquement daminoacides L unis par des liaisons peptidiques. Cette dcouverte a incit dautres scientifiques effectuer ltude de la squence de toute une srie de protines. lheure actuelle les squences compltes daminoacides de plus de 2 000 000 de protines sont connues. Le fait marquant est que chaque protine a une squence unique daminoacides, parfaitement dfinie. La squence des aminoacides dune protine est appele structure primaire.
Chane A 5

S
10

S
15 21

Gly-Ile-Val-Glu-Gln-Cys-Cys-Ala-Ser-Val-Cys-Ser-Leu-Tyr-Gln-Leu-Glu-Asn-Tyr-Cys-Asn S
Chane B 5

S S
10 15 20 25 30

Phe-Val-Asn-Gln-His-Leu-Cys-Gly-Ser-His-Leu-Val-Glu-Ala-Leu-Tyr-Leu-Val-Cys-Gly-Glu-Arg-Gly-Phe-Phe-Tyr-Thr-Pro-Lys-Ala

Figure 2.22 Squence daminoacides de linsuline bovine.

Une srie dtudes dcisives la fin des annes 1950 et au dbut des annes 1960 a rvl que la squence des aminoacides des protines tait dtermine par la squence nuclotidique des gnes. La squence des nuclotides du DNA dtermine la squence complmentaire des nuclotides du RNA qui son tour, dtermine la squence des aminoacides dune protine. En particulier, chacun des vingt aminoacides du rpertoire est cod par une ou plusieurs squences spcifiques de trois nuclotides (Section 5.5). Il est important de connatre la squence daminoacides dune protine pour plusieurs raisons. Tout dabord, la connaissance de la squence dune protine est

souvent essentielle pour lucider le mcanisme daction de cette dernire (par exemple, le mcanisme catalytique dun enzyme). En outre, des protines possdant de nouvelles proprits peuvent tre cres en modifiant la squence de protines connues. Deuximement, la squence daminoacides dtermine la structure tridimensionnelle des protines. La squence daminoacides reprsente le lien entre le message gntique du DNA et la structure tridimensionnelle des protines, qui leur confre une fonction biologique. Les analyses des relations entre la squence daminoacides et la structure tridimensionnelle des protines permettent de dcouvrir les rgles qui gouvernent le reploiement des chanes polypeptidiques. Troisimement, la dtermination de la squence fait partie des investigations de pathologie molculaire, domaine de la mdecine en croissance rapide. En effet, des modifications de la squence daminoacides peuvent conduire une fonction anormale de la protine et un tat pathologique. Des maladies graves, et parfois mortelles, telles que lanmie falciforme (ou drpanocytose p. 195) ou la mucoviscidose, peuvent rsulter du changement dun seul aminoacide dans une protine. Quatrimement, la squence dune protine rvle beaucoup dinformations permettant de retracer lhistoire de son volution (Chapitre 6). Les protines ne se ressemblent par la squence de leurs aminoacides, que lorsquelles ont un anctre commun. Par consquent, les vnements molculaires de lvolution peuvent tre retracs partir des squences des aminoacides. La palontologie molculaire est un domaine de recherche en expansion.

37
2.2 Structure primaire

Les chanes polypeptidiques sont flexibles bien que limites dans leur conformation
Lexamen de la gomtrie du squelette des protines rvle plusieurs caractres importants. Tout dabord, la liaison peptidique est essentiellement plane (Figure 2.23). Ainsi, pour un couple daminoacides unis par une liaison peptidique, six atomes se situent dans un mme plan : latome de carbone et le groupe CO du premier aminoacide, le groupe NH et le carbone du deuxime aminoacide. La nature de la liaison chimique au sein dun peptide rend compte du caractre plan de la liaison. La liaison peptidique a un important caractre de double liaison qui empche la rotation autour delle-mme et contraint ainsi la conformation du squelette du peptide.
H N C O C H N+ C O C

Structures rsonantes de la liaison peptidique

Ce caractre de double liaison sexprime aussi dans la longueur de la liaison entre les groupes CO et NH. La distance CN dans une liaison peptidique est typiquement 1,32 , ce qui se situe entre la valeur attendue pour une simple liaison

N C

Figure 2.23 Les liaisons peptidiques sont planes. Dans un couple daminoacides lis, six atomes (C , C, O, N, H et C ) sont dans un plan. Les chanes latrales sont reprsentes sous forme de boules vertes.

38
CHAPITRE 2 Composition et structure des protines
C
1,5 1
1,3 2

H
1,0

1,4

C
1,24

Figure 2.24 Longueurs typiques de liaison, au sein dune unit peptidique. Lunit peptidique est reprsente dans la configuration trans.

CN (1,49 ) et une double liaison CN (1,27 ), comme le montre la Figure 2.24. Finalement, la liaison peptidique nest pas charge, ce qui rend possible la formation de structures globulaires trs compactes par les polymres daminoacides lis par des liaisons peptidiques. Deux configurations sont possibles pour une liaison peptidique plane. Dans la configuration trans, les deux atomes de carbone sont situs sur des cts opposs de la liaison peptidique. Dans la configuration cis ces groupes sont du mme ct de la liaison peptidique. Presque toutes les liaisons peptidiques sont trans. Cette prfrence de trans sur cis peut tre explique par le fait que les chocs striques entre groupes attachs aux atomes de carbone qui gnent la formation de la forme cis, ne se produisent pas dans la configuration trans (Figure 2.25). Les liaisons peptidiques cis les plus communes sont de loin les liaisons XPro. De telles liaisons prsentent une prfrence rduite pour la configuration trans parce que lazote de la proline est li deux atomes de carbone ttradriques, ce qui limite les diffrences striques entre les formes trans et cis (Figure 2.26).

Trans

Cis

Figure 2.25 Liaisons peptidiques trans et cis. La forme trans est fortement favorise en raison de lencombrement strique qui apparat dans la forme cis.

Trans

Cis

Figure 2.26 Liaisons XPro trans et cis. Les nergies de ces formes sont similaires parce quun encombrement strique apparat dans les deux formes.

(A) H R C N H C O H N C H R O C N H H C C O R

(B)

(C)

39
2.2 Structure primaire

= 80

= +85

Figure 2.27 Rotation autour des liaisons dans un polypeptide. La structure de chaque aminoacide dun polypeptide peut tre ajuste par rotation autour de deux simples liaisons. (A) Phi ( ) est langle de rotation autour de la liaison entre latome dazote et latome de carbone , tandis que psi ( ) est langle de rotation autour de la liaison entre latome de carbone et latome de carbone du carbonyle. (B) Vue de haut en bas de la liaison entre latome dazote et latome de carbone , montrant comment est mesur. (C) Vue de haut en bas de la liaison entre latome de carbone et latome de carbone du carbonyle montrant comment est dtermin.

Contrastant avec la liaison peptidique les liaisons entre les groupes amine et latome de carbone et entre latome de carbone et le groupe carbonyle sont des liaisons simples typiques. Les deux units peptidiques rigides adjacentes peuvent tourner autour de ces liaisons et prendre diverses orientations. Cette libert de rotation de deux liaisons de chaque rsidu aminoacide permet aux protines de se reployer de nombreuses manires diffrentes. Les rotations selon ces liaisons peuvent tre dfinies par des angles de torsion (Figure 2.27). Langle de rotation autour de la liaison entre lazote et latome de carbone est appel phi ( ). Langle de rotation autour de la liaison entre le carbone et latome de carbone du carbonyle est appel psi ( ). Une rotation dans le sens horaire autour de lune ou lautre liaison, observe de latome dazote vers latome de carbone ou du groupe carbonyle vers latome de carbone correspond une valeur positive. Les angles et dterminent la configuration de la chane polypeptidique. Est-ce que toutes les combinaisons de et sont possibles ? Gopalasamudram Ramachandran a pu montrer que beaucoup de combinaisons sont interdites cause de collisions striques entre atomes. Les valeurs permises peuvent tre visualises sur un graphe bidimensionnel appel diagramme de Ramachandran (Figure 2.28). Les trois quarts des combinaisons possibles de et sont simplement exclues cause de chocs striques locaux. Les empchements striques, et le fait que deux atomes ne peuvent pas tre la mme place au mme moment peuvent reprsenter un principe puissant dorganisation.

Angle de torsion Mesure de la rotation autour dune liaison, allant habituellement de 180 180. Les angles de torsion sont parfois appels angles didres.

+180 120 60 0 60 120 180 180 120 60 120 +180

60

( = 90, = 90) Dfavoris

Figure 2.28 Diagramme de Ramachandran montrant les valeurs de et de . Toutes les valeurs de et de ne peuvent pas tre prises sans quil y ait des collisions entre les atomes. Les rgions les plus favorables sont reprsentes en vert fonc, les rgions limite sont reprsentes en vert clair. La structure de droite est dfavorable en raison dempchements striques.

40
CHAPITRE 2 Composition et structure des protines

La capacit des polymres biologiques comme les protines de se reployer (ou se replier) en structures bien dfinies est remarquable sur le plan thermodynamique. Un polymre non reploy prend la forme dune srie de boucles alatoires : chaque copie dun mme polymre non reploy aura une conformation diffrente. Lentropie favorable qui est associe un mlange de nombreuses conformations soppose au reploiement, et doit tre vaincue par des interactions favorisant la forme reploye. Ainsi des polymres hautement flexibles ayant un grand nombre de conformations possibles ne peuvent pas se reployer en une structure unique. En ralit, la rigidit de lunit peptidique, et lensemble restreint des angles et permis, limitent le nombre des structures possibles pour la forme dploye, et ceci suffisamment pour permettre au reploiement des protines de seffectuer.

2.3 Structure secondaire : les chanes polypeptidiques peuvent se reployer en structures rgulires telles que lhlice alpha, le feuillet bta, les coudes et les boucles
Une chane polypeptidique peut-elle se reployer en une structure rgulirement rptitive ? En 1951, Linus Pauling et Robert Corey ont propos deux structures priodiques appeles hlice (hlice alpha) et feuillet pliss (feuillet pliss bta). Par la suite, dautres structures telles que le coude et la boucle omga ( ) ont t identifies. Bien que non priodiques, ces structures courantes en coude ou en boucle sont bien dfinies et contribuent avec les hlices et les feuillets la formation de la structure finale de la protine. Les hlices , les brins , et les coudes sont forms par une configuration rgulire de liaisons hydrogne entre les groupes peptidiques NH et CO des rsidus daminoacides qui sont prs les uns des autres dans la squence linaire. De tels segments replis forment la structure secondaire.

Lhlice alpha est une structure enroule stabilise par des liaisons hydrogne intrachane
Dans leur valuation des structures potentielles, Pauling et Corey se sont demand quelles taient les conformations des peptides striquement permises, et quelles taient celles qui exploitaient le plus compltement la capacit des groupes NH et CO de la chane principale former des liaisons hydrogne. La premire des structures quils ont proposes, lhlice , est une structure en btonnet (Figure 2.29). La chane polypeptidique principale troitement enroule forme la partie interne du btonnet et les chanes latrales se disposent lextrieur en un arrangement hlicodal. Lhlice est stabilise par des liaisons hydrogne entre les groupes NH et CO de la chane principale. En particulier, le groupe CO de chaque aminoacide contracte une liaison hydrogne avec le groupe NH de laminoacide situ quatre rsidus plus en avant dans la squence (Figure 2.30). Ainsi, lexception des aminoacides proches des extrmits dune hlice , tous les groupes CO et NH de la chane principale sont unis par une liaison hydrogne. Chaque rsidu est dispos par rapport au suivant selon une lvation (aussi appele translation) de 1,5 le long de laxe de lhlice et une rotation de 100 degrs, ce qui donne 3,6 rsidus aminoacide par tour dhlice. Ainsi, les aminoacides distants de trois ou quatre rsidus dans la squence linaire sont spatialement trs proches lun de lautre dans une hlice . En revanche, les aminoacides distants de deux rsidus dans la squence linaire sont situs sur des cts opposs de lhlice et, ainsi, ne peuvent pas entrer en contact. Le pas de lhlice , produit de la translation (1,5 ) et du nombre de rsidus par tour (3,6), est de 5,4 . Le sens denroulement dune hlice peut tre droit (dans le sens des aiguilles dune montre) ou gauche (dans le sens inverse des aiguilles dune montre). Le diagramme de Ramachandran montre que les hlices droites et les hlices gauches figurent toutes deux parmi les conformations permises (Figure 2.31). Cependant, les hlices droites sont nergtiquement

Sens denroulement Dcrit la direction dans laquelle une structure hlicodale tourne par rapport son axe. Si, vue vers le bas suivant laxe de lhlice, la chane tourne dans le sens des aiguilles dune montre, elle a un sens denroulement droit. Si lenroulement se fait dans le sens inverse des aiguilles dune montre, le sens est gauche.

(A)

(B)

(C)

(D)

Figure 2.29 Structure de lhlice . (A) Reprsentation sous forme de ruban montrant les atomes de carbone et les chanes latrales (en vert). (B) Une vue latrale dun modle clat dcrit les liaisons hydrogne (lignes pointilles) entre les groupes NH et CO. (C) Une vue partir dune extrmit montre lenroulement du squelette, ainsi que la partie intrieure de lhlice et les chanes latrales (en vert) qui se projettent vers lextrieur. (D) Une vue dun modle compact dun segment de C montre la partie interne troitement compacte de lhlice.

plus favorables en raison dun encombrement strique moindre entre les chanes latrales et la chane principale. Presque toutes les hlices rencontres dans les protines sont droites. Dans les reprsentations schmatiques des protines, les hlices sont reprsentes par des rubans enrouls ou des btonnets (Figure 2.32). Pauling et Corey ont prdit la structure de lhlice six ans avant quelle ne soit observe grce aux rayons X dans la structure de la myoglobine. Llucidation de la structure de lhlice a t un vnement marquant de la biologie molculaire car elle a dmontr que la conformation dune chane polypeptidique pouvait tre prdite lorsque les proprits de ses constituants taient rigoureusement connues. La proportion des hlices dans les protines varie beaucoup, de zro presque 100 %. Par exemple, environ 75 % des rsidus de la ferritine, protine qui contribue

+180 120 60 0 60 120

Hlice gauche (trs rare) Hlice droite (habituelle)


0 60 120 +180

180 180 120 60

Ri C N H

H C

H N C H O Ri+1

O Ri+2 C N H C

H C

H N C H O Ri+3

O Ri+4 C N H C

H C

H N C H O Ri+5

O C

Figure 2.30 Schma des liaisons hydrogne dans une hlice . Dans lhlice , le groupe CO du rsidu i forme une liaison hydrogne avec le groupe NH du rsidu i 4.

Figure 2.31 Diagramme de Ramachandran pour les hlices. Les hlices droites et les hlices gauches se situent toutes deux dans des rgions de conformations permises dans le diagramme de Ramachandran. Cependant, pratiquement toutes les hlices des protines sont droites.

41

42
CHAPITRE 2 Composition et structure des protines

(A)

(B)

(C)

Figure 2.32 Reprsentations schmatiques des hlices . (A) Modle clat. (B) Reprsentation sous forme dun ruban. (C) Reprsentation sous forme dun cylindre.

mettre le fer en rserve, sont engags dans des hlices (Figure 2.33). peu prs 25 % de toutes les protines solubles sont composes dhlices connectes par des boucles et des coudes de la chane polypeptidique. Les hlices formes dun seul tenant ont gnralement moins de 45 de long. Un grand nombre de protines qui traversent les membranes biologiques contiennent, elles aussi, des hlices .
Figure 2.33 Une Protine essentiellement -hlicodale. La ferritine, protine de mise en rserve du fer, est construite partir dun faisceau dhlices . [Dessin daprs 1AEW.pdb.]

Les feuillets bta sont stabiliss par des liaisons hydrogne entre les brins polypeptidiques
Pauling et Corey ont propos un autre motif structural priodique quils ont appel feuillet pliss ( parce quil tait la seconde structure quils lucidaient, lhlice ayant t la premire). Le feuillet pliss (ou plus simplement le feuillet ) diffre notablement de lhlice qui a la forme dun btonnet. Il est compos de deux ou plusieurs chanes polypeptidiques appeles brins . Un brin , est presque totalement tir, et non pas troitement enroul comme une hlice . Toute une srie de structures tires sont striquement permises (Figure 2.34). La distance entre les aminoacides adjacents le long dun brin est approximativement de 3,5 , contrastant avec la distance de 1,5 dans une hlice . De plus, les chanes latrales des aminoacides adjacents pointent dans des directions opposes (Figure 2.35). Un feuillet pliss est constitu par lunion par des liaisons hydrogne de deux ou de plusieurs brins situs les uns ct des autres. Les chanes adjacentes dun feuillet peuvent tre de sens oppos (feuillet antiparallle) ou de mme sens (feuillet parallle). Dans larrangement anti-parallle, les groupes NH et CO de chaque aminoacide sont respectivement unis par des liaisons hydrogne aux groupes CO et NH dun partenaire de la chane adjacente (Figure 2.36). Dans larrangement parallle, la disposition des liaisons hydrogne est lgrement plus complique.

+180 120 60 0 60 120 180 180 120 60 120 +180

Brins bta

60

Figure 2.34 Diagramme de Ramachandran pour les brins . La zone rouge reprsente les conformations striquement permises des structures tires semblables au brin .

Figure 2.35 Structure dun brin . Les chanes latrales (en vert) sont situes alternativement au-dessus et au-dessous du plan du brin.

43
2.3 Structure secondaire

Figure 2.36 Un feuillet anti-parallle. Les brins adjacents sont orients dans des directions opposes. Des liaisons hydrogne entre les groupes NH et CO connectent chaque aminoacide un seul aminoacide dun brin adjacent, ce qui stabilise la structure.

Figure 2.37 Feuillet parallle. Les brins adjacents sont orients dans la mme direction. Des liaisons hydrogne connectent chaque aminoacide dun brin avec deux aminoacides diffrents du brin adjacent.

Pour chaque aminoacide, le groupe NH est li au groupe CO dun aminoacide du brin adjacent, tandis que le groupe CO est uni par liaison hydrogne au groupe NH de laminoacide situ deux rsidus plus loin dans la chane (Figure 2.37). De nombreux brins, habituellement 4 ou 5, mais parfois 10 ou mme davantage, peuvent sunir dans des feuillets . Ces derniers peuvent tre purement anti-parallles, purement parallles ou mixtes (Figure 2.38).

Figure 2.38 Structure dun feuillet

mixte.

(A)

(B)

(C)

Figure 2.39 Feuillet tordu. (A) Modle clat. (B) Modle schmatique. (C) La mme vue schmatique est montre aprs une rotation de 90 degrs pour illustrer cette torsion plus clairement.

Dans les reprsentations schmatiques, les brins sont habituellement reprsents par de larges flches pointant dans la direction de lextrmit C-terminale pour indiquer le type de feuillet form, parallle ou anti-parallle. Plus structuralement divers que les hlices , les feuillets peuvent tre presque plats, mais la plupart dentre eux adoptent une forme quelque peu tordue (Figure 2.39). Le feuillet est un lment structural important de nombreuses protines. Par exemple, les protines qui fixent les acides gras, importantes pour le mtabolisme lipidique, sont construites presque entirement de feuillets (Figure 2.40).

Les chanes polypeptidiques peuvent changer de direction en formant des coudes ou des boucles
La plupart des protines ont des formes compactes, globulaires, dues de frquents changements de direction de leurs chanes polypeptidiques. Un certain nombre de ces derniers sont effectus par un lment structural courant appel coude (connu aussi sous le nom de coude ou de coude en pingle cheveux) reprsent dans la Figure 2.41. Dans de nombreux coudes, le groupe CO dun rsidu i dun polypeptide est uni par liaison hydrogne au groupe NH du rsidu i 3. Cette interaction stabilise les changements abrupts de direction de la chane polypeptidique. Dans dautres cas, des structures plus labores sont responsables des changements de direction de la chane. Ces dernires sont appeles boucles ou parfois boucles (boucles omga) pour suggrer leur forme densemble. Contrairement aux hlices et aux feuillets , les boucles nont pas de structures rgulires priodiques. Nanmoins, les structures des boucles sont souvent rigides et bien dfinies (Figure 2.42). Les coudes et les boucles se situent invariablement la surface des protines et participent donc souvent aux interactions entre les protines et dautres molcules.

Figure 2.40 Protine riche en feuillets . Structure dune protine qui fixe les acides gras. [Dessin daprs 1FTP.pdb.]

i+1

i+2

i+3 i

Figure 2.41 Structure dun coude inverse. Le groupe CO du rsidu i de la chane polypeptidique est uni par liaison hydrogne au groupe NH du rsidu i 3 afin de stabiliser le coude.

Figure 2.42 Boucles la surface dune protine. Cette partie dune molcule danticorps a des boucles de surface (reprsentes en rouge) qui favorisent les interactions avec dautres molcules. [Dessin daprs 7FTP.pdb.]

44

Les protines fibreuses fournissent un support structural pour les cellules et les tissus
Des espces particulires dhlices sont prsentes dans deux protines l -kratine et le collagne. Ces protines forment de longues fibres qui jouent un rle structural. L -kratine, qui est le composant principal de la laine et des cheveux est constitue de deux hlices droites enroules lune autour de lautre pour former une espce de superhlice gauche appele hlice surenroule ou coiled coil . L -kratine est membre dune superfamille de protines appeles protines surenroules (Figure 2.43). Dans ces protines deux ou plusieurs hlices peuvent senrouler lune autour de lautre pour former une structure trs stable qui peut avoir une longueur de 1 000 (100 nm, ou 0,1 mm) ou plus. Il y a approximativement 60 membres de cette famille chez lhomme. Elle comprend les filaments intermdiaires, protines qui participent la structure du cytosquelette (un chafaudage interne de la cellule), et les protines du muscle myosine et tropomyosine (Section 34.2). Les membres de cette famille sont caractriss par une rgion centrale de 300 aminoacides qui contient des rptitions imparfaites dune squence de sept aminoacides appele rptition en heptade.

45
2.3 Structure secondaire

Figure 2.43 Une structure en hlice surenroule. (A) Modle compact. (B) Diagramme en ruban. Les deux hlices senroulent lune autour de lautre pour former une superhlice. De telles structures sont retrouves dans beaucoup de protines, par exemple les kratines des cheveux, des plumes, des griffes et des cornes. [Dessin daprs 1CIG.pdb.]

C Rsidu leucine (Leu)

Leu

Les deux hlices de l -kratine sont associes par des interactions faibles telles les forces de van der Waals et les interactions ioniques. Ces interactions sont facilites par le fait que le surenroulement gauche modifie les deux hlices droites de telle sorte quil y a 3,5 rsidus par tour au lieu de 3,6. Ainsi, la configuration des interactions des chanes latrales des aminoacides peut tre rpte tous les sept rsidus, formant ce quon appelle des rptitions en heptade. Deux hlices ayant de telles rptitions peuvent interagir lune avec lautre, si les rptitions sont complmentaires (Figure 2.44). Par exemple, les rsidus rpts peuvent tre hydrophobes, favorisant les interactions de van der Waals, ou bien possder des charges opposes, permettant des interactions ioniques. De plus, les deux hlices peuvent tre relies par des liaisons disulfure formes par des rsidus cystine voisins. La liaison des hlices est responsable des proprits physiques de la laine, un exemple d -kratine. La laine est extensible et peut tre tire jusqu presque deux fois sa longueur parce que les hlices stirent en rompant les interactions faibles entre hlices voisines. Cependant, les liaisons disulfure sont covalentes et rsistent sans se casser ; elles permettent un retour de la fibre vers son tat original une fois que ltirement est relch. Le nombre de liaisons disulfure inter-chanes dfinit plus compltement les proprits des fibres. Les cheveux et la laine qui ont peu de liaisons interchanes sont flexibles. Les cornes, griffes, et sabots ont plus de liaisons inter-chanes, et sont bien plus durs. Un type diffrent dhlice est prsent dans le collagne, la protine la plus abondante chez les mammifres. Le collagne est le composant fibreux majoritaire de la peau, des os, des tendons, du cartilage, et des dents. Cette protine extracellulaire est une molcule en forme de btonnet d peu prs 3 000 de long et de seulement 15 de diamtre. Elle contient trois chanes polypeptidiques hlicodales, chacune longue denviron 1 000 rsidus. Une glycine est prsente tous les trois rsidus de la

Leu

Leu

Leu

Leu

Leu

Leu

Figure 2.44 Rptitions en heptade dans une protine surenroule. Un rsidu sur sept (cest--dire chaque septime rsidu) de chaque hlice est une leucine. Les deux hlices sont maintenues ensemble par des interactions de van der Waals principalement entre rsidus leucine. [Dessin daprs 2ZTA.pdb.]

31 -Gly-Pro-Met-Gly-Pro-Ser-Gly-Pro-Arg22 -Gly-Leu-Hyp-Gly-Pro-Hyp-Gly-Ala-Hyp31 -Gly-Pro-Gln-Gly-Phe-Gln-Gly-Pro-Hyp40 -Gly-Glu-Hyp-Gly-Glu-Hyp-Gly-Ala-Ser49 -Gly-Pro-Met-Gly-Pro-Arg-Gly-Pro-Hyp58 -Gly-Pro-Hyp-Gly-Lys-Asn-Gly-Asp-Asp-

Figure 2.45 Squence daminoacides dune partie dune chane de collagne. Un rsidu sur trois est une glycine (cest--dire chaque troisime rsidu). La proline et lhydroxyproline sont galement abondantes.

squence daminoacides, et la squence glycine-proline-hydroxyproline se rpte frquemment (Figure 2.45). Lhydroxyproline est un driv de la proline qui porte un groupe hydroxyle la place de lun des hydrognes du cycle pyrrolidine. Lhlice de collagne a des proprits diffrentes des celle de lhlice . Il ny a pas de liaisons hydrogne au sein dune chane de collagne. Au contraire, lhlice de collagne est stabilise par rpulsion strique des cycles pyrrolidine des rsidus proline et hydroxyproline (Figure 2.46). Les cycles pyrrolidine sloignent les uns des autres quand la chane polypeptidique prend sa forme hlicodale, qui a environ trois rsidus par tour. Trois chanes senroulent ensemble pour former un cable superhlicodal qui est stabilis par des liaisons hydrogne entre les chanes. Les liaisons hydrogne se forment entre les groupes peptidiques des NH des rsidus glycine et CO des rsidus des autres chanes. Les groupes hydroxyle des rsidus hydroxyproline participent aussi la formation des liaisons hydrogne, et cest labsence des groupes hydroxyle qui est responsable des symptmes du scorbut (Section 27.5).

Pro Gly

Pro

Gly

Figure 2.46 Conformation dun seul brin dune triple hlice de collagne.

Pro

Pro

Lintrieur du cble hlicodal triple-brin est trs encombr, ce qui explique la ncessit de la prsence dune glycine chaque troisime position sur chaque brin (Figure 2.47A) car le seul rsidu qui peut tenir en position interne est la glycine. Le rsidu aminoacide de chaque ct de la glycine est situ lextrieur du cble, o il y a de la place pour les volumineux cycles des rsidus proline et hydroxyproline (Figure 2.47B).
(A) (B)

G G

Figure 2.47 Structure de la protine collagne. (A) Modle compact du collagne. Chaque brin est reprsent en une couleur diffrente. (B) Modle en section du collagne. Chaque brin est li aux deux autres brins par des ponts hydrogne. Latome de carbone dun rsidu glycine est repr par un G. Un rsidu sur trois doit tre une glycine parce quil ny a pas suffisamment de place dans le centre de lhlice.

2.4 Structure tertiaire : les protines hydrosolubles se reploient en des structures compactes prsentant des cores non polaires
Examinons maintenant comment sont groups les aminoacides dans une protine. Des tudes cristallographiques par diffraction des rayons X ou par rsonance magntique nuclaire (Section 3.6) ont rvl les structures tridimensionnelles
46

(A) Groupe hme Atome de fer

(B)

Groupe hme

47
2.4 Structure tertiaire

Figure 2.48 Structure tridimensionnelle de la myoglobine. (A) Un diagrammme en ruban montre que la protine est constitue principalement dhlices . (B) Un modle compact dans la mme orientation montre quel point la protine reploye est troitement empaquete. Remarquez que le groupement hme est nich dans une crevasse de la protine compacte avec seulement un ct expos. Une hlice est dessine en bleu pour permettre une comparaison des deux modles structuraux. [Dessin daprs 1A6N.pdb.]

dtailles de milliers de protines. Nous commencerons ici par une prsentation de la myoglobine, premire protine avoir t vue un niveau de rsolution atomique. La myoglobine, le transporteur doxygne du muscle, est une chane polypeptidique unique de 153 aminoacides (voir Chapitre 7). La capacit de la myoglobine fixer loxygne dpend de la prsence de lhme, groupement prosthtique (cest-dire auxiliaire) non polypeptidique, constitu dune protoporphyrine IX et dun atome de fer central. La myoglobine est une molcule extrmement compacte. Ses dimensions extrieures sont de 45 35 25 , soit un ordre de grandeur de moins que la longueur quaurait la molcule si elle tait totalement tire (Figure 2.48). Environ 70 % de la chane principale est reploye en hlices , et la plus grande partie du reste de la chane forme des coudes et des boucles entre les hlices. Le reploiement de la chane principale de la myoglobine, de mme que celui dautres protines, est complexe et dpourvu de symtrie. La structure densemble de la chane polypeptidique dune protine est considre comme sa structure tertiaire. Un principe unificateur ressort de la distribution des chanes latrales. Le fait marquant est que la partie interne est constitue presque entirement de rsidus non polaires, tels que la leucine, la valine, la mthionine et la phnylalanine (Figure 2.49). Les rsidus chargs, tels que laspartate, le glutamate, la lysine et

(A)

(B)

Figure 2.49 Distribution des aminoacides dans la myoglobine. (A) Modle compact de la myoglobine ; les aminoacides hydrophobes sont en jaune, les aminoacides chargs, sont en bleu et les autres en blanc. Remarquez que la surface de la molcule contient beaucoup daminoacides chargs, ainsi que quelques aminoacides hydrophobes (B). Remarquez sur cette vue en section que la plupart des aminoacides hydrophobes sont situs lintrieur de la structure, tandis que les aminoacides chargs sont la surface de la protine. [Dessin daprs 1MBD.pdb.]

48
CHAPITRE 2 Composition et structure des protines

larginine sont absents de la partie interne de la myoglobine. Les seuls rsidus polaires internes sont deux histidines qui jouent des rles critiques dans la liaison du fer et de loxygne. La priphrie de la myoglobine, au contraire, est constitue de rsidus polaires et de rsidus apolaires. Le modle compact montre aussi quil y a trs peu despace vide lintrieur. Cette distribution diffrente des rsidus polaires et non polaires rvle un aspect de larchitecture des protines. Dans un environnement aqueux, le reploiement protique est favoris par la forte tendance des rsidus hydrophobes ne pas tre en contact avec leau. Rappelez-vous quun systme est thermodynamiquement plus stable lorsque les groupes hydrophobes sont agglomrs que lorsquils sont au contact de lenvironnement aqueux. La chane polypeptidique se reploie donc de telle faon que ses chanes latrales hydrophobes sont enfouies et que ses chanes polaires charges sont la surface. De nombreuses hlices et brins sont amphipathiques, cest--dire que lhlice ou le brin ont une face hydrophobe qui soriente vers lintrieur de la protine et une face plus polaire qui fait face la solution. La destine de la chane principale accompagnant les chanes latrales hydrophobes est, elle aussi, importante. Un groupe peptidique NH ou CO non appari prfre nettement leau un milieu non polaire. Le secret de lenfouissement dun segment de chane principale dans un environnement hydrophobe est dapparier tous les groupes NH et CO par des liaisons hydrogne. Cet appariement est lgamment accompli par une hlice ou un feuillet . Les liaisons de van der Waals entre des chanes latrales hydrocarbones troitement associes contribuent galement la stabilit des protines. Nous pouvons maintenant comprendre pourquoi le rpertoire de 20 aminoacides contient autant daminoacides aliphatiques qui diffrent de faon subtile par leur taille et leur forme. Ils apportent une palette o peut tre choisie adroitement la faon de remplir la partie interne dune protine et, par ce moyen, de rendre maximales les interactions de van der Waals qui requirent un contact intime. Certaines protines, qui traversent les membranes biologiques, sont les exceptions qui confirment la rgle , parce quelles ont une distribution inverse des aminoacides hydrophobes ou hydrophiles. Considrons, par exemple les porines, protines rencontres dans les membranes externes de nombreuses bactries (Figure 2.50). Ces membranes sont constitues principalement de chanes alkane hydrophobes (Section 12.2). La priphrie des porines est donc largement pourvue

Canal hydrophile rempli deau

Extrieur principalement hydrophobe

Figure 2.50 Distribution inverse ( inside out ) des aminoacides dans la porine. La partie externe de la porine (qui entre en contact avec les groupes hydrophobes des membranes) est largement couverte de rsidus hydrophobes, tandis que le centre prsente un canal rempli deau bord daminoacides chargs ou polaires. [Dessin daprs 1PRN.pdb.]

de rsidus hydrophobes qui peuvent interagir avec les chanes alkane environnantes. En revanche, le centre de la protine contient de nombreux aminoacides chargs ou polaires dlimitant un canal rempli deau qui passe par le milieu de la protine. Donc, tant donn que les porines fonctionnent dans des environnements hydrophobes, elles sont inverses par rapport aux protines qui voluent en milieu aqueux. Certaines combinaisons de structures secondaires sont prsentes sur beaucoup de protines et remplissent souvent des fonctions similaires. Ces combinaisons sont appeles motifs ou structures supersecondaires. Par exemple, une hlice spare dune autre hlice par un coude est appele unit hlice-coude-hlice ; on la trouve sur beaucoup de protines qui se fixent sur le DNA (Figure 2.51). Certaines chanes polypeptidiques se reploient en deux rgions compactes, ou davantage, qui peuvent tre unies par un segment flexible de la chane polypeptidique, presque comme des perles sur un fil. Ces units globulaires compactes, appeles domaines, sont constitues denviron 30 400 rsidus aminoacide. Par exemple, la partie extracellulaire du CD4, protine de la surface cellulaire de certaines cellules du systme immunitaire auxquelles sattache le virus de limmunodficience humaine (VIH), est constitue de quatre domaines semblables dapproximativement 100 aminoacides chacun (Figure 2.52). Les protines peuvent avoir des domaines communs mme lorsque leurs structures densemble sont diffrentes.

Hlice-coude-hlice

Figure 2.51 Le motif hlice-coudehlice, un lment de structure supersecondaire. Les motifs hlice-coudehlice sont prsents dans beaucoup de protines se fixant au DNA. [Dessin daprs 1LMB.pdb.]

Figure 2.52 Domaines des protines. La protine de surface cellulaire CD4 est constitue de quatre domaines semblables. [Dessin daprs 1WIO.pdb.]

2.5 Structure quaternaire : les chanes polypeptidiques peuvent sassembler en des structures multi-sous-unitaires
Quatre niveaux de structure sont frquemment cits dans les discussions sur larchitecture des protines. Jusqu prsent, nous nen avons considr que trois. La structure primaire est la squence des aminoacides. La structure secondaire a trait aux relations dans lespace des rsidus aminoacide proches les uns des autres dans la squence. Certains de ces arrangements sont rguliers et donnent naissance une structure priodique. Lhlice et le feuillet sont des lments de structure secondaire. La structure tertiaire se rfre aux relations dans lespace des rsidus aminoacide loigns dans la squence, ainsi qu la distribution des liaisons disulfure. Nous considrons maintenant les protines qui contiennent plus dune chane polypeptidique. Ces protines montrent un quatrime niveau dorganisation structurale. Chaque chane polypeptidique dune telle protine est appele sous-unit. La structure quaternaire se rapporte la disposition spatiale de chaque sous-unit et la nature des contacts entre ces dernires. Le type le plus simple de structure quaternaire est un dimre constitu de deux sous-units identiques. Cette organisation est prsente dans la protine Cro qui se fixe au DNA, rencontre dans un virus des bactries appel (Figure 2.53). Des structures quaternaires plus compliques sont, elles aussi, habituelles. Par exemple, lhmoglobine humaine, protine du sang qui transporte loxygne, est Figure 2.53. Une structure quaternaire. La protine Cro constitue de deux sous-units dun certain type (dsignes ) du bactriophage est un dimre de sous-units identiques. [Dessin daprs 5CRO.pdb.] et de deux sous-units dun autre type (dsignes ), comme 49

Figure 2.54 Le ttramre 2 2 de lhmoglobine humaine. La structure des deux sous-units identiques (rouge) est similaire mais pas identique celle des deux sous-units identiques (jaune). La molcule contient quatre groupements hme (en gris avec latome de fer en violet). (A) Le diagramme en ruban permet de souligner la similarit des sous-units et de montrer quelles sont composes principalement dhlices . (B) Le model compact illustre la manire selon laquelle les groupements hme occupent des crevasses dans la protine. [Dessin daprs 1A3N.pdb.]

(A)

(B)

reprsent dans la Figure 2.54. La molcule dhmoglobine se prsente donc comme un ttramre 2 2. De subtils changements dans la disposition relative des sous-units au sein dune molcule dhmoglobine permettent cette dernire de transporter loxygne des poumons vers les tissus avec une grande efficacit (Chapitre 7). Les virus tirent le maximum dune quantit limite dinformation gntique en formant des capsides qui utilisent le mme type de sous-units disposes de faon rptitive en un rseau symtrique. La capside du rhinovirus, virus qui provoque le rhume banal, comprend 60 copies de chacune des quatre sous-units diffrentes (Figure 2.55). Les sous-units sagglomrent pour former une coque presque sphrique qui englobe le gnome viral.

Figure 2.55 Une structure quaternaire complexe. La capside du rhinovirus humain, lagent du rhume, contient 60 copies de chacune des quatre sous-units (reprsentes en diffrentes couleurs).

2.6 La squence des aminoacides dune protine dtermine sa structure tridimensionnelle


Comment la structure tridimensionnelle labore des protines est-elle produite ? Le travail classique de Christian Anfinsen dans les annes 1950 sur lenzyme ribonuclase a rvl la relation existant entre la squence des aminoacides dune protine et sa conformation. La ribonuclase est une chane polypeptidique unique constitue de 124 rsidus aminoacide o apparaissent quatre liaisons disulfure (Figure 2.56). Lide dAnfinsen tait de dtruire la structure tridimensionnelle de lenzyme, puis de dterminer quelles taient les conditions ncessaires la restauration de cette structure. Des agents tels que lure ou le chlorure de guanidine rompent efficacement les liaisons non covalentes dune protine, bien que le mcanisme daction de ces agents ne soit pas totalement lucid. Les liaisons disulfure peuvent tre clives rversiblement par rduction par un ractif tel que le -mercaptothanol (Figure 2.57). En prsence dun large excs de -mercaptothanol, les disulfures (les cystines) sont totalement transforms en sulfhydryles (cystines). En labsence dinteractions croises, la plupart des chanes polypeptidiques prennent habituellement dans lure 8 M ou le chlorure de guanidine 6 M, une conforma10

O C H2N
Ure

NH2 NH2 H2N H2 C H S


+

C NH2

Cl

Chlorure de guanidine

HO C H2

-Mercaptothanol

E R Q HM A K F D A A S 1 E T 20 S K + T H3N S S S A A S N 80 30 Y S M T S Y S Q Y K MMQ NC D T I C S C N C 70 T R R S G K A T E S N Q N 120 90 V G L K S A D F H V P V N Y P N G T Y 124 V K E O C K P 110 C SQ D N 60 A C R C A O V V I C Y K 100 A H I 40 K T T Q A N K Q P V V N A D T F V H E S L


50

Figure 2.56 Squence des aminoacides de la ribonuclase bovine. Les quatre liaisons disulfure sont reprsentes en couleur. [Daprs C.H.W. Hirs, S. Moore et W.H. Stein. J. Biol. Chem. 235 (1960) : 633-647.]

50

Excs H S Protine S H O C H2 H2 C S S H2 C C H2 O H Protine S H O C H2 H2 C S H H S

51
2.6 Squence et structure

Figure 2.57 Rle du -mercaptothanol dans la rduction des liaisons disulfure. Remarquez que, lorsque les disulfures sont rduits, le -mercaptothanol est oxyd et forme des dimres.

tion enroule au hasard. Lorsque la ribonuclase est traite par le -mercaptothanol dans lure 8 M, le produit est une chane polypeptidique totalement rduite, enroule au hasard, dpourvue dactivit enzymatique. Quand une protine est convertie en un peptide enroul au hasard dnu dactivit normale, on dit quelle est dnature (Figure 2.58). Anfinsen a ensuite fait lobservation fondamentale que la ribonuclase dnature, une fois libre de lure et du -mercaptothanol par dialyse, rcupre lentement une activit enzymatique. Il a immdiatement peru la signification de cette constatation faite par hasard. Les groupes sulfhydryle de lenzyme dnatur sont roxyds par lair et lenzyme se reploie spontanment en une forme catalytiquement active. Des tudes dtailles ont montr que la presque totalit de lactivit enzymatique de dpart est rcupre lorsque les groupes sulfhydryle sont oxyds dans des conditions convenables. Toutes les proprits physiques et chimiques mesures de lenzyme reploy in vitro sont pratiquement identiques celles de lenzyme natif. Ces expriences ont montr que linformation ncessaire la dtermination de la structure tridimensionnelle complte de la ribonuclase est contenue dans la squence de ses aminoacides. Les tudes ultrieures dautres protines ont tabli la gnralit de ce principe fondamental de la biochimie : la squence dtermine la conformation. La relation de dpendance de la conformation la squence est particulirement significative en raison de lintime rapport entre conformation et fonction. Un rsultat trs diffrent a t obtenu lorsque la ribonuclase rduite tait roxyde alors quelle tait encore en prsence dure 8 M et que la prparation tait ensuite dialyse pour liminer lure. La ribonuclase roxyde de cette faon navait que 1 % de lactivit enzymatique de la protine native. Pourquoi le rsultat de cette exprience tait-il si diffrent lorsque la ribonuclase rduite tait roxyde en prsence ou en absence dure ? La raison en est que de mauvais appariements par liaisons disulfure se constituent en prsence dure. Il y a 105 faons diffrentes dapparier huit cystines pour former quatre liaisons disulfure ; une seule de ces combinaisons est enzymatiquement active. Les 104 mauvais appariements ont t appels, dun terme pittoresque, ribonuclase brouille . Anfinsen a ensuite montr que la ribonuclase brouille se convertissait spontanment en ribonuclase native, totalement active, lorsque des traces de -mercaptothanol

95 1 26 84 95 40 Ribonuclase native 110 58 124 72 65 Ure 8 M et -mercaptothanol 110

SH SH HS

HS

58

40

HS
65

84 HS

HS
72

HS
26

Ribonuclase rduite dnature

Figure 2.58 Rduction et dnaturation de la ribonuclase.

26 40 58 1 65 95 84 Ribonuclase brouille 124 110

72

Traces de -mercaptothanol

taient ajoutes la solution aqueuse de la protine (Figure 2.59). Le -mercaptothanol ajout catalysait le rarrangement des appariements par liaisons disulfure jusqu ce que la structure native ait t reconstitue, ce qui prend environ 10 heures. Ce processus est uniquement favoris par la diminution dnergie libre qui rsulte de la conversion des conformations brouilles en conformation native, stable, de lenzyme. Ainsi, les appariements par liaison disulfure natifs de la ribonuclase contribuent la stabilisation de la structure thermodynamiquement prfrentielle. Des expriences de reploiement similaires ont t ralises avec beaucoup dautres protines. Dans de nombreux cas, la structure native peut tre rgnre dans des conditions favorables. Cependant, pour dautres protines, le reploiement ne seffectue pas de faon efficace. Dans ces cas, les molcules de protines dployes semmlent les unes avec les autres pour former des agrgats. Au sein des cellules, des protines appeles chaperons bloquent ces interactions illicites .

Les aminoacides ont des propensions diffrentes former des hlices alpha, des feuillets bta ou des coudes bta
1 26 84 95 40 Ribonuclase native 110 58 72 65

Figure 2.59 Rtablissement de lappariement correct par liaisons disulfure. La ribonuclase native peut se reformer partir de la ribonuclase brouille en prsence dune trace de -mercaptothanol.

Comment la squence des aminoacides dune protine dtermine-t-elle la structure tridimensionnelle de cette dernire ? Comment une chane polypeptidique dploye acquiert-elle la forme de la protine native ? Ces questions fondamentales en biochimie peuvent tre approches en posant tout dabord une question plus simple : quest-ce qui dtermine une squence particulire dune protine former une hlice , un brin ou un coude ? Une source dindications peut tre lexamen de la frquence dapparition de rsidus aminoacide particuliers dans ces structures secondaires (Tableau 2.3). Des rsidus tels que lalanine, le glutamate et la leucine on tendance tre prsents dans les hlices , tandis que la valine et lisoleucine tendent tre prsentes dans les brins . La glycine, larginine et la proline ont une propension se situer dans les coudes. Les tudes portant sur des protines ou des peptides synthtiques ont rvl certaines raisons de ces prfrences. Lhlice peut tre considre comme la conformation par dfaut. Un branchement au niveau de latome de carbone , comme dans la valine, la thronine et lisoleucine, tend dstabiliser les hlices en raison de conflits striques. Ces rsidus sont facilement accepts dans les brins o leurs chanes latrales se projettent hors du plan contenant la chane
TABLEAU 2.3 Frquences relatives des rsidus aminoacide dans les structures secondaires
Aminoacide
Glu Ala Leu Met Gln Lys Arg His Val Ile Tyr Cys Trp Phe Thr Gly Asn Pro Ser Asp

Hlice
1,59 1,41 1,34 1,30 1,27 1,23 1,21 1,05 0,90 1,09 0,74 0,66 1,02 1,16 0,76 0,43 0,76 0,34 0,57 0,99

Feuillet
0,52 0,72 1,22 1,14 0,98 0,69 0,84 0,80 1,87 1,67 1,45 1,40 1,35 1,33 1,17 0,58 0,48 0,31 0,96 0,39

Coude
1,01 0,82 0,57 0,52 0,84 1,07 0,90 0,81 0,41 0,47 0,76 0,54 0,65 0,59 0,96 1,77 1,34 1,32 1,22 1,24
(second

REMARQUE : Les aminoacides sont groups selon leur prfrence pour les hlices groupe) ou les coudes (troisime groupe).

(groupe du haut), les feuillets

Daprs T.E. Creighton, Proteins : Structures and Molecular Properties, 2d ed. (W.H. Freeman and Company, 1992), p. 256.

52

53 principale. La srine, laspartate et lasparagine tendent rompre les hlices , car 2.6 Squence et structure leurs chanes latrales contiennent des donneurs ou des accepteurs de liaisons hydrogne proches de la chane principale et ils entrent en comptition avec les groupes NH et CO de la chane principale. La proline tend rompre les hlices autant que les brins car elle na pas de groupe NH et sa structure cyclique limite la valeur de environ 60 degrs. La glycine sinsre facilement dans toutes les structures et, pour cette raison, elle ne favorise pas la formation dune hlice en particulier. Peut-on prvoir la structure secondaire des protines en utilisant cette connaissance des prfrences de conformation spatiale des rsidus aminoacide ? Les prvisions de la structure secondaire adopte par un segment de 6 rsidus, ou moins, se sont montres exactes dans 60 70 % environ des cas. Quest-ce qui soppose une prdiction plus prcise ? Remarquez que les prfrences de conformation spatiale des rsidus aminoacide ne permettent pas la prdiction dune structure unique (voir Tableau 2.3). Par exemple, le glutamate, lun des plus puissants formateurs dhlice, ne prfre lhlice au brin que dun facteur 2 seulement. Les rapports de prfrence de la plupart des autres rsidus sont plus faibles. En fait, on a montr que certaines squences de pentapeptides ou dhexapeptides adoptent une certaine structure dans une protine et une structure entirement diffrente dans une autre (Figure 2.60). Ainsi, des squences donnes daminoacides ne dterminent pas une structure secondaire de faon univoque. Des interactions tertiaires, cest--dire des interactions entre rsidus loigns dans la squence, peuvent tre dcisives pour dterminer la structure secondaire de certains segments. Le contexte est souvent essenFigure 2.60. Conformations alternatives dune squence tiel pour dterminer le devenir conformationnel. La conforpeptidique. De nombreuses squences peuvent adopter mation des protines a volu pour quelles puissent fonctionner des conformations diffrentes dans des protines diffrentes. dans un environnement ou un contexte particulier. Des amIci la squence VDLLKN reprsente en rouge prend la forme liorations substantielles dans la prdiction des structures dune hlice dans un certain contexte protique ( gauche) secondaires peuvent tre obtenues en tudiant des familles de et celle dun brin dans un autre ( droite). squences apparentes qui adoptent toutes des structures [Dessin daprs 3WRP.pdb ( gauche) et 2HLA.pdb ( droite).] semblables.

Le mauvais reploiement des protines et leur agrgation sont associs a certaines maladies neurologiques
Jusqu une priode rcente, on croyait que toutes les maladies infectieuses taient transmises par des microbes ou des virus. Une des grandes surprises de la mdecine moderne fut la reconnaissance de la transmission de certaines maladies infectieuses neurologiques par des agents dont la taille est de lordre de celle des virus, mais qui sont constitus uniquement de protines. Ces maladies comprennent lencphalopathie spongiforme bovine (appele communment maladie de la vache folle) et des maladies analogues des autres espces animales, y compris la maladie de Creutzfeldt-Jakob (CJD) chez lhomme, et la scrapie chez le mouton. Les agents causant ces maladies sont appels prions. Stanley Prusiner, personnalit scientifique ayant jou un rle de leader en proposant lhypothse que des maladies pouvaient tre transmises par des protines seules, a reu le Prix Nobel de physiologie et de mdecine en 1997. Ltude de ces agents infectieux rvla les caractristiques suivantes : 1. Lagent transmissible consiste en des formes agrges dune protine spcifique. Ces agrgats ont tout un ventail de poids molculaires. 2. Ces agrgats de protines sont rsistants aux traitements par des agents qui dgradent la plupart des protines. 3. La protine est en majeure partie ou totalement drive dune protine cellulaire normale, appele PrP, qui est prsente dans le cerveau.

54
CHAPITRE 2 Composition et structure des protines

En quoi la structure de la forme agrge de la protine diffre-t-elle de celle de la protine dans son tat normal dans le cerveau ? La structure de la protine cellulaire normale PrP contient de grandes rgions dhlices et relativement peu de structures en feuillets . La structure de la forme de la protine prsente dans les cerveaux infects, appeles PrPsc, na pas encore t dtermine cause dobstacles dus son insolubilit et sa nature htrogne. Cependant, un ensemble de raisons indiquent que certaines rgions de la protine qui formaient des hlices ou des coudes ont t converties en conformations de type feuillet . Les feuillets dune protine sassocient souvent ceux dune autre protine pour former des empilements de feuillets des deux protines, pouvant aboutir la formation dagrgats. Ces agrgats protiques fibreux sont souvent dsigns comme formes amylodes. La dcouverte, que lagent infectieux des maladies prion, est une forme agrge dune protine dj prsente dans le cerveau, a suggr un modle pour expliquer la transmission de la maladie (Figure 2.61). Les agrgats de protines construits partir de formes anormales de PrP agissent comme des centres de nuclation sur lesquels dautres molcules PrP sattachent. Les maladies prion peuvent ainsi se transmettre dun individu un autre par le transfert dun de ces centres de nuclation. Cest probablement ce qui sest pass lors de lpidmie de maladie de vache folle dans le Royaume Uni dans les annes 1990. Le btail nourri avec de la nourriture animale contenant des produits drivs de bovins malades, devint malade son tour.
Noyau de PrPSC

Figure 2.61 Le modle protine-seule de transmission des maladies prion. Un noyau constitu de protines de configuration anormale est agrandi par addition de protines provenant du pool de protines normales.

Pool de PrP normales

Des fibres amylodes sont aussi prsentes dans le cerveau de patients atteints de certaines maladies neurodgnratives non infectieuses telles que les maladies dAlzheimer ou de Parkinson. Par exemple les cerveaux de patients atteints de maladie dAlzheimer contiennent des agrgats de protines appels plaques amylodes constitus presque uniquement dun polypeptide appel A . Ce polypeptide est driv dune protine cellulaire, la protine prcurseur de lamylode ou APP, aprs action de protases spcifiques. Le polypeptide A a tendance former des agrgats insolubles. En dpit des difficults poses par linsolubilit de la protine, un modle structural dtaill de A a t construit grce lutilisation de techniques de RMN (rsonance magntique nuclaire) qui peuvent tre appliques sur des solides plutt que sur des produits en solution. Comme on sy attendait la structure est riche en feuillets qui sassemblent pour former une vaste structure de feuillets parallles empils (Figure 2.62).
Figure 2.62 Une structure de fibres amylodes. Un modle dtaill des fibrilles A dduit dtudes de RMN ltat solide, montre que lagrgation des protines est d la formation de grandes zones de feuillets parallles. [Daprs A. T. Petkova, Y. Ishii, J. J. Balbach, O. N. Antzukin, R. D. Leapman, F. Delagio, and R. Tycko, Proc, Natl. Acad. Sci. U.S.A. 99 (2002) : 1674216747.]

Ax

ed

es

fib rill e

Le reploiement des protines est un processus hautement coopratif

Comme il a t mentionn prcdemment, les protines peuvent tre dnatures par la chaleur ou par des dnaturants chimiques, tels que lure ou le chlorure de guani0 dine. Dans de nombreuses protines, une comparaison du degr de dploiement en [Dnaturant] fonction de laugmentation de la concentration du dnaturant rvle une transition Figure 2.63. Transition dun tat reploy relativement rapide de la forme reploye, ou native, vers la forme dploye ou dna un tat dploy. La plupart ture, ce qui suggre que seuls ces deux tats conformationnels sont prsents un des protines montrent une transition taux significatif (Figure 2.63). De mme, une transition rapide est observe lorsrapide de la forme reploye vers la forme quon limine les dnaturants des protines dployes ce qui permet aux protines dploye la suite dun traitement de se reployer. par des concentrations croissantes La transition brutale observable dans la Figure 2.63 suggre que le reploiement dagents dnaturants. et le dploiement de la protine est un processus de tout ou rien qui rsulte dune transition cooprative. Par exemple, supposez quune protine soit place dans des conditions o une rgion de la structure de la protine est thermodynamiquement instable. Une partie de la structure reploye tant rompue, les interactions entre cette dernire et le reste de la protine seront perdues. La perte de ces dernires dstabilisera alors le reste de la structure. Ainsi, des conditions qui conduisent la disparition dune rgion de la structure de la protine dnaturant vraisemblablement la protine dans son ensemble. Les proprits structurales des protines apportent une comprhension claire de cette transition cooprative. Les consquences du reploiement coopratif peuvent tre Dploye 100 illustres en considrant le contenu dune solution dune protine dans des conditions correspondant un tat intermdiaire de transition entre les formes reployes et dployes. Dans de telles conditions, la protine est demi-dploye . Remarquez que la solution ne contient pas de molcules demi-dployes 50 mais, au contraire, un mlange parties gales de molcules totalement reployes et de molcules totalement dployes (Figure 2.64). Bien que les protines puissent sembler se comporter comme Reploye 0 existant seulement sous deux tats, cette interprtation simple [Dnaturant] dune existence deux tats est impossible au niveau atomique. Des structures intermdiaires instables, transitoires doivent Figure 2.64. Constituants dune solution de protine exister entre les tats natif et dnatur (p. 56). La dtermination partiellement dnature. Dans une solution de protine demi dploye, une moiti des molcules est totalement de la nature de ces structures intermdiaires est un domaine reploye et lautre moiti totalement dploye. intensif de la recherche en biochimie.

Les protines se reploient par stabilisation progressive dintermdiaires et non par une recherche au hasard
Comment une protine effectue-t-elle la transition dune structure dploye la conformation unique de la forme native ? Une possibilit a priori, serait que toutes les conformations possibles soient explores afin que soit trouve celle qui est nergtiquement la plus favorable. Combien de temps une telle recherche au hasard prendrait-elle ? Considrez une petite molcule de 100 rsidus. Cyrus Levinthal a calcul que si chaque rsidu peut assumer trois positions diffrentes, le nombre total de structures est de 3100, soit 5 1047. Sil faut 10 13 s pour convertir une structure en une autre, le temps total de recherche serait de 5 1047 10 13 s, soit 5 1034 s ou 1,6 1027 annes. Manifestement, cela prendrait beaucoup trop de temps, mme une petite protine, pour se reployer correctement en cherchant au hasard toutes les conformations possibles ! Lnorme diffrence entre le temps calcul et le temps rel de reploiement est appele paradoxe de Levinthal. Ce paradoxe rvle clairement que les protines ne se replient pas en essayant chaque conformation
55

[Protine dploye], %

[Protine dploye], %

Comment est-ce que de tels agrgats conduisent la mort des cellules qui les hbergent ? La rponse est toujours controverse. Une hypothse est que les grands agrgats ne sont pas toxiques, mais quau contraire les petits agrgats des mmes protines seraient les coupables, peut-tre en endommageant les membranes.

100

56
CHAPITRE 2 Composition et structure des protines

Figure 2.65 Analogie avec la frappe dun singe. Un singe tapant au hasard sur une machine crire pourrait crire une ligne du Hamlet de Shakespeare, condition que les frappes correctes soient conserves. Dans les deux simulations sur ordinateur reprsentes, le nombre cumulatif de frappes est donn gauche de chaque ligne.

possible ; au contraire, elles doivent suivre un chemin de repliement au moins partiellement dfini, consistant en intermdiaires entre la protine compltement dnature et sa structure native. La faon de sortir de ce paradoxe est de reconnatre la puissance de la slection cumulative. Richard Dawkins, dans The Blind Watchmaker (LHorloger Aveugle), sest demand combien de temps mettrait un singe tapant au hasard sur une machine crire pour reproduire la rplique dHamlet Polonius Methinks it is like a weasel ( Il me semble quil est comme une belette ) (Figure 2.65). Un nombre astronomique de frappes, de lordre de 1040, serait ncessaire. Cependant, supposons que nous conservions tous les caractres corrects et que nous permettions au singe de retaper uniquement les caractres errons. Dans ce cas, quelques milliers de frappes seulement, en moyenne, seraient ncessaires. La diffrence cruciale entre ces deux situations est que dans la premire, la recherche est faite totalement au hasard, tandis que dans la seconde, les intermdiaires partiellement corrects sont retenus. La nature mme du reploiement des protines est leur tendance retenir des intermdiaires partiellement corrects. Cependant, le problme du reploiement des protines est beaucoup plus difficile que celui prsent notre singe shakespearien. Tout dabord, le critre de justesse nest pas lobservation rsidu par rsidu de la conformation par un observateur omniscient, mais lnergie totale des espces transitoires. Deuximement, les protines sont trs peu stables. La diffrence dnergie libre entre les tats reploys et non reploys dune protine typique de 100 rsidus est de 42 kJ mol 1 (10 kcal mol 1) et, ainsi, lnergie de stabilisation de ltat reploy nest que de 0,42 kJ mol 1 (0,1 kcal mol 1) par rsidu en moyenne. Cette valeur est infrieure la quantit dnergie de lagitation thermique qui est de 2,5 kJ mol 1 (0,6 kcal mol 1) la temprature ambiante. Cette faible nergie de stabilisation signifie que des intermdiaires corrects, en particulier ceux forms dans les premires tapes du reploiement peuvent tre perdus. Lanalogie est que le singe serait relativement libre dannuler des frappes correctes. Nanmoins, les interactions qui conduisent un reploiement coopratif peuvent stabiliser des intermdiaires lorsque la structure se construit. Ainsi, des rgions localises, qui ont une prfrence structurale significative, bien que pas ncessairement stables par ellesmmes, tendront adopter leurs structures favorites et, lorsque celles-ci se seront formes, pourront interagir les unes avec les autres, ce qui conduira une stabilisation accrue. Ce schma conceptuel est souvent dsign par lexpression modle de nuclation-condensation. Une simulation du reploiement dune protine bas sur le modle de nuclationcondensation est reprsent Figure 2.66. Ce modle suggre que certaines voies peuvent tre favorises. Bien que la Figure 2.66 suggre un cheminement unique, chacun des intermdiaires qui sont dessins reprsente en fait un ensemble de structures voisines ; en dautres termes une protine suit une voie gnrale plutt quunique dans sa transition dun tat non repli (dnatur) un tat repli (natif). La surface dnergie pour lensemble du processus de reploiement peut tre visualise comme un entonnoir. La grande extrmit de lentonnoir reprsente le large

(1)

(2)

(3)

(4)

(5)

Dnatur

Natif

Figure 2.66 Hypothse propose pour le processus de reploiement de linhibiteur de la chymotrypsine. Des rgions localises ayant suffisamment de prfrences structurales ont tendance adopter initialement leurs structures prfres (1). Ces structures se rejoignent pour former un noyau ayant une structure de type natif, mais encore mobile, (4). Cette structure se condense alors compltement pour former la structure native, plus rigide (5). [Daprs A. R. Fersht and V. Daggett. Cell 108 (2002) : 573582 ; avec lautorisation de Elsevier.]

ventail des structures compatibles avec lensemble des molcules de protines dnatures. Au fur et mesure que lnergie libre de la population de molcules dcrot, les protines se dplacent vers les rgions plus troites de lentonnoir, et moins de conformations y ont accs. A la sortie de lentonnoir on ne trouve plus que la protine reploye dans sa conformation parfaitement dfinie. De nombreux chemins diffrents peuvent mener au mme minimum dnergie.

57
2.6 Squence et structure

La prdiction de la structure tridimensionnelle partir de la squence demeure un grand problme


La prdiction de la structure tridimensionnelle partir de la squence sest rvle extrmement difficile. Comme nous lavons vu, la squence locale semble ne dterminer que 60 70 % de la structure secondaire et des interactions grande distance sont ncessaires pour fixer la structure secondaire complte et la structure tertiaire. Les chercheurs ont explor deux approches fondamentales diffrentes pour prdire la structure tridimensionnelle partir de la squence des aminoacides. La premire est la prdiction ab initio sans autre information , qui tend prdire le reploiement dune squence daminoacides sans connaissance antrieure de squences similaires de protines dont les structures sont connues. On effectue sur ordinateur des calculs qui tendent rendre minimale lnergie libre de la structure partir dune squence donne daminoacides, ou encore simuler le processus de reploiement. Lutilit de ces mthodes est limite par le trs grand nombre de conformations possibles, la faible stabilit des protines et la subtile nergtique des interactions faibles en solution aqueuse. La deuxime approche tire avantage de notre connaissance grandissante de la structure tridimensionnelle de nombreuses protines. Dans ces mthodes bases sur la connaissance, la squence des aminoacides dune structure inconnue est examine pour sa compatibilit avec les structures des protines connues ou des fragments de celles-ci. Lorsquune concordance significative est dtecte, la structure connue peut tre utilise comme modle de dpart. Les mthodes bases sur la connaissance ont t lorigine de nombreuses informations sur la conformation tridimensionnelle des protines de squence connue, mais de structure alors inconnue.

La modification et le clivage des protines gnrent de nouvelles possibilits structurales


Les protines sont susceptibles dassumer des fonctions diverses uniquement en sappuyant sur les proprits varies de leurs 20 aminoacides. Mais en outre, de nombreuses protines peuvent tre modifies de faon covalente par la fixation de groupes autres que les aminoacides, ce qui tend leurs fonctions (Figure 2.67). Par exemple, des groupes actyle sont fixs lextrmit N-terminale de beaucoup de protines, ce qui rend ces dernires plus rsistantes la dgradation. Comme nous lavons discut auparavant (p. 46) laddition de groupes hydroxyle de nombreux rsidus proline stabilise les fibres de collagne nouvellement synthtises. La signification biologique de cette modification est vidente dans le scorHOH2C
OOC

O NH

OH

HN CH COO H2C

HO C H C C O O O C CH3

O O H2C

O P O H C C O

HO CH H2C

H2 C H C N C O

H2C C N H

H C O

N H

N H

Hydroxyproline

-Carboxyglutamate

Complexe ose-asparagine

Phosphosrine

Figure 2.67 Touches de finition. Certaines modifications courantes et importantes des chanes latrales des aminoacides sont reprsentes.

58
CHAPITRE 2 Composition et structure des protines

but : un dficit de vitamine C se traduit par une hydroxylation insuffisante du collagne et les fibres de collagne anormal qui en rsultent sont incapables de maintenir une rsistance normale des tissus (Section 27.5). Un autre aminoacide spcialis produit par une touche de finition est le -carboxyglutamate. En cas de dficit en vitamine K, une carboxylation insuffisante du glutamate de la prothrombine, protine de la coagulation, peut conduire des hmorragies (p. 295). De nombreuses protines, en particulier celles prsentes la surface des cellules ou qui sont scrtes, acquirent des units glucidiques fixes des rsidus asparagine spcifiques (voir Chapitre 11). Laddition de glucides rend les protines plus hydrophiles et capables de participer des interactions avec dautres protines. linverse, laddition dun acide gras au groupe amine ou au groupe sulfhydryle dune cystine produit une protine plus hydrophobe. De nombreuses hormones, telles que ladrnaline, modifient lactivit des enzymes en stimulant la phosphorylation des aminoacides hydroxyls srine et thronine ; la phosphosrine et la phosphothronine sont les aminoacides modifis les plus ubiquitaires des protines. Des facteurs de croissance, tels que linsuline, agissent en dclenchant la phosphorylation du groupe hydroxyle des rsidus tyrosine pour former la phosphotyrosine. Les groupes phosphoryle de ces trois aminoacides modifis sont aisment limins ; ils sont alors capables de se comporter en commutateurs rversibles dans la rgulation des processus cellulaires. Le rle de la phosphorylation dans la transduction des signaux sera discut en dtail dans le Chapitre 14. Les modifications prcdentes rsultent de laddition de groupes spcifiques des aminoacides. Dautres groupes spciaux sont crs par ramnagements chimiques des chanes latrales et, parfois, du squelette peptidique. Par exemple, certaines mduses produisent une protine prsentant une fluorescence verte (la GFP, Figure 2.68).

(A)

HO Tyr O Ser H N N H H
O2

(B)

CH2 H

O N

HO

Gly

HO

C H N H HO N H O N O

Figure 2.68 Rarrangement chimique dans la GFP. (A) Structure de la protine GFP (de green fluorescent protein , protine fluorescence verte). Le rarrangement et loxydation de la squence Ser-Tyr-Gly est lorigine de la fluorescence. (B) Micrographie de fluorescence dun embryon quatre cellules (les contours des cellules sont dessins) du ver rond Caenorhabditis elegans contenant la protine PIE-1 marque par la GFP. La protine nest exprime que dans la cellule ( la partie suprieure) qui donnera naissance la ligne germinale. [(A) Dessin daprs 1GFL.pdb ; (B) Autorisation du Dr Geraldine Seydoux.]

Lorigine de la fluorescence est due un groupe form par le rarrangement et loxydation spontane de la squence Ser-Tyr-Gly au centre de la protine. Cette protine est dune grande utilit pour les chercheurs comme marqueur au sein des cellules (p. 89). Enfin, de nombreuses protines sont clives et dcoupes aprs synthse. Par exemple, les enzymes digestifs sont synthtiss sous forme de prcurseurs inactifs qui peuvent tre mis en rserve sans danger dans le pancras. Aprs libration dans lintestin, ces prcurseurs sont activs par clivage dune liaison peptidique (p. 289). Dans la coagulation du sang, le clivage dune liaison peptidique convertit le fibrinogne soluble en fibrine insoluble (p. 293). De nombreuses hormones polypeptidiques, telles que lhormone adrnocorticotrope (ACTH), proviennent du clivage dun grand prcurseur protique unique. De mme, de nombreuses protines virales sont produites par le clivage de grandes polyprotines prcurseurs. Nous rencontrerons de nombreux autres exemples de modification et de clivage comme caractres essentiels de la formation et de la fonction des protines. En fait, ces touches de finition expliquent une grande partie de la diversit, de la prcision et de llgance de laction et de la rgulation des protines.

59
Rsum

Rsum
La structure des protines peut tre dcrite quatre niveaux. La structure primaire se rfre la squence des aminoacides. La structure secondaire dcrit la conformation adopte par des rgions localises de la chane polypeptidique. La structure tertiaire dcrit le reploiement densemble de la chane polypeptidique. Enfin, la structure quaternaire a trait lassociation spcifique de plusieurs chanes polypeptidiques pour former des complexes multi-sous-unitaires. 2.1 Les protines sont construites partir dun rpertoire de 20 aminoacides Les protines sont des polymres linaires daminoacides. Chaque aminoacide est constitu dun atome de carbone ttradrique central uni un groupe amine, un groupe acide carboxylique, une chane latrale caractristique et un atome dhydrogne. Ces centres ttradriques, lexception de celui de la glycine, prsentent une chiralit ; seul lisomre L existe dans les protines naturelles. Toutes les protines naturelles sont construites partir du mme groupe de 20 aminoacides. Les chanes latrales de ces 20 lments constitutifs diffrent considrablement par leur taille, leur forme et la prsence de groupes fonctionnels. Ces derniers peuvent tre regroups de la faon suivante : (1) chanes latrales aliphatiques : glycine, alanine, valine, leucine, isoleucine, mthionine et proline ; (2) chanes latrales aromatiques : phnylalanine, tyrosine et tryptophane ; (3) chanes latrales aliphatiques contenant un hydroxyle : srine et thronine ; (4) cystine contenant un sulfhydryle ; (5) chanes latrales contenant un carboxamide : asparagine et glutamine (6) chanes latrales basiques : lysine, arginine et histidine ; et (7) chanes latrales acides : acide aspartique et acide glutamique. Ces regroupements sont quelque peu arbitraires et dautres sont possibles. 2.2 Structure primaire : les aminoacides sont unis par des liaisons peptidiques pour former des chanes polypeptidiques Les aminoacides dun polypeptide sont unis par des liaisons amide formes entre le groupe carboxyle dun aminoacide, et le groupe amine du suivant. Cette liaison, appele liaison peptidique a plusieurs proprits importantes. Tout dabord, elle est rsistante lhydrolyse et donc les protines sont remarquablement stables du point de vue cintique. Deuximement, la liaison peptidique est plane, tant donn que la liaison CN a un caractre important de double liaison. Troisimement, chaque liaison peptidique possde la fois un donneur de liaison hydrogne (le groupe NH) et un accepteur de liaison hydrogne (le groupe CO). Les liaisons hydrogne entre ces groupes du squelette polypeptidique reprsentent un des caractres spcifiques de la structure des protines. Enfin, la liaison peptidique nest pas charge, ce qui permet aux pro-

60
CHAPITRE 2 Composition et structure des protines

tines de former des structures globulaires fortement compactes dont une part importante du squelette polypeptidique est enfouie au sein de la protine. tant donn que les protines sont des polymres linaires, elles peuvent tre dcrites comme une squence daminoacides. Cette dernire est crite de lextrmit N-terminale vers lextrmit C-terminale. 2.3 Structure secondaire : les chanes polypeptidiques peuvent se reployer en structures rgulires telles que lhlice alpha, le feuillet bta, les coudes et les boucles Deux lments majeurs de la structure secondaire sont lhlice et le brin . Dans lhlice , la chane polypeptidique senroule en un btonnet troitement compact. Au sein de lhlice, le groupe CO de chaque aminoacide est uni par une liaison hydrogne au groupe NH de laminoacide situ quatre rsidus plus loin dans la chane polypeptidique. Dans le brin , la chane polypeptidique est presque totalement tire. Deux brins , ou davantage, connects par des liaisons hydrogne entre des NH et des CO sassemblent pour former des feuillets . Les brins des feuillets peuvent tre antiparallles, parallles, ou mixtes. 2.4 Structure tertiaire : les protines hydrosolubles se reploient en structures compactes prsentant des cores non polaires La structure compacte, asymtrique, quadopte chaque polypeptide, est appele structure tertiaire. Les structures tertiaires des protines hydrosolubles ont en commun divers caractres : (1) une partie interne forme daminoacides prsentant des chanes latrales hydrophobes et (2) une surface constitue principalement daminoacides hydrophiles qui interagissent avec lenvironnement aqueux. La force qui dtermine la formation de la structure tertiaire des protines hydrosolubles est due aux interactions hydrophobes entre les rsidus de la rgion interne. Les protines qui se situent dans lenvironnement hydrophobe des membranes prsentent une distribution inverse des aminoacides hydrophobes et des aminoacides hydrophiles. Dans ces protines, les aminoacides hydrophobes sont la surface pour entrer en interaction avec lenvironnement lipidique, tandis que les groupes hydrophiles sont protgs de cet environnement en tant situs au sein de la protine. 2.5 Structure quaternaire : les chanes polypeptidiques peuvent sassembler en des structures multi-sous-unitaires Les protines constitues de plus dune chane polypeptidique prsentent une structure quaternaire et chaque chane polypeptidique prise individuellement est appele sous-unit. La structure quaternaire peut tre aussi simple que deux sous-units identiques, ou aussi complexe que des douzaines de sousunits diffrentes. Dans la plupart des cas, les sous-units sont maintenues ensemble par des liaisons non covalentes. 2.6 La squence des aminoacides dune protine dtermine sa structure tridimensionnelle La squence des aminoacides dtermine totalement la structure tridimensionnelle et, par consquent, toutes les autres proprits dune protine. Certaines protines peuvent tre compltement dployes, puis reployes efficacement lorsquelles sont places dans des conditions o la forme reploye de la protine est stable. La squence des aminoacides dune protine est dtermine par la squence des bases dune molcule de DNA. Cette information une dimension de la squence est tendue au monde tridimensionnel par la capacit des protines se reployer spontanment. Le reploiement des protines est un processus hautement coopratif ; les intermdiaires structuraux entre les formes dployes et les formes reployes ne saccumulent pas. La diversit des protines est considrablement accrue par des modifications covalentes. Ces dernires peuvent inclure des groupes fonctionnels non prsents dans les 20 aminoacides. Dautres modifications sont importantes pour la rgulation de lactivit des protines. Grce leur stabilit structurale, leur diversit et leur ractivit chimique, les protines rendent possibles la plupart des processus cl associs la vie.

Appendice

61

APPENDICE. Reprsentation des structures molculaire II : protines


Les scientifiques on dvelopp des techniques puissantes pour la dtermination des structures des protines, comme nous le verrons dans le Chapitre 3. Dans la plupart des cas, ces techniques permettent de dterminer les positions des milliers datomes dune protine. Le rsultat final dune telle exprience comprend les coordonnes x, y, et z pour chaque atome de la structure. Ces dossiers de coordonnes sont compils dans la Banque de Donnes des Protines (http://www. rcsb.org/pdb/) partir de laquelle elles peuvent tre facilement tlcharges. Ces structures comprennent des milliers ou mme des dizaines de milliers datomes. La complexit de protines ayant des milliers datomes pose un problme srieux ceux qui veulent dcrire leur structure. Plusieurs types diffrents de reprsentations sont utiliss pour dpeindre les protines, chacun avec ses forces et ses faiblesses. Les types que vous verrez le plus souvent dans ce livre sont les modles compacts, les modles clats, les modles fil de fer (ou squelette), et les diagrammes en ruban. Quand cela sera appropri, nous noterons les caractres structuraux dimportance ou de pertinence particulires dans la lgende des illustrations. Modles compacts Les modles compacts sont les types de reprsentations les plus ralistes. Chaque atome est montr comme une sphre dont la taille correspond au rayon de van der Waals de latome (p. 8). Les liaisons ne sont pas montres explicitement mais sont reprsentes par lintersection des sphres apparentes quand les atomes sont plus proches que la somme de leurs rayons de van der Waals. Tous les atomes sont montrs, y compris ceux qui forment le squelette et ceux des chanes latrales. Un modle compact du lysozyme est reprsent Figure 2.69. Les modles compacts rendent compte du peu despace libre existant dans la structure dune protine, qui a toujours beaucoup datomes en contact de van der Waals les uns avec les autres. Ces modles sont particulirement utiles pour montrer les changements de conformation spatiale dune protine dans des conditions diffrentes. Un dsavantage des modles compacts est que les structures secondaire et tertiaire de la protine sont difficiles voir. Donc, ces modles ne sont pas trs utiles pour distinguer une protine dune autre (beaucoup de modles compacts de protines se ressemblent normment). Modles clats Les modles clats ne sont pas aussi ralistes que les modles compacts. Les atomes dpeints de manire raliste occupent plus despace (car celui-ci est dtermin par leurs rayons de van der Waals), que les atomes reprsents dans les modles clats. Cependant, larrangement des liaisons est plus facile voir parce que les liaisons sont explicitement reprsentes comme des btonnets (Figure 2.70). Un modle clat rvle une structure complexe plus clairement quun modle compact. Cependant, la description est si complique que les

Figure 2.69 Modle compact du lysozyme. Remarquez comme les atomes sont troitement empils, avec trs peu despace vide. Tous les atomes sont montrs lexception des atomes dhydrogne. Les atomes dhydrogne sont souvent omis car leurs positions ne sont pas dtermines facilement par cristallographie aux rayons X, et parce que cette omission amliore la clart de la reprsentation de la structure.

caractres structuraux tels que les hlices ou les sites de fixation potentiels sont difficiles voir. Comme les modles compacts et clats reprsentent les structures des protines au niveau atomique, le grand nombre datomes de ces structures complexes rend difficile la perception des caractres structuraux pertinents. Aussi, des reprsentations plus schmatiques, comme les modles fil de fer et les diagrammes en ruban, ont t dvelopps pour la description des structures macromolculaires. Dans ces reprsentations, la plupart ou la totalit des atomes ne sont pas montrs explicitement.

Figure 2.70 Modle clat du lysozyme. Les atomes dhydrogne sont encore omis.

6 2 CHAPITRE 2 Composition et structure des protines

Figure 2.71 Modle fil de fer (ou en squelette) du lysozyme.

Modles fil de fer (ou en squelette) Les modles fil de fer montrent seulement le squelette des atomes dune molcule de polypeptide ou mme seulement latome de carbone de chaque aminoacide. Les atomes sont relis par des lignes reprsentant les liaisons ; quand uniquement les atomes de carbone sont reprsents, ces lignes connectent les atomes de carbone des aminoacides qui sont adjacents dans la squence daminoacides (Figure 2.71). Dans ce livre, les modles fil de fer montrent seulement les lignes qui connectent les atomes de carbone ; les autres atomes ne sont pas montrs. Un modle fil de fer montre laspect gnral dune chane polypeptidique bien mieux que les modles compacts ou clats. Cependant, les lments de structure secondaire sont encore difficiles voir.

Diagrammes en ruban Les diagrammes en ruban sont trs schmatiques et le plus souvent utiliss pour insister sur quelques aspects saillants de la structure dune protine, telle que lhlice (dessine comme un ruban enroul ou un cylindre), le brin (une flche large), et les boucles (de simples lignes), pour donner une vue claire et nette du reploiement gnral dune protine (Figure 2.72). Le diagramme en ruban permet de retracer la progression dune chane polypeptidique et montre facilement les lments de structure secondaire. Ainsi, les diagrammes en ruban de protines qui sont apparentes par divergence volutive se ressemblent (voir Figure 6.14), alors que les protines non apparentes sont clairement distinctes. Dans ce livre, les rubans enrouls seront en gnral utiliss pour dpeindre les hlices. Cependant, pour les protines de membrane, qui sont souvent trs complexes, des cylindres seront plutt utiliss. Cette convention rendra aussi faciles reconnatre les protines membranaires avec leurs hlices transmembranaires (voir Figure 12.18). Gardez cependant prsent lesprit que lapparence des diagrammes en ruban est trompeuse. Comme nous lavons remarqu plus tt, les structures des protines sont trs compactes et ont peu despace libre. La clart des diagrammes en ruban les rend particulirement utiles comme cadres dans lesquels ont peu mettre en lumire dautres aspects de la structure dune protine. Les sites actifs, les substrats, les liaisons, et dautres lments de structure peuvent tre inclus sous une forme clate ou compacte au sein mme dun diagramme en ruban (Figure 2.73).

Liaisons disulfure

Brin

Rsidu aspartate du site actif Hlice

Liaisons disulfure

Figure 2.72 Diagramme en ruban du lysozyme. Les hlices sont reprsentes comme des rubans enrouls, et les brins comme des flches. Les structures plus irrgulires sont reprsentes sous la forme de tubes fins.

Figure 2.73 Diagramme en ruban du lysozyme avec les particularits importantes. Quatre ponts disulfure et un rsidu aspartate fonctionnellement important sont reprsents sous la forme de modle clat.

Mots Cl
chane latrale (groupe R) (p. 27) side chain (R group) aminoacide L (p. 27) L amino acid ion dipolaire (zwitterion) (p. 27) dipolar ion (zwitterion) liaison peptidique (liaison amide) (p. 34) peptide bond (amide bond)

Choix de lectures

63

liaison disulfure (p. 35) disulfide bond structure primaire (p. 36) primary structure angle de torsion (p. 39) torsion angle angle phi ( ) (p. 39) phi ( ) angle angle psi ( ) (p. 39) psi ( ) angle diagramme de Ramachandran (p. 39) Ramachandran diagram structure secondaire (p. 40) secondary structure hlice (p. 40) helix lvation (p. 40) rise translation (p. 40) translation feuillet pliss (p. 42) pleated sheet brin (p. 42) strand

coude (coude ; coude en pingle cheveux) (p. 44) reverse turn ( turn ; hairpin turn) structure surenroule (p. 45) coiled coil rptitions en heptade (p. 45) heptad repeats structure tertiaire (p. 47) tertiary structure motif (p. 49) motif structure supersecondaire (p. 49) supersecondary structure domaine (p. 49) domain sous-unit (p. 49) subunit structure quaternaire (p. 49) quaternary structure prion (p. 53) prion transition cooprative (p. 55) cooperative transition

Choix de lectures
Pour commencer
Richardson, J. S. 1981. The anatomy and taxonomy of protein structure. Adv. Protein Chem. 34:167339. Doolittle, R. F. 1985. Proteins. Sci. Am. 253(4):8899. Richards, F. M. 1991. The protein folding problem. Sci. Am. 264(1): 5457. Weber, A. L., and Miller, S. L. 1981. Reasons for the occurrence of the twenty coded protein amino acids. J. Mol. Evol. 17:273284. among three modular proteins with diverse functions and variable assembly. Protein Sci. 7:16611670. Hopfner, K. P., Kopetzki, E., Kresse, G. B., Bode, W., Huber, R., and Engh, R. A. 1998. New enzyme lineages by subdomain shuffling. Proc. Natl. Acad. Sci. U.S.A 95:98139818. Ponting, C. P., Schultz, J., Copley, R. R., Andrade, M. A., and Bork, P. 2000. Evolution of domain families. Adv. Protein Chem. 54:185244.

Livres
Petsko, G.A., and Ringe, D. 2004. Protein Structure and Function. New Science Press. Branden, C., and Tooze, J. 1999. Introduction to Protein Structure (2d ed.). Garland. Perutz, M. F. 1992. Protein Structure: New Approaches to Disease and Therapy. W. H. Freeman and Company. Creighton, T. E. 1992. Proteins: Structures and Molecular Principles (2d ed.). W. H. Freeman and Company.

Reploiement des protines


Caughey, B., and Lansbury, P. T. 2003. Protofibrils, pores, fibrits, and neurodegeneration: Separating the responsible protein aggregates from innocent bystanders. Annu. Rev. Neurosci. 26: 267298. Daggett, V., and Fersht, A. R. 2003. Is there a unifying mechanism for protein folding? Trends Biochem. Sci. 28:1825. Selkoe, D. J. 2003. Folding proteins in fatal ways. Nature 426:900904. Anfinsen, C. B. 1973. Principles that govern the folding of protein chains. Science 181:223230. Baldwin, R. L., and Rose, G. D. 1999. Is protein folding hierarchic? I. Local structure and peptide folding. Trends Biochem. Sci. 24:2633. Baldwin, R. L., and Rose, G. D. 1999. Is protein folding hierarchic? II. Folding intermediates and transition states. Trends Biochem. Sci. 24:7783. Kuhlman, B., Dantas, G., Ireton, G. C., Varani, G., Stoddard, B. L., and Baker, D. 2003. Design of a novel globular protein with atomiclevel accuracy. Science 302: 13641368. Staley, J. P., and Kim, P. S. 1990. Role of a subdomain in the folding of bovine pancreatic trypsin inhibitor. Nature 344:685688.

Conformation des protines


Dobson, C.M. 2003. Protein folding and misfolding. Nature 426: 884890. Richardson, J. S., Richardson, D. C., Tweedy, N. B., Gernert, K. M., Quinn, T. P., Hecht, M. H., Erickson, B. W., Yan, Y., McClain, R. D., Donlan, M. E., and Suries, M. C. 1992. Looking at proteins: Representations, folding, packing, and design. Biophys. J. 63:11861220. Chothia, C., and Finkelstein, A. V. 1990. The classification and origin of protein folding patterns. Annu. Rev. Biochem. 59:10071039.

Hlices alpha, feuillets bta, et coudes


ONeil, K. T., and DeGrado, W. F. 1990. A thermodynamic scale for the helix-forming tendencies of the commonly occurring amino acids. Science 250:646651. Zhang, C., and Kim, S. H. 2000. The anatomy of protein beta-sheet topology. J. Mol. Biol. 299:10751089. Regan, L. 1994. Protein structure: Born to be beta. Curr. Biol. 4:656658. Leszczynski, J. F., and Rose, G. D. 1986. Loops in globular proteins: A novel category of secondary structure. Science 234:849855. Srinivasan, R., and Rose, G. D. 1999. A physical basis for protein secondary structure. Proc. Natl. Acad. Sci. U.S.A. 96:1425814263.

Modifications covalentes des protines


Krishna, R. G., and Wold, F. 1993. Post-translational modification of proteins. Adv. Enzymol. Relat. Areas. Mol. Biol. 67:265298. Aletta, J. M., Cimato, T. R., and Ettinger, M. J. 1998. Protein methylation: A signal event in post-translational modification. Trends Biochem. Sci. 23:8991. Glazer, A. N., DeLange, R. J., and Sigman, D. S. 1975. Chemical Modification of Proteins. North-Holland. Tsien, R. Y. 1998. The green fluorescent protein. Annu. Rev. Biochem. 67:509544.

Reprsentations molculaires graphiques


Kraulis, P. 1991. MOLSCRIPT: A program to produce both detailed and schematic plots of protein structures. J. Appl. Cryst. 24:946950. Ferrin, T., Huang, C., Jarvis, L., and Langridge, R. 1988. The MIDAS display system. J. Mol. Graphics 6:1327. Richardson, D. C., and Richardson, J. S. 1994. Kinemages: Simple macromolecular graphics for interactive teaching and publication. Trends Biochem. Sci. 19:135138.

Domaines
Bennett, M. J., Choe, S., and Eisenberg, D. 1994. Domain swapping: Entangling alliances between proteins. Proc. Natl. Acad. Sci. U.S.A. 91:31273131. Bergdoll, M., Eltis, L. D., Cameron, A. D., Dumas, P., and Bolin, J. T. 1998. All in the family: Structural and evolutionary relationships

6 4 CHAPITRE 2 Composition et structure des protines

Problmes
1. Forme et dimension. (a) La tropomyosine, protine musculaire de 70 kd, est constitue de deux brins en hlice enrouls lun autour de lautre. Quelle est la longueur de la molcule ? (b) Supposez quun segment de 40 rsidus dune protine se reploie en une structure antiparallle deux brins avec un coude en pingle cheveux de quatre rsidus. Quelle est la plus longue dimension de ce motif ? 2. Isomres diffrents. La poly-L-leucine dans un solvant organique tel que le dioxane est en hlice , tandis que la poly-Lisoleucine ne lest pas. Pourquoi ces aminoacides, ayant le mme nombre et le mme type datomes, ont-ils des tendances diffrentes former une hlice ? 3. De nouveau actif. Une mutation qui change un rsidu alanine en une valine lintrieur dune protine conduit la perte de lactivit. Cependant, lactivit est rcupre lorsquune seconde mutation une position diffrente change un rsidu isoleucine en glycine. Comment cette seconde mutation peut-elle conduire la restauration de lactivit ? 4. Test dchange. Un enzyme qui catalyse des ractions dchange disulfure-sulfhydryle, appel protine disulfure isomrase, a t isol. La ribonuclase brouille inactive est rapidement convertie en ribonuclase enzymatiquement active par cet enzyme. Par contre, linsuline est rapidement inactive par ce mme enzyme. Quimplique cette importante observation quant la relation entre la squence des aminoacides de linsuline et sa structure tridimensionnelle ? 5. En tirant une cible. Une protase est un enzyme qui catalyse lhydrolyse des liaisons peptidiques de protines cible. Comment une protase peut-elle se lier une protine cible de telle faon que la chane principale de cette dernire devienne compltement tire dans la rgion de la liaison peptidique vulnrable ? 6. Souvent irremplaable. La glycine est un rsidu aminoacide trs conserv dans lvolution des protines. Pourquoi ? 7. Partenaires potentiels. Identifiez les groupes dune protine qui peuvent former des liaisons hydrogne ou des liaisons lectrostatiques avec une chane latrale arginine pH 7. 8. Ondulations permanentes. La forme des cheveux est en partie dtermine par le profil des liaisons disulfure de la kratine qui est leur protine essentielle. Comment induire la formation de boucles de cheveux ? 9. La localisation est essentielle. Les protines qui traversent les membranes biologiques contiennent souvent des hlices . tant donn que la partie interne des membranes est hautement hydrophobe (Section 12.2), prdire quel type daminoacide sera prsent dans une telle hlice. Pourquoi une hlice est-elle particulirement adapte pour sinsrer dans lenvironnement hydrophobe de la partie interne dune membrane ? 10. Problmes de stabilit. Les protines sont trs stables. La dure de vie dune liaison peptidique en solution aqueuse est denviron 1 000 ans. Cependant, lnergie libre de lhydrolyse des protines est ngative et trs leve. Comment pouvez-vous expliquer la stabilit de la liaison peptidique, compte tenu du fait que lhydrolyse libre autant dnergie ? 11. Espces mineures. Pour un aminoacide tel que lalanine, lespce molculaire majoritaire en solution pH 7 est le zwitterion. En prenant une valeur de 8 pour le pKa du groupe amine et de 3 pour lacide carboxylique, estimez le rapport de la concentration de laminoacide neutre (avec lacide carboxylique proton et le groupe amine neutre) celle du zwitterion, pH 7 (voir p. 16). 12. Question de convention. Tous les aminoacides L ont la configuration absolue S lexception de la L-cystine qui a la configuration R. Expliquez pourquoi la L-cystine a la configuration absolue R. 13. Message cach. Traduisez la squence des aminoacides ciaprs dans le code une lettre : Glu-Leu-Val-Ile-Ser-Ile-SerLeu-Ile-Val-Ile-Asn-Gly-Ile-Asn-Leu-Ala-Ser-Val-Glu-GlyAla-Ser. 14. Qui arrive le premier ? Selon vous, les liaisons peptidiques Pro-X tendent-elles prendre des conformations cis comme celles des liaisons X-Pro ? Pourquoi ou pourquoi pas ? 15. Appariement. Pour chacun des drivs daminoacides reprsents ci-contre (A-E), trouver lappariement des valeurs de et de (a-e).
(A) (B) (C) (D) (E)

(a) 120, 120

(b) 180, 0

(c) 180, 180

(d) 0, 180

(e) 60, 40