Vous êtes sur la page 1sur 10

RECHERCHE

Puces à ADN
par Pascal SOULARUE* et Xavier GIDROL**

Nouveaux outils d’étude des composants moléculaires de la cellule, les puces à ADN
ont permis la mesure massivement parallèle de la concentration à l’équilibre des ARNm.
Un grand nombre d’applications peuvent être envisagées comme l’étude des réseaux
génétiques au sein d’une cellule ou l’obtention de signatures moléculaires caractéristiques
d’un type de cellule, d’une pathologie ou d’un patient.

1. De la notion de cellule Ainsi l’ADN présent dans une cellule de levure est * Ingénieur
Responsable de la plate-
constitué d’un enchaînement de 14 millions de
à celle de transcriptome nucléotides, 170 millions de nucléotides dans une
forme Biopuces du SGF

cellule de mouche et 3 000 milliards de nucléotides ** Docteur en biologie


1.1 La cellule dans une cellule humaine. Ces nucléotides sont eux-
moléculaire et cellulaire
Chef du service de
Tous les organismes vivants sont constitués d’un mêmes des molécules complexes résultant de l’asso- génomique fonction-
nombre variable de cellules : d’une cellule pour les ciation d’un sucre, d’un groupement phosphate et nelle (SGF)
bactéries et les levures à plusieurs milliers de mil- d’une base azotée. Seules 4 bases azotées sont utili-
liards pour les organismes supérieurs. Mais, quel que sées, ne donnant ainsi naissance qu’à 4 nucléotides CEA Evry.
soit l’organisme auquel elles appartiennent, ces cel- différents : l’adénine (A), la cytosine (C), la guanine
lules présentent des caractéristiques communes (G) et la thymine (T). Ces 4 nucléotides, et ces
quant à leur composition, leur architecture ou leur 4 seuls, constituent la molécule d’ADN de tous les La membrane cellu-
mode de fonctionnement. laire délimite la cellule.
êtres vivants. Elle est perméable,
Ainsi chez de nombreux organismes complexes, les permettant ainsi les
échanges entre cellules
eucaryotes, l’information génétique est comparti- On peut ainsi comparer l’ADN à une gigantes- ou avec le milieu exté-
mentée dans le noyau (figure 1). que encyclopédie (de plus de 2 millions de pages rieur.
Le cytoplasme est un
dans le cas de l’ADN humain), encyclopédie dans compartiment semi-
1.2 L’ADN laquelle ne figurerait que les seuls caractères : A, liquide dans lequel se
trouvent différents
C, G et T. organites et où se tien-
nent toutes les réac-
1.2.1 Composition tions métaboliques
participant au bon
L’ADN, présent dans le noyau de chacune des cel- 1.2.2 Structure fonctionnement de la
cellule (respiration,
lules, est une molécule gigantesque composée d’un synthèse protéique,
enchaînement linéaire de millions d’unités appelées La molécule d’ADN, in vivo, ne se présente que dégradation des méta-
bolites...).
nucléotides. sous la forme d’un double brin enroulé en double La membrane nuclé-
hélice, où les deux brins ont une séquence parfaite- aire délimite le noyau
qui renferme l’ADN
ment complémentaire (un A est toujours complé- (acide désoxyribonu-
mentaire d’un T, un C d’un G). Cette complé- cléique), forme de
stockage de l’informa-
mentarité est fondamentale pour la cohésion de la tion génétique de tout
molécule d’ADN. Elle est à la base de la plupart des être vivant.
techniques d’analyse de l’ADN en biologie molécu-
Membrane laire (figure 2).
cellulaire
Pour une espèce donnée, la séquence de la molé-
Cytoplasme cule d’ADN, c’est-à-dire l’enchaînement des nucléoti-
des, est globalement semblable. Il existe cependant,
Membrane au sein d’une même espèce, des variations entre les
nucléaire séquences d’ADN de chaque individu : c’est le poly-
Dans les Techniques
morphisme. Ce polymorphisme peut être silencieux de l’Ingénieur :
ou se manifester par la modification d’un caractère Analyse des macromo-
observable (résistance à un antibiotique chez une lécules biologiques et
applications [P 3 305],
bactérie, couleur des yeux chez la mouche ou forme par J.-M. Chéron et al.
Figure 1 – La cellule eucaryote du nez chez l’homme). Il peut quelquefois être à l’ori- (1992).

06-2002 © Techniques de l’Ingénieur RE 6 - 1


RECHERCHE

C C C T
A T A G
G G G A
A C C A
T A T
C G C A
Nucléotides
G complémentaires
T T T
G C G

Liaison hydrogène Squelette sucre-phosphate

Figure 2 – Structure de l’ADN

gine d’un dysfonctionnement grave de l’organisme taine de milliers chez la souris ou l’homme, constitue
(maladie génétique chez l’être humain). le génome des êtres vivants.

Si l’on reprend l’analogie entre la molécule La molécule d’ADN est en fait analogue à une
d’ADN et une encyclopédie, le polymorphisme encyclopédie dans laquelle on trouverait 95 % de
peut être assimilé à des « fautes de frappe ». ponctuation (séquences non codantes) et seule-
Certaines de ces fautes peuvent n’avoir aucune ment 5 % de texte. Ce texte serait une succes-
incidence sur la compréhension du texte (ex : sion d’informations (les gènes), composées
baktérie, bactèrie ou bactéri pour « bactérie »), exclusivement des 4 lettres A, C, G et T. Chaque
d’autres peuvent, au contraire, en modifier com- information comprend des paragraphes, les
plètement le sens et le rendre totalement incom- exons, interrompus par des messages publicitai-
préhensible (douche, souche moche, moiche, res, les introns : l’information TACTACTACTAC-
mouhe en lieu et place de « mouche »). TAC peut ainsi y être représentée par la
séquence suivante : ... ...
..gcagacggcatcgTACTAgttgacgtgaCTACTAtgtgc-
1.3 Notion de génome tacatgacataaatgggaatCTACccgaactg... ....
L’ADN est la forme de stockage de l’information
génétique de tout être vivant. L’unité de base de Les gènes sont disséminés le long du génome, il
cette information est le gène. Un gène est une petite est par conséquent très difficile d’en localiser sur la
séquence d’ADN particulière qui va être utilisée par la molécule d’ADN, et encore plus de l’identifier, de lui
cellule pour synthétiser les protéines, les enzymes attribuer sa fonction exacte dans la cellule. Caracté-
qui lui sont nécessaires pour assurer le bon fonction- riser l’ensemble des gènes d’un organisme supérieur
nement de la machinerie cellulaire : respiration, divi- est donc un projet titanesque. Pouvoir attribuer à
sion et croissance, échanges avec les autres cellules, chaque gène une fonction exacte dans la cellule,
lutte contre les agressions extérieures, dégradation pouvoir établir de manière fine comment ils inter-
ou transformation de différents métabolites... agissent entre eux est un enjeu considérable pour la
médecine de demain.
Ces gènes présentent différentes caractéristiques :
Même si les grands projets de cartographie des
— ils sont disséminés le long du double brin d’ADN génomes, réalisés dans les années 1990, et l’avance-
de chacune des cellules ; ment du séquençage total de génomes d’organismes
supérieurs (1998-2000) ont déjà permis de caracté-
— leur taille, et donc leur séquence, présente une riser un nombre important de gènes, ces outils ne
longueur variable (de quelques centaines de nucléo- donnent que peu d’informations sur la fonction
tides à quelques milliers) ; exacte de ces gènes ainsi que sur leurs interactions
— chez les organismes supérieurs, ils sont morce- fines. L’ère de l’après-gène, ou post-génomique,
lés en de nombreux fragments informationnels appe- commence seulement !
lés exons, séparés par des morceaux de séquences
dont le rôle est pour l’instant indéterminé nommés 1.4 Du génome au transcriptome
introns ;
En fonction de leurs différents besoins, les cellules
— leurs séquences mises bout à bout ne représen- vont utiliser tout ou partie de ces informations (les
tent qu’une infime partie de la totalité de la molécule gènes) pour réaliser la synthèse des protéines
d’ADN : de l’ordre de 5 % seulement chez l’homme, nécessaires aux grandes fonctions cellulaires.
voire moins.
Le passage du gène (unité informationnelle pré-
L’ensemble de ces gènes, dont le nombre varie de sente dans le noyau) à la protéine (unité fonction-
quelques milliers chez la levure (6 200) à une tren- nelle synthétisée dans le cytoplasme) se fait en deux

RE 6 - 2 © Techniques de l’Ingénieur 06-2002


RECHERCHE

Chromosome

Gène A Gène B

Exon 1 Exon 2 Exon 3

Transcription
Exon 1 Exon 2 Exon 3
AAAAA

ARN messager Noyau

ARN messager
Cytoplasme
AAAAA

Traduction

Protéine

Figure 3 – Passage du gène à la protéine

étapes dites de transcription puis de traduction, pas- Ce transcriptome est le reflet instantané de l’acti-
sant par la synthèse d’un intermédiaire important : vité cellulaire. Il peut donc varier :
l’ARN messager, selon le principe décrit sur la
figure 3. — d’un type cellulaire à l’autre (neurone, cellule
sanguine, cellule de la peau...) ;
À partir d’un même gène, plusieurs copies d’ARN
messagers peuvent être produites simultanément en — pour un type cellulaire donné, il varie au cours
fonction de l’activité de la cellule. des différentes phases de la vie de la cellule ;
— il varie également lorsque les cellules sont sou-
Le noyau de la cellule est comparable à une mises à des conditions particulières de stress (modi-
bibliothèque où serait stockées toutes les infor- fications environnementales : changement de milieu,
mations vitales pour la cellule. Comme dans tou- radiations, stress chimique ou provoqué par des
tes les bibliothèques, les originaux ne peuvent médicaments...) ;
sortir. Seules les photocopies y sont autorisées. — il diffère enfin entre un état sain de la cellule et
L’ADN est donc photocopié en un nombre d’exem- un état pathologique de celle-ci.
plaires variable à l’intérieur du noyau au cours de
l’étape dite de transcription. Les photocopies, Pouvoir comparer le transcriptome de différents
ici les ARNs messagers, sont ensuite distribuées types cellulaires, dans différentes conditions de
dans le cytoplasme aux unités de production pro- stress, pouvoir analyser l’ensemble du transcriptome
téique que sont les ribosomes : c’est l’étape de d’une cellule à différents stades de son cycle cellu-
traduction. laire ou dans des conditions « pathologiques » per-
mettrait de mieux comprendre le fonctionnement
On appelle transcriptome l’ensemble des ARN cellulaire sur le plan fondamental. Cette analyse du
messagers transcrits. Plusieurs milliers de transcrits transcriptome offre également beaucoup d’intérêt en
différents sont présents dans le cytoplasme de la cel- termes d’applications comme nous le verrons ci-
lule à un instant donné. après.

06-2002 © Techniques de l’Ingénieur RE 6 - 3


RECHERCHE

Addition de A
Cette analyse simultanée de milliers de trans- A
crits en parallèle n’était pas envisageable il y a
seulement une dizaine d’années. Le développe- A
ment, au début des années 1990, d’un nouvel A
outil d’analyses, les PUCES à ADN, l’a rendue
désormais possible.

A Masque
2. Les puces à ADN T A C A G
C G C C T A
2.1 Principe A G T G G G
Comme décrit précédemment, l’ADN est présent A T G T G A
dans la cellule sous forme d’un double brin, la
séquence de chaque brin (c’est-à-dire la succession
des nucléotides) étant parfaitement complémentaire a synthèse « in situ » base par base,
de la séquence du brin en vis-à-vis (cf. figure 2). utilisant des masques successifs
C’est ce principe qui sert de base au concept des
puces à ADN, comme à beaucoup d’autres techni-
C
ques utilisées en biologie moléculaire, d’ailleurs.
C
Les puces à ADN sont en fait des supports fonction-
nalisés en verre ou en silicium, de petite taille (la T
taille d’une lame de microscope : 25 mm × 75 mm) T G G
sur lesquels vont être synthétisées directement, ou A G
C
greffées après synthèse, des milliers de séquences
d’ADN nucléiques, appelées sondes, caractéristiques A C T
d’autant de gènes (entre 5 000 et 12 000) (figure 4). A C A
La synthèse directe sur la lame est très onéreuse C T C
et peu souple car elle nécessite la conception de T G C
masques différents pour chaque étape de couplage A T
G
entre deux nucléotides. Aussi la méthode de greffage
des sondes après synthèse se révèle être la plus cou-
ramment utilisée : moins coûteuse, elle permet de Puce
déposer n’importe quelle sonde déjà synthétisée. Ces
puces à ADN sont ensuite mises en contact avec b greffage des sondes après synthèse
l’ensemble des transcrits issus d’une cellule, les
cibles, marqués par un fluorochrome. C’est l’étape Figure 4 – Greffage des sondes sur la puce
d’hybridation. Pendant cette étape, les séquences
cibles marquées du fluorochrome reconnaissent,
parmi les séquences sondes greffées sur la puce, cel- met, pour chaque gène que l’on veut voir figurer sur
les qui leur sont complémentaires et s’y apparient. la puce, de déterminer de courtes séquences nucléo-
Après hybridation, les hybrides cibles/sondes, sont tidiques le caractérisant. Juste avant l’hybridation, on
repérés et quantifiés grâce à leur fluorescence. dénature l’ADN pour qu’il se trouve sous la forme
Outre le fait que l’on peut, grâce aux puces à ADN, simple brin sur la puce, ce qui lui permettra de
analyser en un même temps un nombre considérable s’accrocher au brin complémentaire contenu dans la
de séquences, l’utilisation de 2 fluorochromes diffé- cible. Ces séquences vont servir d’amorces à une
rents [un rouge (Cy5) et un vert (Cy3) par exem- enzyme, la polymérase, qui synthétise par des réac-
ple] permet de comparer les niveaux d’expression tions en chaîne des copies rigoureusement identi-
relatifs de 2 transcriptomes différents sur une même ques caractéristiques du gène en question afin
Dans les Techniques puce. On obtient alors, en une seule étape et donc d’obtenir une quantité suffisante de sonde : c’est la
de l’Ingénieur : dans des conditions rigoureusement identiques technique de PCR (polymerase chain reaction)
Analyse des acides d’hybridation, 2 images : une rouge et une verte (figure 6).
nucléiques [P 3 315],
par B. Parfait et représentatives chacune d’un transcriptome. Ces Après 35 ou 40 cycles, l’ADN ainsi synthétisé (ou
D. Vidaud (2002). 2 images sont ensuite superposées « in silico » pour sonde) est purifié et quantifié. Il est alors quantita-
analyser le différentiel d’expression (figure 5). tivement et qualitativement prêt à être déposé
mécaniquement sur le support : la puce.
2.2 Les différentes étapes
de la réalisation d’une puce à ADN ■ Dépôt des sondes sur le support
fonctionnalisé
sur lame de verre
Après la synthèse, la purification et le contrôle des
■ Production des sondes milliers de sondes, celles-ci sont déposées sur la
Les sondes sont des séquences d’ADN double brin puce : une lame de verre de 25 mm × 75 mm recou-
caractéristiques des gènes dont on cherche à déter- verte d’une fine couche de polymère (du silane ou de
miner la fonction ou l’implication dans un processus la l-polylysine), permettant de « fixer » les sondes
métabolique. L’accès à des bases de séquences per- génomiques par de simples liaisons électrostatiques.

RE 6 - 4 © Techniques de l’Ingénieur 06-2002


RECHERCHE

Transcriptome modifié
marqué au Cy5 (rouge)
Puce ADN

Image Cy5
635 nm

Scanner Image
résultante

Hybridation
compétitive

Image Cy3
532 nm
Transcriptome témoin
marqué au Cy3 (vert)

Figure 5 – Principe de l’hybridation compétitive

ADN double brin

96 °C Dénaturation

ADN dénaturé

55 à 60 °C Appariement
des amorces

Amorçage

72 °C Élongation

Synthèse des brins …


complémentaires

Fin du 1er cycle Fin du 2e cycle Fin du 3e cycle

Figure 6 – Production des sondes par PCR

Le dépôt est effectué par des robots dont la précision ce cas, la sonde, prélevée par une buse, est projetée
est de l’ordre de la dizaine de micromètres. sur la lame, sans contact direct avec celle-ci. Le dia-
Le dépôt proprement dit peut être réalisé par con- mètre des dépôts peut varier de 80 à 300 µm. La dis-
tact grâce à des aiguilles qui prélèvent un infime tance entre 2 dépôts sur la lame est de l’ordre de
volume de sonde et qui viennent au contact de la 250 µm (centre à centre) dans les 2 directions. Le
lame, ou par une technique de « jet d’encre ». Dans volume de sonde déposé est lui de l’ordre de 2 nL.

06-2002 © Techniques de l’Ingénieur RE 6 - 5


RECHERCHE

Dans notre laboratoire, nous réalisons en routine des


spots de 180 µm de diamètre avec un espacement de A A T
centre à centre de 250 µm. T T T
250 µm A A A Cible marquée
■ Préparation et marquage des cibles T A C complémentaire
de la sonde
À un instant donné, des milliers de transcrits diffé- A—T T T

180 µm
greffée
rents sont présents dans les cellules. Leur abondance T—A A A
relative est révélatrice de l’activité cellulaire du T—A A A
moment. Afin d’analyser l’ensemble de ces transcrits T—A A—T A—T
qui serviront de cibles pour l’étape d’hybridation, il A—T T—A T—A
faut les extraire, puis leur incorporer un marqueur T—A A—T T—A
fluorescent qui permettra d’évaluer et de quantifier A—T A—T A—T Sonde greffée
Schéma de dépôt T—A A—T G—C
des sondes l’appariement sonde/cible. L’extraction de ces trans-
A—T T—A T—A
crits se fait à partir de quelques millions de cellules
A—T T—A C—G
(provenant de cultures cellulaires ou de biopsies), T—A A—T A—T
par les techniques physico-chimiques classiques de
séparation (lyse de la cellule et séparation sélective
Si l’on réalise le mar- Puce
quage au jour J, l’hybri- des ARN messagers).
dation de la puce se fait
sur la nuit, l’acquisition Comme il n’existe aucune technique de marquage
de l’image survient le direct de ces ARN, le marquage de ces derniers à Figure 7 – Hybridation spécifique cibles marquées/
jour suivant (J+1). sondes
L’analyse de l’image l’aide de marqueurs fluorescents nécessite une étape
peut se faire dans la supplémentaire : pour réaliser le marquage, on
journée J+1 voire J+2
(selon le nombre de effectue une transcription inverse pour revenir de
spots à analyser). l’ARN messager à la séquence nucléotidique du gène obtenir des valeurs relatives ou ratio d’expression,
de départ. C’est durant cette réaction de synthèse pour chacun des gènes présents sur la puce.
inverse que sont incorporés les marqueurs fluores-
cents (rouge Cy5 ou vert Cy3). On obtient ainsi un
mélange de cibles marquées qui seront ensuite mises
3.1 Localisation des spots
en contact avec les sondes greffées sur la puce pour Pour localiser les spots, il faut utiliser un
l’étape d’hybridation. « masque », une grille théorique définie par des cri-
tères précis pour la disposition des lignes et colon-
■ Étape d’hybridation
nes, en fonction du plan de dépôt. Ce masque est
Elle consiste à mettre en présence les séquences placé sur l’image pour repérer chacun des spots. Ce
cibles marquées et les séquences sondes greffées sur repérage doit être simple, rapide, automatique et
la puce. Du fait de la complémentarité A-T et G-C, les précis.
séquences complémentaires s’apparient (figure 7).
En effet, si l’expérimentateur devait réajuster
La réaction d’hybridation dure quelques heures en manuellement 10 000 spots par puce, cela pourrait
milieu liquide favorisant les liaisons entre séquences prendre énormément de temps. Il faut donc trouver
complémentaires. Les lames, après hybridation, sont le juste équilibre entre la précision du repérage et le
rincées pour se débarrasser des cibles ne s’étant pas gain de temps, car une bonne localisation des spots
fixées ou s’étant fixées de manière non spécifique. est essentielle pour la suite de l’analyse.
Après séchage, les lames sont scannées afin d’établir
le profil d’hybridation.
3.2 Segmentation des spots
3. Acquisition de l’image La segmentation est un processus de classification
des pixels d’une image, en fonction de leurs proprié-
et analyse des données tés. Pour les puces à ADN, la segmentation permet
d’identifier chaque pixel « bruit de fond » ou
Après la lecture des lames par un scanner qui per-
« signal ». Le bruit de fond n’est jamais uniforme sur
met de mesurer la fluorescence de chaque spot sur la
une lame, il varie en fonction de la surface, de l’auto-
lame, il convient d’analyser les images obtenues pour
fluorescence du support ou de l’hybridation non spé-
pouvoir en extraire une indication sur le différentiel
cifique. Il est donc indispensable d’évaluer le bruit de
d’expression pour chacun des gènes présents sur la
fond pour chaque spot. Il existe plusieurs méthodes
puce.
de segmentation qui peuvent être classées en quatre
L’analyse d’image se fait en trois étapes : catégories en fonction de la définition du spot : cercle
— localisation des spots, c’est-à-dire déter- fixe, cercle adaptable, histogramme et forme adapta-
mination des coordonnées de chaque spot sur la ble [1] (figure 9).
puce ;
■ Segmentation en cercle fixe
— segmentation des spots qui permet de discri-
miner, pour chaque spot, les pixels « signal » des Le contour du spot est défini par un cercle de dia-
pixels « bruit de fond » ; mètre constant, identique pour tous les spots de
l’image. Les pixels à l’intérieur du cercle correspon-
— extraction des données : elle consiste à défi- dent au signal, ceux à l’extérieur au bruit de fond.
nir, pour chaque spot, des paires d’intensités du Cette méthode décrite pour la première fois par
signal Cy3 et Cy5. (figure 8) l’équipe d’Eisen de l’université de Stanford [2] est
Les valeurs brutes obtenues à l’issue de l’analyse particulièrement efficace lorsque les spots sont
d’image sont ensuite filtrées et normalisées pour homogènes et parfaitement localisés. En revanche,

RE 6 - 6 © Techniques de l’Ingénieur 06-2002


RECHERCHE

SO–
3 SO–
3

–O S
3 SO–
3
N+ N

O O N

O
a formule chimique du fluorochrome Cy3TM

SO–
3 SO–
3

–O S
3 SO–
3
N+ N
Le spot est délimité par un cercle rouge
O
Figure 9 – Image illustrant les différentes méthodes
O N de calcul de bruit de fond
O

b formule chimique du fluorochrome Cy5TM


pixels situés dans cette zone tampon entre la zone
signal et la zone bruit sont éliminés de la mesure.
Cette méthode est plus robuste ; toutefois comme
pour les cercles fixes, il existe une perte d’informa-
Émission de fluorescence normalisée

tion sur les spots très irréguliers.


100
Cy3 Cy5
■ Histogramme
80
Cette méthode utilise un masque beaucoup plus
60 large que les spots, en général une surface carrée,
autour des spots. Le signal et le bruit de fond sont
40 déterminés à partir d’un histogramme de distribution
des intensités de chaque pixel de la surface considé-
20 rée autour du spot. Plusieurs approches statistiques
peuvent être alors utilisées pour différencier les deux
0 populations de pixels. Les pixels qui dépassent une
500 550 600 650 700 750 800 850 valeur seuil sont classés en tant que signaux, les
Longueur d'onde (nm) autres sont définis comme bruit de fond. L’avantage
majeur de cette méthode est sa simplicité et la pos-
c émission de fluorescence des deux sibilité de traiter n’importe quelle forme de spot. En
fluorochromes a et b revanche, la quantification est instable car elle
dépend du test et de la valeur seuil utilisée pour la Pour le calcul du bruit
de fond, les logiciels
Figure 8 – Formule chimique et émission segmentation. Quantarray, Scanalyse,
de fluorescence de Cy3 et Cy5 et Spot tiennent
compte respectivement
■ Forme adaptative des zones délimitées en
vert, en bleu ou en
mauve sur la figure 9.
elle est très sensible aux irrégularités de taille et de Dans le but de pallier les problèmes d’irrégularité
forme des spots. des spots, on a défini des algorithmes de segmenta-
tion prenant en considération la forme de chaque
■ Cercle adaptable spot. Deux méthodes sont couramment utilisées
Le diamètre de chaque spot est estimé par une dans l’analyse d’image : « ligne de partage » et
méthode automatique et le contour des spots varie « tête de série croissante ». Ces deux approches
donc en fonction du diamètre. De la même manière nécessitent la localisation d’une origine pour définir
que pour les cercles fixes, les pixels à l’intérieur du le spot « tête de série », avant de définir son contour
cercle correspondent au signal. Les pixels et d’analyser de proche en proche les niveaux
« brillants » à l’extérieur du cercle peuvent fausser la d’intensité autour du pixel initial. Dans l’analyse des
mesure et entraîner des erreurs. Afin de les diminuer, puces, la position de spots étant connue a priori, ce
une zone tampon est définie par l’algorithme. Les type d’approche paraît justifié.

06-2002 © Techniques de l’Ingénieur RE 6 - 7


RECHERCHE

3.3 Extraction des données — si ce rapport est supérieur à 1, le gène est dit
surexprimé ou induit (on parle alors de ratio d’induc-
■ Sélection des gènes significatifs tion).

Le niveau d’expression d’un gène correspond en ■ Normalisation des données brutes


fait à une mesure relative des intensités de fluores- Pour pouvoir comparer des données entre plu-
cence en Cy5 et Cy3. Un filtrage des données est sieurs expériences, il est essentiel de les normaliser.
réalisé pour sélectionner les gènes présentant une Il convient donc de corriger si nécessaire les intensi-
variation d’expression significative. Le tri des spots tés en Cy3 et Cy5 pour éliminer les artefacts dus
est basé sur une valeur seuil définie pour plusieurs au protocole expérimental, comme par exemple : la
critères de qualité. Les spots obtiennent un bon score qualité des lames, la quantité d’ARN, la différence de
s’ils possèdent des valeurs supérieures aux seuils. marquage des ARN avec les fluorophores. La plupart
Les intensités des signaux, les bruits de fond et le des logiciels d’analyse normalisent à partir de la
nombre de pixels d’un spot dont l’intensité est au médiane ou de la moyenne des intensités. Toutefois
moins supérieure à une ou deux fois le bruit de fond cette approche est peu satisfaisante. Sachant que
moyen sont, en règle générale, les critères considé- l’expression de la majorité des gènes reste stable,
rés. Les gènes répondant à ces critères de qualité une méthode alternative consiste à calculer la droite
sont alors analysés pour définir le ratio d’induction de régression des intensités après analyse graphique
ou de répression, c’est-à-dire ceux dont le ratio est des résultats. Une translation par rapport à
significativement différent de 1 ; en effet, on établit l’ordonnée à l’origine et/ou au coefficient de corréla-
pour chaque gène le rapport : fluorescence essai/ tion peut être ainsi effectuée. Plus récemment, les
fluorescence témoin : utilisateurs de puces s’orientent vers une normalisa-
tion par bloc de dépôt, chaque aiguille du robot ayant
— si ce rapport est inférieur à 1, le gène est dit un comportement différent.
réprimé (on parle de ratio de répression) ;
Le cycle complet d’une expérience réalisée au
— si ce rapport est égal à 1, le gène est dit moyen d’une puce à ADN sur la plate-forme du
invariant ; Génopôle d’Evry est décrit figure 10.

Bases de données Préparation et Conception des


Analyses de contrôle des plans de dépôt
séquences sondes
Choix des sondes Échantillonnage

Marquage
des cibles

Dépôt des sondes

Hybridation
sondes/cibles
Lecture
(numérisation)

Analyse
d'image

Analyses résultats Conservation


dans bases
de données

Figure 10 – Plate-forme du Génopôle d’Evry

RE 6 - 8 © Techniques de l’Ingénieur 06-2002


RECHERCHE

Figure 11 – Image de la totalité du transcriptome de la levure (6 300 gènes)

4. Principales utilisations l’identification des deux pathologies par les techni-


ques d’anatomopathologie ou de cytopathologie est
des puces à ADN difficile et demande une grande expertise. L’analyse
de l’expression de 6 000 gènes humains sur ces
4.1 Dynamique du transcriptome patients a permis de différencier les LMA des LLA par
une centaine de gènes, signature de l’une ou l’autre
Pour la première fois au milieu des années 1990, des pathologies [8]. La valeur prédictive de cette
les puces à ADN ont permis d’analyser l’expression signature (ensemble de 100 gènes) est proche de
de milliers de gènes en parallèle. Cette approche a 100 %, alors qu’aucun gène en particulier ne peut
été particulièrement utilisée chez la levure, car tous prédire à lui seul l’appartenance à telle ou telle
les gènes étant connus, la totalité du génome de la classe. En outre, un troisième type de patients,
levure peut être déposé sur une seule puce. Ces pre- jamais identifié auparavant, a été caractérisé par
mières expériences, qui ont consisté à générer des cette technologie.
profils d’expression de systèmes biologiques déjà
bien connus tels que le cycle cellulaire de la levure ou
la simulation des fibroblastes par le sérum chez 4.3 Analyse des voies biochimiques
l’homme, ont aussi permis de valider la technologie Les approches globales telles que les puces à ADN
[3] [4]. permettent d’étudier la mise en place de voies méta-
Une bonne concordance a été observée entre les boliques. Chez la levure, les puces à ADN ont permis
variations de gènes connus mesurées par les métho- d’étudier la réorientation du métabolisme suite à un
des traditionnelles (northern RT-PCR, etc.) et les changement des conditions de culture [9].
puces à ADN. Depuis, de véritables recueils de pro- De même, Fambrough et ses collègues [10] ont
fils d’expression ont été réalisés chez la levure [5] étudié la cascade de signalisation des récepteurs à
avec plus de trois cents conditions expérimentales activité tyrosine-kinase dans les cellules NIH3T3. Ces
différentes. Grâce aux études cinétiques réper- récepteurs membranaires jouent un rôle clé dans la
toriées, il devient possible d’avoir une idée de la signalisation de la membrane vers le noyau. Cette
dynamique du transcriptome et des réseaux géné- analyse a révélé une redondance fonctionnelle consi-
tiques impliqués (figure 11). dérable et surprenante entre les différents mutants
de cette voie de signalisation.
4.2 Signatures moléculaires L’étude a également montré que ces récepteurs
Les profils d’expression caractéristiques d’un tissu, initiateurs de la transmission de signaux peuvent
d’un type cellulaire, ou bien encore d’un patient remplir d’autres fonctions dans la cellule, telles que
deviennent des signatures moléculaires de cette con- la simulation de la production d’interleukine. Ces
dition. Des recueils de signatures moléculaires ont voies biochimiques alternatives n’auraient pas pu
été récemment établis à partir de dix-neuf types de être découvertes sans l’utilisation des puces à ADN
tissus humains [6] ou des cellules de l’immunité chez contenant des milliers de gènes.
l’homme [7].
Ces signatures moléculaires permettent aussi la
4.4 Génomique fonctionnelle
classification des patients. Ainsi, la distinction entre Toutes les applications que nous avons considérées
une leucémie myéloïde aiguë (LMA) et une leucémie jusqu’à présent consistent à classer les patients ou
lymphoïde aiguë (LLA) est essentielle afin de pouvoir les situations biologiques en fonction de gènes. Il est
orienter correctement le traitement des patients. Or, possible de faire l’inverse pour explorer la fonction

06-2002 © Techniques de l’Ingénieur RE 6 - 9


RECHERCHE

des gènes in silico et déterminer la fonction d’un loppements similaires commencent à apparaître pour
gène inconnu. Ainsi, à partir d’un compendium de l’analyse massivement parallèle des protéines ou
profils d’expression chez C. elegans on a pu identifier d’autres composantes cellulaires.
quelques grandes fonctions de gènes [11]. Cette révolution technologique, ce changement
d’échelle de la recherche biologique, va de pair avec
4.5 Action des médicaments une utilisation croissante de la robotique et de l’infor-
C. elegans est un ver
Les puces à ADN peuvent aussi être utilisées pour matique. Les biologistes, traditionnellement confron-
nématode de 959 cellules
de son vrai nom Caenor- l’identification de nouvelles cibles pour les médica- tés à quelques dizaines de données expérimentales,
habditis elegans.
ments. La plupart des médicaments agissent en inhi- vont devoir désormais apprendre à gérer des centai-
bant leur molécule cible, enzyme ou récepteur. Par nes de milliers de données. Grâce à ces technologies,
conséquent, une mutation du gène correspondant il est vraisemblable que la biologie prendra une
devrait avoir un effet similaire sur le transcriptome dimension théorique plus marquée.
de la cellule. Marton et al. [12] ont utilisé une puce à
ADN contenant le génome de la levure pour montrer Mots clés : puces à ADN, génomique fonction-
l’existence d’une corrélation entre le profil obtenu nelle, bio-informatique, profils d’expression,
lors d’une simulation médicamenteuse antimicro- transcriptome.
bienne et le profil d’expression d’une levure portant Keywords : DNA chips, functional genomics,
un gène muté et impliqué dans le métabolisme bioinformatic, expression profiles, transcriptome.
d’action de ce médicament.
Bien entendu, cette approche pourrait être réalisée
en aveugle pour rechercher le mode d’action d’un Sites à consulter
médicament en comparant le profil obtenu avec ce National Human Genome Research Institute,
dernier à une base de données répertoriant les profils National Institute of Health http://nhgri.nih.gov
d’expression de centaines de mutants. Cette appro- Affymetrix http://www.affymetrix.com
che pourrait permettre de trouver les groupes de
gènes modulés par différentes classes de médica- National Institute of Environmental Health Scien-
ments. De même des banques de données ces Microarray Center
répertoriant les profils d’expression engendrés par http://dir.niehs.nih.gov/microarray/bioinfor.htm
les médicaments pourraient permettre d’évaluer et DNA Microarray (Genome chips)
prédire l’efficacité et la toxicité de ces médicaments http://www.gene-chips.com/
[13].
European Bioinformatics Institute
http://www.ebi.ac.uk/microarray/
Contact auteur
5. Conclusion De Risi Lab. Department of Biochemistry and Bio-
SOULARUE Pascal : Les puces à ADN ont permis de réaliser un saut physics
SOULARUE@dsvidf.cea.fr
quantique dans l’analyse biologique. Il est mainte- http://www.microarrays.org/protocols.html
nant possible d’analyser l’expression de milliers de The Institute for Genomic Research
gènes en parallèle et à haut débit. Des déve- http://www.tigr.org/tdb/microarray/

Références bibliographiques
[1] YANG (Y.H.), BUCKLEY (M.J.), DUTOIT (S.) et SPEED [8] GOLUB (T.R.), SLONIM (D.), TAMAYO (P.) et al. – Mole-
(T.P.). – Comparison of methods for image analysis on cular classification of cancer : class discovery and class
cDNA microarray data. Tech report 584 (2000). prediction by gene expression monitoring. Science
[2] EISEN (M.B.), SPELLMAN (P.T.), BROWN (P.O.) et (2000).
BOTSTEIN (D.). – Cluster analysis and display of [9] IDEKER (T.), THORSSON (V.), RANISH (J.) et al. – Inte-
genome-wide expression pattern. Proc Natl Acad Sci grated genomic and proteomic analyses of a systema-
USA 95 p. 14863-8 (1998). tically perturbed metabolic network. Science 292
[3] SPELLMAN (P.T.), SHERLOCK (G.), ZHANG (M.Q.) et al. p. 929-34 (2001).
– Comprehensive identification of cell-cycle-regulated
[10] FAMBROUGH (D.), McCLURE (K.), KAZLAUSKAS (A.) et
genes of the yeast Sacchaaromyces cerevisae by
LANDER (E.S.). – Diverse signaling pathways activated
microarray hybridization. Mo biol Cell 9 p. 3273-97
by growth factor receptors induce broadly overlapping
(1998).
rather than independent set of genes. Cell 97 p. 727-
[4] IYER (V.R.), EISEN (M.B.), ROSS (D.T.) et al. – The 41 (1999).
transcriptional program in the response of human
fibroblast to serum. Science 283 p. 83-7 (1999). [11] KIM (S.K.), LUND (J.), KIRALY (M.) et al. – A gene
expression map fo Caenorhabditis elegans. Science
[5] HUGUES (T.R.), MARTON (M.J.), JONES (A.R.) et al. –
293 p. 2087-92 (2001).
Functional discovery via a compendium of expression
profiles. Cell 102 p. 109-26 (2000). [12] MARTON (M.J.), de RISI (J.L.), BENNETT (H.A.) et al. –
[6] HSIAO (L.L.), DANGOND (F.), YOSHIDA (T.) et al. – A Drug traget validation and identification of secondary
compendium of gene expression in normal tissues. drug target effects using DNA microarray. Nat Med 4
Physiol Genomics 7 p. 97-104 (2001). p. 1293-301 (1998).
[7] SHAFFER (A.L.), ROSENWALD (A.), HURT (E.M.) et al. [13] SCHERF (U.), ROSS (D.T.), WALTHAM (M.) et al. – A
– Signature of the immune response. Immunity 15 gene expression database for the molecular pharmaco-
p. 375-85 (2001). logy of cancer. Nat Gen 24 p. 236-44 (2000).

RE 6 - 10 © Techniques de l’Ingénieur 06-2002