0% ont trouvé ce document utile (0 vote)
63 vues76 pages

Organismes Modèles en Recherche Biomédicale

Transféré par

alias.alia.ro
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
63 vues76 pages

Organismes Modèles en Recherche Biomédicale

Transféré par

alias.alia.ro
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

République Algérienne démocratique et populaire

Département Biologie et Physiologie cellulaire


Faculté Science de la Nature et de la Vie
Université Saad Dahleb, Blida 1

Matière enseignée au Master II

Option Génétique et physiologie humaine


Sommaire
Historique
Chapitre I : Organismes modèles, Présentation générale
* Concept d‘’Organisme modèle’’
* Classification des Organismes modèles
* Modèles naturels
* Modèles expérimentaux
* Modèles génétiquement modifiés
* Modèles négatifs
* Modèles orphelins
*Présentation de quelques Organismes modèles
* Souris
* Vers Nématode
* Drosophile
* Levure
* Autres Organismes modèles

Chapitre II : Notions en Génomique


* Quelques bases en génétique moléculaire
* Notions d’ingénierie génomique
* Approche bio-informatique

Chapitre III : Analyse des génomes


* Interaction génique
* Expression ectopique du gène
* Recherche de gènes modificateurs
* Criblage moléculaire
* Motifs génomiques des organismes modèles

Chapitre IV : La place des organismes modèles dans la recherche


* Le modèle animal dans l’expérimentation
* Notion d’expérimentation Animale
* Quelques organismes modèles dans les maladies génétiques humaines

Chapitre V : Transgénèse, stratégies à grandes échelles


* Notions d’organismes transgéniques
* Techniques de transgénèse et de clonage
* Applications de la transgénèse et du clonage
* Thérapie génique
* Différentes Applications De Thérapie Génique
Historique

Durant les deux derniers siècles, l'expérimentation, à partir des organismes modèles,
a permis l'essor de la recherche biomédicale et l'expression "animal modèle de maladie
humaine" est devenue courante, sans pour autant que ses significations soient entièrement
précisées. Ainsi, le développement des modèles animaux en médecine depuis la fin de la
seconde guerre mondiale a connu une période d’euphorie durant les décennies 1960-1990.
De nouveaux outils ont permis de rêver à la construction d’une souris idéale, mais la science
des modèles animaux a suivi d’autres chemins.
Le concept de « modèle animal » est devenu central dans les sciences médicales
contemporaines de manière progressive et surtout à partir des années soixante, avec des
occurrences de citation maximales du concept au cours des années quatre-vingt-dix. Le
développement de ces modèles a connu une époque d’expansion prodigieuse tout au long de
ces quatre décennies. Elle a initié une période plus récente d’interrogation épistémologique
et historique sur la signification de ce phénomène et une critique, de ce qu’est, d’une part, un
modèle animal aujourd’hui et, d’autre part, de ce qu’il ne peut pas être. (Jean-Gaël ,2015)
Un modèle animal est un animal modifié ou présentant une caractéristique spontanée,
intégré dans un système expérimental en vue d’étudier des processus pathogéniques et/ou
des actions thérapeutiques qui seront utiles pour comprendre et soigner des pathologies
humaines. L’établissement de ces systèmes expérimentaux constitue une stratégie de
contournement épistémologique pour répondre à des problèmes de manière indirecte, sans
recours immédiat à l’expérimentation sur l’homme pour envisager des traitements et analyser
les causes des maladies. En ce sens, les modèles animaux ont une histoire ancienne puisque
l’observation d’une chèvre épileptique du corpus hippocratique fait de cet animal un véritable
modèle de l’épilepsie humaine dans le cadre de la théorie des humeurs. Dans le domaine de
la chirurgie, l’entraînement aux procédés opératoires sur des animaux, ou la reproduction de
lésions sur l’animal en vue d’imaginer des traitements, sont des pratiques anciennes qui
utilisent des modèles animaux bien caractérisés au XVIIIe siècle et dans la physiologie
expérimentale du XIXe siècle. (Jean-Gaël ,2015)
Ce concept est éloigné de celui d’« organisme modèle » ou d’« animal modèle ». Dans
ces derniers cas, on a affaire à des animaux sélectionnés par une communauté de chercheurs
pour aborder, d’une même façon et au sein d’une culture épistémique particulière, une série
de problèmes scientifiques fondamentaux. Par exemple, le développement du mouvement
des neurosciences s’est largement inspiré, à partir des années 1950-1960, d’une culture
d’animaux modèles vertébrés et invertébrés dont les caractéristiques physiologiques et
anatomiques rendaient l’étude de certaines fonctions particulièrement aisées. (Jean-Gaël
,2015)

1
Chapitre I : Organismes modèles, Présentation générale

* Concept d‘Organisme modèle

Les modèles animaux ont été développés pour répondre à des interrogations
concernant les traitements et les causes de certaines pathologies humaines dans des cadres
théoriques particuliers caractérisés par certaines théories pathogéniques en lien avec les
sciences biologiques du moment. Il est possible d’envisager de prime abord à grands traits
l’évolution historique de la création de ces modèles animaux en distinguant de grandes
catégories pathogéniques définies de manière transhistorique, afin de faire apparaître
certaines continuités et les changements caractéristiques des nouveaux modèles animaux des
sciences médicales après la seconde guerre mondiale. (Jean-Gaël ,2015)

a. Le modèle animal

Les modèles animaux ont été développés pour répondre à des interrogations
concernant les traitements et les causes de certaines pathologies humaines dans des cadres
théoriques particuliers caractérisés par certaines théories pathogéniques en lien avec les
sciences biologiques du moment.
Il est possible d’envisager de prime abord à grands traits l’évolution historique de la création
de ces modèles animaux en distinguant de grandes catégories pathogéniques définies de
manière transhistorique, afin de faire apparaître certaines continuités et les changements
caractéristiques des nouveaux modèles animaux des sciences médicales après la seconde
guerre mondiale. (Gayon Jean ; 2006)

b. Modes de constitution des modèles animaux


Après la seconde guerre mondiale, les sciences médicales se caractérisent donc par
l’extension des cadres étiologiques des pathologies humaines et par les créations associées
de modèles animaux dans des contextes épistémiques utilisant de nouveaux concepts. Au
nombre de ceux-ci, les concepts de nouveaux agents infectieux (rétrovirus, prion,
mycoplasme), ceux des nouvelles technologies (transplantations, organes artificiels, thérapies
par stimulations), les nouveaux concepts physiologiques (neurohormones, neuromédiateurs)
et moléculaires (mutation, méthylation de l’ADN, agrégats protéiques extracellulaires).
On recourt également à l’utilisation de nombreuses espèces (zoologie et pathologie
comparées), de collections de souches animales mutantes stables et, enfin, d’animaux
génétiquement modifiés.
Toutefois, la réalisation d’un modèle animal ne se limite pas à la création d’un animal
présentant certaines caractéristiques pathologiques ou certaines modifications destinées à
prévenir ou traiter une pathologie qui n’est pas présente. Le modèle animal est également
partie intégrante d’un système expérimental qui réalise, dans son ensemble, les conditions
qui déterminent un état pathologique et qui présente des similitudes avec un état chez
l’homme. Par exemple, une souche de rat épileptique ne constitue pas en elle-même un
modèle animal de l’épilepsie humaine. Ce qui est étudié, ce sont des successions de crises

2
Chapitre I : Organismes modèles, Présentation générale

d’épilepsie qui sont tout aussi bien déterminées par le fond génétique, les conditions
d’élevage et les facteurs environnementaux immédiats. Le modèle animal est donc bien un
dispositif et pas seulement une catégorie d’animaux de laboratoire.
Par conséquent, les modes de constitution de modèles animaux ne se limitent pas à la
possibilité de créer un animal susceptible de développer ou pas une maladie, mais s’étendent
à toutes les conditions expérimentales du système.

* Classification des Organismes modèles


La majorité des organismes modèles doivent répondre à certains critères. Les espèces
utilisées sont faciles à manipuler en laboratoire et doivent permettre une culture ou élevage
facile d'un grand nombre d'individus. Ils doivent ainsi être relativement petit. Leur cycle de vie
et temps de génération sont relativement courts (1,5 à 3 heures pour la levure, environ 8
semaines pour la souris). Les organismes eucaryotes utilisés sont (à l'exception de la levure)
des organismes multicellulaires simples avec différents types de cellules. Le nombre total de
cellules est petit et ont un développement stéréotypé. Leurs gènes doivent permettre une
étude génétique, suivre les lois de Mendel et permettre l'induction de mutations. Ils doivent
être phylogénétiquement et taxonomiquement proche de l'Homme afin de pouvoir extrapoler
les résultats obtenus d'un modèle à l'Homme. (Vincent Thizeau ; 2002)

a. Organismes modèles naturels (spontanés)

Il s’agit de modèles animaux chez lesquels des maladies ou des affections d’origine
naturelle sont identiques à celles que l’on retrouve chez l’humain, comme le diabète,
l'hypertension, l'arthrite et les immunodéficiences en sont quelques exemples. Ou pour des
Maladies ou affections souvent associées à des mutations naturelles conduisant à des
désordres similaires à ceux décrits dans l’espèce modélisée (homme). (Jann Hau, 2002; Jean-
Claude Desfontis, 2008)

b. Organismes modèles expérimentaux


Il s’agit de modèles chez lesquels les scientifiques reproduisent expérimentalement
une affection ou une maladie. Par exemple, la streptozotocine est une substance chimique qui
permet de provoquer le diabète en endommageant les cellules productrices d'insuline dans le
pancréas ; il est également possible de provoquer un certain type de cancer à l'aide d'un
cancérogène chimique ou de déclencher un accident vasculaire cérébral de façon chirurgicale.
(Jann Hau, 2002; Jean-Claude Desfontis, 2008)

c. Organismes modèles génétiquement modifiés


Il s’agit d’un groupe particulier de modèles animaux dont on a manipulé le code
génétique pour provoquer la maladie à étudier. Ces modèles sont créés par l’insertion d’un
ADN étranger ou par le remplacement ou la neutralisation (“knock-out”) de certains gènes
dans le génome des animaux. Ils permettent par exemple l'étude du fondement génétique de
certaines maladies, la susceptibilité ou la résistance à celles-ci. (Jann Hau, 2002; Jean-Claude
Desfontis, 2008)

3
Chapitre I : Organismes modèles, Présentation générale

d. Organismes modèles négatifs


Certains animaux sont résistants à une affection ou une maladie donnée. En étudiant
les causes de cet état, on peut trouver des indices sur la résistance à la maladie et ses
fondements physiologiques. Par exemple, certaines souches de souris sont résistantes à
certains agents infectieux tandis que d'autres y sont sensibles. (Jann Hau, 2002; Jean-Claude
Desfontis, 2008)

e. Organismes modèles orphelins


Il s’agit de modèles animaux présentant des affections apparaissant naturellement
chez un animal et pour lesquelles il n'existe pas d'équivalent chez l'humain. Autrefois, la
tremblante du mouton entrait dans cette catégorie, mais cette maladie constitue maintenant
un modèle utile pour l'étude des encéphalopathies spongiformes humaines dont on entend si
souvent parler (ESB ou « maladie de la vache folle » ainsi que de l'encéphalopathie des
cervidés qui touche les cerfs). (Jann Hau, 2002; Jean-Claude Desfontis, 2008)

* Présentation de quelques Organismes modèles


Bien que le terme « modèle animal » ou « Organisme modèle » soit très employé, il
peut être utile de le définir pour permettre de mieux comprendre les contextes dans lesquels
il est utilisé. L'American National Research Council Committee on Animal Models for Research
and Aging a formulé la définition suivante : « En recherche biomédicale, un modèle animal est
un modèle permettant l'étude de la biologie ou des comportements normatifs, ou d’un
processus pathologique spontané ou induit ayant un ou plusieurs aspects communs avec un
phénomène équivalent chez l'humain ou d'autres espèces animales. (Jann Hau, 2002; Jean-
Claude Desfontis, 2008)
On peut citer quelques organismes modèles employés dans la recherche biomédicale, et
particulièrement ceux qui servent à l'étude des maladies et autres affections touchant les
humains, et à savoir :

 La Souris
La souris, Mus musculus, ne possède pas un génome plus réduit que celui de l'espèce
humaine, mais, en tant que mammifère, c'est le modèle animal qui en est le plus proche. La
possibilité de conduire tous les croisements désirés, l'existence de lignées pures et d'un grand
nombre de mutations identifiées (dont certaines apparentées à des maladies génétiques
humaines), en font un modèle irremplaçable pour les études de génétique et de biologie
moléculaire chez les mammifères.
Grâce à la transgenèse on peut étudier :
 L’inactivation de gènes (plus de 1000, à ce jour) par recombinaison homologue permet
de déterminer leur rôle, avec l'obtention de souris recombinées dites "knock out" ;

4
Chapitre I : Organismes modèles, Présentation générale

 La surexpression d'un gène d’intérêt (hormone de croissance : gigantisme ; oncogène


: modèles de carcinogenèse ; formes mutées de la beta-amyloid protéine : maladie
d'Alzheimer) permet d'en étudier le rôle ;
 Le transfert de gène rapporteur est utilisé pour étudier la régulation de l'expression de
gènes endogènes.

 Vers Nématode
Le nématode Caenorhabditis elegans est un modèle animal pluricellulaire très prisé
des embryologistes et des neurobiologistes. Cet animal présente l'avantage d'être totalement
transparent, ce qui permet de suivre le devenir de chaque cellule tout au long de son
développement. Les chercheurs ont pu ainsi déterminer la filiation exacte de chacune des
cellules de cet organisme depuis la fécondation jusque chez l'adulte (959 cellules).
On connaît aussi exactement l'ensemble des jonctions synaptiques établies par chacun des
302 neurones. De ce point de vue, nul autre organisme n'est aussi bien connu.
Les expériences de transgenèse sur C. elegans ont permis d'élucider le fonctionnement de
certains gènes du développement pour d'autres animaux, y compris l'Homme.

 Drosophile
Le diptère Drosophila melanogaster est un modèle très étudié, et ceci depuis les études
pionnières effectuées au début du XXe siècle par Morgan sur cette mouche, dans le domaine
de la génétique.
Une caractéristique particulièrement intéressante de cet animal est l'existence de
chromosomes polytènes dans certains de ses tissus. Ces chromosomes comprennent jusqu'à
un millier de molécules d'ADN identiques, qui sont le produit de multiples réplications de
l'ADN chromosomique sans qu'il y ait séparation des brins. Ces brins demeurent parallèles et
unis, ce qui leur confère une structure facilement observable, très utile pour la cartographie
physique de ce génome. On peut ainsi reconnaître environ 5 100 bandes par simple coloration
et observation microscopique de ces chromosomes, et la résolution obtenue est de l'ordre de
quelques dizaines de kilobases.
L'utilisation de la drosophile dans des expériences de transgenèse a permis de comprendre le
fonctionnement des gènes du développement (gènes homéotiques) responsables de
l'organisation antéro-postérieure du corps.

 Levure
La levure Saccharomyces cerevisiae est un modèle unicellulaire eucaryote utilisée
depuis de nombreuses années par les généticiens, les biologistes moléculaires et
microbiologistes. C'est aussi une espèce économiquement importante, puisqu'elle est utilisée
par les industries agroalimentaires.
Avantages (par rapport à E. coli) : les levures recombinées ne forment pas d'inclusions ; les
modifications des protéines recombinées sont possibles.

5
Chapitre I : Organismes modèles, Présentation générale

Inconvénients : les protéines recombinées à partir de S. cerevisiae présentent une


conformation qui n'est pas toujours correcte ; elles peuvent déclencher des réactions de
défense

 Autres Organismes modèles

 Escherichia coli
La bactérie Escherichia coli est un modèle unicellulaire procaryote utilisé depuis de
nombreuses années par les généticiens, les biologistes moléculaires et microbiologistes. C'est
aussi une espèce économiquement importante, puisqu'elle est utilisée par les industries
agroalimentaires.
Dans le domaine pharmaceutique E. coli recombinée est utilisée pour la production d'insuline
et d'hormone de croissance, strictement identiques aux protéines humaines.
Inconvénients : d'une part, les protéines recombinées produites sont souvent stockées sous
forme d'inclusions insolubles, d'où la difficulté d'extraction et de purification. D'autre part, les
protéines obtenues n'ont pas toujours leur conformation biologiquement active.

 Arabidopsis thaliana

La brassicacée (anciennement appelée crucifère) Arabidopsis thaliana, longtemps


considérée comme une "mauvaise herbe", est le modèle de référence des biologistes
moléculaires travaillant sur les végétaux supérieurs.
Haute de quelques dizaines de centimètres, elle peut boucler son cycle végétatif et
reproducteur en moins de deux mois d'où la possibilité de suivre génétiquement de 5 à 6
générations par an.
Son génome réparti sur 10 chromosomes à l'état diploïde est le plus petit génome
connu chez les angiospermes. Il est sept fois plus grand que celui d'une levure. C'est la raison
pour laquelle cette plante a été choisie pour un programme de séquençage intégral. On
connaît aujourd'hui un grand nombre de mutants affectés dans des fonctions physiologiques
ou dans l'édification de certains organes et, en particulier, de la fleur.
Les travaux de transgenèse chez A. thaliana ont permis, notamment, de mieux comprendre le
rôle des gènes homéotiques chez les végétaux.

Comparaison de quelques caractéristiques génétiques d'organismes modèles avec


celles de l'espèce humaine
Le recourt à ces espèces comme organismes modèles est justifié en raison, d'une part
de l'universalité de la molécule d'ADN, d'autre part de l'unité cellulaire du vivant et de son
unicité structurale et fonctionnelle (Tableau I)

6
Chapitre I : Organismes modèles, Présentation générale

Aussi, ces espèces ont été retenues car elles partagent plusieurs caractéristiques intéressantes
du point vue génétique, expérimental et économique :

 Génome bien caractérisé, souvent de faible taille, outils de biologie moléculaire


disponibles pour son séquençage et sa manipulation à l'aide de diverses techniques ;
 Temps de génération relativement faible, descendance nombreuse ;
 Facilité d'élevage ou de culture, faible encombrement.

Tableau I : Comparaison de quelques caractéristiques génétiques d'organismes modèles

Organisme Position Nombre de Taille du génome Nombre de


systématique chromosomes (en Mb) gènes
par jeu haploïde
Mus musculus Mammifère 20 3 000 30 000
Caenorhabditis elegans Nématode 6 100 19 100
Drosophila melanogaster Insecte 4 170 15 000
Saccharomyces cerevisiae Ascomycète 16 14 6 200
Escherichia coli Bactérie Circulaire unique 4,7 4 288
Arabidopsis thaliana Angiosperme 5 130 25 000
D’après Thizeau ; 2002

7
Chapitre II : Notions en Génomique

1 * Quelques bases en génétique moléculaire


La compréhension de l’hérédité a considérablement progressé ces 20 dernières
années. L’étude des maladies monogéniques a fortement contribué à éclairer le
fonctionnement des gènes et le récent décryptage du génome humain sur son organisation.
Les connaissances ont évolué et modifié la vision de l’hérédité : à l’heure actuelle, les lois de
Mendel appliquées aux maladies monogéniques ne suffisent plus à expliquer la transmission
des caractères. Les régulations du génome et ses interactions, y compris l’impact de
l’environnement, démontrent la complexité de la transmission des traits et les modulations
précises à la fois acquises et héréditaires qui en résultent pour chaque individu. (Lamoril , 2008)

C'est pourquoi étudier la variation, le mécanisme de son apparition et de sa


transmission dans les différentes formes de reproduction que la génétique est parvenue, en
collaboration avec d'autres disciplines biologiques, à la connaissance des mécanismes
fondamentaux qui assurent aussi bien le maintien de la vie que la transmission de celle-ci
d'une génération à l'autre. (Lamoril , 2008)

Grâce à la technologie de l'ADN recombinant, il est maintenant possible d'obtenir « à


volonté », d'analyser et de manipuler n'importe quel gène de n'importe quel organisme
vivant. Du fait de sa « puissance », le génie génétique devait bientôt quitter les laboratoires
où il avait vu le jour pour pénétrer, et modifier, une très large gamme de secteurs d'activité :
la quasi-totalité de la biologie, la médecine, la médecine légale, l'industrie, l'agriculture.

Les molécules informationnelles dans l’hérédité


Structure, Propriétés et fonction de l’ADN

La molécule d'ADN est polynucléotidique bicaténaire, autrement dit double brin. La synthèse
d'une molécule d'ADN se fait à partir d'une amorce (à gauche) qui sera allongée et d'un brin
de la molécule initiale clivée, brin qui servira de matrice (à droite) et qui permettra, par
complémentarité des bases, l'enchaînement des nucléotides de la chaîne en voie d'extension,
ou élongation. Les deux brins seront appariés par des liaisons hydrogène entre les bases
complémentaires : trois liaisons entre la guanine (G) et la cytosine (C), deux entre l'adénine
(A) et la thymine (T). (Strachan, 1996)

 L’ADN est une molécule chargée négativement, cette propriété permet de faire migrer
de l’ADN sur différents supports dans un champ électrophorétique. Ainsi, l’ADN a d’autres
propriétés physico-chimiques qui permettent de lui faire subir des centrifugations, dosages,
précipitations, chromatographies et autres manipulations. (J. RIQUET, F. PITEL, 2000)

 L’ADN est formé par 2 chaînes polynucléotidiques anti parallèles, reliées par des ponts
hydrogènes entre les bases ; on dit que l’ADN est bicaténaire et il a une double fonction :

* Assure sa propre réplication → base de l’hérédité.

8
Chapitre II : Notions en Génomique

* Synthèse les différentes protéines cellulaires → caractères de l’individu.

Structure de l’ADN : On distingue


I- Structure primaire
Constitué par l’enchaînement linéaire de nucléotides qui forment un filament non ramifié et
chaque nucléotide résulte de l’union d’un désoxyribose, un acide phosphorique et d’une base
azotée purique (A-G) ou pyrimidique (T-C). (Griffiths, 2013)

II- Structure secondaire


2 filaments de polynucléotides sont enroulés l’un sur l’autre en une double hélice.
Chaque hélice est formée par les nucléotides unies par leur désoxyribose (entre C 3’ et 5’) au
moyen de la molécule d’acide phosphorique.

Les 2 hélices sont réunies par les liaisons hydrogènes qui


forment entre les bases azotées une
complémentarité bien définie : A-T ; G-C. (Griffiths, 2013)

Le pas de l’hélice = 34A° avec un diamètre = 20A°. (Figure 1)

Distance entre les


barreaux = 0,34 nm

Largeur 1 barreau =
2nm

1 tour Hélice = 10
barreaux

La double hélice effectue un tour toutes les dix


paires de bases, la distance entre bases sur
l’axe est 3,4 A°. Un tour fait 34A°, le diamètre
de l’hélice est de 20A° (2nm). (1A=0.1nm).

Figure 1: Structure du fragment de la molécule d’ADN (Modifié d’après Strachan, 1996)

III- Structure tertiaire


Dans le noyau l’ADN est associé à des protéines basiques = les histones. La double
hélice subit ainsi un enroulement hélicoïdal secondaire entouré d’un manchon d’histone pour
former : la fibrille élémentaire 100A° de diamètre, cette fibrille subit un nouvel enroulement

9
Chapitre II : Notions en Génomique

pour former une fibre de 300A°, chacun de ces fibres s’enroulent sous forme de spirale
(comportant 50 fibres), ces spirales se regroupent sous forme de mini bande. (Figure 2)

Le chromosome est enfin est composé de plusieurs mini bandes (≈ un million). Le chromosome
apparaît constitué de 2 sous unités = chromatides.

Figure 2 : Configuration d’une molécule d’ADN (Thomas Shafee, 2017)


Watson et Crick ont immédiatement compris en 1953 la portée d'un modèle moléculaire en
double hélice maintenue par des liaisons hydrogène entre des bases précises, modèle qui a marqué
une autre étape sensationnelle et décisive de la génétique moderne. Watson et Crick ont
progressivement élaboré leur modèle moléculaire à partir d'images, souvent difficiles à interpréter, de
diffraction des rayons X par la molécule d'ADN laissant supposer une certaine régularité et une certaine
répétition dans cette molécule très longue. Ils ont également tenu compte des observations d'Erwin
Chargaff portant sur la composition en bases d'ADN provenant de différentes sources. A l'époque, il
n'était pas question d'obtenir la séquence de ce polymère, mais il était possible, après hydrolyse
complète (c'est à dire rupture de toutes les liaisons covalentes unissant les monomères entre eux), de
séparer ceux-ci par chromatographie sur papier. (Jalouzot ; 2010)

Tableau II : Caractéristiques de Chargaff pour quelques organismes modèles (d’après JALOUZOT ; 2010

Organisme A T G C Rapport
A+T/G+C
E. Coli 26,0 23,9 24,9 25,2 1,00
D. Pneumoniae 29,8 31,6 20,5 18,0 1,59
Levure 31,3 32,9 18,7 17,1 1,79
Souris 28,6 28,4 21,4 21,5 1,33
Homme 30,3 30,3 19,9 19,8 1,52

Les purines (A et G) et les pyrimidines (C et T) sont également représentées (50% de


chaque), quelque soit la source de l'ADN, la proportion d'adénine est la même que celle de

10
Chapitre II : Notions en Génomique

thymine et la proportion de guanine est la même que celle de cytosine, par contre, le rapport
A + T / G + C semble caractéristique de la source d'ADN. Jalouzot ; 2010)

Propriétés de l’ADN

Les propriétés de cette molécule support de l'hérédité sont la conséquence de sa


structure en double hélice de deux brins de séquence complémentaires.

Complémentarité
Les deux chaines de la double hélice sont complémentaires, l’espacement entre les
deux hélices est tel qu’à chaque fois une base purine interagit avec une base pyrimidique, ces
bases contractent des liaisons hydrogènes de faible énergie qui aident à stabiliser la double
hélice. (Masselot, 2018)
Dénaturation
Une autre conséquence physique est la sensibilité de la molécule native d'ADN à la chaleur.
Les liaisons hydrogène qui assurent la structure en double hélice sont sensibles à la chaleur et
le chauffage au-delà de 80°C suffit à les rompre, on voit alors l'ADN natif se dénature en deux
simples brins qui ne sont plus maintenus ensemble. Ces liaisons labiles vont cependant se
rétablir si le refroidissement des brins est lent et les deux brins vont se repositionner en
respectant les règles d'appariement en sorte que l'on peut retrouver l'ADN natif initial. Par
contre, si le refroidissement est brutal les simples brins sont " figés " et restent sous la forme
simple brin. (Masselot, 2018)

Figure 3. Dénaturation renaturation de l'ADN en fonction de sa teneur en G+C. Petit, 2018

11
Chapitre II : Notions en Génomique

Reproduction

La structure en double hélice permet d'envisager la pérennité du matériel génétique d'une


génération à l'autre. Le détail des mécanismes de la réplication XE "réplication», aujourd'hui
assez bien connu vous est détaillé dans le cours de biochimie. La réplication se fait par
séparation des brins anciens qui servent de moule pour la synthèse des nouveaux brins en
respectant la complémentarité des bases. Les deux doubles hélices sont donc identiques à la
double hélice initiale. La réplication est dite semi conservative puisque sur les deux brins l'un
est ancien et l'autre est nouveau. (Masselot, 2018)

Figure 4. Réplication de l'ADN (Masselot, 2018)

Antiparallélisme

Chaque brin d’ADN est orienté selon ses extrémités (5’phosphate, 3’ hydroxyle) les deux brins
ont des orientations antiparallèles afin que les bases puissent s’associer correctement par les
liaisons hydrogène. (Masselot, 2018)

Information

La séquence de l'ADN porte un message qui doit être traduit comme tout langage codé.
L’intermédiaire qui va assurer la traduction du message codé par les nucléotides en mots des
protéines est l'ARN de transfert. De plus l'ADN lui-même ne va pas être utilisé directement
pour être traduit mais c'est une copie qui va être utilisée. Cette copie pourra être plus ou

12
Chapitre II : Notions en Génomique

moins multiple ce qui permettra de moduler le niveau final de la protéine (voir le cours de
régulations). Cette copie est l'ARN messager, qui est, comme l'ADN un polymère nucléotidique
qui ne se distingue du précédent que par quelques caractéristiques. (Masselot, 2018)

Figure 5. Constituants de l'ARN Masselot, 2018)

La copie se fait sur l'ADN dont les deux brins se séparent localement. Seul un brin
(toujours le même pour une zone donnée) est copié (brin transcrit) en respectant la
complémentarité des bases à ceci près que les appariements AT sont remplacés par des
appariements AU. L'ARNm a donc la même séquence que le brin non transcrit à condition de
remplacer les T par des U. Masselot, 2018)

Figure 6. Principales étapes de la transcription. Masselot, 2018)

13
Chapitre II : Notions en Génomique

Une fois que l'ARNm a atteint le cytoplasme il va servir pour synthétiser un


polypeptide, avec le concours de l'ARNt XE "ARNt" et du ribosome XE "ribosome».
Le ribosome est constitué de deux sous unités. Chacune comprend une molécule d'ARN
ribosomiques et de nombreuses molécules protéique, l'ensemble constituant un ribozyme
(enzyme à ARN). Les protéines sont codées par des parties du génome (les gènes de structure)
et les ARNr par d'autres parties (gènes des ARNr).
L'ARNt est un petit ARN d'une centaine de nucléotide qui est apte à transporter un acide aminé
particulier. Chaque ARNt est codé par un gène particulier. Masselot, 2018)

Figure 7. Mécanisme de la traduction. Masselot, 2018)

L'unité élémentaire d'information est faite de 3 nucléotides (le codon XE "codon»).Lors


de la traduction, le message est lu sans chevauchement, un polypeptide de 200 acides aminés
est codé par un message de 600 (+3 pour le codon stop) nucléotides. Lorsque l'on a déterminé
une séquence nucléotidique, on peut essayer de déterminer si elle peut correspondre à un
polypeptide. Dans ce but on applique le code génétique. Il n'est pas dit que la séquence
commence sur le premier nucléotide du codon, on a donc le choix entre 3 phases de lecture.
De plus il n'est pas sûr que le brin dont la séquence déterminée soit celui qui correspond à la

14
Chapitre II : Notions en Génomique

séquence de l'ARNm (brin non transcrit). Si tel est le cas il existe également trois phases
possibles de lecture sur l'autre brin.
Dans l'exemple ci-dessus une seule phase n'est pas interrompue par un ou plusieurs codons
stop(en gras) : la phase +2 qui est qualifiée de phase ouverte de lecture. C'est la seule qui soit
susceptible d'être fonctionnelle. Si une phase ouverte est suffisamment longue c'est un bon
candidat pour coder un polypeptide.
Dans le code génétique il faut distinguer 4 codons particuliers AUG qui précédé d'un signal
particulier (TATA box) et situé en début de phase indique précisément le début de la
traduction.
UAG, UAA et UGA qui sont des codons stop et indiquent la fin de la chaîne polypeptidique.

Figure 8. Les six phases possibles de lecture d'une séquence d'ADN (Masselot, 2018)

La succession des bases possède un caractère informatif qui contrôle la synthèse d'un
polypeptide qui peut être doué d'activité catalytique (ou autre), c'est l'unité de fonction
biochimique.

La structure double brin permet que le message entier soit reproduit fidèlement de génération
en génération. (Masselot, 2018)

Formation de sillon
Il existe trois structures classiques des doubles brins d’ADN, la forme A rarement observée, la
forme B la plus courante et la forme Z observée quelque fois, les deux formes A et B sont
composées d’hélice droite emmêlée en torsade par contre la forme Z est composée d’hélice
en zigzag. Pour la forme la courante, l’enchainement des groupements phosphatés crée deux
sillons ou s’exercent les interactions entre les protéines et l’ADN.(Petit, 2018)

15
Chapitre II : Notions en Génomique

 Petit sillon présente deux groupements accepteurs de la liaison pour les deux paires
A – T et C- G, il permet l’attache des histones.
 Grand sillon est tapissé aussi d’atomes qui peuvent interagir avec des composants
extérieurs aux acides nucléiques comme les nucléases, les enzymes de destruction, les
facteurs de transcription, les polymérases (Petit, 2018)

Figure 9. Représentation simplifiée des formes A, B et Z de l’ADN (Petit, 2018)

2 * Notions d’ingénierie génomique


L’ingénierie génomique correspond à la manipulation du matériel génétique du
vivant. Reposant sur la biologie moléculaire et les technologies de séquençage du génome,
elle permet d’identifier les gènes composant le matériel génétique d’une cellule ou d’un être
vivant, d’étudier la relation génotype-phénotype, l’organisation, la stabilité et la variation du
matériel génétique, et enfin de modifier le matériel génétique. Elle se trouve également à la
base de la biologie de synthèse, visant à recomposer des systèmes variés, de la molécule à
l’organisme à partir de l’étude du génome. L’ingénierie génomique trouve des applications
dans différents domaines, notamment l’alimentation, l’environnement et la santé.

Malgré les progrès récents associés à l’utilisation des nucléases d’ingénierie du


génome, certaines problématiques persistent. Par exemple, l’isolement des cellules

16
Chapitre II : Notions en Génomique

génétiquement modifiées est un travail long et parfois laborieux. De plus, la spécificité des
nucléases est aussi un point souvent mal caractérisé. Cette dernière peut avoir des
conséquences importantes in vitro, mais particulièrement in vivo. (Fleury, 2018)

 Les Premiers Outils de l’ingénierie génomique


Les premiers outils d'ingénierie des génomes furent avec la découverte des
Endonucléases dont la spécificité de séquence permettait d'envisager cibler un site unique
dans un génome entier. La première catégorie d'enzymes de cette nature, appelée
maintenant homing endonucleases, avait été découverte à partir d’un intron mobile d'un gène
mitochondrial de levure présentant des anomalies de transmission héréditaire lors des
croisements (Jacquier et Dujon.,1985, Colleaux et al., 1986, Colleaux et al. 1988).

Il s’agissait de l’aboutissement totalement imprévu de plus de quinze ans de


recherches sur un phénomène surprenant dont le seul intérêt était son existence même
(Dujon, 2005), tout sauf le chemin direct avec rapports d’étapes souhaité par les tenants
actuels de la recherche sur projets prédéfinis répondant à un défi sociétal ! A cette époque,
grâce au CNRS et à la liberté qui régnait dans les universités françaises, on pouvait découvrir
ce que l’on ne cherchait pas, simplement parce que c’était possible de le faire, un peu comme
on vainc le sommet d’une montagne. De très nombreuses homing endonucleases ont ensuite
été découvertes issues d'une variété d'organismes ou ont été synthétisées artificiellement
pour des applications précises.
Plus tard (1996) est apparue une deuxième catégorie d'endonucléases site-spécifiques
dites « à doigt de zinc ». Le principe en était très différent puisque, au lieu d’exploiter ce que
fournissait la nature, il s’agissait d’une ingénierie moléculaire, joignant une endonucléase
bactérienne classique à une combinaison de motifs protéiques élémentaires capable de
conférer à l’ensemble une reconnaissance spécifique d’un fragment de séquence
suffisamment long pour assurer son unicité dans un génome. Sur le même principe général,
sont nées plus récemment (2010) une troisième catégorie d'endonucléases site-spécifiques
appelées TALE nucleases ou TALEN. Enfin, très récemment (2012) une quatrième catégorie
d'endonucléases site-spécifiques a pu être développée à partir d’observations faites chez des
bactéries chez lesquelles une « immunité » antiphagique est obtenue par activation d’une
endonucléase protéique non-spécifique par un petit ARN qui, lui, permet la reconnaissance
parfaite d’un fragment de séquence suffisamment long pour assurer son unicité dans un
génome. La facilité avec laquelle on peut synthétiser artificiellement des petits ARN, comparée
à la synthèse de protéines recombinantes, a assuré un enthousiasme immédiat pour ce
dernier système appelé CRISPR. Avec ces outils, on entre dans une nouvelle ère de Génie
génomique qui ouvre les plus grands espoirs.

17
Chapitre II : Notions en Génomique

 Le séquençage des génomes et le développement de la Génomique


Au milieu des années 1980s, les applications potentielles du génie génétique et
d’autres considérations plus stratégiques, voire politiques, allaient motiver le séquençage des
génomes entiers, à commencer par celui de l'homme. Plusieurs années s'ensuivirent au cours
desquelles hésitations, conflits et rebondissements ne furent pas rares. Contrairement aux
idées simples, les progrès les plus décisifs ne vinrent pas toujours de là où on les attendait.
Comme dans toute recherche véritable d'ailleurs.

Des bactéries (comme Haemophilus influenzae), la levure de boulangerie


Saccharomyces cerevisiae et le nématode Caenorhabditis elegans devaient jouer, chacun à
leur manière, des rôles essentiels dans le programme "génome humain" alors qu'ils étaient
des initiatives indépendantes (Vassarotti et al.,1995, Goujon, 2001, Brown, 2003).
Ironiquement, alors que certains ne voyaient dans ces génomes que des tremplins
technologiques pour le génome humain, c’est sur le plan conceptuel que les choses
commençaient à bouger.

Les surprises
Les premiers génomes séquencés rappelèrent rapidement à quel point des
connaissances fondamentales manquaient. Avec le génome de la levure, trois surprises
majeures attendaient les généticiens. D’abord, il y avait dans le génome beaucoup plus de
gènes pour chaque fonction que ce que la génétique laissait prévoir. En d’autres termes, les
cribles génétiques classiques mêmes les plus systématiquement appliqués n’arrivaient jamais
à l’exhaustivité. Ensuite, beaucoup de gènes avaient des séquences entièrement nouvelles,
sans similarité dans les bases de données existantes. Une explication triviale était que ces
bases de données étaient très incomplètes, ce qui n’était pas faux. Mais même aujourd’hui
chaque nouveau génome séquencé fait apparaître une fraction non nulle de tels gènes qu’on
désigne donc comme « orphelins ». Une autre explication commune à l’époque était que ces
gènes orphelins n’étaient pas des vrais gènes. Ce qui n’est pas nécessairement faux non plus
pour certains d’entre eux. (Fleischmann et al. 1995, Goffeau et al. 1996

Mais leur nombre élevé exclu la généralisation de cette hypothèse. Une réalité plus
intéressante, comprise seulement maintenant, est que certains des gènes orphelins sont en
réalité des gènes créés de novo dans les différentes lignées évolutives. Enfin, la troisième
surprise était que nombre de gènes étaient dupliqués. Ceci était incompréhensible dans la
vision classique de mutations aléatoires soumises à la sélection naturelle. On sait maintenant
que cette redondance est vraie pour tous les génomes, même si le cas de la levure était
particulier. En d'autres termes, la nature ne connaît pas les génomes minimums dont rêvent
les ingénieurs. La raison est à rechercher dans la perpétuelle dynamique évolutive des
génomes.

18
Chapitre II : Notions en Génomique

Les chiffres
Actuellement, de nombreux génomes bactériens ont été séquencés entièrement ou
partiellement (plus de 219 000 projets). Il en va de même d'environ deux mille génomes
d'Archaea (un déficit important comparé aux bactéries) et d'un nombre rapidement croissant
d’eucaryotes (environ 14 500 sont terminés ou en cours). Historiquement, ce fut la levure
Saccharomyces cerevisiae avec son génome d'environ 13 millions de nucléotides (Mb) le
premier eucaryote séquencé (Goffeau et al. 1996, 1997). Puis, alors que le nombre de
génomes bactériens augmentait, on a vu apparaître successivement les séquences de
génomes eucaryotes plus grands tels que ceux de Caenorhabditis elegans, (97 Mb, Sulston,
Waterston et Consortium, 1978), un nématode servant de modèle expérimental, et
d'Arabidopsis thaliana (115 Mb, Arabidopsis Genome Initiative, 2000), une crucifère modèle.
Ces débuts étaient très laborieux. Ils nécessitaient plusieurs années de travail de consortiums
de laboratoires qui établissaient d'abord une cartographie détaillée des génomes avant un
séquençage ordonné des segments par la méthode de Sanger. Chacun de ces projets marquait
une étape importante de la génomique naissante.

3 * Approche bio-informatique

De la biologie moléculaire à la génomique et la bioinformatique

 La biologie moléculaire occupe une place dominante dans les sciences biologiques.
Cette “vision moléculaire” du vivant est née de la génétique et de la biochimie. On peut dater
l’émergence de cette nouvelle discipline scientifique avec la mise en évidence de l’ADN
comme vecteur de l’hérédité.

Cette discipline s’est structurée et définie autour de l’étude de l’expression de l’information


génétique et de ses régulations, ce qui aurait tendance à la faire apparaître comme un
domaine de la génétique. Entre les deux, elle est décrite comme l’étude des macromolécules
biologiques : les acides nucléiques, dont l’ADN, support des gènes et de l’information
génétique, et les protéines, produits de ces gènes et “ingénieurs” de la cellule biologique.

 La génomique Le terme “génomique” émerge de débats relatifs aux différents


colloques organisés entre 1984 et 1987. Le HGP aura un effet mobilisateur, tant sur le plan
des techniques, que sur l’impulsion de projets de séquençage d’autres génomes. Du fait de la
taille réduite de leurs chromosomes, les microbes sont les premiers organismes vivants et
autonomes qui ont fait l’objet d’une lecture complète de leur information génétique. Le
premier résultat général et inattendu était l’importance de la part des gènes de fonction
inconnue détectés par cette approche exhaustive, élément qui n’avait pas été mis en évidence
auparavant par les méthodes classiques de la génétique. Cette observation est à l’origine
d’une deuxième génération de programmes de génomique, visant à élucider, de la manière la
plus systématique possible, la fonction de ces “nouveaux gènes”. Elle a également contribué

19
Chapitre II : Notions en Génomique

à entériner au sein de la communauté le concept de “génomique fonctionnelle”, qui regroupe


les approches biochimiques et physiologiques adaptées à des analyses d’un génome entier et
complétant les informations apportées par les séquences d’ADN. Ainsi sont mis en place de
nouveaux moyens de production de grandes quantités d’informations, sur le même mode que
le séquençage, qui devront être croisées pour prédire les fonctions des gènes. (Gabriel Gallezot,
2007)

 Bioinformatique : Le phénomène sans doute le plus marquant, relatif à l’informatique


et à la biologie moléculaire, est l’émergence de la bioinformatique. Les efforts ont d’abord
porté sur l’analyse des séquences et des structures, par des approches algorithmiques et
mathématiques. C’est une fois de plus avec la possibilité de lire le texte de l’ADN que cette
activité a pris de l’ampleur, et que ses outils se sont généralisés chez les biologistes. En même
temps, l’organisation et la gestion de l’information, à savoir les données factuelles sur les
objets biologiques, devenaient une nécessité. Encore à la marge de cette nouvelle discipline,
et relevant des sciences de l’information, les données non factuelles, par exemple le texte des
articles scientifiques, commencent à être exploitées (avec l'informatique) pour enrichir les
connaissances en génomique. La bioinformatique, traitement automatique de l'information
biologique, s’est définitivement imposée avec les programmes d'analyse de génomes. Cette
discipline reprend tous les thèmes de l'informatique : l'acquisition, l'organisation de
l'information, l'analyse, la visualisation, la modélisation, ... pour les appliquer à la génomique.
Plusieurs revues lui sont spécifiquement dédiées, Bioinformatics (CABIOS ou Computer
Applications in the Biosciences jusqu’en 1997) et Journal of Computational Biology, tandis que
Nucleic Acids Research, non content de publier des articles, consacre des numéros spéciaux
aux banques et aux bases de données en biologie moléculaire. Enfin, des revues généralistes
comme Nature, Science ou la série des Trends, lui consacrent régulièrement des colonnes et
des rubriques. (Gabriel Gallezot, 2007)

La bioinformatique peut être assimilée au passage de l'imprimé à l’électronique. D'une


simple lecture de représentations de séquences nucléotidiques (quelques lignes de A.T.G.C.,
la représentation des nucléotides : Adénine, Thymine, Cytosine et Guanine) en sélectionnant
ou en feuilletant des revues disponibles dans leur centre de documentation, les biologistes
peuvent désormais, pour des données factuelles plus conséquentes, faire une recherche
sélective et exhaustive, puis les collecter via Internet, les manipuler in silico et en proposer
une représentation graphique sur écran.
La bioinformatique est la résultante de la nécessité de traiter l’information génomique
et d’une forte appropriation des technologies informatiques par des chercheurs. De
développements ponctuels, isolés et réalisés par des chercheurs en génomique ayant de
bonnes compétences en informatique, la bioinformatique “ s’institutionnalise ”. Des
formations universitaires apparaissent avec le label “bioinformatique ”, des équipes
regroupant des informaticiens, des mathématiciens et des biologistes se forment et des
chercheurs en science de l’information apparaissent dans ces équipes. Du traitement d’un

20
Chapitre II : Notions en Génomique

petit ensemble de données factuelles, la bioinformatique a désormais pour tâche de


rassembler l’ensemble de l’information d’un domaine, d’un champ spécifique. Cela engendre
deux conséquences :

- Les développements informatiques sont d’une plus grande ampleur, ils convoquent et
combinent différentes techniques,
- Les informations traitées ne sont plus uniquement des données expérimentales, mais
aussi des données “textuelles ” (non factuelles) issues de la littérature scientifique. (Gabriel
Gallezot, 2007)

On considère donc la génomique comme un aspect de la biologie moléculaire et la


bioinformatique comme une activité scientifique adjacente à la génomique. Chacun de ces
champs disciplinaires à sa spécificité, des revues dédiées, et un objectif commun : l'analyse
des génomes.

21
Chapitre III : Analyse des génomes

1. Interaction génique
En génétique élémentaire on suppose, pour la simplicité de la chose, que les gènes se
comportent comme des unités héréditaires autonomes, qu'il y a interaction entre les allèles
d'un même gène, mais non pas entre gènes situés à différents loci. Ce genre de
comportement, simple, est celui que l'on pouvait observer dans les expériences de Mendel.
En fait le mode d'action d'un grand nombre de gènes est modifié par l'action de gènes situés
à d'autres loci. L'expression de nombreux caractères mendéliens, c'est-à-dire du type
qualitatif, tels la pigmentation, la forme de la corolle, la couleur du pelage, etc., de même que
de nombreux caractères quantitatifs est contrôlée par l'action simultanée d'une série de
paires alléliques. On parle d'interaction génique réciproque. (Griffiths, 2013)

La figure 10 représente Exemple d’interaction entre une protéine régulatrice et sa cible

Figure 10 : Interaction entre protéine régulatrice et sa cible (Martin Filion, 2017)

Les mutations conduisant au même phénotype


La variabilité phénotypique peut être due à la variation d'un seul gène (on parle de
déterminisme monogénique, ex : mucoviscidose et drépanocytose). Cela ne veut pas dire que
le caractère est contrôlé par un seul gène mais que la variation d'un seul de ces gènes est
suffisante pour entraîner une variation phénotypique.

22
Chapitre III : Analyse des génomes

Les mutations conduisant à des phénotypes différents


La liste des mutations responsables de maladies héréditaires chez l’homme ne cesse
de croître. Deux principales bases de données regroupent ces nombreuses mutations : la
première correspond à la version actuellement en ligne du catalogue des maladies
héréditaires chez l’homme, OMIM (Online mendelian inheritance in man), créé dans les
années 60 par Victor McKusick et ses collaborateurs à l’Université John Hopkins de Baltimore.
En juin 2005, un grand nombre de mutations associées à des maladies génétiques sont
répertoriées au sein de 1 755 gènes sur un total de 10 202 actuellement identifiés.
L’analyse des données fournies par les bases, bien que non exhaustive, permet d’observer que
les substitutions nucléotidiques et les microdélétions constituent 85% des mutations
responsables de maladies héréditaires chez l’homme (Figure 11); quant aux autres types de
mutations, il s’agit d’insertions, duplications, inversions, mutations dynamiques, grands
remaniements ou réarrangements complexes. Certains des mécanismes à l’origine de
l’apparition de ces mutations sont aujourd’hui élucidés. Ces anomalies moléculaires peuvent
résider non seulement dans les régions codantes des gènes, mais également dans les régions
non codantes, au niveau des promoteurs, au sein des introns, voire à distance du gène, et
leurs conséquences sont variées.

Figure 11 : Répartition des différents types de mutations identifiées dans des gènes humains à
l’origine de maladies génétiques. Données extraites de la base de données HGMD, avril 2005
(http://www.hgmd.org).

Nature des mutations


Il est possible de distinguer 3 grandes classes de mutations : les substitutions nucléotidiques,
les insertions/délétions de quelques nucléotides et les remaniements géniques de grande
taille. Des mécanismes mutationnels plus rares seront également présentés.

23
Chapitre III : Analyse des génomes

 Remplacements d’une base : substitutions nucléotidiques


Elles constituent près de 70 % des mutations : on distingue les transitions (remplacement
d’une base pyrimidique (C ou T) ou purique (A ou G) par une autre base de même nature) et
les transversions (remplacement d’une base purique par une base pyrimidique, ou
inversement). Les substitutions nucléotidiques peuvent être induites par des agents
environnementaux mutagènes (substances chimiques, rayonnements…) ou par le
métabolisme endogène, mais également être la conséquence d’erreurs spontanées
intervenant lors de la réplication de l’ADN, et non détectées par les systèmes de réparation.
Les transitions sont en moyenne deux fois plus fréquentes que les transversions, et celles qui
concernent le dinucléotide CpG représentent à elles seules plus de 20 % des substitutions
nucléotidiques responsables de maladies génétiques. La méthylation de l’ADN intervient
préférentiellement en position 5 des cytosines précédant les guanines (dinucléotides CpG). Or
les cytosines et les cytosines méthylées subissent avec une certaine fréquence des
événements de désamination qui les transforment respectivement en uraciles et en thymines.
À la différence du mésappariement U:G, très efficacement réparé par un complexe
enzymatique spécifique (uracile DNA glycosylase), la réparation du mésappariement T:G est
beaucoup plus problématique, puisque la thymine est un composant normal de l’ADN. Par
conséquent, en raison du caractère palindromique du dinucléotide CpG et de sa méthylation,
la réparation des mésappariements T:G peut conduire, malgré l’existence de thymine
glycosylases spécifiques, à des transitions CpG vers TpG ou CpA. Les dimères CpG représentent
donc des points chauds de mutation chez l’homme, même s’il existe de grandes variations
locales dans le taux de mutation de chaque dimère CpG. (Krawczak M, 1998).

 Délétions ou insertions de quelques nucléotides


Les délétions ou insertions d’un ou plusieurs nucléotides (moins de 20) sont, après les
substitutions nucléotidiques, les anomalies de séquences nucléotidiques les plus fréquentes,
représentant près de 25 % des anomalies répertoriées dans la base de données HGMD. Des
délétions ou insertions non multiples de trois bases entraînent au niveau des séquences
codantes un décalage du cadre de lecture (frame shift) qui aboutit à l’apparition d’un codon
Stop prématuré et à l’éventuelle présence d’une protéine incomplète, la plupart du temps non
fonctionnelle. Dans les cas de délétions ou insertions de trois bases ou d’un multiple de trois
bases, la protéine codée présentera une délétion ou une insertion d’un ou plusieurs acides
aminés, avec des conséquences fonctionnelles variables. Ces anomalies moléculaires
surviennent souvent au niveau de courtes répétitions en tandem, très probablement par un
mécanisme de glissement (slippage) de l’ADN polymérase en raison de l’appariement décalé
de séquences répétées lors de la réplication de l’ADN. Selon la façon dont le mésappariement
est résolu, ce dérapage peut être à l’origine d’insertions ou de délétions d’un ou plusieurs
motifs répétés. (Stenson, 2003)

24
Chapitre III : Analyse des génomes

 Mutations dynamiques
La grande majorité des maladies liées à des mutations dynamiques impliquent des
répétitions de triplets. Il est possible de distinguer les répétitions qui affectent la région
codante des gènes, où l’amplification de codons CAG (glutamine) reste modérée, et celles qui
affectent les régions non codantes des gènes, où la taille de l’élément amplifié peut atteindre
10 kb. Il existe quelques cas où le motif nucléotidique répété est supérieur à trois paires de
bases. L’épilepsie myoclonique autosomique récessive d’Unverricht-Lundborg est associée à
une amplification d’un motif de 12 paires de bases (CCCCGCCCCGCG) en amont du site
d’initiation de la transcription du gène CSTB, (Figure 13). L’ataxie spinocérébelleuse de type
10 est due à une amplification du motif (ATTCT) localisé dans l’intron 9 du gène E46L. Enfin,
dans le cas de la dystrophie myotonique de type 2, le motif nucléotidique répété correspond
à une séquence de 4 paires de bases (CCTG) dans le premier intron du gène ZNF9. (Krawczak
M, 1998, Stenson PD, 2003)

Figure 13 : Quelques exemples de mutations dynamiques

Les maladies dues à des mutations dynamiques sont nombreuses et pour la plupart
des maladies neuro-dégénératives. Elles sont caractérisées par le phénomène d’anticipation :
au cours des générations successives, l’âge d’apparition de la maladie est de plus en plus
précoce et s’accompagne d’une accentuation de la gravité, en raison de l’amplification du
nombre de motifs répétés au cours des générations successives. Il est généralement admis
qu’au-delà d’un certain seuil de longueur (environ 50 répétitions), les répétitions formeraient

25
Chapitre III : Analyse des génomes

des structures anormales, de type épingles à cheveux ou triple hélice, perturbant la réplication
et favorisant les dérapages ou glissements réplicatifs. La deuxième hypothèse, non exclusive,
pour expliquer ce phénomène d’instabilité des trinucléotides implique le mécanisme de
réparation des mésappariements (MMR) produits lors de la réplication.
 Réarrangements génomiques : délétions, duplications, inversions et
translocations
Les réarrangements génomiques résultent en général, mais non obligatoirement,
d’événements de recombinaison homologue non allélique (NAHR, non allelic homologous
recombination) intra- ou extrachromosomique, impliquant des séquences très semblables
mais non nécessairement identiques, comme les séquences répétées dispersées Alu.
Récemment, l’étude de réarrangements récurrents et la connaissance de la séquence
complète du génome humain ont permis d’identifier une catégorie particulière de séquence
répétée, appelée duplication segmentaire ou LCR (low-copy repeats). Ces séquences, qui
représentent environ 5 % du génome humain, correspondent à des doublements de 10 à 500
kb survenus généralement il y a moins de 25 millions d’années (Shaw CJ, 2004, Emanuel
BS,2001).

Les deux copies sont quasiment identiques (plus de 95 % de similitude), mais non
alléliques, et sont situées soit sur des chromosomes distincts, en particulier dans les régions
péricentromériques ou subtélomériques, soit sur un même chromosome, à distance variable
(faible dans le cas des gènes alpha de globine ou de l’intron 22 du facteur VIII de la coagulation,
très importante (>1 Mb) dans le syndrome Williams). Ces duplications constituent des
structures hautement recombinogènes, favorisant les réarrangements génomiques par
recombinaison inégale au moment de la méiose, avec comme conséquences des délétions,
inversions, duplications ou translocations. Ces réarrangements sont observés de façon
récurrente dans certaines maladies monogéniques lorsqu’un seul gène est impliqué dans le
réarrangement: a thalassémies, hémophilie A sévère, neurofibromatose de type 1 (Figure 12),
maladie de Charcot-Marie-Tooth type 1A/neuropathie tomaculaire…). Dans le cas des
syndromes dits «des gènes contigus», plusieurs gènes sont impliqués dans le réarrangement :
syndromes de Di-George, de Smith-Magenis.

Figure 12 : Séquences répétées encadrant le locus NF1 et impliquées dans la délétion de


1,5Mb retrouvée chez environ 7% des individus atteints de neurofibromatose de type 1.

26
Chapitre III : Analyse des génomes

D’autres remaniements géniques, non récurrents, sont la conséquence d’événements de


recombinaison non homologue ou illégitime entre séquences qui ne présentent pas, ou très
peu, d’homologie de séquence. C’est le cas de la plupart des délétions du gène codant pour la
dystrophine. Si les mécanismes moléculaires de la recombinaison illégitime sont mal connus,
un certain nombre de motifs pourraient constituer des points chauds de recombinaison :
séquences alternées de purines-pyrimidines, régions MAR (matrix-associated regions) riches
en nucléotides A/T, sites de clivage des topo-isomérases ou, encore, séquences
palindromiques. (Abeysinghe, 2003).

2. Expression ectopique du gène


L'expression ectopique consiste à faire exprimer un gène dans une région extérieure à son
domaine d'expression.
Les méthodes classiques pour l’induction ectopique de l’expression d’un gène emploient des
promoteurs inductibles comme les promoteurs de chocs thermiques ou ceux inductibles par
des médicaments. Certains de ces systèmes interrompent l’expression d’une grande partie du
génome, et c’est un inconvénient, mais on peut effectuer des contrôles appropriés pour
démontrer qu’un phénotype donné est dû au gain d’expression du transgène. Ainsi la
recherche de gènes supprimant le phénotype de gain de fonction, permettront d’identifier les
protéines avec des fonctions biochimiques, physiologiques ou de développement similaires.
Le gain de fonction peut aussi être une méthode efficace pour caractériser l’effet d’une
modification de certaines parties d’une protéine, par exemple pour définir les résidus
responsables d’une spécificité fonctionnelle de facteurs de transcription ou de récepteurs.
Il est difficile de travailler sur la perte de fonction à l’état dominant, mais elle
constituera un outil majeur pour disséquer les fonctions pléiotropes qui sont occultées par les
altérations précoces dues aux mutations. Une approche concernant ces mutations est de
concevoir des protéines censées effectuer seulement certaines des fonctions de la protéine
sauvage. Par exemple, des récepteurs sans le domaine intra-cellulaire vont en général, fixer
un ligand qui active normalement le récepteur, et donc d’intérêt avec la transmission du signal
par le récepteur endogène. L’expression inductible de la forme dominante négative permet
d’étudier la fonction du gène à toutes les phases du développement. (Figure 13). Une autre
approche consiste à cribler un ensemble de constructions chez la levure ou dans des cellules
de culture, pour identifier des protéines dominantes, négatives avant d’induire le transgène
dans la lignée germinale d’un organisme modèle. (Gordon, 2003)

27
Chapitre III : Analyse des génomes

Figure 13 : Perte et gain de fonction ciblés (Gordon, 2003)

(A) Type sauvage : protéine qui s’exprime que dans les cellules bleues ciel et son activation
nécessite le ligand jaune. (B) Perte de fonction dominante : expression des protéines
dominantes négatives (en rouges) dans ces cellules pour inhiber l’activité de la protéine
endogène en séquestrant le ligand jaune. (C) Expression ectopique : gain de fonction de la
protéine en induisant une expression ectopique du gène dans d’autres types cellulaires.
(D) Activité constitutive : par l’induction d’une protéine modifiée toujours active, même en
l’absence de ligand.

3. Recherche de gènes modificateurs


Les gènes modificateurs sont des gènes qui modifient l'expression d'un caractère soumis à
l'action d'un gène majeur. Ces gènes sont nombreux et d'action faible. En l'absence de gènes
majeurs ils ne peuvent pas s'exprimer.
Des variants génétiques codant pour des gènes impliqués dans la physiopathologie de
plusieurs maladies génétiques ont été étudiés, notamment des gènes de l'immunité ou de la
réponse inflammatoire. Certains de ces gènes ont en effet été montrés comme influençant la
sévérité de la maladie.
Une nouvelle approche a également été développée consistant à réaliser l'étude du génome
entier. (FEREC., 2012)

28
Chapitre III : Analyse des génomes

A un niveau basal, l’expression phénotypique est sous la dépendance de divers gènes de


vulnérabilités qui combinent leurs effets de manière variable et interagissent avec
l’environnement qui contribue à moduler leurs effets, et donc affecte aussi en définitive le
niveau syndromique.
A un niveau intermédiaire, les gènes de vulnérabilité sont plus directement à la base de traits
endophénotypiques, insuffisants en eux-mêmes pour porter un diagnostic catégoriel. (D'
Amato, 2003) .(Figure 14).

Figure 14 : Schématisation d’un trouble génétique complexe (d’après Weinberg, 2001 in D' Amato,
2003)

Au vu de ces caractéristiques, l’utilisation d’endophénotypes cognitifs dans les études


génétiques moléculaires pourrait donc s’avérer difficile pour l’identification de ces gènes.
(D' Amato, 2003)

Ainsi, on s’intéresse à l’âge du début de la maladie, considérant que sa variabilité peut


résulter soit de l’intervention de facteurs du milieu, soit de l’existence d’allèles délétères
différents, soit encore de l’action de gènes dont les différents allèles ne sont pas à l’origine de
la maladie, mais peuvent modifier l’âge de son apparition. Si l’on raisonne sur le phénotype
plutôt que sur l’âge de début de la maladie, les caractères énoncés pour les gènes de la
dernière catégorie définissent parfaitement les gènes modificateurs. Remarquons que cette
définition n’exclut pas qu’un gène dont un allèle détermine une maladie récessive puisse,

29
Chapitre III : Analyse des génomes

lorsque ce dernier se trouve à l’état hétérozygote, être modificateur d’une maladie due des
mutations d’un autre gène.

 Modificateur allèle du gène délétère


La mise en évidence d’un tel modificateur peut se faire soit à l’aide de méthodes très
proches de celles de la génétique formelle classique, soit par une caractérisation
moléculaire directe
→ Effet du gène reçu du parent sain, dans le cas d’une maladie dominante
Nous présentons ici des situations dans lesquelles des germains (frères ou sœurs) atteints
présentent des phénotypes différents s’ils ont reçu du parent sain, au locus impliqué dans la
maladie, des allèles non délétères différents (figure 15). Bien que les données ne permettent
pas de le savoir avec certitude, les effets mis ici en évidence sont vraisemblablement ceux
d’hétéroallèles agissant en position trans. ( D' Amato, 2003, Feingold, 2000).

1 2
Aa a1a2

3 4 5
Aa1 Aa1 Aa2

Figure 15 : Gènes allèles du gène délétère, modificateurs du phénotype dans une maladie dominante
autosomique. (Feingold, 2000)
A est le gène délétère, α , α 1 et α 2, des variants du gène normal. Les sujets 3 et 4 ont le
même phénotype pathologique, tandis que le sujet 5, bien qu’également malade porte un
allèle normal différent et n’a pas le même phénotype que ses deux germains.

Cas de L’onycho-arthro-dysplasie (nail patella syndrome) est une maladie dominante


autosomique touchant principalement les rotules et les ongles, dont le gène a été récemment
identifié. Deux indices quantitatifs ont été utilisés pour caractériser respectivement l’atteinte
de la rotule et celle des ongles. Entre deux germains atteints, on constate pour chaque indice
l’existence d’un coefficient de corrélation significativement différent de zéro et non
significativement différent de 0,5, alors qu’entre parent et enfant, tous deux atteints, il n’y a
pas de corrélation significative. Ceci s’explique bien par l’existence d’allèles non délétères
modificateurs. Les variants non délétères n’ont pas été caractérisés. Feingold, 2000)
Cas de la rétinite pigmentaire RP11 est une maladie dominante à pénétrance incomplète due
à un gène localisé sur le chromosome 19. Bien que ce gène ne soit pas identifié, l’étude de la
ségrégation de marqueurs génétiques permet d’identifier les porteurs sains de l’allèle
délétère, ainsi que de reconnaître, parmi les paires de germains porteurs, ceux dont les deux
membres ont reçu du parent sain le même allèle ou des allèles différents. Sur 10 paires de
germains présentant tous deux le même phénotype, tous appartenaient à la première
catégorie, alors que sur les 13 paires phénotypiquement discordantes, 10 appartenaient à la

30
Chapitre III : Analyse des génomes

seconde catégorie. Ce résultat s’explique bien par l’existence d’allèles non délétères modulant
le phénotype. Feingold, 2000)

→ Détection par analyse moléculaire d’hétéro-allèles du gène délétère agissant en


position cis ou trans

Cas des maladies héréditaires à prions qui sont dues à une mutation du gène prion et se
transmettent selon le mode dominant autosomique. La mutation 178 acide aspartique,
ou l’asparagine peut être à l’origine soit de la maladie de Creutzfeldt-Jakob, soit d’une
insomnie fatale familiale selon que le codon 129 en position cis code respectivement la valine
ou la méthionine. ( Feingold, 2000)

Cas de la mucoviscidose qui est une maladie récessive déterminée par diverses mutations
délétères du gène CFTR. Des polymorphismes, lorsqu’ils sont associés à certaines mutations,
peuvent modifier le phénotype de cette maladie. C’est ainsi que les sujets hétérozygotes
composites ∆ F508/R117H ont différentes gravités de la maladie qui dépendent dans une large
mesure du variant du polymorphisme Tn (n est le nombre de thymidine) situé dans l’intron 8
du gène CFTR. Quand la mutation R117H est associée au variant T5 en position cis les sujets
∆F508/R117H ont une mucoviscidose classique mais sans insuffisance pancréatique. Lorsque
la mutation R117H est associée au variant T7, trois phénotypes sont possibles : une
mucoviscidose sans insuffisance pancréatique, une absence des canaux déférents, un
phénotype normal. Rappelons que le variant T5 est associé à une perte fréquente de l’exon 9
du gène CFTR et qu’il peut s’avérer délétère indépendamment de la présence de toute autre
mutation en cis. Il a été par ailleurs montré que d’autres variations pouvaient avoir un rôle
modulateur sur le phénotype, notamment un microsatellite (TG)m, situé lui aussi dans l’intron
8, et la mutation 470 méthionine → valine. (Aams, 1994, Craig 1996)
Cas de la drépanocytose qui est une maladie récessive, mais l’association du gène muté β s
avec une deuxième mutation en cis est à l’origine de formes dominantes. C’est le cas des
hémoglobines S. Antilles et S. Oman. On ne peut toutefois pas exclure que la deuxième
mutation soit à elle seule délétère. (Labie, 1996)

→ Modificateur non allèle du gène délétère

→ Modificateur fortement lié au gène délétère

Cette situation est mise en évidence par l’étude moléculaire de l’haplotype (segment
chromosomique suffisamment court pour que les recombinaisons y soient très rares) associé
au gène délétère. Elle doit en particulier être suspectée quand on observe chez des sujets
porteurs de la même mutation une grande hétérogénéité phénotypique interfamiliale
contrastant avec une forte ressemblance intrafamiliale. Les méthodes de la génétique
formelle ne permettent pas de distinguer cette situation de celle d’un modificateur
hétéroallélique agissant en cis. (Figure 16). ( D' Amato, 2003, Feingold, 2000)

31
Chapitre III : Analyse des génomes

Cas de la drépanocytose, bien que due à la même mutation, n’a pas la même gravité en
Afrique et en Inde. Il existe en effet dans ce dernier pays des formes bénignes compatibles
avec une survie normale, alors qu’en Afrique la maladie est grave, son évolution présentant
toutefois une certaine variabilité. Ces différences sont pour une part dues à des facteurs
régulateurs polymorphes, situés non loin du gène de la β -globine, qui jouent un rôle dans
l’expression des gènes fœtaux : en Inde, un taux élevé d’hémoglobine F à un effet favorable
sur l’évolution de la maladie. (Labie, 1996).

Chaque trait représente un allèle α -spectrine


(dans la direction 5’→ 3’).

A. Situation en trans : l’allèle αLELY, d’expression


faible, augmente l’expression de l’allèle αHE.

B. Situation en cis : le déterminant αLELY atténue


l’expression de la mutation αHE, maintenant
située sur le même allèle

Figure 16 : Les situations en trans ou en cis d’une mutation α HE et du déterminant α LELY.

Cas de l’amyotrophie spinale infantile, transmise sur le mode récessif autosomique, se


présente sous trois formes, toutes dues à la non-expression du gène SMNt (survival motor
neuron télomérique). Bien que les bases moléculaires de cette variabilité ne soient que
partiellement élucidées, on a mis en évidence une relation entre l’expression clinique de la
maladie et la concentration de la protéine SMNc codée par le gène SMN centromérique,
étroitement lié au gène télomérique qui est absent ou muté chez les malades. Le gène
centromérique peut donc être considéré comme un modificateur de la mutation délétère du
gène télomérique. D’autres gènes de la même région chromosomique ont peut-être aussi une
action modulatrice. (Lefèbvre, 1998).

→ Modificateurs distants du gène délétère

Les méthodes mises en œuvre pour détecter et identifier de tels gènes non pathologiques
et dont le polymorphisme n’a qu’un petit effet sur le phénotype sont proches de celles qui
sont utilisées en épidémiologie génétique pour l’analyse des maladies multifactorielles. On
peut ainsi chercher à repérer des gènes candidats. Un gène candidat est un gène dont la
fonction, connue, est supposée interagir avec celle du gène majeur impliqué dans la maladie.
Cette interaction peut concerner soit le phénotype de la maladie au sens strict, soit l’une ou
l’autre des complications qu’elle peut présenter. On peut tenter de détecter un éventuel effet

32
Chapitre III : Analyse des génomes

d’un polymorphisme fonctionnel du gène candidat, ou encore l’effet indirect d’un


polymorphisme neutre, péri- ou intra-génique, qui serait en déséquilibre de liaison avec un
variant fonctionnel. (Feingold, 2000)

Cas des cardiomyopathies hypertrophiques familiales (CHF) : sont des maladies dominantes
autosomiques, très hétérogènes sur le plan génétique, les mutations d’au moins six gènes y
étant impliquées. Or on sait que l’enzyme de conversion de l’angiotensine 1 (ACE) joue un rôle
dans l’hypertrophie du muscle cardiaque chez le sujet sain. Le gène de l’ACE apparaît donc
comme un candidat plausible en tant que modificateur des CHF. De fait, il a été démontré
qu’un polymorphisme insertion/délétion (I/D) de ce gène était associé à une modulation de
l’hypertrophie dans les CHF dues à une mutation de la chaîne lourde de la β -myosine (β -
MHC). Plus précisément, dans le cas de CHF dues à une mutation du codon 403 du gène β -
MHC, l’hypertrophie du septum inter-ventriculaire est significativement plus importante chez
les sujets D/D que chez les sujets I/D ou I/I, ces derniers ayant l’hypertrophie la moins
importante. (Tesson, 1997)

4. Le criblage moléculaire
Les stratégies actuelles du criblage moléculaire peuvent être regroupées en fonction de leur
orientation génomique : spécifique à une région ou de l'ensemble du génome. Au sein de ces
grandes catégories, il existe plusieurs approches pour l'identification de nouvelles mutations.
En général, les cribles spécifiques à une région sont conçus pour examiner le contenu
fonctionnel d'un segment génomique, alors que les stratégies de l'ensemble du génome sont
mieux adaptées à la dissection d'un processus biologique spécifique. Dans certains cas, un
crible spécifique à une région pourrait être une méthode plus appropriée pour l’identification
de mutations qui affectent un processus particulier - par exemple, le développement - dans
laquelle un grand nombre de gènes ont des rôles essentiels. Une approche spécifique à une
région, bien qu’elle puisse réduire le nombre de mutations potentielles qui pourraient être
identifiées, elle peut augmenter considérablement la facilité avec laquelle le crible est réalisé
ce qui permet de maintenir les mutations. (El Hakam, 2016 )

→ Le criblage moléculaire, dit à haut débit, est la technique de référence pour la


recherche de nouvelles molécules susceptibles de devenir les outils de recherche ou les
médicaments de demain. Cette technique consiste à la fois à reproduire et miniaturiser
un test biologique ou biophysique, et à l'utiliser pour tester un grand nombre de molécules,
présentes dans les chimiothèques. Cette miniaturisation et l’utilisation de robots permettent
de tester jusqu’à 10 000 fois plus de molécules qu’un opérateur manuel. Après un
premier test, les molécules montrant une activité significative (les «touches» ou «hits»)
sont testées à nouveau dans le cadre d’un criblage secondaire. Elles sont ensuite étudiées
de façon plus approfondie afin de caractériser leur action. (Priscille, 2015)
→ Criblage phénotypique, ou ‘’ Le high content screening (HCS)’’, connu sous le terme
de « criblage à haut contenu », est apparu au cours des années 1990 et représente une
technologie innovante permettant l’évaluation des composés destinés à devenir des futurs
médicaments. Le HCS fut initialement conçu pour élargir la compréhension du mécanisme
d’action des composés en testant directement leur bioactivité sur des cellules cultivées en
laboratoire (Figure 17). Au cours des dix dernières années, le champ d’utilisation du HCS s’est

33
Chapitre III : Analyse des génomes

considérablement étendu au sein des laboratoires de recherche académiques. La technologie


est ainsi devenue le point de départ de nombreux programmes d’études fonctionnelles visant
à comprendre, pour une pathologie donnée, les cibles protéiques ou les grandes fonctions
cellulaires sur lesquelles de futurs médicaments pourraient agir. Cette approche de criblage
repose sur l’acquisition d’images en fluorescence de cellules marquées, ce qui génère
d’énormes quantités de données qui doivent être traitées par analyse d’images automatisée,
et stockées de manière appropriée. Le stockage, l’analyse et la visualisation des données
associés à leur intégration et leur interprétation sont encore des défis omniprésents auxquels
la méthodologie HCS doit faire face. (Priscille, 2015)

Figure 17 : Processus de criblage phénotypique, ou HCS (Le high content screening) (Priscille, 2015)

34
Chapitre III : Analyse des génomes

Celui-ci se décompose généralement en quatre étapes : ( 1 ) la phase de développement et de


miniaturisation d’un test phénotypique, avec détection des cellules par microscopie automatisée, ( 2 )
la phase d’automatisation, consistant en la robotisation de l’essai, ( 3 ) la phase de criblage, incluant
l’acquisition et l’analyse d’images, ainsi que le stockage des données, et ( 4 ) une étape finale d’analyse
statistique des données pour la sélection de modulateurs génétiques et chimiques, incluant les phases
de validation secondaire et de caractérisation fonctionnelle (dose-réponse, étude de la relation
structure-activité des composés

L’analyse des images permettra, par exemple, de connaître le nombre de cellules, la


distribution d’une protéine cible dans chaque cellule, les caractéristiques morphologiques
(taille, forme, texture), l’identification des compartiments subcellulaires associée au calcul de
leur diamètre ou de leur surface, ou encore le repérage du chevauchement entre différents
objets (colocalisation). Toutes ces données sont accessibles pour la totalité de la population
cellulaire, pour des sous-populations ou encore cellule par cellule. Cette étape est illustrée
dans la Figure 18. (Soleilhac, 2010)

Figure 18 : Acquisition en plaque à l’analyse du phénotype (Soleilhac, 2010)

Chaque image correspond à un champ d’un puits d’une microplaque. Le phénotype est extrait en
segmentant chacune des cellules du champ puis, au sein de celles-ci, en déterminant la taille, la surface
et la texture des structures intracellulaires, et en établissant une corrélation avec un processus
biologique.

→ Criblage virtuel consiste à sélectionner et identifier des molécules bioactives par voie
informatique. Nous disposons d’une base de données de 10 à 15 millions de molécules
commercialement disponibles. Il est impossible de les tester toutes expérimentalement, alors
on les passe au crible : on définit les critères (forme, taille, structure…) selon les propriétés
recherchées, pour ne retenir que celles qui sont d’intérêt, environ 100 à 200. Et ce sont celles-
ci qui seront testées expérimentalement en laboratoire. (Figure 19)

35
Chapitre III : Analyse des génomes

La molécule bleue, repérée par criblage


informatique parmi 3 millions de composés,
présente un effet anxiolytique,
antidépresseur et analgésique remarquable
chez la souris et ouvre ainsi de nouvelles
perspectives thérapeutiques.

Figure 19 : Criblage virtuelle d’une molécule d’intérêt médical. (Robert, 2007)


Le point de départ, ce sont souvent des biologistes qui cherchent une molécule capable
d’inhiber une protéine impliquée dans une pathologie. Une fois identifiées comme molécules
actives sur la protéine, ces dernières sont ré-synthétisées en laboratoire pour s’assurer de leur
pureté et leur efficacité. Ainsi, leur structure est modifiée pour obtenir des analogues qui
pourraient avoir des propriétés encore plus intéressantes que la molécule de départ.
L’intérêt de ce criblage virtuel, est d’accélérer la recherche et la découverte de molécules bioactives
de façon automatisé. Il n’y a pas de limite en termes de nombre de molécules pouvant être criblées.
On peut en cribler informatiquement 10 millions en deux jours. Contrairement au criblage
expérimental robotisé, qui suppose d’archiver et de stocker les molécules, de les conditionner sous
forme de microplaques. C’est plus rapide et le taux de réussite est 100 fois supérieur. (Robert, 2007)

5. Motifs génomiques des organismes modèles


A. Génomique des Organismes modèles
Le problème crucial de l'analyse de séquences génomiques est l'identification des séquences
codantes. L'identification des unités transcriptionnelles est grandement facilitée chez les
Procaryotes par la possibilité d'identifier relativement facilement les promoteurs des gènes,
par la quasi absence d'intron, par la possibilité de reconnaître aisément les phases ouvertes
de lecture et leur terminaison, et par la faible taille des séquences intergéniques.
Deux caractéristiques compliquent radicalement l'identification des séquences codantes chez
les Eucaryotes: le découpage des gènes en introns et exons, et la présence de régions
intergéniques, parfois très vastes.
Chez la levure, ces problèmes restent mineurs, car seulement 5% des gènes sont morcelés en
plusieurs exons, et les régions non codantes sont peu abondantes. Chez C. elegans, D.
melanogaster ou A. thaliana, l'analyse des séquences est déjà beaucoup moins aisée, car les
régions codantes sont en majorité fragmentées, et la fraction d'ADN non codant est
importante. Cette fragmentation exon-intron est aussi la règle dans les génomes de Vertébrés,
chez lesquels les régions intergéniques sont souvent très étendues.
L'identification de gènes peut aussi utiliser des données provenant d'un autre organisme, tels
que par exemple les alignements obtenus entre la séquence génomique de C. elegans et les

36
Chapitre III : Analyse des génomes

séquences d'EST obtenues à partir de Caenorhabditis briggsae, ou les alignements obtenus


entre les séquences génomiques de Tetraodon nigroviridis ou Mus musculus dans le cas de
Homo sapiens. (Tableau III) . (Bernot, 2001)

Tableau III : Nombre de gènes chez quelques organismes modèles, (Bernot, 2001)

Organisme Nb de gènes prédits % gènes connus


E. coli 4288 62%
C. elegans 18 424 42%
A. thaliana 27 029 69%
M. musculus 24 502 50%
H. sapiens 22 763 50%

 Génomes des modèles procaryotes


Chez les Procaryotes, l'abondance en guanine et cytosine par rapport à la totalité du génome,
appelé contenu en [G+C], présente d'importantes variations selon l'espèce: entre 22% chez
Wigglesworthia glossinidia et 67% chez D. radiodurans. Les faibles taux de [G+C] sont souvent
liés à un mode de vie parasitique ou symbiotique. (Bernot, 2001)
 Organisation des gènes
Le séquençage de génome a parfois comporté celui de plasmides: chez X. fastidiosa
par exemple, ont été séquencés deux plasmides de 1.285 pb et 51.158 pb, portant
respectivement 2 et 64 ORF. Des plasmides linéaires sont aussi parfois présents: B. burgdorferi
contient par exemple en plus du chromosome linéaire sept plasmides circulaires (de 9 à 32
kb), et dix linéaires (de 17 à 56 kb). Le séquençage de mégaplasmides a d'autre part été réalisé
chez divers espèces, telle que par exemple D. radiodurans .
Globalement, la fraction codante des génomes procaryotes est élevée, de l'ordre de 90%
variant entre 97% (B. subtilis) et 49,5% (M. leprae). La taille moyenne des gènes observée est
de l'ordre de 925 pb, la plus faible étant celle de X. fastidiosa (799 pb), la plus importante celle
de M. pulmonis (1.115 pb). Le nombre de gènes le plus élevé est observé chez S. coelicolor
(7.825), l'autre extrême est présentée par M. genitalium, qui ne contient que 470 gènes.
Chez les Procaryotes, les unités transcriptionnelles sont fréquemment organisées en
opérons. Un opéron comprend plusieurs gènes, souvent impliqués dans une même fonction
physiologique. Chaque opéron est transcrit à partir d'un même promoteur, les gènes qu'il
contient sont donc soumis à des phénomènes de régulation identiques. Un seul ARN messager
est produit, et cet ARNm est par la suite clivé en régions correspondant à chacun des gènes,
avant traduction. Le nombre de gènes par opéron est très variable: chez E. coli, environ un
quart des gènes sont agencés en opérons, à l'inverse, le nombre d'opéron est très réduit chez
C. jejuni.
Les gènes codant les ARNr sont par exemple souvent agencés en groupe 16S-23S-5S,
constituant un opéron rrn (les régions situées entre les gènes 16S, 23S ou 5S codent souvent

37
Chapitre III : Analyse des génomes

des ARNt). Les rrn peuvent être répétés au sein des génomes bactériens: il en existe par
exemple 10 exemplaires chez B. subtilis. Mais chez d'autres espèces, telles que A. fulgidus ou
M. genitalium, un seul est présent. Chez certaines espèces, les loci rrn sont organisés
différemment (23S-16S-5S chez Vibrio harveyi), et il existe aussi des cas où les gènes 16S, 23S
et 5S ne sont pas assemblées en opéron (A. fulgidus ou H. influenzae).
Généralement, le nombre de pseudogènes (gènes mutés, non transcrits ou non traduits)
est faible, de l'ordre de 1 à 2%: chez C. jejuni sont par exemple présents 20 pseudogènes. Mais
à l'inverse, M. leprae présente une fraction importante d'ADN non codant (24%) et de
pseudogènes (27%). (Bernot, 2001)

 Séquences non codantes


Les domaines non codants des génomes bactériens sont représentés par les régions
intergéniques, contenant les séquences régulatrices et d'éventuelles séquences répétées, et
quelques rares introns. Globalement, les séquences répétées sont beaucoup plus rares chez
les Procaryotes que chez les Eucaryotes.
La distribution et l'abondance de ces éléments varient beaucoup entre espèces, souvent aussi
entre diverses variétés, et aucune généralité concernant l'ensemble des Procaryotes n'a été
mise en évidence. Même un génome tel que celui de M. pneumoniae, de taille pourtant très
réduite (0,8 Mb), comprend 6% de séquences répétées. A l'inverse, les génomes de Buchnera
ou de C. jejuni n'en présentent pratiquement aucune. (Bernot, 2001)
Chez E. coli, les séquences intergéniques ont une taille moyenne de 118 paires de
bases. La taille des plus grandes régions atteint quelques 600 pb, et il en existe une
quarantaine. Pour une vingtaine d'entre elles, il a été possible d'y reconnaître des sites de
fixation de protéines régulatrices de l'expression génique. Les autres contiennent soit des
séquences répétées, soit des séquences uniques dont le rôle (éventuel) reste inconnu.
Les séquences répétées en tandem comprennent un motif de 1 à 6 nucléotides, répété
de 2 à quelques dizaines de fois. Les séquences répétées dispersées ne contiennent
généralement pas de gènes. Dans un certain nombre de cas, leur fonction a été identifiée.
Une autre particularité connue chez les Procaryotes est leur capacité de transformation, c'est
à dire d'acquisition d'un fragment d'ADN, et d'intégration dans son chromosome en lieu et
place de la région homologue. Chez H. influenzae, la transformation est facilitée par l'existence
d'un grand nombre de séquences spécifiques de cette espèce: ces séquences sont appelées
USS (uptake signal sequences) elles sont représentées par des séquences conservées de 29
pb, comprenant un motif constant de 9 pb (5’ - AAGTGCGGT - 3’). Le génome de H. influenzae
comporte 1.465 USS: ce nombre élevé suggère que la transformation pourrait jouer un rôle
important chez cette bactérie. À l'inverse, le génome de C. trachomatis ne contient pas de
séquence impliquée dans la transformation ou l'acquisition d'ADN exogène, ce qui est

38
Chapitre III : Analyse des génomes

probablement corrélé au fait que ce parasite, isolé au sein de la cellule hôte, n'est pas amené
à acquérir d'ADN externe.
La transformation a joué un rôle historique dans le domaine de la génétique, puisque c'est
à partir des expériences de Griffith (1928) sur Streptococcus pneumoniae et la caractérisation
du facteur transformant par Avery (1944) que l'ADN a été caractérisé comme support de
l'hérédité. (Bernot, 2001)

 Génomes des modèles eucaryotes


La levure a été le premier Eucaryote chez lequel tous les chromosomes aient été
séquencés. On espérait alors pouvoir détecter quelques formes de régularité à longue
distance au sein des séquences de ces chromosomes entiers. Quelques grands traits
d'organisation ont effectivement été décelés:

→ Certains chromosomes apparaissent comme une succession de régions d'environ 150


kb alternativement riches ou pauvres en [G+C]. Cette périodicité est corrélée avec la densité
en gènes, plus nombreux dans les régions riches en [G+C]. Mais ces caractéristiques n'ont pas
été observées chez tous les chromosomes.
Alors que les brins complémentaires des chromosomes codent généralement un
nombre similaire de gènes, le nombre de gènes codés par chacun des brins du chromosome II
ou de la région centrale du chromosome VI est significativement différent. Aucune explication
satisfaisante n'a pu être proposée à cette observation.
→ Chez les chromosomes de petite taille (chromosomes I ou VI), la séquence montre que
leurs extrémités sont occupées par des éléments subtélomériques essentiellement non
codants. Leur fonction éventuelle serait "d'allonger" ces chromosomes afin d'en stabiliser la
structure et d'assurer une ségrégation correcte lors des divisions cellulaires.
→ Chez C. elegans, le génome est remarquablement uniforme du point de vue de la
teneur en [G+C], de l'ordre de 36%. Cette teneur ne varie pratiquement pas le long des
chromosomes, contrairement à ce qui a été observé chez les mammifères. La densité en gènes
le long des chromosomes est légèrement plus élevée dans les régions centrales que dans les
bras chromosomiques, et plus faible sur le chromosome X.
La taille du génome de la drosophile est de l'ordre de 180 Mb (le chromosome 4 ne
contient que 4 Mb). L'hétérochromatine est très large chez cette espèce, elle recouvre environ
60 Mb, et comprend essentiellement des séquences répétées, des éléments transposables, et
deux blocs de gènes ribosomiques. Les gènes uniques y sont rares. L'euchromatine couvre 120
Mb, elle contient la majorité des gènes.
Le génome de la souris est réparti en 20 paires de chromosomes (19 autosomes, et une
paire de chromosomes sexuels), tous acrocentriques. La taille globale est environ 14% plus
réduite que celle de l'homme, mais la teneur en [G+C] est en revanche très proche (tableau
3), elle est comme chez l'homme, répartie en régions riches ou pauvres en [G+C].

39
Chapitre III : Analyse des génomes

Le génome d'A. thaliana comprend 5 chromosomes (tous autosomiques) dont la


teneur en [G+C] est de l'ordre de 41%. Deux sont acrocentriques (chromosome 4 [18 Mb] et 2
[20 Mb]), deux submétacentriques (chromosome 3 [23 Mb], et 5 [26 Mb]), et un
métacentrique (chromosome 1, 29 Mb). (Bernot, 2001)

→ Identification des gènes


La première observation remarquable qui découle de l'analyse des séquences de ces
organismes est la densité élevée en gènes (Tableau IV), supérieure à ce que l'ensemble des
observations antérieures laissait supposer.

→ Chez S. cerevisiae, environ 6.200 gènes ont été identifiés (sans compter les ARNt et les
gènes de moins de 300 bases), soit cinq fois plus que ce à quoi on s'attendait. Ceci est corrélé
au fait que beaucoup de ces gènes ne se manifestent pas par un phénotype directement
observable: ils ne sont par conséquent pas décelables par les mutations les affectant, et
n'avaient donc pas été identifiés pas les techniques génétiques conventionnelles. Des gènes
recouvrants ont été mis à jour, tels que SMD1 et PRP38, localisés sur les brins opposés de
l'ADN chromosomiques, et dont les régions 3' codantes se recouvrent.
Le génome de S. pombe comporte environ 4.900 gènes. Alors que peu de gènes sont
fragmentés en plusieurs exons chez la levure (moins de 5%), cette fragmentation est plus
fréquente chez S. pombe, puisqu'elle concerne 43% des gènes (le nombre d'exons le plus élevé
observé chez un même gène est de 16). (Bernot, 2001)

→ Chez C. elegans, la densité en gènes prédits sur le génome a aussi dépassé tous les
pronostics: 19.100 gènes ont été identifiés. Chez cette espèce, le séquençage génomique a
révélé un nombre étonnamment élevé de gènes localisés dans l'intron d'un autre gène, ainsi
que de gènes recouvrants. Plus inattendu encore a été la mise en évidence d'une fréquente
organisation de ces gènes en opérons: plus de 15% des gènes du nématode s'organisent ainsi,
alors que l'on pensait que ce type d'agencement ne se rencontrait que chez les Procaryotes.

→ Chez D. melanogaster est de 13.600. Dans ce cas cependant, il était surprenant que ce
chiffre soit inférieur à celui obtenu chez le nématode: la drosophile est en effet un Métazoaire
triblastique coelomate, traditionnellement considéré comme représentant un stade
d'évolution plus avancé que celui du nématode, qui est un pseudocoelomate. Et une
drosophile comprend 10 fois de cellules que le nématode, et présente des comportements
bien plus évolués.

→ Chez la souris, le nombre total de gènes est de l'ordre de 27.000 - 30.500, fourchette
tout à fait comparable à l'estimation obtenue chez l'homme. Plus de 98% d'entre eux sont
d'ailleurs homologues à un gène humain. Aucun opéron n'a jamais été observé, ni chez la
souris, ni chez aucun autre Vertébré (à ce jour, des opérons eucaryotes n'ont été observés que
chez quelques espèces de Némathelmintes - dont fait partie C. elegans - ou de Plathelminthes
- tel que par exemple Schistosoma mansoni).

40
Chapitre III : Analyse des génomes

→ Chez A. thaliana, 25.500 gènes ont été identifiés. Ce chiffre est supérieur à ceux
obtenus chez le nématode ou la drosophile. Mais une telle comparaison doit être prudente:
d'une part les épissages alternatifs sont peu fréquents chez A. thaliana (moins de 5% des
gènes, contre 20-35% chez les Métazoaires). Ce génome a d'autre part récemment subit une
tétraploïdisation (duplication globale du génome, fréquente chez les végétaux), ce qui rend
probablement compte de ce nombre élevé de gènes (ce qui se retrouve dans le nombre de
gènes codant des ARNt, plus élevé que chez toute autre espèce eucaryote entièrement
séquencée). (Bernot, 2001)

Tableau IV Caractéristiques des génomes de quelques organismes modèles ainsi que la fréquence
des gènes sur les autosomes (Bernot, 2001)
Levure Nématode Drosophile Arabette Homme
Taille physique (Mb) 13 100 180 125 3.000
Taille moyenne d'un cM (kb) 3 500 300 220 800
Teneur en [G+C] 38% 36% nd 41% 41%
Nombre de gènes 6.200 19.100 13.600 25.500 ~30.000
Fraction codante 68% 27% 13% 29% 1,4%
Nombre moyen d'exons par gène 1,04 5,5 4,6 5,2 8,7
Taille des gènes (kb) 1,4 2,7 3 2,1 28
Taille moyenne du codant 1.450 1.311 1.497 1.300 1.340
(introns exclus)
Taille moyenne des exons (pb) 1.450 218 150 250 145
Taille moyenne des introns (pb) 500 267 487 168 ~3.300
Fréquence des gènes (par kb) 2 4,8 / 6 9 4,5 ~100
Nombre d'ARNt 273 584 284 589 535
Localisation chromosomique des 12 1 X et Y 2, 4 13, 14, 15, 21,
NOR 22

→ Fonctions des gènes reconnus ou prédits


Pour un certain nombre de gènes chez toutes ces espèces, l'analyse des séquences
protéiques déduites des séquences nucléotidiques permit par comparaison avec les gènes
déjà connus de prédire leur fonction. Grâce au séquençage systématique, le nombre de gènes
potentiellement impliqués dans une fonction biologique donnée s'est donc soudainement
accru, et ceci beaucoup plus rapidement que si des moyens de recherche classique avaient
été utilisés. Il subsiste cependant une fraction importante de gènes pour lesquels aucune
parenté avec des gènes déjà fonctionnellement connus n'apparaît (40 à 60%, selon les
espèces). (Bernot, 2001)
Le séquençage d'un génome peut révéler des fonctions insoupçonnées chez un organisme:
chez la levure par exemple, a été identifié un gène codant une histone H1, dont l'existence
n'était pas supposée auparavant. Parmi les gènes trouvés uniquement chez le nématode,
certaines codent des protéines SXC, impliquées dans des interactions avec la matrice
extracellulaire. Chez A. thaliana a été identifié le gène de lyase hydroxynitrile, produisant de
l'HCN, répulsif pour les herbivores.

41
Chapitre III : Analyse des génomes

Chez la drosophile ou le nématode, un nombre important de gènes codent des protéines


impliquées dans le cytosquelette (actine, tubuline...) ou dans la motricité (myosine, dynéine).
Ces gènes représentent des homologues de familles présentes chez les Vertébrés.

L'importance de l'ADN transcrit mais non traduit a été établie chez toutes ces espèces. Elle
comprend en particulier les gènes codant les ARNt, les ARNr, qui forment les organisateurs
nucléolaires, localisés dans différentes régions chromosomiques, et les 5S. Curieusement, 40%
des gènes codant des ARNt sont situés sur le chromosome X chez le nématode. (Bernot, 2001)

→ Régions non codantes

La répartition des séquences répétées chez les organismes modèles ainsi que chez l'homme
est représentée dans le tableau V. Sur l'ensemble du génome, elle atteint près de 15% chez la
drosophile (en raison de l'abondance de l'hétérochromatine); mais cette fraction est toujours
nettement plus faible que chez l'homme. (Bernot, 2001)

Tableau V. Fréquences des séquences répétées (Bernot, 2001)

Arabette Nématode Drosophile Souris Homme


LINE/SINE 0,5% 0,4% 4,7% 28% 28%
Séquences type rétrovirus 4,8% 0% 6,4% 10% 7%
Séquences type transposons 5,1% 5,3% 3,6% 1% 3%
Total 10,5% 6,5% 14,9% 38% 38%

Chez C. elegans, diverses familles de séquences répétées, en tandem ou dispersées,


ont été mises en évidence. Certaines de ces familles sont préférentiellement situées dans des
introns, d'autres en sont exclues. D'autres biais de localisation sont observés par rapport aux
divers autosomes et chromosome X, ou entre bras autosomiques et régions centrales.
Le génome d'A. thaliana contient un faible nombre de séquences répétées, de l'ordre
de 10% et cette fraction est très faible par rapport à celle connue chez les autres plantes. Dans
les régions centromériques ou péri-centromériques, le nombre d'éléments transposables et
de séquences répétées est élevé, avec une répartition distincte des différentes familles de ces
séquences. À l'inverse, le nombre de gènes est faible, et bien que beaucoup d'entre eux ne
soient pas fonctionnels, une fraction est toutefois transcrite, et certains correspondent à des
gènes de fonction connue (par exemple des ATPases, des transporteurs ABC, des enzymes de
réplication de l'ADN, des hélicases...). (Bernot, 2001)
La souris représente la deuxième espèce de mammifère (après l'homme, voir ci-
dessous) dont le séquençage global ait été entrepris. Dans ces deux cas, le travail de
séquençage est handicapé par l'abondance des séquences répétées, car - de par leur
ressemblance - différentes séquences répétées obtenues à partir d'un clone génomique
peuvent être assemblées alors qu'elles proviennent de régions distinctes.
Deux types de séquences répétées sont distingués :
→ les séquences répétées en tandem et séquences répétées dispersées. Les séquences
répétées en tandem comprennent les microsatellites, constitués de répétitions de

42
Chapitre III : Analyse des génomes

motifs dont la taille peut varier entre 1 et 13 nucléotides. Ils sont fréquemment
polymorphes, et distribués uniformément le long du génome.
→ Un autre ensemble de séquences répétées en tandem est représenté par les
minisatellites, dont la longueur du motif de base est de 14 à 500 paires de bases. Leur
répétition peut s'étendre sur 0,5 - 30 kb. (Bernot, 2001)

B. Reconnaissance de motifs dans les séquences biologiques


La recherche de motifs dans les séquences biologiques est une étape clef dans la
compréhension du fonctionnement des gènes et des organismes. Par exemple, si on connait
l’enchaînement de nucléotides qu’une protéine utilise pour se fixer à l’ADN, alors on peut
prédire la fixation de cette protéine sur différents gènes selon que ceux-ci possèdent ou non
cet enchaînement de nucléotides. Ce champ de la bio-informatique qui consiste à rechercher
dans les séquences biologiques les instances d’un motif connu est appelé reconnaissance de
motifs, mais il est plus souvent désigné sous le vocable anglais pattern matching. (Antoine-
Lorquin, 2016)

→ De l’ADN à l’ARNm
Un gène est une séquence de l’ADN susceptible d’être transcrite sous la forme d’un ARN.
La partie du gène copiée sous la forme d’un ARN (par transcription), puis transformée en
protéine (par traduction) est appelée partie codante.
L’expression d’un gène (la quantité d’ARN produite à partir d’un gène) est soumise à de
nombreux facteurs de régulation (accessibilité de l’ADN...). Parmi ces facteurs existe une
classe de protéines appelées Facteurs de Transcription (FT), qui ont la capacité de se fixer sur
des séquences spécifiques de l’ADN. Ces sites de fixation des facteurs de transcription (TFBS,
Transcription Factor Binding Site) sont généralement portés sur la partie de la séquence située
en amont du gène (appelée zone upstream). Un gène codant pour une protéine est constitué
de segments pouvant potentiellement composer un ARNm mature, les exons, et de segments
éliminés au cours de la maturation de l’ARNm, les introns. Le mécanisme qui permet d’obtenir
un ARNm à partir d’un gène est appelé transcription. (Antoine-Lorquin, 2016)

→ De l’ARNm à la protéine
La traduction est le mécanisme qui permet la synthèse d’un enchaînement d’acides
aminés, la protéine, à partir de la séquence d’un ARNm. Le complexe biologique permettant
cette synthèse est le ribosome.
Le ribosome "lit" les nucléotides de l’ARNm par groupes de trois, appelés codons. Chaque
codon correspond exactement à un acide aminé spécifique (mais un même acide aminé peut
correspondre à plusieurs codons). Le ribosome assemble les acides aminés en fonction de la
séquence ARNm et forme une protéine.
Ce découpage de l’ARNm en codons est appelé cadre de lecture ouvert ou ORF (Open
Reading Frame). Pour être valide, un ORF doit commencer par un codon start (AUG), qui initie

43
Chapitre III : Analyse des génomes

la synthèse d’une protéine, et se terminer par un codon stop (UAA, UAG ou UGA), qui conclut
la synthèse d’une protéine. (Antoine-Lorquin, 2016)

 Frameshift -1 : un mécanisme de recodage au cours de la traduction et un motif


complexe
Les motifs Frameshift -1 sont des motifs présents sur certains ARNm, qui permettent de faire
glisser le ribosome d’un cran en arrière lors de la synthèse de la protéine. Ce recul entraîne un
décalage de phase de l’ORF et modifie le découpage des codons [Bri95]. Cela permet de
synthétiser deux protéines différentes à partir d’un même brin d’ARNm. Ce recul a lieu sur
une zone de la séquence appelée "site de glissement", formée d’une structure NNX XXY YYZ,
située juste en amont d’une structure secondaire contre laquelle vient butter le ribosome,
généralement un pseudo-nœud. (Figure 20 & 21)
La structure du Frameshift-1 fait intervenir de nombreuses contraintes et donne donc
lieu à un motif très complexe : un codon start, un site de glissement positionné à une distance
particulière d’une structure en pseudo-nœud et un codon stop positionné sur un cadre de
lecture -1. (Figure 20)

Figure 20. Évènement de Frameshift-1 : production d’une protéine alternative. (Antoine-Lorquin,


2016)

44
Chapitre III : Analyse des génomes

Figure 21. Production alternative d’une protéine par l’effet d’une structure frameshift-1. (Antoine-
Lorquin, 2016)

Stratégies standards de reconnaissance de motifs en biologie


Il existe un trop grand nombre d’outils de reconnaissance de motifs, plus ou moins
connus et possédant chacun leur spécificité, pour pouvoir les présenter tous en détail. Dans
cette section, seront présentés différentes stratégies de reconnaissance de motifs
couramment utilisées par la communauté des biologistes.

 Recherche de motifs exacts : expressions régulières


Les expressions régulières sont l’une des formes de reconnaissance de motifs les plus basiques
et faciles à utiliser. En effet, elles reposent sur un modèle explicite décrit par l’utilisateur. Ainsi,
si un motif admet une alternative à certaines positions, la position où cette alternative
intervient doit être directement spécifiée dans le modèle. Les opérateurs définis sont, par
ordre de priorité croissante, l’union ensembliste (+), la concaténation (. ou rien) et la
fermeture de Kleene ou l’étoile (*).
En biologie, l’un des formalismes les plus connus d’expression régulière est celui
proposé par l’outil scanProsite [dCSG+ 06] de la base de données PROSITE [SCH+02], une base
de données sur les protéines pouvant être interrogée via des expressions régulières. Bien que
le formalisme puisse différer en fonction du langage utilisé, la logique est souvent la même
(Figure 22). (Antoine-Lorquin, 2016)

45
Chapitre III : Analyse des génomes

Figure 22 : Expression Régulière de la protéine doigts de zinc C2H2

Les doigts de zinc sont de petits motifs structuraux trouvés dans les protéines et capables d'ordonner
en complexe un ou plusieurs ions zinc pour stabiliser leurs plis

Ci-dessous figure le formalisme de PROSITE :


 Chaque position du modèle est séparée de la suivante par un trait d’union "-".
 Chaque caractère explicite définit la présence de l’acide aminé correspond à
exactement cette position du motif.
 Lorsque plusieurs alternatives sont possibles à une même position, celles-ci sont
indiquées entre crochets "{}".
 La notation "x(4,7)" signifie qu’entre 4 et 7 acides aminés peuvent s’intercaler à cette
Position
 La notation "x(2)" signifie qu’exactement 2 acides aminés peuvent s’intercaler à cette
position
 La notation "{GT}" signifie que tous les acides aminés sont autorisés à cette position, à
l’exception des deux acides aminés correspondant aux lettres entre accolades.

Ainsi, l’expression régulière : A-T-x(1,2)-T reconnait tous les motifs de taille 4 et 5 commençant
par "AT" et finissant par "T". Cependant ; il n’y a pas réellement d’outils de recherche dédiés
car les expressions régulières font partie intégrante de nombreux langages de programmation
(Bash, Python, ...). (Antoine-Lorquin, 2016)

46
Chapitre III : Analyse des génomes

 Recherche de motifs par alignement


L’une des méthodes classiques de recherche d’une séquence proche d’une référence consiste
à aligner cette séquence contre la référence et constater à quel point cet alignement est
possible.
Dans un alignement, les insertions et délétions d’une séquence sont présentées sur la
séquence opposée par le symbole "-", appelé gap. Les gaps font l’objet d’un traitement
spécifique selon les méthodes d’alignement.
Il existe un grand nombre d’algorithmes d’alignement possibles, qui dérivent de trois
algorithmes fondamentaux basé sur la programmation dynamique :

Algorithme de Needleman-Wunsh; Il s’agit d’un algorithme d’alignement global, c’est-à-dire


qu’il essaie d’aligner la séquence contre l’intégralité de la référence. Des scores sont associés
pour les différents cas de figure de l’alignement (match exact, insertion, délétion, substitution)
et l’algorithme permet de tester toutes les possibilités pour fournir l’alignement avec le score
le plus élevé. Le calcul des possibilités se fait via un tableau à deux dimensions (Figure 23 ) et
la solution débute à partir du score le plus haut obtenu sur l’un des côtés opposés au point de
départ, fixé en haut à gauche. (Antoine-Lorquin, 2016)

Figure 23 : Tableau de scores pour alignement de Needleman-Wunsh

Un score Si,j est obtenu en ajoutant le score de l’alignement de la position i de la séquence


avec la position j de la référence à max (Si−1,j,Si−1,j −1,Si,j − 1)

→ Algorithme de Smith-Waterman ; Il s’agit d’un algorithme d’alignement local,


c’est-à-dire qu’il essaie d’obtenir le meilleur alignement possible, même s’il ne concerne
qu’une fraction De la séquence ou de la référence. Il reprend la même logique que celle de

47
Chapitre III : Analyse des génomes

Needleman- Wunsh, mais débute la solution à la position avec le score le plus haut et remonte
l’alignement jusqu’à atteindre une extrémité du tableau ou arriver à un score nul (figure 24).

Figure 24 : Tableau de scores pour alignement de Smith-Waterman

Le meilleur alignement local est surligné en vert : GCCUCG

→ Alignement semi-global ; Il s’agit d’un algorithme qui donne de meilleurs


résultats lorsque les tailles des séquences et de la référence diffèrent. Il est basé sur
l’algorithme de Needleman-Wunsh mais ne fixe pas de pénalité au score pour les gaps en
amont et en aval de la plus petite séquence. Ceci permet d’aligner localement la totalité de la
plus petite séquence. (Antoine-Lorquin, 2016)
→ Analyse de séquences par alignement : BLASTN ; BLAST est l’outil d’alignement
le plus connu et utilisé par la communauté des biologistes. Il permet de rechercher des
séquences contre différentes bases de données de référence. BLAST permet d’effectuer des
alignements entre des séquences et des références de même nature (nucléotides contre
nucléotides, protéines contre protéines) mais aussi des alignements hybrides (nucléotides
contre protéines et réciproquement). BLAST utilise une heuristique de recherche basée sur le
principe de graines. Les séquences sont préalablement fragmentées en k-mers (mots de taille
k) chevauchants. BLAST effectue d’abord une recherche des k-mers correspondant entre la
séquence et les références pour limiter le nombre de candidats. Pour les séquences disposant
de k-mers similaires, BLAST effectue un alignement en allongeant progressivement la
séquence autour des k-mers. Les résultats fournis par BLAST indiquent à la fois le pourcentage
de couverture (à quel point les deux séquences sont chevauchantes) et le pourcentage
d’identité (à quel point les séquences sont parfaitement alignées) d’un alignement.
BLAST autorise de nombreux paramètres influant sur les résultats d’alignement,
notamment la taille des graines nécessaires pour étendre un alignement, les scores et
pénalités en cas d’alignements exacts ou inexacts et les pénalités d’ouverture et de
prolongement des gaps.

48
Chapitre III : Analyse des génomes

Les paramètres ne permettent pas de spécifier exactement un nombre ou un taux d’erreurs


maximum précis pour l’alignement. (Antoine-Lorquin, 2016)

 Recherche de motifs à partir de références


Il est commun qu’un ensemble de références, de mêmes tailles mais présentant de légères
variations, soit connu pour décrire un motif biologique. Il existe au moins quatre stratégies
possibles pour traiter ce genre de motifs :
→ Consensus établir le consensus des références, c’est-à-dire, pour chaque
position présentant des choix, ne conserver que le choix majoritaire. Ceci permet d’obtenir
une séquence unique, qui peut par exemple servir de référence pour un alignement, mais
occulte toutes les subtilités du motif.
→ Expression régulière: conserver la mémoire de chaque choix, c’est-à-dire
établir une expression régulière faisant apparaître toutes les possibilités à chaque position.
Dans ce cas, chaque alternative a le même poids, ce qui ne reflète pas exactement la réalité.
Par exemple, dans la figure 1.14, la position 14 de l’expression régulière admet un C et un T,
alors que la fréquence du T à cette position est très rare (1 fois sur 13).
→ Matrice : conserver la mémoire et le poids relatif de chaque choix, par exemple
en construisant une matrice [Hen96]. Les matrices permettent de conserver le rapport de
force qui peut exister entre les différentes alternatives possibles.

Les modèles matriciels ont la particularité de définir un score pour toutes les séquences de
même taille que le modèle. Plus la séquence est similaire au consensus de la matrice, plus le
score est élevé. Il revient à l’utilisateur de fixer un score seuil de validation, qui déterminera
quels sont les matchs valides. (Antoine-Lorquin, 2016)

 Recherche de motifs structurés


La recherche d’appariements par complémentarité de régions dans les ARN peut se faire d’au
moins deux façons : d’une part en appliquant les règles de thermodynamique, c’est-à-dire en
mesurant si les liens formés entre les deux régions de la tige sont suffisamment forts en
termes d’énergie libre pour maintenir la structure formée, d’autre part, en codifiant les règles
qui permettent la formation de structure.

→ Analyse de séquences par règle de thermodynamique : RNAfold et mfold


Le RNAfold et mfold sont deux outils qui recherchent des repliements dans les séquences en
s’appuyant sur la thermodynamique.
Tous deux permettent de fixer des paramètres pour la recherche de modèles (température,
force ionique, taille des tiges, etc.). Il n’est pas garanti qu’une structure identifiée pour une
molécule ARN par mfold soit exacte, en raison des limitations des modèles, du bruit induit par
les paramètres, l’impossibilité de définir des pseudo-noeuds, l’interférence d’autres
molécules se complexant à l’ARN ou la possibilité de conformations alternatives des ARN. En
effet, mfold identifie la structure présentant le minimum d’énergie libre, donc la plus stable
possible, sans influence extérieure.

49
Chapitre III : Analyse des génomes

Ces deux logicielles identifient plusieurs structures possibles et les classent par probabilité,
proportionnellement au minimum d’énergie libre de chaque structure : la plus basse, donc la
plus stable, obtient la probabilité de formation la plus haute. (Antoine-Lorquin, 2016)

→ Analyse de séquences par complémentarité des chaînes : Structator


Structator est un logiciel qui permet de rechercher des structures secondaires de type tige-
boucle décrites sous la forme d’une séquence et d’une structure représentant les interactions
sous forme de couples de parenthèses. La séquence peut contenir un nombre quelconque de
nucléotides indéfinis, voir ne contenir aucun nucléotide défini. Des options permettent de
définir la présence d’insertion en amont ou en aval de la boucle, ainsi que des insertions en
amont et en aval du modèle (mais devant respecter la complémentarité de façon à allonger la
tige). Il n’est pas possible de permettre des indels ou des substitutions en d’autres points de
la séquence. Par défaut, seuls les liai- sons Watson-Crick sont considérées, mais il est possible
de spécifier l’ensemble des binômes permettant de vérifier un lien de complémentarité.
→ Recherche de motifs complexes
Les outils précédemment abordés permettent la recherche de motifs biologiques sous forme
de mots, voire de palindromes. Même en incluant la recherche de variants, ce sont des motifs
de faible complexité. Il existe d’autres motifs qui font intervenir la recherche de nombreuses
propriétés ou de nombreuses contraintes de types différents. Ces motifs ne peuvent
généralement pas être modélisés par les outils classiques. Pour pallier ce problème, des outils
dédiés sont élaborés, spécialisés dans la recherche d’un unique type de motif complexe. Ils
procèdent généralement par enchaînement de filtres successifs. (Antoine-Lorquin, 2016)

Par exemple, KnotInFrame est un outil spécialisé dans la recherche des motifs
Frameshift-1 (décrits plus haut en début de cette section). Cette recherche s’effectue en 3
étapes :
— Phase de recherche : le programme analyse la séquence pour identifier des sites de
glissement sur le cadre de lecture 0. La région upstream directement en aval de ce site est
analysée pour vérifier sa compatibilité avec une structure en pseudo-nœud.
Cette analyse de la structure est faite par une approche thermodynamique (basé sur
pknotsRG-mfe et RNAfold
— Phase de filtre : trois critères basés sur l’énergie libre et les contraintes de repliement sont
appliqués pour réduire le nombre de candidats
— Phase de classement : les candidats restant sont classés par une fonction d’évaluation
basée sur la dominance normalisée de l’énergie du pseudo-nœud. (Antoine-Lorquin, 2016)

50
Chapitre IV : La place des organismes modèles dans la recherche

1. Le modèle animal dans l’expérimentation

Historiquement, au XIXe siècle, on pratiquait des expérimentations sur les animaux


sans se soucier de leur souffrance : seul le progrès scientifique importait. Depuis, de
nombreuses questions éthiques ont été soulevées et des méthodes alternatives à l’utilisation
des animaux se sont développées.
L'expérimentation animale consiste à utiliser des animaux comme substitut ou modèle, pour
mieux comprendre la physiologie d'un organisme et ses réponses à divers facteurs
(alimentation, environnement, agents pathogènes) ou substances (pour en tester, vérifier ou
évaluer l'innocuité ou la toxicité), et tout particulièrement pour tenter de prévoir ce qui se
passe chez l'humain.
Ainsi, les progrès récents spectaculaires de la biologie moléculaire ont révélé le haut
degré de complexité des organismes vivants et rendu plus que jamais indispensable le recours
aux modèles cellulaires et animaux. L’approche combinatoire fondée sur le traitement
bioinformatique de l’ensemble des données in vivo, in vitro et/ ou in silico s’impose comme le
modèle d’avenir. (Claude Milhault, 2012)
Afin de dégager quelques fils directeurs, le tableau VI, extraits du palmarès global du
Prix Nobel de physiologie du système nerveux, ou de médecine, de génétique ou de
l’immunologie, de sa création en 1901 à nos jours. Il illustre, respectivement, la part prise par
les organismes/animaux modèles dans les travaux fondamentaux sur les virus et les bactéries
pourtant à l’origine, eux aussi de découvertes majeurs distinguées par plusieurs prix Nobel
depuis le début du XXe siècle.
Tableau VI. Quelques-uns des grands progrès de la médecine depuis le début du XXe Siècle (Claude
Milhault, 2012)

ANNEE LAUREATS THEMES MODELES


1905 R. Koch Agent de La tuberculose et du choléra Vache
Mouton
1907 A.Laveran Agent du paludisme Oiseau
1923 F.G.Banting ; Découverte Insuline, et mécanisme Chien, lapin, poisson
J.J.R.Macleod Du diabète
1945 A.Fleming, Découverte de la Pénicilline Souris
E.B.Chain
1951 M. Theiler Vaccin contre la fièvre jaune Singe, souris
1954 J.F.Enders Vaccin contre la poliomyélite Singe, souris
F.C. Robins (culture in vivo du virus)
1966 F.P. Rous Virus induisant des tumeurs et traitement Rat, lapin, poule
C.B. Huggins Hormonal du cancer de la prostate
1976 C.Gajdusek Origine du Kuru (maladie à prion) chimpanzé
B.S.Blumberg
1990 J.E.Murray Techniques de transplantations d’organes Chien
E.D.Thomas (jumeaux homozygotes)
1997 S. Prusiner Découverte des prions Souris, Hamster
2005 B.Marshall Rôle de H.pylori dans les ulcères gastriques Gerbilles, Porc
R.Warren

51
Chapitre IV : La place des organismes modèles dans la recherche

2008 F.Barré-Snoussi Découverte des virus HPV et HIV Souris, primate


L.Montagnier
2010 R. Edwards Développement de la fécondation in vitro Souris, Lapine

Notion d’expérimentation Animale


C'est une section de la recherche où l’animal est l’objet de manipulations invasives. Selon la directive
européenne 2010/63/UE, elle concerne la recherche qui est susceptible « de causer une douleur, une
souffrance, une angoisse ou des dommages durables équivalents ou supérieurs à ceux causés par
l’introduction d’une aiguille ». Ainsi, une expérience ayant pour objet l’étude du comportement animal
(éthologie) mais qui nécessite quelques prélèvements sanguins entre aussi dans cette catégorie. Selon
le code rural, une procédure expérimentale concerne « toute utilisation, invasive ou non, d'un animal
à des fins expérimentales ou à d'autres fins scientifiques ou à des fins éducatives »
(La Fondation Droit Animal ; 2018)

En Europe, les animaux sont principalement utilisés dans les domaines suivants :

•Études de biologies fondamentales (46 %)

•Recherche et développement en médecine humaine, animale et dentisterie (19 %)

•Production et contrôle en médecine humaine et dentisterie (11 %)

•Essais toxicologiques et autres évaluations de la sécurité (9 %)

•Production et contrôle de qualité en médecine vétérinaire (3 %)

•Diagnostic de maladie (2 %)

•Autre , enseignement professionnel, la protection de l'environnement ou la conservation des espèces


(9.3%)

Ainsi, l’ensemble des animaux modèles utilisés sont répartis comme suit :

 61 % de souris
 14 % de rats
 12 % d'animaux à sang froid (reptiles, amphibiens, poissons)
 6 % d'oiseaux
 7 % d'autres animaux (chevaux, les ânes, les porcins, les caprins, les ovins et les bovins, les
carnivores (qui incluent chats et chiens) et les primates non humains)

14 millions d’animaux par an en Europe. (Claude Milhault, 2012)

Les biologistes étudient les organismes à de multiples niveaux : molécules, cellules,


organes, fonctions physiologiques, en bonne santé ou malades. Tous ces niveaux doivent
être étudiés pour décrire et comprendre complètement les mécanismes en jeu. Les
deux, dans certains cas les trois premiers niveaux d’organisation, peuvent être étudiés in vitro
(par exemple en culture cellulaire). (Barré-Sinoussi, 2015)

52
Chapitre IV : La place des organismes modèles dans la recherche

Ces techniques sont devenues très sophistiquées pour reproduire les complexes
structures 3D des tissus. Elles représentent des avancées scientifiques majeures qui ont
remplacé l’utilisation d’animaux. Mais par ailleurs, l’exploration des fonctions physiologiques
et des interactions systémiques entre organes ne peut être réalisée que sur des organismes
complets. C’est par exemple le cas pour la plupart des régulations hormonales, pour la
dissémination des micro-organismes à l’occasion de maladies infectieuses, pour l’influence
des micro-organismes sur les défenses immunitaires ou pour le développement des fonctions
du cerveau. Dans ces nombreux cas, aucun modèle in vitro n’est actuellement disponible pour
reproduire complètement ces interactions, et des études sur les humains et les animaux sont
encore nécessaires. Des hypothèses et des modèles peuvent émerger d’études in vitro mais
ils doivent être testés et validés sur un organisme complet, sinon ils restent spéculatifs. Les
scientifiques sont bien loin de pouvoir prédire le fonctionnement d’un organisme complexe à
partir de l’étude de cellules, tissus et organes séparés.
Les plus grands défis rencontrés par la recherche biomédicale moderne concernent
entre autres les maladies complexes et multifactorielles comme le cancer, les maladies
cardiovasculaires, les maladies infectieuses, les désordres neuro-dégénératifs, les maladies
liées au vieillissement, pour lesquelles l’ensemble des approches expérimentales sont
indispensables du fait de leur complémentarité: biochimie, génomiques, culture cellulaire,
modélisation informatique, modèles animaux et études cliniques. (Barré-Sinoussi, 2015)

Quelques organismes modèles dans les maladies génétiques


humaines
Le nématode Caenorhabditis elegans (C. elegans), modèle majeur pour la biologie du
développement, permet l’utilisation de l’analyse génétique pour l’étude de l’anatomie et du
développement. Grâce au séquençage des génomes et aux techniques qui en sont issues
(utilisation de banques de mutants, criblages double-hybride dans la levure, puces à ADN, C.
elegans est entré dans l’ère de la post-génomique, comme la levure Saccharomyces
cerevisiae ou la mouche Drosophila melanogaster. Mais l’avantage de C. elegans par rapport
à ces autres systèmes modèles est que les données sur la fonction des gènes peuvent être
interprétées à la lumière de nos connaissances précises sur sa phylogénie cellulaire. Cet
organisme invertébré reste en effet le mieux décrit en termes physiologiques, notamment
pour l’organisation de son système nerveux.

1. C. elegans comme modèle pour les maladies dégénératives héréditaires humaines

L’utilisation de C. elegans pour l’étude de la physiopathologie des maladies humaines a


commencé vers le milieu des années 1990 par l’étude d’homologues de gènes humains
associés à certaines maladies. Un exemple abondamment décrit concerne la susceptibilité
génétique à la maladie d’Alzheimer, avec notamment l’étude des présénilines, ou l’étude de
myopathies comme la myopathie de Duchenne. On peut également étudier les effets de
l’introduction de gènes dont C. elegans est dépourvu, comme le gène codant pour la

53
Chapitre IV : La place des organismes modèles dans la recherche

huntingtine, responsable d’une maladie neuro-dégénérative humaine, la chorée de


Huntington. Pour de telles études, C. elegans présente plusieurs avantages : sa transparence,
son court cycle de reproduction (3,5 jours) et sa grande facilité de manipulation. À la question
de la conservation, chez l’homme, des anomalies et des activités pharmacologiques identifiées
chez cet organisme, les réponses sont apportées au cas par cas, avec un pronostic a priori
favorable qui provient de la comparaison des gènes - environ 45 % des gènes de C. elegans
possèdent au moins un homologue chez l’homme - et des nombreux aspects de sa physiologie
cellulaire qui sont bien conservés.

2. Le poisson zèbre: Un organisme modèle pour l'étude des maladies humaines


Tout comme la souris, le poisson-zèbre « Danio rerio », convient parfaitement pour les analyses
génétiques et représente un outil précieux pour créer des modèles génétiques de maladies humaines.
Commencé en 2001, le séquençage du génome du poisson-zèbre est toujours en cours. Le génome du
poisson-zèbre est moitié moins long que celui de l'homme ; sa structure génétique est pourtant
étonnamment similaire. Les gènes responsables de maladies humaines ont souvent des équivalents
chez le poisson-zèbre. (Lambert ; 2013)

Ce petit poisson « Danio rerio », qui se rencontre en Inde possède pratiquement le même génome que
l’être humain. Une caractéristique unique au monde qui fait de cette espèce un intéressant sujet
d’étude pour les maladies génétiques. Possédant un génome de 26.000 gènes codants, le patrimoine
génétique du poisson zèbre se trouve être actuellement le plus imposant jamais décrypté chez un
vertébré. Une caractéristique qui fait de ce petit poisson un très sérieux sujet d’étude chez les
généticiens qui affirment aujourd’hui pouvoir comprendre certaines maladies génétiques qui touchent
l’être humain simplement en procédant à des comparaisons avec les gênes du poisson. (Lambert ;
2013)

Exemple des maladies neuromusculaires Normalement, si on touche à un embryon du


poisson-zèbre, sa queue va tressauter et il va essayer de se sauver. En 2013, un groupe de
chercheurs a remarqué un embryon dont la queue demeurait immobile. Le gène responsable
a été découvert et du même coup ils ont trouvé que ce gène est l’équivalent du gène humain
STAC3 qui est à l’origine d’une maladie génétique rare, la myopathie amérindienne présente
chez les Amérindiens Lumbee en Caroline du Nord. L’étude de ce gène permettra également
d’étudier les mécanismes des contractions musculaires. Des études sont aussi en cours sur le
gène et la protéine «dystrophine», qui est en cause dans la dystrophie musculaire de
Duchenne. (Lambert ; 2013)

Exemple des cancers : En effet, de nombreux cancers chez l'homme sont caractérisés par ce
que l'on appelle l'aneuploïdie, c'est-à-dire un nombre anormal de chromosomes au sein de la
cellule. Habituellement, dans une cellule saine diploïde, le nombre de chromosomes est fixe :
chacun de nous possède 46 chromosomes, soit 23 paires.
En général, si le nombre de chromosomes n'est pas correct, la cellule ne peut vivre,
mais on connaît des exceptions. La trisomie 21 (trois chromosomes 21 au lieu de deux) est un
exemple d'aneuploïdie totale (toutes les cellules de l'organisme sont touchées). D'autres
trisomies en revanche ne permettent pas le développement du fœtus, qui meurt bien avant
la naissance.

54
Chapitre IV : La place des organismes modèles dans la recherche

L'aneuploïdie ponctuelle est aussi néfaste pour l'organisme. Certains gènes surreprésentés ou
au contraire absents dérégulent le cycle cellulaire et entraînent une prolifération des cellules,
ou cancer. Le processus d'apparition de l'aneuploïdie est encore peu compris, mais il est
supposé qu'elle a pour origine une répartition incorrecte des chromosomes dans les cellules filles
lors de la division cellulaire. (Lambert ; 2013)

3. La Drosophile comme modèle pour l’étude de maladies neurodégénératives

Les travaux déjà réalisés chez la drosophile en rapport avec les maladies
neurodégénératives seront présentés en trois parties : premièrement, l’étude de mutants
développant spontanément des neurodégénérescences ; deuxièmement, l’induction de
phénotypes de dégénérescence par transgénèse et les modèles de maladies à expansion de
triplets ; et troisièmement, les applications possibles des recherches effectuées dans notre
groupe sur la neurotransmission chez la drosophile
Les modèles drosophile des maladies à expansion de triplets devraient permettre de
comprendre pourquoi certains types cellulaires sont plus sensibles que d’autres à la présence
de ces homopeptides. Ils devraient également être utiles pour rechercher des gènes
fonctionnellement impliqués dans le mécanisme des dégénérescences. En effet, la
dégénérescence rétinienne est un phénotype immédiatement visible chez la drosophile, ce
qui rendra aisée la recherche de mutants réduisant ou au contraire exacerbant l’expression
de ce phénotype. Enfin, une caractéristique des maladies à expansion de triplets est
l’anticipation génétique : la longueur des séquences de triplets peut augmenter à chaque
génération, provoquant une apparition plus précoce de la maladie et augmentant parfois la
gravité des symptômes. Il serait intéressant de voir si un phénomène comparable pourra être
mis en évidence dans ces lignées de drosophiles transgéniques.
En revanche, l’expression dans les cellules épithéliales des disques imaginaux,
progéniteurs de structures adultes diverses comme les ailes, les pattes ou les antennes, n’a
aucun effet délétère sur ces structures (Tableau VII). (Serge Birman, 2000)
Tableau VII : Conséquences de l’expression ciblée d’un fragment polyglutamine de l’ataxine-3 dans
différents tissus de drosophile (Serge Birman, 2000)
Lignée GAL4 Tissu d’expression Phénotype
gmr-GAL4 rétine formation d’inclusions nucléaires,
dégénérescence progressive des photorécepteurs
elav-GAL4 neurones longévité très réduite des mouches adultes,
absence de signes patents de neurodégénéres-
cence dans le cerveau
lignée 24B muscles mortalité au stade larvaire
dpp-GAL4 cellules épithéliales aucun effet
des disques imaginaux

4. La Souris comme organisme modèle et son intérêt pour la recherche biomédicale

Depuis le 19e siècle, la souris est le modèle le plus utilisé pour la recherche génétique
chez les mammifères. Bien que la levure (Caenorhabditis elegans), le nématode
(Caenorhabditis elegans) ou la drosophile puissent être de bons modèles pour certaines

55
Chapitre IV : La place des organismes modèles dans la recherche

études comme celles du cycle cellulaire et du développement, la souris est un meilleur modèle
pour l’étude des systèmes complexes comme les systèmes immunitaire, musculaire,
endocrinien, nerveux, cardio-vasculaire, squelettiques et d'autres systèmes physiologiques
complexes communs aux mammifères. Et ce, principalement en raison de ses étroites
similitudes génétiques, physiologiques et pathologiques avec l'homme. Le génome de la souris
est environ 14% plus petit que le génome humain (2,5 gigabase (Gb) comparativement à 2,9
Gb) mais les deux génomes contiennent chacun environ 24000 à 25000 gènes codant pour des
protéines. En effet, 75-80% des gènes de la souris possèdent un orthologue unique et
identifiable chez l’homme et moins de 1% des gènes semblent n’avoir aucun homologue entre
les deux génomes (Waterston et al. 2002). On peut donc penser que les génomes murin et
humain sont issus d'un ancêtre commun datant ~85 millions d'années. Les évolutions
technologiques, et en particulier de génie-génétique ont permis de manipuler le génome de
la souris pour produire tous types de mutation et ainsi faciliter son analyse. Il est ainsi possible
de créer des souris «modèles» de nombreuses pathologies humaines, permettant d’évaluer
et valider de nouveaux traitements pour ces maladies. (Birman, 2000)

Exemple des maladies à prions : (maladie de Creutzfeldt-Jakob, par exemple) sont


héréditaires, sporadiques ou acquises. Dans ce dernier cas, elles ont été transmises
principalement ou exclusivement par le tissu nerveux issu d’individus souffrant d’une
maladie à prions, quelle que soit son origine (héréditaire, sporadique ou acquise). Selon
l’hypothèse de Prusiner, c’est une protéine prion mal conformée (riche en feuillets-β plissés)
qui est l’agent transmissible. À son contact, la protéine prion normale de l’hôte, adopte
à son tour une conformation anormale. Cette donnée explique que les souris invalidées pour
le gène de la protéine prion ne développent pas la maladie après contamination. Il est
difficile de transmettre une maladie à prions d’une espèce à l’autre, la transmission
étant limitée par le phénomène de barrière d’espèce. Les souris, par exemple, ne sont
que peu sensibles au matériel infectant issu de l’homme. En revanche, la transgénèse
de la protéine prion humaine chez la souris (souris « humanisée ») lui confère une
sensibilité accrue aux diverses souches de prion humaines. (Langui 2007).

Exemple en oncologie : L’espèce animale la plus couramment utilisée comme modèle en oncologie est
la souris commune Mus musculus. (figure 25). Sa petite taille, sa grande fécondité et son coût de
production et d’entretien relativement peu élevé en font un animal de choix pour les laboratoires. De
plus, le développement de nombreuses souches consanguines a permis d’obtenir des lots d’animaux
génétiquement très similaires, facilitant ainsi les études comparatives. Enfin, le génome de la
souris a été séquencé et de nombreux outils permettent de le manipuler, notamment par
transgénèse ou mutagénèse ciblée. (Lopez 2013)

56
Chapitre IV : La place des organismes modèles dans la recherche

Figure 25. Quelques souches de mus musculus utilisées dans la recherche médicale
Voici quelques souches de souris couramment utilisées et leurs caractéristiques :

Tableau VIII : Caractéristiques de plusieurs souches de souris utilisées dans la recherche médicale
(Lopez 2013)

Caractéristiques Désignation Utilisation médicale


de la souris
BALB/c Ce sont des souris albinos produites depuis1923. Elles sont
utilisées en immunologie. Parmi toutes les études publiées
entre 2001 et 2005 utilisant des souches consanguines,
immunocompétente 30% se servaient de BALB/c
C57 BL/6 Cette souche, créée en 1921, est également une des plus
répandues dans le monde : il est estimé qu’elle est utilisée
dans 14% des études. Elle est notamment utile pour les
modèles de tumeurs induites
La mutation Nude fut découverte en 1962 dans une
animalerie de laboratoire et caractérisée par Flanagan.
Nude Cette mutation concerne le gène codant pour la protéine
immunodéprimée Forkhead box N1 (FoxN1), qui est un facteur de
transcription. La protéine FoxN1 porteuse de la mutation
Nude perd son domaine de fixation à l’ADN. Cela provoque
entre autres le blocage de la différenciation des cellules
épithéliales du thymus et crée à terme une lymphopoïèse.
(Severe Combined Immunodeficiency): Des souris
possédant des nœuds lymphatiques de très petite taille et
un microthymus, et ne produisant pas de lymphocytes B
SCID et T matures.Ces particularités proviennent de la mutation
du gène Prkdc, provoquant une inactivation de la sous-
unité catalytique de la protéine DNA-PK. La fonction
principale de cette protéine est de réparer les cassures
doubles brin de l’ADN.
Ces souches SCID tolèrent plus facilement les greffes que
les souris Swiss nude. Néanmoins, pour une raison à ce
jour inconnue, certaines souris SCID adultes, dites
“leaky”, peuvent générer des clones fonctionnels de
lymphocytes B et T (Bosma 1992). A partir de 10 ou 14

57
Chapitre IV : La place des organismes modèles dans la recherche

mois d’âge, toutes les souris SCID peuvent être considérées


comme étant « leaky ». Pour contourner ce problème, une
autre souche de souris, la souche RAG1/RAG2, peut être
utilisée. Ces souris ne produisent jamais de lymphocytes
matures car un défaut en enzyme RAG empêche tout
déclenchement de la recombinaison V(D)J.
Cette souche est obtenue en provoquant la mutation SCID
chez des souris de souche NOD (Non Obese Diabetic). Les
souris NOD portent une mutation sur l’exon 2 du gène
NOD-SCID CTLA-4, qui provoque l’apparition d’un diabète
insulinodépendant chez 80% des souris femelles et 20% des
souris mâles à partir de l’âge de 30 semaines. Comme la
mutation SCID empêche la maturation des lymphocytes T, les
souris NOD-SCID ne développent pas de diabète.
Néanmoins, contrairement aux souris SCID, les souris NOD-
SCID n’ont pas de cellules NK et ne sont pas « leaky ». Elles
tolèrent donc encore mieux les greffes que les autres souris
SCID. Elles ont cependant tendance à développer des
lymphomes.
NSG Il s’agit d’une des souches de souris les plus
ou immunodéprimées. En plus des mutations NOD et SCID, ces
NOD-SCID souris présentent une déficience en sous-unité gamma des
Gamma récepteurs IL2 (IL2Rγ)
Cette souche aux caractéristiques très proches des NSG
(mutations NOD, SCID et IL2R) est très utilisée pour
NOG répondre à des problématiques concernant les cellules
souches tumorales. Elle présente une plus faible incidence
de lymphomes que les souris NOD-SCID.

58
Chapitre V : Transgénèse, stratégies à grandes échelles

*Notions d’organismes transgéniques


Un organisme transgénique contient de l'ADN recombinant intégré de manière stable
dans toutes ses cellules. En d'autres termes, l'organisme, qu'il s'agisse d'une plante, d'un
animal ou d'un microorganisme, possède un nouveau morceau d'ADN intégré dans un
chromosome dans chacune de ses cellules. Ce « nouveau morceau » d'ADN contient
généralement un gène provenant d'un autre organisme (plante, animal ou autre) et qui a été
modifié de sorte à être exprimé dans le nouvel organisme. Un organisme transgénique peut
même posséder l'ADN d'un autre organisme de la même espèce. Le gène inséré peut être
appelé le transgène. Les organismes transgéniques sont mis au point à l'aide de la technologie
de recombinaison de l'ADN, décrite dans la section portant sur le génie génétique.

En général, le nouveau morceau d'ADN renferme un gène qui code pour une protéine
particulière. Par conséquent, les organismes transgéniques acquièrent habituellement une
nouvelle fonction ou un nouveau trait caractéristique. Par exemple, on a obtenu des cultures
possédant un gène offrant une résistance aux insectes; on a créé des animaux qui produisent
dans leur lait des protéines pouvant être recueillies et utilisées pour traiter des infections
aiguës; et certaines bactéries sont capables de décomposer en toute sécurité des déchets
toxiques. On peut également désigner les organismes transgéniques par l'expression
organismes génétiquement modifiés (OGM). En fait, on utilise généralement le terme
transgénique lorsqu'on fait allusion à des animaux, et l'expression génétiquement modifié
lorsqu'on veut parler de plantes ou de microorganismes auxquels on a intégré de l'ADN
recombinant. Mais les deux termes signifient exactement la même chose. (Cottier, 2000)

Les animaux transgéniques


Les animaux sont constitués de milliards de cellules. La production d'un animal
transgénique doté dans chaque cellule d'un nouveau morceau identique d'ADN semble à
première vue un processus fort laborieux. (Cottier, 2000)
Les scientifiques peuvent tirer parti d'une caractéristique fondamentale du
développement animal : il est possible de déterminer de quelle cellule proviennent toutes les
cellules d'un animal donné. En d'autres termes, chaque animal est né d'une seule cellule, qui
s'est divisée et redivisée pour finalement produire les milliards de cellules qui le constituent.
En conséquence, pour s'assurer que chaque cellule de l'animal contient le même morceau
d'ADN, les scientifiques ajoutent de l'ADN à une entité cellulée avant qu'elle ne commence à
se diviser. Le nouvel ADN s'intègre au génome de la cellule et, en théorie, sera présent dans
toutes les cellules qui constituent l'animal. La création d'animaux transgéniques est plus
complexe que la production de bactéries ou de plantes transgéniques. Les bactéries
transgéniques sont relativement faciles à produire, étant donné qu'elles sont unicellulaires.
Cela signifie qu'on n'a pas à s'assurer de la présence du nouvel ADN dans toutes les cellules
de l'organisme, comme c'est le cas pour les organismes pluricellulaires transgéniques. Pour de

59
Chapitre V : Transgénèse, stratégies à grandes échelles

nombreux types de plantes, les biotechnologues peuvent amener une cellule de plante
transgénique à donner naissance à une plante transgénique. Toutefois, pour créer des
animaux transgéniques, il faut modifier les cellules germinales. Les cellules germinales
(comme l'ovule et le spermatozoïde) sont les seules cellules animales capables de donner
naissance à une nouvelle progéniture. D'autres cellules dans l'animal (appelées cellules
somatiques comme les cellules du sang, de la peau, du cerveau ou du cœur) ne sont pas
capables de donner naissance à de nouveaux animaux qui deviendront adultes. (Cottier, 2000)
Pour produire un animal transgénique, on peut entre-autres avoir recours à la micro-
injection. Le nouvel ADN est injecté directement dans un ovule fécondé (zygote) avant qu'il
ne commence à se diviser. Le nouvel ADN s'intègre dans un chromosome dans le noyau et
sera dès lors présent dans chaque cellule de l'animal qui en résultera. Le nouvel ADN sera
également présent dans les cellules germinales de l'animal qui en résultera, ce qui signifie que
le nouvel ADN sera transmis à nombre de descendants de cet animal. (figure 26)

Figure 26 : Obtention d’animaux transgéniques par micro-injection

La micro-injection est un processus aléatoire. Il se peut que l'ADN injecté ne s'intègre


pas du tout au chromosome du zygote. Aucune des cellules de l'organisme résultant ne
possédera alors le nouvel ADN. (Cottier, 2000).

A l'occasion, le nouvel ADN ne s'intègre pas au chromosome avant la division de la


cellule. Il en résulte un animal mosaïque, qui contient le nouveau gène dans certaines de ses
cellules, mais pas dans l'ensemble. Lors de l'injection de l'ADN, il n'existe aucune façon de
prédire l'endroit du noyau où il s'intégrera. En général, l'ADN injecté contient un gène qui code
pour une protéine particulière destinée à s'exprimer dans l'animal. De nombreuses régions
d'un chromosome donné sont inaccessibles aux enzymes responsables de l'amorce de
l'expression génique. L'emplacement de ces régions varie en fonction du type de cellule et
permet de s'assurer que seuls les gènes appropriés sont « actifs » dans toute cellule donnée.

60
Chapitre V : Transgénèse, stratégies à grandes échelles

Si le transgène s'intègre dans l'une de ces régions inaccessibles, la protéine associée ne sera
pas produite ou sera peut-être produite uniquement dans certains types de cellules. (Cottier,
2000).

Techniques de transgénèse et de clonage


 Techniques de transgénèse
La transgénèse, comme le transfert de gènes isolé dans des cellules en culture, est une
suite logique à l’isolement des fragments d’ADN portant une information génétique. En
effet, seule une cellule ou mieux un organisme entier sont susceptibles de fournir certaines
informations sur les mécanismes qui contrôlent l’expression des gènes. Ce fait a été révélé,
sans qu’on le perçoive bien, dès les premières expériences de transgénèse. Le gène de globine
utilisé s’est en effet avéré inactif à l’état de transgène. Cette observation incompréhensible à
l’époque a conduit une décennie plus tard à définir la notion de LCR (Locus Control Region).
La transgénèse est donc par essence le retour du gène isolé dans son contexte naturel
complexe qu’est l’organisme.
La transgénèse comprend deux opérations distinctes : l’addition et le remplacement
de gènes. La première est très largement pratiquée et chez plusieurs espèces. Pour des raisons
d’ordre technique la seconde commence seulement à être mise en œuvre chez des espèces
autres que la souris.
L’addition de gènes, réalisée pour la première fois en 1980-1982, a rapidement montré
que le transfert de gènes n’était pas fondamentalement très difficile, à condition toutefois de
mettre en œuvre la technique de micro-injection qui est un peu délicate. Le fait que les souris
qui abritaient un gène d’hormone de croissance exogène avaient une croissance augmentée
a fortement frappé les esprits, dans la mesure où la modification de caractères phénotypiques
paraissait relativement simple à obtenir de cette manière. Très rapidement, toute une série
d’applications potentielles ont été proposées qui deviennent petit à petit des réalités. Le
remplacement de gènes chez des animaux entiers n’est venu que dix ans plus tard et a été
réservé à la souris jusqu’à 1999. La transgénèse expérimentale est désormais une des
opérations incontournables dans l’étude des gènes (figure 27). Ceci ne va faire que
s’accentuer avec la possibilité désormais offerte d’identifier systématiquement l’ensemble
des gènes d’un génome. (Houdebine, 2000, Cottier, 2000).

Une des limites de la transgénèse par addition de gènes réside dans le fait que
beaucoup de transgènes ne fonctionnent pas de manière satisfaisante. Il apparaît de plus en
plus clairement que ceci est dû à l’incapacité des expérimentateurs à construire des gènes
actifs, et à la méconnaissance qu’ils ont encore de ce que sont réellement les mécanismes de
contrôle de l’expression génétique. La transgénèse apporte dans ce domaine une moisson
d’informations essentielles dont elle est directement bénéficiaire. (Houdebine, 2000)

61
Chapitre V : Transgénèse, stratégies à grandes échelles

Figure 27 : Principales utilisations des gènes isolés (Houdebine, 2000)

Les gènes peuvent être isolés par les méthodes classiques de clonage (1), par l’utilisation de marqueurs
microsatellites (2) ou par la séquence systématique des ADNc et des génomes (3). Les gènes isolés
peuvent être étudiés en tant que tels, utilisés pour réaliser des diagnostics et de la sélection ainsi que
pour produire les protéines correspondantes et procéder à une thérapie génique ou à une
transgénèse.

Les techniques de transfert de gène


L’obtention de lignées d’organismes transgéniques suppose qu’un gène étranger ait
été transféré de manière telle qu’il soit présent dans les gamètes pour pouvoir être transmis
à la descendance. Ce but peut être atteint de plusieurs manières qui dépendent de l’organisme
concerné et de la maîtrise que l’on a des différentes techniques de la reproduction.
 Le transfert de gènes dans les gamètes

La microinjection de gènes dans les ovocytes des animaux ne conduit pas


fréquemment à l’intégration de l’ADN étranger. L’introduction d’une particule rétrovirale
recombinante recouverte de l’enveloppe du VSV (vesicular somatitis virus) entre la zone
pellucide et la membrane de l’ovocyte conduit au transfert et à l’intégration des gènes du
vecteur. L’enveloppe du virus VSV permet une haute efficacité d’infection, et l’intégration est
facilitée par l’absence de membrane nucléaire de l’ovocyte au moment choisi pour réaliser
l’infection. Les contraintes inhérentes aux vecteurs rétroviraux font que cette technique,
actuellement appliquée à la vache seulement, est peut-être plus intéressante que la

62
Chapitre V : Transgénèse, stratégies à grandes échelles

microinjection dans les pronoyaux mais moins performante que le protocole mettant en
œuvre le transfert de noyau. (Houdebine, 2000)
La mise en contact direct des spermatozoïdes avec des solutions d’ADN, suivie d’une
fécondation in vitro ou in vivo, n’a conduit qu’à l’obtention d’un très petit nombre d’animaux
transgéniques. Plusieurs invertébrés marins, des poissons, des poulets, une vache et un porc
transgéniques ont pu être obtenus de cette manière. Dans beaucoup de cas, les gènes intégrés
étaient très profondément réarrangés et inexploitables. Il se pourrait qu’une activité
DNAsique localisée en périphérie des spermatozoïdes les protège contre une invasion
intempestive par des gènes étrangers. Une inhibition de cette enzyme permettrait peut-être
à ce procédé d’être utilisable. Une méthode mise au point chez le xénope, et étendue très
récemment à la souris, consiste à perméabiliser préalablement la membrane du
spermatozoïde avant de l’incuber en présence d’ADN et de procéder à une fécondation par
ICSI (intracytoplasmic sperm injection). L’efficacité du procédé dépend alors du rendement de
l’ICSI. La maturation de cellules précurseurs des spermatozoïdes in vitro, suivie d’un transfert
dans des testicules adoptifs, pourrait en principe permettre une addition ou un remplacement
de gènes. ( Baccetti B, 2000).

 Le transfert de gènes dans les embryons au stade une cellule

Chez les mammifères, l’injection de quelques milliers de copies du gène isolé se fait
couramment dans les pro-noyaux (figure 28). Cette technique perd très nettement de son
efficacité chez les gros mammifères, du fait de la rareté relative des embryons et des femelles
adoptives, mais aussi du faible taux d’intégration de l’ADN étranger. Pour contourner ces
difficultés, les embryons peuvent être obtenus après maturation des ovocytes et fécondation
in vitro. Après microinjection, les embryons sont cultivés jusqu’au stade blastocyste, ce qui
permet une élimination spontanée des embryons non viables et un tri des transgéniques, si
l’on a pris soin d’introduire un gène marqueur avec le gène d’intérêt. Ce protocole, qui a fait
ses preuves chez la vache, a été presque aussitôt remplacé par la technique mettant en œuvre
le transfert de noyau. La microinjection de gènes dans l’embryon de poulet, qui ne peut avoir
lieu que dans le cytoplasme car les pronucléus sont invisibles, impose que l’embryon achève
son développement après avoir été transféré dans le jaune d’un œuf non fécondé .
(Houdebine, 2000)

Des injections de plusieurs millions de copies du gène dans le cytoplasme conduisent


à l’obtention d’individus transgéniques en assez grand nombre mais, le plus souvent,
fortement mosaïques. Chez certaines espèces comme le poisson zèbre, la microinjection ne
permet que très difficilement d’obtenir des individus transgéniques. L’utilisation d’un
transposon s’est avérée d’une bonne efficacité, Chez les végétaux, le transfert de gènes dans
les embryons s’est avéré difficilement praticable et cette approche méthodologique n’est pas,
en pratique, utilisée.

63
Chapitre V : Transgénèse, stratégies à grandes échelles

 Le transfert de gènes par l’intermédiaire de cellules


Les cellules dans lesquelles on a transféré des gènes peuvent être un intermédiaire
intéressant pour engendrer des organismes transgéniques. Ceci n’est possible que dans la
mesure où les cellules ont la capacité de participer ensuite au développement de l’embryon.

 La formation de chimères à partir de cellules multipotentes, Les cellules multipotentes


ont par essence la capacité de pouvoir participer au développement d’un embryon. Elles
peuvent être obtenues partir de la masse cellulaire d’un blastocyste (cellules ES) ou des
cellules primordiales germinales d’un fœtus (cellules EG). Certains marqueurs, comme la
phosphatase alcaline, définissent en partie au moins le caractère multipotent. En pratique,
des cellules sont considérées comme multipotentes si elles peuvent coloniser une morula ou
un blastocyste.
• L’obtention de clones à partir de cellules différenciées Une approche a priori plus
simple que la production de chimères à partir de cellules multipotentes consiste, en principe,
à recréer un embryon et un organisme entier à partir d’une cellule plus ou moins différenciée.
Chez les plantes, ce phénomène a été décrit et maîtrisé bien avant que le transfert de gènes
puisse être envisagé. Des cellules du méristème d’un certain nombre de végétaux peuvent
redonner naissance à des plantes entières in vitro. Ce procédé, défini il y a un demi-siècle, est
très couramment utilisé pour cloner les plantes d’intérêt agronomique ou ornemental. Cette
propriété remarquable est à l’origine de la transgénèse chez les plantes. Le transfert du gène
étranger peut se faire dans les cellules avant que celles-ci se multiplient pour donner une
plante entière. ( Houdebine, 2000, Forster K et all, 1999)

 Le transfert de gènes dans les organites cellulaires


Le transfert de gènes dans les chloroplastes présente davantage d’intérêt, pour
plusieurs raisons. La première est que le génome chloroplastique contient beaucoup plus de
gènes que celui des mitochondries. Il existe par ailleurs 10 000 chloroplastes par cellule,
environ. Le transfert de gènes dans les chloroplastes est possible, et les plantes qui en
résultent sont qualifiées de transplastomiques. L’ADN étranger peut être introduit par
biolistique, par une transfection à l’aide du polyéthylèneglycol ou par un système particulier
de microinjection. L’ADN étranger peut s’incorporer dans le génome chloroplastique par
recombinaison homologue. Outre l’étude du génome chloroplastique, le transfert de gènes
ainsi pratiqué permet une expression très intense des transgènes, jusqu’à 100 fois plus que
celle obtenue avec le même gène incorporé dans le génome principal. Ce fait est évidemment
dû essentiellement au grand nombre de chloroplastes que contient chaque cellule. Les
chloroplastes, comme les mitochondries, sont par ailleurs d’origine maternelle. Le pollen ne
transmet donc pas le gène étranger incorporé dans les chloroplastes. Ceci offre une sécurité
très élevée pour l’environnement, quoique celle-ci ne soit pas totale dans la mesure où
quelques chloroplastes paternels se retrouvent parfois dans le zygote, comme c’est le cas pour
quelques mitochondries. (Miahle1997 ; Houdebine 2000)

64
Chapitre V : Transgénèse, stratégies à grandes échelles

Figure 28 : Méthodes de transfert de gènes (Houdebine 2000)

A. Méthodes de transfert de gènes dans les gamètes et les embryons. L’ADN peut être introduit dans le
spermatozoïde par contact direct mais surtout après altération de la membrane plasmique. Dans ce deuxième
cas, la fécondation doit être réalisée par ICSI. Des vecteurs rétroviraux peuvent apporter un gène étranger dans
le génome des ovocytes après introduction des particules infectieuses entre la zone pellucide et la membrane
plasmique. Chez les mammifères, la microinjection de quelques milliers de copies du gène isolé dans un des
pronucléus conduit à l’établissement de lignées transgéniques. Chez les vertébrés inférieurs et les invertébrés, les
pronucleus ne sont pas accessibles. L’injection de plusieurs millions de copies du gène doit avoir lieu dans le
cytoplasme. Transfert de gènes via les cellules ES et formation d’embryons chimères. Cette technique, surtout
utilisée depuis plus de dix ans pour inactiver des gènes cellulaires, ne peut pas être exploitée chez d’autres espèces,
car la transmission à la descendance de la mutation provoquée dans les cellules ES n’a pratiquement jamais lieu.
C. Transfert de gènes via la technique de clonage. Des cellules fœtales sont transfectées avec des gènes étrangers
pour procéder à une addition ou un remplacement de gènes. Les cellules sélectionnées sont ensuite utilisées pour
engendrer des animaux clonés transgéniques. Cette technique permet de procéder plus simplement à une
addition de gènes, surtout chez les animaux peu prolifiques. C’est la seule technique disponible actuellement pour
obtenir un remplacement de gènes par recombinaison homologue chez les espèces autres que la souris.

 Le transfert de gènes l’aide de vecteurs épisomiques


Les vecteurs capables de se répliquer de manière indépendante du génome principale
offrent des avantages théoriques très importants. L’utilisation intense des plasmides, des
phages, des cosmides, des BAC et de YAC dans les bactéries et les levures est là pour le

65
Chapitre V : Transgénèse, stratégies à grandes échelles

prouver. De tels vecteurs sont en principe transférés et transmis avec une efficacité maximale.
L’obtention d’animaux ou de plantes transgéniques deviendrait aisée avec ces outils. Les
vecteurs épisomaux sont par ailleurs souvent présents sous forme de plusieurs copies
indépendantes dans les cellules. Les gènes insérés dans les vecteurs épisomaux ne subissent
pas l’influence d’éléments de la chromatine puisqu’ils n’en font pas partie. Ils ne sont donc
soumis qu’à l’action limitée des composants du vecteur. Il y a par ailleurs de bonnes chances
que ces effets soient évaluables avec fiabilité dans des cellules en culture, et transposables à
l’échelle d’un organisme entier. (Bilang ,1998 ; Houdebine 2000)

 Techniques de Clonage
Le terme « clone » désigne un objet ou un organisme considéré comme identique à un autre.
En biotechnologie, le clonage désigne la reproduction en laboratoire de gènes, cellules ou
organismes à partir d'une même entité originale. Par conséquent, il est possible de produire
des copies génétiques exactes du gène, de la cellule ou de l'organisme original. Dans le monde
végétal, le clonage n'est pas un phénomène sensationnel car les boutures, les greffes, les
pousses, sont toutes des manières de produire des exemplaires d'une même espèce à base
d'une seule cellule. (Figure 29).
Depuis plus de vingt ans, le clonage, ou la reproduction exacte de gènes particuliers et
de types individuels de cellules , est une technique employée en biotechnologie afin de
produire des médicaments et des vaccins pour traiter les crises cardiaques, des maladies du
rein, le diabète, divers cancers, l'hépatite, la sclérose en plaques, la fibrose kystique et d'autres
maladies. On nomme ces deux types de clonage :
 Le clonage moléculaire: On prend des parties de l'ADN, qui contiennent des gènes, on
les duplique dans un milieu bactérien. . On utilise cette technique en génétique thérapeutique,
pour mettre au point des vaccins, des drogues et des tests génétiques

Le clonage cellulaire: On fait plusieurs exemplaires de la même cellule pour pouvoir faire des
recherches médicales. Il existe deux autres types de clonage possibles, qui nous intéressent
plus particulièrement dans ce chapitre. On les appelle clonages reproductifs et ils consistent
en un clonage en vue de l’obtention d’individus et organismes génétiquement identiques.

 Le jumelage embryonnaire, aussi appelé clonage par séparation de blastomères


(embryon se trouvant au stade 2 à 8 cellules). On prélève un embryon, on le divise en deux et
on obtient des jumeaux parfaitement identiques. (C’est ce qui se passe pour les vrais
jumeaux). On utilise cette technique pour la reproduction en chaîne. Cette méthode en
fertilisation in vitro sert à augmenter les chances de réussite de fécondation en créant plus
d'embryons à inséminer (Aujourd'hui, il y a toujours un désaccord médical et éthique, bien
que cette méthode soit approuvée aux U.S.A.). Houdebine, 2000)

 Transfert Somatique Nucléaire (TSN) A partir d'un individu, on prend le noyau d'une
cellule et on l'injecte dans l'œuf d'un autre individu dont on avait déjà enlevé le noyau. Le
noyau peut venir d'un embryon, d'un fœtus. On peut utiliser les cellules d'un être vivant (les
cellules sont prises dans un laboratoire de culture ou de tissus congelés). L'œuf peut venir de
l'individu qui porte le fœtus à qui il va donner naissance ou d'un autre donneur.

66
Chapitre V : Transgénèse, stratégies à grandes échelles

Figure 29 : Clonage (MaRichesse.Com, 2014)

La technique de clonage
Un ovule est prélevé sur une femme. Son contenu génétique situé dans le noyau est
enlevé. On parle ainsi d'ovule énucléé. Une cellule somatique (non sexuelle, comme une
cellule de peau par exemple) est prélevée sur un homme ou une femme, puis mise en culture.
L'ADN de cette cellule somatique est extrait et implanté dans l'ovule vide de la donneuse.
L'œuf ainsi reconstruit contient maintenant le matériel génétique du donneur. Grâce à des
chocs électriques et un certain cocktail chimique, l'œuf commence alors sa division et son
développement. L'œuf poursuit son développement jusqu'au stade de plus de 100 cellules
(blastocyste ou embryon préimplantatoire). La couche externe va former le placenta, la partie
interne (futur embryon) contient les cellules souches. Houdebine, 2000)

67
Chapitre V : Transgénèse, stratégies à grandes échelles

Le clonage reproductif
En 1996 est paru le résultat du premier clonage reproductif d'un mammifère, la
fameuse brebis Dolly, obtenue par reproduction asexuée. La technique, mise au point
antérieurement chez les amphibiens, repose sur le transfert du noyau d'une cellule somatique
adulte dans un ovule (cellule germinale femelle) dont le propre noyau a été ôté. En quelques
heures, le noyau transféré subit une «reprogrammation» qui lui permet de prendre le contrôle
du développement embryonnaire jusqu'au stade de blastocyste. Celui-ci est ensuite transféré
dans l'utérus d'une brebis porteuse et il poursuit son développement jusqu'à obtention d'un
clone, soit une brebis possédant un patrimoine génétique identique à celui de la brebis adulte
dont était issue la cellule somatique. (Figure 30). (Houdebine, 2000)
Les essais de clonage reproductif de primates ont échoué; les chercheurs qui ont
essayé de comprendre les raisons de cet échec ont mis en évidence des anomalies
chromosomiques majeures dans les blastocystes clonés de primates. Ces «monstruosités
chromosomiques» illustrent l'influence fondamentale des facteurs épigénétiques (nucléaires
et cytoplasmiques) sur la reprogrammation du noyau transféré dans l'ovule. La
reprogrammation nucléaire en quelques heures d'un noyau somatique n'équivaut pas à la
programmation nucléaire des gamètes qui prend des mois (pour le gamète mâle) ou des
années (pour le gamète femelle).
La nature de ces facteurs épigénétiques est encore largement inconnue et leur contrôle n'est
pas envisageable avant longtemps.

C'est pour ces raisons que la communauté scientifique mondiale condamne de manière
absolue toute idée de clonage reproductif appliqué à l'homme et considère comme un crime
les tentatives proposées par des individus et des sectes aux motivations les plus suspectes.

Figure 30 : Clonage reproductif

68
Chapitre V : Transgénèse, stratégies à grandes échelles

Le clonage thérapeutique
Le «clonage thérapeutique» est un terme ambigu et impropre qui a été proposé par
facilité pour désigner l'utilisation des cellules souches multipotentielles dérivées de
blastocystes humains obtenus selon la même technique de départ, à savoir le transfert du
noyau d'une cellule somatique dans un ovule préalablement énucléé.
L'idée sous-jacente est d'utiliser les capacités de différenciation multiple des cellules souches
embryonnaires (ES) ainsi générées pour réparer des tissus adultes malades (maladie de
Parkinson, diabète, cancers, infarctus,...).
Cette voie a été explorée avec un certain succès dans des modèles animaux de ces maladies,
mais son application se heurte à l’impossibilité actuelle d’obtenir des blastocystes humains en
suivant cette technique. (Cottier, 2000)
Parallèlement, des recherches explorent de plus en plus la possibilité d'utiliser des
cellules souches issues de sources ne passant pas par l’obtention de blastocystes par transfert
nucléaire. Les sources de cellules souches adultes sont principalement le sang de cordon
ombilical, le sang lui-même, mais surtout la moelle osseuse.
Que leur origine soit embryonnaire ou adulte, les cellules souches ne se heurtent pas au
problème du rejet immunologique et elles seront parfaitement tolérées par le système
immunitaire du receveur puisqu'elles partagent le même patrimoine génétique. (Cottier,
2000)
C’est évidemment le bénéfice thérapeutique de cette parfaite «tolérance» qui est
recherché dans l’usage des cellules souches adultes ou des ES obtenues par transfert
nucléaire. Pour des raisons évidentes, un tel bénéfice n’existe absolument pas dans
l’utilisation d’ES provenant d’embryons surnuméraires issus de FIV. (Figure 31).

Figure 31 : Clonage thérapeutique

69
Chapitre V : Transgénèse, stratégies à grandes échelles

Applications de la transgénèse et du clonage

La naissance de la brebis Polly, annoncée par le Roslin Institute au cours de l'été 1997,
fit moins de bruit que celle de Dolly, quelques mois plus tôt. Il est vrai que Polly avait été
clonée à partir d'un fibroblaste de fœtus, cellule moins différenciée que celle utilisée pour la
création de son illustre congénère. Elle n'en constituait pas moins une nouveauté scientifique
considérable puisqu'il s'agissait du premier gros mammifère cloné porteur du gène d'une
protéine humaine : le facteur IX de coagulation. Cette application concrète du clonage aux
biotechnologies animales représente pour la transgénèse une avancée notable.

La création d'animaux transgéniques fait l'objet de recherches poussées depuis une


dizaine d'années compte tenu des applications qu'elle peut offrir, d'une part pour la
production de protéines thérapeutiques, d'autre part pour la transplantation chez l'homme
d'organes « humanisés » susceptibles de surmonter l'obstacle immunitaire. Si les résultats
sont restés jusqu'ici assez décevants, cela tient en partie à la faible efficacité des méthodes
employées ; le recours au clonage par transfert nucléaire permettrait, selon les avis autorisés,
d'accomplir sur ce point des progrès très sensibles. (Mallet, J. 2005 ; Cottier, 2000)

La transgénèse et le clonage dans la médecine et santé


La transgénèse permet la production de molécules thérapeutiques à partir de bactéries, mais
aussi de plantes et même d'animaux (biopharming). Cette solution s'avère intéressante pour
des molécules dont l'extraction était insuffisante, difficile et/ou coûteuse. Quelques
exemples :• insuline de synthèse, produite par des bactéries transgéniques ; • tabac
producteur d'hémoglobine (1997), recherche en cours sur les possibilités d'utilisation de cette
molécule d'hémoglobine de synthèse ;
 depuis 1988, la production d'une hormone de croissance de synthèse identique à la
molécule humaine empêche désormais une possible contamination des patients par la
maladie de Creutzfeldt-Jacob.
La production de vaccins par la transgénèse
Partout dans le monde, la mise au point de nouveaux vaccins plus efficaces est devenue une
nécessité. La recherche s'est orientée vers le développement de "vaccins comestibles" c'est-
à-dire de plantes comestibles modifiées par transgénèse afin de produire des protéines
vaccins.

Absorbées par voie orale, ces protéines devraient stimuler la réaction immunitaire requise
pour protéger l’individu contre l'infection. De tels vaccins présenteraient différents
avantages : ils seraient moins coûteux ; ils pourraient être conservés à température ambiante
dans l’emballage naturel que constitue le fruit ; et enfin, ils seraient plus sûrs et efficaces que
les vaccins classiques. (Mallet, J. 2005)

Production d’organe association transgénèse/clonage


Le manque d'organes d'origine humaine pour des greffes à des patients a fait envisager
l'utilisation d'organes ainsi que des cellules d'origine animale.

70
Chapitre V : Transgénèse, stratégies à grandes échelles

Le porc a été retenu comme donneur potentiel de part ses atouts : omnivore, proche de
l'homme, ayant des organes de taille comparable à celle de l'homme. De plus, les techniques
d'élevage de porcs dépourvus de germes pathogènes sont bien maîtrisées. Toutes ces raisons
sont en faveur du porc plutôt que des primates supérieurs, très coûteux, plus dangereux et
moins acceptables éthiquement.

Les organes de porc sont vigoureusement rejetés par les receveurs humains. D'où la
transgénèse effectuée chez le porc qui vise à définir des substances mais aussi des gènes dont
l'action pourrait inhiber les réactions de rejet.
L'ajout par transgénèse des gènes ayant des effets antirejet vise à protéger les greffons
d'origine porcine mais aussi l'inactivation des gènes porcins responsables de l'activation des
mécanismes de rejet. Ainsi, la transgénèse mise en œuvre permet l'inactivation du gène de
l'alpha-1-2 galactosyl transférase qui ajoute des groupements glucidiques très immunogènes
sur des protéines de surface des cellules de porc.

Enfin, les génomes porcins contiennent de nombreuses séquences rétrovirales intéfrées,


transmissibles à la descendance et dont certaines sont actives, également chez l'homme après
la greffe. Dans ce cas, la transgénèse peut contribuer à ajouter des gènes inactivant l'infection
par les rétrovirus ou à inactiver les génomes rétroviraux. (Mallet, J. 2011).

La thérapie Génique
Certaines maladies sont provoquées par des gènes défectueux qui produisent des protéines
défectueuses. Les symptômes des maladies héréditaires apparaissent souvent par suite de
l'interruption de processus cellulaires vitaux subséquents causée par l'absence ou le mauvais
fonctionnement de protéines. Si un gène particulier est défectueux, il risque de ne pas
fabriquer de produit protéique ou encore d'en fabriquer un qui fonctionne mal ou se
comporte de manière trop agressive.
Par exemple, la mucoviscidose (ou fibrose kystique) est provoquée par l'absence ou la
mutation d'un gène qui donne lieu à une protéine de transport membranaire défectueuse.
S'ensuit l'accumulation d'un épais mucus dans les poumons et dans les voies aériennes du
corps.
Aussi, Les cancers, provoqués par la division et la prolifération incontrôlable de cellules. Des
gènes particuliers peuvent provoquer une telle croissance cellulaire s'ils sont défectueux. On
appelle ces gènes défectueux oncogènes. D’autres servent de régulateurs négatifs de la
division cellulaire, ce sont les gènes suppresseurs de tumeurs. Lorsque ceux-ci sont également
défectueux, on n’a plus de régulation et contrôle de la quantité de division cellulaire qui se
fait, et très souvent cancer. (Mallet, J. 2005 ; Cottier, 2000)

La thérapie génique constitue un autre mode de traitement d'un trouble génétique par
lequel on insère ou intègre de nouveaux gènes dans les cellules humaines. De nombreux
essais en thérapie génique visent à ajouter dans un certain type de cellule un gène utile qui
compensera la version manquante ou défectueuse. D'autres efforts visent à doter la cellule
cible de nouvelles propriétés. Cette dernière méthode est souvent employée dans le

71
Chapitre V : Transgénèse, stratégies à grandes échelles

traitement du cancer, où l'on ajoute des gènes toxiques aux cellules cancéreuses en vue de
les éliminer. (Mallet, J. 2005)
Selon les types de cellule affectés, on peut classer la thérapie génique en deux grandes
catégories : la thérapie de la lignée germinale et la thérapie de la lignée somatique.
 La thérapie de la lignée germinale consiste à modifier les cellules germinales (cellules
reproductrices), ce qui signifie que les modifications génétiques subséquentes seront
transmises à la descendance du patient.
 La thérapie de la lignée somatique implique l'altération de cellules somatiques (cellules
non reproductrices du corps, comme les cellules de la peau, du cerveau ou des muscles).
Cette manipulation génétique n'affectera que l'individu chez lequel on a effectué ces
changements. La thérapie de la lignée somatique est le seul type actuellement envisagé
pour les êtres humains. (Cottier, 2000)

Comment Les Gènes Sont-Ils Insérés Dans Les Cellules Cibles


Imaginons qu'un patient est atteint d'un trouble génétique qui ne touche que certaines
cellules de son cerveau. Comment le traiter à l'aide de la thérapie génique de sorte que le
gène thérapeutique ne cible que les cellules affectées? On pourrait par exemple avoir
recours à un vecteur. Un vecteur est simplement un « transporteur » du matériel génétique
qui lui permet de pénétrer dans la cellule cible et, selon le type de vecteur, peut entraîner
l'intégration de nouveaux gènes dans le génome de la cellule hôte. Les vecteurs doivent être
administrés à des types de cellules cibles particulières.
Il existe trois grands moyens d'administrer les vecteurs pour qu'ils transportent de nouveaux
gènes dans les cellules cibles (figure 32).
 Le premier, c'est la thérapie de la lignée somatique ex vivo, par laquelle les cellules
cibles sont enlevées du corps, cultivées en laboratoire avec un vecteur, puis réinsérées dans
le corps. En général, ce processus est réalisé à l'aide de cellules sanguines, car ce sont les
plus faciles à enlever et à réintroduire.
 La deuxième solution, la thérapie de la lignée somatique in situ, consiste à placer le
vecteur directement dans le tissu touché. Ce processus est employé pour traiter la
mucoviscidose (fibrose kystique) (par infusion directe du vecteur dans les bronches des
poumons), détruire les tumeurs (p. ex., cancer du cerveau) et traiter la dystrophie
musculaire.
La troisième option est la thérapie de la lignée somatique in vivo, par laquelle le vecteur est
injecté dans le courant sanguin et peut trouver et insérer de nouveaux gènes uniquement
dans les cellules pour lesquelles il a été spécialement conçu. Bien qu'il n'existe actuellement
aucun traitement in vivo disponible, une percée dans ce domaine rendra la thérapie génique
fort attrayante.5 Dans ce cas, le vecteur conçu pour traiter notre patient imaginaire pourrait
être injecté dans un vaisseau sanguin de son bras et se rendrait jusqu'aux cellules du cerveau
affectées. Cavazzana-Calvo et al. 2000, Cottier, 2000,)

72
Chapitre V : Transgénèse, stratégies à grandes échelles

Figure 32 : Mécanisme de la thérapie génique (Cottier, 2000)

Différentes Applications De Thérapie Génique


Dans les années quatre-vingt, on croyait que la thérapie génique ne servirait qu'à guérir
des maladies héréditaires. Toutefois, on s'aperçoit qu'elle peut être utilisée dans plusieurs
autres domaines:
 La thérapie génique d’une maladie héréditaire, l’ADA
C’est en septembre 1990 qu’a été pratiquée la première thérapie génique dans le
monde. Cet essai mené aux National lnstitute of Health américains (NIH), par les médecins
Anderson et Blaese, concernait une petite fille de trois ans atteinte d’un syndrome génétique
rare et grave, le déficit en adénosine déaminase (ADA).Les enfants souffrant de cette
maladie n’ont plus de défenses contre les agents pathogènes et sont condamnés à vivre dans
une « bulle » stérile, privés de tout contact physique avec d’autres êtres humains. Les
chercheurs ont prélevé chez la fillette un certain nombre de cellules de la moelle osseuse et
y ont introduit un gène sain de l’ADA puis ont réinjecté ces cellules chez la fillette. Les cellules
immunitaires ainsi «Renforcées » ont exercé une influence positive sur l’évolution positive
sur l’évolution de la maladie. La correction de cette maladie n'a malheureusement été que

73
Chapitre V : Transgénèse, stratégies à grandes échelles

transitoire mais ce demi-succès suscite toujours énormément d'espoir. Plus récemment, en


1999, l'équipe du Professeur Fisher à l'hôpital Necker-Enfants Malades de Paris a pu corriger
une autre forme de déficit immunitaire grave chez quatre nourrissons, en remplaçant le
fragment défectueux du code génétique par le fragment normal. Les enfants ont ainsi
récupéré des fonctions immunitaires normales ou quasi-normales, leur évitant une greffe de
moelle classique. Il est encore trop tôt pour crier victoire, mais les spécialistes de ce domaine
s'accordent à penser que cette tentative sera couronnée de succès à long terme.
(Cavazzana-Calvo et al. 2000, Cottier, 2000,)
 Les Cancers
Le cancer représente la maladie la plus concernée par les essais cliniques en thérapie
génique (voir la section sur les essais cliniques). Cette dominance de la cancérologie
s’explique par le fait que, dans ce domaine, les besoins sont grands et les patients pouvant
participés aux essais sont également nombreux. Certains essais cliniques en oncologie
concernent notamment la leucémie.
 le SIDA
Cette technique est basée sur l'action d'une enzyme, le ribozyme, capable de «cisailler»
l'ARN de la cellule. L'enzyme a été modifiée par les scientifiques afin de s'attaquer
spécifiquement au virus du VIH au moment où il pénètre dans la cellule. Six paires de
jumeaux identiques vont participer à l'étude. Chaque paire de jumeaux comprendra un
individu sain et un autre atteint du sida. Des lymphocytes CD4+, qui jouent un rôle de
premier plan dans l'immunité, ont été prélevées sur l'individu sain. Le ribozyme a ensuite
été introduit dans ces cellules. Puis, ces dernières ont été multipliées en laboratoire puis
administrées par transfusion sanguine au patient atteint. Après la transfusion, le patient
atteint peut compter sur un stock de lymphocytes CD4+ devenus invulnérables au virus du
sida. Progressivement, elles remplaceront les CD4+ détruites par le sida, c'est cette perte de
lymphocytes qui produit ce fameux déficit immunitaire. (Cavazzana-Calvo et al. 2000)
Même si les résultats de cette étude se montrent concluants, cette technique ne sera
pas disponible de sitôt pour les millions de personnes présentement atteintes

En conclusion, la route qui mène vers les applications cliniques des méthodes
de transfert de gènes est désormais ouverte et s'avère séduisante.
Néanmoins, pour que le domaine de la thérapie génique et cellulaire
atteigne sa maturité, il s’avère nécessaire d’évaluer plus précisément les
risques inhérents à ces technologies et de répondre en toute clarté et
objectivité aux questions de sécurité relatives à ces méthodes.

74

Vous aimerez peut-être aussi