Vous êtes sur la page 1sur 8

Chapitre

27
Taxonomie bactérienne
à l'heure des technologies
nouvelles de la taxonomie
polyphasique
à la taxogénomique
G. Durand, A. Van Belkum

PLAN DU CHAPITRE
Introduction : la taxonomie et le concept La génomique pour la taxonomie bactérienne
d'espèce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 (génotaxonomique) . . . . . . . . . . . . . . . . . . . . . 256
Aspects de la variation bactérienne . . . . . . . . 254 Pertinence de la métagénomique pour
Taxonomie polyphasique . . . . . . . . . . . . . . . . . 255 l'évolution de la taxonomie bactérienne . . . . 259
Les technologies « omiques » comme outils Conclusion et perspectives . . . . . . . . . . . . . . . . 259
taxonomiques (taxon « omiques ») . . . . . . . . . . 255
La protéomique et la spectrométrie de masse
MALDI-TOF pour la taxonomie bactérienne . . . 255

Introduction : la taxonomie taxonomie se subdivise en trois parties : (1) la classification,


c'est-à-dire l'arrangement des organismes dans des groupes
et le concept d'espèce taxonomiques ou « taxons » sur la base de la similarité de
Depuis la première description de bactéries vivantes par leurs caractères, (2) la nomenclature, c'est-à-dire la dénomi-
Anthonie Van Leeuvenhoek en 1665 jusqu'à la fin du nation de ces groupes selon des règles strictes, et (3) l'iden-
XIXe siècle, il n'y eut que peu d'intérêt pour l'identification tification, c'est-à-dire la comparaison des caractères d'un
des espèces bactériennes et leur classification. Leur étude organisme inconnu à ceux des différents groupes décrits
n'a véritablement commencé qu'avec la découverte de leur permettant alors de l'assigner à l'un d'entre eux.
rôle dans les processus de fermentation et de leur mode de Un taxon regroupe différents organismes dans le groupe
transmission en pathologie infectieuse grâce aux travaux de qu'il constitue. L'élément de base est l'espèce. On considère
Louis Pasteur et de Robert Koch. C'est le naturaliste sué- alors des taxons d'espèce (par exemple espèce Escherichia
dois Carl von Linné (1707–1778) qui fonda la science du coli), de genre (genre Escherichia), de famille (famille des
classement des organismes vivants appelée taxonomie (du Enterobacteriaceae), d'ordre (ordre des Enterobacteriales),
grec taxis, arrangement), et le premier ouvrage « moderne » de classe (classe des Gammaproteobacteria), de phylum
de classification bactérienne parut en 1923 avec le Bergey's (phylum des Proteobacteria) et de domaine ou encore appelé
Manual of Determinative Bacteriology. La taxonomie per- taxon de super-règne (Bacteria).
met de différencier les organismes vivants en définissant En bactériologie clinique, l'identification d'une bacté-
les limites aux groupes à l'intérieur desquels les organismes rie responsable d'une pathologie infectieuse permet d'en
seront rassemblés sur la base de leurs caractères communs déduire l'ensemble des caractéristiques écologiques, épidé-
ou distinctifs, caractères principalement liés à la morpho- miologiques et thérapeutiques se rapportant au taxon. La
logie, à la niche écologique ou encore à la physiologie. La taxonomie bactérienne, discipline relativement récente, s'est

Bactériologie médicale
© 2016, Elsevier Masson SAS. Tous droits réservés 253
254   Partie III. Identification et systématique bactérienne

développée principalement au cours du siècle dernier et n'a des séquences d'ARN ribosomal (ARNr), principalement de
réellement atteint sa maturité qu'avec l'avènement de la bio- l'unité 16S. En 1987, Carl Woese émet l'hypothèse que l'évo-
logie moléculaire étudiant les motifs de séquences d'acide lution s'effectue à un rythme quasi indépendant des change-
nucléiques. Cependant, la taxonomie reste un domaine en ments de phénotypes. Les gènes d'ARN ribosomaux codent
constante évolution avec la découverte régulière de nou- pour des molécules constantes et universelles et qui ne sont
velles espèces ou encore la révision des frontières entre les pas sous contrainte de la pression de sélection. On considère
espèces [12]. La classification bactérienne se trouve réguliè- alors que les mutations des ARNr au cours du temps ont
rement mise à jour sur le site internet www.bacterio.net et les été constantes puisqu'elles ne conféraient pas d'avantages
nouvelles espèces sont publiées dans la revue International sélectifs. Selon le paradigme de Woese [26], les séquences
Journal of Systematic and Evolutionary Microbiology (IJSEM). d'ARNr 16S doivent avoir plus de 97 % de similitude au
Comme pour la plupart des autres formes de vie, la sein d'une même espèce. Des souches dont les séquences
taxonomie bactérienne a été initialement fondée sur des d'ARNr 16S possèdent moins de 97 % de similitude ne font
caractères phénotypiques, principalement morphologiques. donc pas partie de la même espèce ; en revanche, l'inverse
Par exemple, le genre Staphylococcus a été nommé ainsi n'est pas vrai et, dans la pratique courante, l'intérêt du
sur son apparence en forme de grappes de raisin au micro­ séquençage 16S devient alors vite limité lorsque les orga-
scope après coloration de Gram. La distinction de l'espèce nismes sont très proches.
Staphylococcus aureus des autres espèces de staphylocoques Les taxonomistes s'accordent sur la nécessité de revisiter
à coagulase négative a été établie sur la coloration jaunâtre la taxonomie et de moderniser les outils, grâce notamment à
(liée au pigment caroténoïde) de ses colonies sur des milieux l'utilisation de nouvelles technologies comme le séquençage
de culture synthétiques. Beaucoup d'observations simi- du génome complet (whole genome sequencing [WGS]) qui
laires fondées sur la morphologie, la coloration ou encore a déjà permis la découverte et la caractérisation de milliers
les effets d'hémolyse des colonies sur les milieux de culture d'espèces d'origine clinique ou environnementale [21, 22, 24].
ont conduit dans les années 1950 à une définition complexe L'objectif de ce chapitre consiste à décrire les tendances
de la notion d'espèce. L'avènement de la « culturomique », actuelles pour la taxonomie bactérienne, et la transition
approche fondée sur l'utilisation de plus de 200 conditions dans les années à venir de la taxonomie polyphasique
de culture différentes permettant la croissance synthétique comme nous la connaissons actuellement vers ce que nous
de micro-organismes jusqu'alors qualifiés de non cultivables pourrons appeler la « taxogénomique », taxon « omique » ou
[14], a encore significativement complexifié la notion d'es- encore la « génotaxonomique ».
pèce. Au cours du siècle dernier, de nombreuses technolo-
gies ont été utilisées dans l'analyse comparative de souches Aspects de la variation bactérienne
bactériennes pour la délimitation d'espèces. La technologie
clé, toujours considérée comme un standard de l'Interna- La description d'une espèce est assortie du dépôt d'une
tional Committee on Systematics of Prokaryotes (ICSP), souche type de l'espèce dans au moins deux collections inter-
est l'hybridation ADN/ADN (DNA-DNA hybridization nationales. Cependant, au sein d'une espèce, des variants
[DDH]). Cette méthode, au cours de laquelle la totalité du peuvent coexister qui se différencient de l'espèce type par
génome bactérien est hybridée, permet de mesurer un pour- des caractères mineurs et stables. La variation bactérienne
centage de similitude entre deux molécules d'ADN. Pour les est en réalité un processus fondamental dans le cycle de
génomes bactériens, on estime qu'une hybridation à 70 % ou vie bactérien. Elle est causée par la sélection des variants
un ΔTm (différence de températures de demi-dénaturation les plus appropriés à partir d'un ensemble de mutants qui
à laquelle la moitié de l'ADN est sous forme simple brin) de émergent spontanément du fait d'échecs partiels de réplica-
4 à 5 °C correspond à une homologie de séquence de 96 %. tion de l'ADN, l'ADN polymérase n'étant pas une enzyme
Une espèce peut donc se définir comme le rassemblement infaillible. Des mutations peuvent apparaître de manière
de souches ayant des relations ADN/ADN qui se traduisent relativement fréquente avec des polymorphismes sur un
à la fois par des valeurs d'hybridation supérieures à 70 % et seul nucléotide (single nucleotide polymorphism [SNP]), ou
une instabilité thermique des hybrides inférieure ou égale à encore des insertions ou des délétions dans l'ADN géno-
5 °C. Néanmoins, cette méthode ne permet que la compa- mique, générant des populations cellulaires hétérogènes au
raison d'ADN deux à deux et les taxonomistes s'accordent sein de la même souche. Des plasmides peuvent être perdus
sur le besoin d'une approche modernisée intégrant un plus ou amplifiés durant la réplication, et des éléments génétiques
grand nombre de données issues d'approches expérimen- mobiles peuvent changer de localisation ou bien voir modi-
tales multiples. fier leur nombre de copies. De même, des bactériophages
L'approche taxonomique utilisée de nos jours est la taxo- peuvent être intégrés ou activés en fonction des conditions
nomie dite « polyphasique » ou encore « mixte et consen- physiologiques. L'échange et l'acquisition d'ADN sont des
suelle » prenant en compte le maximum de techniques processus relativement fréquents (dépendant de l'espèce
possibles, phénotypiques, chimiotaxonomiques et molé- bactérienne ou du type), facilitant l'adaptation environne-
culaires dans le but d'obtenir une résolution fine des diffé- mentale et l'échappement aux agents stressants. Ces phé-
rents groupes bactériens. Sa description intervient pour la nomènes surviennent fréquemment dans les communautés
première fois en 1970 par Colwell et al. [5], mais elle a été bactériennes, y compris au sein des biofilms. Les change-
réellement mise en avant par Vandamme et al. en 1996 [25]. ments dans l'arsenal génétique peuvent alors conduire à
Tout en intégrant les données phénotypiques et chimiomé- un phénotype plus ou moins désirable qui sera sélectionné
triques, la taxonomie polyphasique se fonde sur l'analyse par la pression environnementale. Par l'intermédiaire d'un
Chapitre 27. Taxonomie bactérienne à l'heure des technologies nouvelles    255

processus communément appelé « goulot d'étranglement », Les technologies « omiques »


on peut voir apparaître de nouveaux variants bactériens.
L'émergence constante de variants bactériens résistants aux
comme outils taxonomiques
antibiotiques ou aux antiseptiques courants illustre bien ce (taxon « omiques »)
processus continu de sélection. Cette pression de sélection Face à la masse de données générées au cours des analyses
conduit à une diversification des génotypes et phénotypes taxonomiques, Vandamme et al. [25] avaient conclu dès
bactériens à l'origine de la diversité des espèces bactériennes 1996 que « la taxonomie dite synthétique serait rendue pos-
connues actuellement ou encore non identifiées. sible par le développement de nouvelles stratégies mathé-
matiques et informatiques ». Cette affirmation visionnaire
est devenue maintenant une réalité avec l'émergence des
Taxonomie polyphasique technologies « omiques » telles que la protéomique, la géno-
mique, la transcriptomique, la lipidomique, la glycomique
La taxonomie polyphasique comprend deux types d'infor- qui ont considérablement modifié l'étendue des données
mations : le phénotype et les informations génomiques. analysables.
La taxonomie fondée sur le phénotype étudie la morpho- À l'ère du big data, l'explosion de la quantité de don-
logie bactérienne (forme, présence de flagelles, aspects nées nécessite des technologies d'interprétation à haut
tinctoriaux comme la coloration de Gram, sporulation, débit. Pour toutes les méthodes analytiques à visée
etc.), l'aspect des colonies (couleur, taille, forme, etc.), la taxonomique vues précédemment, un point de mesure
physiologie (croissance à différentes températures et dans unique a été converti en un large ensemble de données.
différentes conditions atmosphériques, pH, concentration Par exemple, alors que la chromatographie en phase
en sel, sensibilité à un bactériophage, etc.). La chimiotaxo- gazeuse était auparavant utilisée pour des analyses très
nomie fondée sur des techniques d'analyse biochimique limitées, de nouvelles approches, en particulier celles
comme l'électrophorèse ou la chromatographie fait partie couplées à la spectrométrie de masse (mass spectro-
de l'analyse phénotypique. Elle a permis une grande avan- metry [MS]), facilitent la détection, l'identification et
cée dans la taxonomie en étudiant les différents constituants la quantification de molécules parfois au niveau d'une
biochimiques (acides aminés, sucres, lipides) de la cellule cellule unique. La combinaison de diverses technolo-
bactérienne ou de sa paroi. Elle comprend entre autres l'ana- gies « omiques » autorise un inventaire quasi exhaus-
lyse des acides gras cellulaires (analyse FAME, ou fatty acid tif de toutes les catégories de molécules cellulaires et
methyl ester), des acides mycoliques pour les mycobactéries, de leurs représentants individuels. Cependant, reste
des lipides polaires, des quinones, des polyamines ou encore à définir quelles molécules ou quelle combinaison de
des exopolysacharides. Comme nous l'avons évoqué, l'hy- molécules fournissent la meilleure plateforme analy-
bridation ADN-ADN a été la première technologie molé- tique pour l'identification des espèces. Finalement, les
culaire utilisée à des fins taxonomiques. Au cours des trois technologies omiques montreront que beaucoup d'enti-
dernières décennies, d'autres méthodes moléculaires ont été tés appelées espèces aujourd'hui seraient en réalité des
introduites. Ces méthodes sont dites de première génération hybrides d'autres espèces. Bien que de nombreux cher-
lorsqu'elles reposent sur l'analyse de l'ADN entier comme cheurs voient les données omiques comme détermi-
l'approche RFLP (restriction fragment length polymorphism), nantes dans la définition des espèces, les valeurs de seuil
dont le typage ribosomal, l'électrophorèse en champ pulsé de « variabilité autorisée » devront être mieux définies.
(pulsed field gel electrophoresis [PFGE]) ou encore les sondes Quel devrait être le nombre commun de pics dans un
à ADN. Elles sont dites de deuxième génération quand elles chromatogramme ou bien de changements de nucléo-
consistent à amplifier des fragments d'ADN spécifiques au tides au sein de séquences d'ADN pour statuer que deux
moyen de la PCR telles les approches par AFLP (amplified isolats appartiennent bien à la même espèce ? C'est ce
fragment length polymorphism), AP-PCR (arbitrarily-primed paramètre quantitatif qui reste à définir et qui devra
PCR), rep-PCR (repetitive extragenic palindromic-PCR), être accepté en dernier ressort par les taxonomistes du
RAPD (random amplification polymorphic DNA), analyse de monde entier comme le critère de définition d'espèce.
l'ADNt, VNTR (variable number of tandem repeat) et LMVA
(multiple loci VNTR analysis).
Au final, les analyses phénotypiques et moléculaires
peuvent conduire individuellement ou de façon combinée
La protéomique et la
(polyphasique !) à l'identification d'espèces bactériennes spectrométrie de masse
nouvelles ou préexistantes. Cependant, la taxonomie poly- MALDI-TOF pour la taxonomie
phasique dans son format actuel peut parfois échouer bactérienne
dans la dénomination de nouvelles espèces bactériennes.
Vandamme et al. [25] suggèrent alors que la taxomonie L'introduction récente de la spectrométrie de masse
moderne devrait s'appuyer sur le séquençage du génome MALDI-TOF dans les laboratoires de microbiologie médi-
complet en association avec des données phénotypiques et cale a révolutionné l'identification des micro-organismes
biochimiques. La principale difficulté réside dans l'accep- isolés d'échantillons biologiques et environnementaux. Les
tation de cette nouvelle approche taxonomique de façon systèmes commerciaux mettant en œuvre cette technologie
consensuelle comme l'outil principal et supportant le code sont MALDI BioTyper® de Bruker Daltonics et VITEK® MS,
international de nomenclature bactérienne. de bioMérieux.
256   Partie III. Identification et systématique bactérienne

La spectrométrie de masse, technologie fondée sur l'io- La génomique pour la taxonomie


nisation des échantillons, étudie le déplacement d'entités
ioniques dans des champs électromagnétiques et permet
bactérienne (génotaxonomique)
l'identification des micro-organismes grâce à l'analyse de La technologie du séquençage de dernière génération (next
leur contenu protéique. Une colonie bactérienne ou fon- generation sequencing [NGS]) a fortement évolué au cours de
gique est étalée sur une cible, recouverte d'une matrice ces quelques dernières années tout en révolutionnant l'ana-
ionisante et bombardée par un laser. Les ions ainsi générés lyse génomique et en offrant de nouvelles opportunités dia-
sont séparés en fonction de leur temps de vol (time of flight gnostiques dans les laboratoires de microbiologie clinique
[TOF]), c'est-à-dire la mesure du temps qu'ils mettent pour [8]. De nouveaux génomes microbiens sont séquencés tous
parcourir la longueur du tube de vol. Lorsqu'ils sont soumis les jours, permettant la constitution de vastes bases de don-
à une tension accélératrice. La zone de vol se situant hors nées accessibles dans le domaine public de génomes entiers
du champ électrique, la séparation des ions ne dépend que ou de séquences de gènes individuels (Tableau 27.1). La
de la vitesse acquise lors de la phase d'accélération. Ainsi, possibilité de caractériser des communautés microbiennes
les ions avec un rapport masse sur charge (m/z) le plus petit complètes en s'affranchissant de l'étape de culture a ouvert
parviendront au détecteur en premier. Pour chaque groupe les domaines devenus très populaires de la métagénomique
d'ions de même rapport m/z, un signal est enregistré au et de l'analyse du microbiome que nous détaillerons plus
niveau du détecteur sous la forme d'une fonction temps/ loin. Le microbiote humain est désormais considéré comme
intensité ; l'ensemble des pics ainsi enregistrés constitue un un organe à part entière, plutôt que comme une collection
spectre de masse. La source d'ions de type MALDI, source de micro-organismes. Le NGS a permis de dévoiler des
dite « douce », permet la formation d'espèces ioniques prin- informations sur les interactions entre le micro-organisme
cipalement monochargées ; la séparation des ions ne dépend et son hôte, la littérature médicale regorgeant d'exemples
ainsi que de leur masse. Parmi les nombreux pics produits, illustrant la manière dont cette technologie peut être uti-
les principaux correspondent à des protéines ribosomales, lisée à des fins de diagnostic clinique ou pour l'étude des
spécifiques d'espèce et peu influencées par les variations pathogènes. Cependant, l'introduction du NGS dans la pra-
intraspécifiques. Les spectres générés à partir de bactéries tique médicale ne pourra se faire rapidement en raison de
entières sont ensuite comparés aux spectres de référence nombreux challenges, tels que la nécessité de réaliser des
de la base de données d'un système expert. Ces spectres essais cliniques, l'absence actuelle de cadre réglementaire ou
de référence ont été obtenus à partir des souches types et bien l'adaptation nécessaire de la technologie à l'environne-
d'isolats cliniques issus de collections internationales. En ment clinique. Le NGS demeure une technologie coûteuse
résumé, les profils de pics sont spécifiques d'espèces et par- et complexe dont le temps de rendu des résultats se compte
fois même spécifiques d'une sous-espèce ou d'un type [7]. encore en jours plutôt qu'en heures, et dont l'interprétation
Bien que la majorité des protéines détectées par MALDI- des résultats demeure délicate, nécessitant une expertise
TOF MS soient d'origine ribosomale, d'autres protéines très pointue. Toutefois, les communautés scientifiques, du
hautement exprimées peuvent être détectées comme les diagnostic et de la taxonomie s'accordent sur le fait que
ADN et ARN polymérases ainsi que des enzymes impli- le NGS sera au centre de futurs développements de tests
quées dans la synthèse des protéines. Ainsi, toute forme de diagnostiques.
taxonomie liée à cette technologie possède les mêmes avan- Les séquences génomiques, et plus particulièrement
tages et inconvénients que la taxonomie fondée sur les gènes celles issues de génomes entiers, sont considérées comme
d'ARNr, en tenant compte que la contribution de protéines des informations optimales pour la taxonomie. Le séquen-
non ribosomales reste très limitée. Bien que les microbio- çage génomique existe depuis des décennies ; la technologie
logistes cliniques aient largement plébiscité la spectromé- désormais obsolète de séquençage chimique « Maxam et
trie de masse en raison de la simplicité des procédures et Gilbert » était déjà utilisée à des fins taxonomiques. Faisant
de la fiabilité de l'identification des espèces bactériennes, la suite à la méthode de séquençage enzymatique de Sanger,
technologie en elle-même ne permettra pas une étude taxo- dite de terminaison de chaînes, l'avènement de nouvelles
nomique bactérienne de façon autosuffisante. Cependant, générations de séquençage a permis d'accroître à la fois
grâce aux bases de données contenant les spectres de réfé- la vitesse et le rendement tout en réduisant les coûts de
rence de centaines d'espèces bactériennes, une taxonomie manière significative. Des technologies encore plus sophis-
dite « pratique » peut être mise en œuvre en routine dans le tiquées dites de 3e ou 4e génération, telles que le séquençage
laboratoire de microbiologie. La technologie possède une par nanopore, sont en cours de développement et permet-
résolution qui n'a pas été exploitée à son maximum et la tront l'utilisation de séquences de génomes entiers à des fins
base de données des espèces embarquée dans le système taxonomiques (Tableau 27.2).
n'est pas encore exhaustive. Des améliorations dans l'inter- Dans le cadre de la révision de la taxonomie, de nouvelles
prétation des données au même titre que des évolutions définitions sont nécessaires. Dans les débats sur la taxo-
technologiques sont envisagées, comme l'amélioration nomie génétique, une unité taxonomique opérationnelle
de la résolution. Les technologies analytiques comme la (operational taxonomic unit [OTU]) est définie comme une
chromatographie en phase gazeuse ou liquide trouveront espèce ou un groupe d'espèces s'appuyant seulement sur les
des applications sur le terrain en combinaison avec la MS. données de séquences d'ADN disponibles. C'est l'unité de
Néanmoins, à ce jour, le manque de multiplexage et le coût diversité microbienne la plus couramment utilisée [3]. La
des équipements sont prohibitifs par rapport à la générali- définition de l'OTU telle que donnée par le National Center
sation de leur application. for Biotechnology Information (NCBI) est la suivante :
Chapitre 27. Taxonomie bactérienne à l'heure des technologies nouvelles    257

Tableau 27.1 Génomes d'espèces bactériennes, connues ou nouvelles, impliquées en pathologie


infectieuse humaine publiés dans la revue ASM Journal Genome Announcements (novembre-décembre
2015).
Espèce bactérienne Connue ou nouvelle Nombre de souches Source
Acinetobacter baumannii Connue 3 Bacteriémie
Bacillus anthracis Connue 3 Anthrax cutané
Bacteroides periocalifornicus Nouvelle 1 Periodontite
Bartonella ancashensis Nouvelle 1 Bartonellose, verruga peruana
Bordetella pertussis Connue 11 Coqueluche, souches échappant
au vaccin
Burkholderia pseudomallei Connue 1 Isolat clinique, multirésistant
Campylobacter jejuni Connue 3 Syndrome de Guillain-Barré
et gastro-entérite
Campylobacter ureolyticus Connue 1 Infection génitale
Enterococcus faecalis Connue 1 Souche de référence ERV
(entérobactérie résistant
à la vancomycine)
Escherichia coli Connue 4 Septicémie
Famille des Chitinophagaceae Nouvelle 1 Tumeur péritonéale
Francisella tularensis Connue 1 Isolat humain
Gardnerella vaginalis Connue 1 Infection génitale
Haemophilus influenzae Connue 8 Isolats cliniques
Klebsiella pneumoniae Connue 1 Infection sur cathéter par voie
veineuse centrale
Mycobacterium chimaera Nouvelle (ou variant) 3 Sécrétions respiratoires
Mycobacterium mucogenicum Nouvelle 1 Prélèvement respiratoire
Mycobacterium peregrinum Nouvelle 1 Prélèvement respiratoire
Mycobacterium tuberculosis Connue 2 Crachat, souche multirésistante
Porphyromonas gingivalis Connue 2 Periodontite
Propionibacterium acnes Connue 2 Hypomélanose maculaire progressive
Pseudomonas aeruginosa Connue 4 Infection respiratoire
Salmonella enterica Connue 3 Gastro-entérite, souche
multirésistante
Serratia marcescens Connue 1 Infection urinaire
Serratia rubidaea Connue 1 Infection opportuniste
Staphylococcus aureus Connue 1 Souche de référence SASM
(S. aureus sensible à la méticilline)
Yersinia pestis Connue 19 Peste
27 espèces bactériennes 6 nouvelles 81 souches

« le niveau taxonomique d'échantillonnage sélectionné par Les séquences de génomes complets peuvent être
l'utilisateur pour être utilisé dans une étude, comme les indi- générées pour n'importe quelle espèce bactérienne culti-
vidus, les populations, les espèces, les genres ou les souches vable ou pour laquelle une biomasse suffisante peut être
bactériennes ». Wooley et al. [27] proposent la définition sui- obtenue. Même si la spectrométrie de masse MALDI-
vante : « l'unité taxonomique opérationnelle, distinction des TOF semble aujourd'hui être la méthode la plus pratique
espèces en microbiologie utilisant l'ARNr et un seuil de pour- pour une étude à visée taxonomique, les données de
centage de similarité pour classer les microbes dans le même séquences contiennent une telle masse d'informations
ou dans des OTU différents ». Les OTU sont donc des unités biologiques, fonctionnelles et taxonomiques que la majo-
taxonomiques importantes dans la taxonomie génomique. rité des taxonomistes sont convaincus que le séquençage
Bien que la notion d'OTU ne soit pas utilisée de façon très de génomes complets sera la source ultime d'informa-
homogène, cette notion définit les caractéristiques de base de tions avec lesquelles un cadre taxonomique final pourra
la taxogénomique que nous allons évoquer ci-dessous. être construit.
258   Partie III. Identification et systématique bactérienne

Tableau 27.2 Comparaison des plateformes de séquençage nouvelle génération (next generation
sequencing [NGS]) du génome complet (whole genome sequencing [WGS])*.
Plateforme de Illumina MiSeq® et Ion Torrent PGM® Pacific Bioscience PacBio Oxford Nanopore
séquençage HiSeq® RS® minION®

Mécanisme de Étape de Étape de Pas d'étape de Pas d'étape de


séquençage pré-amplification pré-amplification pré-amplification pré-amplification
Séquençage par synthèse Séquençage par synthèse Séquençage utilisant un Séquençage par
sur semi-conducteur marquage fluorescent nanopore, détection par
courant électrique
Longueur des « read » ≥ 150 pb ~ 200 pb ~ 1 500 pb ~ 10 000 pb max.
(≥ 1500 pb avec le
nouveau robot)
Rendement ~ 1,5–2 Gb pour MiSeq
® 20–50 Mb (314 chip) 100 Mb >  500 Mb en 48 h
® 100–200 Mb (316 chip)
600 Gb max. pour HiSeq
1Gb (318 chip)
Temps/cycle (run) ® 2h 2h Jusqu'à 3 jours mais
27 h pour MiSeq à
® premières données
11 jours pour HiSeq
disponibles en quelques
heures (≤ 6 h)
Préparation automatisée Oui Oui Protocole rapide Protocole de 2 h
de la librairie disponible sans
préparation de la librairie
Quantité d'ADN 50–1000 ng 100–1 000 ng ~ 1 μg 20 ng min.
nécessaire
Taux d'erreurs ® 1,7 % 12,8 % 5–40 %
0,8 % pour MiSeq
®
0,3 % pour HiSeq

* Il est important d'insister sur le fait que cette table ne représente qu'un instantané au jour de sa création et ne sert qu'à un but comparatif puisque chacune
des technologies mentionnées ci-dessus évolue à une vitesse incompatible avec la mise en place d'un tableau à la fois exhaustif et en permanence à jour.
D'après Quail MA, Smith M, Coupland P, et al. A tale of three next generation sequencing platforms : comparison of Ion Torrent, Pacific Biosciences and Illumina
MiSeq sequencers. BMC Genomics 2012 ; 13 : 341 ; et Liu L, Li Y, Li S, et al. Comparison of next-generation sequencing systems. J Biomed Biotechnol 2012 ;
2012 : 251364), ainsi que d'autres données publiques sur internet disponibles à ce jour (www.molecularecologist.com/next-gen-fieldguide-2014/).

Dans le cadre de l'utilisation des séquences génomiques les nouvelles technologies à haut débit exigent des méthodes
en taxonomie, il existe toutefois différents points critiques : de calcul plus sophistiquées et innovantes [4]. Toutefois, une
(1) les souches types utilisées doivent être soigneusement approche simple consiste à calculer la moyenne d'identité
choisies ; (2) la base de données de référence doit être fiable ; de nucléotides (average nucleotide identity [ANI]) [13] pour
(3) les OTU doivent être clairement définies ; (4) les outils laquelle une valeur de 70 % d'hybridation ADN-ADN se tra-
d'analyse comparative pour vérifier si une nouvelle séquence duit par une ANI comprise entre 95 et 96 % [17]. De façon
est proche (ou pas) d'une séquence de référence doivent être alternative, la distance phylogénique entre génomes fondée
clairement spécifiés. Afin d'établir des comparaisons géno- sur des technologies classiques d'alignement de génome
miques fiables, la plupart des taxonomistes préfèrent sépa- BLAST (basic local alignement search tool) constitue un
rer les séquences génomiques dans différentes catégories : outil pouvant être utilisé même sans avoir recours à l'anno-
les core-gènes (partagés par tous les isolats d'une espèce tation de génome [10]. Beaucoup d'autres systèmes ont été
donnée), les core-gènes variables (ceux qui varient significa- développés. La plupart utilisent des séquences annotées et
tivement mais uniformément présents dans une espèce), les fondent l'analyse phylogénique sur la comparaison directe
gènes variables (faisant partie du pangénome, représentant des séquences pour lesquelles la stabilité phylogénétique et
l'accumulation de tous les gènes présents dans une espèce taxonomique peut être déduite d'après les restrictions struc-
plutôt qu'une souche de cette espèce, mais présents de façon turales et/ou fonctionnelles des protéines impliquées. La
sélective dans une fraction de ces génomes) et les éléments plupart de ces méthodes s'apparentent au séquençage multi-
génétiques mobiles qui doivent être considérés à part pour locus (multi locus sequence typing [MLST]) dont les données
une taxonomie optimale. On constate actuellement une générées peuvent être calibrées au niveau de l'espèce mais
tendance nette vers l'utilisation de core-gènes pour l'ordon- aussi au niveau de la sous-espèce ou de la souche [15, 20].
nancement taxonomique [9, 15, 23]. Le nombre de gènes La MLST classique nécessitant habituellement entre 2 et
utilisés pour ces analyses peut varier selon l'espèce, mais 10 gènes se trouve largement dépassée depuis par la MLST
habituellement il n'excède pas 1 000 gènes [18]. La question génomique qui peut utiliser des milliers de gènes en fonc-
principale reste la définition d'une identification au niveau tion de la taille du core-génome de l'espèce.
de l'espèce qui soit utilisable. Dans le passé, une valeur de Beaucoup d'optimisations sont attendues dans les années
seuil de 97 % d'homologie de l'ARN ribosomal était utilisée, à venir. Les données génomiques doivent être classées, réfé-
ou bien une valeur de 70 % d'hybridation ADN-ADN, mais rencées et cumulées avec d'autres informations comme les
Chapitre 27. Taxonomie bactérienne à l'heure des technologies nouvelles    259

données cliniques, démographiques, environnementales et lors de l'analyse des données. Comme la génomique et
aussi épidémiologiques. Les grandes initiatives publiques la métagénomique ne répondent pas à la même question,
sont déjà engagées dans le développement de ces res- le logiciel d'interprétation pour l'analyse des données de
sources et leur accessibilité dans le domaine public via des métagénomique devient alors un élément crucial. Si la
programmes nationaux ou internationaux tels que le pro- génération des données n'est plus un point limitant d'une
gramme européen COMPARE (www.compare-europe.eu). étude métagénomique, c'est dorénavant l'analyse de ces
À terme, la spectrométrie de masse permettra de détec- gros jeux de données qui pose problème aux logiciels
ter une nouvelle espèce potentielle et l'analyse ultérieure existants, et nécessite le développement de nouveaux
du génome viendra définitivement confirmer l'existence de logiciels [2]. Par exemple, pour toutes les lectures, on doit
cette nouvelle espèce [6]. investiguer si elles appartiennent à un seul chromosome
ou non. Le processus taxonomique requiert alors des
temps de calculs très longs, exige du matériel sophistiqué
Pertinence de la métagénomique et donc des budgets conséquents. Le filtrage et la curation
des données constituent également des étapes critiques
pour l'évolution de la taxonomie car le regroupement des OTU et l'annotation ne pourront
bactérienne être réalisés qu'en utilisant des données justes et avec des
La notion de génotaxomique que nous avons intro- bases de données de référence fiables [1]. La revue de
duite précédemment est fondée sur la disponibilité tous les logiciels disponibles va au-delà du cadre de ce
de séquences de génomes « purs » obtenus à partir de chapitre, le lecteur intéressé pourra se référer à une revue
souches microbiennes préalablement cultivées, isolées récente sur ce sujet [19].
et caractérisées. Or, des séquences de génomes entiers En conclusion, beaucoup d'outils mathématiques ont
ou partiels peuvent être générées pour des espèces pour déjà été développés ces dernières années, mais des modules
lesquelles des quantités limitées de biomasse sont obte- logiciels additionnels viendront à l'avenir optimiser et accé-
nues et qui ne sont disponibles que dans des échantil- lérer encore davantage l'interprétation des données dans le
lons polymicrobiens ou au sein de cultures mixtes. Une champ de la métagénomique.
large fraction des bactéries terrestres n'a pas encore été
cultivée, et donc isolée, puisque les conditions optimales
de culture de ces bactéries n'ont pas encore été détermi-
Conclusion et perspectives
nées. La caractérisation de nouveaux procaryotes direc- Les nouvelles biotechnologies nous font appréhender la
tement issus d'un mélange sans culture préalable, soit taxonomie bactérienne sous une forme totalement dif-
par le séquençage de leur ARN ribosomaux, soit par le férente. Avec une approche protéomique, il est possible
séquençage de leur ADN total extrait et purifié, est appelé d'interpréter des profils d'expression protéiques complexes
métagénomique. La métagénomique permet de connaître avec une résolution inégalée jusqu'à ce jour. La protéo-
le métagénome, c'est-à-dire l'ensemble des génomes des mique nous aidera alors à analyser les protéines hautement
micro-organismes qui proviennent d'une même niche exprimées au sein d'une espèce bactérienne à des fins de
écologique. Quand l'approche ribosomale est utilisée, classification. L'approche génomique avec le séquençage du
les espèces peuvent être cataloguées (et quantifiées) génome complet, quant à elle, autorise une comparaison de
sur la base (du nombre) des séquences lues couvrant la souches bactériennes à l'échelle du nucléotide. La transition
séquence du gène ribosomal. Cette approche est quasi d'une taxonomie polyphasique classique vers une forme
équivalente à la procédure classique de taxonomie fondée de taxon« omique » gouvernée par le génome nécessitera
sur l'ARNr 16S utilisée au siècle dernier. L'approche par un peu de temps et, afin de supporter et renforcer cette
séquençage des ADN totaux grâce au NGS est plus avan- approche, l'association avec des données phénotypiques sera
cée mais crée de nouveaux challenges bio-informatiques. encore nécessaire. Nous sommes convaincus qu'un nou-
La métagénomique permet la découverte de nouvelles veau modèle de taxonomie est à établir de façon urgente,
espèces bactériennes, potentiellement des pathogènes de même que, par exemple, la description du contenu du
humains, mais aussi la découverte de capacités physio­ microbiome procaryotique humain nécessitera encore
logiques inconnues jusqu'alors pour certaines espèces d'affiner les technologies [11]. Le NGS va pouvoir répondre
[16]. La procédure de séquençage ne constitue que la à certaines exigences requises pour la mise en place d'un
première étape d'une longue série pour finaliser la carac- processus taxonomique « nouvelle génération ». Toutefois,
térisation. De nombreux projets de métagénomique uti- la définition des critères concernant la délimitation des
lisent des protocoles standard d'analyses génomiques : espèces requiert avant tout le soutien de l'ensemble des taxo-
séquencer le plus possible (on parle de profondeur de nomistes microbiens. En tout état de cause, l'établissement
séquençage, chaque morceau d'ADN étant séquencé de ces nouvelles approches taxonomiques va augmenter de
plusieurs dizaines de fois), assembler les lectures (petits façon considérable les relations entre les disciplines scien-
morceaux d'ADN qu'on obtient en sortie d'un séquen- tifiques autrefois relativement distantes, qu'il s'agisse de la
ceur) en morceaux plus grands, puis finalement annoter biologie, des mathématiques appliquées ou de la bio-infor-
les séquences génomiques. Or, dans tout le processus, matique. Avec un peu de recul, si l'on regarde les récentes
les espèces très faiblement représentées dans l'échantil- évolutions technologiques spectaculaires dans ce domaine,
lon ont toutes les chances d'être considérées comme des on peut sans doute considérer qu'il s'agit d'un véritable pas
artéfacts et ainsi ignorées ; cela peut mener à des biais de géant pour une seule génération de taxonomistes…
260   Partie III. Identification et systématique bactérienne

Références [15] Mende DR, Sunagawa S, Zeller G, et al. Accurate and universal deli-
neation of prokaryotic species. Nat Methods 2013 ; 10(9) : 881–4.
[1] Albanese D, Fontana P, De Filippo C, et al. MICCA : a complete and [16] Nielsen HB, Almeida M, Juncker AS, et al. Identification and assembly
accurate software for taxonomic profiling of metagenomic data. Sci of genomes and genetic elements in complex metagenomic samples
Rep 2015 ; 5 : 9743. without using reference genomes. Nat Biotechnol 2014 ; 32(8) : 822–8.
[2] Ames SK, Hysom DA, Gardner SN, et al. Scalable metageno- [17] Richter M, Rosselló-Móra R. Shifting the genomic gold standard for
mic taxonomy classification using a reference genome database. the prokaryotic species definition. Proc Natl Acad Sci U S A 2009 ;
Bioinformatics 2013 ; 29(18) : 2253–60. 106(45) : 19126–31.
[3] Blaxter M, Mann J, Chapman T, et al. Defining operational taxonomic [18] Rosselló-Móra R, Amann R. Past and future species definitions for
units using DNA barcode data. Philos Trans R Soc Lond B Biol Sci Bacteria and Archaea. Syst Appl Microbiol 2015 ; 38(4) : 209–16.
2005 ; 360 : 1935–43. [19] Scheuch M, Höper D, Beer M. RIEMS : a software pipeline for sen-
[4] Chun J, Rainey FA. Integrating genomics into the taxonomy and sys- sitive and comprehensive taxonomic classification of reads from
tematics of the Bacteria and Archaea. Int J Syst Evol Microbiol 2014 ; metagenomics datasets. BMC Bioinformatics 2015 ; 16 : 69.
64(Pt 2) : 316–24. [20] Stackebrandt E, Frederiksen W, Garrity GM, et al. Report of the ad
[5] Colwell RR. Polyphasic taxonomy of the genus Vibrio : numerical hoc committee for the re-evaluation of the species definition in bacte-
taxonomy of Vibrio cholerae, Vibrio parahaemolyticus, and related riology. Int J Syst Evol Microbiol 2002 ; 52(Pt 3) : 1043–7.
Vibrio species. J Bacteriol 1970 ; 104(1) : 410–33. [21] Sutcliffe IC, Trujillo ME, Goodfellow M. A call to arms for systema-
[6] Fournier PE, Lagier JC, Dubourg G, et al. From culturomics to taxo- tists : revitalising the purpose and practises underpinning the des-
nomogenomics : A need to change the taxonomy of prokaryotes in cription of novel microbial taxa. Antonie Van Leeuwenhoek 2012 ;
clinical microbiology. Anaerobe ; 2015.pii : S1075-9964(15)30071-8. 101(1) : 13–20.
[7] Gilchrist CA, Turner SD, Riley MF, et al. Whole-genome sequencing [22] Sutcliffe IC, Trujillo ME, Whitman WB, et al. A call to action for
in outbreak analysis. Clin Microbiol Rev 2015 ; 28(3) : 541–63. the International Committee on Systematics of Prokaryotes. Trends
[8] Goldberg B, Sichtig H, Geyer C, et al. Making the leap from research Microbiol 2013 ; 21(2) : 51–2.
laboratory to clinic : challenges and opportunities for next-gene- [23] Van Belkum A, Soriaga L, Akella S, et al. Phylogenetic distribution of
ration sequencing in infectious disease diagnostics. 2015 ; 6(6). pii : CRISPR-Cas systems in antibiotic resistant Pseudomonas aeruginosa.
e01888-15. mBio 2015 ; 6(6). e01796-15.
[9] Haley BJ, Grim CJ, Hasan NA, et al. Comparative genomic analysis [24] Vandamme P, Peeters C. Time to revisit polyphasic taxonomy.
reveals evidence of two novel Vibrio species closely related to V. cho- Antonie Van Leeuwenhoek 2014 ; 106(1) : 57–65.
lerae. BMC Microbiol 2010 ; 10 : 154. [25] Vandamme P, Pot B, Gillis M, et al. Polyphasic taxonomy, a consen-
[10] Henz SR, Huson DH, Auch AF, et al. Whole-genome prokaryotic phy- sus approach to bacterial systematics. Microbiol Rev 1996 ; 60(2) :
logeny. Bioinformatics 2005 ; 21(10) : 2329–35. 407–38.
[11] Hugon P, Dufour JC, Colson P, et al. A comprehensive repertoire of [26] Woese CR. Bacterial evolution. Microbiol Rev 1987 ; 51 : 221–71.
prokaryotic species identified in human beings. Lancet Infect Dis [27] Wooley JC, Godzik A, Friedberg I. A primer on metagenomics. MBio
2015 ; 15(10) : 1211–9. 2015 ; 6(6). pii : e01888-15. doi : 10.1128/mBio.01888-15.
[12] Janda JM. Taxonomic update on proposed nomenclature and classifi-
cation changes for bacteria of medical importance, 2013–2014. Diagn
Microbiol Infect Dis 2015 ; 83 : 82–8. Sites internet
[13] Konstantinidis KT, Tiedje JM. Genomic insights that advance the
species definition for prokaryotes. Proc Natl Acad Sci U S A 2005 ; www.bacterio.net
102(7) : 2567–72. www.the-icsp.org
[14] Lagier JC, Armougom F, Million M, et al. Microbial culturomics : http://ijs.microbiologyresearch.org/content/journal/ijsem
paradigm shift in the human gut microbiome study. Clin Microbiol http://genomea.asm.org
Infect 2012 ; 18(12) : 1185–93.

Vous aimerez peut-être aussi