Vous êtes sur la page 1sur 6

Machine Translated by Google

Hartmann et coll. Notes de résolution BMC (2020)


13:426 https://doi.org/10.1186/s13104­020­05254­4
Notes de recherche BMC

NOTE DE RECHERCHE Accès libre

Séquences annotées du génome


de la plante carnivore Roridula gorgonias
et un parent non carnivore, Clethra arborea
Stéfanie Hartmann1* , Michaela Preick1 , Ceinture en soie1 , André Schefel2 et Michael Hofreiter1

Abstrait
Objectif : Les plantes carnivores sont réparties dans l'arbre de vie et ont évolué au moins six fois de manière indépendante, mais les génomes
nucléaires séquencés et annotés des plantes carnivores font actuellement défaut. Nous avons séquencé et annoté structurellement le
génome nucléaire des gorgonias carnivores Roridula et celui d'un parent non carnivore, le muguet de Madère, Clethra arborea, tous deux
appartenant aux Ericales. Ces données ajoutent une ressource importante pour étudier la génétique évolutive des plantes carnivores à travers
les lignées d'angiospermes ainsi que pour les aspects fonctionnels et systématiques des plantes des Ericales.

Résultats : Nos assemblages ont des longueurs totales de 284 Mbp (R. gorgonias) et 511 Mbp (C. arborea) et affichent des scores BUSCO
élevés de 84,2 % et 89,5 %, respectivement. Nous avons utilisé leurs gènes prédits ainsi que des données accessibles au public provenant
des génomes et transcriptomes d'autres Ericales pour assembler un ensemble de données phylogénomiques pour l'inférence d'un arbre d'espèces.
Cependant, les groupes d'orthologues ont montré une absence marquée d'espèces représentées par un transcriptome. Nous discutons des
raisons possibles et mettons en garde contre la combinaison de gènes prédits à partir d'assemblages basés sur le génome et le transriptome.

Mots clés : Plante carnivore, Roridula gorgonias, Clethra arborea, Assemblage du génome, Assemblage du transcriptome,
Phylogénomique, Projet Matrice orthologue (OMA)

Introduction Pour étudier l’évolution et les adaptations moléculaires impliquant


Bien que les plantes puissent convertir l’eau, le CO2 et l’énergie les plantes carnivores, les données génomiques annotées
lumineuse en composés organiques par photosynthèse, elles ont constituent une ressource essentielle. Cependant, bien que plus de
besoin de minéraux et de nutriments supplémentaires pour leur 600 espèces de plantes carnivores aient été décrites [1], les
croissance et leur reproduction. La plupart des plantes absorbent génomes nucléaires séquencés et annotés de seulement quatre de
ces composés essentiels du sol. Plusieurs plantes appartenant à ces plantes remarquables sont actuellement disponibles [2­5].
des lignées d’angiospermes multiples et diverses ont cependant Pour quelques plantes carnivores supplémentaires, des assemblages
adopté indépendamment un mode de vie carnivore [1] : elles attirent de génome non annotés [6] ou de transcriptome [7–10] sont
et capturent des proies d’insectes et absorbent les nutriments disponibles. Les données de séquence pour les études moléculaires
essentiels des animaux morts. Il n’est pas surprenant que les et évolutives chez les plantes carnivores font donc clairement
plantes carnivores aient évolué principalement dans des zones défaut. Cette étude apporte les génomes nucléaires de deux plantes
pauvres en nutriments, de sorte que la disponibilité accrue de des Ericales : de la plante carnivore Roridula gor­gonias, considérée
nutriments par la prédation offre un net avantage sélectif. par certains auteurs comme proto­carnivore [11], ainsi que celui
d'un parent non carnivore, le lys de Madère. de l'arbre de la vallée,

*Correspondance : stefanie.hartmann@uni­potsdam.de
Clethra arborea. Nous avons utilisé les gènes prédits de leur
1
Institut de biochimie et de biologie, Université de Potsdam, Karl­Liebknecht­ génome pour une analyse phylogénomique des plantes des Ericales
Str. 24­25, 14476 Potsdam, Allemagne et concluons que
La liste complète des informations sur l’auteur est disponible à la fin de l’article

© Le(s) Auteur(s) 2020. Cet article est sous licence internationale Creative Commons Attribution 4.0, qui autorise l'utilisation, le partage, l'adaptation, la
distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur original ( s) et la source,
fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers contenu
dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit du matériel. Si le matériel
n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation statutaire ou
dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativeco
mmons.org/licenses/by/4.0/. La renonciation à la dédicace au domaine public Creative Commons (http://creativecommons.org/publicdomain/
zéro/1,0/) s'applique aux données mises à disposition dans cet article, sauf indication contraire dans une ligne de crédit aux données.
Machine Translated by Google

Hartmann et coll. Notes de résolution BMC (2020) 13:426 Page 2 sur 6

Des ensembles de protéines basés sur le génome, par opposition à des données 1,78 nM (C. arborea) et 4,2 nM (R. gorgonias). Les bibliothèques ont été
incomplètes et fragmentées basées sur le transcriptome, sont nécessaires pour séquencées sur une plate­forme Illumina NextSeq 500 en utilisant un
les futures études phylogénomiques axées sur les aspects systématiques et séquençage à extrémités appariées de 2 x 150 pb ; cela a abouti à 537 M (C.
fonctionnels de ce groupe de plantes. arborea) et 177 M (R. gorgonias) lectures.

Texte principal Assemblage du génome


Matériels et méthodes Le logiciel Supernova (10× Genomics) a été utilisé pour extraire des fichiers
Collecte d'échantillons fastq et générer des assemblages de novo. Pour les assemblages, les données
Les feuilles de Clethra arborea Aiton (numéro IPEN PT­0­B­3250100 ; source : ont été sous­échantillonnées à 350 millions de lectures pour C. arborea et à 115
Madère, Funchal) ont été échantillonnées au Jardin botanique de Berlin le 22 millions de lectures pour R. gorgonias. Des échafaudages d'au moins 1 000 pb
octobre 2018 pour l'estimation de la taille du génome et le 1er avril 2019 pour ont été générés en utilisant le style pseudohap Supernova, qui représente un
l'extraction et le séquençage de l'ADN. . Roridula gorgonias Planch. mélange arbitraire d'allèles maternels et paternels.

(numéro IPEN XX­0­B­0981111 ; source : Botanical Gar­den Liberec) a été


échantillonné au Jardin botanique de Berlin le 1er avril 2019 pour l'extraction Identification et élimination de la contamination

et le séquençage de l'ADN ; les feuilles étaient collantes mais exemptes de Les assemblages ont été comparés à une base de données personnalisée de
restes macroscopiques d'insectes. génomes de référence disponible auprès du NCBI. Pour cette analyse, seuls
Les feuilles de C. arborea destinées à l'estimation de la taille du génome ont les génomes complets ont été récupérés pour les bactéries, alors qu'aucune
été conservées enveloppées dans du papier absorbant humide à 4 degrés restriction de ce type n'a été utilisée pour les autres divisions.

Celsius jusqu'à leur utilisation le lendemain ; les jeunes feuilles destinées à Cela a abouti à un ensemble de données comprenant 886 génomes d’archées,
l'extraction de l'ADN des deux espèces ont été collectées séparément et 293 de bactéries, 188 d’invertébrés et 94 de protozoaires. Comme base de
stockées dans de l'azote liquide jusqu'à leur utilisation. données alternative, une installation locale du nt de Genbank (v.230) a été
utilisée. Le logiciel BLAST [15, 16] a été utilisé pour comparer séparément les
Estimation de la taille du génome de C. arborea échafaudages de C. arborea et de R. gorgonias à ces deux bases de données
La taille du génome de R. gorgonias était de 186 Mbp [12]. Pour C. arborea, avec un seuil de valeur E de 10−15 et un maximum de 10 séquences cibles.
aucune information sur la taille du génome n'était disponible, bien que la plante Les tableaux résultants ont été importés dans MEGAN6­LR [17] et les

soit connue pour être diploïde avec deux ensembles de huit chromosomes échafaudages ont été lus sous forme de lectures longues.
[13]. Avant le séquençage, nous avons déterminé la teneur en ADN nucléaire
de C. arborea par cytométrie en flux à l'aide du trieur de cellules FACSAria II
(BD Bioscience). Les suspensions de noyaux ont été préparées à l'aide de
tampons Otto [14], complétés par 50 µg/ Annotation du génome avec MAKER

RepeatModeler (//www.repeatmasker.org/Repeat­Modeler/) a été utilisé pour


ml de solution de RNase A et 50 µg/ml de solution d’iodure de propidium. La identifier les répétitions spécifiques à une espèce pour R. gorgonias et C.
fluorescence a été mesurée à l'aide d'un laser bleu (488 nm), d'un filtre passe­ arborea. Les bibliothèques de répétitions résultantes ont été utilisées pour les
bande 616/23 nm et d'un miroir 610 LP. Sur la base du rapport entre la valeur étapes ultérieures d’annotation du génome. Pour l'annotation structurelle du
moyenne du pic 8C de l'étalon interne Arabidopsis thali­ana Col­0 et la valeur génome, MAKER [18] a été exécuté de manière itérative : au cours du premier
moyenne du pic de l'échantillon 2C, la taille du génome haploïde de C. arborea cycle, 42 988 séquences protéiques prédites d'Actinidia chinensis
a été estimée à
[19], 34 015 séquences d'Actinidia eriantha [20] et 42 509 séquences UniProt
550 Mbit/s. [21] de plantes (division sprot uniquement) ont été utilisées comme preuve pour
la prédiction génique basée sur l'homologie. Les résultats de cette première
Isolement de l'ADN, préparation de bibliothèques 10× et séquençage exécution ont été utilisés pour former les HMM SNAP. Tese, ainsi que les HMM

Les feuilles des plantes ont été broyées dans de l'azote liquide et 51 mg de d'Augustus issus d'une analyse BUSCO sur les échafaudages assemblés, ont
poudre de C. arborea et 56 mg de R. gorgonias. été utilisés pour une deuxième série de prédictions génétiques. Les résultats
ont été utilisés pour l'extraction de l'ADN avec le kit Power Plant Pro (Qiagen) ; ont été utilisés pour recycler les HMM SNAP et Augustus, et ceux­ci ont été
la solution de séparation phénolique a été utilisée pour l'extraction et une étape utilisés pour une troisième et dernière série de prédictions génétiques.
de vortex a été utilisée après la digestion de l'ARN. Les résultats de Tape
Station ont montré un pic de 20 504 pb pour R. gorgonias et de 27 474 pb pour
C. arborea. Estimation et analyse de la famille de gènes
Les bibliothèques ont été préparées avec le kit Genome Protocol à partir des Pour attribuer les protéines prédites de C. arborea et R. gorgonias à des familles
kits Genome Reagent (10x Chromium) et ont été quantifiées à l'aide du kit de gènes orthologues d'autres génomes d'Ericales pour lesquels des protéines
NEBNext Library Quant (New England Biolabs). Ils avaient des concentrations prédites étaient disponibles, l'algorithme du projet OMA (Orthologous MAtrix)
d'ADN de
Machine Translated by Google

Hartmann et coll. Notes de résolution BMC (2020) 13:426 Page 3 sur 6

[22] a été utilisé. Les études basées sur le génome et le transcriptome Résultats et discussion

que nous avons incluses sont répertoriées dans le tableau 1. Les Nous avons séquencé et assemblé les génomes nucléaires de la
prédictions de protéines issues des assemblages du génome ont été plante carnivore R. gorgonias et de la plante non carnivore C.
directement utilisées. Pour quatre ensembles de données de arborea. Les mesures récapitulatives et de qualité des assemblages
transcriptome, TransDecoder [23] a été utilisé pour identifier le meilleur finaux ont été générées à l'aide de quast [30] et sont présentées dans
cadre de lecture ouvert par transcription, ce qui a donné le nombre le tableau 2.
total de protéines prédites indiqué dans le tableau 1. Pour Diospyros
lotus, cependant, cela a abouti à 219 698 protéines prédites, ce qui Identification et élimination de la contamination
est clairement une surestimation et aurait dû être filtrée.
Aucun échafaudage de C. arborea n'a été attribué à aucune des
Cette espèce a donc été exclue de notre analyse. lignées non végétales. Pour R. gorgonias, les six mêmes échafaudages
Pour d'autres génomes et transcriptomes végétaux séquencés au sein ont été attribués aux insectes avec les deux bases de données, et
des Ericales, tels que Argania spinosa [24], Mono­tropa hypopitys quatre échafaudages supplémentaires ont été attribués aux insectes
[25] et Embelia ribes (non publié ; soumission directe des contigs), à l'aide de la base de données personnalisée. Ces dix échafaudages
aucune protéine prédite n'était disponible au téléchargement, et ces de R. gorgonias variaient en taille entre 1,3 kpb et 45,3 kpb et ont été
espèces ont donc également été exclus. En tant que groupe externe attribués aux Neoptera, Holometabola, Diptera ou Schizophora à l'aide
pour les analyses phylogénétiques, nous avons inclus 44 655 protéines de la base de données personnalisée. Ils avaient une longueur
prédites de Daucus carota (26). cumulée de 92,5 kpb et ont été retirés de l'assemblage pour des
Ces séquences protéiques ont été utilisées comme entrée pour le analyses ultérieures. L’assemblage de R. gorgonias résultant est
pipeline OMA autonome (27), et un total de 63 256 ensembles de d’environ 100 Mbp plus grand qu’une estimation basée sur la
gènes pour lesquels toutes les paires sont supposées être des microdensitométrie de Feulgen [12].
orthologues (« groupes OMA ») ont été générés. L'algorithme OMA
calcule des orthologues de haute qualité mais a tendance à produire Annotation du génome avec MAKER
des familles de gènes plus nombreuses et plus petites que les autres
L'ensemble final de gènes prédits à l'aide de MAKER comprenait 31
approches (27). Cela a également été observé ici, avec 72,5% des
129 gènes pour C. arborea et 22 655 pour R. gorgo­nias. Le logiciel
groupes OMA contenant des séquences de cinq espèces ou moins. BUSCO [31] a été utilisé pour évaluer l'exhaustivité des deux
Pour une analyse plus approfondie, nous avons sélectionné les 4 annotations. Sur 2 121 orthologues quasi universels à copie unique
901 groupes contenant des représentants d'au moins 7 des 10
d'eudicots (ensembles de données basés sur OrthoDB version 10),
espèces de l'endogroupe et incluions également une séquence de 89,5 % ont été identifiés pour C. arborea et 84,2 % pour R. gorgonias.
Daucus carota. Pour chacun des 2434 groupes OMA dans lesquels Les statistiques complètes de BUSCO sont fournies dans le tableau 2.
toutes les espèces basées sur le génome étaient présentes (voir ci­
dessous), nous avons calculé un alignement de séquences multiples
à l'aide de MAFFT v7.455 [28] et une phylogénie du maximum de
Évaluation des familles de gènes
vraisemblance à l'aide de RAxML v8.2.12 [29] en utilisant le modèle
Utilisation comme entrée des gènes prédits de R. gorgonias
PROTGAMMAWAG et la séquence D. carota comme groupe externe.
et C. arborea, ainsi que des ensembles de protéines publiques de

Tableau 1 Statistiques récapitulatives sur le nombre total de gènes et la longueur des ensembles de données complets utilisés pour l'inférence des familles
de gènes

Min. Médian 3ème Qu Max. Total Taper Référence

A. chinensis 4 353 535 5453 34 015 g [19]


A. ériantha 2 268 438 5498 42 988 g [20]
C. arborea 14 324 520 4973 31 129 g Cette étude
Environ. sinensis 29 325 515 5786 76 698 g [33]
D. carotte 29 399 601 5453 44 655 g [26]
P. veris 23 366 544 4732 18 301 g [34]

P. vulgaris 49 375 605 5347 28 441 g [35]

R. gorgonias 21 325 509 5314 22 655 g Cette étude

S. psittacina 39 108 155 447 22 690 t [7]

S. purpurea 41 111 158 831 18 748 t [7]

V. macrocarpon 40 118 212 2061 34 789 t [36]


Dans. lotus 40 74 107 4354 219 698 t [37]
Machine Translated by Google

Hartmann et coll. Notes de résolution BMC (2020) 13:426 Page 4 sur 6

Tableau 2 Statistiques récapitulatives pour les échafaudages et les La différence dans les absences indique un biais systématique des
gènes prédits. Les métriques sont répertoriées pour les échafaudages transcriptomes. Les données RNA­Seq correspondent à des transcrits
d'au moins 1 kbp, déterminés à l'aide du logiciel Quast. qui sont exprimés uniquement dans un tissu donné à un instant donné,
métrique R. gorgones C. arborea et tous les gènes codant pour les protéines ne sont donc pas
représentés dans un assemblage de transcriptome. De plus, les erreurs
Longueur totale (>= 10 kbit/s) 235 721 577 437 604 713
de séquençage, les formes d'épissage alternatives et les paralogues
Longueur totale (>= 25 kbit/s) 200 375 750 384 820 916
présentent de sérieux défis pour l'assemblage de transcriptomes,
Longueur totale (>= 50 kbp) # 125 205 191 312 317 250
entraînant souvent un nombre irréaliste de petites transcriptions. Pour
contigs 20 623 29 265
réduire ce nombre, différentes stratégies de filtrage sont couramment
Le plus grand contig 191 047 616 539
appliquées, telles que la suppression des transcriptions faiblement
Longueur totale 284 273 507 511 026 369
exprimées ou la réduction des transcriptions en fonction de l'identité de
CV (%) 36,60 38.50
la séquence. Le nombre de transcriptions qui en résulte est souvent
N50 46 982 67 174
beaucoup plus proche du nombre attendu de gènes (exprimés) de
# N pour 100 kbit/s 734.67 2 082,52
l’organisme. Cependant, des problèmes subsistent, car de nombreux
Total des groupes BUSCO recherchés 2121 2121
défis liés aux assemblages de transcriptomes ne peuvent pas être
BUSCO complets 1787 (84,2%) 1899 (89,5%) surmontés en utilisant une approche de filtrage post­assemblage : la
BUSCO complets et en un seul exemplaire 1712 (80,7%) 1744 (82,2%) plupart des transcrits ne sont encore que des fragments de gènes et, de
BUSCO complets et dupliqués 75 (3,5%) 155 (7,3%) plus, de véritables gènes sont fréquemment filtrés (32). Cela a également
Des BUSCO fragmentés 203 (9,6%) 135 (6,4%) été observé ici, avec des gènes prédits beaucoup plus longs à partir
BUSCO manquants 131 (6,2%) 87 (4,1%) des données génomiques qu'à partir des données du transcriptome
Les statistiques de BUSCO sont basées sur 2 121 orthologues d'eudicots à copie unique (Tableau 1), et avec la plupart des ensembles d'orthologues manquants
pour les séquences protéiques prévues de R. gorgonias et C. arborea.
chez les espèces représentées par un assemblage de transcriptome.

Malgré le nombre réduit d'espèces dans notre ensemble de données


À l'échelle du génome, pour les génomes d'autres Ericales et D. carota phylogénomiques finales, nous l'avons utilisé pour déduire les relations
en tant que groupe externe, nous avons généré un ensemble de données entre organismes au sein des Ericales. Les 2 434 phylogénies calculées
phylogénomiques de groupes OMA correspondant à des orthologues 1: ont révélé 118 topologies d’arbres différentes, dont 90 ont été observées
1. Nous avons évalué la représentation de chacune des 10 espèces moins de 10 fois. Les trois topologies les plus fréquemment observées
endogroupes dans les groupes OMA sélectionnés. Les espèces pour représentaient ensemble 50 % des arbres ; ceux­ci ne diffèrent qu'en ce
lesquelles un assemblage génomique était disponible manquaient entre qui concerne l'emplacement de Camellia sinensis et sont illustrés dans
1 % (Actinidia chinensis) et 10 % (Primula vulgaris) des groupes. la figure 1. Davantage de données basées sur le génome incluant
Cependant, les trois assemblages de transcriptome ont montré un toutes les lignées de l'ordre des plantes Ericales sont nécessaires pour
niveau d'absence considérablement plus élevé, entre 64 % (Vaccinium résoudre avec confiance leurs relations à l'avenir.
macrocarpon) et 82 % (Sar­racenia purpurea). Nous avons observé 121
modèles distincts d’absence et de présence d’espèces. Le modèle le
plus fréquemment observé, trouvé dans 2 434 des 4 901 groupes OMA Limites
sélectionnés, contenait des représentants de tous les génomes et En résumé, nous présentons les génomes annotés de la plante
d’aucun des transcriptomes. carnivore R. gorgonias et du parent non carnivore C. arborea. Les
longueurs et le nombre de leurs gènes prédits s'inscrivent entièrement
Bien que les espèces sélectionnées couvrent de grandes distances dans la plage d'autres données basées sur le génome et peuvent être
évolutives et qu'une perte ou une divergence spécifique à la lignée soit utilisés pour étudier les adaptations partagées et uniques du carnivore
attendue dans certaines familles de gènes, les conséquences dramatiques végétal au niveau moléculaire.

Fig. 1 Les topologies ML les plus fréquemment observées. Sur 2 434 familles OMA sélectionnées, 814, 218 et 176 arbres ont abouti aux topologies présentées respectivement en A, B et C.
Machine Translated by Google

Hartmann et coll. Notes de résolution BMC (2020) 13:426 Page 5 sur 6

Acevedo­Hernández G, Schuster SC, Himmelbauer H, Minoche AE, Xu S, Lynch M, Oropeza­


niveau. Une fois que des génomes supplémentaires, plutôt que des tomes de
Aburto A, Cervantes­Pérez SA, de Jesús Ortega­Estrada M, Cervantes­Luevano JI, Michael TP,
transcription, d'autres plantes carnivores et non carnivores au sein des Ericales Mockler T, Bryant D , Herrera­Estrella A, Albert VA, Herrera­Estrella L. Architecture et évolution
seront disponibles, l'évolution des différentes adaptations carnivores et la d'un minuscule génome végétal. Nature. 2013 ;498(7452) :94–8. https://doi.org/10.1038/

relation entre les principales lignées de ce groupe pourront être résolues. Les
nature12132.
limites de notre ensemble de données sont celles inhérentes à tout projet de 3. Leushkin EV, Sutormin RA, Nabieva ER, Penin AA, Kondrashov AS,

génome : en raison de la nature fragmentée de l'assemblage, certains gènes Logacheva MD. Le génome miniature d'une plante carnivore genlisea aurea contient un faible
nombre de gènes et de courtes séquences non codantes.
situés à l'extrémité des échafaudages sont probablement incomplets, des
Génomique BMC. 2013;14:476. https://doi.org/10.1186/1471­2164­14­476.
échafaudages correspondant aux régions génomiques organellaires peuvent 4. Silva SR, Moraes AP, Penha HA, Julião MHM, Domingues DS, Michael
être contenus dans l'assemblage, et répéter les régions peuvent être TP, Miranda VFO, Varani AM. La plante carnivore terrestre Utricularia reniformis met en
lumière la plasticité du génome de l’environnement et des formes de vie.
manquantes ou mal assemblées.
Int J Mol Sci. 2019;21:1. https://doi.org/10.3390/ijms21010003.
5. Fukushima K, Fang X, Alvarez­Ponce D, Cai H, Carretero­Paulet L, Chen C, Chang TH, Farr KM,
Fujita T, Hiwatashi Y et al. Le génome de la sarracénie cephalotus révèle des changements
génétiques associés au carnivore. Nat Ecol Evol. 2017;1:0059.
Abréviations

BUSCO : analyse comparative des orthologues universels à copie unique ; ADN : acide 6. Butts CT, Bierma JC, Martin RW. Nouvelles protéases du génome de la plante carnivore drosera
désoxyribonucléique ; HMM : modèles de Markov cachés ; IPEN : Réseau international d'échange de capensis : prédiction structurelle et analyse comparative. Protéines. 2016;84(10):1517­33.
plantes ; kbp : kilo paire de bases ; M : millions ; Mbp : Méga paire de bases ; NCBI : Centre national https://doi.org/10.1002/
d'information sur la biotechnologie ; nm : nanomètre ; ARN : Acide ribonucléique ; OMA : Projet de matrice protégé 25095.
orthologique. 7. Srivastava A, Rogers WL, Breton CM, Cai L, Malmberg RL. Transcriptome
analyse de la sarracenia, une plante insectivore. ADN Rés. 2011;18(4):253­61. https://doi.org/
Remerciements 10.1093/dnares/dsr014.
Nous tenons à remercier le Jardin botanique de Berlin pour avoir fourni le matériel végétal utilisé dans 8. Jensen MK, Vogt JK, Bressendorf S, Seguin­Orlando A, Petersen M,
cette étude, ainsi qu'Alice Dennis pour les discussions utiles tout au long de ce projet. Sicheritz­Pontén T, Mundy J. Analyse du transcriptome et de la taille du génome du venus fytrap.
PLoS UN. 2015;10(4):0123887. https://doi.org/10.1371/
journal.pone.0123887.
Contributions des auteurs
9. Bárta J, Stone JD, Pech J, Sirová D, Adamec L, Campbell MA, Štorchová H.
MP et AS ont effectué la cytométrie de flux. MP et SA ont effectué tous les travaux de laboratoire Le transcriptome d'Utricularia vulgaris, une plante sans racines dotée d'un génome minimaliste,
moléculaire. MH et SH ont conçu l'étude. SH a analysé les données et rédigé le manuscrit. Tous les révèle un épissage alternatif extrême et une similarité de séquence seulement modérée
auteurs ont lu et approuvé le manuscrit final. avec Utricularia gibba. Biol végétal BMC. 2015;15:78. https://doi.org/10.1186/
s12870­015­0467­8.
Financement 10. Ibarra­Laclette E, Albert VA, Pérez­Torres CA, Zamudio­Hernández F,
Financement en libre accès fourni par Projekt DEAL. . Ortega­Estrada MdJ, Herrera­Estrella A, Herrera­Estrella L. Transcriptomique et analyse du taux
d'évolution moléculaire de l'utriculaire (utricularia), une plante carnivore avec un génome minimal.
Disponibilité des données et du matériel Biol végétal BMC. 2011;11:101. https://doi.org/10.1186/1471­2229­11­101.
Les données de séquence brutes ont été déposées dans les archives de lecture courte sous
BioProject ID PRJNA630565 (https://www.ncbi.nlm.nih.gov/sra/?term=PRJNA 11. Voigt D, Gorb S. Résistance à la dessiccation de la sécrétion adhésive chez la plante proto­carnivore
630565), avec les numéros d'accession SAMN14840030 (R. gorgonias) et SAMN14840031 roridula gorgonias en tant qu'adaptation à un environnement périodiquement sec. Plante.
(C. arborea). Les assemblages du génome et les protéines prédites ont été mis à disposition sur 2010;232(6):1511­5. https://doi.org/10.1007/s0042
DataDryad sous l'URL https://doi.org/10.5061/ 5­010­1270­2.
dryade.573n5tb4k. 12. Bennett MD, Leitch IJ. Quantités d’ADN nucléaire dans les angiospermes : pro­
progrès, problèmes et perspectives. Ann Bot. 2005;95(1):45­90. https://doi.
Des intérêts concurrents org/10.1093/aob/mci003.
Les auteurs déclarent qu'ils n'ont aucun intérêt concurrent. 13. Hayden WJ. Il reste encore beaucoup à apprendre : les chromosomes de Clethra. Sempervi­
faire le ménage. 2015;4 :

Approbation éthique et consentement à participer 14. Coloration Otto F. Dapi de cellules fxées pour la cytométrie en flux haute résolution de
N'est pas applicable ADN nucléaire. Méthodes Cell Biol. 1990 ; 33 : 105­10.
15. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Outil de recherche d'alignement local de
Consentement à publier base. J Mol Biol. 1990;215(3):403­10. https://doi.org/10.1016/S0022
N'est pas applicable ­2836(05)80360­2.
16. Camacho C, Coulouris G, Avagyan V, Ma N, Papadopoulos J, Bealer
Détails de l'auteur
K, Madden TL. Blast+ : architecture et applications. BMC Bioinformer. 2009;10:421. https://
1
Institut de biochimie et de biologie, Université de Potsdam, Karl­Liebkne­cht­Str. 24­25, 14476 doi.org/10.1186/1471­2105­10­421.
2
Potsdam, Allemagne. Institut Max­Planck de Moléculaire
[ PubMed ] 17. Huson DH, Albrecht B, Bağcı C, Bessarab I, Gorska A, Jolic D, Williams RBH.
Physiologie végétale, Am Mühlenberg 1, 14476 Potsdam, Allemagne. Megan­lr : de nouveaux algorithmes permettent un regroupement précis et une exploration
interactive facile des lectures longues et des contigs métagénomiques. BiolDirect.
Reçu : 15 mai 2020 Accepté : 24 août 2020 2018;13(1):6. https://doi.org/10.1186/s13062­018­0208­7.
18. Holt C, Yandell M. Maker2 : un pipeline d'annotations et un outil de gestion de bases de données
génomiques pour les projets génomiques de deuxième génération. Forme BMC Bioin.
2011;12:491. https://doi.org/10.1186/1471­2105­12­491.
[ PubMed ] 19. Pilkington SM, Crowhurst R, Hilario E, Nardozza S, Fraser L, Peng Y,
Les références Gunaseelan K, Simpson R, Tahir J, Deroles SC, Templeton K, Luo Z, Davy M,
1. Ellison AM, Gotelli NJ. L'énergie et l'évolution des plantes carnivores, les « plantes les plus Cheng C, McNeilage M, Scaglione D, Liu Y, Zhang Q, Datson P, De Silva N,
merveilleuses du monde » selon Darwin. J Exp Bot. 2009;60(1):19­42. https://doi.org/10.1093/jxb/ Gardiner SE, Bassett H, Chagné D, McCallum J, Dzierzon H, Deng C, Wang
ern179. YY , Barron L , Home K , Bowen J , Foster TM , Erridge ZA , Tiffn H , Waite
2. Ibarra­Laclette E, Lyons E, Hernández­Guzmán G, Pérez­Torres CA, Carretero­Paulet L, CN , Davies KM , Grierson EP , Laing WA , Kirk R , Chen X , Wood M , Montefori
Chang TH, Lan T, Welch AJ, Juárez MJA, Simp­son J, Fernández­Cortés A, Arteaga­ M, Brummell DA, Schwinn KE, Catanach A, Fullerton C, Li D, Meiyalaghan
Vázquez M, Gongora­Castillo E, S, Nieuwenhuizen, N. Read, R. Prakash, D. Hunter, H. Zhang et McKenzie
Machine Translated by Google

Hartmann et coll. Notes de résolution BMC (2020) 13:426 Page 6 sur 6

M , Knäbel M , Harris A , Allan AC , Gleave A , Chen A , Janssen BJ , Plunkett B , 27. Altenhof AM, Levy J, Zarowiecki M, Tomiczek B, Warwick Vesztrocy A,
Ampomah­Dwamena C , Voogd C , Leif D , Laferty D , Souleyre EJF , Varkonyi­Gasic Dalquen DA, Müller S, Telford MJ, Glover NM, Dylus D, Dessimoz C. Oma autonome :
E , Gambi F , Hanley J , Yao JL , Cheung J , David KM , Warren B , Marsh K , Snowden inférence orthologique parmi les génomes et transcriptomes publics et personnalisés.
KC , Lin­Wang K , Brian L , Martinez­Sanchez M , Wang M , Ileperuma N , Macnee N , Génome Res. 2019;29(7):1152­63. https://doi.
Campin R , McAtee P , Drummond RSM . Espley RV, Irlande HS, Wu R, Atkinson RG, org/10.1101/gr.243212.118.
Karunairetnam S, Bulley S, Chunkath S, Hanley Z, Storey R, Thrimawithana AH, Thomson 28. Katoh K et Standley DM. Logiciel d'alignement de séquences multiples Maft version
S, David C, Testolin R, Huang H, Hellens RP, Schafer RJ. Un actinidia chinen­sis var. 7 : améliorations des performances et de la convivialité. Mol Biol Évol.
annoté manuellement. chinensis (kiwi) met en évidence les défis associés aux projets de 2013;30(4):772­80. https://doi.org/10.1093/molbev/mst010.
génomes et à la prédiction génétique chez les plantes. Génomique BMC. 2018;19(1):257. 29. Stamatakis A. Raxml version 8 : un outil d'analyse phylogénétique et de post­analyse des
https://doi.org/10.1186/s12864­018­4656­3 grandes phylogénies. Bioinformatique. 2014;30(9):1312­3. https://
est ce que je.org/10.1093/bioinformatics/btu033.
20. Tang W, Sun X, Yue J, Tang X, Jiao C, Yang Y, Niu X, Miao M, Zhang D, 30. Gurevich A, Saveliev V, Vyahhi N, Tesler G. Quast : outil d'évaluation de la qualité des
Huang S, Shi W, Li M, Fang C, Fei Z, Liu Y. Assemblage du génome à l'échelle assemblages de génomes. Bioinformatique. 2013;29(8):1072­5. https://doi.
chromosomique de l'actinidia eriantha du kiwi avec séquençage d'une seule molécule et org/10.1093/bioinformatique/btt086.
cartographie des interactions chromatine. Gigascience. 2019;8:4. https://doi. 31. Simão FA, Waterhouse RM, Ioannidis P, Kriventseva EV, Zdobnov EM.
org/10.1093/gigascience/giz027. Busco : évaluation de l'assemblage du génome et de l'exhaustivité des annotations
21. Consortium UniProt. Uniprot : un hub mondial de connaissances sur les protéines. avec des orthologues à copie unique. Bioinformatique. 2015;31(19):3210­2. https://doi.
Acides nucléiques Res. 2019;47(D1):506­15. https://doi.org/10.1093/nar/gky10 org/10.1093/bioinformatique/btv351.
49. 32. Freedman AH, Clamp M, Sackton TB. Erreur, bruit et biais dans les assemblages de
22. Train CM, Glover NM, Gonnet GH, Altenhof AM, Dessimoz C. Ortholo­ transcriptome de novo. bioRxiv, 585745, 2019.
Algorithme de matrice de Gous (OMA) 2.0 : plus robuste aux taux d'évolution 33. Wei C, Yang H, Wang S, Zhao J, Liu C, Gao L, Xia E, Lu Y, Tai Y, She G, Sun J, Cao H,
asymétriques et inférence de groupe orthologue hiérarchique plus évolutive. Tong W, Gao Q, Li Y, Deng W, Jiang X, Wang W, Chen Q, Zhang S, Li H, Wu J, Wang P,
Bioinformatique. 2017;33(14):75­82. https://doi.org/10.1093/bioinforma Li P, Shi C, Zheng F, Jian J, Huang B, Shan D, Shi M, Fang C, Yue Y, Li F , Li D, Wei
tics/btx229. S, Han B, Jiang C, Yin Y, Xia T, Zhang Z, Bennetzen JL, Zhao S, Wan X. Le projet de
23. Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, séquence génomique de camellia sinensis var. sinensis donne un aperçu de l'évolution
Couger MB, Eccles D, Li B, Lieber M, MacManes MD, Ott M, Orvis J, Pochet N, Strozzi F, du génome du thé et. qualité du thé.
Weeks N, Westerman R, William T, Dewey CN, Henschel R, LeDuc RD, Friedman Proc Natl Acad Sci États­Unis 2018;115(18):4151­8. https://doi.org/10.1073/
N, Regev A Reconstruction de séquences de transcription de novo à partir de rna­ pnas.1719622115.
seq à l'aide de la plateforme Trinity pour la génération et l'analyse de références. Protocole 34. Nowak MD, Russo G, Schlapbach R, Huu CN, Lenhard M, Conti E. Le projet de
Nat. 2013;8(8):1494­512. https://doi.org/10.1038/ génome de primula veris donne un aperçu des bases moléculaires de l'hétérostylie.
nprot.2013.084. Génome Biol. 2015;16:12. https://doi.org/10.1186/s1305
24. Khayi S, Azza N, Gaboun F, Pirro S, Badad O, Claros M, Lightfoot D, Unver T, Chaouni B, 9­014­0567­z.
Merrouch R, Rahim B, Essayeh S, Ganoudi M, Abdelwahd R, Diria G, Mdarhi M, Labhilili 35. Cocker JM, Wright J, Li J, Swarbreck D, Dyer S, Caccamo M, Gilmartin PM.
M, Iraqi D, Mouhaddab J, Sedrati H, Memari M, Hamamouch N, Alché J, Boukhatem N, Assemblage du génome de Primula vulgaris (primrose), annotation et expression
Mrabet R, Dahan R, Legssyer A, Khalfaoui M, Badraoui M, Van de Peer Y, Tatusova génique, avec génomique comparative sur le supergène hétérostylie.
T, El Mousadik A , Mentag R, Ghazal H. Premier projet d'assemblage du génome de Sci Rep.2018;8(1):17942. https://doi.org/10.1038/s41598­018­36304­4.
l'arganier (argania spinosa) [version 1 ; examen par les pairs : 1 approuvé, 1 36. Polashock J, Zelzion E, Fajardo D, Zalapa J, Georgi L, Bhattacharya D, Vorsa N. La
approuvé avec réserves]. F1000Recherche. 2018;7(1310). https://doi.org/10.12688/ canneberge américaine : premiers aperçus de l'ensemble du génome d'une espèce
f1000resea adaptée à l'habitat des tourbières. Biol végétal BMC. 2014;14:165. https://doi.
rch.15719.1 org/10.1186/1471­2229­14­165.
25. Beletsky AV, Filyushin MA, Gruzdev EV, Mazur AM, Prokhortchouk EB, [ Article gratuit PMC ] [ PubMed ] 37. Akagi T, Henry IM, Tao R, Comai L. Génétique végétale. un chromosome y­

Kochieva EZ, Mardanov AV, Ravin NV, Skryabin KG. Assemblage du transcriptome de Le petit ARN codé agit comme un déterminant du sexe chez les kakis. Science.
novo de la plante mycohétérotrophe monotropa hypopitys. Grâce aux données. 2014;346(6209):646­50. https://doi.org/10.1126/science.1257225.
2017 ; 11 : 60­1. https://doi.org/10.1016/j.gdata.2016.11.020.
[ PubMed ] 26. Iorizzo M, Ellison S, Senalik D, Zeng P, Satapoomin P, Huang J, Bowman
M, Iovene M, Sanseverino W, Cavagnaro P, Yildiz M, Macko­Podgórni A, Moranska
Note de l'éditeur
Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans
E, Grzebelus E, Grzebelus D, Ashraf H, Zheng Z, Cheng S, Spooner D, Van
les cartes publiées et les affiliations institutionnelles.
Deynze A, Simon P. Un assemblage du génome de carotte de haute qualité fournit
de nouvelles informations sur l'accumulation de caroténoïdes et l'évolution du
génome des astérides. Nuit Genet. 2016;48(6):657­66. https://doi.
org/10.1038/ng.3565.

Prêt ton soumettre une recherche ? à Choisir BMC et bénéficiez de :

• soumission en ligne rapide et pratique

• un examen approfondi par les pairs par des chercheurs expérimentés dans votre domaine

• publication rapide sur acceptation

• prise en charge des données de recherche, y compris les types de données volumineux et complexes

• Gold Open Access qui favorise une collaboration plus large et une augmentation des citations

• visibilité maximale pour vos recherches : plus de 100 millions de visites de sites Web par an

Chez BMC, la recherche est toujours en progrès.

En savoir plus biomedcentral.com/submissions

Vous aimerez peut-être aussi