AM
Aaron Mussig
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(80% Open Access)
Cited by:
6,425
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

GTDB: an ongoing census of bacterial and archaeal diversity through a phylogenetically consistent, rank normalized and complete genome-based taxonomy

Donovan Parks et al.Sep 8, 2021
The Genome Taxonomy Database (GTDB; https://gtdb.ecogenomic.org) provides a phylogenetically consistent and rank normalized genome-based taxonomy for prokaryotic genomes sourced from the NCBI Assembly database. GTDB R06-RS202 spans 254 090 bacterial and 4316 archaeal genomes, a 270% increase since the introduction of the GTDB in November, 2017. These genomes are organized into 45 555 bacterial and 2339 archaeal species clusters which is a 200% increase since the integration of species clusters into the GTDB in June, 2019. Here, we explore prokaryotic diversity from the perspective of the GTDB and highlight the importance of metagenome-assembled genomes in expanding available genomic representation. We also discuss improvements to the GTDB website which allow tracking of taxonomic changes, easy assessment of genome assembly quality, and identification of genomes assembled from type material or used as species representatives. Methodological updates and policy changes made since the inception of the GTDB are then described along with the procedure used to update species clusters in the GTDB. We conclude with a discussion on the use of average nucleotide identities as a pragmatic approach for delineating prokaryotic species.
0
Citation987
0
Save
0

Resolving widespread incomplete and uneven archaeal classifications based on a rank-normalized genome-based taxonomy

Christian Rinke et al.Mar 3, 2020
Abstract An increasing wealth of genomic data from cultured and uncultured microorganisms provides the opportunity to develop a systematic taxonomy based on evolutionary relationships. Here we propose a standardized archaeal taxonomy, as part of the Genome Taxonomy Database (GTDB), derived from a 122 concatenated protein phylogeny that resolves polyphyletic groups and normalizes ranks based on relative evolutionary divergence (RED). The resulting archaeal taxonomy is stable under a range of phylogenetic variables, including marker genes, inference methods, corrections for rate heterogeneity and compositional bias, tree rooting scenarios, and expansion of the genome database. Rank normalization was shown to robustly correct for substitution rates varying up to 30-fold using simulated datasets. Taxonomic curation follows the rules of the International Code of Nomenclature of Prokaryotes (ICNP) while taking into account proposals to formally recognise the rank of phylum and to use genome sequences as type material. The taxonomy is based on 2,392 quality screened archaeal genomes, the great majority of which (93.3%) required one or more changes to their existing taxonomy, mostly as a result of incomplete classification. In total, 16 archaeal phyla are described, including reclassification of three major monophyletic units from the former Euryarchaeota and one phylum resulting from uniting the TACK superphylum into a single phylum. The taxonomy is publicly available at the GTDB website ( https://gtdb.ecogenomic.org ).
0
Citation19
0
Save
0

Proposal of Patescibacterium danicum gen. Nov., sp. nov. in the ubiquitous ultrasmall bacterial phylum Patescibacteriota phyl. Nov

Zuzanna Dutkiewicz et al.Nov 19, 2024
Abstract Candidatus Patescibacteria is a diverse bacterial phylum that is notable for members with ultrasmall cell size, reduced genomes, limited metabolic capabilities and dependence on other prokaryotic hosts. Despite the prevalence of the name Ca. Patescibacteria in the scientific literature, it is not officially recognized under the International Code of Nomenclature of Prokaryotes (ICNP) and lacks a nomenclatural type. Here, we rectify this situation by describing two closely related circular metagenome-assembled genomes (MAGs) and by proposing one of them (ABY1TS) to serve as the nomenclatural type for the species Patescibacterium danicumTS gen. Nov., sp. nov. according to the rules of the SeqCode. Rank-normalized phylogenomic inference confirmed the stable placement of P. danicumTS in the class ABY1 within Ca. Patescibacteria. Based on these results, we propose Patescibacterium gen. Nov. to serve as the type genus for associated higher taxa, including the phylum Patescibacteriota phyl. Nov. We complement our proposal with a genomic characterization, metabolic reconstruction, and biogeographical analysis of Patescibacterium. Our results confirm small genome sizes (&lt; 1Mbp), low GC content (&gt;36%), and the occurrence of long gene coding insertions in the 23S rRNA sequences, along with reduced metabolic potential, inferred symbiotic lifestyle, and a global distribution. In summary, this effort, focused on the fourth-largest phylum in the bacterial domain, aims to provide nomenclatural stability in the scientific literature.
0
Citation1
0
Save
0

Selection of representative genomes for 24,706 bacterial and archaeal species clusters provide a complete genome-based taxonomy

Donovan Parks et al.Sep 18, 2019
We recently introduced the Genome Taxonomy Database (GTDB), a phylogenetically consistent, genome-based taxonomy providing rank normalized classifications for nearly 150,000 genomes from domain to genus. However, nearly 40% of the genomes used to infer the GTDB reference tree lack a species name, reflecting the large number of genomes in public repositories without complete taxonomic assignments. Here we address this limitation by proposing 24,706 species clusters which encompass all publicly available bacterial and archaeal genomes when using commonly accepted average nucleotide identity (ANI) criteria for circumscribing species. In contrast to previous ANI studies, we selected a single representative genome to serve as the nomenclatural type for circumscribing each species with type strains used where available. We complemented the 8,792 species clusters with validly or effectively published names with 15,914 de novo species clusters in order to assign placeholder names to the growing number of genomes from uncultivated species. This provides the first complete domain to species taxonomic framework which will improve communication of scientific results.