MC
Maria Chuvochina
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(67% Open Access)
Cited by:
5,377
h-index:
23
/
i10-index:
29
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Recovery of nearly 8,000 metagenome-assembled genomes substantially expands the tree of life

Donovan Parks et al.Sep 11, 2017
+5
M
C
D
Abstract Challenges in cultivating microorganisms have limited the phylogenetic diversity of currently available microbial genomes. This is being addressed by advances in sequencing throughput and computational techniques that allow for the cultivation-independent recovery of genomes from metagenomes. Here, we report the reconstruction of 7,903 bacterial and archaeal genomes from >1,500 public metagenomes. All genomes are estimated to be ≥50% complete and nearly half are ≥90% complete with ≤5% contamination. These genomes increase the phylogenetic diversity of bacterial and archaeal genome trees by >30% and provide the first representatives of 17 bacterial and three archaeal candidate phyla. We also recovered 245 genomes from the Patescibacteria superphylum (also known as the Candidate Phyla Radiation) and find that the relative diversity of this group varies substantially with different protein marker sets. The scale and quality of this data set demonstrate that recovering genomes from metagenomes provides an expedient path forward to exploring microbial dark matter.
0
Citation1,577
0
Save
0

A complete domain-to-species taxonomy for Bacteria and Archaea

Donovan Parks et al.Apr 27, 2020
+3
P
M
D
0
Citation1,050
0
Save
0

GTDB: an ongoing census of bacterial and archaeal diversity through a phylogenetically consistent, rank normalized and complete genome-based taxonomy

Donovan Parks et al.Sep 8, 2021
+3
C
M
D
The Genome Taxonomy Database (GTDB; https://gtdb.ecogenomic.org) provides a phylogenetically consistent and rank normalized genome-based taxonomy for prokaryotic genomes sourced from the NCBI Assembly database. GTDB R06-RS202 spans 254 090 bacterial and 4316 archaeal genomes, a 270% increase since the introduction of the GTDB in November, 2017. These genomes are organized into 45 555 bacterial and 2339 archaeal species clusters which is a 200% increase since the integration of species clusters into the GTDB in June, 2019. Here, we explore prokaryotic diversity from the perspective of the GTDB and highlight the importance of metagenome-assembled genomes in expanding available genomic representation. We also discuss improvements to the GTDB website which allow tracking of taxonomic changes, easy assessment of genome assembly quality, and identification of genomes assembled from type material or used as species representatives. Methodological updates and policy changes made since the inception of the GTDB are then described along with the procedure used to update species clusters in the GTDB. We conclude with a discussion on the use of average nucleotide identities as a pragmatic approach for delineating prokaryotic species.
0
Citation987
0
Save
0

Proposal to reclassify the proteobacterial classes Deltaproteobacteria and Oligoflexia, and the phylum Thermodesulfobacteria into four phyla reflecting major functional capabilities

David Waite et al.Nov 1, 2020
+10
C
M
D
The class Deltaproteobacteria comprises an ecologically and metabolically diverse group of bacteria best known for dissimilatory sulphate reduction and predatory behaviour. Although this lineage is the fourth described class of the phylum Proteobacteria , it rarely affiliates with other proteobacterial classes and is frequently not recovered as a monophyletic unit in phylogenetic analyses. Indeed, one branch of the class Deltaproteobacteria encompassing Bdellovibrio- like predators was recently reclassified into a separate proteobacterial class, the Oligoflexia . Here we systematically explore the phylogeny of taxa currently assigned to these classes using 120 conserved single-copy marker genes as well as rRNA genes. The overwhelming majority of markers reject the inclusion of the classes Deltaproteobacteria and Oligoflexia in the phylum Proteobacteria . Instead, the great majority of currently recognized members of the class Deltaproteobacteria are better classified into four novel phylum-level lineages. We propose the names Desulfobacterota phyl. nov. and Myxococcota phyl. nov. for two of these phyla, based on the oldest validly published names in each lineage, and retain the placeholder name SAR324 for the third phylum pending formal description of type material. Members of the class Oligoflexia represent a separate phylum for which we propose the name Bdellovibrionota phyl. nov. based on priority in the literature and general recognition of the genus Bdellovibrio. Desulfobacterota phyl. nov. includes the taxa previously classified in the phylum Thermodesulfobacteria , and these reclassifications imply that the ability of sulphate reduction was vertically inherited in the Thermodesulfobacteria rather than laterally acquired as previously inferred. Our analysis also indicates the independent acquisition of predatory behaviour in the phyla Myxococcota and Bdellovibrionota , which is consistent with their distinct modes of action. This work represents a stable reclassification of one of the most taxonomically challenging areas of the bacterial tree and provides a robust framework for future ecological and systematic studies.
0
Citation904
0
Save
0

Lists of names of prokaryotic Candidatus taxa

Aharon Oren et al.Jul 1, 2020
+2
C
G
A
We here present annotated lists of names of Candidatus taxa of prokaryotes with ranks between subspecies and class, proposed between the mid-1990s, when the provisional status of Candidatus taxa was first established, and the end of 2018. Where necessary, corrected names are proposed that comply with the current provisions of the International Code of Nomenclature of Prokaryotes and its Orthography appendix. These lists, as well as updated lists of newly published names of Candidatus taxa with additions and corrections to the current lists to be published periodically in the International Journal of Systematic and Evolutionary Microbiology, may serve as the basis for the valid publication of the Candidatus names if and when the current proposals to expand the type material for naming of prokaryotes to also include gene sequences of yet-uncultivated taxa is accepted by the International Committee on Systematics of Prokaryotes.
0
Citation827
0
Save
0

Resolving widespread incomplete and uneven archaeal classifications based on a rank-normalized genome-based taxonomy

Christian Rinke et al.Mar 3, 2020
+6
A
M
C
Abstract An increasing wealth of genomic data from cultured and uncultured microorganisms provides the opportunity to develop a systematic taxonomy based on evolutionary relationships. Here we propose a standardized archaeal taxonomy, as part of the Genome Taxonomy Database (GTDB), derived from a 122 concatenated protein phylogeny that resolves polyphyletic groups and normalizes ranks based on relative evolutionary divergence (RED). The resulting archaeal taxonomy is stable under a range of phylogenetic variables, including marker genes, inference methods, corrections for rate heterogeneity and compositional bias, tree rooting scenarios, and expansion of the genome database. Rank normalization was shown to robustly correct for substitution rates varying up to 30-fold using simulated datasets. Taxonomic curation follows the rules of the International Code of Nomenclature of Prokaryotes (ICNP) while taking into account proposals to formally recognise the rank of phylum and to use genome sequences as type material. The taxonomy is based on 2,392 quality screened archaeal genomes, the great majority of which (93.3%) required one or more changes to their existing taxonomy, mostly as a result of incomplete classification. In total, 16 archaeal phyla are described, including reclassification of three major monophyletic units from the former Euryarchaeota and one phylum resulting from uniting the TACK superphylum into a single phylum. The taxonomy is publicly available at the GTDB website ( https://gtdb.ecogenomic.org ).
0
Citation19
0
Save
141

Reclassification of Shigella species as later heterotypic synonyms of Escherichia coli in the Genome Taxonomy Database

Donovan Parks et al.Sep 22, 2021
+2
P
M
D
Members of the genus Shigella have high genomic similarity to Escherichia coli and are often considered to be atypical members of this species. In an attempt to retain Shigella species as recognizable entities, they were reclassified as Escherichia species in the Genome Taxonomy Database (GTDB) using an operational average nucleotide identity (ANI)-based approach nucleated around type strains. This resulted in nearly 80% of E. coli genomes being reclassified to new species including the common laboratory strain E. coli K-12 (to ‘ E. flexneri’ ) because it is more closely related to the type strain of Shigella flexneri than it is to the type strain of E. coli . Here we resolve this conundrum by treating Shigella species as later heterotypic synonyms of E. coli , present evidence supporting this reclassification, and show that assigning E. coli / Shigella strains to a single species is congruent with the GTDB-adopted genomic species definition.
141
Citation6
0
Save
0

Metabolic potential of uncultured bacteria and archaea associated with petroleum seepage in deep-sea sediments

Xiyang Dong et al.Aug 28, 2018
+11
M
A
X
Abstract The lack of microbial genomes and isolates from the deep seabed means that very little is known about the ecology of this vast habitat. Here, we investigated energy and carbon acquisition strategies of microbial communities from three deep seabed petroleum seeps (3 km water depth) in the Eastern Gulf of Mexico. Shotgun metagenomic analysis revealed that each sediment harbored diverse communities of chemoheterotrophs and chemolithotrophs. We recovered 82 metagenome-assembled genomes affiliated with 21 different archaeal and bacterial phyla. Multiple genomes encoded enzymes for anaerobic oxidation of aliphatic and aromatic compounds, including those of candidate phyla Aerophobetes, Aminicenantes, TA06 and Bathyarchaeota. Microbial interactions are predicted to be driven by acetate and molecular hydrogen. These findings are supported by sediment geochemistry, metabolomics, and thermodynamic modelling. Overall, we infer that deep-sea sediments experiencing thermogenic hydrocarbon inputs harbor phylogenetically and functionally diverse communities potentially sustained through anaerobic hydrocarbon, acetate and hydrogen metabolism.
0
Citation4
0
Save
0

Judicial Opinion 130

David Arahal et al.Jun 6, 2024
+9
B
C
D
Opinion 130 deals with a Request for an Opinion asking the Judicial Commission to clarify whether the genus name Rhodococcus Zopf 1891 (Approved Lists 1980) is illegitimate. The Request is approved and an answer is given. The name Rhodococcus Zopf 1891 (Approved Lists 1980) is illegitimate because it is a later homonym of the validly published cyanobacterial name Rhodococcus Hansgirg 1884. The Judicial Commission also clarifies that it has the means to resolve such cases by conserving a name over an earlier homonym. It is concluded that the name Rhodococcus Zopf 1891 (Approved Lists 1980) is significantly more important than the name Rhodococcus Hansgirg 1884 and therefore the former is conserved over the latter. This makes the name Rhodococcus Zopf 1891 (Approved Lists 1980) legitimate.
0
Citation2
0
Save
0

Putative genome contamination has minimal impact on the GTDB taxonomy

Aaron Mussig et al.May 29, 2024
+3
M
P
A
The Genome Taxonomy Database (GTDB) provides a species to domain classification of publicly available genomes based on average nucleotide identity (ANI) (for species) and a concatenated gene phylogeny normalized by evolutionary rates (for genus to phylum), which has been widely adopted by the scientific community. Here, we use the Genome UNClutterer (GUNC) software to identify putatively contaminated genomes in GTDB release 07-RS207. We found that GUNC reported 35,723 genomes as putatively contaminated, comprising 11.25 % of the 317,542 genomes in GTDB release 07-RS207. To assess the impact of this high level of inferred contamination on the delineation of taxa, we created 'clean' versions of the 34,846 putatively contaminated bacterial genomes by removing the most contaminated half. For each clean half, we re-calculated the ANI and concatenated gene phylogeny and found that only 77 (0.22 %) of the genomes were not consistent with their original classification. We conclude that the delineation of taxa in GTDB is robust to the putative contamination detected by GUNC.
0
Citation1
0
Save
Load More