MG
Markus Göker
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
25
(68% Open Access)
Cited by:
12,753
h-index:
62
/
i10-index:
285
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome-Based Taxonomic Classification of the Phylum Actinobacteria

Imen Nouioui et al.Aug 22, 2018
+7
M
L
I
The application of phylogenetic taxonomic procedures led to improvements in the classification of bacteria assigned to the phylum Actinobacteria but even so there remains a need to further clarify relationships within a taxon that encompasses organisms of agricultural, biotechnological, clinical and ecological importance. Classification of the morphologically diverse bacteria belonging to this large phylum based on a limited number of features has proved to be difficult, not least when taxonomic decisions rested heavily on interpretation of poorly resolved 16S rRNA gene trees. Here, draft genome sequences of a large collection of actinobacterial type strains were used to infer phylogenetic trees from genome-scale data using the principles drawn from phylogenetic systematics. The majority of taxa were found to be monophyletic but several orders, families and genera, as well as many species and a few subspecies were shown to be in need of revision leading to proposals for the recognition of 2 orders, 10 families and 17 genera, as well as the transfer of over 100 species to other genera. In addition, emended descriptions are given for many species mainly involving the addition of data on genome size and DNA G+C content, the former can be considered to be a valuable taxonomic marker in actinobacterial systematics. Many of the incongruities detected when the results of the present study were compared with existing classifications had been recognised from 16S rRNA gene trees though whole-genome phylogenies proved to be much better resolved. The few significant incongruities found between 16S/23S rRNA and whole genome trees underline the pitfalls inherent in phylogenies based upon single gene sequences. Similarly good congruence was found between the discontinuous distribution of phenotypic properties and taxa delineated in the phylogenetic trees though diverse non-monophyletic taxa appeared to be based on the use of plesiomorphic character states as diagnostic features.
0
Citation2,659
0
Save
0

Digital DNA-DNA hybridization for microbial species delineation by means of genome-to-genome sequence comparison

Alexander Auch et al.Jan 28, 2010
M
H
M
A
The pragmatic species concept for Bacteria and Archaea is ultimately based on DNA-DNA hybridization (DDH). While enabling the taxonomist, in principle, to obtain an estimate of the overall similarity between the genomes of two strains, this technique is tedious and error-prone and cannot be used to incrementally build up a comparative database. Recent technological progress in the area of genome sequencing calls for bioinformatics methods to replace the wet-lab DDH by in-silico genome-to-genome comparison. Here we investigate state-of-the-art methods for inferring whole-genome distances in their ability to mimic DDH. Algorithms to efficiently determine high-scoring segment pairs or maximally unique matches perform well as a basis of inferring intergenomic distances. The examined distance functions, which are able to cope with heavily reduced genomes and repetitive sequence regions, outperform previously described ones regarding the correlation with and error ratios in emulating DDH. Simulation of incompletely sequenced genomes indicates that some distance formulas are very robust against missing fractions of genomic information. Digitally derived genome-to-genome distances show a better correlation with 16S rRNA gene sequence distances than DDH values. The future perspectives of genome-informed taxonomy are discussed, and the investigated methods are made available as a web service for genome-based species delineation.
0
Citation1,457
0
Save
0

Analysis of 1,000 Type-Strain Genomes Improves Taxonomic Classification of Bacteroidetes

Marina García-López et al.Sep 23, 2019
+5
B
J
M
Although considerable progress has been made in recent years regarding the classification of bacteria assigned to the phylum Bacteroidetes, there remains a need to further clarify taxonomic relationships within a diverse assemblage that includes organisms of clinical, piscicultural, and ecological importance. Bacteroidetes classification has proved to be difficult, not least when taxonomic decisions rested heavily on interpretation of poorly resolved 16S rRNA gene trees and a limited number of phenotypic features. Here, draft genome sequences of a greatly enlarged collection of genomes of more than 1000 Bacteroidetes and outgroup type strains were used to infer phylogenetic trees from genome-scale data using the principles drawn from phylogenetic systematics. The majority of taxa were found to be monophyletic but several orders, families and genera, including taxa proposed long ago such as Bacteroides, Cytophaga and Flavobacterium but also quite recent taxa, as well as a few species were shown to be in need of revision. According proposals are made for the recognition of new orders, families and genera, as well as the transfer of a variety of species to other genera. In addition, emended descriptions are given for many species mainly involving information on DNA G+C content and (approximate) genome size, both of which can be considered valuable taxonomic markers. We detected many incongruities when comparing the results of the present study with existing classifications, which appear to be caused by insufficiently resolved 16S rRNA gene trees or incomplete taxon sampling. The few significant incongruities found between 16S rRNA gene and whole genome trees underline the pitfalls inherent in phylogenies based upon single gene sequences and the impediment in using ordinary bootstrapping in phylogenomic studies, particularly when combined with too narrow gene selections. While a significant degree of phylogenetic conservation was detected in all phenotypic characters investigated, the overall fit to the tree varied considerably, which is one of the probable causes of misclassifications in the past, much like the use of plesiomorphic character states as diagnostic features.
0
Citation1,319
0
Save
0

List of Prokaryotic names with Standing in Nomenclature (LPSN) moves to the DSMZ

Aidan Parte et al.Jul 23, 2020
+2
J
J
A
The List of Prokaryotic names with Standing in Nomenclature (LPSN) was acquired in November 2019 by the DSMZ and was relaunched using an entirely new production system in February 2020. This article describes in detail the structure of the new site, navigation, page layout, search facilities and new features.
0
Paper
Citation1,222
0
Save
0

TYGS and LPSN: a database tandem for fast and reliable genome-based classification and nomenclature of prokaryotes

Jan Meier‐Kolthoff et al.Sep 22, 2021
M
R
J
J
Microbial systematics is heavily influenced by genome-based methods and challenged by an ever increasing number of taxon names and associated sequences in public data repositories. This poses a challenge for database systems, particularly since it is obviously advantageous if such data are based on a globally recognized approach to manage names, such as the International Code of Nomenclature of Prokaryotes. The amount of data can only be handled if accurate and reliable high-throughput platforms are available that are able to both comply with this demand and to keep track of all changes in an efficient and flexible way. The List of Prokaryotic names with Standing in Nomenclature (LPSN) is an expert-curated authoritative resource for prokaryotic nomenclature and is available at https://lpsn.dsmz.de. The Type (Strain) Genome Server (TYGS) is a high-throughput platform for accurate genome-based taxonomy and is available at https://tygs.dsmz.de. We here present important updates of these two previously introduced, heavily interconnected platforms for taxonomic nomenclature and classification, including new high-level facilities providing access to bioinformatic algorithms, a considerable expansion of the database content, and new ways to easily access the data.
0
Citation1,027
0
Save
0

Critical Assessment of Metagenome Interpretation—a benchmark of metagenomics software

Alexander Sczyrba et al.Oct 2, 2017
+64
P
P
A
The Critical Assessment of Metagenome Interpretation (CAMI) community initiative presents results from its first challenge, a rigorous benchmarking of software for metagenome assembly, binning and taxonomic profiling. Methods for assembly, taxonomic profiling and binning are key to interpreting metagenome data, but a lack of consensus about benchmarking complicates performance assessment. The Critical Assessment of Metagenome Interpretation (CAMI) challenge has engaged the global developer community to benchmark their programs on highly complex and realistic data sets, generated from ∼700 newly sequenced microorganisms and ∼600 novel viruses and plasmids and representing common experimental setups. Assembly and genome binning programs performed well for species represented by individual genomes but were substantially affected by the presence of related strains. Taxonomic profiling and binning programs were proficient at high taxonomic ranks, with a notable performance decrease below family level. Parameter settings markedly affected performance, underscoring their importance for program reproducibility. The CAMI results highlight current challenges but also provide a roadmap for software selection to answer specific research questions.
0
Citation767
0
Save
0

Toward a Novel Multilocus Phylogenetic Taxonomy for the Dermatophytes

Sybren Hoog et al.Oct 25, 2016
+10
M
K
S
Type and reference strains of members of the onygenalean family Arthrodermataceae have been sequenced for rDNA ITS and partial LSU, the ribosomal 60S protein, and fragments of β-tubulin and translation elongation factor 3. The resulting phylogenetic trees showed a large degree of correspondence, and topologies matched those of earlier published phylogenies demonstrating that the phylogenetic representation of dermatophytes and dermatophyte-like fungi has reached an acceptable level of stability. All trees showed Trichophyton to be polyphyletic. In the present paper, Trichophyton is restricted to mainly the derived clade, resulting in classification of nearly all anthropophilic dermatophytes in Trichophyton and Epidermophyton, along with some zoophilic species that regularly infect humans. Microsporum is restricted to some species around M. canis, while the geophilic species and zoophilic species that are more remote from the human sphere are divided over Arthroderma, Lophophyton and Nannizzia. A new genus Guarromyces is proposed for Keratinomyces ceretanicus. Thirteen new combinations are proposed; in an overview of all described species it is noted that the largest number of novelties was introduced during the decades 1920-1940, when morphological characters were used in addition to clinical features. Species are neo- or epi-typified where necessary, which was the case in Arthroderma curreyi, Epidermophyton floccosum, Lophophyton gallinae, Trichophyton equinum, T. mentagrophytes, T. quinckeanum, T. schoenleinii, T. soudanense, and T. verrucosum. In the newly proposed taxonomy, Trichophyton contains 16 species, Epidermophyton one species, Nannizzia 9 species, Microsporum 3 species, Lophophyton 1 species, Arthroderma 21 species and Ctenomyces 1 species, but more detailed studies remain needed to establish species borderlines. Each species now has a single valid name. Two new genera are introduced: Guarromyces and Paraphyton. The number of genera has increased, but species that are relevant to routine diagnostics now belong to smaller groups, which enhances their identification.
0
Citation559
0
Save
0

Taxonomic use of DNA G+C content and DNA–DNA hybridization in the genomic age

Jan Meier‐Kolthoff et al.Feb 1, 2014
M
H
J
The G+C content of a genome is frequently used in taxonomic descriptions of species and genera. In the past it has been determined using conventional, indirect methods, but it is nowadays reasonable to calculate the DNA G+C content directly from the increasingly available and affordable genome sequences. The expected increase in accuracy, however, might alter the way in which the G+C content is used for drawing taxonomic conclusions. We here re-estimate the literature assumption that the G+C content can vary up to 3-5 % within species using genomic datasets. The resulting G+C content differences are compared with DNA-DNA hybridization (DDH) similarities calculated in silico using the GGDC web server, with 70% similarity as the gold standard threshold for species boundaries. The results indicate that the G+C content, if computed from genome sequences, varies no more than 1% within species. Statistical models based on larger differences alone can reject the hypothesis that two strains belong to the same species. Because DDH similarities between two non-type strains occur in the genomic datasets, we also examine to what extent and under which conditions such a similarity could be <70% even though the similarity of either strain to a type strain was ≥ 70%. In theory, their similarity could be as low as 50%, whereas empirical data suggest a boundary closer (but not identical) to 70%. However, it is shown that using a 50% boundary would not affect the conclusions regarding the DNA G+C content. Hence, we suggest that discrepancies between G+C content data provided in species descriptions on the one hand and those recalculated after genome sequencing on the other hand ≥ 1% are due to significant inaccuracies of the applied conventional methods and accordingly call for emendations of species descriptions.
0
Citation541
0
Save
0

Standard operating procedure for calculating genome-to-genome distances based on high-scoring segment pairs

Alexander Auch et al.Jan 28, 2010
M
H
A
DNA-DNA hybridization (DDH) is a widely applied wet-lab technique to obtain an estimate of the overall similarity between the genomes of two organisms. To base the species concept for prokaryotes ultimately on DDH was chosen by microbiologists as a pragmatic approach for deciding about the recognition of novel species, but also allowed a relatively high degree of standardization compared to other areas of taxonomy. However, DDH is tedious and error-prone and first and foremost cannot be used to incrementally establish a comparative database. Recent studies have shown that in-silico methods for the comparison of genome sequences can be used to replace DDH. Considering the ongoing rapid technological progress of sequencing methods, genome-based prokaryote taxonomy is coming into reach. However, calculating distances between genomes is dependent on multiple choices for software and program settings. We here provide an overview over the modifications that can be applied to distance methods based in high-scoring segment pairs (HSPs) or maximally unique matches (MUMs) and that need to be documented. General recommendations on determining HSPs using BLAST or other algorithms are also provided. As a reference implementation, we introduce the GGDC web server (http://ggdc.gbdp.org).
0
Citation528
0
Save
0

Genome-Based Taxonomic Classification of Bacteroidetes

Richard Hahnke et al.Dec 20, 2016
+7
M
J
R
The bacterial phylum Bacteroidetes, characterized by a distinct gliding motility, occurs in a broad variety of ecosystems, habitats, life styles and physiologies. Accordingly, taxonomic classification of the phylum, based on a limited number of features, proved difficult and controversial in the past, for example, when decisions were based on unresolved phylogenetic trees of the 16S rRNA gene sequence. Here we use a large collection of type-strain genomes from Bacteroidetes and closely related phyla for assessing their taxonomy based on the principles of phylogenetic classification and trees inferred from genome-scale data. No significant conflict between 16S rRNA gene and whole-genome phylogenetic analysis is found, whereas many but not all of the involved taxa are supported as monophyletic groups, particularly in the genome-scale trees. Phenotypic and phylogenomic features support the separation of Balneolaceae as new phylum Balneolaeota from Rhodothermaeota and of Saprospiraceae as new class Saprospiria from Chitinophagia. Epilithonimonas is nested within the older genus Chryseobacterium and without significant phenotypic differences; thus merging the two genera is proposed. Similarly, Vitellibacter is proposed to be included in Aequorivita. Flexibacter is confirmed as being heterogeneous and dissected, yielding six distinct genera. Hallella seregens is a later heterotypic synonym of Prevotella dentalis. Compared to values directly calculated from genome sequences, the G+C content mentioned in many species descriptions is too imprecise; moreover, corrected G+C content values have a significantly better fit to the phylogeny. Corresponding emendations of species descriptions are provided where necessary. Whereas most observed conflict with the current classification of Bacteroidetes is already visible in 16S rRNA gene trees, as expected whole-genome phylogenies are much better resolved.
0
Citation492
0
Save
Load More