AE
A. Eren
Author with expertise in Marine Microbial Diversity and Biogeography
Helmholtz Institute for Functional Marine Biodiversity, Alfred-Wegener-Institut Helmholtz-Zentrum für Polar- und Meeresforschung, Max Planck Institute for Marine Microbiology
+ 10 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
26
(69% Open Access)
Cited by:
89
h-index:
55
/
i10-index:
90
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
84

Metabolic independence drives gut microbial colonization and resilience in health and disease

Andrea Watson et al.Oct 24, 2023
+17
I
J
A
Abstract Changes in microbial community composition as a function of human health and disease states have sparked remarkable interest in the human gut microbiome. However, establishing reproducible insights into the determinants of microbial succession in disease has been a formidable challenge. Here we use fecal microbiota transplantation (FMT) as an in natura experimental model to investigate the association between metabolic independence and resilience in stressed gut environments. Our genome-resolved metagenomics survey suggests that FMT serves as an environmental filter that favors populations with higher metabolic independence, the genomes of which encode complete metabolic modules to synthesize critical metabolites, including amino acids, nucleotides, and vitamins. Interestingly, we observe higher completion of the same biosynthetic pathways in microbes enriched in IBD patients. These observations suggest a general mechanism that underlies changes in diversity in perturbed gut environments, and reveal taxon-independent markers of ‘dysbiosis’ that may explain why widespread yet typically low abundance members of healthy gut microbiomes can dominate under inflammatory conditions without any causal association with disease.
84
Citation17
0
Save
1

proovframe: frameshift-correction for long-read (meta)genomics

Thomas Hackl et al.Oct 24, 2023
+6
A
F
T
Abstract Long-read sequencing technologies hold big promises for the genomic analysis of complex samples such as microbial communities. Yet, despite improving accuracy, basic gene prediction on long-read data is still often impaired by frameshifts resulting from small indels. Consensus polishing using either complementary short reads or to a lesser extent the long reads themselves can mitigate this effect but requires universally high sequencing depth, which is difficult to achieve in complex samples where the majority of community members are rare. Here we present proovframe , a software implementing an alternative approach to overcome frameshift errors in long-read assemblies and raw long reads. We utilize protein-to-nucleotide alignments against reference databases to pinpoint indels in contigs or reads and correct them by deleting or inserting 1-2 bases, thereby conservatively restoring reading-frame fidelity in aligned regions. Using simulated and real-world benchmark data we show that proovframe performs comparably to short-read-based polishing on assembled data, works well with remote protein homologs, and can even be applied to raw reads directly. Together, our results demonstrate that protein-guided frameshift correction significantly improves the analyzability of long-read data both in combination with and as an alternative to common polishing strategies. Proovframe is available from https://github.com/thackl/proovframe .
1

The genetic and ecological landscape of plasmids in the human gut

Michael Yu et al.Oct 24, 2023
A
E
M
Abstract Despite their prevalence and impact on microbial lifestyles, ecological and evolutionary insights into naturally occurring plasmids are far from complete. Here we developed a machine learning model, PlasX, which identified 68,350 non-redundant plasmids across human gut metagenomes, and we organized them into 1,169 evolutionarily cohesive ‘plasmid systems’ using our sequence containment-aware network partitioning algorithm, MobMess. Similar to microbial taxa, individuals from the same country tend to cluster together based on their plasmid diversity. However, we found no correlation between plasmid diversity and bacterial taxonomy. Individual plasmids were often country-specific, yet most plasmid systems spanned across geographically distinct human populations, revealing cargo genes that likely respond to environmental selection. Our study introduces powerful tools to recognize and organize plasmids, uncovers their tremendous diversity and intricate ecological and evolutionary patterns in naturally occurring habitats, and demonstrates that plasmids represent a dimension of ecosystems that is not explained by microbial taxonomy alone.
1
Paper
Citation13
0
Save
151

Unifying the known and unknown microbial coding sequence space

Chiara Vanni et al.Oct 24, 2023
+14
S
M
C
Abstract Genes of unknown function are among the biggest challenges in molecular biology, especially in microbial systems, where 40%-60% of the predicted genes are unknown. Despite previous attempts, systematic approaches to include the unknown fraction into analytical workflows are still lacking. Here, we propose a conceptual framework and a computational workflow that bridge the known-unknown gap in genomes and metagenomes. We showcase our approach by exploring 415,971,742 genes predicted from 1,749 metagenomes and 28,941 bacterial and archaeal genomes. We quantify the extent of the unknown fraction, its diversity, and its relevance across multiple biomes. Furthermore, we provide a collection of 283,874 lineage-specific genes of unknown function for Cand . Patescibacteria, being a significant resource to expand our understanding of their unusual biology. Finally, by identifying a target gene of unknown function for antibiotic resistance, we demonstrate how we can enable the generation of hypotheses that can be used to augment experimental data.
151
Paper
Citation12
0
Save
102

Metagenomics Strain Resolution on Assembly Graphs

Christopher Quince et al.Oct 24, 2023
+7
S
S
C
Abstract We introduce a novel bioinformatics pipeline, STrain Resolution ON assembly Graphs (STRONG), which identifies strains de novo , when multiple metagenome samples from the same community are available. STRONG performs coassembly, followed by binning into metagenome assembled genomes (MAGs), but uniquely it stores the coassembly graph prior to simplification of variants. This enables the subgraphs for individual single-copy core genes (SCGs) in each MAG to be extracted. It can then thread back reads from the samples to compute per sample coverages for the unitigs in these graphs. These graphs and their unitig coverages are then used in a Bayesian algorithm, BayesPaths, that determines the number of strains present, their sequences or haplotypes on the SCGs and their abundances in each of the samples. Our approach both avoids the ambiguities of read mapping and allows more of the information on co-occurrence of variants in reads to be utilised than if variants were treated independently, whilst at the same time exploiting the correlation of variants across samples that occurs when they are linked in the same strain. We compare STRONG to the current state of the art on synthetic communities and demonstrate that we can recover more strains, more accurately, and with a realistic estimate of uncertainty deriving from the variational Bayesian algorithm employed for the strain resolution. On a real anaerobic digestor time series we obtained strain-resolved SCGs for over 300 MAGs that for abundant community members match those observed from long Nanopore reads.
102
Citation10
0
Save
15

AGNOSTOS-DB: a resource to unlock the uncharted regions of the coding sequence space

Chiara Vanni et al.Oct 24, 2023
+4
T
M
C
Abstract Genomes and metagenomes contain a considerable percentage of genes of unknown function, which are often excluded from downstream analyses limiting our understanding of the studied biological systems. To address this challenge, we developed AGNOSTOS, a combined database-computational workflow resource that unifies the known and unknown coding sequence space of genomes and metagenomes. Here, we present AGNOSTOS-DB, an extensive database of high-quality gene clusters enriched with functional, ecological and phylogenetic information. Moreover, AGNOSTOS allows integrating new data into existing AGNOSTOS-DBs, maximizing the information retrievable for the genes of unknown function. As a proof of concept, we provide a seed database that integrates the predicted genes from marine and human metagenomes, as well as from Bacteria, Archaea, Eukarya and giant viruses environmental and cultivar genomes. The seed database comprises 6,572,081 gene clusters connecting 342 million genes and represents a comprehensive and scalable resource for the inclusion and exploration of the unknown fraction of genomes and metagenomes.
15
Paper
Citation8
0
Save
71

Heterotrophic bacterial diazotrophs are more abundant than their cyanobacterial counterparts in metagenomes covering most of the sunlit ocean

Tom Delmont et al.Oct 24, 2023
+6
I
J
T
Abstract Biological nitrogen fixation is a major factor contributing to microbial primary productivity in the open ocean. The current view depicts a few cyanobacterial diazotrophs as the most relevant marine nitrogen fixers, whereas heterotrophic diazotrophs are more diverse and considered to have lower impacts on the nitrogen balance. Here, we used 891 Tara Oceans metagenomes to create a manually curated, non-redundant genomic database corresponding to free-living, as well as filamentous, colony-forming, particle-attached and symbiotic bacterial and archaeal populations occurring in the surface of five oceans and two seas. Notably, the database provided the genomic content of eight cyanobacterial diazotrophs including Trichodesmium populations and a newly discovered population similar to Richelia , as well as 40 heterotrophic bacterial diazotrophs organized into three main functional groups that considerably expand the known diversity of abundant marine nitrogen fixers compared to previous genomic surveys. Critically, these 48 populations may account for more than 90% of cells containing known nifH genes and occurring in the sunlit ocean, suggesting that the genomic characterization of the most abundant marine diazotrophs may be nearing completion. The newly identified heterotrophic bacterial diazotrophs are widespread, express their nifH genes in situ , and co-occur under nitrate-depleted conditions in large size fractions where they might form aggregates providing the low-oxygen microenvironments required for nitrogen fixation. Most significantly, we found heterotrophic bacterial diazotrophs to be more abundant than cyanobacterial diazotrophs in most metagenomes from the open oceans and seas. This large-scale environmental genomic survey emphasizes the considerable potential of heterotrophs in the marine nitrogen balance.
71
Citation6
0
Save
93

Structure-informed microbial population genetics elucidate selective pressures that shape protein evolution

Evan Kiefl et al.Oct 24, 2023
+5
S
Ö
E
Abstract Comprehensive sampling of natural genetic diversity with metagenomics enables highly resolved insights into the interplay between ecology and evolution. However, intra-population genomic variation represents the outcome of both stochastic and selective forces, making it difficult to identify whether variants are maintained by adaptive, neutral, or purifying processes. This is partly due to the reliance on gene sequences to interpret variants, which disregards the physical properties of three-dimensional gene products that define the functional landscape on which selection acts. Here we describe an approach to analyze genetic variation in the context of predicted protein structures, and apply it to study a marine microbial population within the SAR11 subclade 1a.3.V, which dominates low-latitude surface oceans. Our analyses reveal a tight association between the patterns of nonsynonymous polymorphism, selective pressures, and structural properties of proteins such as per-site relative solvent accessibility and distance to ligands, which explain up to 59% of genetic variance in some genes. In glutamine synthetase, a central gene in nitrogen metabolism, we observe decreased occurrence of nonsynonymous variants from ligand binding sites as a function of nitrate concentrations in the environment, revealing genetic targets of distinct evolutionary pressures maintained by nutrient availability. Our data also reveals that rare codons are purified from ligand binding sites when genes are under high selection, demonstrating the utility of structure-aware analyses to study the variants that likely impact translational processes. Overall, our work yields insights into the governing principles of evolution that shape the genetic diversity landscape within a globally abundant population, and makes available a software framework for structure-aware investigations of microbial population genetics. Significance Increasing availability of metagenomes offers new opportunities to study evolution, but the equal treatment of all variants limits insights into drivers of sequence diversity. By capitalizing on recent advances in protein structure prediction capabilities, our study examines subtle evolutionary dynamics of a microbial population that dominates surface oceans through the lens of structural biology. We demonstrate the utility of structure-informed metrics to understand the distribution of nonsynonymous polymorphism, establish insights into the impact of changing nutrient availability on protein evolution, and show that even synonymous variants are scrutinized strictly to maximize translational efficiency when selection is high. Overall, our work illustrates new opportunities for discovery at the intersection between metagenomics and structural bioinformatics, and offers an interactive and scalable software platform to visualize and analyze genetic variants in the context of predicted protein structures and ligand-binding sites.
30

Metapangenomics of the oral microbiome provides insights into habitat adaptation and cultivar diversity

Daniel Utter et al.Oct 24, 2023
+2
A
G
D
Abstract Background The increasing availability of microbial genomes and environmental shotgun metagenomes provides unprecedented access to the genomic differences within related bacteria. The human oral microbiome with its diverse habitats and abundant, relatively well-characterized microbial inhabitants presents an opportunity to investigate bacterial population structures at an ecosystem scale. Results Here, we employ a metapangenomic approach that combines public genomes with Human Microbiome Project (HMP) metagenomes to study the diversity of microbial residents of three oral habitats: tongue dorsum, buccal mucosa, and supragingival plaque. For two exemplar taxa, Haemophilus parainfluenzae and the genus Rothia , metapangenomes revealed distinct genomic groups based on shared genome content. H. parainfluenzae genomes separated into three distinct subgroups with differential abundance between oral habitats. Functional enrichment analyses identified an operon encoding oxaloacetate decarboxylase as diagnostic for the tongue-abundant subgroup. For the genus Rothia , grouping by shared genome content recapitulated species-level taxonomy and habitat preferences. However, while most R. mucilaginosa were restricted to the tongue as expected, two genomes represented a cryptic population of R. mucilaginosa in many buccal mucosa samples. For both H. parainfluenzae and the genus Rothia , we identified not only limitations in the ability of cultivated organisms to represent populations in their native environment, but also specifically which cultivar gene sequences were absent or ubiquitous. Conclusions Our findings provide insights into population structure and biogeography in the mouth and form specific hypotheses about habitat adaptation. These results illustrate the power of combining metagenomes and pangenomes to investigate the ecology and evolution of bacteria across analytical scales.
30
Paper
Citation2
0
Save
0

Wolbachia populations across organs of individual Culex pipiens: highly conserved intra-individual core pangenome with inter-individual polymorphisms

Blandine Trouche et al.Sep 11, 2024
+2
O
H
B
is a maternally inherited intracellular bacterium that infects a wide range of arthropods including mosquitoes. The endosymbiont is widely used in biocontrol strategies due to its capacity to modulate arthropod reproduction and limit pathogen transmission.
0
Citation1
0
Save
Load More