MD
Maude David
Author with expertise in Diversity and Function of Gut Microbiome
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(57% Open Access)
Cited by:
1,126
h-index:
18
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Metagenomic analysis of a permafrost microbial community reveals a rapid response to thaw

Rachel Mackelprang et al.Nov 4, 2011
Permafrost contains an estimated 1672 Pg carbon (C), an amount roughly equivalent to the total currently contained within land plants and the atmosphere. This reservoir of C is vulnerable to decomposition as rising global temperatures cause the permafrost to thaw. During thaw, trapped organic matter may become more accessible for microbial degradation and result in greenhouse gas emissions. Despite recent advances in the use of molecular tools to study permafrost microbial communities, their response to thaw remains unclear. Here we use deep metagenomic sequencing to determine the impact of thaw on microbial phylogenetic and functional genes, and relate these data to measurements of methane emissions. Metagenomics, the direct sequencing of DNA from the environment, allows the examination of whole biochemical pathways and associated processes, as opposed to individual pieces of the metabolic puzzle. Our metagenome analyses reveal that during transition from a frozen to a thawed state there are rapid shifts in many microbial, phylogenetic and functional gene abundances and pathways. After one week of incubation at 5 °C, permafrost metagenomes converge to be more similar to each other than while they are frozen. We find that multiple genes involved in cycling of C and nitrogen shift rapidly during thaw. We also construct the first draft genome from a complex soil metagenome, which corresponds to a novel methanogen. Methane previously accumulated in permafrost is released during thaw and subsequently consumed by methanotrophic bacteria. Together these data point towards the importance of rapid cycling of methane and nitrogen in thawing permafrost.
0
Citation652
0
Save
79

Multi-omic analysis along the gut-brain axis points to a functional architecture of autism

James Morton et al.Feb 26, 2022
Abstract Autism is a highly heritable neurodevelopmental disorder characterized by heterogeneous cognitive, behavioral and communication impairments. Disruption of the gut-brain axis (GBA) has been implicated in autism, with dozens of cross-sectional microbiome and other omic studies revealing autism-specific profiles along the GBA albeit with little agreement in composition or magnitude. To explore the functional architecture of autism, we developed an age and sex-matched Bayesian differential ranking algorithm that identified autism-specific profiles across 10 cross-sectional microbiome datasets and 15 other omic datasets, including dietary patterns, metabolomics, cytokine profiles, and human brain expression profiles. The analysis uncovered a highly significant, functional architecture along the GBA that encapsulated the overall heterogeneity of autism phenotypes. This architecture was determined by autism-specific amino acid, carbohydrate and lipid metabolism profiles predominantly encoded by microbial species in the genera Prevotella, Enterococcus, Bifidobacterium , and Desulfovibrio , and was mirrored in brain-associated gene expression profiles and restrictive dietary patterns in individuals with autism. Pro-inflammatory cytokine profiling and virome association analysis further supported the existence of an autism-specific architecture associated with particular microbial genera. Re-analysis of a longitudinal intervention study in autism recapitulated the cross-sectional profiles, and showed a strong association between temporal changes in microbiome composition and autism symptoms. Further elucidation of the functional architecture of autism, including of the role the microbiome plays in it, will require deep, multi-omic longitudinal intervention studies on well-defined stratified cohorts to support causal and mechanistic inference.
79
Citation6
0
Save
1

Topic modeling for multi-omic integration in the human gut microbiome and implications for Autism

Christine Tataru et al.Oct 3, 2022
Abstract While healthy gut microbiomes are critical to human health, pertinent microbial processes remain largely undefined, partially due to differential bias among profiling techniques. By simultaneously integrating multiple profiling methods, multi-omic analysis can define generalizable microbial pro-cesses, and is especially useful in understanding complex conditions such as Autism. Challenges with integrating heterogeneous data produced by multiple profiling methods can be overcome using Latent Dirichlet Allocation (LDA), a promising natural language processing technique that identifies topics in heterogeneous documents. In this study, we apply LDA to multi-omic microbial data (16S rRNA amplicon, shotgun metagenomic, shotgun metatranscriptomic, and untargeted metabolomic profiling) from the stool of 81 children with and without Autism. We identify topics, or microbial processes, that summarize complex phenomena occurring within gut microbial communities. We then subset stool samples by topic distribution, and identify metabolites, specifically neurotransmitter precursors and fatty acid derivatives, that differ significantly between children with and without Autism. We identify clusters of topics, deemed “cross-omic topics”, which we hypothesize are representative of generalizable microbial processes observable regardless of profiling method. Interpreting topics, we find each represents a particular diet, and we heuristically label each cross-omic topic as: healthy/general function, age-associated function, transcriptional regulation, and opportunistic pathogenesis.
1
Citation1
0
Save
0

Crowdsourced study of children with autism and their typically developing siblings identifies differences in taxonomic and predicted function for stool-associated microbes using exact sequence variant analysis.

Maude David et al.May 10, 2018
The existence of a link between the gut microbiome and autism spectrum disorder (ASD) is well established in mice, but in human populations efforts to identify microbial biomarkers have been limited due to problems stratifying participants within the broad phenotype of ASD and a lack of appropriately matched controls. To overcome these limitations and investigate the relationship between ASD and the gut microbiome, we ran a crowdsourced study of families 2-7 year old sibling pairs, where one child of the pair had a diagnosis of ASD and the other child did not. Methods: Parents of age-matched sibling pairs electronically consented and completed study procedures via a secure web portal (microbiome.stanford.edu). Parents collected stool samples from each child, responded to behavioral questionnaires about the ASD child's typical behavior, and whenever possible provided a home video of their ASD child's natural social behavior. We performed DNA extraction and 16S rRNA amplicon sequencing on 117 stool samples (60 ASD and 57 NT) that met all study design eligibility criteria,. Using DADA2, Exact Sequence Variants (ESVs) were identified as taxonomic units, and three statistical tests were performed on ESV abundance counts: (1) permutation test to determine differences between sibling pairs, (2) differential abundance test using a zero-inflated gaussian mixture model to account for the sparse abundance matrix, and (3) differential abundance test after modeling under a negative binomial distribution. The potential functional gene abundance for each sample was also inferred from the 16S rRNA data, providing KEGG Ortholog (KO), which were analyzed for differential abundance. Results: In total, 21 ESVs had significantly differentially proportions in stool of children with ASD and their neurotypical siblings. Of these 21 ESVs, 11 were enriched in neurotypical children and ten were enriched in children with ASD. ESVs enriched in the ASD cohort were predominantly associated with Ruminococcaceae and Bacteroidaceae; while those enriched in controls were more diverse including taxa associated with Bifidobacterium, Porphyromonas, Slackia, Desulfovibrio, Acinetobacter johnsonii, and Lachnospiraceae. Exact Variant Analysis suggested that Lachnospiraceae was specific to the control cohort, while Ruminococcaceae, Tissierellaceae and Bacteroidaceae were significantly enriched in children with ASD. Metabolic gene predictions determined that while both cohorts harbor the butyrogenic pathway, the ASD cohort was more likely to use the 4-aminobutanoate (4Ab) pathway, while the control cohort was more likely to use the pyruvate pathway. The 4Ab pathway releases harmful by-products like ammonia and can shunt glutamate, affecting its availability as an excitatory neurotransmitter. Finally, we observed differences in the carbohydrate uptake capabilities of various ESVs identified between the two cohorts.
0

Decoding the Language of Microbiomes: Leveraging Patterns in 16S Public Data using Word-Embedding Techniques and Applications in Inflammatory Bowel Disease

Christine Tataru et al.Sep 5, 2019
Microbiomes are complex ecological systems that play crucial roles in understanding natural phenomena from human disease to climate change. Especially in human gut microbiome studies, where collecting clinical samples can be arduous, the number of taxa considered in any one study often exceeds the number of samples ten to one hundred-fold. This discrepancy decreases the power of studies to identify meaningful differences between samples, increases the likelihood of false positive results, and subsequently limits reproducibility. Despite the vast collections of microbiome data already available, biome-specific patterns of microbial structure are not currently leveraged to inform studies. Instead, most microbiome survey studies focus on differential abundance testing per taxa in pursuit of specific biomarkers for a given phenotype. This methodology assumes differences in individual species, genera, or families can be used to distinguish between microbial communities and ignores community-level response. In this paper, we propose to leverage public microbiome databases to shift the analysis paradigm from a focus on taxonomic counts to a focus on comprehensive properties that more completely characterize microbial community members’ function and environmental relationships. We learn these properties by applying an embedding algorithm to quantify taxa co-occurrence patterns in over 18,000 samples from the American Gut Project (AGP) microbiome crowdsourcing effort. The resulting set of embeddings transforms human gut microbiome data from thousands of taxa counts to a latent variable landscape of only one hundred “properties”, or contextual relationships. We then compare the predictive power of models trained using properties, normalized taxonomic count data, and another commonly used dimensionality reduction method, Principal Component Analysis in categorizing samples from individuals with inflammatory bowel disease (IBD) and healthy controls. We show that predictive models trained using property data are the most accurate, robust, and generalizable, and that property-based models can be trained on one dataset and deployed on another with positive results. Furthermore, we find that these properties can be interpreted in the context of current knowledge; properties correlate significantly with known metabolic pathways, and distances between taxa in “property space” roughly correlate with their phylogenetic distances. Using these properties, we are able to extract known and new bacterial metabolic pathways associated with inflammatory bowel disease across two completely independent studies.More broadly, this paper explores a reframing of the microbiome analysis mindset, from taxonomic counts to comprehensive community-level properties. By providing a set of pre-trained embeddings, we allow any V4 16S amplicon study to leverage and apply the publicly informed properties presented to increase the statistical power, reproducibility, and generalizability of analysis.
5

Learning a deep language model for microbiomes: the power of large scale unlabeled microbiome data

Quintin Pope et al.Jul 17, 2023
Abstract We use open source human gut microbiome data to learn a microbial “language” model by adapting techniques from Natural Language Processing (NLP). Our microbial “language” model is trained in a self-supervised fashion (i.e., without additional external labels) to capture the interactions among different microbial species and the common compositional patterns in microbial communities. The learned model produces contextualized taxa representations that allow a single bacteria species to be represented differently according to the specific microbial environment it appears in. The model further provides a sample representation by collectively interpreting different bacteria species in the sample and their interactions as a whole. We show that, compared to baseline representations, our sample representation consistently leads to improved performance for multiple prediction tasks including predicting Irritable Bowel Disease (IBD) and diet patterns. Coupled with a simple ensemble strategy, it produces a highly robust IBD prediction model that generalizes well to microbiome data independently collected from different populations with substantial distribution shift. We visualize the contextualized taxa representations and find that they exhibit meaningful phylum-level structure, despite never exposing the model to such a signal. Finally, we apply an interpretation method to highlight bacterial species that are particularly influential in driving our model’s predictions for IBD. Author summary Human microbiomes and their interactions with various body systems have been linked to a wide range of diseases and lifestyle variables. To understand these links, citizen science projects such as the American Gut Project (AGP) have provided large open-source datasets for microbiome investigation. In this work we leverage such open-source data and learn a “language” model for human gut microbiomes using techniques derived from natural language processing. We train the “language” model to capture the interactions among different microbial species and the common compositional patterns that shape gut microbiome communities. By considering the entirety of species within a sample and their interactions, our model produces a representation that enables contextualized interpretation of individual bacterial species within their microbial environment. We demonstrate that our sample representation enhances prediction performance compared to baseline methods across multiple microbiome tasks including prediction of Irritable Bowel Disease (IBD) and diet patterns. Furthermore, our learned representation yields a robust IBD prediction model that generalizes well to independent data collected from different populations. To gain insight into our model’s workings, we present interpretation results that showcase its ability to learn biologically meaningful representations.