AC
Anna Carrieri
Author with expertise in Diversity and Function of Gut Microbiome
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(88% Open Access)
Cited by:
22
h-index:
14
/
i10-index:
17
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
25

Multi-omics profiling of Earth’s biomes reveals patterns of diversity and co-occurrence in microbial and metabolite composition across environments

Justin Shaffer et al.Jun 6, 2021
+49
L
L
J
ABSTRACT As our understanding of the structure and diversity of the microbial world grows, interpreting its function is of critical interest for understanding and managing the many systems microbes influence. Despite advances in sequencing, lack of standardization challenges comparisons among studies that could provide insight into the structure and function of microbial communities across multiple habitats on a planetary scale. Technical variation among distinct studies without proper standardization of approaches prevents robust meta-analysis. Here, we present a multi-omics, meta-analysis of a novel, diverse set of microbial community samples collected for the Earth Microbiome Project. We include amplicon (16S, 18S, ITS) and shotgun metagenomic sequence data, and untargeted metabolomics data (liquid chromatography-tandem mass spectrometry and gas chromatography mass spectrometry), centering our description on relationships and co-occurrences of microbially-related metabolites and microbial taxa across environments. Standardized protocols and analytical methods for characterizing microbial communities, including assessment of molecular diversity using untargeted metabolomics, facilitate identification of shared microbial and metabolite features, permitting us to explore diversity at extraordinary scale. In addition to a reference database for metagenomic and metabolomic data, we provide a framework for incorporating additional studies, enabling the expansion of existing knowledge in the form of a community resource that will become more valuable with time. To provide examples of applying this database, we outline important ecological questions that can be addressed, and test the hypotheses that every microbe and metabolite is everywhere, but the environment selects. Our results show that metabolite diversity exhibits turnover and nestedness related to both microbial communities and the environment. The relative abundances of microbially-related metabolites vary and co-occur with specific microbial consortia in a habitat-specific manner, and highlight the power of certain chemistry – in particular terpenoids – in distinguishing Earth’s environments.
25
Citation7
0
Save
46

EMPress enables tree-guided, interactive, and exploratory analyses of multi-omic datasets

Kalen Cantrell et al.Oct 8, 2020
+26
G
M
K
Abstract Standard workflows for analyzing microbiomes often include the creation and curation of phylogenetic trees. Here we present EMPress, an interactive tool for visualizing trees in the context of microbiome, metabolome, etc. community data scalable beyond modern large datasets like the Earth Microbiome Project. EMPress provides novel functionality—including ordination integration and animations—alongside many standard tree visualization features, and thus simplifies exploratory analyses of many forms of ‘omic data.
46
Citation7
0
Save
40

Challenges in Benchmarking Metagenomic Profilers

Zheng Sun et al.Nov 16, 2020
+8
M
S
Z
Accurate microbial identification and abundance estimation are crucial for metagenomics analysis. Various methods for classifying metagenomic data and estimating taxonomic profiles, broadly referred to as metagenomic profilers, have been developed. Yet, benchmarking metagenomic profilers remains challenging because some tools are designed to report relative sequence abundance while others report relative taxonomic abundance. Here, we show how misleading conclusions can be drawn by neglecting this distinction between relative abundance types when benchmarking metagenomic profilers. Moreover, we show compelling evidence that interchanging sequence abundance and taxonomic abundance will influence both per-sample summary statistics and cross-sample comparisons. We suggest that the microbiome research community should pay attention to potentially misleading biological conclusions arising from this issue when benchmarking metagenomic profilers, by carefully considering the type of abundance data that was analyzed and interpreted, and clearly stating the strategy used for metagenomic profiling.
40
Citation4
0
Save
8

Explainable AI reveals changes in skin microbiome composition linked to phenotypic differences

Anna Carrieri et al.Jul 3, 2020
+15
S
N
A
Abstract Alterations in the human microbiome have been observed in a variety of conditions such has asthma, gingivitis, dermatitis and cancer, and much remains to be learned about the links between the microbiome and human health. The fusion of artificial intelligence with rich microbiome datasets can offer an improved understanding of the microbiome’s role in our health. To gain actionable insights it is essential to consider both the predictive power and the transparency of the models by providing explanations for the predictions. We combine the effort of collecting a corpus of leg skin microbiome samples of two healthy cohorts of women with the development of an explainable artificial intelligence (EAI) approach that provides accurate predictions of phenotypes and explanations. The explanations are expressed in terms of variations in the abundance of key microbes that drive the predictions. We predict skin hydration, subject’s age, pre/post-menopausal status and smoking status from the leg skin microbiome. The key changes in microbial composition linked to skin hydration can accelerate the development of personalised treatments for healthy skin, while those associated with age may offer insights into the skin aging process. The leg microbiome signatures associated with smoking and menopausal status are consistent with previous findings from oral/respiratory tract microbiomes and vaginal microbiomes respectively. This suggests that easily accessible microbiome samples could be used to investigate health-related phenotypes, offering potential for non-invasive diagnosis and condition monitoring. Our EAI approach sets the stage for new work focused on understanding the complex relationships between microbial communities and phenotypes. Our approach can be applied to predict any conditions from microbiome samples and has the potential to accelerate the development of microbiome-based personalised therapeutics and non-invasive diagnostics.
8
Citation4
0
Save
25

Interpreting machine learning models to investigate circadian regulation and facilitate exploration of clock function

Laura‐Jayne Gardiner et al.Feb 6, 2021
+7
J
R
L
Abstract The circadian clock is an important adaptation to life on earth. Here, we use machine learning to predict complex temporal circadian gene expression patterns in Arabidopsis . Most significantly, we classify circadian genes using DNA sequence features generated from public genomic resources, with no experimental work or prior knowledge needed. We use model explanation to rank DNA sequence features, observing transcript-specific combinations of potential circadian regulatory elements that discriminate temporal phase of expression. Model interpretation/explanation provides the backbone of our methodological advances, giving insight into biological processes and experimental design. Next, we use model interpretation to optimize sampling strategies when we predict circadian transcripts using reduced numbers of transcriptomic timepoints, saving both time and money. Finally, we predict the circadian time from a single transcriptomic timepoint, deriving novel marker transcripts that are most impactful for accurate prediction, this could facilitate the identification of altered clock function from existing datasets.
25
0
Save
0

Streaming histogram sketching for rapid microbiome analytics

Will Rowe et al.Sep 4, 2018
+7
C
A
W
Motivation: The growth in publically available microbiome data in recent years has yielded an invaluable resource for genomic research; allowing for the design of new studies, augmentation of novel datasets and reanalysis of published works. This vast amount of microbiome data, as well as the widespread proliferation of microbiome research and the looming era of clinical metagenomics, means there is an urgent need to develop analytics that can process huge amounts of data in a short amount of time. To address this need, we propose a new method for the compact representation of microbiome sequencing data using similarity-preserving sketches of streaming k-mer spectra. These sketches allow for dissimilarity estimation, rapid microbiome catalogue searching, and classification of microbiome samples in near real-time. Results: We apply streaming histogram sketching to microbiome samples as a form of dimensionality reduction, creating a compressed "histosketch" that can be used to efficiently represent microbiome k-mer spectra. Using public microbiome datasets, we show that histosketches can be clustered by sample type using pairwise Jaccard similarity estimation, consequently allowing for rapid microbiome similarity searches via a locality sensitive hashing indexing scheme. Furthermore, we show that histosketches can be used to train machine learning classifiers to accurately label microbiome samples. Specifically, using a collection of 108 novel microbiome samples from a cohort of premature neonates, we trained and tested a Random Forest Classifier that could accurately predict whether the neonate had received antibiotic treatment (95% accuracy, precision 97%) and could subsequently be used to classify microbiome data streams in less than 12 seconds. We provide our implementation, Histosketching Using Little K-mers (HULK), which can histosketch a typical 2GB microbiome in 50 seconds on a standard laptop using 4 cores, with the sketch occupying 3000 bytes of disk space. Availability: Our implementation (HULK) is written in Go and is available at: https://github.com/will-rowe/hulk (MIT License).
1

Bacterial metatranscriptomes in wastewater can differentiate virally infected human populations

Rodolfo Salido et al.Feb 24, 2022
+20
H
K
R
Abstract Monitoring wastewater samples at building-level resolution screens large populations for SARS-CoV-2, prioritizing testing and isolation efforts. Here we perform untargeted metatranscriptomics on virally-enriched wastewater samples from 10 locations on the UC San Diego campus, demonstrating that resulting bacterial taxonomic and functional profiles discriminate SARS-CoV-2 status even without direct detection of viral transcripts. Our proof-of-principle reveals emergent threats through changes in the human microbiome, suggesting new approaches for untargeted wastewater-based epidemiology.
5

Detecting anomalous content in dairy with whole metagenome sequencing

Niina Haiminen et al.Aug 17, 2022
+7
A
A
N
The increasing knowledge of microbial ecology in food products relating to quality and safety and the established usefulness of machine learning algorithms for anomaly detection in multiple scenarios suggests that the application of microbiome data in food production systems for anomaly detection could be a valuable approach to be used in food systems. These methods could be used to identify ingredients that deviate from their typical microbial composition, which could indicate food fraud or safety issues. The objective of this study was to assess the feasibility of using shotgun sequencing data as input into anomaly detection algorithms using fluid milk as a model system. Contrastive PCA, cluster-based methods, and explainable AI were evaluated for the detection of two anomalous sample classes using longitudinal metagenomic profiling of fluid milk compared to baseline samples collected under comparable circumstances. Traditional methods (alpha and beta diversity, clustering-based contrastive PCA, MDS, and dendrograms) failed to differentiate anomalous sample classes; however, explainable AI was able to classify anomalous vs. baseline samples and indicate microbial drivers in association with antibiotic use. We validated the potential for explainable AI to classify different milk sources using larger publicly available fluid milk 16s rDNA sequencing datasets and demonstrated that explainable AI is able to differentiate between milk storage methods, processing stage, and season. Our results indicate the application of artificial intelligence continues to hold promise in the realm of microbiome data analysis and could present further opportunities for downstream analytic automation to aid in food safety and quality.