LS
Lars Snipen
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
404
h-index:
32
/
i10-index:
57
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Evolution of the immune system influences speciation rates in teleost fishes

Martin Malmstrøm et al.Aug 22, 2016
Kjetill S. Jakobsen, Sissel Jentoft and colleagues assemble partial draft genomes and analyze sequences from 66 teleost fish species to determine major histocompatibility complex (MHC) class I and class II gene status. They find that MHC II is absent from the Gadiformes lineage, while MHC I gene expansions have occurred multiple times. Teleost fishes constitute the most species-rich vertebrate clade and exhibit extensive genetic and phenotypic variation, including diverse immune defense strategies. The genomic basis of a particularly aberrant strategy is exemplified by Atlantic cod, in which a loss of major histocompatibility complex (MHC) II functionality coincides with a marked expansion of MHC I genes. Through low-coverage genome sequencing (9–39×), assembly and comparative analyses for 66 teleost species, we show here that MHC II is missing in the entire Gadiformes lineage and thus was lost once in their common ancestor. In contrast, we find that MHC I gene expansions have occurred multiple times, both inside and outside this clade. Moreover, we identify an association between high MHC I copy number and elevated speciation rates using trait-dependent diversification models. Our results extend current understanding of the plasticity of the adaptive immune system and suggest an important role for immune-related genes in animal diversification.
0
Citation218
0
Save
0

HumGut: A comprehensive Human Gut prokaryotic genomes collection filtered by metagenome data

Pranvera Hiseni et al.Mar 25, 2020
A major challenge with human gut microbiome studies is the lack of a publicly accessible human gut genome collection that is verifiably complete. We aimed to create Humgut, a comprehensive collection of healthy human gut prokaryotic genomes, to be used as a reference for worldwide human gut microbiome studies. We screened >2,300 healthy human gut metagenomes for the containment of >486,000 publicly available prokaryotic genomes. The contained genomes were then scored, ranked, and clustered based on their sequence identity, only to keep representative genomes per cluster, resulting thus in the creation of HumGut. Superior performance in the taxonomic assignment of metagenomic reads, classifying 97% of reads on average, is a benchmark advantage of HumGut. Re-analyses of healthy gut samples using HumGut revealed that >90% contained a core set of 129 bacterial species and that, on average, the guts of healthy people contain around 1,000 bacterial species. The HumGut collection will continuously be updated as the list of publicly available genomes and metagenomes expand. Our approach can also be extended to disease-associated genomes and metagenomes, in addition to other species. The comprehensive, yet slim HumGut database streamlines analyses while significantly improving taxonomic assignments in a field in dire need of method standardization and effectivity.
1

A Targeted Reference Database for Improved Analysis of Environmental 16S rRNA Oxford Nanopore Sequencing Data

Melcy Philip et al.Oct 3, 2024
The Oxford Nanopore Technologies (ONT) sequencing platform is compact and efficient, making it suitable for rapid biodiversity assessments in remote areas. Despite its long reads, ONT has a higher error rate compared to other platforms, necessitating high-quality reference databases for accurate taxonomic assignments. However, the absence of targeted databases for underexplored habitats, such as the seafloor, limits ONT's broader applicability for exploratory analysis. To address this, we have developed a strategy to build environmentally-targeted databases to enhance 16S rRNA gene(16S) analysis using ONT. We start by using Illumina short-read data to create a database of full-length or near full-length 16S sequences from seafloor samples. Initially, amplicons are mapped to the SILVA database, with matches added to our database. Unmatched amplicons are reconstructed using METASEED and Barrnap methodologies with amplicon and metagenome data. Finally, if the previous strategies did not succeed, we included the short-read sequences in the database. This resulted in AQUAeD-DB, which contains 14 545 16S sequences clustered at 95% identity. Comparative database analysis and relative abundance correlation studies reveal that AQUAeD-DB provides consistent results for both Illumina and Nanopore read assignments (median correlation coefficient: 0.50), whereas a standard database showed a substantially weaker correlation. These findings also emphasis its potential to recognize both high and low-abundance taxa, which could be key indicators in environmental studies. This work highlights the necessity of targeted databases for environmental analysis, especially for ONT-based studies, and lays foundations for future extension of the database.
6

Standardising a microbiome pipeline for body fluid identification from complex crime scene stains

Meghna Swayambhu et al.Aug 7, 2024
Abstract Background Recent advances in next-generation sequencing have opened up new possibilities for utilizing the human microbiome in various fields, including forensics. Researchers have capitalized on the site-specific microbial communities found in different parts of the body to identify body fluids from biological evidence. Despite promising results, microbiome-based methods have not yet been fully integrated into forensic practice due to the lack of standardized protocols and systematic testing of methods on forensically relevant samples. Our study addresses critical decisions in establishing these protocols, focusing on bioinformatics choices and the use of machine learning to present microbiome results in court for forensically relevant and challenging samples. Results We propose using Operational Taxonomic Units (OTUs) for read data processing and creating heterogeneous training datasets for training a random forest classifier. Our classifier incorporates six forensically relevant classes: saliva, semen, hand skin, penile skin, urine, and vaginal/menstrual fluid. Across these classes, our classifier achieved a high weighted average F1 score of 0.89. Systematic testing on mixed-source samples and underwear revealed reliable detection of at least one component of the mixture and the identification of vaginal fluid from underwear substrates. Additionally, when investigating the sexually shared microbiome (sexome) of heterosexual couples, our classifier shows promising results for the inference of sexual activity. Conclusion In our study, we recommend the use of a novel random forest classifier trained on a heterogenous dataset for obtaining predictions from samples mimicking forensic evidence. We also highlight the potential of the sexome for assessing the nature of sexual activities in forensic investigations, while delineating areas that warrant further research. Furthermore, we underscore key considerations when presenting machine learning results for classifying mixed-source samples.
6
3.3
6
Save
0

Transcriptional profiling elucidates biofilm functionality in the dynamic environment of an enhanced biological phosphorus removal reactor

Didrik Villard et al.Sep 17, 2024
ABSTRACT Recently, biofilms, complex and dynamic structures of microorganisms, have been applied to enhanced biological phosphorus removal (EBPR), a wastewater treatment configuration dependent on cyclic shifts between anaerobic and aerobic conditions. In this study, comparative metagenomics and metatranscriptomics were performed on biofilms collected from seven sites of a moving-bed-biofilm-reactor-based EBPR process. The aim was to examine the functional ecology of phosphorus-accumulating biofilms throughout a single EBPR cycle. Taxonomic profiling revealed high microbial diversity, stable throughout the EBPR cycle. The dominant phosphorus-accumulating organisms (PAOs) were identified as Candidatus accumulibacter, Candidatus phosphoribacter, and Candidatus lutibacillus. However, these did not show the highest transcriptional activities. Propionivibrio, a potential glycogen-accumulating organism, was the most transcriptionally active. Comparative analysis of biofilms from different EBPR stages showed a progressive change in metatranscriptome composition, correlating with nutrient removal. Analysis of differentially expressed genes in abundant PAOs revealed key genes associated with the uptake of phosphorus, degradation of glycogen, biosynthesis of polyhydroxyalkanoates, and acetate production. In conclusion, this study reveals that biofilms possess the capability to adapt to environmental fluctuations primarily through alterations in microbial gene expression activity and subsequent metabolic modulation, and dominant taxa may not necessarily exhibit the highest transcriptional activity in complex microbial communities.