AS
Andreas Sjödin
Author with expertise in Marine Microbial Diversity and Biogeography
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(50% Open Access)
Cited by:
489
h-index:
34
/
i10-index:
60
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Community-led, integrated, reproducible multi-omics with anvi’o

A. Eren et al.Dec 21, 2020
+31
A
E
A
Big data abound in microbiology, but the workflows designed to enable researchers to interpret data can constrain the biological questions that can be asked. Five years after anvi’o was first published, this community-led multi-omics platform is maturing into an open software ecosystem that reduces constraints in ‘omics data analyses.
0
Paper
Citation488
0
Save
1

Genomic characterization of Francisella tularensis and other diverse Francisella species from complex samples

David Wagner et al.Aug 7, 2022
+12
R
D
D
Abstract Francisella tularensis , the bacterium that causes the zoonosis tularemia, and its genetic near neighbor species, can be difficult or impossible to cultivate from complex samples. Thus, there is a lack of genomic information for these species that has, among other things, limited the development of robust detection assays for F. tularensis that are both specific and sensitive. The objective of this study was to develop and validate approaches to capture, enrich, sequence, and analyze Francisella DNA present in DNA extracts generated from complex samples. RNA capture probes were designed based upon the known pan genome of F. tularensis and other diverse species in the family Francisellaceae . Probes that targeted genomic regions also present in non- Francisellaceae species were excluded, and probes specific to particular Francisella species or phylogenetic clades were identified. The capture-enrichment system was then applied to diverse, complex DNA extracts containing low-level Francisella DNA, including human clinical tularemia samples, environmental samples ( i.e. , animal tissue and air filters), and whole ticks/tick cell lines, which was followed by sequencing of the enriched samples. Analysis of the resulting data facilitated rigorous and unambiguous confirmation of the detection of F. tularensis or other Francisella species in complex samples, identification of mixtures of different Francisella species in the same sample, analysis of gene content ( e.g. , known virulence and antimicrobial resistance loci), and high-resolution whole genome-based genotyping. The benefits of this capture-enrichment system include: even very low target DNA can be amplified; it is culture-independent, reducing exposure for research and/or clinical personnel and allowing genomic information to be obtained from samples that do not yield isolates; and the resulting comprehensive data not only provide robust means to confirm the presence of a target species in a sample, but also can provide data useful for source attribution, which is important from a genomic epidemiology perspective.
1
Citation1
0
Save
0

Bioconda: A sustainable and comprehensive software distribution for the life sciences

Björn Grüning et al.Oct 21, 2017
+157
M
A
B
We present Bioconda (https://bioconda.github.io), a distribution of bioinformatics software for the lightweight, multi-platform and language-agnostic package manager Conda. Currently, Bioconda offers a collection of over 3000 software packages, which is continuously maintained, updated, and extended by a growing global community of more than 200 contributors. Bioconda improves analysis reproducibility by allowing users to define isolated environments with defined software versions, all of which are easily installed and managed without administrative privileges.
0

doepipeline: a systematic approach to optimizing multi-level and multi-step data processing workflows

Daniel Svensson et al.Dec 21, 2018
+2
D
R
D
Background Selecting the proper parameter settings for bioinformatic software tools is challenging. Not only will each parameter have an individual effect on the outcome, but there are also potential interaction effects between parameters. Both of these effects may be difficult to predict. To make the situation even more complex, multiple tools may be run in a sequential pipeline where the final output depends on the parameter configuration for each tool in the pipeline. Because of the complexity and difficulty of predicting outcomes, in practice parameters are often left at default settings or set based on personal or peer experience obtained in a trial and error fashion. To allow for the reliable and efficient selection of parameters for bioinformatic pipelines, a systematic approach is needed.Results We present doepipeline , a novel approach to optimizing bioinformatic software parameters, based on core concepts of the Design of Experiments methodology and recent advances in subset designs. Optimal parameter settings are first approximated in a screening phase using a subset design that efficiently spans the entire search space, then optimized in the subsequent phase using response surface designs and OLS modeling. doepipeline was used to optimize parameters in four use cases; 1) de-novo assembly, 2) scaffolding of a fragmented genome assembly, 3) k-mer taxonomic classification of Oxford Nanopore Technologies MinION reads, and 4) genetic variant calling. In all four cases, doepipeline found parameter settings that produced a better outcome with respect to the characteristic measured when compared to using default values. Our approach is implemented and available in the Python package doepipeline .Conclusions Our proposed methodology provides a systematic and robust framework for optimizing software parameter settings, in contrast to labor- and time-intensive manual parameter tweaking. Implementation in doepipeline makes our methodology accessible and user-friendly, and allows for automatic optimization of tools in a wide range of cases. The source code of doepipeline is available at and it can be installed through conda-forge.
0

Airborne eDNA captures three decades of ecosystem biodiversity

Alexis Sullivan et al.Dec 11, 2023
+16
E
H
A
Abstract Conserving biodiversity is a global imperative, yet our capacity to quantify and understand species occurrences has been limited. To help address this challenge, we develop a novel monitoring approach based on deep sequencing of airborne eDNA. When applied to a 34-year archive of weekly filters from an aerosol sampling station in northern Sweden, our methods enabled robust detection of over 2,700 genera across all domains of life and estimates of eDNA catchment areas. Reconstructed time series revealed regional biodiversity declines consistent with contemporary, large-scale transformations of forest composition and structure. Our results show airborne eDNA can reliably monitor biodiversity and underscore the immense latent potential in the thousands of aerosol monitoring stations deployed worldwide. One-Sentence Summary DNA captured from air reveals organisms from all domains of life and their long-term trends.
0

A whole-genome sequenced control population in northern Sweden reveals subregional genetic differences.

Daniel Svensson et al.Feb 19, 2020
+7
A
M
D
The number of national reference populations that are whole-genome sequenced are rapidly increasing. Partly driving this development is the fact that genetic disease studies benefit from knowing the genetic variation typical for the geographical area of interest. A whole-genome sequenced Swedish national reference population (n=1000) has been recently published but with few samples from northern Sweden. In the present study we have whole-genome sequenced a control population (n=300) (ACpop) from Västerbotten County, a sparsely populated region in northern Sweden previously shown to be genetically different from southern Sweden. The aggregated variant frequencies within ACpop are publicly available (DOI 10.17044/NBIS/G000005) to function as a basic resource in clinical genetics and for genetic studies. Our analysis of ACpop, representing approximately 0.11% of the population in Västerbotten, indicates the presence of a genetic substructure within the county. Furthermore, a demographic analysis showed that the population from which samples were drawn was to a large extent geographically stationary, a finding that was corroborated in the genetic analysis down to the level of municipalities. Including ACpop in the reference population when imputing unknown variants in a Västerbotten cohort resulted in a strong increase in the number of high-confidence imputed variants (up to 81% for variants with minor allele frequency < 5%). ACpop was initially designed for cancer disease studies, but the genetic structure within the cohort will be of general interest for all genetic disease studies in northern Sweden.