OS
Oliver Stegle
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
European Molecular Biology Laboratory, German Cancer Research Center, Heidelberg University
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
85
(47% Open Access)
Cited by:
651
h-index:
92
/
i10-index:
194
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
64

Swarm Learning for decentralized and confidential clinical machine learning

Stefanie Warnat-Herresthal et al.May 26, 2021
+176
K
H
S
Abstract Fast and reliable detection of patients with severe and heterogeneous illnesses is a major goal of precision medicine 1,2 . Patients with leukaemia can be identified using machine learning on the basis of their blood transcriptomes 3 . However, there is an increasing divide between what is technically possible and what is allowed, because of privacy legislation 4,5 . Here, to facilitate the integration of any medical data from any data owner worldwide without violating privacy laws, we introduce Swarm Learning—a decentralized machine-learning approach that unites edge computing, blockchain-based peer-to-peer networking and coordination while maintaining confidentiality without the need for a central coordinator, thereby going beyond federated learning. To illustrate the feasibility of using Swarm Learning to develop disease classifiers using distributed data, we chose four use cases of heterogeneous diseases (COVID-19, tuberculosis, leukaemia and lung pathologies). With more than 16,400 blood transcriptomes derived from 127 clinical studies with non-uniform distributions of cases and controls and substantial study biases, as well as more than 95,000 chest X-ray images, we show that Swarm Learning classifiers outperform those developed at individual sites. In addition, Swarm Learning completely fulfils local confidentiality regulations by design. We believe that this approach will notably accelerate the introduction of precision medicine.
3

A spatially resolved atlas of the human lung characterizes a gland-associated immune niche

Elo Madissoon et al.Jan 26, 2024
+37
V
A
E
Single-cell transcriptomics has allowed unprecedented resolution of cell types/states in the human lung, but their spatial context is less well defined. To (re)define tissue architecture of lung and airways, we profiled five proximal-to-distal locations of healthy human lungs in depth using multi-omic single cell/nuclei and spatial transcriptomics (queryable at lungcellatlas.org ). Using computational data integration and analysis, we extend beyond the suspension cell paradigm and discover macro and micro-anatomical tissue compartments including previously unannotated cell types in the epithelial, vascular, stromal and nerve bundle micro-environments. We identify and implicate peribronchial fibroblasts in lung disease. Importantly, we discover and validate a survival niche for IgA plasma cells in the airway submucosal glands (SMG). We show that gland epithelial cells recruit B cells and IgA plasma cells, and promote longevity and antibody secretion locally through expression of CCL28, APRIL and IL-6. This new 'gland-associated immune niche' has implications for respiratory health.
3
Paper
4.0
Citation52
2
Save
141

A spatial multi-omics atlas of the human lung reveals a novel immune cell survival niche

Elo Madissoon et al.Oct 13, 2023
+28
V
A
E
Summary Multiple distinct cell types of the human lung and airways have been defined by single cell RNA sequencing (scRNAseq). Here we present a multi-omics spatial lung atlas to define novel cell types which we map back into the macro- and micro-anatomical tissue context to define functional tissue microenvironments. Firstly, we have generated single cell and nuclei RNA sequencing, VDJ-sequencing and Visium Spatial Transcriptomics data sets from 5 different locations of the human lung and airways. Secondly, we define additional cell types/states, as well as spatially map novel and known human airway cell types, such as adult lung chondrocytes, submucosal gland (SMG) duct cells, distinct pericyte and smooth muscle subtypes, immune-recruiting fibroblasts, peribronchial and perichondrial fibroblasts, peripheral nerve associated fibroblasts and Schwann cells. Finally, we define a survival niche for IgA-secreting plasma cells at the SMG, comprising the newly defined epithelial SMG-Duct cells, and B and T lineage immune cells. Using our transcriptomic data for cell-cell interaction analysis, we propose a signalling circuit that establishes and supports this niche. Overall, we provide a transcriptional and spatial lung atlas with multiple novel cell types that allows for the study of specific tissue microenvironments such as the newly defined gland-associated lymphoid niche (GALN).
141
Citation29
0
Save
16

SpatialDE2: Fast and localized variance component analysis of spatial transcriptomics

Ilia Kats et al.Oct 24, 2023
O
R
I
Abstract Spatial transcriptomics is now a mature technology, allowing to assay gene expression changes in the histological context of complex tissues. A canonical analysis workflow starts with the identification of tissue zones that share similar expression profiles, followed by the detection of highly variable or spatially variable genes. Rapid increases in the scale and complexity of spatial transcriptomic datasets demand that these analysis steps are conducted in a consistent and integrated manner, a requirement that is not met by current methods. To address this, we here present SpatialDE2, which unifies the mapping of tissue zones and spatial variable gene detection as integrated software framework, while at the same time advancing current algorithms for both of these steps. Formulated in a Bayesian framework, the model accounts for the Poisson count noise, while simultaneously offering superior computational speed compared to previous methods. We validate SpatialDE2 using simulated data and illustrate its utility in the context of two real-world applications to the spatial transcriptomics profiles of the mouse brain and human endometrium.
0

Genetic associations at regulatory phenotypes improve fine-mapping of causal variants for twelve immune-mediated diseases

Kousik Kundu et al.May 7, 2020
+10
M
A
K
Abstract The identification of causal genetic variants for common diseases improves understanding of disease biology. Here we use data from the BLUEPRINT project to identify regulatory quantitative trait loci (QTL) for three primary human immune cell types and use these to fine-map putative causal variants for twelve immune-mediated diseases. We identify 340 unique, non major histocompatibility complex (MHC) disease loci that colocalise with high (>98%) posterior probability with regulatory QTLs, and apply Bayesian frameworks to fine-map associations at each locus. We show that fine-mapping applied to regulatory QTLs yields smaller credible set sizes and higher posterior probabilities for candidate causal variants compared to disease summary statistics. We also describe a systematic under-representation of insertion/deletion (INDEL) polymorphisms in credible sets derived from publicly available disease meta-analysis when compared to QTLs based on genome-sequencing data. Overall, our findings suggest that fine-mapping applied to disease-colocalising regulatory QTLs can enhance the discovery of putative causal disease variants and provide insights into the underlying causal genes and molecular mechanisms.
0

Scalable latent-factor models applied to single-cell RNA-seq data separate biological drivers from confounding effects

Florian Buettner et al.May 6, 2020
O
J
N
F
Single-cell RNA-sequencing (scRNA-seq) allows heterogeneity in gene expression levels to be studied in large populations of cells. Such heterogeneity can arise from both technical and biological factors, thus making decomposing sources of variation extremely difficult. We here describe a computationally efficient model that uses prior pathway annotation to guide inference of the biological drivers underpinning the heterogeneity. Moreover, we jointly update and improve gene set annotation and infer factors explaining variability that fall outside the existing annotation. We validate our method using simulations, which demonstrate both its accuracy and its ability to scale to large datasets with up to 100,000 cells. Moreover, through applications to real data we show that our model can robustly decompose scRNA-seq datasets into interpretable components and facilitate the identification of novel sub-populations.
0
Citation11
0
Save
1

Identifying temporal and spatial patterns of variation from multi-modal data using MEFISTO

Britta Velten et al.Oct 24, 2023
+2
D
J
B
Abstract Factor analysis is among the most-widely used methods for dimensionality reduction in genome biology, with applications from personalized health to single-cell studies. Existing implementations of factor analysis assume independence of the observed samples, an assumption that fails in emerging spatio-temporal profiling studies. Here, we present MEFISTO, a flexible and versatile toolbox for modelling high-dimensional data when spatial or temporal dependencies between the samples are known. MEFISTO maintains the established benefits of factor analysis for multi-modal data, but enables performing spatio-temporally informed dimensionality reduction, interpolation and separation of smooth from non-smooth patterns of variation. Moreover, MEFISTO can integrate multiple related datasets by simultaneously identifying and aligning the underlying patterns of variation in a data-driven manner. We demonstrate MEFISTO through applications to an evolutionary atlas of mammalian organ development, where the model reveals conserved and evolutionary diverged developmental programs. In applications to a longitudinal microbiome study in infants, birth mode and diet were highlighted as major causes for heterogeneity in the temporally-resolved microbiome over the first years of life. Finally, we demonstrate that the proposed framework can also be applied to spatially resolved transcriptomics.
119

Population-scale single-cell RNA-seq profiling across dopaminergic neuron differentiation

Julie Jerber et al.Oct 24, 2023
+14
A
D
J
Abstract Common genetic variants can have profound effects on cellular function, but studying these effects in primary human tissue samples and during development is challenging. Human induced pluripotent stem cell (iPSC) technology holds great promise for assessing these effects across different differentiation contexts. Here, we use an efficient pooling strategy to differentiate 215 iPS cell lines towards a midbrain neural fate, including dopaminergic neurons, and profile over 1 million cells sampled across three differentiation timepoints using single cell RNA sequencing. We find that the proportion of neuronal cells produced by each cell line is highly reproducible over different experimental batches, and identify robust molecular markers in pluripotent cells that predict line-to-line differences in cell fate. We identify expression quantitative trait loci (eQTL) that manifest at different stages of neuronal development, and in response to oxidative stress, by exposing cells to rotenone. We find over one thousand eQTL that colocalise with a known risk locus for a neurological trait, nearly half of which are not found in GTEx. Our study illustrates how coupling single cell transcriptomics with long-term iPSC differentiation can profile mechanistic effects of human trait-associated genetic variants in otherwise inaccessible cell states.
119
Paper
Citation11
0
Save
60

Mapping interindividual dynamics of innate immune response at single-cell resolution

Natsuhiko Kumasaka et al.Oct 24, 2023
+23
N
R
N
Abstract Common genetic variants modulate the cellular response to viruses and are implicated in a range of immune pathologies, including infectious and autoimmune diseases. The transcriptional antiviral response is known to vary between infected cells from a single individual, yet how genetic variants across individuals modulate the antiviral response (and its cell-to-cell variability) is not well understood. Here, we triggered the antiviral response in human fibroblasts from 68 healthy donors, and profiled tens of thousands of cells using single-cell RNA-seq. We developed GASPACHO (GAuSsian Processes for Association mapping leveraging Cell HeterOgeneity), the first statistical approach designed to identify dynamic eQTLs across a transcriptional trajectory of cell populations, without aggregating single-cell data into pseudo-bulk. This allows us to uncover the underlying architecture and variability of antiviral response across responding cells, and to identify more than two thousands eQTLs modulating the dynamic changes during this response. Many of these eQTLs colocalise with risk loci identified in GWAS of infectious and autoimmune diseases. As a case study, we focus on a COVID-19 susceptibility locus, colocalised with the antiviral OAS1 splicing QTL. We validated it in blood cells from a patient cohort and in the infected nasal cells of a patient with the risk allele, demonstrating the utility of GASPACHO to fine-map and functionally characterise a genetic locus. In summary, our novel analytical approach provides a new framework for delineation of the genetic variants that shape a wide spectrum of transcriptional responses at single-cell resolution.
60
Paper
Citation9
0
Save
0

A linear mixed model approach to study multivariate gene-environment interactions

Rachel Moore et al.May 6, 2020
+4
M
F
R
Abstract Different environmental factors, including diet, physical activity, or external conditions can contribute to genotype-environment interactions (GxE). Although high-dimensional environmental data are increasingly available, and multiple environments have been implicated with GxE at the same loci, multi-environment tests for GxE are not established. Such joint analyses can increase power to detect GxE and improve the interpretation of these effects. Here, we propose the structured linear mixed model (StructLMM), a computationally efficient method to test for and characterize loci that interact with multiple environments. After validating our model using simulations, we apply StructLMM to body mass index in UK Biobank, where our method detects previously known and novel GxE signals. Finally, in an application to a large blood eQTL dataset, we demonstrate that StructLMM can be used to study interactions with hundreds of environmental variables.
0
Paper
Citation8
0
Save
Load More