ML
Malte Luecken
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Helmholtz Zentrum München, German Center for Lung Research, Center for Environmental Health
+ 1 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(91% Open Access)
Cited by:
383
h-index:
16
/
i10-index:
19
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Best practices for single-cell analysis across modalities

Lukas Heumos et al.Apr 28, 2024
+39
C
A
L
Recent advances in single-cell technologies have enabled high-throughput molecular profiling of cells across modalities and locations. Single-cell transcriptomics data can now be complemented by chromatin accessibility, surface protein expression, adaptive immune receptor repertoire profiling and spatial information. The increasing availability of single-cell data across modalities has motivated the development of novel computational methods to help analysts derive biological insights. As the field grows, it becomes increasingly difficult to navigate the vast landscape of tools and analysis steps. Here, we summarize independent benchmarking studies of unimodal and multimodal single-cell analysis across modalities to suggest comprehensive best-practice workflows for the most common analysis steps. Where independent benchmarks are not available, we review and contrast popular methods. Our article serves as an entry point for novices in the field of single-cell (multi-)omic analysis and guides advanced users to the most recent best practices.
1
Citation204
0
Save
1

An integrated cell atlas of the lung in health and disease

Lisa Sikkema et al.Jan 26, 2024
+94
D
C
L
Abstract Single-cell technologies have transformed our understanding of human tissues. Yet, studies typically capture only a limited number of donors and disagree on cell type definitions. Integrating many single-cell datasets can address these limitations of individual studies and capture the variability present in the population. Here we present the integrated Human Lung Cell Atlas (HLCA), combining 49 datasets of the human respiratory system into a single atlas spanning over 2.4 million cells from 486 individuals. The HLCA presents a consensus cell type re-annotation with matching marker genes, including annotations of rare and previously undescribed cell types. Leveraging the number and diversity of individuals in the HLCA, we identify gene modules that are associated with demographic covariates such as age, sex and body mass index, as well as gene modules changing expression along the proximal-to-distal axis of the bronchial tree. Mapping new data to the HLCA enables rapid data annotation and interpretation. Using the HLCA as a reference for the study of disease, we identify shared cell states across multiple lung diseases, including SPP1 + profibrotic monocyte-derived macrophages in COVID-19, pulmonary fibrosis and lung carcinoma. Overall, the HLCA serves as an example for the development and use of large-scale, cross-dataset organ atlases within the Human Cell Atlas.
31

Multimodal single cell data integration challenge: results and lessons learned

Christopher Lance et al.Oct 13, 2023
+15
D
M
C
Abstract Biology has become a data-intensive science. Recent technological advances in single-cell genomics have enabled the measurement of multiple facets of cellular state, producing datasets with millions of single-cell observations. While these data hold great promise for understanding molecular mechanisms in health and disease, analysis challenges arising from sparsity, technical and biological variability, and high dimensionality of the data hinder the derivation of such mechanistic insights. To promote the innovation of algorithms for analysis of multimodal single-cell data, we organized a competition at NeurIPS 2021 applying the Common Task Framework to multimodal single-cell data integration. For this competition we generated the first multimodal benchmarking dataset for single-cell biology and defined three tasks in this domain: prediction of missing modalities, aligning modalities, and learning a joint representation across modalities. We further specified evaluation metrics and developed a cloud-based algorithm evaluation pipeline. Using this setup, 280 competitors submitted over 2600 proposed solutions within a 3 month period, showcasing substantial innovation especially in the modality alignment task. Here, we present the results, describe trends of well performing approaches, and discuss challenges associated with running the competition.
31
Citation37
0
Save
1

RAAS blockade, kidney disease, and expression of ACE2, the entry receptor for SARS-CoV-2, in kidney epithelial and endothelial cells

Ayshwarya Subramanian et al.Oct 24, 2023
+13
M
K
A
Abstract SARS-CoV-2, the coronavirus that causes COVID-19, binds to angiotensin-converting enzyme 2 (ACE2) on human cells. Beyond the lung, COVID-19 impacts diverse tissues including the kidney. ACE2 is a key member of the Renin-Angiotensin-Aldosterone System (RAAS) which regulates blood pressure, largely through its effects on the kidney. RAAS blockers such as ACE inhibitors (ACEi) and Angiotensin Receptor Blockers (ARBs) are widely used therapies for hypertension, cardiovascular and chronic kidney diseases, and therefore, there is intense interest in their effect on ACE2 expression and its implications for SARS-CoV-2 pathogenicity. Here, we analyzed single-cell and single-nucleus RNA-seq of human kidney to interrogate the association of ACEi/ARB use with ACE2 expression in specific cell types. First, we performed an integrated analysis aggregating 176,421 cells across 49 donors, 8 studies and 8 centers, and adjusting for sex, age, donor and center effects, to assess the relationship of ACE2 with age and sex at baseline. We observed a statistically significant increase in ACE2 expression in tubular epithelial cells of the thin loop of Henle (tLoH) in males relative to females at younger ages, the trend reversing, and losing significance with older ages. ACE2 expression in tLoH increases with age in females, with an opposite, weak effect in males. In an independent cohort, we detected a statistically significant increase in ACE2 expression with ACEi/ARB use in epithelial cells of the proximal tubule and thick ascending limb, and endothelial cells, but the association was confounded in this small cohort by the underlying disease. Our study illuminates the dynamics of ACE2 expression in specific kidney cells, with implications for SARS-CoV-2 entry and pathogenicity.
1
Paper
Citation8
0
Save
-1

An integrated cell atlas of the human lung in health and disease

Lisa Sikkema et al.Oct 11, 2023
+71
L
D
L
ABSTRACT Organ- and body-scale cell atlases have the potential to transform our understanding of human biology. To capture the variability present in the population, these atlases must include diverse demographics such as age and ethnicity from both healthy and diseased individuals. The growth in both size and number of single-cell datasets, combined with recent advances in computational techniques, for the first time makes it possible to generate such comprehensive large-scale atlases through integration of multiple datasets. Here, we present the integrated Human Lung Cell Atlas (HLCA) combining 46 datasets of the human respiratory system into a single atlas spanning over 2.2 million cells from 444 individuals across health and disease. The HLCA contains a consensus re-annotation of published and newly generated datasets, resolving under- or misannotation of 59% of cells in the original datasets. The HLCA enables recovery of rare cell types, provides consensus marker genes for each cell type, and uncovers gene modules associated with demographic covariates and anatomical location within the respiratory system. To facilitate the use of the HLCA as a reference for single-cell lung research and allow rapid analysis of new data, we provide an interactive web portal to project datasets onto the HLCA. Finally, we demonstrate the value of the HLCA reference for interpreting disease-associated changes. Thus, the HLCA outlines a roadmap for the development and use of organ-scale cell atlases within the Human Cell Atlas.
84

Alterations of multiple alveolar macrophage states in chronic obstructive pulmonary disease

Kevin Baßler et al.Oct 24, 2023
+39
T
W
K
Abstract Despite the epidemics of chronic obstructive pulmonary disease (COPD), the cellular and molecular mechanisms of this disease are far from being understood. Here, we characterize and classify the cellular composition within the alveolar space and peripheral blood of COPD patients and control donors using a clinically applicable single-cell RNA-seq technology corroborated by advanced computational approaches for: machine learning-based cell-type classification, identification of differentially expressed genes, prediction of metabolic changes, and modeling of cellular trajectories within a patient cohort. These high-resolution approaches revealed: massive transcriptional plasticity of macrophages in the alveolar space with increased levels of invading and proliferating cells, loss of MHC expression, reduced cellular motility, altered lipid metabolism, and a metabolic shift reminiscent of mitochondrial dysfunction in COPD patients. Collectively, single-cell omics of multi-tissue samples was used to build the first cellular and molecular framework for COPD pathophysiology as a prerequisite to develop molecular biomarkers and causal therapies against this deadly disease.
0

Integrated multi-omics single cell atlas of the human retina

Jin Li et al.Nov 8, 2023
+19
I
J
J
Single-cell sequencing has revolutionized the scale and resolution of molecular profiling of tissues and organs. Here, we present an integrated multimodal reference atlas of the most accessible portion of the mammalian central nervous system, the retina. We compiled around 2.4 million cells from 55 donors, including 1.4 million unpublished data points, to create a comprehensive human retina cell atlas (HRCA) of transcriptome and chromatin accessibility, unveiling over 110 types. Engaging the retina community, we annotated each cluster, refined the Cell Ontology for the retina, identified distinct marker genes, and characterized cis-regulatory elements and gene regulatory networks (GRNs) for these cell types. Our analysis uncovered intriguing differences in transcriptome, chromatin, and GRNs across cell types. In addition, we modeled changes in gene expression and chromatin openness across gender and age. This integrated atlas also enabled the fine-mapping of GWAS and eQTL variants. Accessible through interactive browsers, this multimodal cross donor and cross-lab HRCA, can facilitate a better understanding of retinal function and pathology.
1

Probe set selection for targeted spatial transcriptomics

Louis Kuemmerle et al.Oct 24, 2023
+13
A
M
L
Abstract Targeted spatial transcriptomics methods capture the topology of cell types and states in tissues at single cell- and subcellular resolution by measuring the expression of a predefined set of genes. The selection of an optimal set of probed genes is crucial for capturing and interpreting the spatial signals present in a tissue. However, current selections often rely on marker genes, precluding them from detecting continuous spatial signals or novel states. We present Spapros, an end-to-end probe set selection pipeline that optimizes both probe set specificity for cell type identification and within-cell-type expression variation to resolve spatially distinct populations while taking into account prior knowledge, as well as probe design and expression constraints. To facilitate data analysis and interpretation, Spapros also provides rules for cell type identification. We evaluated Spapros by selecting probes on 6 different data sets and built an evaluation pipeline with 12 quality metrics to find that Spapros outperforms other selection approaches in both cell type recovery and recovering expression variation beyond cell types. Furthermore, we used Spapros to design a SCRINSHOT experiment of adult lung tissue to demonstrate how probes selected with Spapros identify cell types of interest and detect spatial variation even within cell types. Spapros enables optimal probe set selection, probe set evaluation, and probe design, as a freely available Python package.
1

Optimizing Xenium In Situ data utility by quality assessment and best practice analysis workflows

Sergio Salas et al.Oct 24, 2023
+13
L
P
S
Abstract The Xenium In Situ platform is a new spatial transcriptomics product commercialized by 10X Genomics capable of mapping hundreds of transcripts in situ at a subcellular resolution. Given the multitude of commercially available spatial transcriptomics technologies, recommendations in choice of platform and analysis guidelines are increasingly important. Herein, we explore eight preview Xenium datasets of the mouse brain and two of human breast cancer by comparing scalability, resolution, data quality, capacities and limitations with eight other spatially resolved transcriptomics technologies. In addition, we benchmarked the performance of multiple open source computational tools when applied to Xenium datasets in tasks including cell segmentation, segmentation-free analysis, selection of spatially variable genes and domain identification, among others. This study serves as the first independent analysis of the performance of Xenium, and provides best-practices and recommendations for analysis of such datasets.
328

Benchmarking atlas-level data integration in single-cell genomics

Malte Luecken et al.Oct 11, 2023
+8
K
M
M
Abstract Cell atlases often include samples that span locations, labs, and conditions, leading to complex, nested batch effects in data. Thus, joint analysis of atlas datasets requires reliable data integration. Choosing a data integration method is a challenge due to the difficulty of defining integration success. Here, we benchmark 38 method and preprocessing combinations on 77 batches of gene expression, chromatin accessibility, and simulation data from 23 publications, altogether representing >1.2 million cells distributed in nine atlas-level integration tasks. Our integration tasks span several common sources of variation such as individuals, species, and experimental labs. We evaluate methods according to scalability, usability, and their ability to remove batch effects while retaining biological variation. Using 14 evaluation metrics, we find that highly variable gene selection improves the performance of data integration methods, whereas scaling pushes methods to prioritize batch removal over conservation of biological variation. Overall, BBKNN, Scanorama, and scVI perform well, particularly on complex integration tasks; Seurat v3 performs well on simpler tasks with distinct biological signals; and methods that prioritize batch removal perform best for ATAC-seq data integration. Our freely available reproducible python module can be used to identify optimal data integration methods for new data, benchmark new methods, and improve method development.
Load More