CM
Carsten Marr
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Helmholtz Zentrum München, Technical University of Munich, Center for Environmental Health
+ 7 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
24
(46% Open Access)
Cited by:
9
h-index:
32
/
i10-index:
63
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
32

SHAPR predicts 3D cell shapes from 2D microscopic images

Dominik Waibel et al.Oct 24, 2023
+3
S
N
D
Summary Reconstruction of shapes and sizes of three-dimensional (3D) objects from two-dimensional (2D) information is an intensely studied subject in computer vision. We here consider the level of single cells and nuclei and present a neural network-based SHApe PRediction autoencoder. For proof-of-concept, SHAPR reconstructs 3D shapes of red blood cells from single view 2D confocal microscopy images more accurately than naïve stereological models and significantly increases the feature-based prediction of red blood cell types from F1 = 79.0% to F1 = 87.4%. Applied to 2D images containing spheroidal aggregates of densely grown human induced pluripotent stem cells, we find that SHAPR learns fundamental shape properties of cell nuclei and allows for prediction-based morphometry. Reducing imaging time and data storage, SHAPR will help to optimize and up-scale image-based high-throughput applications for biomedicine.
32
Citation2
0
Save
17

scifAI: Explainable machine learning for profiling the immunological synapse and functional characterization of therapeutic antibodies

Sayedali Boushehri et al.Oct 24, 2023
+6
N
K
S
Abstract Therapeutic antibodies are widely used to treat severe diseases. Most of them alter immune cells and act within the immunological synapse; an essential cell-to-cell interaction to direct the humoral immune response. Although many antibody designs are generated and evaluated, a high-throughput tool for systematic antibody characterization and prediction of function is lacking. Here, we introduce the first comprehensive open-source framework, scifAI (single-cell imaging flow cytometry AI), for preprocessing, feature engineering and explainable, predictive machine learning on imaging flow cytometry (IFC) data. Additionally, we generate the largest publicly available IFC data set of the human immunological synapse containing over 2.8 million images. Using scifAI, we analyze class frequency- and morphological changes under different immune stimulation. T cell cytokine production across multiple donors and therapeutic antibodies is quantitatively predicted in vitro, linking morphological features with function and demonstrating the potential to significantly impact antibody design. scifAI is universally applicable to IFC data. Given its modular architecture it is straightforward to incorporate into existing workflows and analysis pipelines, e.g. for rapid antibody screening and functional characterization.
0

InstantDL - An easy-to-use deep learning pipeline for image segmentation and classification

Dominik Waibel et al.Jun 3, 2024
C
S
D
Abstract Motivation Deep learning contributes to uncovering and understanding molecular and cellular processes with highly performant image computing algorithms. Convolutional neural networks have become the state-of-the-art tool to provide accurate, consistent and fast data processing. However, published algorithms mostly solve only one specific problem and they often require expert skills and a considerable computer science and machine learning background for application. Results We have thus developed a deep learning pipeline called InstantDL for four common image processing tasks: semantic segmentation, instance segmentation, pixel-wise regression and classification. InstantDL enables experts and non-experts to apply state-of-the-art deep learning algorithms to biomedical image data with minimal effort. To make the pipeline robust, we have automated and standardized workflows and extensively tested it in different scenarios. Moreover, it allows to assess the uncertainty of predictions. We have benchmarked InstantDL on seven publicly available datasets achieving competitive performance without any parameter tuning. For customization of the pipeline to specific tasks, all code is easily accessible. Availability and Implementation InstantDL is available under the terms of MIT licence. It can be found on GitHub: https://github.com/marrlab/InstantDL Contact carsten.marr@helmholtz-muenchen.de
12

Systematic comparison of incomplete-supervision approaches for biomedical imaging classification

Sayedali Boushehri et al.Oct 24, 2023
+2
D
A
S
ABSTRACT Deep learning based classification of biomedical images requires manual annotation by experts, which is time-consuming and expensive. Incomplete-supervision approaches including active learning, pre-training and semi-supervised learning address this issue and aim to increase classification performance with a limited number of annotated images. Up to now, these approaches have been mostly benchmarked on natural image datasets, where image complexity and class balance typically differ considerably from biomedical classification tasks. In addition, it is not clear how to combine them to improve classification performance on biomedical image data. We thus performed an extensive grid search combining seven active learning algorithms, three pre-training methods and two training strategies as well as respective baselines (random sampling, random initialization, and supervised learning). For four biomedical datasets, we started training with 1% of labeled data and increased it by 5% iteratively, using 4-fold cross-validation in each cycle. We found that the contribution of pre-training and semi-supervised learning can reach up to 25% macro F1-score in each cycle. In contrast, the state-of-the-art active learning algorithms contribute less than 5% to macro F1-score in each cycle. Based on performance, implementation ease and computation requirements, we recommend the combination of BADGE active learning, ImageNet-weights pre-training, and pseudo-labeling as training strategy, which reached over 90% of fully supervised results with only 25% of annotated data for three out of four datasets. We believe that our study is an important step towards annotation and resource efficient model training for biomedical classification challenges.
22

Computational modeling reveals cell-cycle dependent kinetics of H4K20 methylation states during Xenopus embryogenesis

Lea Schuh et al.Oct 24, 2023
+3
D
C
L
SUMMARY Histone modifications regulate chromatin architecture and thereby control gene expression. Rapid cell divisions and DNA replication however lead to a dilution of histone modifications and can thus affect chromatin mediated gene regulation So how does the cell-cycle shape the histone modification landscape, in particular during embryogenesis when a fast and precise control of cell-specific gene expression is required? We addressed this question in vivo by manipulating the cell-cycle during early Xenopus laevis embryogenesis. The global distribution of un-, mono- di- and tri-methylated histone H4K20 was measured by mass spectrometry in normal and cell-cycle arrested embryos over time. Using multi-start maximum likelihood optimization and quantitative model selection, we found that three specific methylation rate constants were required to explain the measured H4K20 methylation state kinetics. Interestingly, demethylation was found to be redundant in the cycling embryos but essential in the cell-cycle arrested embryos. Together, we present the first quantitative analysis of in vivo histone H4K20 methylation kinetics. Our computational model shows that demethylation is only essential for regulating H4K20 methylation kinetics in non-cycling cells. In rapidly dividing cells of early embryos, we predict that demethylation is dispensable, suggesting that cell-cycle mediated dilution of chromatin marks is an essential regulatory component for shaping the epigenetic landscape during early embryonic development.
22
Citation1
0
Save
1

PXPermute: Unveiling staining importance in multichannel fluorescence microscopy

Sayedali Boushehri et al.Oct 24, 2023
+3
D
A
S
Abstract Imaging Flow Cytometry (IFC) enables rapid acquisition of thousands of single-cell images per second, capturing information from multiple fluorescent channels. However, the conventional process of staining cells with fluorescently labeled conjugated antibodies for IFC analysis is labor-intensive, costly, and potentially detrimental to cell viability. To streamline experimental workflows and reduce expenses, it is imperative to identify the most relevant channels for downstream analysis. In this study, we present PXPermute, a user-friendly and powerful method that assesses the significance of IFC channels for a given task, such as cell profiling. Our approach evaluates channel importance by permuting pixel values within each channel and analyzing the resulting impact on the performance of machine learning or deep learning models. Through rigorous evaluation on three multi-channel IFC image datasets, we demonstrate the superiority of PXPermute in accurately identifying the most informative channels, aligning with established biological knowledge. To facilitate systematic investigations of channel importance and aid biologists in optimizing their experimental designs, we have released PXPermute as an easy-to-use open-source Python package.
0

Single-Cell Gene Expression Profi ling and Cell State Dynamics: Collecting Data, Correlating Data Points and Connecting the Dots

Carsten Marr et al.May 6, 2020
S
J
C
Single-cell analyses of transcript and protein expression profiles - more precisely, single-cell resolution analysis of molecular profiles of cell populations - have now entered center stage with the wide application of single-cell qPCR, single-cell RNA-Seq and CytOF. These high-dimensional population snapshots techniques are complemented by low-dimensional time-resolved microscopy-based monitoring methods of individual cells. Both fronts of advance have exposed a rich heterogeneity of cell states within uniform cell populations in many biological contexts, producing a new kind of data that has stimulated a series of computational analysis methods for data visualization, dimensionality reduction, and "cluster"(subpopulation) identification. The next step is to go beyond collecting data and correlating data points with computational analyses: to connect the dots, that is, to understand what actually underlies the identified data patterns. This entails interpreting the "clouds of points", each representing a cell in state space, and their structure as manifestation of the regulation by the molecular network. This control of cell state dynamics can be formalized as a quasi-potential landscape, as first proposed by Waddington. We summarize not only key methods of data acquisition and computational analysis but also explain the principles that link the single-cell resolution measurements to dynamical systems theory.
0

Parameter inference with analytical propagators for stochastic models of autoregulated gene expression

Frits Veerman et al.May 7, 2020
C
N
F
Stochastic gene expression in regulatory networks is conventionally modelled via the Chemical Master Equation (CME) (van Kampen 1981). As explicit solutions to the CME, in the form of so-called propagators, are oftentimes not readily available, various approximations have been proposed (Zechner et al. 2013, Feigelman et al 2016, Popović, Marr and Swain 2016). A recently developed analytical method (Veerman, Marr and Popović 2017) is based on a scale separation that assumes significant differences in the lifetimes of mRNA and protein in the network, allowing for the efficient approximation of propagators from asymptotic expansions for the corresponding generating functions. Here, we showcase the applicability of that method to simulated data from a ‘telegraph’ model for gene expression that is extended with an autoregulatory mechanism. We demonstrate that the resulting approximate propagators can be successfully applied for Bayesian parameter inference in the non-regulated model with synthetic data; moreover, we show that in the extended autoregulated model, autoactivation or autorepression may be refuted under certain assumptions on the model parameters. Our results indicate that the method showcased here may allow for successful parameter inference and model identification from longitudinal single cell data.
0

A Sparse Deep Learning Approach for Automatic Segmentation of Human Vasculature in Multispectral Optoacoustic Tomography

Nikolaos Chlis et al.May 7, 2020
+5
N
A
N
Multispectral Optoacoustic Tomography (MSOT) resolves oxy- (HbO2) and deoxy-hemoglobin (Hb) to perform vascular imaging. MSOT suffers from gradual signal attenuation with depth due to light-tissue interactions: an effect that hinders the precise manual segmentation of vessels. Furthermore, vascular assessment requires functional tests, which last several minutes and result in recording thousands of images. Here, we introduce a deep learning approach with a sparse UNET (S-UNET) for automatic vascular segmentation in MSOT images to avoid the rigorous and time-consuming manual segmentation. We evaluated the S-UNET on a test-set of 33 images, achieving a median DICE score of 0.88. Apart from high segmentation performance, our method based its decision on two wavelengths with physical meaning for the task-at-hand: 850 nm (peak absorption of oxy-hemoglobin) and 810 nm (isosbestic point of oxy-and deoxy-hemoglobin). Thus, our approach achieves precise data-driven vascular segmentation for automated vascular assessment and may boost MSOT further towards its clinical translation.
0

Automatic identification of relevant genes from low-dimensional embeddings of single cell RNAseq data

Philipp Angerer et al.May 7, 2020
+2
F
D
P
Dimensionality reduction is a key step in the analysis of single-cell RNA sequencing data and produces a low-dimensional embedding for visualization and as a calculation base for downstream analysis. Nonlinear techniques are most suitable to handle the intrinsic complexity of large, heterogeneous single cell data. With no linear relation between genes and embedding however, there is no way to extract the identity of genes most relevant for any cell's position in the low-dimensional embedding, and thus the underlying process. In this paper, we introduce the concepts of global and local gene relevance to compute an equivalent of principal component analysis loadings for non-linear low-dimensional embeddings. While global gene relevance identifies drivers of the overall embedding, local gene relevance singles out genes that change in small, possibly rare subsets of cells. We apply our method to single-cell RNAseq datasets from different experimental protocols and to different low dimensional embedding techniques, shows our method's versatility to identify key genes for a variety of biological processes. To ensure reproducibility and ease of use, our method is released as part of destiny 3.0, a popular R package for building diffusion maps from single-cell transcriptomic data. It is readily available through Bioconductor.
Load More