SD
Slavica Dimitrieva
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
334
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
43

Probabilistic machine learning ensures accurate ambient denoising in droplet-based single-cell omics

Caibin Sheng et al.Jan 14, 2022
Abstract Droplet-based single-cell omics, including single-cell RNA sequencing (scRNAseq), single-cell CRISPR perturbations (e.g., CROP-seq), and single-cell protein and transcriptomic profiling (CITE-seq) hold great promise for comprehensive cell profiling and genetic screening at the single-cell resolution. However, these technologies suffer from substantial noise, among which ambient signals present in the cell suspension may be the predominant source. Current models to address this issue are highly technology-specific and relatively scRNAseq-centric. while a universal model to describe the noise across these technologies may reveal this common source, improving the denoising accuracy. To this end, we explicitly examined these unexpected signals in multiple datasets across droplet-based technologies, summarised a predictable pattern, and developed single-cell Ambient Remover (scAR) – a hypothesis-driven machine learning model to predict and remove ambient signals (including mRNA counts, protein counts, and sgRNA counts) at the molecular level. We benchmarked scAR on three technologies – single-cell CRISPR screens, CITE-seq, and scRNAseq along with the state-of-the-art single-technology-specific approaches. scAR showed high denoising accuracy for each type of dataset.
0

Ultra-sensitive proteome profiling of FACS-isolated cell populations by data-independent acquisition-MS: Application to human hematopoietic stem and progenitor cells

Sabine Amon et al.Jul 17, 2018
Physiological processes in multicellular organisms depend on the function and interactions of a multitude of specialized cell types operating in context. Fluorescence-activated cell sorting (FACS) provides a powerful tool to determine the cell type composition of complex mixtures and to purify highly homogeneous cell populations using a small number of differentially expressed marker proteins. These populations can be further characterized, e.g. by phenotypic or molecular analyses. We describe an ultra-sensitive mass spectrometric method for the robust quantitative and reproducible proteomic analysis of cohorts of FACS-isolated cell samples. It uses a minimum of post-sorting sample processing steps prior to data-independent acquisition MS on a current generation Orbitrap hybrid mass spectrometer. The method provides highly accurate and reproducible quantitative proteome profiles across the cohort with an average coefficient of variance <15% from as little as 150 ng of total peptide mass. We quantified the proteome of 25,000 sorted human hematopoietic stem/multipotent progenitor cell and three committed progenitor cell subpopulations (common myeloid progenitors, megakaryocyte-erythrocyte progenitors and granulocyte-macrophage progenitors) isolated from five healthy donors. On average, 5,851 protein groups were identified per sample. After stringent filtering, a subset of 4,131 protein groups (≥2 peptides) was used for differential comparison across the 20 samples, defining unique proteomic signatures for each cell type tested. A comparison of proteomic and transcriptomic profiles of the four cell types indicated hematopoietic stem/multipotent progenitor cell-specific divergent regulation of biochemical processes that are essential for maintaining stemness and were detected at the proteome rather than the transcriptome level. The technology supports the generation of extensive and accurate quantitative proteomic profiles from low numbers of FACS-purified cells providing new information about the biochemical state of the analyzed cell types that is essential for basic and translational research.
1

Biologically relevant integration of transcriptomics profiles from cancer cell lines, patient-derived xenografts and clinical tumors using deep learning

Slavica Dimitrieva et al.Sep 9, 2022
Abstract Cell lines and patient-derived xenografts are essential to cancer research, however, the results derived from such models often lack clinical translatability, as these models do not fully recapitulate the complex cancer biology. It is critically important to better understand the systematic differences between cell lines, xenografts and clinical tumors, and to be able to identify pre-clinical models that sufficiently resemble the biological characteristics of clinical tumors across different cancers. On another side, direct comparison of transcriptional profiles from pre-clinical models and clinical tumors is infeasible due to the mixture of technical artifacts and inherent biological signals. To address these challenges, we developed MOBER, M ulti- O rigin B atch E ffect R emover method, to simultaneously extract biologically meaningful embeddings and remove batch effects from transcriptomic datasets of different origin. MOBER consists of two neural networks: conditional variational autoencoder and source discriminator neural network that is trained in adversarial fashion. We applied MOBER on transcriptional profiles from 932 cancer cell lines, 434 patient-derived tumor xenografts and 11’159 clinical tumors and identified pre-clinical models with greatest transcriptional fidelity to clinical tumors, and models that are transcriptionally unrepresentative of their respective clinical tumors. MOBER can conserve the biological signals from the original datasets, while generating embeddings that do not encode confounder information. In addition, it allows for transformation of transcriptional profiles of pre-clinical models to resemble the ones of clinical tumors, and therefore can be used to improve the clinical translation of insights gained from pre-clinical models. As a batch effect removal method, MOBER can be applied widely to transcriptomics datasets of different origin, allowing for integration of multiple datasets simultaneously.
0

Biologically relevant integration of transcriptomics profiles from cancer cell lines, patient-derived xenografts, and clinical tumors using deep learning

Slavica Dimitrieva et al.Jan 17, 2025
Cell lines and patient-derived xenografts are essential to cancer research; however, the results derived from such models often lack clinical translatability, as they do not fully recapitulate the complex cancer biology. Identifying preclinical models that sufficiently resemble the biological characteristics of clinical tumors across different cancers is critically important. Here, we developed MOBER, Multi-Origin Batch Effect Remover method, to simultaneously extract biologically meaningful embeddings while removing confounder information. Applying MOBER on 932 cancer cell lines, 434 patient-derived tumor xenografts, and 11,159 clinical tumors, we identified preclinical models with greatest transcriptional fidelity to clinical tumors and models that are transcriptionally unrepresentative of their respective clinical tumors. MOBER allows for transformation of transcriptional profiles of preclinical models to resemble the ones of clinical tumors and, therefore, can be used to improve the clinical translation of insights gained from preclinical models. MOBER is a versatile batch effect removal method applicable to diverse transcriptomic datasets, enabling integration of multiple datasets simultaneously.