XX
Xiao Xu
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
17
h-index:
5
/
i10-index:
5
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
30

Community assessment of methods to deconvolve cellular composition from bulk gene expression

Brian White et al.Jun 5, 2022
+35
X
A
B
Abstract Deconvolution methods infer levels of immune and stromal infiltration from bulk expression of tumor samples. These methods allow projection of characteristics of the tumor microenvironment, known to affect patient outcome and therapeutic response, onto the millions of bulk transcriptional profiles in public databases, many focused on uniquely valuable and clinically-annotated cohorts. Despite the wide development of such methods, a standardized dataset with ground truth to evaluate their performance has been lacking. We generated and sequenced in vitro and in silico admixtures of tumor, immune, and stromal cells and used them as ground truth in a community-wide DREAM Challenge that provided an objective, unbiased assessment of six widely-used published deconvolution methods and of 22 new analytical approaches developed by international teams. Our results demonstrate that existing methods predict many cell types well, while team-contributed methods highlight the potential to resolve functional states of T cells that were either not covered by published reference signatures or estimated poorly by some published methods. Our assessment and the open-source implementations of top-performing methods will allow researchers to apply the deconvolution approach most appropriate to querying their cell type of interest. Further, our publicly-available admixed and purified expression profiles will be a valuable resource to those developing deconvolution methods, including in non-malignant settings involving immune cells.
0

Species and Cell-Type Properties of Classically Defined Human and Rodent Neurons and Glia

Xiao Xu et al.Nov 1, 2017
+3
A
E
X
Summary Determination of the molecular properties of genetically targeted cell types has led to fundamental insights into mouse brain function and dysfunction. Here, we report an efficient strategy for precise exploration of gene expression events in specific cell types in a broad range of species, including postmortem human brain. We demonstrate that classically defined, homologous neuronal and glial cell types differ between rodent and human by the expression of hundreds of orthologous, cell specific genes. Confirmation that these genes are differentially active was obtained using epigenetic mapping and immunofluorescence localization. Studies of sixteen human postmortem brains revealed cell-specific molecular responses to aging, and the induction of a shared, robust response to an unknown external event experienced by three donors. Our data establish a comprehensive approach for analysis of unique molecular events associated with specific circuits and cell types in a wide variety of human conditions.
0
Citation5
0
Save
29

A Community Challenge to Predict Clinical Outcomes After Immune Checkpoint Blockade in Non-Small Cell Lung Cancer

M. Mason et al.Dec 8, 2022
+44
X
R
M
Abstract Purpose Predictive biomarkers of immune checkpoint inhibitors (ICIs) efficacy are currently lacking for non-small cell lung cancer (NSCLC). Here, we describe the results from the Anti–PD-1 Response Prediction DREAM Challenge, a crowdsourced initiative that enabled the assessment of predictive models by using data from two randomized controlled clinical trials (RCTs) of ICIs in first-line metastatic NSCLC. Methods Participants developed and trained models using public resources. These were evaluated with data from the CheckMate 026 trial ( NCT02041533 ), according to the model-to-data paradigm to maintain patient confidentiality. The generalizability of the models with the best predictive performance was assessed using data from the CheckMate 227 trial ( NCT02477826 ). Both trials were phase III RCTs with a chemotherapy control arm, which supported the differentiation between predictive and prognostic models. Isolated model containers were evaluated using a bespoke strategy that considered the challenges of handling transcriptome data from clinical trials. Results A total of 59 teams participated, with 417 models submitted. Multiple predictive models, as opposed to a prognostic model, were generated for predicting overall survival, progression-free survival, and progressive disease status with ICIs. Variables within the models submitted by participants included tumor mutational burden (TMB), programmed death ligand 1 (PD-L1) expression, and gene-expression–based signatures. The bestperforming models showed improved predictive power over reference variables, including TMB or PD-L1. Conclusion This DREAM Challenge is the first successful attempt to use protected phase III clinical data for a crowdsourced effort towards generating predictive models for ICIs clinical outcomes and could serve as a blueprint for similar efforts in other tumor types and disease states, setting a benchmark for future studies aiming to identify biomarkers predictive of ICIs efficacy. Context summary Key objective Not all patients with non-small cell lung cancer (NSCLC) eligible for immune checkpoint inhibitor (ICIs) respond to treatment, but accurate predictive biomarkers of ICIs clinical outcomes are currently lacking. This crowdsourced initiative enabled the robust assessment of predictive models using data from two randomized clinical trials of first-line ICI in metastatic NSCLC. Knowledge generated Models submitted indicate that a combination of programmed death ligand 1 (PD-L1), tumor mutational burden (TMB), and immune gene signatures might be able to identify patients more likely to respond to ICIs. TMB and PD-L1 seemed important to predict progression-free survival and overall survival. Mechanisms including apoptosis, T-cell crosstalk, and adaptive immune resistance appeared essential to predict response. Relevance
29
Citation2
0
Save
4

Dice-XMBD: Deep learning-based cell segmentation for imaging mass cytometry

Xiao Xu et al.Jun 7, 2021
+6
Y
X
X
Abstract Highly multiplexed imaging technology is a powerful tool to facilitate understanding cells composition and interaction in tumor microenvironment at subcellular resolution, which is crucial for both basic research and clinical applications. Imaging mass cytometry (IMC), a multiplex imaging method recently introduced, can measure up to 40 markers simultaneously in one tissue section by using a high-resolution laser with a mass cytometer. However, due to its high resolution and large number of channels, how to process and interpret the image data from IMC remains a key challenge for its further applications. Accurate and reliable single cell segmentation is the first and a critical step to process IMC image data. Unfortunately, existing segmentation pipelines either produce inaccurate cell segmentation results, or require manual annotation which is very time-consuming. Here, we developed Dice-XMBD, a Deep learnIng-based Cell sEgmentation algorithm for tissue multiplexed imaging data. In comparison with other state-of-the-art cell segmentation methods currently used in IMC, Dice-XMBD generates more accurate single cell masks efficiently on IMC images produced with different nuclear, membrane and cytoplasm markers. All codes and datasets are available at https://github.com/xmuyulab/Dice-XMBD .
1

IMCellXMBD: A statistical approach for robust cell identification and quantification from imaging mass cytometry images

Xu Xiao et al.Sep 27, 2021
+6
Y
X
X
Imaging Mass Cytometry (IMC) has become a useful tool in biomedical research due to its capability to measure over 100 markers simultaneously. Unfortunately, some protein channels in IMC images can be very noisy, which may significantly affect the phenotyping results without proper data processing. We developed IMCell XMBD1 , a highly effective and generalizable cell identification and quantification method for IMC images. IMCell performs denoising by subtracting an estimated background noise value from pixel values for each individual protein channel, identifies positive cells from negative cells by comparing the distribution between segmented cells and decoy cells, and normalize the protein expression levels of the identified positive cells for downstream data analysis. Experimental results demonstrate that our method significantly improves the reliability of cell phenotyping which is essential for using IMC in biomedical studies.
0

Comparison of High-Throughput Single-Cell RNA Sequencing Data Processing Pipelines

Mingxuan Gao et al.Feb 9, 2020
+6
S
X
M
With the development of single-cell RNA sequencing (scRNA-seq) technology, it has become possible to perform large-scale transcript profiling for tens of thousands of cells in a single experiment. Many analysis pipelines have been developed for data generated from different high-throughput scRNA-seq platforms, bringing a new challenge to users to choose a proper workflow that is efficient, robust and reliable for a specific sequencing platform. Moreover, as the amount of public scRNA-seq data has increased rapidly, integrated analysis of scRNA-seq data from different sources has become increasingly popular. However, it remains unclear whether such integrated analysis would be biased if the data were processed by different upstream pipelines. In this study, we encapsulated seven existing high-throughput scRNA-seq data processing pipelines with Nextflow, a general integrative workflow management framework, and evaluated their performances in terms of running time, computational resource consumption, and data processing consistency using nine public datasets generated from five different high-throughput scRNA-seq platforms. Our work provides a useful guideline for the selection of scRNA-seq data processing pipelines based on their performances on different real datasets. In addition, these guidelines can serve as a performance evaluation framework for future developments in high-throughput scRNA-seq data processing.
0

DAISM-DNN: Highly accurate cell type proportion estimation with in silico data augmentation and deep neural networks

Yating Lin et al.Mar 29, 2020
+6
L
X
Y
Understanding the immune-cell abundances of cancer and other disease-related tissues has an important role in guiding cancer treatments. We propose data augmentation through in silico mixing with deep neural networks (DAISM-DNN), where highly accurate and unbiased immune-cell proportion estimation is achieved through DNN with dataset-specific training data created from partial samples from the same batch with ground truth cell proportions. We evaluated the performance of DAISM-DNN on three publicly available real-world datasets and results showed that DAISM-DNN is robust against platform-specific variations among different datasets and outperforms other existing methods by a significant margin on all the datasets evaluated.* RNA-seq : Next Generation RNA Sequencing scRNA-seq : Single cell RNA-seq GEP : Gene expression profile matrix SVR : Support Vector Regression DNN : Deep Neural Network PBMC : Peripheral Blood Mononuclear Cells CCC : Lin’s Concordance Correlation Coefficient r : Pearson’s correlation coefficient RMSE : Root Mean Square Error CS : CIBERSORT CSx : CIBERSORTx