TY
Tingyang Yu
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
1
h-index:
2
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Contrastive Cycle Adversarial Autoencoders for Single-cell Multi-omics Alignment and Integration

Xuesong Wang et al.Dec 13, 2021
ABSTRACT We have entered the multi-omics era, and we can measure cells from different aspects. When dealing with such multi-omics data, the first step is to determine the correspondence among different omics. In other words, we should match data from different spaces corresponding to the same object. This problem is particularly challenging in the single-cell multi-omics scenario because such data are very sparse with extremely high dimensions. Secondly, matched single-cell multi-omics data are rare and hard to collect. Furthermore, due to the limitations of the experimental environment, the data are usually highly noisy. To promote the single-cell multi-omics research, we overcome the above challenges, proposing a novel framework to align and integrate single-cell RNA-seq data and single-cell ATAC-seq data. Our approach can efficiently map the above data with high sparsity and noise from different spaces to a low-dimensional manifold in a unified space, making the downstream alignment and integration straightforward. Compared with the other state-of-the-art methods, our method performs better on both simulated and real single-cell data. On the real data, the performance improvement on accuracy over the previous methods is up to 55.7% regarding scRNA-seq and scATAC-seq data integration. Downstream trajectory inference analysis shows that our tool can transfer the labels from scRNA-seq to scATAC-seq with very high accuracy, which indicates our method’s effectiveness.
6

conST: an interpretable multi-modal contrastive learning framework for spatial transcriptomics

Yongshuo Zong et al.Jan 17, 2022
Abstract Motivation Spatially resolved transcriptomics (SRT) shows its impressive power in yielding biological insights into neuroscience, disease study, and even plant biology. However, current methods do not sufficiently explore the expressiveness of the multi-modal SRT data, leaving a large room for improvement of performance. Moreover, the current deep learning based methods lack interpretability due to the “black box” nature, impeding its further applications in the areas that require explanation. Results We propose conST, a powerful and flexible SRT data analysis framework utilizing contrastive learning techniques. conST can learn low-dimensional embeddings by effectively integrating multi-modal SRT data, i . e . gene expression, spatial information, and morphology (if applicable). The learned embeddings can be then used for various downstream tasks, including clustering, trajectory and pseudotime inference, cell-to-cell interaction, etc . Extensive experiments in various datasets have been conducted to demonstrate the effectiveness and robustness of the proposed conST, achieving up to 10% improvement in clustering ARI in the commonly used benchmark dataset. We also show that the learned embedding can be used in complicated scenarios, such as predicting cancer progression by analyzing the tumour microenvironment and cell-to-cell interaction (CCI) of breast cancer. Our framework is interpretable in that it is able to find the correlated spots that support the clustering, which matches the CCI interaction pairs as well, providing more confidence to clinicians when making clinical decisions.
32

scMinerva: an Unsupervised Graph Learning Framework with Label-efficient Fine-tuning for Single-cell Multi-omics Integrated Analysis

Tingyang Yu et al.May 29, 2022
Abstract Single-cell multi-omics is a rapidly growing field in biomedicine, where multiple biological contents, such as the epigenome, genome, and transcriptome, can be measured simultaneously. Despite its potential, the integrated analysis and prediction of cellular states based on this complex multi-omics data pose significant challenges due to data sparsity, high noise, and computational overhead. To address these challenges, we developed scMinerva , an unsupervised framework for single-cell multi-omics integrated analysis. The learned embeddings from the multi-omics data enable accurate integrated classification of cell types and stages. Specifically, we construct a heterogeneous graph from multiple omics and propose a novel biased random walk algorithm omics2vec , which can learn the heterogeneous biological graph in a way that balances both local and global network structures. scMinerva successfully outperforms existing unsupervised methods on various simulated and real-world datasets when fine-tuned by very few labels. Additionally, scMinerva demonstrates strong label efficiency, is robust to fluctuation in data quality, allows one omics to compensate for weakness in others and could effectively classify cells with different annotation granularities. Furthermore, we showcase scMinerva’s ability to accurately provide prospective biomarkers and predict cell differentiation trends for COVID-19-infected cells, through the joint analysis of multi-omics data.