SF
Shuangsang Fang
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(56% Open Access)
Cited by:
14
h-index:
4
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
5

spatiAlign: An Unsupervised Contrastive Learning Model for Data Integration of Spatially Resolved Transcriptomics

Chao Zhang et al.Aug 12, 2023
Abstract Integrative analysis of spatially resolved transcriptomics datasets empowers a deeper understanding of complex biological systems. However, integrating multiple tissue sections presents challenges for batch effect removal, particularly when the sections are measured by various technologies or collected at different times. Here, we propose spatiAlign, an unsupervised contrastive learning model that employs the expression of all measured genes and the spatial location of cells, to integrate multiple tissue sections. It enables the joint downstream analysis of multiple datasets not only in low-dimensional embeddings but also in the reconstructed full expression space. In benchmarking analysis, spatiAlign outperforms state-of-the-art methods in learning joint and discriminative representations for tissue sections, each potentially characterized by complex batch effects or distinct biological characteristics. Furthermore, we demonstrate the benefits of spatiAlign for the integrative analysis of time-series brain sections, including spatial clustering, differential expression analysis, and particularly trajectory inference that requires a corrected gene expression matrix.
0

spatiAlign: an unsupervised contrastive learning model for data integration of spatially resolved transcriptomics

Chao Zhang et al.Jan 1, 2024
Abstract Background Integrative analysis of spatially resolved transcriptomics datasets empowers a deeper understanding of complex biological systems. However, integrating multiple tissue sections presents challenges for batch effect removal, particularly when the sections are measured by various technologies or collected at different times. Findings We propose spatiAlign, an unsupervised contrastive learning model that employs the expression of all measured genes and the spatial location of cells, to integrate multiple tissue sections. It enables the joint downstream analysis of multiple datasets not only in low-dimensional embeddings but also in the reconstructed full expression space. Conclusions In benchmarking analysis, spatiAlign outperforms state-of-the-art methods in learning joint and discriminative representations for tissue sections, each potentially characterized by complex batch effects or distinct biological characteristics. Furthermore, we demonstrate the benefits of spatiAlign for the integrative analysis of time-series brain sections, including spatial clustering, differential expression analysis, and particularly trajectory inference that requires a corrected gene expression matrix.
0

Stereopy: modeling comparative and spatiotemporal cellular heterogeneity via multi-sample spatial transcriptomics

Shuangsang Fang et al.Jan 1, 2023
Tracing cellular dynamic changes across conditions, time, and space is crucial for understanding the molecular mechanisms underlying complex biological systems. However, integrating multi-sample data in a unified and flexible way to explore cellular heterogeneity remains a major challenge. Here, we present Stereopy, a flexible and versatile framework for modeling and dissecting comparative and spatiotemporal patterns in multi-sample spatial transcriptomics with interactive data visualization. To optimize this flexible framework, we have developed three key components: a multi-sample tailored data container, a scope controller, and an analysis transformer. Furthermore, Stereopy showcases three transformative applications supported by pivotal algorithms. Firstly, the multi-sample cell community detection (CCD) algorithm introduces an innovative capability to detect specific cell communities and identify genes responsible for pathological changes in comparable datasets. Secondly, the spatially resolved temporal gene pattern inference (TGPI) algorithm represents a notable advancement in detecting important spatiotemporal gene patterns while concurrently considering spatial and temporal features, which enhances the identification of important genes, domains and regulatory factors closely associated with temporal datasets. Finally, the 3D niche-based regulation inference tool, named NicheReg3D, reconstructs the 3D cell niches to enable the inference of cell-gene interaction network within the spatial texture, thus bridging intercellular communications and intracellular regulations to unravel the intricate regulatory mechanisms that govern cellular behavior. Overall, Stereopy serves as both a bioinformatics toolbox and an extensible framework that provides researchers with enhanced data interpretation abilities and new perspectives for mining multi-sample spatial transcriptomics data.
0

SpaGRN: investigating spatially informed regulatory paths for spatially resolved transcriptomics data

Yao Li et al.Jan 1, 2023
Cells expressing similar transcriptional regulatory circuits spatially aggregate into distinct cell types or states. However, most existing methods for inferring gene regulatory networks from spatially resolved transcriptomics are devoted to spatial co-expression modules or interactions between transcription factors and target genes, neglecting mediated effects from extracellular signals. Here we introduce SpaGRN, a statistical framework for predicting the comprehensive intracellular regulatory network underlying spatial patterns by integrating spatial expression profiles with prior knowledge on regulatory relationships and signaling paths. We validate and assess SpaGRN using simulated and real datasets, demonstrating its efficiency, performance, and robustness. When applied to 3D datasets of developing Drosophila embryos and larvae, SpaGRN identifies spatiotemporal variations in specific regulatory patterns, delineating the cascade of events from receptor stimulation to downstream transcription factors and targets, revealing synergetic regulation mechanism during organogenesis. Moreover, SpaGRN provides flexible visualization functions. We construct an online 3D regulatory network atlas database for interactive exploration and sharing.
8

BatchEval Pipeline: Batch Effect Evaluation Workflow for Multiple Datasets Joint Analysis

Chengqi Zhang et al.Jan 1, 2023
As genomic sequencing technology continues to advance, it becomes increasingly important to perform multiple dataset joint analysis of transcriptomics to understand complex biological systems. However, batch effect presents challenges for dataset integration, such as sequencing measured by different platforms and datasets collected at different times. Here, we develop a BatchEval Pipeline, which is used to evaluate batch effect of dataset integration and output a comprehensive report. This report consists of a series of HTML pages for the assessment findings, including a main page, a raw dataset evaluation page and several built-in methods evaluation pages. The main page exhibits basic information of integrated datasets, comprehensive score of batch effect and the most recommended method for batch effect removal to current datasets. The residual pages exhibit the evaluation details of raw dataset and evaluation results of many built-in batch effect removal methods after removing batch effect. This comprehensive report enables researchers to accurately identify and remove batch effects, resulting in more reliable and meaningful biological insights from integrated datasets. In summary, BatchEval Pipeline represents a significant advancement in batch effect evaluation and is a valuable tool to improve the accuracy and reliability of the experimental results.
0

ST-GEARS: Advancing 3D Downstream Research through Accurate Spatial Information Recovery

Tianyi Xia et al.Jan 1, 2023
Three-dimensional Spatial Transcriptomics has revolutionized our understanding of tissue regionalization, organogenesis, and development. However, to reconstruct single sections back to their in situ three-dimensional morphology, existing approaches either neglect experiment-induced section distortions, or fail to account for structural consistency during reconstruction. This leads to significant discrepancies between reconstruction results and the actual in vivo locations of cells, imposing unreliable spatial profiles to downstream analysis. To address these challenges, we propose ST-GEARS (Spatial Transcriptomics GEospatial profile recovery system through AnchoRS), which solves optimized "anchors" between in situ closest spots utilizing expressional and structural similarity across sections and recovers in vivo spatial information under the guidance of anchors. By employing innovative Distributive Constraints into the Optimization scheme, it retrieves more precise anchors compared to existing methods. Taking these anchors as reference points, ST-GEARS first rigidly aligns sections, then introduces and infers Elastic Fields to counteract distortions. ST-GEARS denoises the fields using context information by Gaussian Denoising. Utilizing the denoised fields, it eliminates distortions and eventually recovers original spatial profile through innovative and mathematically proved Bi-sectional Fields Application. Studying ST-GEARS on both bi-sectional registration and complete tissue reconstruction across sectional distances and sequencing platforms, we observed its outstanding performance in spatial information recovery across tissue, cell, and gene levels compared to current approaches. Through this recovery, ST-GEARS provides a precise and well-explainable bridge between in vitro analysis and 3D in vivo situations, powerfully fueling the potential of biological discoveries.
0

Generating single-cell gene expression profiles for high-resolution spatial transcriptomics based on cell boundary images

Bohan Zhang et al.Dec 26, 2023
ABSTRACT Stereo-seq is a cutting-edge technique for spatially resolved transcriptomics that combines subcellular resolution with centimeter-level field-of-view, serving as a technical foundation for analyzing large tissues at the single-cell level. Our previous work presents the first one-stop software that utilizes cell nuclei staining images and statistical methods to generate high-confidence single-cell spatial gene expression profiles for Stereo-seq data. With recent advancements in Stereo-seq technology, it is possible to acquire cell boundary information, such as cell membrane/wall staining images. To take advantage of this progress, we update our software to a new version, named STCellbin, which utilizes the cell nuclei staining images as a bridge to align cell membrane/wall staining images with spatial gene expression maps. By employing an advanced cell segmentation technique, accurate cell boundaries can be obtained, leading to more reliable single-cell spatial gene expression profiles. Experimental results verify that STCellbin can be applied on the mouse liver (cell membranes) and Arabidopsis seed (cell walls) datasets and outperforms other competitive methods. The improved capability of capturing single cell gene expression profiles by this update results in a deeper understanding of the contribution of single cell phenotypes to tissue biology. Availability & Implementation The source code of STCellbin is available at https://github.com/STOmics/STCellbin .