YW
Yichen Wang
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(86% Open Access)
Cited by:
2
h-index:
3
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
9

Matrix and analysis metadata standards (MAMS) to facilitate harmonization and reproducibility of single-cell data

Yichen Wang et al.Mar 7, 2023
A large number of genomic and imaging datasets are being produced by consortia that seek to characterize healthy and disease tissues at single-cell resolution. While much effort has been devoted to capturing information related to biospecimen information and experimental procedures, the metadata standards that describe data matrices and the analysis workflows that produced them are relatively lacking. Detailed metadata schema related to data analysis are needed to facilitate sharing and interoperability across groups and to promote data provenance for reproducibility. To address this need, we developed the Matrix and Analysis Metadata Standards (MAMS) to serve as a resource for data coordinating centers and tool developers. We first curated several simple and complex "use cases" to characterize the types of feature-observation matrices (FOMs), annotations, and analysis metadata produced in different workflows. Based on these use cases, metadata fields were defined to describe the data contained within each matrix including those related to processing, modality, and subsets. Suggested terms were created for the majority of fields to aid in harmonization of metadata terms across groups. Additional provenance metadata fields were also defined to describe the software and workflows that produced each FOM. Finally, we developed a simple list-like schema that can be used to store MAMS information and implemented in multiple formats. Overall, MAMS can be used as a guide to harmonize analysis-related metadata which will ultimately facilitate integration of datasets across tools and consortia. MAMS specifications, use cases, and examples can be found at https://github.com/single-cell-mams/mams/.
9
Citation2
0
Save
0

CytoSignal Detects Locations and Dynamics of Ligand-Receptor Signaling at Cellular Resolution from Spatial Transcriptomic Data

Jialin Liu et al.Mar 13, 2024
Abstract Nearby cells within tissues communicate through ligand-receptor signaling interactions. Emerging spatial transcriptomic technologies provide a tremendous opportunity to systematically detect ligand-receptor signaling, but no method operates at cellular resolution in the spatial context. We developed CytoSignal to infer the locations and dynamics of cell-cell communication at cellular resolution from spatial transcriptomic data. CytoSignal is based on the simple insight that signaling is a protein-protein interaction that occurs at a specific tissue location when ligand and receptor are expressed in close spatial proximity. Our cellular-resolution, spatially-resolved signaling scores allow several novel types of analyses: we identify spatial gradients in signaling strength; separately quantify the locations of contact-dependent and diffusible interactions; and detect signaling-associated differentially expressed genes. Additionally, we can predict the temporal dynamics of a signaling interaction at each spatial location. CytoSignal is compatible with nearly every kind of spatial transcriptomic technology including FISH-based protocols and spot-based protocols without deconvolution. We experimentally validate our results in situ by proximity ligation assay, confirming that CytoSignal scores closely match the tissue locations of ligand-receptor protein-protein interactions. Our work addresses the field’s current need for a robust and scalable tool to detect cell-cell signaling interactions and their dynamics at cellular resolution from spatial transcriptomic data.
18

Comprehensive generation, visualization, and reporting of quality control metrics for single-cell RNA sequencing data

Rui Hong et al.Nov 17, 2020
Abstract Single-cell RNA sequencing (scRNA-seq) can be used to gain insights into cellular heterogeneity within complex tissues. However, a variety of technical artifacts can be present in scRNA-seq data and need to be assessed before downstream analyses can be performed. While several algorithms and tools have been developed to perform individual quality control (QC) tasks, they are scattered in different packages across several programming environments. Comprehensive pipelines to streamline the process of generating and visualizing QC metrics are lacking. To address this need, we built the SCTK-QC pipeline within the singleCellTK R package ( https://github.com/compbiomed/singleCellTK ). Features in this pipeline include the ability to import data from 11 different preprocessing tools or file formats, perform empty droplet detection with 2 different algorithms, generate standard quality control metrics such as number of UMIs per cell or the percentage of mitochondrial counts, predict doublets using 6 different algorithms, and estimate ambient RNA. QC data can be exported to R and/or Python objects used in popular down-stream workflows. Results are visualized in an easy-to-read HTML report. This pipeline can also be used by non-computational users with an interactive graphical user interface developed with R/Shiny. Overall, the SCTK-QC pipeline will streamline and standardize QC analysis for scRNA-seq data across a variety of different single-cell transcriptomic platforms and preprocessing tools.
10

Interactive analysis of single-cell data using flexible workflows with SCTK2.0

Yichen Wang et al.Jul 14, 2022
Summary Analysis of single-cell RNA-seq (scRNA-seq) data can reveal novel insights into heterogeneity of complex biological systems. Many tools and workflows have been developed to perform different types of analysis. However, these tools are spread across different packages or programming environments, rely on different underlying data structures, and can only be utilized by people with knowledge of programming languages. In the Single Cell Toolkit 2.0 (SCTK2.0), we have integrated a variety of popular tools and workflows to perform various aspects of scRNA-seq analysis. All tools and workflows can be run in the R console or using an intuitive graphical user interface built with R/Shiny. HTML reports generated with Rmarkdown can be used to document and recapitulate individual steps or entire analysis workflows. We show that the toolkit offers more features when compared with existing tools and allows for a seamless analysis of scRNA-seq data for non-computational users. Graphical Abstract Highlights Intuitive graphical user interface for interactive analysis of scRNA-seq data Allows non-computational users to analyze scRNA-seq data with end-to-end workflows Provides interoperability between tools across different programming environments Produces HTML reports for reproducibility and easy sharing of results
0

Scalable identification of lineage-specific gene regulatory networks from metacells with NetID

Weixu Wang et al.Sep 11, 2024
The identification of gene regulatory networks (GRN) governing distinct cell fates in multilineage cellular differentiation systems is of critical importance for understanding cell fate decision. Single-cell RNA-sequencing (scRNA-seq) provides a powerful tool for the quantification of gene-level co-variation across the cell state manifold. However, accurate GRN reconstruction is hampered by the sparsity of scRNA-seq data introducing substantial technical noise. Moreover, the high dimensionality of typical scRNA-seq datasets limits the scalability of available approaches. To overcome these challenges, and to facilitate the inference of lineage-specific GRNs with directed regulator-target relations, we introduce NetID. This approach optimizes coverage of the cell state manifold by homogenous metacells and avoids spurious gene-gene correlations observed with available imputation methods. Benchmarking demonstrates superior performance of NetID compared to imputation-based GRN inference. By incorporating cell fate probability information, NetID facilitates prediction of lineage-specific GRNs and recovers known network motifs centered around lineage-determining transcription factors governing bone marrow hematopoiesis, making it a powerful toolkit for deciphering the gene regulatory control of cellular differentiation from large-scale single-cell transcriptome data.
0

CytoSimplex: Visualizing Single-cell Fates and Transitions on a Simplex

Jialin Liu et al.Jan 1, 2023
Cells differentiate to their final fates along unique trajectories, often involving multi-potent progenitors that can produce multiple terminally differentiated cell types. Recent developments in single-cell transcriptomic and epigenomic measurement provide tremendous opportunities for mapping these trajectories. The visualization of single-cell data often relies on dimension reduction methods such as UMAP to simplify high-dimensional single-cell data down into an understandable two-dimensional (2D) form. However, these visualization methods can be misleading and often do not effectively represent the direction of cell differentiation. To address these limitations, we developed a new approach that places each cell from a single-cell dataset within a simplex whose vertices correspond to terminally differentiated cell types. Our approach can quantify and visualize current cell fate commitment and future cell potential. We developed CytoSimplex, a standalone open-source package implemented in R and Python that provides simple and intuitive visualizations of cell differentiation in 2D ternary and three-dimensional (3D) quaternary plots. We believe that CytoSimplex can help researchers gain a better understanding of cell type transitions in specific tissues and characterize developmental processes.
0

Repetitive head impacts induce neuronal loss and neuroinflammation in young athletes

Morgane Butler et al.Mar 28, 2024
Abstract Repetitive head impacts (RHI) sustained from contact sports are the largest risk factor for chronic traumatic encephalopathy (CTE). Currently, CTE can only be diagnosed after death and the multicellular cascade of events that trigger initial hyperphosphorylated tau (p-tau) deposition remain unclear. Further, the symptoms endorsed by young individuals with early disease are not fully explained by the extent of p-tau deposition, severely hampering development of therapeutic interventions. Here, we show that RHI exposure associates with a multicellular response in young individuals (<51 years old) prior to the onset of CTE p-tau pathology that correlates with number of years of RHI exposure. Leveraging single nucleus RNA sequencing of tissue from 8 control, 9 RHI-exposed, and 11 low stage CTE individuals, we identify SPP1+ inflammatory microglia, angiogenic and inflamed endothelial cell profiles, reactive astrocytes, and altered synaptic gene expression in excitatory and inhibitory neurons in all individuals with exposure to RHI. Surprisingly, we also observe a significant loss of cortical sulcus layer 2/3 neurons in contact sport athletes compared to controls independent of p-tau pathology. These results provide robust evidence that multiple years of RHI exposure is sufficient to induce lasting cellular alterations that may underlie p-tau deposition and help explain the early clinical symptoms observed in young former contact sport athletes. Furthermore, these data identify specific cellular responses to repetitive head impacts that may direct future identification of diagnostic and therapeutic strategies for CTE.