YW
Yixin Wang
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(86% Open Access)
Cited by:
7
h-index:
74
/
i10-index:
396
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
19

DANCE: A Deep Learning Library and Benchmark Platform for Single-Cell Analysis

Jiayuan Ding et al.Oct 21, 2022
+12
R
W
J
Abstract In the realm of single-cell analysis, computational approaches have brought an increasing number of fantastic prospects for innovation and invention. Meanwhile, it also presents enormous hurdles to reproducing the results of these models due to their diversity and complexity. In addition, the lack of gold-standard benchmark datasets, metrics, and implementations prevents systematic evaluations and fair comparisons of available methods. Thus, we introduce the DANCE platform, the first standard, generic, and extensible benchmark platform for accessing and evaluating computational methods across the spectrum of benchmark datasets for numerous single-cell analysis tasks. Currently, DANCE supports 3 modules and 8 popular tasks with 32 state-of-art methods on 21 benchmark datasets. People can easily reproduce the results of supported algorithms across major benchmark datasets via minimal efforts (e.g., only one command line). In addition, DANCE provides an ecosystem of deep learning architectures and tools for researchers to develop their own models conveniently. The goal of DANCE is to accelerate the development of deep learning models with complete validation and facilitate the overall advancement of single-cell analysis research. DANCE is an open-source python package that welcomes all kinds of contributions. All resources are integrated and available at https://omicsml.ai/ .
1

Modelling, characterization of data-dependent and process-dependent errors in DNA data storage

Yixin Wang et al.Jul 19, 2021
+2
Y
E
Y
Abstract Motivation Using DNA as the medium to store information has recently been recognized as a promising solution for long-term data storage. While several system prototypes have been demonstrated, the error characteristics in DNA data storage are discussed with limited content. Due to the data and process variations from experiment to experiment, the error variation and its effect on data recovery remain to be uncovered. To close the gap, we systematically investigate the storage channel, i.e., error characteristics in the storage process. Results We first propose a new concept named sequence corruption to unify the error characteristics into the sequence level, easing the channel analysis. Then we derived the formulations of the data imperfection at the decoder including both sequence loss and sequence corruption, revealing the decoding demand and monitoring the data recovery. Furthermore, we extensively explored several data-dependent unevenness observed in the base error patterns and studied a few potential factors and their impacts on the data imperfection at the decoder both theoretically and experimentally. The results presented here introduce a more comprehensive channel model and offer a new angle towards the data recovery issue in DNA data storage by further elucidating the error characteristics of the storage process. Contact poh.chuehloo@nus.edu.sg
11

SpatialCTD: a large-scale TME spatial transcriptomic dataset to evaluate cell type deconvolution for immuno-oncology

Jiayuan Ding et al.Apr 12, 2023
+14
Y
Q
J
Abstract Recent technological advancements have enabled spatially resolved transcriptomic profiling but at multi-cellular resolution. The task of cell type deconvolution has been introduced to disentangle discrete cell types from such multi-cellular spots. However, existing datasets for cell type deconvolution are limited in scale, predominantly encompassing data on mice, and are not designed for human immuno-oncology. In order to overcome these limitations and promote comprehensive investigation of cell type deconvolution for human immuno-oncology, we introduce a large-scale spatial transcriptomic dataset named S patial CTD, encompassing 1.8 million cells from the human tumor microenvironment across the lung, kidney, and liver. Distinct from existing approaches that primarily depend on single-cell RNA sequencing data as a reference without incorporating spatial information, we introduce Graph Neural Network-based method (i.e., GNND econvolver ) that effectively utilize the spatial information from reference samples, and extensive experiments show that GNND econvolver often outperforms existing state-of-the-art methods by a substantial margin, without requiring single-cell RNA-seq data. To enable comprehensive evaluations on spatial transcriptomics data from flexible protocols, we provide an online tool capable of converting spatial transcriptomic data from other platforms (e.g., 10x Visium, MERFISH and sci-Space) into pseudo spots, featuring adjustable spot size. The S patial CTD dataset and GNND econvolver implementation are available at https://github.com/OmicsML/SpatialCTD , and the online converter tool can be accessed at https://omicsml.github.io/SpatialCTD/ .
0

Time-course transcriptome landscape of achene development in lettuce

Chen Luo et al.Aug 3, 2020
+5
J
Z
C
Abstract Lettuce ( Lactuca sativa L.), which belongs to the large Asteraceae (Compositae) family, breeds by sexual reproduction and produce seeds. Actually, lettuce seeds are achenes, which are defined as fruits. However, few studies have described the morphological characteristics of the lettuce achenes, and genes essential for achene development are largely unknown in lettuce. To investigate the gene activity during achene development and determine the possible mechanisms that influence achene development in lettuce, we performed a time-course transcriptome analysis of lettuce achenes. A total of 23,790 expressed genes were detected at the five achene development stages. We investigated the gene expression patterns during achene development and identified the enriched biological processes at the corresponding stages. Kyoto Encyclopedia of Genes and Genomes and Gene Ontology analyses revealed a variety of transcriptomic similarities and differentiation at different achene development stages. Further, transcription factors and phytohormones were found to play important roles during achene development. Finally, we proposed a working model to illustrate the gene expression modules and possible molecular mechanism underlying achene development. Our time-course transcriptome data also provides a foundation for future functional studies to reveal the genetic control of achene development in lettuce.
1

Scrutiny of human lung infection by SARS-CoV-2 and associated human immune responses in humanized mice

Rong Sun et al.Nov 5, 2021
+14
Y
R
R
ABSTRACT There is an urgent need for animal models of COVID-19 to study immunopathogenesis and test therapeutic intervenes. In this study we showed that NSG mice engrafted with human lung (HL) tissue (NSG-L mice) could be infected efficiently by SARS-CoV-2, and that live virus capable of infecting Vero cells was found in the HL grafts and multiple organs from infected NSG-L mice. RNA-seq examination identified a series of differentially expressed genes, which are enriched in viral defense responses, chemotaxis, interferon stimulation, and pulmonary fibrosis between HL grafts from infected and control NSG-L mice. Furthermore, when infecting humanized mice with human immune system (HIS) and autologous HL grafts (HISL mice), the mice had bodyweight loss and hemorrhage and immune cell infiltration in HL grafts, which were not observed in immunodeficient NSG-L mice, indicating the development of anti-viral immune responses in these mice. In support of this possibility, the infected HISL mice showed bodyweight recovery and lack of detectable live virus at the later time. These results demonstrate that NSG-L and HISL mice are susceptible to SARS-CoV-2 infection, offering a useful in vivo model for studying SARS-CoV-2 infection and the associated immune response and immunopathology, and testing anti-SARS-CoV-2 therapies.
0

MEM-GAN: A Pseudo Membrane Generator for Single-cell Imaging in Fluorescent Microscopy

Yixin Wang et al.Jan 1, 2023
+10
A
L
Y
Motivation: Fluorescent microscopy imaging is vital to capturing single-cell spatial data, characterizing tissue organization and facilitating comprehensive analysis of cellular state. Advancements in fluorescent microscopy imaging technologies have enabled precise downstream cellular analysis, particularly in cell segmentation. Accurate segmentation of individual cells allows better profiling and understanding of cell properties and behaviors. The majority of existing segmentation methods predominantly concentrate on enhancing segmentation algorithms, and their effectiveness strongly relies on the input stained image quality. Factors such as high cellular density, indistinct cell boundaries, and staining artifacts can result in uneven and low-quality staining, particularly causing missing or unclear membrane staining. These artifacts adversely impact the efficacy of the subsequent cell segmentation methods.Results: To tackle this insufficient membrane staining, we propose a novel approach, MEM-GAN, to generate high-quality membranes for cells with missing or weak membranes. Inspired by advanced style transfer techniques in computer vision, MEM-GAN styles the content of the cells with missing or weak membranes into cells with integrated membrane staining. Considering the differences in membrane morphology between epithelial/tumor cells and immune cells, MEM-GAN deals with tumor and immune cells separately, not only enhancing membrane staining for cells with partially weak membrane signals but also generating membranes for cells with only nuclear channels. The proposed MEM-GAN is evaluated using the publicly available CosMx dataset. Experimental results demonstrate significant improvements in image staining quality, more accurate representation of membrane morphology characteristics, and better performance in downstream segmentation tasks. MEM-GAN is flexibly adapted and applied to other spatially resolved transcriptomics datasets, such as MERFISH and FISHseq. Our work provides a new perspective on tackling the challenges in cell segmentation from fluorescent microscopy image restoration. Availability and implementation: The implementation of MEM-GAN is open-source and available at the github repository https://github.com/OmicsML/Mem-GAN. The interactive webserver-based demo of MEM-GAN can be accessed at https://omicsml.ai/memgan.
5

D2Sim: A Computational Simulator for Nanopore Sequencing based DNA Data Storage

subhasiny Sankar et al.Mar 17, 2024
+3
M
Y
s
DNA data storage has gained significant attention due to its high storage density and durability. However, errors during storage and reading processes compromise data integrity, prompting research into error correction strategies. Researchers have been exploring physical redundancy (data copies) and logical redundancy (added redundancy in error-correcting codes) to mitigate errors. Evaluating these designs and reconstruction methods typically involves time-consuming and costly trials. To streamline this process, We designed a computational channel simulator namely D2Sim for Nanopore sequencing-based DNA data storage. This simulator mimics real experiments, generating data with distribution and errors at the receiver. Integrated with DeepSimulator, D2Sim outputs signals closely resembling actual signals of Nanopore-based DNA storage. Comparative analysis reveals that the proposed simulator yields 16.7% to 88.7% lower sample difference deviations than signals from DeepSimulator alone. This cost-effective and time-efficient tool facilitates the assessment of physical and logical redundancy for data reconstruction in DNA data storage without the need for real-time experiments.
5
3.0
1
Save