YY
Ye Yuan
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(82% Open Access)
Cited by:
2,054
h-index:
27
/
i10-index:
48
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Understanding Convolution for Semantic Segmentation

Panqu Wang et al.Mar 1, 2018
Recent advances in deep learning, especially deep convolutional neural networks (CNNs), have led to significant improvement over previous semantic segmentation systems. Here we show how to improve pixel-wise semantic segmentation by manipulating convolution-related operations that are of both theoretical and practical value. First, we design dense upsampling convolution (DUC) to generate pixel-level prediction, which is able to capture and decode more detailed information that is generally missing in bilinear upsampling. Second, we propose a hybrid dilated convolution (HDC) framework in the encoding phase. This framework 1) effectively enlarges the receptive fields (RF) of the network to aggregate global information; 2) alleviates what we call the "gridding issue"caused by the standard dilated convolution operation. We evaluate our approaches thoroughly on the Cityscapes dataset, and achieve a state-of-art result of 80.1% mIOU in the test set at the time of submission. We also have achieved state-of-theart overall on the KITTI road estimation benchmark and the PASCAL VOC2012 segmentation task. Our source code can be found at https://github.com/TuSimple/TuSimple-DUC.
19

Cell Type Assignments for Spatial Transcriptomics Data

Haotian Teng et al.Feb 26, 2021
ABSTRACT Motivation Recent advancements in fluorescence in situ hybridization (FISH) techniques enable them to concurrently obtain information on the location and gene expression of single cells. A key question in the initial analysis of such spatial transcriptomics data is the assignment of cell types. To date, most studies used methods that only rely on the expression levels of the genes in each cell for such assignments. To fully utilize the data and to improve the ability to identify novel sub-types we developed a new method, FICT, which combines both expression and neighborhood information when assigning cell types. Results FICT optimizes a probabilistic function that we formalize and for which we provide learning and inference algorithms. We used FICT to analyze both simulated and several real spatial transcriptomics data. As we show, FICT can accurately identify cell types and sub-types improving on expression only methods and other methods proposed for clustering spatial transcriptomics data. Some of the spatial sub-types identified by FICT provide novel hypotheses about the new functions for excitatory and inhibitory neurons. Availability FICT is available at: https://github.com/haotianteng/FICT Contact zivbj@andrew.cmu.edu
19
Citation5
0
Save
0

Deep learning of gene relationships from single cell time-course expression data

Ye Yuan et al.Sep 22, 2020
Abstract Motivation Time-course gene expression data has been widely used to infer regulatory and signaling relationships between genes. Most of the widely used methods for such analysis were developed for bulk expression data. Single cell RNA-Seq (scRNA-Seq) data offers several advantages including the large number of expression profiles available and the ability to focus on individual cells rather than averages. However, this data also raises new computational challenges. Results Using a novel encoding for scRNA-Seq expression data we develop deep learning methods for interaction prediction from time-course data. Our methods use a supervised framework which represents the data as a 3D tensor and train convolutional and recurrent neural networks (CNN and RNN) for predicting interactions. We tested our Time-course Deep Learning (TDL) models on five different time series scRNA-Seq datasets. As we show, TDL can accurately identify causal and regulatory gene-gene interactions and can also be used to assign new function to genes. TDL improves on prior methods for the above tasks and can be generally applied to new time series scRNA-Seq data. Availability and Implementation Freely available at https://github.com/xiaoyeye/TDL . Contact zivbj@cs.cmu.edu Supplementary information Supplementary data are available at XXX online.
0

GCNG: Graph convolutional networks for inferring cell-cell interactions

Ye Yuan et al.Dec 23, 2019
Several methods have been developed for inferring gene-gene interactions from expression data. To date, these methods mainly focused on intra-cellular interactions. The availability of high throughput spatial expression data opens the door to methods that can infer such interactions both within and between cells. However, the spatial data also raises several new challenges. These include issues related to the sparse, noisy expression vectors for each cell, the fact that several different cell types are often profiled, the definition of a neighborhood of cell and the relatively small number of extracellular interactions. To enable the identification of gene interactions between cells we extended a Graph Convolutional Neural network approach for Genes (GCNG). We encode the spatial information as a graph and use the network to combine it with the expression data using supervised training. Testing GCNG on spatial transcriptomics data we show that it improves upon prior methods suggested for this task and can propose novel pairs of extracellular interacting genes. Finally, we show that the output of GCNG can also be used for down-stream analysis including functional assignment.
0

Integration of multi-source gene interaction networks and omics data with graph attention networks to identify novel disease genes

Yi Fang et al.Dec 5, 2023
Abstract The pathogenesis of diseases is closely associated with genes, and the discovery of disease genes holds significant importance for understanding disease mechanisms and designing targeted therapeutics. However, biological validation of all genes for diseases is expensive and challenging. In this study, we propose DGP-AMIO, a computational method based on graph attention networks, to rank all unknown genes and identify potential novel disease genes by integrating multi-omics and gene interaction networks from multiple data sources. DGP-AMIO outperforms other methods significantly on 20 disease datasets, with an average AUROC and AUPR exceeding 0.9. The superior performance of DGP-AMIO is attributed to the integration of multiomics and gene interaction networks from multiple databases, as well as triGAT, a proposed GAT-based method that enables precise identification of disease genes in directed gene networks. Enrichment analysis conducted on the top 100 genes predicted by DGP-AMIO and literature research revealed that a majority of enriched GO terms, KEGG pathways and top genes were associated with diseases supported by relevant studies. We believe that our method can serve as an effective tool for identifying disease genes and guiding subsequent experimental validation efforts.
Load More