JC
Jiayang Chen
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
5
(100% Open Access)
Cited by:
45
h-index:
26
/
i10-index:
46
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Interpretable RNA Foundation Model from Unannotated Data for Highly Accurate RNA Structure and Function Predictions

Jiayang Chen et al.Aug 7, 2022
Abstract Non-coding RNA structure and function are essential to understanding various biological processes, such as cell signaling, gene expression, and post-transcriptional regulations. These are all among the core problems in the RNA field. With the rapid growth of sequencing technology, we have accumulated a massive amount of unannotated RNA sequences. On the other hand, expensive experimental observatory results in only limited numbers of annotated data and 3D structures. Hence, it is still challenging to design computational methods for predicting their structures and functions. The lack of annotated data and systematic study causes inferior performance. To resolve the issue, we propose a novel RNA foundation model (RNA-FM) to take advantage of all the 23 million non-coding RNA sequences through self-supervised learning. Within this approach, we discover that the pre-trained RNA-FM could infer sequential and evolutionary information of non-coding RNAs without using any labels. Furthermore, we demonstrate RNA-FM’s effectiveness by applying it to the downstream secondary/3D structure prediction, SARS-CoV-2 genome structure and evolution prediction, protein-RNA binding preference modeling, and gene expression regulation modeling. The comprehensive experiments show that the proposed method improves the RNA structural and functional modelling results significantly and consistently. Despite only being trained with unlabelled data, RNA-FM can serve as the foundational model for the field.
4
Citation31
0
Save
6

Self-supervised contrastive learning for integrative single cell RNA-seq data analysis

Wenkai Han et al.Jul 27, 2021
Abstract Single-cell RNA-sequencing (scRNA-seq) has become a powerful tool to reveal the complex biological diversity and heterogeneity among cell populations. However, the technical noise and bias of the technology still have negative impacts on the downstream analysis. Here, we present a self-supervised Contrastive LEArning framework for scRNA-seq (CLEAR) profile representation and the downstream analysis. CLEAR overcomes the heterogeneity of the experimental data with a specifically designed representation learning task and thus can handle batch effects and dropout events. In the task, the deep learning model learns to pull together the representations of similar cells while pushing apart distinct cells, without manual labeling. It achieves superior performance on a broad range of fundamental tasks, including clustering, visualization, dropout correction, batch effect removal, and pseudo-time inference. The proposed method successfully identifies and illustrates inflammatory-related mechanisms in a COVID-19 disease study with 43,695 single cells from peripheral blood mononuclear cells. Further experiments to process a million-scale single-cell dataset demonstrate the scalability of CLEAR. This scalable method generates effective scRNA-seq data representation while eliminating technical noise, and it will serve as a general computational framework for single-cell data analysis.
19

AcrNET: Predicting Anti-CRISPR with Deep Learning

Yunxiang Li et al.Apr 2, 2022
ABSTRACT As an important group of proteins discovered in phages, anti-CRISPR inhibits the activity of the immune system of bacteria ( i.e ., CRISPR-Cas), showing great potential for gene editing and phage therapy. However, the prediction and discovery of anti-CRISPR are challenging for its high variability and fast evolution. Existing biological studies often depend on known CRISPR and anti-CRISPR pairs, which may not be practical considering the huge number of pairs in reality. Computational methods usually struggle with prediction performance. To tackle these issues, we propose a novel deep neural net work for a nti- CR ISPR analysis ( AcrNET ), which achieves impressive performance. On both the cross-fold and cross-dataset validation, our method outperforms the previous state-of-the-art methods significantly. Impressively, AcrNET improves the prediction performance by at least 15% regarding the F1 score for the cross-dataset test. Moreover, AcrNET is the first computational method to predict the detailed anti-CRISPR classes, which may help illustrate the anti-CRISPR mechanism. Taking advantage of a Transformer protein language model pre-trained on 250 million protein sequences, AcrNET overcomes the data scarcity problem. Extensive experiments and analysis suggest that Transformer model feature, evolutionary feature, and local structure feature complement each other, which indicates the critical properties of anti-CRISPR proteins. Combined with AlphaFold prediction, further motif analysis and docking experiments demonstrate that AcrNET captures the evolutionarily conserved pattern and the interaction between anti-CRISPR and the target implicitly. With the impressive prediction capability, AcrNET can serve as a valuable tool for anti-CRISPR study and new anti-CRISPR discovery, with a free webserver at https://proj.cse.cuhk.edu.hk/aihlab/AcrNET/ .
19
Citation3
0
Save
0

A MYT1L Syndrome mouse model recapitulates patient phenotypes and reveals altered brain development due to disrupted neuronal maturation

Xuhua Chen et al.Dec 17, 2020
Abstract Human genetics have defined a new autism-associated syndrome caused by loss-of-function mutations in MYT1L , a transcription factor known for enabling fibroblast-to-neuron conversions. However, how MYT1L mutation causes autism, ADHD, intellectual disability, obesity, and brain anomalies is unknown. Here, we develop a mouse model of this syndrome. Physically, Myt1l haploinsufficiency causes obesity, white-matter thinning, and microcephaly in the mice, mimicking clinical phenotypes. During brain development we discovered disrupted gene expression, mediated in part by loss of Myt1l gene target activation, and identified precocious neuronal differentiation as the mechanism for microcephaly. In contrast, in adults we discovered that mutation results in failure of transcriptional and chromatin maturation, echoed in disruptions in baseline physiological properties of neurons. This results in behavioral anomalies including hyperactivity, muscle weakness and fatigue, and social alterations with more severe phenotypes in males. Overall, our findings provide insight into the mechanistic underpinnings of this disorder and enable future preclinical studies.
0
Citation3
0
Save
1

Early zygotic gene product Dunk interacts with anillin to regulate Myosin II during Drosophila cleavage

Jiayang Chen et al.Feb 15, 2022
Abstract Drosophila cellularization is a special form of cleavage that converts syncytial embryos into cellular blastoderms by partitioning the peripherally localized nuclei into individual cells. An early event in cellularization is the recruitment of non-muscle myosin II (“myosin”) to the basal tip of cleavage furrows, where myosin forms an interconnected basal array before reorganizing into individual cytokinetic rings. The initial recruitment and organization of basal myosin are regulated by a cellularization-specific gene, dunk , but the underlying mechanism is unclear. Through a genome-wide yeast two-hybrid screen, we identified anillin (Scraps in Drosophila ), a conserved scaffolding protein in cytokinesis, as the primary binding partner of Dunk. We show that Dunk regulates the localization of anillin at the cleavage furrows during early cellularization and functionally interacts with anillin in regulating basal myosin. Furthermore, we show that anillin colocalizes with myosin since the onset of cellularization and is required for the initial recruitment and maintenance of myosin at the basal array, prior to the well-documented function of anillin in regulating cytokinetic ring assembly. Based on these results, we propose that Dunk regulates myosin recruitment and organization during early cellularization by interacting with and regulating anillin.