JC
Jianghua Cheng
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(50% Open Access)
Cited by:
472
h-index:
15
/
i10-index:
17
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
2

Accurate proteome-wide missense variant effect prediction with AlphaMissense

Jianghua Cheng et al.Sep 19, 2023
+13
J
G
J
The vast majority of missense variants observed in the human genome are of unknown clinical significance. We present AlphaMissense, an adaptation of AlphaFold fine-tuned on human and primate variant population frequency databases to predict missense variant pathogenicity. By combining structural context and evolutionary conservation, our model achieves state-of-the-art results across a wide range of genetic and experimental benchmarks, all without explicitly training on such data. The average pathogenicity score of genes is also predictive for their cell essentiality, capable of identifying short essential genes that existing statistical approaches are underpowered to detect. As a resource to the community, we provide a database of predictions for all possible human single amino acid substitutions and classify 89% of missense variants as either likely benign or likely pathogenic.
2
Citation463
0
Save
9

BERTMHC: Improves MHC-peptide class II interaction prediction with transformer and multiple instance learning

Jun Cheng et al.Nov 24, 2020
+2
K
J
J
Abstract Motivation Increasingly comprehensive characterisation of cancer associated genetic alteration has paved the way for the development of highly specific therapeutic vaccines. Predicting precisely binding and presentation of peptides by MHC alleles is an important step towards such therapies. Recent data suggest that presentation of both class I and II epitopes is critical for the induction of a sustained effective immune response. However, the prediction performance for MHC class II has been limited compared to class I. Results We present a transformer neural network model which leverages on self-supervised pretraining from a large corpus of protein sequences. We also propose a multiple instance learning (MIL) framework to deconvolve mass spectrometry data where multiple potential MHC alleles may have presented each peptide. We show that pretraining boosted the performance for these tasks. Combining pretraining and the novel MIL approach, our model outperforms state-of-the-art models for both binding and mass spectrometry presentation predictions. Availability Our model is available at https://github.com/s6juncheng/BERTMHC Contact jun.cheng@neclab.eu , brandon.malone@neclab.eu
0

MTSplice predicts effects of genetic variants on tissue-specific splicing

Jianghua Cheng et al.Jun 8, 2020
J
A
M
J
Abstract Tissue-specific splicing of exons plays an important role in determining tissue identity. However, computational tools predicting tissue-specific effects of variants on splicing are lacking. To address this issue, we developed MTSplice (Multi-tissue Splicing), a neural network which quantitatively predicts effects of human genetic variants on splicing of cassette exons in 56 tissues. MTSplice combines the state-of-the-art predictor MMSplice, which models constitutive regulatory sequences, with a new neural network which models tissue-specific regulatory sequences. MTSplice outperforms MMSplice on predicting effects associated with naturally occurring genetic variants in most tissues of the GTEx dataset. Furthermore, MTSplice predicts that autism-associated de novo mutations are enriched for variants affecting splicing specifically in the brain. MTSplice is provided free of use and open source at the model repository Kipoi. We foresee MTSplice to be useful for functional prediction and prioritization of variants associated with tissue-specific disorders.
0
Citation4
0
Save
0

Modular modeling improves the predictions of genetic variant effects on splicing

Jianghua Cheng et al.Oct 10, 2018
+4
K
T
J
Predicting the effects of genetic variants on splicing is highly relevant for human genetics. We describe the framework MMSplice (modular modeling of splicing) with which we built the winning model of the CAGI 2018 exon skipping prediction challenge. The MMSplice modules are neural networks scoring exon, intron, and splice sites, trained on distinct large-scale genomics datasets. These modules are combined to predict effects of variants on exon skipping, alternative donor and acceptor sites, splicing efficiency, and pathogenicity, with matched or higher performance than state-of-the-art. Our models, available in the repository Kipoi, apply to variants including indels directly from VCF files.
32

Artificial intelligence predicts the immunogenic landscape of SARS-CoV-2: toward universal blueprints for vaccine designs

Brandon Malone et al.Apr 21, 2020
+9
J
C
B
Abstract The global population is at present suffering from a pandemic of Coronavirus disease 2019 (COVID-19), caused by the novel coronavirus Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2). The goals of this study were to use artificial intelligence (AI) to predict blueprints for designing universal vaccines against SARS-CoV-2, that contain a sufficiently broad repertoire of T-cell epitopes capable of providing coverage and protection across the global population. To help achieve these aims, we profiled the entire SARS-CoV-2 proteome across the most frequent 100 HLA-A, HLA-B and HLA-DR alleles in the human population, using host-infected cell surface antigen presentation and immunogenicity predictors from the NEC Immune Profiler suite of tools, and generated comprehensive epitope maps. We then used these epitope maps as input for a Monte Carlo simulation designed to identify statistically significant “epitope hotspot” regions in the virus that are most likely to be immunogenic across a broad spectrum of HLA types. We then removed epitope hotspots that shared significant homology with proteins in the human proteome to reduce the chance of inducing off-target autoimmune responses. We also analyzed the antigen presentation and immunogenic landscape of all the nonsynonymous mutations across 3400 different sequences of the virus, to identify a trend whereby SARS-COV-2 mutations are predicted to have reduced potential to be presented by host-infected cells, and consequently detected by the host immune system. A sequence conservation analysis then removed epitope hotspots that occurred in less-conserved regions of the viral proteome. Finally, we used a database of the HLA genotypes of approximately 22 000 individuals to develop a “digital twin” type simulation to model how effective different combinations of hotspots would work in a diverse human population, and used the approach to identify an optimal constellation of epitopes hotspots that could provide maximum coverage in the global population. By combining the antigen presentation to the infected-host cell surface and immunogenicity predictions of the NEC Immune Profiler with a robust Monte Carlo and digital twin simulation, we have managed to profile the entire SARS-CoV-2 proteome and identify a subset of epitope hotspots that could be harnessed in a vaccine formulation to provide a broad coverage across the global population.
1

Aspartate reduces liver inflammation and fibrosis by suppressing the NLRP3 inflammasome pathway via upregulating NS3TP1 expression

Li Zhou et al.Jun 28, 2022
+6
J
A
L
Abstract Aspartate (Asp) can act on liver Kupffer cells, inhibit NOD-like receptor-P 3 (NLRP3) inflammatory bodies, and improve liver inflammation in acute hepatitis. However, the effect of Asp on the role of hepatic stellate cells (HSCs) in the pathogenesis of liver fibrosis in chronic liver injury remains unexplored. This study aimed to investigate the effects of Asp on CCl 4 -induced liver fibrosis in mice and HSCs via the NF-κB/ NLRP3 signaling pathway. Liver fibrosis was induced in C57BL/6J mice by intraperitoneally (IP) injecting 0.5 mL/kg 2% CCl 4 three times weekly for 8 weeks. Asp was administered to mice by gavage once every morning for 4 weeks. Masson’s trichrome staining, Sirius red staining and hematoxylin and eosin staining were used to detect and analyze the pathological changes in liver tissues. Western blot analysis and immunohistochemistry were applied to determine the protein expression levels of α-smooth muscle actin (α-SMA), collagen III (COL III), NLRP3, and IL-1β. Also, reverse transcription-quantitative PCR was performed to detect the mRNA expression levels. In the liver fibrosis model, the pathological changes in liver tissues improved following treatment with Asp. A marked decrease was observed in protein and mRNA expression levels of α-SMA, COL III, NLRP3, and IL-1β. In addition, HSCs were treated with Asp. The expression levels of α-SMA, COL III, NLRP3, and IL-1β reduced in dose- and time-dependent manners. Furthermore, Asp upregulated the expression of NS3TP1 in vivo and in vitro , and NS3TP1 had a significant inhibitory effect on liver fibrosis. Asp attenuated liver fibrosis and reduced collagen production by suppressing the NF-κB/ NLRP3 signaling pathway via upregulating the expression of NS3TP1.
0

Modeling positional effects of regulatory sequences with spline transformations increases prediction accuracy of deep neural networks

Žiga Avsec et al.Jul 18, 2017
J
J
M
Ž
Regulatory sequences are not solely defined by their nucleic acid sequence but also by their relative distances to genomic landmarks such as transcription start site, exon boundaries, or polyadenylation site. Deep learning has become the approach of choice for modeling regulatory sequences because of its strength to learn complex sequence features. However, modeling relative distances to genomic landmarks in deep neural networks has not been addressed. Here we developed spline transformation, a neural network module based on splines to flexibly and robustly model distances. Modeling distances to various genomic landmarks with spline transformations significantly increased state-of-the-art prediction accuracy of in vivo RNA-binding protein binding sites for 114 out of 123 proteins. We also developed a deep neural network for human splice branchpoint based on spline transformations that outperformed the current best, already distance-based, machine learning model. Compared to piecewise linear transformation, as obtained by composition of rectified linear units, spline transformation yields higher prediction accuracy as well as faster and more robust training. As spline transformation can be applied to further quantities beyond distances, such as methylation or conservation, we foresee it as a versatile component in the genomics deep learning toolbox. Spline transformation is implemented as a Keras layer in the CONCISE python package: github.com/gagneurlab/concise. Analysis code is available at goo.gl/3yMY5w.
0

Robotic parastomal hernia repair in Ileal-conduit patients: short-term results in a single-center cohort study

Tommaso Violante et al.Sep 6, 2024
+6
I
D
T
0

Kipoi: accelerating the community exchange and reuse of predictive models for genomics

Žiga Avsec et al.Jul 24, 2018
+9
J
R
Ž
Advanced machine learning models applied to large-scale genomics datasets hold the promise to be major drivers for genome science. Once trained, such models can serve as a tool to probe the relationships between data modalities, including the effect of genetic variants on phenotype. However, lack of standardization and limited accessibility of trained models have hampered their impact in practice. To address this, we present Kipoi, a collaborative initiative to define standards and to foster reuse of trained models in genomics. Already, the Kipoi repository contains over 2,000 trained models that cover canonical prediction tasks in transcriptional and post-transcriptional gene regulation. The Kipoi model standard grants automated software installation and provides unified interfaces to apply and interpret models. We illustrate Kipoi through canonical use cases, including model benchmarking, transfer learning, variant effect prediction, and building new models from existing ones. By providing a unified framework to archive, share, access, use, and build on models developed by the community, Kipoi will foster the dissemination and use of machine learning models in genomics.
0

Cis-regulatory elements explain most of the mRNA stability variation across genes in yeast

Jianghua Cheng et al.Nov 3, 2016
+2
Ž
K
J
The stability of mRNA is one of the major determinants of gene expression. Although a wealth of sequence elements regulating mRNA stability has been described, their quantitative contributions to half-life are unknown. Here, we built a quantitative model for Saccharomyces cerevisiae based on functional mRNA sequence features that explains 60% of the half-life variation between genes and predicts half-life at a median relative error of 30%. The model revealed a new destabilizing 3'UTR motif, ATATTC, which we functionally validated. Codon usage proves to be the major determinant of mRNA stability. Nonetheless, single-nucleotide variations have the largest effect when occurring on 3'UTR motifs or upstream AUGs. Analyzing mRNA half-life data of 34 knockout strains showed that the effect of codon usage not only requires functional decapping and deadenylation, but also the 5'-to-3' exonuclease Xrn1, the non-sense mediated decay genes, but not no-go decay. Altogether, this study quantitatively delineates the contributions of mRNA sequence features on stability in yeast, reveals their functional dependencies on degradation pathways, and allows accurate prediction of half-life from mRNA sequence.