JZ
Jianyang Zeng
Author with expertise in Computational Methods in Drug Discovery
Tsinghua University, Westlake University, Silexon AI Technology (China)
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
22
(41% Open Access)
Cited by:
39
h-index:
30
/
i10-index:
47
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
31

A Community Challenge for Pancancer Drug Mechanism of Action Inference from Perturbational Profile Data

Eugene Douglass et al.Oct 24, 2023
+25
B
R
E
SUMMARY The Columbia Cancer Target Discovery and Development (CTD 2 ) Center has developed PANACEA (PANcancer Analysis of Chemical Entity Activity), a collection of dose-response curves and perturbational profiles for 400 clinical oncology drugs in cell lines selected to optimally represent 19 cancer subtypes. This resource, developed to study tumor-specific drug mechanism of action, was instrumental in hosting a DREAM Challenge to assess computational models for de novo drug polypharmacology prediction. Dose-response and perturbational profiles for 32 kinase inhibitors were provided to 21 participating teams, who did not know the identity or nature of the compounds, and they were asked to predict high-affinity binding among ~1,300 possible protein targets. Best performing methods leveraged both gene expression profile similarity analysis, and deep-learning methodologies trained on individual datasets. This study lays the foundation for future integrative analyses of pharmacogenomic data, reconciliation of polypharmacology effects in different tumor contexts, and insights into network-based assessment of context-specific drug mechanism of action.
0

A Network Integration Approach for Drug-Target Interaction Prediction and Computational Drug Repositioning from Heterogeneous Information

Ying Luo et al.May 6, 2020
+6
J
X
Y
Abstract The emergence of large-scale genomic, chemical and pharmacological data provides new opportunities for drug discovery and repositioning. Systematic integration of these heterogeneous data not only serves as a promising tool for identifying new drug-target interactions (DTIs), which is an important step in drug development, but also provides a more complete understanding of the molecular mechanisms of drug action. In this work, we integrate diverse drug-related information, including drugs, proteins, diseases and side-effects, together with their interactions, associations or similarities, to construct a heterogeneous network with 12,015 nodes and 1,895,445 edges. We then develop a new computational pipeline, called DTINet, to predict novel drug-target interactions from the constructed heterogeneous network. Specifically, DTINet focuses on learning a low-dimensional vector representation of features for each node, which accurately explains the topological properties of individual nodes in the heterogeneous network, and then predicts the likelihood of a new DTI based on these representations via a vector space projection scheme. DTINet achieves substantial performance improvement over other state-of-the-art methods for DTI prediction. Moreover, we have experimentally validated the novel interactions between three drugs and the cyclooxygenase (COX) protein family predicted by DTINet, and demonstrated the new potential applications of these identified COX inhibitors in preventing inflammatory diseases. These results indicate that DTINet can provide a practically useful tool for integrating heterogeneous information to predict new drug-target interactions and repurpose existing drugs. The source code of DTINet and the input heterogeneous network data can be downloaded from http://github.com/luoyunan/DTINet .
5

CAMP: a Convolutional Attention-based Neural Network for Multifaceted Peptide-protein Interaction Prediction

Yipin Lei et al.Oct 24, 2023
+5
Z
S
Y
Abstract Peptide-protein interactions (PepPIs) are involved in various fundamental cellular functions and their identification is crucial for designing efficacious peptide therapeutics. To facilitate the peptide drug discovery process, a number of computational methods have been developed to predict peptide-protein interactions. However, most of the existing prediction approaches heavily depend on high-resolution structure data. Although several deep-learning-based frameworks have been proposed to predict compound-protein interactions or protein-protein interactions, few of them are particularly designed to specifically predict peptide-protein interactions. In this paper, We present a sequence-based C onvolutional A ttention-based neural network for M ultifaceted prediction of P eptide-protein interactions, called CAMP , including predicting binary peptide-protein interactions and corresponding binding residues in the peptides. We also construct a benchmark dataset containing high-quality peptide-protein interaction pairs with the corresponding peptide binding residues for model training and evaluation. CAMP incorporates convolution neural network architectures and attention mechanism to fully exploit informative sequence-based features, including secondary structures, physicochemical properties, intrinsic disorder features and position-specific scoring matrix of the protein. Systematical evaluation of our benchmark dataset demonstrates that CAMP outperforms the state-of-the-art baseline methods on binary peptide-protein interaction prediction. In addition, CAMP can successfully identify the binding residues involved non-covalent interactions for peptides. These results indicate that CAMP can serve as a useful tool in peptide-protein interaction prediction and peptide binding site identification, which can thus greatly facilitate the peptide drug discovery process. The source code of CAMP can be found in https://github.com/twopin/CAMP .
5
Paper
Citation5
0
Save
0

TITER: predicting translation initiation sites by deep learning

Sai Zhang et al.May 6, 2020
+2
T
H
S
Abstract Motivation Translation initiation is a key step in the regulation of gene expression. In addition to the annotated translation initiation sites (TISs), the translation process may also start at multiple alternative TISs (including both AUG and non-AUG codons), which makes it challenging to predict TISs and study the underlying regulatory mechanisms. Meanwhile, the advent of several high-throughput sequencing techniques for profiling initiating ribosomes at single-nucleotide resolution, e.g., GTI-seq and QTI-seq, provides abundant data for systematically studying the general principles of translation initiation and the development of computational method for TIS identification. Methods We have developed a deep learning based framework, named TITER, for accurately predicting TISs on a genome-wide scale based on QTI-seq data. TITER extracts the sequence features of translation initiation from the surrounding sequence contexts of TISs using a hybrid neural network and further integrates the prior preference of TIS codon composition into a unified prediction framework. Results Extensive tests demonstrated that TITER can greatly outperform the state-of-the-art prediction methods in identifying TISs. In addition, TITER was able to identify important sequence signatures for individual types of TIS codons, including a Kozak-sequence-like motif for AUG start codon. Furthermore, the TITER prediction score can be related to the strength of translation initiation in various biological scenarios, including the repressive effect of the upstream open reading frames (uORFs) on gene expression and the mutational effects influencing translation initiation efficiency. Availability TITER is available as an open-source software and can be downloaded from https://github.com/zhangsaithu/titer Contact lzhang20@mail.tsinghua.edu.cn and zengjy321@tsinghua.edu.cn
8

Understanding the phase separation characteristics of nucleocapsid protein provides a new therapeutic opportunity against SARS-CoV-2

Dan Zhao et al.Oct 24, 2023
+14
X
W
D
Abstract The ongoing coronavirus disease 2019 (COVID-19) pandemic has raised an urgent need to develop effective therapeutics against the severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2). As a potential antiviral drug target, the nucleocapsid (N) protein of SARS-CoV-2 functions as a viral RNA chaperone and plays vital and multifunctional roles during the life cycle of coronavirus 1-3 . In this study, we discovered that the N protein of SARS-CoV-2 undergoes liquid-liquid phase separation (LLPS) both in vitro and in vivo , which is further modulated by viral RNA. In addition, we found that, the core component of the RNA-dependent RNA polymerase (RdRp) of SARS-CoV-2, nsp12, preferentially partitions into the N protein condensates. Moreover, we revealed that, two small molecules, i.e., CVL218 and PJ34, can be used to intervene the N protein driven phase separation and loosen the compact structures of the condensates of the N-RNA-nsp12 complex of SARS-CoV-2. The discovery of the LLPS-mediated interplay between N protein and nsp12 and the corresponding modulating compounds illuminates a feasible way to improve the accessibility of antiviral drugs (e.g., remdesivir) to their targets (e.g., nsp12/RdRp), and thus may provide useful hints for further development of effective therapeutic strategies against SARS-CoV-2.
8
Paper
Citation2
0
Save
3

MoTSE: an interpretable task similarity estimator for small molecular property prediction tasks

Han Li et al.Jan 16, 2021
+3
S
X
H
Abstract Understanding the molecular properties (e.g., physical, chemical or physiological characteristics and biological activities) of small molecules plays essential roles in biomedical researches. The accumulating amount of datasets has enabled the development of data-driven computational methods, especially the machine learning based methods, to address the molecular property prediction tasks. Due to the high cost of obtaining experimental labels, the datasets of individual tasks generally contain limited amount of data, which inspired the application of transfer learning to boost the performance of the molecular property prediction tasks. Our analyses revealed that simultaneously considering similar tasks, rather than randomly chosen ones, can significantly improve the performance of transfer learning in this field. To provide accurate estimation of task similarity, we proposed an effective and interpretable computational tool, named Molecular Tasks Similarity Estimator (MoTSE). By extracting task-related local and global knowledge from pretrained graph neural networks (GNNs), MoTSE projects individual tasks into a latent space and measures the distance between the embedded vectors to derive the task similarity estimation and thus enhance the molecular prediction results. We have validated that the task similarity estimated by MoTSE can serve as a useful guidance to design a more accurate transfer learning strategy for molecular property prediction. Experimental results showed that such a strategy greatly outperformed baseline methods including training from scratch and multitask learning. Moreover, MoTSE can provide interpretability for the estimated task similarity, through visualizing the important loci in the molecules attributed by the attribution method employed in MoTSE. In summary, MoTSE can provide an accurate method for estimating the molecular property task similarity for effective transfer learning, with good interpretability for the learned chemical or biological insights underlying the intrinsic principles of the task similarity.
0

NeoDTI: Neural integration of neighbor information from a heterogeneous network for discovering new drug-target interactions

Fangping Wan et al.May 6, 2020
+2
X
L
F
Motivation: Accurately predicting drug-target interactions (DTIs) in silico can guide the drug discovery process and thus facilitate drug development. Computational approaches for DTI prediction that adopt the systems biology perspective generally exploit the rationale that the properties of drugs and targets can be characterized by their functional roles in biological networks. Results: Inspired by recent advance of information passing and aggregation techniques that generalize the convolution neural networks (CNNs) to mine large-scale graph data and greatly improve the performance of many network-related prediction tasks, we develop a new nonlinear end-to-end learning model, called NeoDTI, that integrates diverse information from heterogeneous network data and automatically learns topology-preserving representations of drugs and targets to facilitate DTI prediction. The substantial prediction performance improvement over other state-of-the-art DTI prediction methods as well as several novel predicted DTIs with evidence supports from previous studies have demonstrated the superior predictive power of NeoDTI. In addition, NeoDTI is robust against a wide range of choices of hyperparameters and is ready to integrate more drug and target related information (e.g., compound protein binding affinity data). All these results suggest that NeoDTI can offer a powerful and robust tool for drug development and drug repositioning. Availability and implementation: The source code and data used in NeoDTI are available at: https://github.com/FangpingWan/NeoDTI.
0

DeepHINT: Understanding HIV-1 integration via deep learning with attention

Hailin Hu et al.May 7, 2020
+6
S
X
H
Motivation: Human immunodeficiency virus type 1 (HIV-1) genome integration is closely related to clinical latency and viral rebound. In addition to human DNA sequences that directly interact with the integration machinery, the selection of HIV integration sites has also been shown to depend on the heterogeneous genomic context around a large region, which greatly hinders the prediction and mechanistic studies of HIV integration. Results: We have developed an attention-based deep learning framework, named DeepHINT, to simultaneously provide accurate prediction of HIV integration sites and mechanistic explanations of the detected sites. Extensive tests on a high-density HIV integration site dataset showed that DeepHINT can outperform conventional modeling strategies by automatically learning the genomic context of HIV integration solely from primary DNA sequence information. Systematic analyses on diverse known factors of HIV integration further validated the biological relevance of the prediction result. More importantly, in-depth analyses of the attention values output by DeepHINT revealed intriguing mechanistic implications in the selection of HIV integration sites, including potential roles of several basic helix-loop-helix (bHLH) transcription factors and zinc finger proteins. These results established DeepHINT as an effective and explainable deep learning framework for the prediction and mechanistic study of HIV integration. Availability: DeepHINT is available as an open-source software and can be downloaded from https://github.com/nonnerdling/DeepHINT Contact: lzhang20@mail.tsinghua.edu.cn and zengjy321@tsinghua.edu.cn
0

Metagenomic binning through low density hashing

Ying Luo et al.May 6, 2020
+2
J
Y
Y
Bacterial microbiomes of incredible complexity are found throughout the world, from exotic marine locations to the soil in our yards to within our very guts. With recent advances in Next-Generation Sequencing (NGS) technologies, we have vastly greater quantities of microbial genome data, but the nature of environmental samples is such that DNA from different species are mixed together. Here, we present Opal for metagenomic binning, the task of identifying the origin species of DNA sequencing reads. Our Opal method introduces low-density, even-coverage hashing to bioinformatics applications, enabling quick and accurate metagenomic binning. Our tool is up to two orders of magnitude faster than leading alignment-based methods at similar or improved accuracy, allowing computational tractability on large metagenomic datasets. Moreover, on public benchmarks, Opal is substantially more accurate than both alignment-based and alignment-free methods (e.g. on SimHC20.500, Opal achieves 95% F1-score while Kraken and CLARK achieve just 91% and 88%, respectively); this improvement is likely due to the fact that the latter methods cannot handle computationally-costly long-range dependencies, which our even-coverage, low-density fingerprints resolve. Notably, capturing these long-range dependencies drastically improves Opal's ability to detect unknown species that share a genus or phylum with known bacteria. Additionally, the family of hash functions Opal uses can be generalized to other sequence analysis tasks that rely on k-mer based methods to encode long-range dependencies.
0

ACME: Pan-specific peptide-MHC class I binding prediction through attention-based deep neural networks

Yan Hu et al.May 7, 2020
+7
H
Z
Y
Prediction of peptide binding to MHC molecules plays a vital role in the development of therapeutic vaccines for the treatment of cancer. Although numerous computational methods have been developed to this end, several challenges still remain in predicting peptide-MHC interactions. Many previous methods are allele-specific, training separate models for individual alleles and are thus unable to yield accurate predictions for those alleles with limited training data. Despite that there exist several pan-specific algorithms that train a common model for different alleles, they only adopt simple model structures that generally have limited performance in capturing the complex underlying patterns of peptide-MHC interactions. Here we present ACME (Attention-based Convolutional neural networks for MHC Epitope binding prediction), a new pan-specific algorithm to accurately predict the binding affinities between peptides and MHC class I molecules, even for those new alleles that are not seen in the training data. Extensive tests have demonstrated that ACME can significantly outperform other state-of-the-art prediction methods with an increase of the Pearson Correlation Coefficient by up to 23 percent. In addition, its ability to identify strong-binding peptides has been experimentally validated. Moreover, by integrating the convolutional neural network with attention mechanism, ACME is able to extract interpretable patterns that can provide useful and detailed insights into the binding preferences between peptides and their MHC partners. All these results have demonstrated that ACME can provide a powerful and practically useful tool for the studies of peptide-MHC class I interactions.
Load More