JP
Jiajie Peng
Author with expertise in Microarray Data Analysis and Gene Expression Profiling
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
17
(53% Open Access)
Cited by:
245
h-index:
28
/
i10-index:
61
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Identifying drug–target interactions based on graph convolutional network and deep neural network

Tianyi Zhao et al.Mar 9, 2020
Identification of new drug-target interactions (DTIs) is an important but a time-consuming and costly step in drug discovery. In recent years, to mitigate these drawbacks, researchers have sought to identify DTIs using computational approaches. However, most existing methods construct drug networks and target networks separately, and then predict novel DTIs based on known associations between the drugs and targets without accounting for associations between drug-protein pairs (DPPs). To incorporate the associations between DPPs into DTI modeling, we built a DPP network based on multiple drugs and proteins in which DPPs are the nodes and the associations between DPPs are the edges of the network. We then propose a novel learning-based framework, 'graph convolutional network (GCN)-DTI', for DTI identification. The model first uses a graph convolutional network to learn the features for each DPP. Second, using the feature representation as an input, it uses a deep neural network to predict the final label. The results of our analysis show that the proposed framework outperforms some state-of-the-art approaches by a large margin.
0
Citation233
0
Save
1

A novel framework for single-cell Hi-C clustering based on graph-convolution-based imputation and two-phase-based feature extraction

Caiwei Zhen et al.May 1, 2021
ABSTRACT The three-dimensional genome structure plays a key role in cellular function and gene regulation. Singlecell Hi-C technology can capture genome structure information at the cell level, which provides the opportunity to study how genome structure varies among different cell types. However, few methods are well designed for single-cell Hi-C clustering, because of high sparsity, noise and heterogeneity of single-cell Hi-C data. In this manuscript, we propose a novel framework, named ScHiC-Rep, for singlecell Hi-C data representation and clustering. ScHiC-Rep mainly contains two parts: data imputation and feature extraction. In the imputation part, a novel imputation workflow is proposed, including graph convolution-based, random walk with restart-based and genomic neighbor-based imputation. In the feature extraction part, a two-phase feature extraction method is proposed, including linear phase for chromosome level and non-linear phase for cell level feature extraction. The evaluation results show that the proposed framework outperforms existing state-of-the-art approaches on both human and mouse datasets.
0

Accurately deciphering spatial domains for spatially resolved transcriptomics with stCluster

NULL AUTHOR_ID et al.May 23, 2024
Abstract Spatial transcriptomics provides valuable insights into gene expression within the native tissue context, effectively merging molecular data with spatial information to uncover intricate cellular relationships and tissue organizations. In this context, deciphering cellular spatial domains becomes essential for revealing complex cellular dynamics and tissue structures. However, current methods encounter challenges in seamlessly integrating gene expression data with spatial information, resulting in less informative representations of spots and suboptimal accuracy in spatial domain identification. We introduce stCluster, a novel method that integrates graph contrastive learning with multi-task learning to refine informative representations for spatial transcriptomic data, consequently improving spatial domain identification. stCluster first leverages graph contrastive learning technology to obtain discriminative representations capable of recognizing spatially coherent patterns. Through jointly optimizing multiple tasks, stCluster further fine-tunes the representations to be able to capture complex relationships between gene expression and spatial organization. Benchmarked against six state-of-the-art methods, the experimental results reveal its proficiency in accurately identifying complex spatial domains across various datasets and platforms, spanning tissue, organ, and embryo levels. Moreover, stCluster can effectively denoise the spatial gene expression patterns and enhance the spatial trajectory inference. The source code of stCluster is freely available at https://github.com/hannshu/stCluster.
0
Paper
Citation1
0
Save
0

A multi-scale feature fusion model based on biological knowledge graph and transformer-encoder for drug-drug interaction prediction

Tao Wang et al.Jan 15, 2024
Abstract Drug-Drug Interaction (DDI) refers to the combined effects that occur when a patient takes multiple medications simultaneously or within the same period. This interaction can either enhance the therapeutic effects of the drugs or inhibit their efficacy, and in severe cases, it can even lead to adverse drug reactions (ADRs). Thus, it is crucial to identify potential DDIs, as this information is significant for both biological research and clinical medicine. However, most existing works only consider the information of individual drugs or focus on the local correlation between a few medical entities, thus overlooking the global performance of the entire human medical system and the potential synergistic effects of multi-scale information. Consequently, these limitations hinder the predictive ability of models. In this paper, we propose an innovative multi-scale feature fusion model called ALG-DDI, which can comprehensively incorporate attribute information, local biological information, and global semantic information. To achieve this, we first employ the Attribute Masking method to obtain the embedding vector of the molecular graph. Next, ALG-DDI leverages heterogeneous graphs to capture the local biological information between drugs and several highly related biological entities. The global semantic information is also learned from the medicine-oriented large knowledge graphs. Finally, we employ a transformer encoder to fuse the multi-scale drug representations and feed the resulting drug pair vector into a fully connected neural network for prediction. Experimental evaluations on datasets of varying sizes and different classification tasks demonstrate that ALG-DDI outperforms other state-of-the-art models.
0

xQTLImp: efficient and accurate xQTL summary statistics imputation

Tao Wang et al.Aug 10, 2019
Motivation Quantitative trait locus (QTL) analysis of multiomic molecular traits, such as gene transcription (eQTL), DNA methylation (mQTL) and histone modification (haQTL), has been widely used to infer the effects of genomic variation on multiple levels of molecular activities. However, the power of xQTL (various types of QTLs) detection is largely limited by missing association statistics due to missing genotypes and limited effective sample size. Existing hidden Markov model (HMM)-based imputation approaches require individual-level genotypes and molecular traits, which are rarely available. No available implementation exists for the imputation of xQTL summary statistics when individual-level data are missed.Results We present xQTLImp, a C++ software package specifically designed for efficient imputation of xQTL summary statistics based on multivariate Gaussian approximation. Experiments on a single-cell eQTL dataset demonstrates that a considerable amount of novel significant eQTL associations can be rediscovered by xQTLImp.Availability Software is available at .Contact ydwang{at}hit.edu.cn or jiajiepeng{at}nwpu.edu.cnSupplementary information Supplementary data are available at Bioinformatics online.
0

A systems-biology approach connects aging mechanisms with Alzheimer’s disease pathogenesis

Matthew Leventhal et al.Mar 17, 2024
Summary Age is the strongest risk factor for developing Alzheimer’s disease, the most common neurodegenerative disorder. However, the mechanisms connecting advancing age to neurodegeneration in Alzheimer’s disease are incompletely understood. We conducted an unbiased, genome-scale, forward genetic screen for age-associated neurodegeneration in Drosophila to identify the underlying biological processes required for maintenance of aging neurons. To connect genetic screen hits to Alzheimer’s disease pathways, we measured proteomics, phosphoproteomics, and metabolomics in Drosophila models of Alzheimer’s disease. We further identified Alzheimer’s disease human genetic variants that modify expression in disease-vulnerable neurons. Through multi-omic, multi-species network integration of these data, we identified relationships between screen hits and tau-mediated neurotoxicity. Furthermore, we computationally and experimentally identified relationships between screen hits and DNA damage in Drosophila and human iPSC-derived neural progenitor cells. Our work identifies candidate pathways that could be targeted to attenuate the effects of age on neurodegeneration and Alzheimer’s disease.
0

Efficient integration of multiple spatial transcriptomics data for 3D domain detection, matching, and alignment with stMSA

Han Shu et al.Jul 30, 2024
Abstract Spatial transcriptomics (ST) is a powerful methodology that enables the study of genes within tissue architecture by providing gene expression information along with spatial location data. With the increasing availability of ST datasets, researchers are now inclined to explore potential biological features across larger datasets simultaneously, aiming for a more comprehensive understanding. However, existing methods primarily focus on cross-batch feature learning, often overlooking the intricate spatial patterns within individual slices. This limitation poses a significant challenge in effectively integrating features across different slices while considering slice-specific patterns. To address this challenge and enhance the integration performance of multi-slice data, we propose stMSA, a deep graph contrastive-learning model that incorporates graph auto-encoder techniques. stMSA is specifically designed to generate batch-corrected representations while preserving the unique spatial patterns within each slice, simultaneously considering both inner-batch and cross-batch patterns during the integration process. Our extensive evaluations demonstrate that stMSA outperforms state-of-the-art methods in discerning tissue structures across different slices, even when confronted with diverse experimental protocols and sequencing technologies. Furthermore, stMSA exhibits remarkable performance in cross-slice matching and alignment for three-dimensional reconstruction. The source code for stMSA is available at https://github.com/hannshu/stMSA .
0

Vulnerability detection based on transformer and high‐quality number embedding

Yang Cao et al.Sep 23, 2024
Summary Software vulnerability detection is an important problem in software security. In recent years, deep learning offers a novel approach for source code vulnerability detection. Due to the similarities between programming languages and natural languages, many natural language processing techniques have been applied to vulnerability detection tasks. However, specific problems within vulnerability detection tasks, such as buffer overflow, involve numerical reasoning. For these problems, the model needs to not only consider long dependencies and multiple relationships between statements of code but also capture the magnitude property of numerical literals in the program through high‐quality number embeddings. Therefore, we propose VDTransformer, a Transformer‐based method that improves source code embedding by integrating word and number embeddings. Furthermore, we employ Transformer encoders to construct a hierarchical neural network that extracts semantic features from the code and enables line‐level vulnerability detection. To evaluate the effectiveness of the method, we construct a dataset named OverflowGen based on templates for buffer overflow. Experimental comparisons on OverflowGen with a well‐known static vulnerability detector and two state‐of‐the‐art deep learning‐based methods confirm the effectiveness of VDTransformer and the importance of high‐quality number embeddings in vulnerability detection tasks involving numerical features.
Load More