XL
Xiangrong Liu
Author with expertise in Prediction of Protein Subcellular Localization
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(38% Open Access)
Cited by:
586
h-index:
36
/
i10-index:
81
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

deepDR: a network-based deep learning approach toin silicodrug repositioning

Xiangxiang Zeng et al.May 14, 2019
Traditional drug discovery and development are often time-consuming and high risk. Repurposing/repositioning of approved drugs offers a relatively low-cost and high-efficiency approach toward rapid development of efficacious treatments. The emergence of large-scale, heterogeneous biological networks has offered unprecedented opportunities for developing in silico drug repositioning approaches. However, capturing highly non-linear, heterogeneous network structures by most existing approaches for drug repositioning has been challenging.In this study, we developed a network-based deep-learning approach, termed deepDR, for in silico drug repurposing by integrating 10 networks: one drug-disease, one drug-side-effect, one drug-target and seven drug-drug networks. Specifically, deepDR learns high-level features of drugs from the heterogeneous networks by a multi-modal deep autoencoder. Then the learned low-dimensional representation of drugs together with clinically reported drug-disease pairs are encoded and decoded collectively via a variational autoencoder to infer candidates for approved drugs for which they were not originally approved. We found that deepDR revealed high performance [the area under receiver operating characteristic curve (AUROC) = 0.908], outperforming conventional network-based or machine learning-based approaches. Importantly, deepDR-predicted drug-disease associations were validated by the ClinicalTrials.gov database (AUROC = 0.826) and we showcased several novel deepDR-predicted approved drugs for Alzheimer's disease (e.g. risperidone and aripiprazole) and Parkinson's disease (e.g. methylphenidate and pergolide).Source code and data can be downloaded from https://github.com/ChengF-Lab/deepDR.Supplementary data are available online at Bioinformatics.
1

DNA Storage Designer: A practical and holistic design platform for storing digital information in DNA sequence

Likun Jiang et al.Jul 12, 2023
Abstract DNA molecules, as natural information carriers, have several benefits over conventional digital storage mediums, including high information density and long-term durability. It is expected to be a promising candidate for information storage. However, despite significant research in this field, the pace of development has been slow due to the lack of complete encoding-decoding platform and simulaton-evaluation system. And the mutation in DNA sequences during synthesis and sequencing requires multiple experiments, and wet experiments can be costly. Thus, a silicon-based simulation platform is urgently needed for promoting research. Therefore, we proposed DNA Storage Designer, the first online platform to simulate the whole process of DNA storage experiments. Our platform offers classical and novel technologies and experimental settings that simulate three key processes: encoding, error simulation, and decoding for DNA storage system. Fisrt, 8 mainstream encoding methods were embedded in the encoding process to convert files to DNA sequences. Secondly, to uncover potential mutations and sequence distribution changes in actual experiments we integrate the simulation setting for five typical experiment sub-processes (synthesis, decay, PCR, sampling, and sequencing) in the error simulation stage. Finally, the corresponding decoding process realizes the conversion of DNA sequence to binary sequence. All the above simulation processes correspond to an analysis report will provide guides for better experiment design for researchers’ convenience. In short, DNA Storage Designer is an easy-to-use and automatic web-server for simulating DNA storage experiments, which could advance the development of DNA storage-related research. And it is freely available for all users at: https://dmci.xmu.edu.cn/dna/ . Author summary DNA storage technology is an emerging and promising storage technology. At the same time, DNA storage is an interdisciplinary technology that requires researchers to know both computer cryptography and biological experiments knowledge. However, DNA storage experiments are costly and lengthy, many studies have been prevented by the lack of a comprehensive design and evaluation platform to guide DNA storage experiments. Herein, we introduce DNA Storage Designer, the first integrated and practical web server for providing the simulation of the whole process of DNA storage application, from encoding, error simulation during preservation, to decoding. In the encoding process, we not only provided the coding DNA sequences but also analyzed the sequence stability. In the error simulation process, we simulated as many experimental situations as possible, such as different mutation probabilities of DNA sequences due to being stored in different bacteria hosts or different sequencing platforms. The platform provides high freedom in that users could not only encode their files and conduct the entire operation but also could upload FASTA files and only simulate the sustaining process of sequences and imitate the mutation errors together with distribution changes of sequences.
1
Citation1
0
Save
0

Glypred: Lysine Glycation Site Prediction via CCU–LightGBM–BiLSTM Framework with Multi-Head Attention Mechanism

Yun Zuo et al.Aug 9, 2024
Glycation, a type of posttranslational modification, preferentially occurs on lysine and arginine residues, impairing protein functionality and altering characteristics. This process is linked to diseases such as Alzheimer's, diabetes, and atherosclerosis. Traditional wet lab experiments are time-consuming, whereas machine learning has significantly streamlined the prediction of protein glycation sites. Despite promising results, challenges remain, including data imbalance, feature redundancy, and suboptimal classifier performance. This research introduces Glypred, a lysine glycation site prediction model combining ClusterCentroids Undersampling (CCU), LightGBM, and bidirectional long short-term memory network (BiLSTM) methodologies, with an additional multihead attention mechanism integrated into the BiLSTM. To achieve this, the study undertakes several key steps: selecting diverse feature types to capture comprehensive protein information, employing a cluster-based undersampling strategy to balance the data set, using LightGBM for feature selection to enhance model performance, and implementing a bidirectional LSTM network for accurate classification. Together, these approaches ensure that Glypred effectively identifies glycation sites with high accuracy and robustness. For feature encoding, five distinct feature types─AAC, KMER, DR, PWAA, and EBGW─were selected to capture a broad spectrum of protein sequence and biological information. These encoded features were integrated and validated to ensure comprehensive protein information acquisition. To address the issue of highly imbalanced positive and negative samples, various undersampling algorithms, including random undersampling, NearMiss, edited nearest neighbor rule, and CCU, were evaluated. CCU was ultimately chosen to remove redundant nonglycated training data, establishing a balanced data set that enhances the model's accuracy and robustness. For feature selection, the LightGBM ensemble learning algorithm was employed to reduce feature dimensionality by identifying the most significant features. This approach accelerates model training, enhances generalization capabilities, and ensures good transferability of the model. Finally, a bidirectional long short-term memory network was used as the classifier, with a network structure designed to capture glycation modification site features from both forward and backward directions. To prevent overfitting, appropriate regularization parameters and dropout rates were introduced, achieving efficient classification. Experimental results show that Glypred achieved optimal performance. This model provides new insights for bioinformatics and encourages the application of similar strategies in other fields. A lysine glycation site prediction software tool was also developed using the PyQt5 library, offering researchers an auxiliary screening tool to reduce workload and improve efficiency. The software and data sets are available on GitHub: https://github.com/ZBYnb/Glypred.
0

A heterogeneous graph neural network with automatic discovery of effective metapaths for drug-target interaction prediction

M Zhang et al.May 27, 2024
Predicting potential Drug-Target Interactions (DTIs) is a critical step in drug discovery. In recent years, graph machine learning methods based on heterogeneous networks have garnered significant attention and have demonstrated advantages in predicting potential DTIs. However, existing methods require the specification of metapaths for different types of nodes to learn node features, which fails to fully and effectively mine the high-order relationships between nodes. Moreover, most methods do not generate meaningful embeddings for nodes in the network, relying solely on the network's topological structure to learn feature representations of drugs and targets. To address these limitations, we propose a novel DTI prediction framework based on heterogeneous networks, named ADEM, which can Automatically Discover Effective Metapaths for any type of node. In addition, this framework employs similarity constraints as prior knowledge to generate meaningful embeddings for nodes in the network. ADEM outperforms classical and state-of-the-art models on three benchmark DTI datasets. Experimental analysis validates the effectiveness and rationality of the ADEM framework and its individual modules. Furthermore, the metapaths discovered by ADEM can enhance the performance of existing models in DTI prediction tasks.
0

The Co‐Infection of ISKNVII and RGNNV Resulting in Mass Mortality of Juvenile Asian Seabass (Lates calcarifer), Zhuhai, Southern China

Qianqian Sun et al.Dec 2, 2024
ABSTRACT Infectious spleen and kidney necrosis virus (ISKNV) and nervous necrosis virus (NNV) are two common and important causative agents in marine‐cultured fish. However, high viral loads of both ISKNV and NNV in the same clinical case is unusual. In this study, a mass mortality event of Asian seabass Lates calcarifer juveniles occurred in Zhuhai, the main Asian seabass cultured area in mainland China. The fish samples were pooled for pathogen identification and both high viral loads of ISKNV and NNV were detected by real‐time microfluidic quantitative PCR and conventional PCR. Immunohistochemistry and immunofluorescence showed that strong ISKNV signals were detected in spleen and liver, while strong NNV signals were detected in brain and eye. The tissue homogenates were inoculated into MFF‐1 cell and SSN‐1 cell, respectively. After several viral passages, both individual ISKNV and NNV were purely isolated from each other, and designated as ASB‐ISKNV‐23 and ASB‐NNV‐23, respectively. The whole genome sequences of ASB‐ISKNV‐23 and ASB‐NNV‐23 were determined and annotated. The result showed that ASB‐ISKNV‐23 and ASB‐NNV‐23 are composed of 112,236 bp and 4441 bp, respectively. Phylogeny analysis showed that ASB‐ISKNV‐23 belongs to ISKNV‐II sub‐genotype and ASB‐NNV‐23 belongs to RGNNV genotype. Collectedly, coinfection of ISKNV‐II and RGNNV were firstly documented in mass mortality of Asian seabass in mainland China. Importantly, both individual ISKNV‐II and RGNNV were purely isolated using two different permissive cell lines. Our study provides useful information for better understanding the complex pathogenesis regarding the coinfection with ISKNV and NNV in farmed fish.
Load More