XK
Xiangtai Kong
Author with expertise in Computational Methods in Drug Discovery
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(83% Open Access)
Cited by:
6
h-index:
3
/
i10-index:
0
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Deep representation learning of chemical-induced transcriptional profile for phenotype-based drug discovery

Xiaochu Tong et al.Jun 25, 2024
+9
X
N
X
Abstract Artificial intelligence transforms drug discovery, with phenotype-based approaches emerging as a promising alternative to target-based methods, overcoming limitations like lack of well-defined targets. While chemical-induced transcriptional profiles offer a comprehensive view of drug mechanisms, inherent noise often obscures the true signal, hindering their potential for meaningful insights. Here, we highlight the development of TranSiGen, a deep generative model employing self-supervised representation learning. TranSiGen analyzes basal cell gene expression and molecular structures to reconstruct chemical-induced transcriptional profiles with high accuracy. By capturing both cellular and compound information, TranSiGen-derived representations demonstrate efficacy in diverse downstream tasks like ligand-based virtual screening, drug response prediction, and phenotype-based drug repurposing. Notably, in vitro validation of TranSiGen’s application in pancreatic cancer drug discovery highlights its potential for identifying effective compounds. We envisage that integrating TranSiGen into the drug discovery and mechanism research holds significant promise for advancing biomedicine.
0
Citation3
0
Save
0

Fine-tuning Large Language Models for Chemical Text Mining

Wei Zhang et al.Jan 1, 2024
+15
X
Q
W
Extracting knowledge from complex and diverse chemical texts is a pivotal task for both experimental and computational chemists. The task is still considered to be extremely challenging due to the complexity of the chemical language and scientific literature. This study explored the power of fine-tuned large language models (LLMs) on five intricate chemical text mining tasks: compound entity recognition, reaction role labelling, metal-organic framework (MOF) synthesis information extraction, nuclear magnetic resonance spectroscopy (NMR) data extraction, and the conversion of reaction paragraphs to action sequences. The fine-tuned LLMs demonstrated impressive performance, significantly reducing the need for repetitive and extensive prompt engineering experiments. For comparison, we guided ChatGPT (GPT-3.5-turbo) and GPT-4 with prompt engineering and fine-tuned GPT-3.5-turbo as well as other open-source LLMs such as Mistral, Llama3, Llama2, T5, and BART. The results showed that the fine-tuned ChatGPT models excelled in all tasks. They achieved exact accuracy levels ranging from 69% to 95% on these tasks with minimal annotated data. They even outperformed those task-adaptive pre-training and fine-tuning models that were based on a significantly larger amount of in-domain data. Notably, fine-tuned Mistral and Llama3 show competitive abilities. Given their versatility, robustness, and low-code capability, leveraging fine-tuned LLMs as flexible and effective toolkits for automated data acquisition could revolutionize chemical knowledge extraction.
0

The therapeutic effect of a novel GAPDH inhibitor in mouse model of breast cancer and efficacy monitoring by molecular imaging

Yunqi Zhang et al.May 29, 2024
+5
X
W
Y
Abstract Background Breast cancer is a serious threat to women’s health with high morbidity and mortality. The development of more effective therapies for the treatment of breast cancer is strongly warranted. Growing evidence suggests that targeting glucose metabolism may be a promising cancer treatment strategy. We previously identified a new glyceraldehyde-3-phosphate dehydrogenase (GAPDH) inhibitor, DC-5163, which shows great potential in inhibiting tumor growth. Here, we evaluated the anticancer potential of DC-5163 in breast cancer cells. Methods The effects of DC-5163 on breast cancer cells were investigated in vitro and in vivo. Seahorse, glucose uptake, lactate production, and cellular ATP content assays were performed to examine the impact of DC-5163 on cellular glycolysis. Cell viability, colony-forming ability, cell cycle, and apoptosis were assessed by CCK8 assay, colony formation assay, flow cytometry, and immunoblotting respectively. The anticancer activity of DC-5163 in vivo was evaluated in a mouse breast cancer xenograft model. Results DC-5163 suppressed aerobic glycolysis and reduced energy supply of breast cancer cells, thereby inhibiting breast cancer cell growth, inducing cell cycle arrest in the G0/G1 phase, and increasing apoptosis. The therapeutic efficacy was assessed using a breast cancer xenograft mouse model. DC-5163 treatment markedly suppressed tumor growth in vivo without inducing evident systemic toxicity. Micro-PET/CT scans revealed a notable reduction in tumor 18 F-FDG and 18 F-FLT uptake in the DC-5163 treatment group compared to the DMSO control group. Conclusions Our results suggest that DC-5163 is a promising GAPDH inhibitor for suppressing breast cancer growth without obvious side effects. 18 F-FDG and 18 F-FLT PET/CT can noninvasively assess the levels of glycolysis and proliferation in tumors following treatment with DC-5163.
0
Citation1
0
Save
0

TranSiGen: Deep representation learning of chemical-induced transcriptional profile

Xiaochu Tong et al.Jan 1, 2023
+9
X
N
X
With the advancement of high-throughput RNA sequencing technologies, the use of chemical-induced transcriptional profiling has greatly increased in biomedical research. However, the usefulness of transcriptomics data is limited by inherent random noise and technical artefacts that may cause systematical biases. These limitations make it challenging to identify the true signal of perturbation and extract knowledge from the data. In this study, we propose a deep generative model called Transcriptional Signatures Generator (TranSiGen), which aims to denoise and reconstruct transcriptional profiles through self-supervised representation learning. TranSiGen uses cell basal gene expression and compound molecular structure representation to infer the chemical-induced transcriptional profile. Results demonstrate the effectiveness of TranSiGen in learning and predicting differential expression genes. The representation derived from TranSiGen can also serve as an alternative phenotype information, with applications in ligand-based virtual screening, drug response prediction, and phenotype-based drug repurposing. We envisage that integrating TranSiGen into the drug discovery and mechanism research pipeline will promote the development of biomedicine.
0

Identify compound-protein interaction with knowledge graph embedding of perturbation transcriptomics

Shengkun Ni et al.Apr 12, 2024
+19
Z
S
S
Abstract The emergence of perturbation transcriptomics provides a new perspective and opportunity for drug discovery, but existing analysis methods suffer from inadequate performance and limited applicability. In this work, we present PertKGE, a method designed to improve compound-protein interaction with knowledge graph embedding of perturbation transcriptomics. PertKGE incorporates diverse regulatory elements and accounts for multi-level regulatory events within biological systems, leading to significant improvements compared to existing baselines in two critical “cold-start” settings: inferring binding targets for new compounds and conducting virtual ligand screening for new targets. We further demonstrate the pivotal role of incorporating multi- level regulatory events in alleviating dataset bias. Notably, it enables the identification of ectonucleotide pyrophosphatase/phosphodiesterase-1 as the target responsible for the unique anti- tumor immunotherapy effect of tankyrase inhibitor K-756, and the discovery of five novel hits targeting the emerging cancer therapeutic target, aldehyde dehydrogenase 1B1, with a remarkable hit rate of 10.2%. These findings highlight the potential of PertKGE to accelerate drug discovery by elucidating mechanisms of action and identifying novel therapeutic compounds.
0

PackDock: a Diffusion Based Side Chain Packing Model for Flexible Protein-Ligand Docking

Runze Zhang et al.Feb 3, 2024
+15
D
X
R
Structure-based drug design (SBDD) relies on accurate knowledge of protein structure and ligand-binding conformations. However, most of the static conformations obtained by advanced methods such as structural biology and de novo protein folding algorithms often don't meet the needs for drug design. We introduce PackDock, a flexible docking method that combines "conformation selection" and "induced fit" mechanisms in a two-stage docking pipeline. The core module of this method is PackPocket, which uses a diffusion model to explore the side-chain conformation space in ligand binding pockets, both with or without a ligand. We evaluate our method using several tests that reflect real-world application scenarios. (1) Side-chain packing and Re-docking experiments validate the ability of PackDock to predict accurate side-chain conformations and ligand conformations. (2) Cross-docking experiments with apo and non-homologous ligand-induced holo structures align with real docking scenarios, demonstrating PackDock's practical value. (3) Docking experiments with hypothetical models show that PackPocket can potentially conduct SBDD starting from protein sequence information only. Additionally, we found that PackDock can identify key amino acid conformation changes, which may provide insights for lead compound optimization. We demonstrate PackDock can accurately predict the complex conformations in various application scenarios, by combining the conformation selection theory and the induced fit theory, and by using the ability of PackPocket to accurately predict the side chain conformations in the pocket region. We believe this method can improve the usability of existing structures, providing a new perspective for the SBDD community.