YG
Yaowen GuVerified
Verified Account
Verified
Ph.D. student focusing on theoretical & computational chemistry. Got M.S. degree of medical informatics.
Chemistry PhD '28, New York University
Member for 1 day
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
22
(55% Open Access)
Cited by:
137
h-index:
6
/
i10-index:
4
Reputation
Computational Theory And Mathematics
66%
Epidemiology
40%
Pharmacy
28%
Show more
How is this calculated?
Publications
0

Drug–disease association prediction with literature based multi-feature fusion

Hongyu Kang et al.May 22, 2023
Introduction: Exploring the potential efficacy of a drug is a valid approach for drug development with shorter development times and lower costs. Recently, several computational drug repositioning methods have been introduced to learn multi-features for potential association prediction. However, fully leveraging the vast amount of information in the scientific literature to enhance drug-disease association prediction is a great challenge. Methods: We constructed a drug-disease association prediction method called Literature Based Multi-Feature Fusion (LBMFF), which effectively integrated known drugs, diseases, side effects and target associations from public databases as well as literature semantic features. Specifically, a pre-training and fine-tuning BERT model was introduced to extract literature semantic information for similarity assessment. Then, we revealed drug and disease embeddings from the constructed fusion similarity matrix by a graph convolutional network with an attention mechanism. Results: LBMFF achieved superior performance in drug-disease association prediction with an AUC value of 0.8818 and an AUPR value of 0.5916. Discussion: LBMFF achieved relative improvements of 31.67% and 16.09%, respectively, over the second-best results, compared to single feature methods and seven existing state-of-the-art prediction methods on the same test datasets. Meanwhile, case studies have verified that LBMFF can discover new associations to accelerate drug development. The proposed benchmark dataset and source code are available at: https://github.com/kang-hongyu/LBMFF .
0
Citation12
0
Save
0

An efficient curriculum learning-based strategy for molecular graph learning

Yaowen Gu et al.Mar 2, 2022
Abstract Computational methods have been widely applied to resolve various core issues in drug discovery, such as molecular property prediction. In recent years, a data-driven computational method-deep learning had achieved a number of impressive successes in various domains. In drug discovery, graph neural networks (GNNs) take molecular graph data as input and learn graph-level representations in non-Euclidean space. An enormous amount of well-performed GNNs have been proposed for molecular graph learning. Meanwhile, efficient use of molecular data during training process, however, has not been paid enough attention. Curriculum learning (CL) is proposed as a training strategy by rearranging training queue based on calculated samples' difficulties, yet the effectiveness of CL method has not been determined in molecular graph learning. In this study, inspired by chemical domain knowledge and task prior information, we proposed a novel CL-based training strategy to improve the training efficiency of molecular graph learning, called CurrMG. Consisting of a difficulty measurer and a training scheduler, CurrMG is designed as a plug-and-play module, which is model-independent and easy-to-use on molecular data. Extensive experiments demonstrated that molecular graph learning models could benefit from CurrMG and gain noticeable improvement on five GNN models and eight molecular property prediction tasks (overall improvement is 4.08%). We further observed CurrMG’s encouraging potential in resource-constrained molecular property prediction. These results indicate that CurrMG can be used as a reliable and efficient training strategy for molecular graph learning. Availability: The source code is available in https://github.com/gu-yaowen/CurrMG.
0

Prediction of Medical Disputes Between Health Care Workers and Patients in Terms of Hospital Legal Construction Using Machine Learning Techniques: Externally Validated Cross-Sectional Study

Min Yi et al.Aug 17, 2023
Medical disputes are a global public health issue that is receiving increasing attention. However, studies investigating the relationship between hospital legal construction and medical disputes are scarce. The development of a multicenter model incorporating machine learning (ML) techniques for the individualized prediction of medical disputes would be beneficial for medical workers.This study aimed to identify predictors related to medical disputes from the perspective of hospital legal construction and the use of ML techniques to build models for predicting the risk of medical disputes.This study enrolled 38,053 medical workers from 130 tertiary hospitals in Hunan province, China. The participants were randomly divided into a training cohort (34,286/38,053, 90.1%) and an internal validation cohort (3767/38,053, 9.9%). Medical workers from 87 tertiary hospitals in Beijing were included in an external validation cohort (26,285/26,285, 100%). This study used logistic regression and 5 ML techniques: decision tree, random forest, support vector machine, gradient boosting decision tree (GBDT), and deep neural network. In total, 12 metrics, including discrimination and calibration, were used for performance evaluation. A scoring system was developed to select the optimal model. Shapley additive explanations was used to generate the importance coefficients for characteristics. To promote the clinical practice of our proposed optimal model, reclassification of patients was performed, and a web-based app for medical dispute prediction was created, which can be easily accessed by the public.Medical disputes occurred among 46.06% (17,527/38,053) of the medical workers in Hunan province, China. Among the 26 clinical characteristics, multivariate analysis demonstrated that 18 characteristics were significantly associated with medical disputes, and these characteristics were used for ML model development. Among the ML techniques, GBDT was identified as the optimal model, demonstrating the lowest Brier score (0.205), highest area under the receiver operating characteristic curve (0.738, 95% CI 0.722-0.754), and the largest discrimination slope (0.172) and Youden index (1.355). In addition, it achieved the highest metrics score (63 points), followed by deep neural network (46 points) and random forest (45 points), in the internal validation set. In the external validation set, GBDT still performed comparably, achieving the second highest metrics score (52 points). The high-risk group had more than twice the odds of experiencing medical disputes compared with the low-risk group.We established a prediction model to stratify medical workers into different risk groups for encountering medical disputes. Among the 5 ML models, GBDT demonstrated the optimal comprehensive performance and was used to construct the web-based app. Our proposed model can serve as a useful tool for identifying medical workers at high risk of medical disputes. We believe that preventive strategies should be implemented for the high-risk group.
0

CurrMG: A Curriculum Learning Approach for Graph Based Molecular Property Prediction

Yaowen Gu et al.Dec 9, 2021
Nowadays computational methods in bioinformatics and cheminformatics have been widely used in molecular property prediction, advancing activities such as drug discovery. Combining to expert manual annotation of molecular features, machine learning approaches have gained satisfying prediction accuracies in most molecular property prediction tasks. Recently, Graph neural networks (GNNs) have gained increasing popularity in cheminformatics, where a chemical molecule structure is represented as a graph, and have made monumental progress in molecular property prediction. However, GNNs models requires large amounts of training samples, and the diversified molecular structure information might under-utilized when the model is trained with traditional random sampling strategies, thus leading to redundancy and inefficiency. Similar to human learning procedures, training of molecule graph learning models can benefit from an easy-to-difficult curriculum. In this study, we proposed a curriculum learning approach for graph based molecular property prediction, called CurrMG. A data-aware integrated difficulty measurer was proposed to distinguish easy molecules from complex ones. Without any model redesign or external data, our training strategy improves model efficiency and accuracy in numerous molecular property prediction tasks and shows potential for low data drug discovery.
0
Citation7
0
Save
0

Study on tumour cell-derived hybrid exosomes as dasatinib nanocarriers for pancreatic cancer therapy

Xiaofei Zhou et al.Oct 5, 2023
Pancreatic ductal adenocarcinoma (PDAC) is one of the leading causes of cancer-related death. Therefore, we intend to explore novel strategies against PDAC. The exosomes-based biomimetic nanoparticle is an appealing candidate served as a drug carrier in cancer treatment, due to its inherit abilities. In the present study, we designed dasatinib-loaded hybrid exosomes by fusing human pancreatic cancer cells derived exosomes with dasatinib-loaded liposomes, followed by characterization for particle size (119.9 ± 6.10 nm) and zeta potential (−11.45 ± 2.24 mV). Major protein analysis from western blot techniques reveal the presence of exosome marker proteins CD9 and CD81. PEGylated hybrid exosomes showed pH-sensitive drug release in acidic condition, benefiting drug delivery to acidic cancer environment. Dasatinib-loaded hybrid exosomes exhibited significantly higher uptake rates and cytotoxicity to parent PDAC cells by two-sample t-test or by one-way ANOVA analysis of variance, as compared to free drug or liposomal formulations. The results from our computational analysis demonstrated that the drug-likeness, ADMET, and protein-ligand binding affinity of dasatinib are verified successfully. Cancer derived hybrid exosomes may serve as a potential therapeutic candidate for pancreatic cancer treatment.
0
Citation5
0
Save
Load More