HG
Humberto González‐Díaz
Author with expertise in Prediction of Protein Subcellular Localization
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
6
(33% Open Access)
Cited by:
1
h-index:
54
/
i10-index:
211
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Unraveling druggable cancer-driving proteins and targeted drugs using artificial intelligence and multi-omics analyses

Andrés López‐Cortés et al.Aug 21, 2024
+11
G
A
A
The druggable proteome refers to proteins that can bind to small molecules with appropriate chemical affinity, inducing a favorable clinical response. Predicting druggable proteins through screening and in silico modeling is imperative for drug design. To contribute to this field, we developed an accurate predictive classifier for druggable cancer-driving proteins using amino acid composition descriptors of protein sequences and 13 machine learning linear and non-linear classifiers. The optimal classifier was achieved with the support vector machine method, utilizing 200 tri-amino acid composition descriptors. The high performance of the model is evident from an area under the receiver operating characteristics (AUROC) of 0.975 ± 0.003 and an accuracy of 0.929 ± 0.006 (threefold cross-validation). The machine learning prediction model was enhanced with multi-omics approaches, including the target-disease evidence score, the shortest pathways to cancer hallmarks, structure-based ligandability assessment, unfavorable prognostic protein analysis, and the oncogenic variome. Additionally, we performed a drug repurposing analysis to identify drugs with the highest affinity capable of targeting the best predicted proteins. As a result, we identified 79 key druggable cancer-driving proteins with the highest ligandability, and 23 of them demonstrated unfavorable prognostic significance across 16 TCGA PanCancer types: CDKN2A, BCL10, ACVR1, CASP8, JAG1, TSC1, NBN, PREX2, PPP2R1A, DNM2, VAV1, ASXL1, TPR, HRAS, BUB1B, ATG7, MARK3, SETD2, CCNE1, MUTYH, CDKN2C, RB1, and SMARCA4. Moreover, we prioritized 11 clinically relevant drugs targeting these proteins. This strategy effectively predicts and prioritizes biomarkers, therapeutic targets, and drugs for in-depth studies in clinical trials. Scripts are available at https://github.com/muntisa/machine-learning-for-druggable-proteins .
0
Paper
Citation1
0
Save
0

OncoOmics approaches to reveal essential genes in breast cancer: a panoramic view from pathogenesis to precision medicine

Andrés López‐Cortés et al.May 16, 2019
+7
S
C
A
Breast cancer (BC) is a heterogeneous disease where each OncoOmics approach needs to be fully understood as a part of a complex network. Therefore, the main objective of this study was to analyze genetic alterations, signaling pathways, protein-protein interaction networks, protein expression, dependency maps and enrichment maps in 230 previously prioritized genes by the Consensus Strategy, the Pan-Cancer Atlas, the Pharmacogenomics Knowledgebase and the Cancer Genome Interpreter, in order to reveal essential genes to accelerate the development of precision medicine in BC. The OncoOmics essential genes were rationally filtered to 144, 48 (33%) of which were hallmarks of cancer and 20 (14%) were significant in at least three OncoOmics approaches: RAC1, AKT1 CCND1, PIK3CA, ERBB2, CDH1, MAPK14, TP53, MAPK1, SRC, RAC3, PLCG1, GRB2, MED1, TOP2A, GATA3, BCL2, CTNNB1, EGFR and CDK2. According to the Open Targets Platform, there are 111 drugs that are currently being analyzed in 3151 clinical trials in 39 genes. Lastly, there are more than 800 clinical annotations associated with 94 genes in BC pharmacogenomics.
0

Prediction of breast cancer proteins using molecular descriptors and artificial neural networks: a focus on cancer immunotherapy proteins, metastasis driver proteins, and RNA-binding proteins

Andrés López‐Cortés et al.Nov 13, 2019
+7
J
A
A
Background: Breast cancer (BC) is a heterogeneous disease characterized by an intricate interplay between different biological aspects such as ethnicity, genomic alterations, gene expression deregulation, hormone disruption, signaling pathway alterations and environmental determinants. Due to the complexity of BC, the prediction of proteins involved in this disease is a trending topic in drug design. Methods: This work is proposing accurate prediction classifier for BC proteins using six sets of protein sequence descriptors and 13 machine learning methods. After using a univariate feature selection for the mix of five descriptor families, the best classifier was obtained using multilayer perceptron method (artificial neural network) and 300 features. Results: The performance of the model is demonstrated by the area under the receiver operating characteristics (AUROC) of 0.980 +/- 0.0037 and accuracy of 0.936 +/- 0.0056 (3-fold cross-validation). Regarding the prediction of 4504 cancer-associated proteins using this model, the best ranked cancer immunotherapy proteins related to BC were RPS27, SUPT4H1, CLPSL2, POLR2K, RPL38, AKT3, CDK3, RPS20, RASL11A and UBTD1; the best ranked metastasis driver proteins related to BC were S100A9, DDA1, TXN, PRNP, RPS27, S100A14, S100A7, MAPK1, AGR3 and NDUFA13; and the best ranked RNA-binding proteins related to BC were S100A9, TXN, RPS27L, RPS27, RPS27A, RPL38, MRPL54, PPAN, RPS20 and CSRP1. Conclusions: This powerful model predicts several BC-related proteins which should be deeply studied to find new biomarkers and better therapeutic targets. The script and the results are available as a free repository at https://github.com/muntisa/neural-networks-for-breast-cancer-proteins. Keywords: breast cancer, machine learning, cancer immunotherapy proteins, metastasis driver proteins, RNA-binding proteins.
0

Prediction of druggable proteins using machine learning and functional enrichment analysis: a focus on cancer-related proteins and RNA-binding proteins

Andrés López‐Cortés et al.Oct 31, 2019
+8
C
A
A
Background: Druggable proteins are a trending topic in drug design. The druggable proteome can be defined as the percentage of proteins that have the capacity to bind an antibody or small molecule with adequate chemical properties and affinity. The screening and in silico modeling are critical activities for the reduction of experimental costs. Methods: The current work proposes a unique prediction model for druggable proteins using amino acid composition descriptors of protein sequences and 13 machine learning linear and non-linear classifiers. After feature selection, the best classifier was obtained using the support vector machine method and 200 tri-amino acid composition descriptors. Results: The high performance of the model is determined by an area under the receiver operating characteristics (AUROC) of 0.975 +/- 0.003 and accuracy of 0.929 +/- 0.006 (3-fold cross-validation). Regarding the prediction of cancer-associated proteins using this model, the best ranked druggable predicted proteins in the breast cancer protein set were CDK4, AP1S1, POLE, HMMR, RPL5, PALB2, TIMP1, RPL22, NFKB1 and TOP2A; in the cancer-driving protein set were TLL2, FAM47C, SAGE1, HTR1E, MACC1, ZFR2, VMA21, DUSP9, CTNNA3 and GABRG1; and in the RNA-binding protein set were PLA2G1B, CPEB2, NOL6, LRRC47, CTTN, CORO1A, SCAF11, KCTD12, DDX43 and TMPO. Conclusions: This powerful model predicts several druggable proteins which should be deeply studied to find better therapeutic targets and thus improve clinical trials. The scripts are freely available at https://github.com/muntisa/machine-learning-for-druggable-proteins.
1

The landscape of toxic intermediates in the metabolic networks of pathogenic fungi reveals targets for antifungal drugs

Jan Ewald et al.Sep 6, 2021
+8
S
P
J
The burden of fungal infections for humans, animals and plants is widely underestimated and comprises deadly infections as well as great economic costs. Despite that, antifungal drugs are scarce and emergence of resistance in fungal strains contributes to a high mortality. To overcome this shortage, we propose toxic intermediates and their controlling enzymes in metabolic pathways as a resource for new targets and provide a web-service, FunTox-Networks to explore the landscape of toxic intermediates in the metabolic networks of fungal pathogens. The toxicity of metabolites is predicted by a new random forest regression model and is available for over one hundred fungal species. Further, for major fungal pathogens, metabolic networks from the KEGG database were enriched with data of toxicity and regulatory effort for each enzyme to support identification of targets. We determined several toxic intermediates in fungal-specific pathways like amino acid synthesis, nitrogen and sulfur assimilation, and the glyoxylate bypass. For the latter, we show experimentally that growth of the pathogen Candida albicans is inhibited when the detoxifying enzymes Mls1 and Hbr2 are deleted and toxic glyoxylate accumulates in the cell. Thus, toxic pathway intermediates and their controlling enzymes represent an untapped resource of antifungal targets.
0

Multi-Endpoint Acute Toxicity Assessment of Organic Compounds Using Large-Scale Machine Learning Modeling

Amirreza Daghighi et al.May 27, 2024
+3
K
G
A
In recent years, alternative animal testing methods such as computational and machine learning approaches have become increasingly crucial for toxicity testing. However, the complexity and scarcity of available biomedical data challenge the development of predictive models. Combining nonlinear machine learning together with multicondition descriptors offers a solution for using data from various assays to create a robust model. This work applies multicondition descriptors (MCDs) to develop a QSTR (Quantitative Structure–Toxicity Relationship) model based on a large toxicity data set comprising more than 80,000 compounds and 59 different end points (122,572 data points). The prediction capabilities of developed single-task multi-end point machine learning models as well as a novel data analysis approach with the use of Convolutional Neural Networks (CNN) are discussed. The results show that using MCDs significantly improves the model and using them with CNN-1D yields the best result (R2train = 0.93, R2ext = 0.70). Several structural features showed a high level of contribution to the toxicity, including van der Waals surface area (VSA), number of nitrogen-containing fragments (nN+), presence of S–P fragments, ionization potential, and presence of C–N fragments. The developed models can be very useful tools to predict the toxicity of various compounds under different conditions, enabling quick toxicity assessment of new compounds.