FG
Francesco Gualdi
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
0
h-index:
4
/
i10-index:
3
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genopyc: a python library for investigating the genomic basis of complex diseases

Francesco Gualdi et al.Jan 12, 2024
Motivation: Understanding the genetic basis of complex diseases is a paramount challenge in modern genomics. However, current tools often lack the versatility to efficiently analyze the intri-cate relationships between genetic variations and disease outcomes. To address this, we intro-duce Genopyc, a novel Python library designed for comprehensive investigation of the genetics underlying complex diseases. Genopyc offers an extensive suite of functions for heterogeneous data mining and visualization, enabling researchers to delve into and integrate biological infor-mation from large-scale genomic datasets with ease. Results: In this study, we present the Genopyc library through application to real-world genome wide association studies variants. Using Genopyc to investigate variants associated to interverte-bral disc degeneration (IDD) enabled a deeper understanding of the potential dysregulated path-ways involved in the disease, which can be explored and visualized by exploiting the functionali-ties featured in the package. Genopyc emerges as a powerful asset for researchers, fostering ad-vancements in the understanding of complex diseases and thus paving the way for more targeted therapeutic interventions. Availability: Genopyc is available at pip (https://pypi.org/project/genopyc/) and the source code of Genopyc is available at https://github.com/freh-g/genopyc
0

PREDICTING GENE DISEASE ASSOCIATIONS WITH KNOWLEDGE GRAPH EMBEDDINGS FOR DISEASES WITH CURTAILED INFORMATION

Francesco Gualdi et al.Jan 15, 2024
ABSTRACT Knowledge graph embeddings (KGE) are a powerful technique used in the biological domain to represent biological knowledge in a low dimensional space. However, a deep understanding of these methods is still missing, and in particular the limitations for diseases with reduced information on gene-disease associations. In this contribution, we built a knowledge graph (KG) by integrating heterogeneous biomedical data and generated KGEs by implementing state-of-the-art methods, and two novel algorithms: DLemb and BioKG2Vec. Extensive testing of the embeddings with unsupervised clustering and supervised methods showed that our novel approaches outperform existing algorithms in both scenarios. Our results indicate that data preprocessing and integration influence the quality of the predictions and that the embeddings efficiently encodes biological information when compared to a null model. Finally, we employed KGE to predict genes associated with Intervertebral disc degeneration (IDD) and showed that functions relevant to the disease are enriched in the genes prioritized from the model GRAPHICAL ABSTRACT