GG
Gihanna Galindez
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
4
(100% Open Access)
Cited by:
1
h-index:
5
/
i10-index:
4
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
10

Transcriptome analysis of growth variation in early juvenile stage sandfishHolothuria scabra

June Ordoñez et al.Sep 1, 2020
Abstract The sandfish Holothuria scabra is a high-value tropical sea cucumber species representing a major mariculture prospect across the Indo-Pacific. Advancements in culture technology, rearing, and processing present options for augmenting capture production, stock restoration, and sustainable livelihood activities from hatchery-produced sandfish. Further improvements in mariculture production may be gained from the application of genomic technologies to improve performance traits such as growth. In this study, we performed de novo transcriptome assembly and characterization of fast- and slow-growing juvenile H. scabra from three Philippine populations. Analyses revealed 66 unigenes that were consistently differentially regulated in fast-growing sandfish and found to be associated with immune response and metabolism. Further, we identified microsatellite and single nucleotide polymorphism markers potentially associated with fast growth. These findings provide insight on potential genomic determinants underlying growth regulation in early juvenile sandfish which will be useful for further functional studies. Highlights The study explores the genomic basis of growth variation in juvenile sandfish by examining gene expression profiles of fast- and slow-growing early juvenile stages from three hatchery populations using RNA-seq. Sixty-six differentially regulated unigenes potentially related to growth variation are associated with several biological and molecular processes, including carbohydrate binding, extracellular matrix organization, fatty-acid metabolism, and metabolite and solute transport. A large number of potential microsatellite and growth category-associated SNP markers have been identified.
10
Citation1
0
Save
0

Identification of transcriptional regulators using a combined disease module identification and prize-collecting Steiner tree approach

Gihanna Galindez et al.Feb 5, 2024
Abstract Transcription factors play important roles in maintaining normal biological function, and their dys-regulation can lead to the development of diseases. Identifying candidate transcription factors involved in disease pathogenesis is thus an important task for deriving mechanistic insights from gene expression data. We developed Transcriptional Regulator Identification using Prize-collecting Steiner trees (TRIPS), a workflow for identifying candidate transcriptional regulators from case-control expression data. In the first step, TRIPS combines the results of differential expression analysis with a disease module identification step to retrieve perturbed subnetworks comprising an expanded gene list. TRIPS then solves a prize-collecting Steiner tree problem on a gene regulatory network, thereby identifying candidate transcriptional modules and transcription factors. We compare TRIPS to relevant methods using publicly available disease datasets and show that the proposed workflow can recover known disease-associated transcription factors with high precision. Network perturbation analyses demonstrate the reliability of TRIPS results. We further evaluate TRIPS on Alzheimer’s disease, diabetic kidney disease, and prostate cancer single-cell omics datasets. Overall, TRIPS is a useful approach for prioritizing transcriptional mechanisms for further downstream analyses.
0

Nucleotide dependency analysis of DNA language models reveals genomic functional elements

Pedro Silva et al.Jul 27, 2024
Deciphering how nucleotides in genomes encode regulatory instructions and molecular machines is a long-standing goal in biology. DNA language models (LMs) implicitly capture functional elements and their organization from genomic sequences alone by modeling probabilities of each nucleotide given its sequence context. However, using DNA LMs for discovering functional genomic elements has been challenging due to the lack of interpretable methods. Here, we introduce nucleotide dependencies which quantify how nucleotide substitutions at one genomic position affect the probabilities of nucleotides at other positions. We generated genome-wide maps of pairwise nucleotide dependencies within kilobase ranges for animal, fungal, and bacterial species. We show that nucleotide dependencies indicate deleteriousness of human genetic variants more effectively than sequence alignment and DNA LM reconstruction. Regulatory elements appear as dense blocks in dependency maps, enabling the systematic identification of transcription factor binding sites as accurately as models trained on experimental binding data. Nucleotide dependencies also highlight bases in contact within RNA structures, including pseudoknots and tertiary structure contacts, with remarkable accuracy. This led to the discovery of four novel, experimentally validated RNA structures in Escherichia coli. Finally, using dependency maps, we reveal critical limitations of several DNA LM architectures and training sequence selection strategies by benchmarking and visual diagnosis. Altogether, nucleotide dependency analysis opens a new avenue for discovering and studying functional elements and their interactions in genomes.
1

Inference of differential gene regulatory networks from gene expression data using boosted differential trees

Gihanna Galindez et al.Sep 27, 2022
Abstract Diseases can be caused by molecular perturbations that induce specific changes in regulatory interactions and their coordinated expression, also referred to as network rewiring. However, the detection of complex changes in regulatory connections remains a challenging task and would benefit from the development of novel non-parametric approaches. We developed a new ensemble method called BoostDiff (boosted differential regression trees) to infer a differential network discriminating between two conditions. BoostDiff builds an adaptively boosted (AdaBoost) ensemble of differential trees with respect to a target condition. To build the differential trees, we propose differential variance improvement as a novel splitting criterion. Variable importance measures derived from the resulting models are used to reflect changes in gene expression predictability and to build the output differential networks. BoostDiff outperforms existing differential network methods on simulated data evaluated in two different complexity settings. We then demonstrate the power of our approach when applied to real transcriptomics data in COVID-19 and Crohn’s disease. BoostDiff identifies context-specific networks that are enriched with genes of known disease-relevant pathways and complements standard differential expression analyses. BoostDiff is available at https://github.com/gihannagalindez/boostdiff_inference . Author Summary Gene regulatory networks, which comprise the collection of regulatory relationships between transcription factors and their target genes, are important for controlling various molecular processes. Diseases can induce perturbations in normal gene co-expression patterns in these networks. Detecting differentially co-expressed or rewired edges between disease and healthy biological states can be thus useful for investigating the link between specific disease-associated molecular alterations and phenotype. We developed BoostDiff (boosted differential trees), an ensemble method to derive differential networks between two biological contexts. Our approach applies a boosting scheme using differential trees as base learner. A differential tree is a new tree structure that is built from two expression datasets using a splitting criterion called the differential variance improvement. The resulting BoostDiff model learns the most differentially predictive features which are then used to build the directed differential networks. BoostDiff outperforms other differential network methods on simulated data and outputs more biologically meaningful results when evaluated on real transcriptomics datasets. BoostDiff can be applied to gene expression data to reveal new disease mechanisms or identify potential therapeutic targets.