MS
Madhu Sharma
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
0
h-index:
9
/
i10-index:
8
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Explainable models using transcription factor binding and epigenome patterns at promoters reveal disease-associated genes and their regulators in the context of cell-types

Omkar Chandra et al.May 8, 2024
Abstract Understanding genome-wide epigenetic regulation of diseases is important in establishing pathogenic factors and could aid in disease diagnosis, prognosis, and therapeutics. In this study, we have utilized transcription factors (TFs) and co-factor profiles (n=823) as features to predict their link with various diseases. Further, along with TFs and co-factor profiles, histone modifications ChIP-seq (n = 621), cap analysis gene expression (CAGE) tags (n = 255), and DNase hypersensitivity profiles (n = 255) as features allowed for the modeling of association of coding and non-coding genes to diseases. Such predicted associations could be independently validated using genome-wide association data and survival analysis. However, the unique aspect of our approach is that it highlights the link between TF binding patterns and diseases in the context of cell types. Besides highlighting relevant TF-binding in known cell-types associated with diseases, it also provided their surprising link with TFs expressed in immune cells and other seemingly non-related cells. Further investigation revealed such links to be genuine and potentially useful for prognosis, further revealing the need to deconvolve a set of known genes associated with diseases.
1

Inferring functions of coding and non-coding genes using epigenomic patterns and deciphering the effect of combinatorics of transcription factors binding at promoters

Omkar Chandra et al.Apr 17, 2022
Abstract The number of annotated genes in the human genome has increased tremendously, and understanding their biological role is challenging through experimental methods alone. There is a need for a computational approach to infer the function of genes, particularly for non-coding RNAs, with reliable explainability. We have utilized genomic features that are present across both coding and non-coding genes like transcription factor (TF) binding pattern, histone modifications, and DNase hypersensitivity profiles to predict ontology-based functions of genes. Our approach for gene function prediction (GFPred) made reliable predictions (>90% balanced accuracy) for 486 gene-sets. Further analysis revealed that predictability using only TF-binding patterns at promoters is also high, and it paved the way for studying the effect of their combinatorics. The predicted associations between functions and genes were validated for their reliability using PubMed abstract mining. Clustering functions based on shared top predictive TFs revealed many latent groups of gene-sets involved in common major biological processes. Available CRISPR screens also supported the inferred association of genes with the major biological processes of latent groups of gene-sets. For the explainability of our approach, we also made more insights into the effect of combinatorics of TF binding (especially TF-pairs) on association with biological functions.