RK
Rintu Kutum
Author with expertise in Regulation of RNA Processing and Function
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(73% Open Access)
Cited by:
15
h-index:
13
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

Genetic differences between extreme and composite constitution types from whole exome sequences reveal actionable variations

Tahseen Abbas et al.Apr 28, 2020
Abstract Personalized medicine relies on successful identification of genome-wide variations that governs inter-individual differences in phenotypes and system level outcomes. In Ayurveda, assessment of composite constitution types “ Prakriti” forms the basis for risk stratification, predicting health and disease trajectories and personalized recommendations. Here, we report a novel method for identifying pleiotropic genes and variants that associate with healthy individuals of three extreme and contrasting “ Prakriti” constitutions through exome sequencing and state-of-the-art computational methods. Exome Seq of three extreme Prakriti types from 108 healthy individuals 54 each from genetically homogeneous populations of North India (NI, Discovery cohort) and Western India (VADU, Replication cohort) were evaluated. Fisher’s Exact Test was applied between Prakriti types in both cohorts and further permutation based p-value was used for selection of exonic variants. To investigate the effect of sample size per genetic association test, we performed power analysis. Functional impact of differentiating genes and variations were inferred using diverse resources -Toppfun, GTEx, GWAS, PheWAS, UK Biobank and mouse knockdown/knockout phenotype (MGI). We also applied supervised machine learning approach to evaluate the association of exonic variants with multisystem phenotypes of Prakriti . Our targeted investigation into exome sequencing from NI (discovery) and VADU (validation) cohorts datasets provide ~7,000 differentiating SNPs. Closer inspection further identified a subset of SNPs (2407 (NI) and 2393 (VADU)), that mapped to an overlapping set of 1181 genes. This set can robustly stratify the Prakriti groups into three distinct clusters with distinct gene ontological (GO) enrichments. Functional analysis further strengthens the potential pleiotropic effects of these differentiating genes/variants and multisystem phenotypic consequences. Replicated SNPs map to some very prominent genes like FIG4, EDNRA, ANKLE1, BCKDHA, ATP5SL, EXOCS5 , IFIT5, ZNF502, PNPLA3 and IL6R . Lastly, multivariate analysis using random forest uncovered rs7244213 within urea transporter SLC14A2 , that associate with an ensemble of features linked to distinct constitutions. Our results reinforce the concept of integration of Prakriti based deep phenotypes for risk stratification of healthy individuals and provides markers for early actionable interventions.
3
Citation12
0
Save
55
0

Genomic sequencing should extend to diverse priority pathogens for effective study and surveillance of antimicrobial resistance: a systematic review of whole-genome sequencing studies from India

Nazneen Gheewalla et al.Jan 1, 2023
Background Antimicrobial resistance (AMR) is a public health emergency in many low and middle-income countries, including India. To effectively tackle AMR, we need rapid diagnostics, effective surveillance and new antimicrobial drugs. Whole-genome sequencing of pathogens is the first definite step towards achieving these goals. Methods In this work, we review all the studies published till date that report whole-genome sequences of select priority AMR pathogens from India. We searched PubMed and Web of Science databases for the studies that involved whole-genome sequencing of AMR priority pathogens from India. For the top two highly sequenced pathogens, S. typhi and K. pneumoniae, we performed phylogenetic analyses to understand the geo-climatic distribution of genetically diverse strains. Results Our search reveals 94 studies that report 2547 unique whole-genome sequences. We find that most sequences are limited to select priority pathogens isolated from a couple of geo-climatic zones of India. Our phylogenetic analyses show that available data does not indicate systematic differences between the genomes of isolates from different geo-climatic zones. Our search also reveals complete absence of travel-related studies tracking possible movement of AMR pathogens within country. Lastly, we find very few studies that sequence AMR pathogens isolated from food, soil or other environments. Conclusion Together, these observations suggest that lndia should prioritize sequencing of diverse AMR pathogens from clinics as well as from environments and travellers rather than extending the geo-climatic range of already-sequenced pathogens. Our recommendations can be potentially valuable for other low and middle-income countries with limited resources, high prevalence of AMR and diverse geo-climatic conditions.
0

Origin of a novel CYP20A1 transcript isoform through multiple Alu exaptations creates a potential miRNA sponge

Aniket Bhattacharya et al.Apr 25, 2019
Abstract Background Primate-specific Alus contribute to transcriptional novelties in conserved gene regulatory networks. Alu RNAs are present at elevated levels in stress conditions and consequently leads to transcript isoform specific functional role modulating the physiological outcome. One of the possible mechanisms could be Alu nucleated mRNA-miRNA interplay. Result Using combination of bioinformatics and experiments, we report a transcript isoform of an orphan gene, CYP20A1 ( CYP20A1_Alu-LT ) through exaptation of 23 Alus in its 9kb 3’UTR. CYP20A1_Alu-LT , confirmed by 3’RACE, is an outlier in length and expressed in multiple cell lines. We demonstrate its presence in single nucleus RNA-seq of ∼16000 human cortical neurons (including rosehip neurons). Its expression is restricted to the higher primates. Most strikingly, miRanda predicts ∼4700 miRNA recognition elements (MREs; with threshold< −25kcal/mol) for ∼1000 miRNAs, which have majorly originated within the 3’UTR-Alus post exaptation. We hypothesized that differential expression of this transcript could modulate mRNA-miRNA networks and tested it in primary human neurons where CYP20A1_Alu-LT is downregulated during heat shock response and upregulated upon HIV1-Tat treatment. CYP20A1_Alu-LT could possibly function as a miRNA sponge as it exhibits features of a sponge RNA such as cytosolic localization and ≥10 MREs for 140 miRNAs. Small RNA-seq revealed expression of nine miRNAs that can potentially be sponged by CYP20A1_Alu-LT in neurons. Additionally, CYP20A1_Alu-LT expression was positively correlated (low in heat shock and high in Tat) with 380 differentially expressed genes that contain cognate MREs for these nine miRNAs. This set is enriched in genes involved in neuronal development and hemostasis pathways. Conclusion We demonstrate a potential role for CYP20A1_Alu-LT as miRNA sponge through preferential presence of MREs within Alus in a transcript isoform specific manner. This highlights a novel component of Alu-miRNA mediated transcriptional modulation leading to physiological homeostasis.
0

Host cholesterol dependent activation of VapC12 toxin enriches persister population during Mycobacterium tuberculosis infection

Sakshi Talwar et al.Nov 26, 2019
A worldwide increase in the frequency of multidrug-resistant and extensively drug-resistant cases of tuberculosis is mainly due to therapeutic noncompliance associated with a lengthy treatment regimen. Depending on the drug susceptibility profile, the treatment duration can extend from 6 months to 2 years. This protracted regimen is attributed to a supposedly non-replicating and metabolically inert subset of the Mycobacterium tuberculosis (Mtb) population, called ‘persisters’. The mechanism underlying stochastic generation and enrichment of persisters is not fully known. We have previously reported that the utilization of host cholesterol is essential for mycobacterial persistence. In this study, we have demonstrated that cholesterol-induced activation of a ribonuclease toxin (VapC12) inhibits translation by targeting proT tRNA in Mtb. This results in cholesterol-specific growth modulation that increases the frequency of the generation of persisters in a heterogeneous Mtb population. Also, a null mutant strain of this toxin (Δ vapC12 ) failed to persist and demonstrated an enhanced growth phenotype in a guinea pig model of Mtb infection. Thus, we have identified a novel strategy through which cholesterol-specific activation of a toxin–antitoxin (TA) module in Mtb enhances persister formation during infection. In addition to identifying the mechanism, the study provides opportunity for targeting persisters, a new paradigm facilitating tuberculosis drug development.
1

Evaluating Sample Augmentation in Microarray Datasets with Generative Models: A Comparative Pipeline and Insights in Tuberculosis

Ayushi Gupta et al.May 4, 2021
Abstract High throughput screening technologies have created a fundamental challenge for statistical and machine learning analyses, i.e., the curse of dimensionality. Gene expression data are a quintessential example, high dimensional in variables (Large P) and comparatively much smaller in samples (Small N). However, the large number of variables are not independent. This understanding is reflected in Systems Biology approaches to the transcriptome as a network of coordinated biological functioning or through principal Axes of variation underlying the gene expression. Recent advances in generative deep learning offers a new paradigm to tackle the curse of dimensionality by generating new data from the underlying latent space captured as a deep representation of the observed data. These have led to widespread applications of approaches such as Generative Adversarial Networks (GANs) and Variational Autoencoders (VAEs), especially in domains where millions of data points exist, such as in computer vision and single cell data. Very few studies have focused on generative modeling of bulk transcriptomic data and microarrays, despite being one of the largest types of publicly available biomedical data. Here we review the potential of Generative models in recapitulating and extending biomedical knowledge from microarray data, which may thus limit the potential to yield hundreds of novel biomarkers. Here we review the potential of generative models and conduct a comparative analysis of VAE, GAN and gaussian mixture model (GMM) in a dataset focused on Tuberculosis. We further review whether previously known axes genes can be used as an effective strategy to employ domain knowledge while designing generative models as a means to further reduce biological noise and enhance signals that can be validated by standard enrichment approaches or functional experiments.
9

Comprehensive assessment of Indian variations in the druggable kinome landscape highlights distinct insights at the sequence, structure and pharmacogenomic stratum

Gautam Panda et al.May 26, 2021
Abstract India confines more than 17% of the world’s population and has a diverse genetic makeup with several clinically relevant rare mutations belonging to many sub-group which are undervalued in global sequencing datasets like the 1000 Genome data (1KG) containing limited samples for Indian ethnicity. Such databases are critical for the pharmaceutical and drug development industry where the diversity plays a crucial role in identifying genetic disposition towards adverse drug reactions. A qualitative and comparative sequence and structural study utilizing variant information present in the recently published, largest curated Indian genome database (IndiGen) and the 1000 Genome data was performed for variants belonging to the kinase coding genes,the second most targeted group of drug targets. The sequence level analysis identified similarities and differences among different populations based on the nsSNVs and amino acid exchange frequencies whereas comparative structural analysis of IndiGen variants was performed with pathogenic variants reported in UniProtKB Humsavar data. The influence of these variations on structural features of the protein, such as structural stability, solvent accessibility, hydrophobicity, and the hydrogen-bond network were investigated. In-silico screening of the known drugs to these Indian variation-containing proteins reveal critical differences imparted in the strength of binding due to the variations present in the Indian population. In conclusion, this study constitutes a comprehensive investigation into the understanding of common variations present in the second largest population in the world, and investigating its implications in the sequence, structural and pharmacogenomic landscape. The preliminary investigation reported in this paper, supporting the screening and detection of ADRs specific to the Indian population could aid in the development of techniques for pre-clinical and post-market screening of drug-related adverse events in the Indian population.
1

Genomic Surveillance of COVID-19 Variants with Language Models and Machine Learning

Sargun Nagpal et al.May 25, 2021
Abstract The global efforts to control COVID-19 are threatened by the rapid emergence of novel SARS-CoV-2 variants that may display undesirable characteristics such as immune escape, increased transmissibility or pathogenicity. Early prediction for emergence of new strains with these features is critical for pandemic preparedness. We present Strainflow , a supervised and causally predictive model using unsupervised latent space features of SARS-CoV-2 genome sequences. Strainflow was trained and validated on 0.9 million sequences for the period December, 2019 to June, 2021 and the frozen model was prospectively validated from July, 2021 to December, 2021. Strainflow captured the rise in cases two months ahead of the Delta and Omicron surges in most countries including the prediction of a surge in India as early as beginning of November, 2021. Entropy analysis of Strainflow unsupervised embeddings clearly reveals the explore-exploit cycles in genomic feature-space, thus adding interpretability to the deep learning based model. We also conducted codon-level analysis of our model for interpretability and biological validity of our unsupervised features. Strainflow application is openly available as an interactive web-application for prospective genomic surveillance of COVID-19 across the globe.
0

PATHOGEN GROWTH AND VIRULENCE DYNAMICS DRIVE THE HOST EVOLUTION AGAINST COINFECTIONS

Srijan Seal et al.May 4, 2024
Coinfections, or the simultaneous infection of hosts by multiple pathogens, are widespread in nature with significant negative impacts on global health. Can hosts evolve against such coinfections as effectively as they would against individual pathogens? Also, what roles do individual pathogens play during such evolution? Here, we combined theoretical models and experiments with Tribolium castaneum populations evolving against two coinfecting bacterial pathogens, with contrasting growth and virulence dynamics, to reveal that fast-growing pathogens inflicting rapid mortality surges (i.e., fast-acting) restrict adaptive success against coinfections. While hosts rapidly evolved better survival against slow-growing bacteria causing long-lasting infections, evolution against coinfection was significantly delayed and resembled slow adaptation against fast-acting pathogens. Moreover, limited scopes of immunomodulation against fast-acting pathogens during coinfections can drive the observed adaptive patterns. Overall, we provide new insights into how adaptive dynamics and mechanistic bases against coinfections are critically regulated by individual pathogens' growth and virulence dynamics.
1

CDK5 mediated phosphorylation of cytosolic phospholipase A2 regulates its activity and neuroinflammation in Parkinson’s Disease

Sangita Paul et al.Nov 5, 2021
Abstract Hyperactivation of cyclin-dependent kinase 5 (CDK5) by p25, contributes to neuroinflammation causing neurodegeneration in Parkinson’s Disease (PD) and Alzheimer diseases (AD). However, the mechanism by which CDK5 induces neuroinflammation in the PD brain is largely unexplored. Here, we show that CDK5 phosphorylates cytosolic phospholipase A2 (cPLA2) at Thr-268 and Ser-505 sites lead to its activation and generation of eicosanoid products. Mutational studies using site-directed mutagenesis and molecular simulations show that the architecture of the protein changes upon each single-point mutation. Interestingly, double-mutations also led to severe decline in the activity of cPLA2 and disruption of its translocation to the plasma membrane. Further, the brain lysates of transgenic PD mouse models show hyperactivation of CDK5 resulting in enhanced phosphorylation of Thr-268 and Ser-505 of cPLA2 and its heightened activity confirming the findings observed in the cell culture model of PD. These phosphorylation sites of cPLA2 and CDK5 could be explored as the future therapeutic targets against neuroinflammation in PD. Further, conjoint transcriptomic analysis of the publicly available human PD datasets strengthens the hypothesis that genes of the arachidonic acid, prostaglandin synthesis and inflammatory pathways are significantly upregulated in case of the PD patients as compared to that of healthy controls.
Load More