DS
Divyanshu Srivastava
Author with expertise in Chemotherapy-Induced Peripheral Neuropathy in Cancer Treatment
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
4
(100% Open Access)
Cited by:
7
h-index:
4
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

(Machine) Learning the mutation signatures of SARS-CoV-2: a primer for predictive prognosis

Sunil Nagpal et al.Aug 31, 2021
+2
D
N
S
Abstract Motivation Continuous emergence of new variants through appearance, accumulation and disappearance of mutations in viruses is a hallmark of many viral diseases. SARS-CoV-2 and its variants have particularly exerted tremendous pressure on global healthcare system owing to their life threatening and debilitating implications. The sheer plurality of the variants and huge scale of genome sequence data available for Covid19 have added to the challenges of traceability of mutations of concern. The latter however provides an opportunity to utilize SARS-CoV-2 genomes and the mutations therein as ‘big data records’ to comprehensively classify the variants through the (machine) learning of mutation patterns. The unprecedented sequencing effort and tracing of disease outcomes provide an excellent ground for identifying important mutations by developing machine learnt models or severity classifiers using mutation profile of SARS-CoV-2. This is expected to provide a significant impetus to the efforts towards not only identifying the mutations of concern but also exploring the potential of mutation driven predictive prognosis of SARS-CoV-2. Results We describe how a graduated approach of building various severity specific machine learning classifiers, using only the mutation corpus of SARS-CoV-2 genomes, can potentially lead to the identification of important mutations and guide potential prognosis of infection. We demonstrate the applicability of model derived important mutations and use of Shapley values in order to identify the significant mutations of concern as well as for developing sparse models of outcome classification. A total of 77,284 outcome traced SARS-CoV-2 genomes were employed in this study which represented a total corpus of 30346 unique nucleotide mutations and 18647 amino acid mutations. Machine learning models pertaining to graduated classifiers of target outcomes namely ‘Asymptomatic, Mild, Symptomatic/Moderate, Severe and Fatal’ were built considering the TRIPOD guidelines for predictive prognosis. Shapley values for model linked important mutations were employed to select significant mutations leading to identification of less than 20 outcome driving mutations from each classifier. We additionally describe the significance of adopting a ‘temporal modeling approach’ to benchmark the predictive prognosis linked with continuously evolving pathogens. A chronologically distinct sampling is important in evaluating the performance of models trained on ‘past data’ in accurately classifying prognosis linked with genomes of future (observed with new mutations). We conclude that while machine learning approach can play a vital role in identifying relevant mutations, caution should be exercised in using the mutation signatures for predictive prognosis in cases where new mutations have accumulated along with the previously observed mutations of concern. Contact sharmila.mande@tcs.com Supplementary information Supplementary data are enclosed.
1
Citation4
0
Save
1

What if we perceive SARS-CoV-2 genomes as documents? Topic modelling using Latent Dirichlet Allocation to identify mutation signatures and classify SARS-CoV-2 genomes

Sunil Nagpal et al.Aug 20, 2020
S
D
S
ABSTRACT Topic modeling is frequently employed for discovering structures (or patterns) in a corpus of documents. Its utility in text-mining and document retrieval tasks in various fields of scientific research is rather well known. An unsupervised machine learning approach, Latent Dirichlet Allocation (LDA) has particularly been utilized for identifying latent (or hidden) topics in document collections and for deciphering the words that define one or more topics using a generative statistical model. Here we describe how SARS-CoV-2 genomic mutation profiles can be structured into a ‘Bag of Words’ to enable identification of signatures (topics) and their probabilistic distribution across various genomes using LDA. Topic models were generated using ~47000 novel corona virus genomes (considered as documents), leading to identification of 16 amino acid mutation signatures and 18 nucleotide mutation signatures (equivalent to topics) in the corpus of chosen genomes through coherence optimization. The document assumption for genomes also helped in identification of contextual nucleotide mutation signatures in the form of conventional N-grams (e.g. bi-grams and tri-grams). We validated the signatures obtained using LDA driven method against the previously reported recurrent mutations and phylogenetic clades for genomes. Additionally, we report the geographical distribution of the identified mutation signatures in SARS-CoV-2 genomes on the global map. Use of the non-phylogenetic albeit classical approaches like topic modeling and other data centric pattern mining algorithms is therefore proposed for supplementing the efforts towards understanding the genomic diversity of the evolving SARS-CoV-2 genomes (and other pathogens/microbes).
1
Citation3
0
Save
0

Patient-derived lymphomoids preserve the tumor architecture and allow to assess response to therapies in lymphoma

Albert Santamaria‐Martínez et al.Apr 20, 2024
+9
D
J
A
The efficacy of anti-cancer therapies depends on the genomic composition of the tumor, its microenvironment, spatial organization, and intra-tumor heterogeneity. B cell lymphomas are a heterogeneous group of tumors emerging from B cells at different stages of differentiation and exhibiting tumor-specific interactions with the tumor microenvironment. Thus, to measure response to therapy in lymphoma, it is critical to preserve the tumor composition and functional interactions among immune cells. Here, we developed a platform to maintain small fragments of human lymphoma tissue in culture for several days, and use them to test response to therapies. We collected 25 patient samples representative of different lymphoma subtypes, and established ex vivo tissue fragments that retained histological, cellular, and molecular characteristics of the original tissue, here referred to as lymphomoids. Using lymphomoids, we tested sensitivity to several clinically approved small molecule inhibitors in parallel and examined tissue remodeling upon treatment. Importantly, when this information was available, we showed that sensitivity to therapy observed in lymphomoids was consistent with patient's response in the clinic. Lymphomoids are an innovative tool to assess treatment efficacy in clinically relevant contexts and could be used to uncover novel aspects of lymphoma biology.
0

Improving gene-network inference with graph-wavelets and making insights about ageing associated regulatory changes in lungs

Shreya Mishra et al.Jul 25, 2020
V
D
S
Abstract Using gene-regulatory-networks based approach for single-cell expression profiles can reveal un-precedented details about the effects of external and internal factors. However, noise and batch effect in sparse single-cell expression profiles can hamper correct estimation of dependencies among genes and regulatory changes. Here we devise a conceptually different method using graph-wavelet filters for improving gene-network (GWNet) based analysis of the transcriptome. Our approach improved the performance of several gene-network inference methods. Most Importantly, GWNet improved consistency in the prediction of generegulatory-network using single-cell transcriptome even in presence of batch effect. Consistency of predicted gene-network enabled reliable estimates of changes in the influence of genes not highlighted by differential-expression analysis. Applying GWNet on the single-cell transcriptome profile of lung cells, revealed biologically-relevant changes in the influence of pathways and master-regulators due to ageing. Surprisingly, the regulatory influence of ageing on pneumocytes type II cells showed noticeable similarity with patterns due to effect of novel coronavirus infection in Human Lung.