AT
Allen Tannenbaum
Author with expertise in Analysis of Gene Interaction Networks
Stony Brook University, Applied Mathematics (United States), Memorial Sloan Kettering Cancer Center
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
30
(43% Open Access)
Cited by:
15
h-index:
65
/
i10-index:
261
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Network Curvature as a Hallmark of Brain Structural Connectivity

Hamza Farooq et al.May 7, 2020
+2
T
Y
H
Abstract Studies show that while brain networks are remarkably robust to a variety of adverse events, such as injuries and lesions due to accidents or disease, they may be fragile when the disturbance takes place in specific locations. This seems to be the case for diseases in which accumulated changes in network topology dramatically affect certain sensitive areas. To this end, previous attempts have been made to quantify robustness and fragility of brain functionality in two broadly defined ways: (i) utilizing model-based techniques to predict lesion effects, and (ii) studying empirical effects from brain lesions due to injury or disease. Both directions aim at assessing functional connectivity changes resulting from structural network variations. In the present work, we follow a more geometric viewpoint that is based on a notion of curvature of networks, the so-called Ollivier-Ricci curvature. A similar approach has been used in recent studies to quantify financial market robustness as well as to differentiate biological networks corresponding to cancer cells from normal cells. The same notion of curvature, defined at the node level for brain networks obtained from MRI data, may help identify and characterize the effects of diseases on specific brain regions. In the present paper, we apply the Ollivier-Ricci curvature to brain structural networks to: i) Demonstrate its unique ability to identify robust (or fragile) brain regions in healthy subjects. We compare our results to previously published work which identified a unique set of regions (called structural core ) of the human cerebral cortex. This novel characterization of brain networks, complementary to measures such as degree, strength, clustering or efficiency, may be particularly useful to detect and monitor candidate areas for targeting by surgery (e.g. deep brain stimulation) or pharmaco-therapeutic agents; ii) Illustrate the power our curvature-derived measures to track changes in brain connectivity with healthy development/aging and; iii) Detect changes in brain structural connectivity in people with Autism Spectrum Disorders (ASD) which are in agreement with previous morphometric MRI studies.
0
Citation9
0
Save
3

Automatic identification of drug-induced liver injury literature using natural language processing and machine learning methods

Jung Oh et al.Oct 24, 2023
J
A
J
Abstract Drug-induced liver injury (DILI) is an adverse hepatic drug reaction that can potentially lead to life-threatening liver failure. Previously published work in the scientific literature on DILI has provided valuable insights for the understanding of hepatotoxicity as well as drug development. However, the manual search of scientific literature in PubMed is laborious. Natural language processing (NLP) techniques have been developed to decipher and understand the meaning of human language by extracting useful information from unstructured text data. In particular, NLP along with artificial intelligence (AI) / machine learning (ML) techniques may allow automatic processing of the DILI literature, but useful methods are yet to be demonstrated. To address this challenge, we have developed an integrated NLP/ML classification model to identify DILI-related literature using only paper titles and abstracts. We used 14,203 publications provided by the Critical Assessment of Massive Data Analysis (CAMDA) challenge, employing word vectorization techniques in NLP coupled with machine learning methods. Classification modeling was performed using 2/3 of the data for training and the remainder for testing in internal validation. The best performance was achieved using a linear support vector machine (SVM) model that combined vectors derived from term frequency-inverse document frequency (TF-IDF) and Word2Vec , achieving an accuracy of 95.0% and an F1-score of 95.0%. The final SVM model built using all 14,203 publications was tested on independent datasets, resulting in accuracies of 92.5%, 96.3%, and 98.3%, and F1-scores of 93.5%, 86.1%, and 75.6% for three test sets (T1-T3). The SVM model was tested on four external validation sets (V1-V4), resulting in accuracies of 92.0%, 96.2%, 98.3%, and 93.1%, and F1-scores of 92.4%, 82.9%, 75.0%, and 93.3%.
1

Multi-omic integrated curvature study on pan-cancer genomic data

Jiening Zhu et al.Oct 24, 2023
A
J
A
J
Abstract In this work, we introduce a new mathematical framework based on network curvature to extract significant cancer subtypes from multi-omics data. This extends our previous work that was based on analyzing a fixed single-omics data class (e,g, CNA, gene expression, etc.). Notably, we are able to show that this new methodology provided us with significant survival differences on Kaplan-Meier curves across almost every cancer that we considered. Moreover, the variances in Ollivier-Ricci curvature was explored to investigate its usefulness in network topology analysis as this curvature may be capturing subtle functional changes between various cancer subtypes.
1
Citation2
0
Save
8

The Maximum Entropy Principle For Compositional Data

Corey Weistuch et al.Oct 24, 2023
A
J
J
C
Abstract In this work, we provide a general method for inferring the stochastic behavior of compositional systems. Our approach is guided by the principle of maximum entropy, a data-driven modeling technique. In particular, we show that our method can accurately capture stochastic, inter-species relationships with minimal model parameters. We provide two proofs of principle. First, we measure the relative abundances of different bacteria and infer how they interact. Second, we show that our method outperforms a common alternative for the extraction of gene-gene interactions in triple-negative breast cancer. Author summary Compositional systems, represented as proportions of some whole, are ubiquitous. They encompass the abundances of proteins in a cell, the distribution of organisms in nature, and the stoichiometry of the most basic chemical reactions. Thus, a central goal is to understand how such processes emerge from the behaviors of their components and their pairwise interactions. Such a study, however, is challenging for two key reasons. Firstly, such systems are complex and depend, often stochastically, on their constituent parts. Secondly, the data lie on a simplex which influences their correlations. We provide a general and data-driven modeling tool for compositional systems to resolve both of these issues. We achieve this through the principle of maximum entropy, which requires only minimal assumptions and limited experimental data in contrast to current alternatives. We show that our approach provides novel and biologically-intuitive insights and is promising as a comprehensive quantitative framework for compositional data.
0

Fingerprints of cancer by persistent homology

Ana Carpio et al.May 7, 2020
A
J
L
A
We have carried out a topological data analysis of gene expressions for different databases based on the Fermat distance between the z scores of different tissue samples. There is a critical value of the filtration parameter at which all clusters collapse in a single one. This critical value for healthy samples is gapless and smaller than that for cancerous ones. After collapse in a single cluster, topological holes persist for larger filtration parameter values in cancerous samples. Barcodes, persistence diagrams and Betti numbers as functions of the filtration parameter are different for different types of cancer and constitute fingerprints thereof.
0

Control and the Analysis of Cancer Growth Models

Allen Tannenbaum et al.May 7, 2020
L
J
T
A
In this note, we analyze two cancer dynamical models from a system-theoretic point of view. The first model is based upon stochastic controlled versions of the classical Lotka-Volterra equations. Here we consider from a controls point of view the utility of employing ultrahigh dose flashes in radiotherapy. The second is based on work of Norton-Simon-MassaguĂ© growth model that takes into account the heterogeneity of a tumor cell population. We indicate an optimal strategy based on linear quadratic control applied to a linear transformed model.
0

aWCluster: A Novel integrative Network-based Clustering of Multiomics Breast Cancer Data

Maryam Pouryahya et al.May 7, 2020
+4
P
J
M
The remarkable growth of multi-platform genomic profiles has led to the multiomics data integration challenge. In this study, we present a novel network-based integration method of multiomics data as well as a clustering technique founded on the Wasserstein (Earth Mover’s) distance from the theory of optimal mass transport. We applied our proposed method of aggregating multiomics and Wasserstein distance clustering (aWCluster) to invasive breast carcinoma from The Cancer Genome Atlas (TCGA) project. The subtypes were characterized by the concordant effect of mRNA expression, DNA copy number alteration, and DNA methylation as well as the interaction network connectivity of the gene products. aWCluster successfully clusters the breast cancer TCGA data into classes with significantly different survival rates. A gene ontology enrichment analysis of significant genes in the low survival subgroup leads to the well-known phenomenon of tumor hypoxia and the transcription factor ETS1 whose expression is induced by hypoxia. In addition, immune subtype analysis in our clustering via aWCluster recovers the inflammatory immune subtype in a group demonstrating improved prognosis. Consequently, we believe aWCluster has the potential to discover novel subtypes and biomarkers by accentuating the genes that have concordant multiomics measurements in their interaction network, which are challenging to find without the network inference or with single omics analysis.
0

Multi-Scale Geometric Network Analysis Identifies Melanoma Immunotherapy Response Gene Modules

Kevin Murgas et al.Jun 3, 2024
+3
N
R
K
Abstract Melanoma response to immune-modulating therapy remains incompletely characterized at the molecular level. In this study, we assess melanoma immunotherapy response using a multi-scale network approach to identify gene modules with coordinated gene expression in response to treatment. Using gene expression data of melanoma before and after treatment with nivolumab, we modeled gene expression changes in a correlation network and measured a key network geometric property, dynamic Ollivier-Ricci curvature, to distinguish critical edges within the network and reveal multi-scale treatment-response gene communities. Analysis identified six distinct gene modules corresponding to sets of genes interacting in response to immunotherapy. One module alone, overlapping with the nuclear factor kappa-B pathway (NFKB), was associated with improved patient survival and a positive clinical response to immunotherapy. This analysis demonstrates the usefulness of dynamic Ollivier-Ricci curvature as a general method for identifying information-sharing gene modules in cancer.
0

Robust and Interpretable PAM50 Reclassification Exhibits Survival Advantage for Myoepithelial and Immune Phenotypes

James Mathews et al.May 7, 2020
+3
A
S
J
We introduce a classification of breast tumors into 7 classes which are more clearly defined by interpretable mRNA signatures along the PAM50 gene set than the 5 traditional PAM50 intrinsic subtypes. Each intrinsic subtype is partially concordant with one of our classes, and the 2 additional classes correspond to division of the classes concordant with the Luminal B and the Normal intrinsic subtypes along expression of the Her2 gene group. Our Normal class shows similarity with the myoepithelial mammary cell phenotype, including TP63 expression (specificity: 80.8% and sensitivity: 82.8%), and exhibits the best overall survival (89.6% at 5 years). Though Luminal A tumors are traditionally considered the least aggressive, our analysis shows that only the Luminal A tumors which are now classified as myoepithelial have this phenotype, while tumors in our luminal class (concordant with Luminal A) may be more aggressive than previously thought. We also find that patients with Basal tumors surviving to 48 months exhibit favorable survival rates when certain markers for B-lymphocytes are present and poor survival rates when they are absent, which is consistent with recent findings.
0

Cerebrospinal Fluid and Interstitial Fluid Motion via the Glymphatic Pathway Modelled by Optimal Mass Transport

Vadim Ratner et al.May 7, 2020
+3
H
Y
V
It was recently shown that the brain-wide cerebrospinal fluid (CSF) and interstitial fluid exchange system designated the `glymphatic pathway' plays a key role in removing waste products from the brain, similarly to the lymphatic system in other body organs [1,2]. It is therefore important to study the flow patterns of glymphatic transport through the live brain in order to better understand its functionality in normal and pathological states. Unlike blood, the CSF does not flow rapidly through a network of dedicated vessels, but rather through peri-vascular channels and brain parenchyma in a slower time-domain, and thus conventional fMRI or other blood-flow sensitive MRI sequences do not provide much useful information about the desired flow patterns. We have accordingly analyzed a series of MRI images, taken at different times, of the brain of a live rat, which was injected with a paramagnetic tracer into the CSF via the lumbar intrathecal space of the spine. Our goal is twofold: (a) find glymphatic (tracer) flow directions in the live rodent brain; and (b) provide a model of a (healthy) brain that will allow the prediction of tracer concentrations given initial conditions. We model the liquid flow through the brain by the diffusion equation. We then use the Optimal Mass Transfer (OMT) approach [3] to model the glymphatic flow vector field, and estimate the diffusion tensors by analyzing the (changes in the) flow. Simulations show that the resulting model successfully reproduces the dominant features of the experimental data.
Load More