JM
James Mathews
Author with expertise in Analysis of Gene Interaction Networks
Memorial Sloan Kettering Cancer Center, Allen Institute, Allen Institute for Brain Science
+ 7 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
9
(11% Open Access)
Cited by:
5
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

The BRAIN Initiative Cell Census Network Data Ecosystem: A User’s Guide

Michael Hawrylycz et al.Oct 24, 2023
+96
P
M
M
Abstract Characterizing cellular diversity at different levels of biological organization across data modalities is a prerequisite to understanding the function of cell types in the brain. Classification of neurons is also required to manipulate cell types in controlled ways, and to understand their variation and vulnerability in brain disorders. The BRAIN Initiative Cell Census Network (BICCN) is an integrated network of data generating centers, data archives and data standards developers, with the goal of systematic multimodal brain cell type profiling and characterization. Emphasis of the BICCN is on the whole mouse brain and demonstration of prototypes for human and non-human primate (NHP) brains. Here, we provide a guide to the cellular and spatial approaches employed, and to accessing and using the BICCN data and its extensive resources, including the BRAIN Cell Data Center (BCDC) which serves to manage and integrate data across the ecosystem. We illustrate the power of the BICCN data ecosystem through vignettes highlighting several BICCN analysis and visualization tools. Finally, we present emerging standards that have been developed or adopted by the BICCN toward FAIR (Wilkinson et al. 2016a) neuroscience. The combined BICCN ecosystem provides a comprehensive resource for the exploration and analysis of cell types in the brain.
0

Fingerprints of cancer by persistent homology

Ana Carpio et al.May 7, 2020
A
J
L
A
We have carried out a topological data analysis of gene expressions for different databases based on the Fermat distance between the z scores of different tissue samples. There is a critical value of the filtration parameter at which all clusters collapse in a single one. This critical value for healthy samples is gapless and smaller than that for cancerous ones. After collapse in a single cluster, topological holes persist for larger filtration parameter values in cancerous samples. Barcodes, persistence diagrams and Betti numbers as functions of the filtration parameter are different for different types of cancer and constitute fingerprints thereof.
0

aWCluster: A Novel integrative Network-based Clustering of Multiomics Breast Cancer Data

Maryam Pouryahya et al.May 7, 2020
+4
P
J
M
The remarkable growth of multi-platform genomic profiles has led to the multiomics data integration challenge. In this study, we present a novel network-based integration method of multiomics data as well as a clustering technique founded on the Wasserstein (Earth Mover’s) distance from the theory of optimal mass transport. We applied our proposed method of aggregating multiomics and Wasserstein distance clustering (aWCluster) to invasive breast carcinoma from The Cancer Genome Atlas (TCGA) project. The subtypes were characterized by the concordant effect of mRNA expression, DNA copy number alteration, and DNA methylation as well as the interaction network connectivity of the gene products. aWCluster successfully clusters the breast cancer TCGA data into classes with significantly different survival rates. A gene ontology enrichment analysis of significant genes in the low survival subgroup leads to the well-known phenomenon of tumor hypoxia and the transcription factor ETS1 whose expression is induced by hypoxia. In addition, immune subtype analysis in our clustering via aWCluster recovers the inflammatory immune subtype in a group demonstrating improved prognosis. Consequently, we believe aWCluster has the potential to discover novel subtypes and biomarkers by accentuating the genes that have concordant multiomics measurements in their interaction network, which are challenging to find without the network inference or with single omics analysis.
0

Robust and Interpretable PAM50 Reclassification Exhibits Survival Advantage for Myoepithelial and Immune Phenotypes

James Mathews et al.May 7, 2020
+3
A
S
J
We introduce a classification of breast tumors into 7 classes which are more clearly defined by interpretable mRNA signatures along the PAM50 gene set than the 5 traditional PAM50 intrinsic subtypes. Each intrinsic subtype is partially concordant with one of our classes, and the 2 additional classes correspond to division of the classes concordant with the Luminal B and the Normal intrinsic subtypes along expression of the Her2 gene group. Our Normal class shows similarity with the myoepithelial mammary cell phenotype, including TP63 expression (specificity: 80.8% and sensitivity: 82.8%), and exhibits the best overall survival (89.6% at 5 years). Though Luminal A tumors are traditionally considered the least aggressive, our analysis shows that only the Luminal A tumors which are now classified as myoepithelial have this phenotype, while tumors in our luminal class (concordant with Luminal A) may be more aggressive than previously thought. We also find that patients with Basal tumors surviving to 48 months exhibit favorable survival rates when certain markers for B-lymphocytes are present and poor survival rates when they are absent, which is consistent with recent findings.
0

Characterizing Cancer Drug Response and Biological Correlates: A Geometric Network Approach

Maryam Pouryahya et al.May 7, 2020
+2
J
J
M
In the present work, we consider a geometric network approach to study common biological features of anticancer drug response. We use for this purpose the panel of 60 human cell lines (NCI-60) provided by the National Cancer Institute. Our study suggests that utilization of mathematical tools for network-based analysis can provide novel insights into drug response and cancer biology. We adopted a discrete notion of Ricci curvature to measure the robustness of biological networks constructed with a pre-treatment gene expression dataset and coupled the results with the GI50 response of the cell lines to the drugs. The link between network robustness and Ricci curvature was implemented using the theory of optimal mass transport. Our hypothesis behind this idea is that robustness in the biological network contributes to tumor drug resistance, thereby enabling us to predict the effectiveness and sensitivity of drugs in the cell lines. Based on the resulting drug response ranking, we assessed the impact of genes that are likely associated with individual drug response. For important genes identified, we performed a gene ontology enrichment analysis using a curated bioinformatics database which resulted in very plausible biological processes associated with drug response across cell lines and cell types from the biological and literature viewpoint. These results demonstrate the potential of using the mathematical network analysis in assessing drug response and in identifying relevant genomic biomarkers and biological processes for precision medicine.
0

Molecular phenotyping using networks, diffusion, and topology: soft tissue sarcoma

James Mathews et al.May 7, 2020
+3
C
M
J
In this paper, we describe an unsupervised data analysis methodology that operates in the setting of a multivariate dataset and a network which expresses influence between the variables of the given set. The technique involves network geometry employing the Wasserstein distance, global spectral analysis in the form of diffusion maps, and topological data analysis using the Mapper algorithm. The prototypical application is to gene expression profiles obtained from RNA-Seq experiments on a collection of tissue samples, considering only genes whose protein products participate in a known pathway or network of interest. Employing the technique, we discern several coherent states or signatures displayed by the gene expression profiles of The Cancer Genome Atlas (TCGA) sarcoma project along the p53 signaling network. The signatures substantially recover the leiomyosarcoma, dedifferentiated liposarcoma (DDLPS), and synovial sarcoma histological subtype diagnoses, but they also include a new signature defined by simultaneous activation and inactivation of about a dozen genes, including activation of fibrinolysis inhibitor SERPINE1/PAI and inactivation of p53-family tumor suppressor gene P73 and cyclin dependent kinase inhibitor 2A CDKN2A/P14ARF.
0

Hierarchical Network Exploration using Gaussian Mixture Models

James Mathews et al.May 7, 2020
+3
M
S
J
We present a framework based on optimal mass transport to construct, for a given network, a reduction hierarchy which can be used for interactive data exploration and community detection. Given a network and a set of numerical data samples for each node, we calculate a new computationally-efficient comparison metric between Gaussian Mixture Models, the Gaussian Mixture Transport distance, to determine a series of merge simplifications of the network. If only a network is given, numerical samples are synthesized from the network topology. The method has its basis in the local connection structure of the network, as well as the joint distribution of the data associated with neighboring nodes.The analysis is benchmarked on networks with known community structures. We also analyze gene regulatory networks, including the PANTHER curated database and networks inferred from the GTEx lung and breast tissue RNA profiles. Gene Ontology annotations from the EBI GOA database are ranked and superimposed to explain the salient gene modules. We find that several gene modules related to highly specific biological processes are well-coordinated in such tissues. We also find that 18 of the 50 genes of the PAM50 breast-tumor prognostic signature appear among the highly coordinated genes in a single gene module, in both the breast and lung samples. Moreover these 18 are precisely the subset of the PAM50 recently identified as the basal-like markers.
0

Network-based clustering for drug sensitivity prediction in cancer cell lines

Maryam Pouryahya et al.May 7, 2020
+4
J
J
M
The study of large-scale pharmacogenomics provides an unprecedented opportunity to develop computational models that can accurately predict large cohorts of cell lines and drugs. In this work, we present a novel method for predicting drug sensitivity in cancer cell lines which considers both cell line genomic features and drug chemical features. Our network-based approach combines the theory of optimal mass transport (OMT) with machine learning techniques. It starts with unsupervised clustering of both cell line and drug data, followed by the prediction of drug sensitivity in the paired cluster of cell lines and drugs. We show that prior clustering of the heterogenous cell lines and structurally diverse drugs significantly improves the accuracy of the prediction. In addition, it facilities the interpretability of the results and identification of molecular biomarkers which are significant for both clustering of the cell lines and predicting the drug response.
0

Optimal Mass Transport for Robust Texture Analysis

Zehor Belkhatir et al.May 7, 2020
+5
J
A
Z
The emerging field of radiomics, which consists of transforming standard-of-care images to quantifiable scalar statistics, endeavors to reveal the information hidden in these macroscopic images. This field of research has found different applications ranging from phenotyping and tumor classification to outcome prediction and treatment planning. Texture analysis, which often consists of reducing spatial texture matrices to summary scalar features, has been shown to be important in many of the latter applications. However, as pointed out in many studies, some of the derived texture statistics are strongly correlated and tend to contribute redundant information; and are also sensitive to the parameters used in their computation, e.g., the number of gray intensity levels. In the present study, we propose first to consider texture matrices, with an emphasis on gray-level co-occurrence matrix (GLCM), as a non-parametric multivariate objects. The proposed modeling approach avoids evaluating redundant and strongly correlated features and also prevents the feature processing steps. Then, via the Wasserstein distance from optimal mass transport theory, we propose to compare these spatial objects to identify computerized tomography slices with dental artifacts in head and neck cancer. We demonstrate the robustness of the proposed classification approach with respect to the GLCM extraction parameters and the size of the training set. Comparisons with the random forest classifier, which is constructed on scalar texture features, demonstrates the efficiency and robustness of the proposed algorithm.