MP
Maryam Pouryahya
Author with expertise in Analysis of Gene Interaction Networks
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
10
(10% Open Access)
Cited by:
1
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

AI-based automation of enrollment criteria and endpoint assessment in clinical trials in liver diseases

Janani Iyer et al.Aug 7, 2024
Abstract Clinical trials in metabolic dysfunction-associated steatohepatitis (MASH, formerly known as nonalcoholic steatohepatitis) require histologic scoring for assessment of inclusion criteria and endpoints. However, variability in interpretation has impacted clinical trial outcomes. We developed an artificial intelligence-based measurement (AIM) tool for scoring MASH histology (AIM-MASH). AIM-MASH predictions for MASH Clinical Research Network necroinflammation grades and fibrosis stages were reproducible ( κ = 1) and aligned with expert pathologist consensus scores ( κ = 0.62–0.74). The AIM-MASH versus consensus agreements were comparable to average pathologists for MASH Clinical Research Network scores (82% versus 81%) and fibrosis (97% versus 96%). Continuous scores produced by AIM-MASH for key histological features of MASH correlated with mean pathologist scores and noninvasive biomarkers and strongly predicted progression-free survival in patients with stage 3 ( P < 0.0001) and stage 4 ( P = 0.03) fibrosis. In a retrospective analysis of the ATLAS trial (NCT03449446), responders receiving study treatment showed a greater continuous change in fibrosis compared with placebo ( P = 0.02). Overall, these results suggest that AIM-MASH may assist pathologists in histologic review of MASH clinical trials, reducing inter-rater variability on trial outcomes and offering a more sensitive and reproducible measure of patient responses.
1
Citation1
0
Save
0

Characterizing Cancer Drug Response and Biological Correlates: A Geometric Network Approach

Maryam Pouryahya et al.Nov 21, 2017
In the present work, we consider a geometric network approach to study common biological features of anticancer drug response. We use for this purpose the panel of 60 human cell lines (NCI-60) provided by the National Cancer Institute. Our study suggests that utilization of mathematical tools for network-based analysis can provide novel insights into drug response and cancer biology. We adopted a discrete notion of Ricci curvature to measure the robustness of biological networks constructed with a pre-treatment gene expression dataset and coupled the results with the GI50 response of the cell lines to the drugs. The link between network robustness and Ricci curvature was implemented using the theory of optimal mass transport. Our hypothesis behind this idea is that robustness in the biological network contributes to tumor drug resistance, thereby enabling us to predict the effectiveness and sensitivity of drugs in the cell lines. Based on the resulting drug response ranking, we assessed the impact of genes that are likely associated with individual drug response. For important genes identified, we performed a gene ontology enrichment analysis using a curated bioinformatics database which resulted in very plausible biological processes associated with drug response across cell lines and cell types from the biological and literature viewpoint. These results demonstrate the potential of using the mathematical network analysis in assessing drug response and in identifying relevant genomic biomarkers and biological processes for precision medicine.
0

Hierarchical Network Exploration using Gaussian Mixture Models

James Mathews et al.Apr 30, 2019
We present a framework based on optimal mass transport to construct, for a given network, a reduction hierarchy which can be used for interactive data exploration and community detection. Given a network and a set of numerical data samples for each node, we calculate a new computationally-efficient comparison metric between Gaussian Mixture Models, the Gaussian Mixture Transport distance, to determine a series of merge simplifications of the network. If only a network is given, numerical samples are synthesized from the network topology. The method has its basis in the local connection structure of the network, as well as the joint distribution of the data associated with neighboring nodes.The analysis is benchmarked on networks with known community structures. We also analyze gene regulatory networks, including the PANTHER curated database and networks inferred from the GTEx lung and breast tissue RNA profiles. Gene Ontology annotations from the EBI GOA database are ranked and superimposed to explain the salient gene modules. We find that several gene modules related to highly specific biological processes are well-coordinated in such tissues. We also find that 18 of the 50 genes of the PAM50 breast-tumor prognostic signature appear among the highly coordinated genes in a single gene module, in both the breast and lung samples. Moreover these 18 are precisely the subset of the PAM50 recently identified as the basal-like markers.
0

Reproducibility test of radiomics using network analysis and Wasserstein K-means algorithm

Jung Oh et al.Sep 19, 2019
Purpose: To construct robust and validated radiomic predictive models, the development of a reliable method that can identify reproducible radiomic features robust to varying image acquisition methods and other scanner parameters should be preceded with rigorous validation. Due to the property of high correlation present between radiomic features, we hypothesize that reproducible radiomic features across different datasets that are obtained from different image acquisition settings preserve some level of connectivity between features in the form of a network. Methods: We propose a regularized partial correlation network to identify robust and reproducible radiomic features. This approach was tested on two radiomic feature sets generated with two different reconstruction methods from a cohort of 47 lung cancer patients. The commonality of the resulting two networks was assessed. A largest common network component from the two networks was tested on phantom data consisting of 5 cancer samples. We further propose a novel K-means algorithm coupled with the optimal mass transport (OMT) theory to cluster samples. This approach following the regularized partial correlation analysis was tested on computed tomography (CT) scans from 77 head and neck cancer patients that were downloaded from The Cancer Imaging Archive (TCIA) and validated on CT scans from 83 head and neck cancer patients treated at our institution. Results: Common radiomic features were found in relatively large network components between the resulting two partial correlation networks from a cohort of 47 lung cancer patients. The similarity of network components in terms of the common number of radiomic features was statistically significant. For phantom data, the Wasserstein distance on a largest common network component from the lung cancer data was much smaller than the Wasserstein distance on the same network using random radiomic features, implying the reliability of those radiomic features present in the network. Further analysis using the proposed Wasserstein K-means algorithm on TCIA head and neck cancer data showed that the resulting clusters separate tumor subsites and this was validated on our institution data. Conclusions: We showed that a network-based analysis enables identifying reproducible radiomic features. This was validated using phantom data and external data via the Wasserstein distance metric and the proposed Wasserstein K-means method.
0

Optimal Mass Transport for Robust Texture Analysis

Zehor Belkhatir et al.Nov 27, 2019
The emerging field of radiomics, which consists of transforming standard-of-care images to quantifiable scalar statistics, endeavors to reveal the information hidden in these macroscopic images. This field of research has found different applications ranging from phenotyping and tumor classification to outcome prediction and treatment planning. Texture analysis, which often consists of reducing spatial texture matrices to summary scalar features, has been shown to be important in many of the latter applications. However, as pointed out in many studies, some of the derived texture statistics are strongly correlated and tend to contribute redundant information; and are also sensitive to the parameters used in their computation, e.g., the number of gray intensity levels. In the present study, we propose first to consider texture matrices, with an emphasis on gray-level co-occurrence matrix (GLCM), as a non-parametric multivariate objects. The proposed modeling approach avoids evaluating redundant and strongly correlated features and also prevents the feature processing steps. Then, via the Wasserstein distance from optimal mass transport theory, we propose to compare these spatial objects to identify computerized tomography slices with dental artifacts in head and neck cancer. We demonstrate the robustness of the proposed classification approach with respect to the GLCM extraction parameters and the size of the training set. Comparisons with the random forest classifier, which is constructed on scalar texture features, demonstrates the efficiency and robustness of the proposed algorithm.
0

Periodicity Scoring of Time Series Encodes Dynamical Behavior of the Tumor Suppressor p53

Caroline Moosmüller et al.Feb 4, 2020
In this paper, we analyze the dynamical behavior of the tumor suppressor protein p53, an essential player in the cellular stress response, which prevents a cell from dividing if severe DNA damage is present. When this response system is malfunctioning, e.g. due to mutations in p53, uncontrolled cell proliferation may lead to the development of cancer. Understanding the behavior of p53 is thus crucial to prevent its failing. It has been shown in various experiments that periodicity of the p53 signal is one of the main descriptors of its dynamics, and that its pulsing behavior (regular vs. spontaneous) indicates the level and type of cellular stress. In the present work, we introduce an algorithm to score the local periodicity of a given time series (such as the p53 signal), which we call "Detrended Autocorrelation Periodicity Scoring" (DAPS). It applies pitch detection (via autocorrelation) on sliding windows of the entire time series to describe the overall periodicity by a distribution of localized pitch scores. We apply DAPS to the p53 time series obtained from single cell experiments and establish a correlation between the periodicity scoring of a cell's p53 signal and the number of cell division events. In particular, we show that high periodicity scoring of p53 is correlated to a low number of cell divisions and vice versa. We show similar results with a more computationally intensive state-of-the-art periodicity scoring algorithm based on topology known as Sw1PerS. This correlation has two major implications: It demonstrates that periodicity scoring of the p53 signal is a good descriptor for cellular stress, and it connects the high variability of p53 periodicity observed in cell populations to the variability in the number of cell division events.
0

Robust and Interpretable PAM50 Reclassification Exhibits Survival Advantage for Myoepithelial and Immune Phenotypes

James Mathews et al.Nov 28, 2018
We introduce a classification of breast tumors into 7 classes which are more clearly defined by interpretable mRNA signatures along the PAM50 gene set than the 5 traditional PAM50 intrinsic subtypes. Each intrinsic subtype is partially concordant with one of our classes, and the 2 additional classes correspond to division of the classes concordant with the Luminal B and the Normal intrinsic subtypes along expression of the Her2 gene group. Our Normal class shows similarity with the myoepithelial mammary cell phenotype, including TP63 expression (specificity: 80.8% and sensitivity: 82.8%), and exhibits the best overall survival (89.6% at 5 years). Though Luminal A tumors are traditionally considered the least aggressive, our analysis shows that only the Luminal A tumors which are now classified as myoepithelial have this phenotype, while tumors in our luminal class (concordant with Luminal A) may be more aggressive than previously thought. We also find that patients with Basal tumors surviving to 48 months exhibit favorable survival rates when certain markers for B-lymphocytes are present and poor survival rates when they are absent, which is consistent with recent findings.
0

Molecular phenotyping using networks, diffusion, and topology: soft tissue sarcoma

James Mathews et al.May 24, 2018
In this paper, we describe an unsupervised data analysis methodology that operates in the setting of a multivariate dataset and a network which expresses influence between the variables of the given set. The technique involves network geometry employing the Wasserstein distance, global spectral analysis in the form of diffusion maps, and topological data analysis using the Mapper algorithm. The prototypical application is to gene expression profiles obtained from RNA-Seq experiments on a collection of tissue samples, considering only genes whose protein products participate in a known pathway or network of interest. Employing the technique, we discern several coherent states or signatures displayed by the gene expression profiles of The Cancer Genome Atlas (TCGA) sarcoma project along the p53 signaling network. The signatures substantially recover the leiomyosarcoma, dedifferentiated liposarcoma (DDLPS), and synovial sarcoma histological subtype diagnoses, but they also include a new signature defined by simultaneous activation and inactivation of about a dozen genes, including activation of fibrinolysis inhibitor SERPINE1/PAI and inactivation of p53-family tumor suppressor gene P73 and cyclin dependent kinase inhibitor 2A CDKN2A/P14ARF.
0

aWCluster: A Novel integrative Network-based Clustering of Multiomics Breast Cancer Data

Maryam Pouryahya et al.Feb 25, 2019
The remarkable growth of multi-platform genomic profiles has led to the multiomics data integration challenge. In this study, we present a novel network-based integration method of multiomics data as well as a clustering technique founded on the Wasserstein (Earth Mover’s) distance from the theory of optimal mass transport. We applied our proposed method of aggregating multiomics and Wasserstein distance clustering (aWCluster) to invasive breast carcinoma from The Cancer Genome Atlas (TCGA) project. The subtypes were characterized by the concordant effect of mRNA expression, DNA copy number alteration, and DNA methylation as well as the interaction network connectivity of the gene products. aWCluster successfully clusters the breast cancer TCGA data into classes with significantly different survival rates. A gene ontology enrichment analysis of significant genes in the low survival subgroup leads to the well-known phenomenon of tumor hypoxia and the transcription factor ETS1 whose expression is induced by hypoxia. In addition, immune subtype analysis in our clustering via aWCluster recovers the inflammatory immune subtype in a group demonstrating improved prognosis. Consequently, we believe aWCluster has the potential to discover novel subtypes and biomarkers by accentuating the genes that have concordant multiomics measurements in their interaction network, which are challenging to find without the network inference or with single omics analysis.