JG
Joshy George
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Jackson Laboratory, Peter MacCallum Cancer Centre, University of Connecticut Health Center
+ 9 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(62% Open Access)
Cited by:
55
h-index:
61
/
i10-index:
89
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Development and Validation of the Gene Expression Predictor of High-grade Serous Ovarian Carcinoma Molecular SubTYPE (PrOTYPE)

Aline Talhouk et al.Aug 25, 2024
+122
C
J
A
Abstract Purpose: Gene expression–based molecular subtypes of high-grade serous tubo-ovarian cancer (HGSOC), demonstrated across multiple studies, may provide improved stratification for molecularly targeted trials. However, evaluation of clinical utility has been hindered by nonstandardized methods, which are not applicable in a clinical setting. We sought to generate a clinical grade minimal gene set assay for classification of individual tumor specimens into HGSOC subtypes and confirm previously reported subtype-associated features. Experimental Design: Adopting two independent approaches, we derived and internally validated algorithms for subtype prediction using published gene expression data from 1,650 tumors. We applied resulting models to NanoString data on 3,829 HGSOCs from the Ovarian Tumor Tissue Analysis consortium. We further developed, confirmed, and validated a reduced, minimal gene set predictor, with methods suitable for a single-patient setting. Results: Gene expression data were used to derive the predictor of high-grade serous ovarian carcinoma molecular subtype (PrOTYPE) assay. We established a de facto standard as a consensus of two parallel approaches. PrOTYPE subtypes are significantly associated with age, stage, residual disease, tumor-infiltrating lymphocytes, and outcome. The locked-down clinical grade PrOTYPE test includes a model with 55 genes that predicted gene expression subtype with &gt;95% accuracy that was maintained in all analytic and biological validations. Conclusions: We validated the PrOTYPE assay following the Institute of Medicine guidelines for the development of omics-based tests. This fully defined and locked-down clinical grade assay will enable trial design with molecular subtype stratification and allow for objective assessment of the predictive value of HGSOC molecular subtypes in precision medicine applications. See related commentary by McMullen et al., p. 5271
0
Citation50
0
Save
0

Pan-cancer machine learning predictors of primary site of origin and molecular subtype

William Flynn et al.May 7, 2020
+4
C
S
W
ABSTRACT Background It is estimated by the American Cancer Society that approximately 5% of all metastatic tumors have no defined primary site (tissue) of origin and are classified as c ancers of u nknown p rimary (CUPs). The current standard of care for CUP patients depends on immunohistochemistry (IHC) based approaches to identify the primary site. The addition of post-mortem evaluation to IHC based tests helps to reveal the identity of the primary site for only 25% of the CUPs, emphasizing the acute need for better methods of determination of the site of origin. CUP patients are therefore given generic chemotherapeutic agents resulting in poor prognosis. When the tissue of origin is known, patients can be given site specific therapy with significant improvement in clinical outcome. Similarly, identifying the primary site of origin of metastatic cancer is of great importance for designing treatment. Identification of the primary site of origin is an import first step but may not be sufficient information for optimal treatment of the patient. Recent studies, primarily from The Cancer Genome Atlas (TCGA) project, and others, have revealed molecular subtypes in several cancer types with distinct clinical outcome. The molecular subtype captures the fundamental mechanisms driving the cancer and provides information that is essential for the optimal treatment of a cancer. Thus, along with primary site of origin, molecular subtype of a tumor is emerging as a criterion for personalized medicine and patient entry into clinical trials. However, there is no comprehensive toolset available for precise identification of tissue of origin or molecular subtype for precision medicine and translational research. Methods and Findings We posited that metastatic tumors will harbor the gene expression profiles of the primary site of origin of the cancer. Therefore, we decided to learn the molecular characteristics of the primary tumors using the large number of cancer genome profiles available from the TCGA project. Our predictors were trained for 33 cancer types and for the 11 cancers where there are established molecular subtypes. We estimated the accuracy of several machine learning models using cross-validation methods. The extensive testing using independent test sets revealed that the predictors had a median sensitivity and specificity of 97.2% and 99.9% respectively without losing classification of any tumor. Subtype classifiers achieved median sensitivity of 87.7% and specificity of 94.5% via cross validation and presented median sensitivity of 79.6% and specificity of 94.6% in two external datasets of 1,999 total samples. Importantly, these external data shows that our classifiers can robustly predict the primary site of origin from external microarray data, metastatic cancer data, and patient-derived xenograft (PDX) data. Conclusion We have demonstrated the utility of gene expression profiles to solve the important clinical challenge of identifying the primary site of origin and the molecular subtype of cancers based on machine learning algorithms. We show, for the first time to our knowledge, that our pan-cancer classifiers can predict multiple cancers’ primary site of origin from metastatic samples. The predictors will be made available as open source software, freely available for academic non-commercial use.
0
Paper
Citation3
0
Save
8

Supervised learning with word embeddings derived from PubMed captures latent knowledge about protein kinases and cancer

Vida Ravanmehr et al.Oct 24, 2023
+14
L
H
V
ABSTRACT Inhibiting protein kinases (PKs) that cause cancers has been an important topic in cancer therapy for years. So far, almost 8% of more than 530 PKs have been targeted by FDA-approved medications and around 150 protein kinase inhibitors (PKIs) have been tested in clinical trials. We present an approach based on natural language processing and machine learning to the relations between PKs and cancers, predicting PKs whose inhibition would be efficacious to treat a certain cancer. Our approach represents PKs and cancers as semantically meaningful 100-dimensional vectors based on co-occurrence patterns in PubMed abstracts. We use information about phase I-IV trials in ClinicalTrials.gov to construct a training set for random forest classification. In historical data, associations between PKs and specific cancers could be predicted years in advance with good accuracy. Our model may be a tool to predict the relevance of inhibiting PKs with specific cancers.
0

A computational method to aid the design and analysis of single cell RNA-seq experiments for cell type identification

Douglas Abrams et al.May 7, 2020
J
R
P
D
Background: The advent of single cell RNA sequencing (scRNA-seq) enabled researchers to study transcriptomic activity within individual cells and identify inherent cell types in the sample. Although numerous computational tools have been developed to analyze single cell transcriptomes, there are no published studies and analytical packages available to guide experimental design and to devise suitable analysis procedure for cell type identification. Results: We have developed an empirical methodology to address this important gap in single cell experimental design and analysis into an easy-to-use tool called SCEED (Single Cell Empirical Experimental Design and analysis). With SCEED, user can choose a variety of combinations of tools for analysis, conduct performance analysis of analytical procedures and choose the best procedure, and estimate sample size (number of cells to be profiled) required for a given analytical procedure at varying levels of cell type rarity and other experimental parameters. Using SCEED, we examined 3 single cell algorithms using 48 simulated single cell datasets that were generated for varying number of cell types and their proportions, number of genes expressed per cell, number of marker genes and their fold change, and number of single cells successfully profiled in the experiment. Conclusions: Based on our study, we found that when marker genes are expressed at fold change of 4 or more than the rest of the genes, either Seurat or Simlr algorithm can be used to analyze single cell dataset for any number of single cells isolated (minimum 1000 single cells were tested). However, when marker genes are expected to be only up to fC 2 upregulated, choice of the single cell algorithm is dependent on the number of single cells isolated and proportion of rare cell type to be identified. In conclusion, our work allows the assessment of various single cell methods and also aids in examining the single cell experimental design.
0

The impact of sex on alternative splicing

Guy Karlebach et al.May 7, 2020
+18
A
D
G
Over 95% of human genes undergo alternative splicing (AS) in a developmental, tissue-specific, or signal transduction-dependent manner. A number of factors including binding of cis-acting sequences by RNA-binding proteins (RBPs) are known to affect AS, but the combinatorial mechanisms leading to the distribution of spliced isoforms remain largely unstudied. Here, in 9011 samples from 532 individuals across 53 tissues from the Genotype-Tissue Expression (GTEx) resource, we identified 4,135 genes with sex-biased expression and 5,925 sex-biased AS events. We find that factors including escape from X-chromosomal inactivation, presence of Alu elements, and estrogen receptor binding sites affect sex-biased AS. We utilize hierarchical Bayesian modeling to characterize the interactions of exon skipping, gene expression, and RBPs, and demonstrate two categories of sex-biased AS that differ with respect to splice site scores, gene expression, RBP levels, and skipping/inclusion ratio.
0
0
Save
0

Differential functions of splicing factors in breast-cancer initiation and metastasis

Shipra Das et al.May 7, 2020
+13
S
M
S
Misregulation of alternative splicing is a hallmark of human tumors; yet to what extent and how it contributes to malignancy are only beginning to be unraveled. Here, we define which members of the splicing factor SR and SR-like families contribute to breast cancer, and uncover differences and redundancies in their targets and biological functions. We first identify splicing factors frequently altered in human breast tumors, and then assay their oncogenic functions using breast organoid models. Importantly we demonstrate that not all splicing factors affect mammary tumorigenesis. Specifically, upregulation of either SRSF4, SRSF6 or TRA2β promotes cell transformation and invasion. By characterizing the targets of theses oncogenic factors, we identify a shared set of spliced genes associated with well-established cancer hallmarks. Finally, we demonstrate that the splicing factor TRA2β is regulated by the MYC oncogene, plays a role in metastasis maintenance in vivo, and its levels correlate with breast-cancer-patient survival.
0

Evolution of an intratumoral ecology susceptible to successive treatment in breast cancer xenografts

Hyunsoo Kim et al.May 7, 2020
+16
F
P
H
ABSTRACT The processes by which tumors evolve are essential to the efficacy of treatment, but quantitative understanding of intratumoral dynamics has been limited. Although intratumoral heterogeneity is common, quantification of evolution is difficult from clinical samples because treatment replicates cannot be performed and because matched serial samples are infrequently available. To circumvent these problems we derived and assayed large sets of human triple-negative breast cancer xenografts and cell cultures from two patients, including 86 xenografts from cyclophosphamide, doxorubicin, cisplatin, docetaxel, or vehicle treatment cohorts as well as 45 related cell cultures. We assayed these samples via exome-seq and/or high-resolution droplet digital PCR, allowing us to distinguish complex therapy-induced selection and drift processes among endogenous cancer subclones with cellularity uncertainty <3%. For one patient, we discovered two predominant subclones that were granularly intermixed in all 48 co-derived xenograft samples. These two subclones exhibited differential chemotherapy sensitivity -- when xenografts were treated with cisplatin for 3 weeks, the post-treatment volume change was proportional to the post-treatment ratio of subclones on a xenograft-to-xenograft basis. A subsequent cohort in which xenografts were treated with cisplatin, allowed a drug holiday, then treated a second time continued to exhibit this proportionality. In contrast, xenografts from other treatment cohorts, spatially dissected xenograft fragments, and cell cultures evolved unsystematically but with substantial population bottlenecks. These results show that ecologies susceptible to successive retreatment can arise spontaneously in breast cancer in spite of a background of irregular subclonal bottlenecks, and our work provides to our knowledge the first quantification of the population genetics of such a system. Intriguingly, in such an ecology the ratio of common subclones is predictive of the state of treatment susceptibility, suggesting that this ratio can be measured to optimize dynamic treatment protocols in patients. AUTHOR SUMMARY An overarching challenge of cancer is that patients develop resistance to treatment -- an essentially evolutionary process. However, there is currently very little understanding of how tumor evolution can be exploited to improve treatment. One reason for this is that usually only 1-2 samples can be obtained per patient, so cancer evolutionary processes are still poorly understood. To solve this problem, we created many dozens of copies of the tumors from two breast cancer patients using xenografting and cell culture methods. We then compared the evolution in these tumor copies in response to different treatments, including four of the most common breast cancer chemotherapies. These studies present the most exhaustive comparisons of treatment-induced evolution that have yet been performed for individual cancer patients. Unexpectedly, high-resolution sequencing of these samples revealed a special dynamically treatable ecology in one tumor, in which tumor growth during platinum therapy was determined by the ecological balance of two tumor cell populations. Our work shows that ecologies that can be targeted by dynamic treatment strategies arise spontaneously in breast cancers. Population heterogeneity is common within cancers, and our work suggests how tracking of intratumoral evolution can be used to optimize treatment.
1

A Genomically and Clinically Annotated Patient Derived Xenograft (PDX) Resource for Preclinical Research in Non-Small Cell Lung Cancer

Xing Woo et al.Oct 24, 2023
+30
P
A
X
Abstract Patient-derived xenograft models (PDXs) are an effective preclinical in vivo platform for testing the efficacy of novel drug and drug combinations for cancer therapeutics. Here we describe a repository of 79 genomically and clinically annotated lung cancer PDXs available from The Jackson Laboratory that have been extensively characterized for histopathological features, mutational profiles, gene expression, and copy number aberrations. Most of the PDXs are models of non-small cell lung cancer (NSCLC), including 37 lung adenocarcinoma (LUAD) and 33 lung squamous cell carcinoma (LUSC) models. Other lung cancer models in the repository include four small cell carcinomas, two large cell neuroendocrine carcinomas, two adenosquamous carcinomas, and one pleomorphic carcinoma. Models with both de novo and acquired resistance to targeted therapies with tyrosine kinase inhibitors are available in the collection. The genomic profiles of the LUAD and LUSC PDX models are consistent with those observed in patient tumors of the same tumor type from The Cancer Genome Atlas (TCGA) and to previously characterized gene expression-based molecular subtypes. Clinically relevant mutations identified in the original patient tumors were confirmed in engrafted tumors. Treatment studies performed for a subset of the models recapitulated the responses expected based on the observed genomic profiles. Significance The collection of lung cancer Patient Derived Xenograft (PDX) models maintained at The Jackson Laboratory retain both the histologic features and treatment-relevant genomic alterations observed in the originating patient tumors and show expected responses to treatment with standard-of-care agents. The models serve as a valuable preclinical platform for translational cancer research. Information and data for the models are freely available from the Mouse Models of Human Cancer database (MMHCdb, http://tumor.informatics.jax.org/mtbwi/pdxSearch.do ).
2

Collaborative partnership model to transform bioinformatics core into a highly effective research partner and multiply the impact

R. Karuturi et al.Oct 24, 2023
+2
G
G
R
Many bioinformatics cores face a multitude of challenges. We recognized that the primary source of these challenges was the service-centric approach. So, we initiated the transformation of our bioinformatics core, Computational Sciences (CS), at the Jackson Laboratory (Jax) to be a science-centric collaborative research partner for our faculty and project stakeholders. We call our model as collaborative partnership model . With the effective replacement of the service model with the collaborative partnership model, CS now acts as both an effective collaborator and a co-driver of scientific research and innovation at Jax. In this paper, we describe the principles and practices we adopted to realize this transformation and present the resulting growth in the impact of CS in the research enterprise at Jax.
3

Sex-biasedYap1oncogene function

Nourhan Abdelfattah et al.Oct 24, 2023
+8
J
S
N
ABSTRACT The incidence of many human cancers differs according to sex, but little is known about the interplay between oncogenic events and sex as a variable in tumorigenesis. Here we report that the oncogene Yap1 is sexually dimorphic in medulloblastoma progression and immune suppression. We show that Yap1 promotes stemness and blocks differentiation in sonic hedgehog (SHH)-subtype medulloblastoma by at least two distinct but complementary molecular mechanisms to regulate the RNA expression and protein functions of Sox2, Atoh1, NeuroD1, and Zic1/2. Yap1 also promotes an immune suppressive tumor microenvironment by directly regulating Csf1, Igf1, and Igfbp3 transcription and modulating IL6-JAK-STAT3, TNFR1, TGF-β, and CCL5 immune pathways. Notably, Yap1 function is more critical in males and this is evolutionarily conserved: genes downstream of YAP1 identified in mouse models stratify male but not female medulloblastoma patient survival. In summary, we demonstrate a sex-based function for an oncogene, underscoring the critical need to incorporate sex as a variable in cancer mechanism and clinical response studies, particularly those involving YAP1.
3
0
Save
Load More