ML
Marilyn Li
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(89% Open Access)
Cited by:
191
h-index:
31
/
i10-index:
68
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
14

Integrated Proteogenomic Characterization across Major Histological Types of Pediatric Brain Cancer

Francesca Petralia et al.Dec 1, 2020
+141
B
N
F
We report a comprehensive proteogenomics analysis, including whole-genome sequencing, RNA sequencing, and proteomics and phosphoproteomics profiling, of 218 tumors across 7 histological types of childhood brain cancer: low-grade glioma (n = 93), ependymoma (32), high-grade glioma (25), medulloblastoma (22), ganglioglioma (18), craniopharyngioma (16), and atypical teratoid rhabdoid tumor (12). Proteomics data identify common biological themes that span histological boundaries, suggesting that treatments used for one histological type may be applied effectively to other tumors sharing similar proteomics features. Immune landscape characterization reveals diverse tumor microenvironments across and within diagnoses. Proteomics data further reveal functional effects of somatic mutations and copy number variations (CNVs) not evident in transcriptomics data. Kinase-substrate association and co-expression network analysis identify important biological mechanisms of tumorigenesis. This is the first large-scale proteogenomics analysis across traditional histological boundaries to uncover foundational pediatric brain tumor biology and inform rational treatment selection.
14
Citation187
0
Save
8

Alternative splicing of its 5’-UTR limits CD20 mRNA translation and enables resistance to CD20-directed immunotherapies

Zhiwei Ang et al.Feb 19, 2023
+23
K
L
Z
Aberrant skipping of coding exons in CD19 and CD22 compromises responses to immunotherapy for B-cell malignancies. Here, we show that the MS4A1 gene encoding human CD20 also produces several mRNA isoforms with distinct 5' untranslated regions (5'-UTR). Four variants (V1-4) were detectable by RNA-seq in distinct stages of normal B-cell differentiation and B-lymphoid malignancies, with V1 and V3 being the most abundant by far. During B-cell activation and Epstein-Barr virus infection, redirection of splicing from V1 to V3 coincided with increased CD20 positivity. Similarly, in diffuse large B-cell lymphoma only V3, but not V1, correlated with CD20 protein levels, suggesting that V1 might be translation-deficient. Indeed, the longer V1 isoform was found to contain upstream open reading frames (uORFs) and a stem-loop structure, which cooperatively inhibited polysome recruitment. By modulating CD20 isoforms with splice-switching Morpholino oligomers, we enhanced CD20 expression and anti-CD20 antibody rituximab-mediated cytotoxicity in a panel of B-cell lines. Furthermore, reconstitution of CD20-knockout cells with V3 mRNA led to the recovery of CD20 positivity, while V1-reconstituted cells had undetectable levels of CD20 protein. Surprisingly, in vitro CD20-directed CAR T cells were able to kill both V3- and V1-expressing cells, but the bispecific T cell engager mosunetuzumab was only effective against V3-expressing cells. To determine whether CD20 splicing is involved in immunotherapy resistance, we performed RNA-seq on four post-mosunetuzumab follicular lymphoma relapses and discovered that in two of them downregulation of CD20 was accompanied by the V3-to-V1 shift. Thus, splicing-mediated mechanisms of epitope loss extend to CD20-directed immunotherapies.In normal & malignant human B cells, CD20 mRNA is alternatively spliced into four 5'-UTR isoforms, some of which are translation-deficient.The balance between translation-deficient and -competent isoforms modulates CD20 protein levels & responses to CD20-directed immunotherapies.We discovered that in normal and malignant B-cells, CD20 mRNA is alternatively spliced to generate four distinct 5'-UTRs, including the longer translation-deficient V1 variant. Cells predominantly expressing V1 were still sensitive to CD20-targeting chimeric antigen receptor T-cells. However, they were resistant to the bispecific anti-CD3/CD20 antibody mosunetuzumab, and the shift to V1 were observed in CD20-negative post-mosunetuzumab relapses of follicular lymphoma.
8
Citation2
0
Save
0

Using Machine Learning to Identify True Somatic Variants from Next-Generation Sequencing

Chao Wu et al.Jun 13, 2019
+5
M
X
C
Abstract Background Molecular profiling has become essential for tumor risk stratification and treatment selection. However, cancer genome complexity and technical artifacts make identification of real variants a challenge. Currently, clinical laboratories rely on manual screening, which is costly, subjective, and not scalable. Here we present a machine learning-based method to distinguish artifacts from bona fide Single Nucleotide Variants (SNVs) detected by NGS from tumor specimens. Methods A cohort of 11,278 SNVs identified through clinical sequencing of tumor specimens were collected and divided into training, validation, and test sets. Each SNV was manually inspected and labeled as either real or artifact as part of clinical laboratory workflow. A three-class (real, artifact and uncertain) model was developed on the training set, fine-tuned using the validation set, and then evaluated on the test set. Prediction intervals reflecting the certainty of the classifications were derived during the process to label “uncertain” variants. Results The optimized classifier demonstrated 100% specificity and 97% sensitivity over 5,587 SNVs of the test set. 1,252 out of 1,341 true positive variants were identified as real, 4,143 out of 4,246 false positive calls were deemed artifacts, while only 192(3.4%) SNVs were labeled as “uncertain” with zero misclassification between the true positives and artifacts in the test set. Conclusions We presented a computational classifier to identify variant artifacts detected from tumor sequencing. Overall, 96.6% of the SNVs received a definitive label and thus were exempt from manual review. This framework could improve quality and efficiency of variant review process in clinical labs.
5

CancerVar: an Artificial Intelligence empowered platform for clinical interpretation of somatic mutations in cancer

Quan Li et al.Oct 8, 2020
+3
M
K
Q
ABSTRACT Several knowledgebases, such as CIViC and OncoKB, have been manually curated to support clinical interpretations of a limited number of “hotspot” somatic mutations in cancer, yet discrepancies or even conflicting interpretations have been observed among these knowledgebases. Additionally, while these knowledgebases have been extremely useful, they typically cannot interpret novel mutations, which may also have functional and clinical impacts in cancer. To address these challenges, we developed an automated interpretation tool called CancerVar (Cancer Variants interpretation) to score more than 12.9 million somatic mutations and classify them into four tiers: strong clinical significance, potential clinical significance, uncertain clinical significance, and benign/likely benign, based on the AMP/ASCO/CAP 2017 guideline. Considering that the AMP/ASCO/CAP rule-based scoring system may have inherent limitations, such as lack of a clear guidance on weighing different pieces of functional evidence or unclear definition for certain clinical evidence, it may cause misinterpretation for certain variants that have functional impacts but no proven clinical significance. To address this issue, we further introduced a deep learning-based scoring system to predict oncogenicity of mutations by semi-supervised generative adversarial network (SGAN) method using both functional and clinical evidence. We trained and validated the SGAN model on 5,234 somatic mutations from an in-house database of clinical reports on cancer patients, and achieved a good performance when testing on 6,226 variants that were curated by us through literature search. We also compared the prediction with several independent datasets and showed great utility in classifying variants with previously unknown interpretations. CancerVar is also incorporated into a web server that can generate automated texts with summarized descriptive interpretations, such as diagnostic, prognostic, targeted drug responses and clinical trial information for many hotspot mutations. In summary, CancerVar can facilitate clinical interpretation and hypothesis generation for somatic mutations, and greatly reduce manual workload for retrieving relevant evidence and implementing existing guidelines.
5
Citation1
0
Save
0

Novel BRAF gene fusions in pediatric histiocytic neoplasms define distinct therapeutic responsiveness to RAF paradox breakers

Payal Jain et al.Apr 14, 2020
+8
J
L
P
Pediatric histiocytic neoplasms are clonal hematopoietic disorders driven by mutations activating the mitogen-activated protein kinase (MAPK) pathway, such as BRAF-V600E. In non-BRAFV600E cases, we investigated alternative MAPK mutations and found two novel BRAF gene fusions. We investigated the distinct responsiveness of novel BRAF fusions to RAFi therapies and explored the mechanistic basis of such differential responses compared to other BRAF fusions. Two histiocytic patient tumors were analyzed using the CHOP Comprehensive Next-Gen Sequencing Solid Tumor Panel and a targeted RNA-seq panel for 106 fusion partner genes. In the two M- and L-type histiocytic neoplasms assessed, we found novel and rare BRAF gene fusions, MTAP-BRAF and MS4A6A-BRAF, respectively. Both BRAF fusions activated the MAPK/ PI3K pathways and showed homo- and hetero-dimerization with BRAF and the respective N-terminal fusion partner. In contrast to common BRAF fusions, MTAP-BRAF and MS4A6A-BRAF did not respond to PLX8394 due to a lack of disruption of active fusion homo- and hetero-dimers, which was in turn due to the untargeted, stable dimerization mediated by the N-terminal fusion partners. Conversely, we observed robust suppression with LY3009120 that bound fusion dimers and kept them in an inactivate confirmation. MEKi were found to successfully suppress fusion driven signaling and oncogenic phenotypes. Our finding that PLX8394 does not disrupt MTAP-BRAF or MS4A6A-BRAF dimerization due to contribution of N-terminal partners defines a novel paradigm for the distinct mechanisms sought by BRAF fusions in response to RAFi therapy. Overall, this study highlights the unique and differential biology hijacked by BRAF fusions in response to RAFi and further warrants detailed mechanistic classification of BRAF fusions based on their responsiveness to targeted agents.### Competing Interest StatementThe authors have declared no competing interest.
1

Fusion-oncogenes are associated with increased metastatic capacity and persistent disease in pediatric thyroid cancers

Aime Franco et al.Jul 26, 2021
+12
A
J
A
ABSTRACT Background In 2014, data from a comprehensive multiplatform analysis of 496 adult papillary thyroid cancer samples reported by The Cancer Genome Atlas project suggested that reclassification of thyroid cancer into molecular subtypes, RAS -like and BRAF -like, better reflects clinical behavior than sole reliance on pathological classification. The aim of this study was to categorize the common oncogenic variants in pediatric differentiated thyroid cancer and investigate if mutation subtype classification correlated with the risk of metastasis and response to initial therapy in pediatric DTC. Methods Somatic cancer gene panel analysis was completed on DTC from 131 pediatric patients. DTC were categorized into RAS -mutant ( H-K-NRAS ), BRAF -mutant (BRAF p.V600E) and RET/NTRK fusion ( RET, NTRK1 and NTRK3 fusions) to determine differences between subtype classification in regard to pathological data (AJCC TNM) as well as response to therapy 1-year after initial treatment had been completed. Results Mutation-based subtype categories were significant in most variables, including age at diagnosis, metastatic behavior, and the likelihood of remission at 1-year. Patients with RET/NTRK fusions were significantly more likely to have advanced lymph node and distant metastasis and less likely to achieve remission at one year than patients within RAS - or BRAF-mut subgroups. Conclusions Our data supports that genetic subtyping of pediatric DTC more accurately reflects clinical behavior than sole reliance on pathological classification with patients with RET/NTRK fusions having worse outcomes than those with BRAF -mutant disease. Future trials should consider inclusion of molecular subtype into risk stratification.
1

A Novel Aberrantly Spliced Gain-of-Function NT5C2 Isoform Contributes to Thiopurine Resistance in Acute Lymphoblastic Leukemia

Manuel Torres-Diz et al.Sep 16, 2023
+11
C
C
M
Abstract Relapse-specific mutations do not account for all chemotherapy failures in patients with B-cell acute lymphoblastic leukemia (B-ALL). By mining RNA-seq datasets of paired diagnostic/relapse pediatric B-ALL samples, we discovered pervasive aberrant splicing (AS) patterns linked with relapse. They affected drivers of resistance to glucocorticoids, anti-folates, and thiopurines. Most splicing variations represent exon skipping, “poison” exon inclusion, and intron retention, phenocopying well-documented loss-of-function mutations. In addition, relapse-associated AS of NT5C2 mRNA yields an isoform with a cryptic 24-nt in-frame exon 6a. Inclusion of the extra 8 amino acids into this enzyme results in elevated nucleosidase activity, a known consequence of gain-of-function mutations in NT5C2 and a common determinant of 6-mercaptopurine resistance. Furthermore, in B-ALL cells NT5C2ex6a and the R238W hotspot variant confers comparable levels of resistance to 6-mercaptopurine in vitro and in vivo . These results support a role for alternative splicing as a prevalent mechanism driving chemotherapy resistance in relapsed B-ALL. Statement of significance Mutations in chemoresistance genes are found in relapsed/refractory acute lymphoblastic leukemia. However, in this low-mutational-burden disease, up to 30% of cases have no known relapse-specific genetic alterations. Our identification of aberrant splicing as an alternative mechanism of acquired drug resistance fills this gap and suggests new opportunities for therapeutic interventions.
0

METB-14. INTEGRATED GERMLINE AND SOMATIC PROFILING OF PEDIATRIC BRAIN TUMORS REVEALS INCIDENTAL FINDINGS AND NOVEL TUMOR BIOLOGY

Ryan Corbett et al.Jun 18, 2024
+23
S
R
R
Abstract BACKGROUND The contribution of rare pathogenic germline variation to central nervous system (CNS) tumor formation in pediatric patients without a family history of cancer remains unclear. METHODS We characterized the prevalence of pathogenic germline variants in 214 cancer predisposition genes (CPGs) in 837 patients profiled in the Pediatric Brain Tumor Atlas by whole genome or exome sequencing (n=820 and n=17, respectively). Rare SNVs and small INDELs were annotated as pathogenic (P) or likely pathogenic (LP) consistent with American College of Medical Genetics criteria using AutoGVP, our open-source automated pathogenicity assessment tool. We classified pathogenicity of germline structural variants (SVs) using ClassifyCNV and AnnotSV. Somatic alterations and mutational signatures from matched tumor sequencing were integrated to identify functional consequences associated with germline pathogenic variation. RESULTS We observed 206 germline P/LP SNVs/small INDELs and 18 SVs (16 deletions, 2 duplications) within 78 unique CPGs in 195 patients (23.3%). We detected syndrome-associated P/LP variants in 45/58 patients with a clinically-reported cancer predisposition syndrome and incidentally in 41 patients. Ninety-five (42%) germline P/LP variants co-occurred with at least one somatic alteration in the same gene in matched tumors: n=6 oncogenic SNVs, n=28 CNVs, n=54 loss of heterozygosity (LOH), n=26 differential gene or protein expression, and n=18 alternative splicing. NF1, TSC1, and TSC2 germline P/LP carriers exhibited significantly higher tumor LOH scores and lower gene expression in tumors relative to non-P/LP carriers. Patients with germline splice region P/LP variants exhibited significantly increased skipping of most the proximal exon in matched tumor relative to patients with non-splice region P/LP variants (W=401, p=1.1E-04). CONCLUSION We have identified rare germline P/LP variants associated with cancer predisposition syndromes and diverse functional consequences in pediatric CNS tumor patients. Efforts are underway to extend this work to include 1,801 additional probands and 1,105 parents to further characterize the prevalence and heritability of germline pathogenic variation in children diagnosed with CNS tumors.
4

ALT in Pediatric High-Grade Gliomas Can Occur withoutATRXMutation and is Enriched in Patients with Pathogenic Germline MMR Variants

Jennifer Stundon et al.Aug 6, 2022
+20
M
D
J
ABSTRACT Background To achieve replicative immortality, most cancers develop a telomere maintenance mechanism, such as reactivation of telomerase or alternative lengthening of telomeres (ALT). There are limited data on the prevalence and clinical significance of ALT in pediatric brain tumors, and ALT-directed therapy is not available. Methods We performed C-circle analysis (CCA) on 579 pediatric brain tumors that had corresponding tumor/normal whole genome sequencing through the Open Pediatric Brain Tumor Atlas (OpenPBTA). We detected ALT in 6.9% (n=40/579) of these tumors and completed additional validation by ultrabright telomeric foci in situ on a subset of these tumors. We used CCA to validate TelomereHunter for computational prediction of ALT status and focus subsequent analyses on pediatric high-grade glioma (pHGG) Finally, we examined whether ALT is associated with recurrent somatic or germline alterations. Results ALT is common in pHGG (n=24/63, 38.1%), but occurs infrequently in other pediatric brain tumors (<3%). Somatic ATRX mutations occur in 50% of ALT+ pHGG and in 30% of ALT-pHGG. Rare pathogenic germline variants in mismatch repair (MMR) genes are significantly associated with an increased occurrence of ALT. Conclusions: We demonstrate that ATRX is mutated in only a subset of ALT+ pHGG, suggesting other mechanisms of ATRX loss of function or alterations in other genes may be associated with the development of ALT in these patients. We show that germline variants in MMR are associated with development of ALT in patients with pHGG. Key Points ATRX alterations are frequent, but not required, for an ALT phenotype in pHGGs pHGG patients with germline mismatch repair variants have higher rate of ALT + tumors TelomereHunter is validated to predict ALT in pHGGs Importance of the Study We performed orthogonal molecular and computational analyses to detect the presence of alternative lengthening of telomeres in a highly characterized cohort of pediatric brain tumors. We demonstrate that many pHGG utilize ALT without a mutation in ATRX, suggesting either loss of function of ATRX via an alternative mechanism or an alternate means of development of ALT. We show that germline variants in MMR genes are significantly associated with ALT in pHGG. Our work adds to the biological understanding of the development of ALT and provides an approach to stratify patients who may benefit from future ALT-directed therapies in this patient population.