SR
Steve Rozen
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Duke-NUS Medical School, Duke University, National Cancer Centre Singapore
+ 13 more
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(50% Open Access)
Cited by:
2
h-index:
90
/
i10-index:
171
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Integrative genomic analyses of European intrahepatic cholangiocarcinoma: Novel ROS1 fusion gene and PBX1 as prognostic marker

Patrick Plum et al.Sep 11, 2024
+40
F
T
P
Cholangiocarcinoma (CCA) is a fatal cancer of the bile duct with a poor prognosis owing to limited therapeutic options. The incidence of intrahepatic CCA (iCCA) is increasing worldwide, and its molecular basis is emerging. Environmental factors may contribute to regional differences in the mutation spectrum of European patients with iCCA, which are underrepresented in systematic genomic and transcriptomic studies of the disease.
7

mSigHdp: hierarchical Dirichlet process mixture modeling for mutational signature discovery

Mo Liu et al.Oct 24, 2023
+2
N
Y
M
Abstract Mutational signatures are characteristic patterns of mutations caused by endogenous or exogenous mutational processes. These signatures can be discovered by analyzing mutations in large sets of samples – usually somatic mutations in tumor samples. Most programs for discovering mutational signatures are based on non-negative matrix factorization (NMF). Alternatively, signatures can be discovered using hierarchical Dirichlet process (HDP) mixture models, an approach that has been explored less. These models assign mutations to clusters and view each cluster as being generated from the signature of a particular mutational process. Here we describe mSigHdp, an improved approach to using HDP mixture models to discover mutational signatures. We benchmarked mSigHdp and state-of-the-art NMF-based approaches on 4 realistic synthetic data sets. These data sets encompassed 18 cancer types. In total they contained 3.5×10 7 single-base-substitution mutations representing 32 signatures and 6.1×10 6 small-insertion-and-deletion mutations representing 13 signatures. For 3 of the 4 data sets, mSigHdp had the best positive predictive value for discovering mutational signatures, and for all 4 data sets, it had the best true positive rate. Its CPU usage was similar to that of the NMF-based approaches. Thus, mSigHdp is an important and practical addition to the set of tools available for discovering mutational signatures. Data and code availability mSigHdp is available at public repositories https://github.com/steverozen/mSigHdp and https://github.com/steverozen/hdpx . The synthetic data, code for generating the synthetic data, code for running the mutational-signature discovery programs, the main outputs of the programs, and code for analyzing their results and for generating the data figures in this paper are available at https://github.com/Rozen-Lab/mSigHdp sup files. A singularity container with mSigHdp can be downloaded from cloud.sylabs.io with the shell command “singularity pull library://rozen-lab/msighdp/msighdp:2.1.2”. A toy-example Rscript for using this container is at https://github.com/steverozen/mSigHdp/blob/master/data-raw/container_scripts/test_mSigHdp.R . Supplementary material One excel file of supplementary tables and one PDF file of supplementary figures have been submitted along with this manuscript.
0

Identification of novel mutational signatures in Asian oral squamous cell carcinomas associated with bacterial infections

Arnoud Boot et al.May 7, 2020
+5
F
A
A
Mutational signatures can reveal the history of mutagenic processes that cells were exposed to prior to and during tumourigenesis. We expect that as-yet-undiscovered mutational processes will shed further light on mutagenesis leading to carcinogenesis. With this in mind, we analyzed the mutational spectra of 36 Asian oral squamous cell carcinomas. The mutational spectra of two samples from patients who presented with oral bacterial infections, showed novel mutational signatures. One of these novel signatures, SBS_AnT, is characterized by a preponderance of thymine mutations, strong transcriptional strand bias, and striking enrichment for adenines in the 4 base pairs 5’ of mutation sites. Examination of publicly available sequencing data revealed SBS_AnT in 25 tumours from several mucosal tissue types, all of which harbour human symbionts or are adjacent to tissues that harbour symbionts. Data in a preprint released while this manuscript was in revision strongly suggest that the bacterial compound colibactin causes SBS_AnT.* bp : base pair indels : insertions and deletions SBS : single base substitutions DBS : double base substitutions HNSCC : head and neck squamous cell carcinoma OSCC : oral squamous cell carcinoma PCAWG : Pan-Cancer Analysis of Whole Genomes TC-NER : transcription coupled nucleotide excision repair VAF : variant allele frequency
0

Recurrent PD-L1 Structural Rearrangements in Natural Killer/T Cell Lymphoma Patients with Complete Response to PD-1 Blockade Therapy

Jing Lim et al.May 7, 2020
+42
Q
T
J
Natural killer/ T-cell lymphoma (NKTL) patients failing L-asparaginase regimens have extremely poor treatment outcomes. Previous case series showed promising activity when relapsed or refractory NKTL patients were treated with anti-programmed death 1 (PD1) inhibitors. Here, we continue to unravel the molecular profiles with whole-genome sequencing (WGS) on an extended cohort of 11 pembrolizumab-treated patients (median age at diagnosis, 42 years; range, 27-66 years) with a median follow-up of 11 months (range, 2 - 25 months) since starting anti-PD1 therapy. Seven patients achieved complete response (CR) and four patients had progressive disease (PD). Using WGS, we found structural rearrangements of the PD-L1 gene, JAK3-activating mutations and ARID1B homozygous insertion in four, two and one of the CR patient's tumors, respectively. Interesting, these alterations, especially PD-L1 rearrangements, were absent in the four PD cases. Expression of PD1 ligand (PD-L1) was strong in nine patients (5 CR and 4 PD cases) and weak in two patients (both CR). PD1 blockade with pembrolizumab was a potent strategy for NKTL patients and genomic screening could potentially accompany PD-L1 immunohistochemical screening to better select patients for anti-PD1 therapy.
1

Dearth of smoking-induced mutations in NSRO-driven non-small-cell lung cancer despite smoking exposure

Chenyang Huang et al.Oct 24, 2023
+20
M
N
C
Abstract Non-small cell lung cancers (NSCLCs) in non-smokers are mostly driven by mutations in the oncogenes EGFR, ERBB2, and MET , and fusions involving ALK and RET . We term these “non-smoking-related oncogenes” (NSROs). In addition to occurring in non-smokers, NSRO-driven tumors also occur in smokers, and the clonal architecture and genomic landscape of these tumors remain unknown. We investigated genomic and transcriptomic alterations in 173 tumor sectors from 48 patients with NSRO-driven or typical-smoking NSCLCs. NSRO-driven NSCLCs in smokers and non-smokers have similar genomic landscapes. Surprisingly, even in patients with prominent smoking histories, the mutational signature caused by tobacco smoking was essentially absent in NSRO-driven NSCLCs. However, NSRO-driven NSCLCs in smokers had higher transcriptomic activities related to regulation of the cell cycle, suggesting that smoking still affects tumor phenotype independently of genomic alterations. Statement of significance This study highlights the lack of genomic scars caused by smoking in NSCLCs driven by non-smoking-related oncogenes regardless of smoking history. The impact of smoking on these tumors is mainly non-genomic. The transcriptomic features of NSCLCs associated with smoking may help in the development of therapeutic approaches.
0

The Repertoire of Mutational Signatures in Human Cancer

Ludmil Alexandrov et al.May 6, 2020
+18
N
J
L
Somatic mutations in cancer genomes are caused by multiple mutational processes each of which generates a characteristic mutational signature. Using 84,729,690 somatic mutations from 4,645 whole cancer genome and 19,184 exome sequences encompassing most cancer types we characterised 49 single base substitution, 11 doublet base substitution, four clustered base substitution, and 17 small insertion and deletion mutational signatures. The substantial dataset size compared to previous analyses enabled discovery of new signatures, separation of overlapping signatures and decomposition of signatures into components that may represent associated, but distinct, DNA damage, repair and/or replication mechanisms. Estimation of the contribution of each signature to the mutational catalogues of individual cancer genomes revealed associations with exogenous and endogenous exposures and defective DNA maintenance processes. However, many signatures are of unknown cause. This analysis provides a systematic perspective on the repertoire of mutational processes contributing to the development of human cancer including a comprehensive reference set of mutational signatures in human cancer.
0
0
Save
0

Family History Assessment Significantly Enhances Delivery of Precision Medicine in the Genomics Era

Yasmin Bylstra et al.May 7, 2020
+16
S
W
Y
Background: Family history has traditionally been an essential part of clinical care to assess health risks. However, declining sequencing costs have precipitated a shift towards genomics-first approaches in population screening programs, with less emphasis on family history assessment. We evaluated the utility of family history for genomic sequencing selection. Methods: We analysed whole genome sequences of 1750 healthy research participants, with and without preselection based on standardised family history collection, screening 95 cancer genes. Results: The frequency of likely pathogenic/ pathogenic (LP/P) variants in 884 participants with no family history available (FH not available group) (2%) versus 866 participants with family history available (FH available group) (3.1%) was not significant (p=0.158). However, within the FH available group, amongst 73 participants with an increased family history cancer risk (increased FH risk), 1 in 7 participants carried a LP/P variant inferring a six-fold increase compared with 1 in 47 participants assessed at average family history cancer risk (average FH risk) and a seven-fold increase compared to the FH not available group. The enrichment was further pronounced (up to 18-fold) when assessing the 25 cancer genes in the ACMG 59-gene panel. Furthermore, 63 participants had an increased family history cancer risk in absence of an apparent LP/P variant. Conclusion: Our findings show that systematic family history collection remains critical for health risk assessment, providing important actionable data and augmenting the yield from genomic data. Family history also highlights the potential impact of additional hereditary, environmental and behavioural influences not reflected by genomic sequencing.
0

SigProfilerMatrixGenerator: a tool for visualizing and exploring patterns of small mutational events

Erik Bergstrom et al.May 7, 2020
+4
U
M
E
Background Cancer genomes are peppered with somatic mutations imprinted by different mutational processes. The mutational pattern of a cancer genome can be used to identify and understand the etiology of the underlying mutational processes. A plethora of prior research has focused on examining mutational signatures and mutational patterns from single base substitutions and their immediate sequencing context. We recently demonstrated that further classification of small mutational events (including substitutions, insertions, deletions, and doublet substitutions) can be used to provide a deeper understanding of the mutational processes that have molded a cancer genome. However, there has been no standard tool that allows fast, accurate, and comprehensive classification for all types of small mutational eventsResults Here, we present SigProfilerMatrixGenerator, a computational tool designed for optimized exploration and visualization of mutational patterns for all types of small mutational events. SigProfilerMatrixGenerator is written in Python with an R wrapper package provided for users that prefer working in an R environment. SigProfilerMatrixGenerator produces fourteen distinct matrices by considering transcriptional strand bias of individual events and by incorporating distinct classifications for single base substitutions, doublet base substitutions, and small insertions and deletions. While the tool provides a comprehensive classification of mutations, SigProfilerMatrixGenerator is also faster and more memory efficient than existing tools that generate only a single matrix.Conclusions SigProfilerMatrixGenerator provides a standardized method for classifying small mutational events that is both efficient and scalable to large datasets. In addition to extending the classification of single base substitutions, the tool is the first to provide support for classifying doublet base substitutions and small insertions and deletions. SigProfilerMatrixGenerator is freely available at with an extensive documentation at .
0

Recurrent mutations in topoisomerase 2a cause a novel mutator phenotype in human cancers

Arnoud Boot et al.Jun 11, 2024
S
A
Abstract Topoisomerases are essential for genome stability. Here, we link the p.K743N mutation in topoisomerase TOP2A to a previously undescribed mutator phenotype in human cancers. This phenotype primarily generates a distinctive pattern of duplications of 2 to 4 base pairs and deletions of 6 to 8 base pairs, which we call ID_TOP2A. All tumors carrying the TOP2A p.K743N mutation showed ID_TOP2A, which was absent in all of 12,269 other tumors. We also report evidence of structural variation associated with TOP2A p.K743N. All tumors with ID_TOP2A mutagenesis had several indels in known cancer genes, including frameshift mutations in PTEN and TP53 and an in-frame activating mutation in BRAF . Thus, ID_TOP2A mutagenesis almost certainly contributed to tumorigenesis in these tumors. This is the first report of topoisomerase-associated mutagenesis in human cancers, and sheds further light on TOP2A’s role in genome maintenance. We also postulate that tumors showing ID_TOP2A mutagenesis might be especially sensitive to topoisomerase inhibitors.
0

A new approach to the challenging problem of mutational signature attribution

Nanhai Jiang et al.May 28, 2024
S
Y
N
Mutational signatures are characteristic patterns of mutations caused by endogenous mutational processes or by exogenous mutational exposures. Much research has focused on the problem of inferring mutational signatures as latent variables in somatic mutation data from multiple tumors. However, the problem of determining which signatures are present in a given sample and how many mutations each signature is responsible for has received negligible attention. In particular, there has been little systematic benchmarking of various approaches to this problem. This problem is referred to as "signature attribution" in a single sample. We show that this is a challenging problem, because there are often many combinations of signatures that can reconstruct the mutational spectrum of a given sample reasonably well. We benchmarked the accuracy of five approaches to signature attribution, including a new approach we call Presence Attribute Signature Activity (PASA), on large synthetic data sets. These data sets recapitulated the single-base, insertion-deletion, and doublet-base mutational signature repertoires of 9 cancer types. For single-base substitution mutations, PASA outperformed other approaches on all the cancer types combined. Interestingly, however, the ranking of approaches varied by cancer type. For doublet-base substitutions and small insertions and deletions, the ranking of approaches was more stable, with PASA outperforming other approaches in most, but not all of the nine cancer types. For all mutation types, the ranking of approaches varied by cancer type, and no approach achieved both high precision and recall. We believe these observations reflect the inherent challenges in signature attribution