JW
Jeremiah Wala
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Dana-Farber Cancer Institute, Broad Institute, Harvard University
+ 6 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
10
(20% Open Access)
Cited by:
9
h-index:
26
/
i10-index:
44
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

SvABA: Genome-wide detection of structural variants and indels by local assembly

Jeremiah Wala et al.May 6, 2020
+13
N
P
J
Abstract Structural variants (SVs), including small insertion and deletion variants (indels), are challenging to detect through standard alignment-based variant calling methods. Sequence assembly offers a powerful approach to identifying SVs, but is difficult to apply at-scale genome-wide for SV detection due to its computational complexity and the difficulty of extracting SVs from assembly contigs. We describe SvABA, an efficient and accurate method for detecting SVs from short-read sequencing data using genome-wide local assembly with low memory and computing requirements. We evaluated SvABA’s performance on the NA12878 human genome and in simulated and real cancer genomes. SvABA demonstrates superior sensitivity and specificity across a large spectrum of SVs, and substantially improved detection performance for variants in the 20-300 bp range, compared with existing methods. SvABA also identifies complex somatic rearrangements with chains of short (< 1,000 bp) templated-sequence insertions copied from distant genomic regions. We applied SvABA to 344 cancer genomes from 11 cancer types, and found that templated-sequence insertions occur in ~4% of all somatic rearrangements. Finally, we demonstrate that SvABA can identify sites of viral integration and cancer driver alterations containing medium-sized SVs.
0
Paper
Citation9
0
Save
0

The whole-genome panorama of cancer drivers

Radhakrishnan Sabarinathan et al.May 6, 2020
+24
I
O
R
The advance of personalized cancer medicine requires the accurate identification of the mutations driving each patient's tumor. However, to date, we have only been able to obtain partial insights into the contribution of genomic events to tumor development. Here, we design a comprehensive approach to identify the driver mutations in each patient's tumor and obtain a whole-genome panorama of driver events across more than 2,500 tumors from 37 types of cancer. This panorama includes coding and non-coding point mutations, copy number alterations and other genomic rearrangements of somatic origin, and potentially predisposing germline variants. We demonstrate that genomic events are at the root of virtually all tumors, with each carrying on average 4.6 driver events. Most individual tumors harbor a unique combination of drivers, and we uncover the most frequent co-occurring driver events. Half of all cancer genes are affected by several types of driver mutations. In summary, the panorama described here provides answers to fundamental questions in cancer genomics and bridges the gap between cancer genomics and personalized cancer medicine.
0

Patterns of structural variation in human cancer

Yilong Li et al.May 6, 2020
+8
J
N
Y
A key mutational process in cancer is structural variation, in which rearrangements delete, amplify or reorder genomic segments ranging in size from kilobases to whole chromosomes. We developed methods to group, classify and describe structural variants, applied to >2,500 cancer genomes. Nine signatures of structural variation emerged. Deletions have trimodal size distribution; assort unevenly across tumour types and patients; enrich in late-replicating regions; and correlate with inversions. Tandem duplications also have trimodal size distribution, but enrich in early-replicating regions, as do unbalanced translocations. Replication-based mechanisms of rearrangement generate varied chromosomal structures with low-level copy number gains and frequent inverted rearrangements. One prominent structure consists of 1-7 templates copied from distinct regions of the genome strung together within one locus. Such cycles of templated insertions correlate with tandem duplications, frequently activating the telomerase gene, TERT, in liver cancer. Cancers access many rearrangement processes, flexibly sculpting the genome to maximise oncogenic potential.
0

Selective and mechanistic sources of recurrent rearrangements across the cancer genome

Jeremiah Wala et al.May 6, 2020
+12
M
O
J
Cancer cells can acquire profound alterations to the structure of their genomes, including rearrangements that fuse distant DNA breakpoints. We analyze the distribution of somatic rearrangements across the cancer genome, using whole-genome sequencing data from 2,693 tumor-normal pairs. We observe substantial variation in the density of rearrangement breakpoints, with enrichment in open chromatin and sites with high densities of repetitive elements. After accounting for these patterns, we identify significantly recurrent breakpoints (SRBs) at 52 loci, including novel SRBs near BRD4 and AKR1C3. Taking into account both loci fused by a rearrangement, we observe different signatures resembling either single breaks followed by strand invasion or two separate breaks that become joined. Accounting for these signatures, we identify 90 pairs of loci that are significantly recurrently juxtaposed (SRJs). SRJs are primarily tumor-type specific and tend to involve genes with tissue-specific expression. SRJs were frequently associated with disruption of topology-associated domains, juxtaposition of enhancer elements, and increased expression of neighboring genes. Lastly, we find that the power to detect SRJs decreases for short rearrangements, and that reliable detection of all driver SRJs will require whole-genome sequencing data from an order of magnitude more cancer samples than currently available.
0

Large-Scale Uniform Analysis of Cancer Whole Genomes in Multiple Computing Environments

Christina Yung et al.May 6, 2020
+110
S
B
C
The International Cancer Genome Consortium (ICGC)'s Pan-Cancer Analysis of Whole Genomes (PCAWG) project aimed to categorize somatic and germline variations in both coding and non-coding regions in over 2,800 cancer patients. To provide this dataset to the research working groups for downstream analysis, the PCAWG Technical Working Group marshalled ~800TB of sequencing data from distributed geographical locations; developed portable software for uniform alignment, variant calling, artifact filtering and variant merging; performed the analysis in a geographically and technologically disparate collection of compute environments; and disseminated high-quality validated consensus variants to the working groups. The PCAWG dataset has been mirrored to multiple repositories and can be located using the ICGC Data Portal. The PCAWG workflows are also available as Docker images through Dockstore enabling researchers to replicate our analysis on their own data.
0

Pan-cancer analysis of whole genomes reveals driver rearrangements promoted by LINE-1 retrotransposition in human tumours

Bernardo Rodríguez–Martín et al.May 6, 2020
+48
A
E
B
About half of all cancers have somatic integrations of retrotransposons. To characterize their role in oncogenesis, we analyzed the patterns and mechanisms of somatic retrotransposition in 2,954 cancer genomes from 37 histological cancer subtypes. We identified 19,166 somatically acquired retrotransposition events, affecting 35% of samples, and spanning a range of event types. L1 insertions emerged as the first most frequent type of somatic structural variation in esophageal adenocarcinoma, and the second most frequent in head-and-neck and colorectal cancers. Aberrant L1 integrations can delete megabase-scale regions of a chromosome, sometimes removing tumour suppressor genes, as well as inducing complex translocations and large-scale duplications. Somatic retrotranspositions can also initiate breakage-fusion-bridge cycles, leading to high-level amplification of oncogenes. These observations illuminate a relevant role of L1 retrotransposition in remodelling the cancer genome, with potential implications in the development of human tumours.
0

Novel patterns of complex structural variation revealed across thousands of cancer genome graphs

Kevin Hadi et al.May 6, 2020
+45
J
X
K
Cancer genomes often harbor hundreds of somatic DNA rearrangement junctions, many of which cannot be easily classified into simple (e.g. deletion, translocation) or complex (e.g. chromothripsis, chromoplexy) structural variant classes. Applying a novel genome graph computational paradigm to analyze the topology of junction copy number (JCN) across 2,833 tumor whole genome sequences (WGS), we introduce three complex rearrangement phenomena: pyrgo, rigma , and tyfonas . Pyrgo are “towers” of low-JCN duplications associated with early replicating regions and superenhancers, and are enriched in breast and ovarian cancers. Rigma comprise “chasms” of low-JCN deletions at late-replicating fragile sites in esophageal and other gastrointestinal (GI) adenocarcinomas. Tyfonas are “typhoons” of high-JCN junctions and fold back inversions that are enriched in acral but not cutaneous melanoma and associated with a previously uncharacterized mutational process of non-APOBEC kataegis. Clustering of tumors according to genome graph-derived features identifies subgroups associated with DNA repair defects and poor prognosis.
1

Detecting significantly recurrent genomic connections from simple and complex rearrangements in the cancer genome

Shu Zhang et al.Oct 24, 2023
+9
O
K
S
Abstract The detection of somatic genetic alterations that recur across cancer genomes more than expected by chance has been a major goal of cancer genomics, as these alterations are enriched for “driver” events that promote cancer. Multiple methods have been developed to detect driver point mutations and copy-number variants, but methods to detect driver rearrangements have largely not been pursued. Unlike point mutations and copy-number alterations, which can be assigned to a single genomic locus, rearrangements connect two distant genomic loci, and possibly more in the case of complex or clustered events. Here, we explore genomic features that predict the rate at which any pair of loci will be connected by rearrangements and describe two methods to detect rearrangements that recur more often than this background rate. The first, SVSig-2D, detects pairs of loci that are directly connected by a single rearrangement; the second, SVSig-2Dc also detects loci that are recurrently connected indirectly through two or more rearrangements. When applied to a pan-cancer dataset of over 2,500 cancers, these methods identified 80 significantly recurrent simple rearrangements and 29 complex rearrangements, including both known and novel events. Intriguingly, though both recurrent simple and complex rearrangements tended to be tissue-specific, this was less true for the complex events. The detection of recurrent rearrangements with methods such as these will be an essential component of cancer genomics in the whole-genome sequencing era.
0

A robust benchmark for germline structural variant detection

Justin Zook et al.May 6, 2020
+47
N
N
J
New technologies and analysis methods are enabling genomic structural variants (SVs) to be detected with ever-increasing accuracy, resolution, and comprehensiveness. Translating these methods to routine research and clinical practice requires robust benchmark sets. We developed the first benchmark set for identification of both false negative and false positive germline SVs, which complements recent efforts emphasizing increasingly comprehensive characterization of SVs. To create this benchmark for a broadly consented son in a Personal Genome Project trio with broadly available cells and DNA, the Genome in a Bottle (GIAB) Consortium integrated 19 sequence-resolved variant calling methods, both alignment- and de novo assembly-based, from short-, linked-, and long-read sequencing, as well as optical and electronic mapping. The final benchmark set contains 12745 isolated, sequence-resolved insertion and deletion calls ≥50 base pairs (bp) discovered by at least 2 technologies or 5 callsets, genotyped as heterozygous or homozygous variants by long reads. The Tier 1 benchmark regions, for which any extra calls are putative false positives, cover 2.66 Gbp and 9641 SVs supported by at least one diploid assembly. Support for SVs was assessed using svviz with short-, linked-, and long-read sequence data. In general, there was strong support from multiple technologies for the benchmark SVs, with 90 % of the Tier 1 SVs having support in reads from more than one technology. The Mendelian genotype error rate was 0.3 %, and genotype concordance with manual curation was >98.7 %. We demonstrate the utility of the benchmark set by showing it reliably identifies both false negatives and false positives in high-quality SV callsets from short-, linked-, and long-read sequencing and optical mapping.
0

Renal medullary carcinomas depend upon SMARCB1 loss and are sensitive to proteasome inhibition

Andrew Hong et al.May 7, 2020
+38
J
Y
A
Renal medullary carcinoma (RMC) is a rare and deadly kidney cancer in patients of African descent with sickle cell trait. Through direct-to-patient outreach, we developed genomically faithful patient-derived models of RMC. Using whole genome sequencing, we identified intronic fusion events in one SMARCB1 allele with concurrent loss of the other allele, confirming that SMARCB1 loss occurs in RMC. Biochemical and functional characterization of these RMC models revealed that RMC depends on the loss of SMARCB1 for survival and functionally resemble other cancers that harbor loss of SMARCB1, such as malignant rhabdoid tumors or atypical teratoid rhabdoid tumors. We performed RNAi and CRISPR-Cas9 loss of function genetic screens and a small-molecule screen and identified UBE2C as an essential gene in SMARCB1 deficient cancers. We found that the ubiquitin-proteasome pathway was essential for the survival of SMARCB1 deficient cancers in vitro and in vivo. Genetic or pharmacologic inhibition of this pathway leads to G2/M arrest due to constitutive accumulation of cyclin B1. These observations identify a synthetic lethal relationship that may serve as a therapeutic approach for patients with SMARCB1 deficient cancers.