SC
Shaolong Cao
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
1,161
h-index:
30
/
i10-index:
35
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

The evolutionary history of 2,658 cancers

Moritz Gerstung et al.Feb 5, 2020
+65
I
C
M
Abstract Cancer develops through a process of somatic evolution 1,2 . Sequencing data from a single biopsy represent a snapshot of this process that can reveal the timing of specific genomic aberrations and the changing influence of mutational processes 3 . Here, by whole-genome sequencing analysis of 2,658 cancers as part of the Pan-Cancer Analysis of Whole Genomes (PCAWG) Consortium of the International Cancer Genome Consortium (ICGC) and The Cancer Genome Atlas (TCGA) 4 , we reconstruct the life history and evolution of mutational processes and driver mutation sequences of 38 types of cancer. Early oncogenesis is characterized by mutations in a constrained set of driver genes, and specific copy number gains, such as trisomy 7 in glioblastoma and isochromosome 17q in medulloblastoma. The mutational spectrum changes significantly throughout tumour evolution in 40% of samples. A nearly fourfold diversification of driver genes and increased genomic instability are features of later stages. Copy number alterations often occur in mitotic crises, and lead to simultaneous gains of chromosomal segments. Timing analyses suggest that driver mutations often precede diagnosis by many years, if not decades. Together, these results determine the evolutionary trajectories of cancer, and highlight opportunities for early cancer detection.
1
Citation816
0
Save
1

Characterizing genetic intra-tumor heterogeneity across 2,658 human cancer genomes

Adriana Salcedo et al.Apr 1, 2021
+64
K
I
A
Intra-tumor heterogeneity (ITH) is a mechanism of therapeutic resistance and therefore an important clinical challenge. However, the extent, origin, and drivers of ITH across cancer types are poorly understood. To address this, we extensively characterize ITH across whole-genome sequences of 2,658 cancer samples spanning 38 cancer types. Nearly all informative samples (95.1%) contain evidence of distinct subclonal expansions with frequent branching relationships between subclones. We observe positive selection of subclonal driver mutations across most cancer types and identify cancer type-specific subclonal patterns of driver gene mutations, fusions, structural variants, and copy number alterations as well as dynamic changes in mutational processes between subclonal expansions. Our results underline the importance of ITH and its drivers in tumor evolution and provide a pan-cancer resource of comprehensively annotated subclonal events from whole-genome sequencing data.
1
Citation338
0
Save
0

Tumor cell total mRNA expression shapes the molecular and clinical phenotype of cancer

Shaolong Cao et al.Oct 2, 2020
+38
S
J
S
Abstract Cancers can vary greatly in their transcriptomes. In contrast to alterations in specific genes or pathways, differences in tumor cell total mRNA content have not been comprehensively assessed. Technical and analytical challenges have impeded examination of total mRNA expression at scale across cancers. To address this, we developed a model for quantifying tumor-specific total mRNA expression (TmS) from bulk sequencing data, which performs transcriptomic deconvolution while adjusting for mixed genomes. We used single-cell RNA sequencing data to demonstrate total mRNA expression as a feature of tumor phenotype. We estimated and validated TmS in 5,015 patients across 15 cancer types identifying significant inter-individual variability. At a pan-cancer level, high TmS is associated with increased risk of disease progression and death. Cancer type-specific patterns of genetic alterations, intra-tumor genetic heterogeneity, as well as pan-cancer trends in metabolic dysregulation and hypoxia contribute to TmS. Taken together, our results suggest that measuring cell-type specific total mRNA expression offers a broader perspective of tracking cancer transcriptomes, which has important biological and clinical implications.
0
Citation5
0
Save
8

CliP: subclonal architecture reconstruction of cancer cells in DNA sequencing data using a penalized likelihood model

Yujie Jiang et al.Apr 2, 2021
+11
S
S
Y
Abstract Subpopulations of tumor cells characterized by mutation profiles may confer differential fitness and consequently influence prognosis of cancers. Understanding subclonal architecture has the potential to provide biological insight in tumor evolution and advance precision cancer treatment. Recent methods comprehensively integrate single nucleotide variants (SNVs) and copy number aberrations (CNAs) to reconstruct subclonal architecture using whole-genome or whole-exome sequencing (WGS, WES) data from bulk tumor samples. However, the commonly used Bayesian methods require a large amount of computational resources, a prior knowledge of the number of subclones, and extensive post-processing. Regularized likelihood modeling approach, never explored for subclonal reconstruction, can inherently address these drawbacks. We therefore propose a model-based method, Cl onal structure i dentification through pair-wise P enalization, or CliP, for clustering subclonal mutations without prior knowledge or post-processing. The CliP model is applicable to genomic regions with or without CNAs. CliP demonstrates high accuracy in subclonal reconstruction through extensive simulation studies. Utilizing the well-established regularized likelihood framework, CliP takes only 16 hours to process WGS data from 2,778 tumor samples in the ICGC-PCAWG study, and 38 hours to process WES data from 9,564 tumor samples in the TCGA study. In summary, a penalized likelihood framework for subclonal reconstruction will help address intrinsic drawbacks of existing methods and expand the scope of computational analysis for cancer evolution in large cancer genomic studies. The associated software tool is freely available at: https://github.com/wwylab/CliP .
8
Citation2
0
Save
9

Single-cell ATAC and RNA sequencing reveal pre-existing and persistent subpopulations of cells associated with relapse of prostate cancer

Sinja Taavitsainen et al.Feb 10, 2021
+33
W
T
S
Abstract Prostate cancer is profoundly heterogeneous and patients would benefit from methods that stratify clinically indolent from more aggressive forms of the disease. We employed single-cell assay for transposase-accessible chromatin (ATAC) and RNA sequencing in models of early treatment response and resistance to enzalutamide. In doing so, we identified pre-existing and treatment-persistent cell subpopulations that possess transcriptional stem-like features and regenerative potential when subjected to treatment. We found distinct chromatin landscapes associated with enzalutamide treatment and resistance that are linked to alternative transcriptional programs. Transcriptional profiles characteristic of persistent stem-like cells were able to stratify the treatment response of patients. Ultimately, we show that defining changes in chromatin and gene expression in single-cell populations from pre-clinical models can reveal hitherto unrecognized molecular predictors of treatment response. This suggests that high analytical resolution of pre-clinical models may powerfully inform clinical decision-making.
0

Crowd-sourced benchmarking of single-sample tumor subclonal reconstruction

K.-C. Lee et al.Jun 11, 2024
+80
A
K
K
Abstract Subclonal reconstruction algorithms use bulk DNA sequencing data to quantify parameters of tumor evolution, allowing an assessment of how cancers initiate, progress and respond to selective pressures. We launched the ICGC–TCGA (International Cancer Genome Consortium–The Cancer Genome Atlas) DREAM Somatic Mutation Calling Tumor Heterogeneity and Evolution Challenge to benchmark existing subclonal reconstruction algorithms. This 7-year community effort used cloud computing to benchmark 31 subclonal reconstruction algorithms on 51 simulated tumors. Algorithms were scored on seven independent tasks, leading to 12,061 total runs. Algorithm choice influenced performance substantially more than tumor features but purity-adjusted read depth, copy-number state and read mappability were associated with the performance of most algorithms on most tasks. No single algorithm was a top performer for all seven tasks and existing ensemble strategies were unable to outperform the best individual methods, highlighting a key research need. All containerized methods, evaluation code and datasets are available to support further assessment of the determinants of subclonal reconstruction accuracy and development of improved methods to understand tumor evolution.
0

An R Implementation of Tumor-Stroma-Immune Transcriptome Deconvolution Pipeline using DeMixT

Shaolong Cao et al.Mar 5, 2019
+6
S
F
S
The deconvolution of transcriptomic data from heterogeneous tissues in cancer studies remains challenging. Available software faces difficulties for accurately estimating both component- specific proportions and expression profiles for individual samples. To address these challenges, we present a new R-implementation pipeline for the more accurate and efficient transcriptome deconvolution of high dimensional data from mixtures of more than two components. The pipeline utilizes the computationally efficient DeMixT R-package with OpenMP and additional cancer-specific biological information to perform three-component deconvolution without requiring data from the immune profiles. It enables a wide application of DeMixT to gene expression datasets available from cancer consortium such as the Cancer Genome Atlas (TCGA) projects, where, other than the mixed tumor samples, a handful of normal samples are profiled in multiple cancer types. We have applied this pipeline to two TCGA datasets in colorectal adenocarcinoma (COAD) and prostate adenocarcinoma (PRAD). In COAD, we found varying distributions of immune proportions across the Consensus Molecular Subtypes, from the highest to the lowest being CMS1, CMS3, CMS4 and CMS2. In PRAD, we found the immune proportions are associated with progression-free survival (p<0.01) and negatively correlated with Gleason scores (p<0.001). Our DeMixT-centered analysis protocol opens up new opportunities to investigate the tumor-stroma-immune microenvironment, by providing both proportions and component-specific expressions, and thus better define the underlying biology of cancer progression. Availability and implementation: An R package, scripts and data are available: https://github.com/wwylab/DeMixTallmaterials.
1

The Origin of Bladder Cancer from Mucosal Field Effects

Jolanta Bondaruk et al.May 14, 2021
+22
Z
R
J
ABSTRACT We used whole-organ mapping to study loco-geographic molecular changes in evolution of human bladder cancer from mucosal field effects. The integrative multi-platform analyses based on genome-wide RNA sequencing, methylation, copy number variations, and whole exome sequencing identified over 100 dysregulated canonical pathways involving immunity, tissue differentiation and transformation as initiators of bladder carcinogenesis. Widespread dysregulation of interleukin signaling was the dominant change signifying the important role of inflammation and immunity in the incipient phases of urothelial carcinogenesis. The analyses of mutational patterns identified three types of mutations based on their geographic distribution and variant allele frequencies. The most common were low frequency subclonal mutations restricted to individual mucosal samples which were the progeny of their respective uroprogenitor cells. The two additional types of mutations were associated with clonal expansion and involved large areas of bladder mucosa. The first group referred to as α mutations, showed a low mutational frequency across the mucosa. The second group referred to as β mutations increased in their frequencies with disease progression and a large proportion of them represented mutated transcriptional regulators controlling proliferation. Time modeling revealed that bladder carcinogenesis is spanning 10-15 years and can be divided into dormant and progressive phases. The progressive phase lasted 1-2 years and was primarily driven by β mutations with high proliferative advantage. This is the first detailed molecular characterization of mucosal field effects initiating bladder carcinogenesis on the whole-organ scale. It provides novel insights into incipient phases of bladder carcinogenesis and biomarkers for early detection of bladder cancer as well as targets for preventive therapies.
0

Transcriptome Deconvolution of Heterogeneous Tumor Samples with Immune Infiltration

Zeya Wang et al.Jun 8, 2017
+14
L
I
Z
Transcriptomic deconvolution in cancer and other heterogeneous tissues remains challenging. Available methods lack the ability to estimate both component-specific proportions and expression profiles for individual samples. We present DeMixT, a new tool to deconvolve high dimensional data from mixtures of more than two components. DeMixT implements an iterated conditional mode algorithm and a novel gene-set-based component merging approach to improve accuracy. In a series of experimental validation studies and application to TCGA data, DeMixT showed high accuracy. Improved deconvolution is an important step towards linking tumor transcriptomic data with clinical outcomes. An R package, scripts and data are available: https://github.com/wwylab/DeMixT/.
0

Pan-cancer subclonal mutation analysis of 7,827 tumors predicts clinical outcome

Yujie Jiang et al.Jul 6, 2024
+23
K
M
Y
Intra-tumor heterogeneity is an important driver of tumor evolution and therapy response. Advances in precision cancer treatment will require understanding of mutation clonality and subclonal architecture. Currently the slow computational speed of subclonal reconstruction hinders large cohort studies. To overcome this bottleneck, we developed Clonal structure identification through Pairwise Penalization, or CliPP, which clusters subclonal mutations using a regularized likelihood model. CliPP reliably processed whole-genome and whole-exome sequencing data from over 12,000 tumor samples within 24 hours, thus enabling large-scale downstream association analyses between subclonal structures and clinical outcomes. Through a pan-cancer investigation of 7,827 tumors from 32 cancer types, we found that high subclonal mutational load (sML), a measure of latency time in tumor evolution, was significantly associated with better patient outcomes in 16 cancer types with low to moderate tumor mutation burden (TMB). In a cohort of prostate cancer patients participating in an immunotherapy clinical trial, high sML was indicative of favorable response to immune checkpoint blockade. This comprehensive study using CliPP underscores sML as a key feature of cancer. sML may be essential for linking mutation dynamics with immunotherapy response in the large population of non-high TMB cancers.