SM
Salvatore Milite
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
16
h-index:
5
/
i10-index:
5
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
26

Computational validation of clonal and subclonal copy number alterations from bulk tumour sequencing

Alice Antonello et al.Feb 13, 2021
Abstract The identification of chromosome number alterations is now widespread in cancer research, but three features of genomic data hinder copy number calling and downstream analyses: the purity of the tumour sample, intra-tumour heterogeneity, and the ploidy of the tumour. To assess these features, consensus methods are often utilised, though these become onerous in projects that involve thousands of genomes. To facilitate the validation of clonal and subclonal copy number variants we present CNAqc, an evolution-inspired toolset that leverages the known quantitative relationships of purity, ploidy and heterogeneity. We validate the algorithms in CNAqc using low-pass single-cell data, as well as extensive simulations. Its application is demonstrated using over 4000 whole genomes and exomes from TCGA, and PCAWG. A real world application of CNAqc in the analysis of clinical tumour samples, has been demonstrated by its incorporation into the validation of clinically accredited bioinformatics pipeline at Genomics England. Our approach is compatible with most bioinformatic pipelines and designed to augment algorithms with automated quality control procedures for data validation.
26
Citation10
0
Save
28

Mutation Rate Evolution Drives Immune Escape In Mismatch Repair-Deficient Cancer

Hamzeh Kayhanian et al.Mar 7, 2022
SUMMARY Mutation rate optimisation drives evolution and immune evasion of bacteria and lentiviral strains, including HIV. Whether evolving cancer lineages similarly adapt mutation rates to increase tumour cell fitness is unknown. Here, by mapping the clonal topography of mismatch repair-deficient (MMRd) colorectal cancer, we show that genomic MMRd mutability co-evolves with neoantigen selection to drive intratumour diversification and immune escape. Mechanistically, we find that microsatellite instability modulates subclonal DNA repair by toggling two hypermutable mononucleotide homopolymer runs in the mismatch repair genes MSH6 and MSH3 (C8 and A8, respectively) through stochastic frameshift switching. Spontaneous mutation and reversion at these evolvability switches modulates subclonal mutation rate, mutation bias, and clonal HLA diversity during MMRd cancer evolution. Combined experimental and simulation studies demonstrate that subclonal immune selection favours incremental MMR mutations. MMRd cancers thus fuel intratumour heterogeneity by adapting subclonal mutation rate and mutation bias to immune selection, revealing a conserved co-evolutionary arms race between neoantigen selection and adaptive genomic mutability. Our work reveals layers of mutational complexity and microsatellite biology in MMRd cancer evolution previously hidden in bulk analyses.
28
Citation3
0
Save
48

A Bayesian method to cluster single-cell RNA sequencing data using Copy Number Alterations

Salvatore Milite et al.Feb 3, 2021
Abstract Motivation Cancers are composed by several heterogeneous subpopulations, each one harbouring different genetic and epigenetic somatic alterations that contribute to disease onset and therapy response. In recent years, copy number alterations leading to tumour aneuploidy have been identified as potential key drivers of such populations, but the definition of the precise makeup of cancer subclones from sequencing assays remains challenging. In the end, little is known about the mapping between complex copy number alterations and their effect on cancer phenotypes. Results We introduce CONGAS, a Bayesian probabilistic method to phase bulk DNA and single-cell RNA measurements from independent assays. CONGAS jointly identifies clusters of single cells with subclonal copy number alterations, and differences in RNA expression. The model builds statistical priors leveraging bulk DNA sequencing data, does not require a normal reference and scales fast thanks to a GPU backend and variational inference. We test CONGAS on both simulated and real data, and find that it can determine the tumour subclonal composition at the single-cell level together with clone-specific RNA phenotypes in tumour data generated from both 10x and Smart-Seq assays. Availability CONGAS is available as 2 packages: CONGAS ( https://github.com/caravagnalab/congas ), which implements the model in Python, and RCONGAS ( https://caravagnalab.github.io/rcongas/ ), which provides R functions to process inputs, outputs, and run CONGAS fits. The analysis of real data and scripts to generate figures of this paper are available via RCONGAS; code associated to simulations is available at https://github.com/caravagnalab/rcongas_test . Contact gcaravagna@units.it Supplementary information Supplementary data are available at Bioinformatics online.
48
Citation2
0
Save
0

Epigenetic heritability of cell plasticity drives cancer drug resistance through one-to-many genotype to phenotype mapping

Javier Fernandez-Mateos et al.Jan 1, 2023
Drug resistance is a largely unsolved problem in oncology. Despite the explanatory power of the genetic model of cancer initiation, most treatment resistance is unexplained by genetics alone. Even when known resistance mutations are present, they are often found in a small proportion of the cells in the tumour. So where is the cellular memory that leads to treatment failure? New evidence suggests resistance is multi-factorial, resulting from the contribution of heritable genetic and epigenetic changes, but also non-heritable phenotypic plasticity. However, cell plasticity has proven hard to study as it dynamically changes over time and needs to be distinguished from clonal evolution where cell phenotypes change because of Darwinian selective bottlenecks. Here we dissected the contribution of different evolutionary processes to drug resistance by perturbing patient-derived organoids with multiple drugs in sequence. We combined dense longitudinal tracking, single cell multi-omics, evolutionary modelling, and machine learning archetypal analysis. We found that different drugs select for distinct subclones, an essential requirement for the use of evolutionary therapy with sequential drug treatment. The data supports a model in which the cellular memory is encoded as a heritable configuration of the epigenome, which however produces multiple transcriptional programmes. Those emerge in different proportions depending on the environment, giving rise to cellular plasticity. Epigenetically encoded programmes include reactivation of developmental genes and cell regeneration. A one-to-many (epi)genotype-phenotype map explains how clonal expansions and non-heritable phenotypic plasticity manifest together, including drug tolerant states. This ensures the robustness of drug resistance subclones that can exhibit distinct phenotypes in changing environments while still preserving the cellular memory encoding their selective advantage.
30

A Bayesian method to infer copy number clones from single-cell RNA and ATAC sequencing

Lucrezia Patruno et al.Apr 2, 2023
Abstract Single-cell RNA and ATAC sequencing technologies allow one to probe expression and chromatin accessibility states as a proxy for cellular phenotypes at the resolution of individual cells. A key challenge of cancer research is to consistently map such states on genetic clones, within an evolutionary framework. To this end we introduce CONGAS+, a Bayesian model to map single-cell RNA and ATAC profiles generated from independent or multimodal assays on the latent space of copy numbers clones. CONGAS+ can detect tumour subclones associated with aneuploidy by clustering cells with the same ploidy profile. The framework is implemented in a probabilistic language that can scale to analyse thousands of cells thanks to GPU deployment. Our tool exhibits robust performance on simulations and real data, highlighting the advantage of detecting aneuploidy from two distinct molecules as opposed to other single-molecule models, and also leveraging real multi-omic data. In the application to prostate cancer, lymphoma and basal cell carcinoma, CONGAS+ did retrieve complex subclonal architectures while providing a coherent mapping among ATAC and RNA, facilitating the study of genotype-phenotype mapping, and their relation to tumour aneuploidy. Author summary Aneuploidy is a condition caused by copy number alterations (CNAs), which brings cells to acquire or lose chromosomes. In the context of cancer progression and treatment response, aneuploidy is a key factor driving cancer clonal dynamics, and measuring CNAs from modern sequencing assays is therefore important. In this framing, we approach this problem from new single-cell assays that measure both chromatin accessibility and RNA transcripts. We model the relation between single-cell data and CNAs and, thanks to a sophisticated Bayesian model, we are capable of determining tumour clones from clusters of cells with the same copy numbers. Our model works when input cells are sequenced independently for both assays, or even when modern multi-omics protocols are used. By linking aneuploidy to gene expression and chromatin conformation, our new approach provides a novel way to map complex genotypes with phenotype-level information, one of the missing factors to understand the molecular basis of cancer heterogeneity.
0

Homopolymer switches mediate adaptive mutability in mismatch repair-deficient colorectal cancer

Hamzeh Kayhanian et al.Jul 1, 2024
Abstract Mismatch repair (MMR)-deficient cancer evolves through the stepwise erosion of coding homopolymers in target genes. Curiously, the MMR genes MutS homolog 6 ( MSH6) and MutS homolog 3 ( MSH3 ) also contain coding homopolymers, and these are frequent mutational targets in MMR-deficient cancers. The impact of incremental MMR mutations on MMR-deficient cancer evolution is unknown. Here we show that microsatellite instability modulates DNA repair by toggling hypermutable mononucleotide homopolymer runs in MSH6 and MSH3 through stochastic frameshift switching. Spontaneous mutation and reversion modulate subclonal mutation rate, mutation bias and HLA and neoantigen diversity. Patient-derived organoids corroborate these observations and show that MMR homopolymer sequences drift back into reading frame in the absence of immune selection, suggesting a fitness cost of elevated mutation rates. Combined experimental and simulation studies demonstrate that subclonal immune selection favors incremental MMR mutations. Overall, our data demonstrate that MMR-deficient colorectal cancers fuel intratumor heterogeneity by adapting subclonal mutation rate and diversity to immune selection.
0

Deep Archetypal Analysis for interpretable multi-omic data integration based on biological principles

Salvatore Milite et al.Apr 9, 2024
Abstract High-throughput multi-omic molecular profiling allows probing biological systems at unprecedented resolution. However, the integration and interpretation of high-dimensional, sparse, and noisy multimodal datasets remains challenging. Deriving new biology using current methods is particularly difficult because they are not based on biological principles, but instead focus exclusively on a dimensionality reduction task. Here we introduce MIDAA (Multiomic Integration with Deep Archetypal Analysis), a framework that combines archetypal analysis, an approach grounded in biological principles, with deep learning. Using the concept of archetypes that are based on evolutionary trade-offs and Pareto optimality – MIDAA finds extreme data points that define the geometry of the latent space, preserving the complexity of biological interactions while retaining an interpretable output. We demonstrate that indeed these extreme points represent cellular programmes reflecting the underlying biology. We show on real and simulated multi-omics data how MIDAA outperforms state-of-the-art methods in identifying parsimonious, interpretable, and biologically relevant patterns.