FS
Fran Supek
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
27
(81% Open Access)
Cited by:
8,976
h-index:
34
/
i10-index:
54
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

An expanded evaluation of protein function prediction methods shows an improvement in accuracy

Yuxiang Jiang et al.Sep 7, 2016
A major bottleneck in our understanding of the molecular underpinnings of life is the assignment of function to proteins. While molecular experiments provide the most reliable annotation of proteins, their relatively low throughput and restricted purview have led to an increasing role for computational function prediction. However, assessing methods for protein function prediction and tracking progress in the field remain challenging.We conducted the second critical assessment of functional annotation (CAFA), a timed challenge to assess computational methods that automatically assign protein function. We evaluated 126 methods from 56 research groups for their ability to predict biological functions using Gene Ontology and gene-disease associations using Human Phenotype Ontology on a set of 3681 proteins from 18 species. CAFA2 featured expanded analysis compared with CAFA1, with regards to data set size, variety, and assessment metrics. To review progress in the field, the analysis compared the best methods from CAFA1 to those of CAFA2.The top-performing methods in CAFA2 outperformed those from CAFA1. This increased accuracy can be attributed to a combination of the growing number of experimental annotations and improved methods for function prediction. The assessment also revealed that the definition of top-performing algorithms is ontology specific, that different performance metrics can be used to probe the nature of accurate predictions, and the relative diversity of predictions in the biological process and human phenotype ontologies. While there was methodological improvement between CAFA1 and CAFA2, the interpretation of results and usefulness of individual methods remain context-dependent.
0
Citation397
0
Save
1

The CAFA challenge reports improved protein function prediction and new functional annotations for hundreds of genes through experimental screens

Naihui Zhou et al.Nov 19, 2019
Abstract Background The Critical Assessment of Functional Annotation (CAFA) is an ongoing, global, community-driven effort to evaluate and improve the computational annotation of protein function. Results Here, we report on the results of the third CAFA challenge, CAFA3, that featured an expanded analysis over the previous CAFA rounds, both in terms of volume of data analyzed and the types of analysis performed. In a novel and major new development, computational predictions and assessment goals drove some of the experimental assays, resulting in new functional annotations for more than 1000 genes. Specifically, we performed experimental whole-genome mutation screening in Candida albicans and Pseudomonas aureginosa genomes, which provided us with genome-wide experimental data for genes associated with biofilm formation and motility. We further performed targeted assays on selected genes in Drosophila melanogaster , which we suspected of being involved in long-term memory. Conclusion We conclude that while predictions of the molecular function and biological process annotations have slightly improved over time, those of the cellular component have not. Term-centric prediction of experimental annotations remains equally challenging; although the performance of the top methods is significantly better than the expectations set by baseline methods in C. albicans and D. melanogaster , it leaves considerable room and need for improvement. Finally, we report that the CAFA community now involves a broad range of participants with expertise in bioinformatics, biological experimentation, biocuration, and bio-ontologies, working together to improve functional annotation, computational function prediction, and our ability to manage big data in the era of large experimental screens.
1
Citation346
0
Save
0

Differential DNA mismatch repair underlies mutation rate variation across the human genome

Fran Supek et al.Feb 23, 2015
An analysis of how regional mutation rates vary across 652 tumours identifies variable DNA mismatch repair as the basis of the characteristic regional variation in mutation rates seen across the human genome; the results show that differential DNA repair, rather than differential mutation supply, is likely to be the primary cause of this variation. Somatic mutation rates vary across the human genome in different cancers. Using comparative genomic analysis of 652 tumours, Fran Supek and Ben Lehner identify variable DNA mismatch repair (MMR) as the basis of the characteristic regional variation in mutation rates across the human genome. While regional autosomal mutation rates are largely stable across cell types, with differences related to changes in replication timing and gene expression, tumours with inactivated MMR have reduced regional mutation density variation. It therefore appears that differential DNA repair and not differential mutation supply is the primary cause of the large-scale regional mutation rate variation in the human genome. Cancer genome sequencing has revealed considerable variation in somatic mutation rates across the human genome, with mutation rates elevated in heterochromatic late replicating regions and reduced in early replicating euchromatin1,2,3,4,5. Multiple mechanisms have been suggested to underlie this2,6,7,8,9,10, but the actual cause is unknown. Here we identify variable DNA mismatch repair (MMR) as the basis of this variation. Analysing ∼17 million single-nucleotide variants from the genomes of 652 tumours, we show that regional autosomal mutation rates at megabase resolution are largely stable across cancer types, with differences related to changes in replication timing and gene expression. However, mutations arising after the inactivation of MMR are no longer enriched in late replicating heterochromatin relative to early replicating euchromatin. Thus, differential DNA repair and not differential mutation supply is the primary cause of the large-scale regional mutation rate variation across the human genome.
0
Citation344
0
Save
0

Pan-cancer analysis of whole genomes identifies driver rearrangements promoted by LINE-1 retrotransposition

Bernardo Rodríguez–Martín et al.Feb 5, 2020
Abstract About half of all cancers have somatic integrations of retrotransposons. Here, to characterize their role in oncogenesis, we analyzed the patterns and mechanisms of somatic retrotransposition in 2,954 cancer genomes from 38 histological cancer subtypes within the framework of the Pan-Cancer Analysis of Whole Genomes (PCAWG) project. We identified 19,166 somatically acquired retrotransposition events, which affected 35% of samples and spanned a range of event types. Long interspersed nuclear element (LINE-1; L1 hereafter) insertions emerged as the first most frequent type of somatic structural variation in esophageal adenocarcinoma, and the second most frequent in head-and-neck and colorectal cancers. Aberrant L1 integrations can delete megabase-scale regions of a chromosome, which sometimes leads to the removal of tumor-suppressor genes, and can induce complex translocations and large-scale duplications. Somatic retrotranspositions can also initiate breakage–fusion–bridge cycles, leading to high-level amplification of oncogenes. These observations illuminate a relevant role of 22 L1 retrotransposition in remodeling the cancer genome, with potential implications for the development of human tumors.
0
Citation322
0
Save
1

Mutational signatures are markers of drug sensitivity of cancer cells

Jurica Levatić et al.May 21, 2021
Abstract Genomic analyses have revealed mutational signatures that are associated with DNA maintenance gone awry, a common occurrence in tumors. Because cancer therapeutics often target synthesis of DNA building blocks, DNA replication or DNA repair, we hypothesized that mutational signatures would make useful markers of drug sensitivity. We rigorously tested this hypothesis by a global analysis of various drug screening and genetic screening data sets, derived from cancer cell line panels. We introduce a novel computational method that detects mutational signatures in cell lines by stringently adjusting for the confounding germline mutational processes, which are difficult to remove when healthy samples from the same individuals are not available. This revealed many associations between diverse mutational signatures and drug activity in cancer cell lines, which are comparably or more numerous than associations with classical genetic features such as cancer driver mutations or copy number alterations. Validation across independent drug screening data and across genetic screens involving drug target genes revealed hundreds of robustly supported associations, which are provided as a resource for drug repurposing guided by mutational signature markers. We suggest that cancer cells bearing genomic signatures of deficiencies in certain DNA repair pathways may be vulnerable to particular types of therapeutics, such as epigenetic drugs.
1
Citation9
0
Save
24

Copy number losses of oncogenes and gains of tumor suppressor genes generate common driver events of human cancer

Elizaveta Besedina et al.Aug 7, 2023
ABSTRACT Cancer driver genes can be under positive selection for various types of genetic alterations, including gain-of-function or loss-of-function point mutations (single-nucleotide variants, SNV), small indels, copy number alterations (CNA) and other structural variants. We studied the landscape of interactions between these different types of alterations affecting the same gene by a statistical method, MutMatch, which can test for significant differences in selection, while accounting for various causes of mutation risk heterogeneity. Analyzing ∼18,000 cancer exomes and genomes, we found that known oncogenes simultaneously exhibit signatures of positive selection and also negative selection, where the latter can mask the former. Consistently, focussing on known positively selected regions identifies additional tumor types where an oncogene is relevant. Next, we characterized the landscape of CNA-dependent selection effects, revealing a general trend of increased positive selection on oncogene mutations not only upon CNA gains but also upon CNA deletions. Conversely, we observe a positive interaction between mutations and CNA gains in tumor suppressor genes. Thus, two-hit events involving point mutations and CNA are universally observed on driver genes regardless of the type of CNA, and may signal new therapeutic opportunities that have been overlooked. An explicit focus on the somatic CNA two-hit events can identify additional driver genes relevant to a tumor type. By a global analysis of CNA-selection effects across many driver genes and tissues, we identified at least four independently varying signatures, and thus generated a comprehensive, data-driven classification of cancer genes by mechanisms of (in)activation by genetic alterations.
24
Citation2
0
Save
Load More