CP
Christoph Plass
Author with expertise in Epigenetic Modifications and Their Functional Implications
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
55
(69% Open Access)
Cited by:
20,826
h-index:
103
/
i10-index:
346
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Maftools: efficient and comprehensive analysis of somatic variants in cancer

Anand Mayakonda et al.Oct 19, 2018
Numerous large-scale genomic studies of matched tumor-normal samples have established the somatic landscapes of most cancer types. However, the downstream analysis of data from somatic mutations entails a number of computational and statistical approaches, requiring usage of independent software and numerous tools. Here, we describe an R Bioconductor package, Maftools, which offers a multitude of analysis and visualization modules that are commonly used in cancer genomic studies, including driver gene identification, pathway, signature, enrichment, and association analyses. Maftools only requires somatic variants in Mutation Annotation Format (MAF) and is independent of larger alignment files. With the implementation of well-established statistical and computational methods, Maftools facilitates data-driven research and comparative analysis to discover novel results from publicly available data sets. In the present study, using three of the well-annotated cohorts from The Cancer Genome Atlas (TCGA), we describe the application of Maftools to reproduce known results. More importantly, we show that Maftools can also be used to uncover novel findings through integrative analysis.
0
Citation3,266
0
Save
0

Pan-cancer analysis of whole genomes

Lauri Aaltonen et al.Feb 5, 2020
Abstract Cancer is driven by genetic change, and the advent of massively parallel sequencing has enabled systematic documentation of this variation at the whole-genome scale 1–3 . Here we report the integrative analysis of 2,658 whole-cancer genomes and their matching normal tissues across 38 tumour types from the Pan-Cancer Analysis of Whole Genomes (PCAWG) Consortium of the International Cancer Genome Consortium (ICGC) and The Cancer Genome Atlas (TCGA). We describe the generation of the PCAWG resource, facilitated by international data sharing using compute clouds. On average, cancer genomes contained 4–5 driver mutations when combining coding and non-coding genomic elements; however, in around 5% of cases no drivers were identified, suggesting that cancer driver discovery is not yet complete. Chromothripsis, in which many clustered structural variants arise in a single catastrophic event, is frequently an early event in tumour evolution; in acral melanoma, for example, these events precede most somatic point mutations and affect several cancer-associated genes simultaneously. Cancers with abnormal telomere maintenance often originate from tissues with low replicative activity and show several mechanisms of preventing telomere attrition to critical levels. Common and rare germline variants affect patterns of somatic mutation, including point mutations, structural variants and somatic retrotransposition. A collection of papers from the PCAWG Consortium describes non-coding mutations that drive cancer beyond those in the TERT promoter 4 ; identifies new signatures of mutational processes that cause base substitutions, small insertions and deletions and structural variation 5,6 ; analyses timings and patterns of tumour evolution 7 ; describes the diverse transcriptional consequences of somatic mutation on splicing, expression levels, fusion genes and promoter activity 8,9 ; and evaluates a range of more-specialized features of cancer genomes 8,10–18 .
0
Citation2,464
0
Save
0

Identification of Regulatory Networks in HSCs and Their Immediate Progeny via Integrated Proteome, Transcriptome, and DNA Methylome Analysis

Nina Cabezas‐Wallscheid et al.Aug 21, 2014
In this study, we present integrated quantitative proteome, transcriptome, and methylome analyses of hematopoietic stem cells (HSCs) and four multipotent progenitor (MPP) populations. From the characterization of more than 6,000 proteins, 27,000 transcripts, and 15,000 differentially methylated regions (DMRs), we identified coordinated changes associated with early differentiation steps. DMRs show continuous gain or loss of methylation during differentiation, and the overall change in DNA methylation correlates inversely with gene expression at key loci. Our data reveal the differential expression landscape of 493 transcription factors and 682 lncRNAs and highlight specific expression clusters operating in HSCs. We also found an unexpectedly dynamic pattern of transcript isoform regulation, suggesting a critical regulatory role during HSC differentiation, and a cell cycle/DNA repair signature associated with multipotency in MPP2 cells. This study provides a comprehensive genome-wide resource for the functional exploration of molecular, cellular, and epigenetic regulation at the top of the hematopoietic hierarchy.
0
Citation463
0
Save
0

Principles for the post-GWAS functional characterization of cancer risk loci

Matthew Freedman et al.May 26, 2011
Genome wide association studies (GWAS) have identified more than 200 mostly new common low-penetrance susceptibility loci for cancers. The predicted risk associated with each locus is generally modest (with a per-allele odds ratio typically less than 2) and so, presumably, are the functional effects of individual genetic variants conferring disease susceptibility. Perhaps the greatest challenge in the ‘post-GWAS’ era is to understand the functional consequences of these loci. Biological insights can then be translated to clinical benefits, including reliable biomarkers and effective strategies for screening and disease prevention. The purpose of this article is to propose principles for the initial functional characterization of cancer risk loci, with a focus on non-coding variants, and to define ‘post-GWAS’ functional characterization. By December 2010, there were 1,212 published GWAS studies1 reporting significant (P < 5 × 10−8) associations for 210 traits (Table 1), and the Catalog of Published GWAS states that by March 2011, 812 publications reported 3,977 SNP associations1. This is likely a small fraction of the common susceptibility loci of low penetrance that will eventually be identified. Despite these successes in identifying risk loci, the causal variant and/or the molecular basis of risk etiology has been determined for only a small fraction of these associations2–4. Plausible candidate genes can be based on proximity to risk loci, but few have so far been defined in a more systematic manner (Supplementary Table 1). Table 1 The genomic context in which a variant is found can be used as preliminary functional analysis Increased investment in post-GWAS functional characterization of risk loci5 has now been advocated across diseases and for cardiovascular disease and diabetes6. For cancer biology, the complex interplay between genetics and the environment in many cancers poses a particularly exciting challenge for post-GWAS research. Here we suggest a systematic strategy for understanding how cancer-associated variants exert their effects. We mostly refer to SNPs throughout the paper, but we recognize that other types of common genetic (for example, copy number variants) or epigenetic variation may influence risk. Our understanding of the way in which a risk variant initiates disease pathogenesis progresses from statistical association between genetic variation and trait or disease variation to functionality and causality. The functional consequences of variants in protein-coding regions causing most monogenic disorders are more readily interpreted because we know the genetic code. For non-Mendelian or multifactorial traits, most of the common DNA variants have so far mapped to non-protein–coding regions2, where our understanding of functional consequences and causality is more rudimentary. Our hypothesis is that the trait-associated alleles exert their effects by influencing transcriptional output (such as transcript levels and splicing) through multiple mechanisms. We emphasize appropriate assays and models to test the functional effects of both SNPs and genes mapping to cancer predisposition loci. Although much of what is written is applicable to alleles discovered for any trait, the section on modeling gene effects will emphasize measuring cancer-related phenotypes. At some loci, multiple, independently associated risk alleles rather than single risk alleles may be functionally responsible for the occurrence of disease. Genotyping susceptibility loci (and their correlated variants) in multiple populations with different linkage disequilibrium (LD) structures may prove effective in substantially reducing the number of potentially causative variants (that is, the same causal variant may segregate in multiple populations), as shown for the FGFR2 locus in breast cancer7, but for most loci there will remain a set of potentially causative variants that cannot be separated at the statistical level from case-control genotype data. A susceptibility locus should be re-sequenced to ascertain all genetic variation, identifying candidate functional or causal variants and identifying candidate causal genes. Ideally, the identification of a causal SNP would be the next step to reveal the molecular mechanisms of risk modification. Practically, however, it is unclear what the criteria for causality should be, particularly in non-protein–coding regions. Thus, although we propose a framework set of analyses (Box 1), we acknowledge that the techniques and methods will continue to evolve with the field. Box 1 Strategies to progress from tag SNP to mechanism Target resequencing efforts using linkage disequilibrium (LD) structure. Use other populations to refine LD regions (for example African ancestry with shorter LD and more heterogeneity). Determine expression levels of nearby genes as a function of genotype at each locus (eQTL). Characterize gene regulatory regions by multiple empirical techniques bearing in mind that these are tissue and context specific. Combine regulatory regions with risk loci using coordinates from multiple reference genomes to capture all variation within the shorter regulatory regions that correlates with the tag SNP at each locus. Multiple experimental manipulations in model systems are needed to progressively implicate transcription units (genes) in mechanisms relevant to the associated loci: Knockouts of regulatory regions in animal (difficult and may be limited by functional redundancy, but new targeting methods in rat are promising) models followed by genome-wide expression analysis. Use chromatin association methods (3C, CHIA-PET) of regulatory regions to determine the identity of target genes (compare with eQTL data). Targeted gene perturbations in somatic cell models. Explore fully genome-wide eQTL and miRNA quantitative variation correlation in relevant tissues and cells. Explore epigenetic mechanisms in the context of genome-wide genetic polymorphism. Employ cell models and tissue reconstructions to evaluate mechanisms using gene perturbations and polymorphic variants. The human cancer cell xenograft has re-emerged as a minimal in vivo validation of these models. Above all, resist the temptation to equate any partial functional evidence as sufficient. Published claims of functional relevance should be fully evaluated using the steps detailed above.
0
Citation418
0
Save
0

BCAT1 promotes cell proliferation through amino acid catabolism in gliomas carrying wild-type IDH1

Martje Tönjes et al.Jun 23, 2013
Branched-chain amino acid transaminase 1, the enzyme that initiates the catabolism of branched-chain amino acids, is involved in glioma pathogenesis, making it a potential therapeutic target. Here we show that glioblastoma express high levels of branched-chain amino acid transaminase 1 (BCAT1), the enzyme that initiates the catabolism of branched-chain amino acids (BCAAs). Expression of BCAT1 was exclusive to tumors carrying wild-type isocitrate dehydrogenase 1 (IDH1) and IDH2 genes and was highly correlated with methylation patterns in the BCAT1 promoter region. BCAT1 expression was dependent on the concentration of α-ketoglutarate substrate in glioma cell lines and could be suppressed by ectopic overexpression of mutant IDH1 in immortalized human astrocytes, providing a link between IDH1 function and BCAT1 expression. Suppression of BCAT1 in glioma cell lines blocked the excretion of glutamate and led to reduced proliferation and invasiveness in vitro, as well as significant decreases in tumor growth in a glioblastoma xenograft model. These findings suggest a central role for BCAT1 in glioma pathogenesis, making BCAT1 and BCAA metabolism attractive targets for the development of targeted therapeutic approaches to treat patients with glioblastoma.
0
Citation407
0
Save
Load More