KC
Karl Clauser
Author with expertise in Prediction of Peptide-MHC Binding Affinity
Broad Institute, Harvard University, Massachusetts Institute of Technology
+ 7 more
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(60% Open Access)
Cited by:
8
h-index:
56
/
i10-index:
71
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
21

MONTE enables serial immunopeptidome, ubiquitylome, proteome, phosphoproteome, acetylome analyses of sample-limited tissues

Jennifer Abelin et al.Oct 24, 2023
+13
H
E
J
Abstract Serial multiomic analyses of proteome, phosphoproteome and acetylome provides functional insights into disease pathology and drug effects while conserving precious human material. To date, ubiquitylome and HLA peptidome analyses have required separate samples for parallel processing each using distinct protocols. Here we present MONTE, a highly-sensitive m ulti- o mic n ative t issue e nrichment workflow that enables serial, deepscale analysis of HLA-I and HLA-II immunopeptidome, ubiquitylome, proteome, phosphoproteome and acetylome from the same tissue samples. We demonstrate the capabilities of MONTE in a proof-of-concept study of primary patient lung adenocarcinoma(LUAD) tumors. Depth of coverage and quantitative precision at each of the ‘omes is not compromised by serialization, and the addition of HLA immunopeptidomics enables identification of putative immunotherapeutic targets such as cancer/testis antigens and neoantigens. MONTE can provide insights into disease-specific changes in antigen presentation, protein expression, protein degradation, cell signaling, cross-talk and epigenetic pathways involved in disease pathology and treatment.
21
Citation8
0
Save
76

The HLA-II immunopeptidome of SARS-CoV-2

Shira Weingarten-Gabbay et al.Oct 24, 2023
+11
S
D
S
ABSTRACT Targeted synthetic vaccines have the potential to transform our response to viral outbreaks; yet the design of these vaccines requires a comprehensive knowledge of viral immunogens, including T-cell epitopes. Having previously mapped the SARS-CoV-2 HLA-I landscape, here we report viral peptides that are naturally processed and loaded onto HLA-II complexes in infected cells. We identified over 500 unique viral peptides from canonical proteins, as well as from overlapping internal open reading frames (ORFs), revealing, for the first time, the contribution of internal ORFs to the HLA-II peptide repertoire. Most HLA-II peptides co-localized with the known CD4+ T cell epitopes in COVID-19 patients. We also observed that two reported immunodominant regions in the SARS-CoV-2 membrane protein are formed at the level of HLA-II presentation. Overall, our analyses show that HLA-I and HLA-II pathways target distinct viral proteins, with the structural proteins accounting for most of the HLA-II peptidome and non-structural and non-canonical proteins accounting for the majority of the HLA-I peptidome. These findings highlight the need for a vaccine design that incorporates multiple viral elements harboring CD4+ and CD8+ T cell epitopes to maximize the vaccine effectiveness.
76
0
Save
1

What can Ribo-seq and proteomics tell us about the non-canonical proteome?

John Prensner et al.Oct 24, 2023
+6
L
J
J
Ribosome profiling (Ribo-seq) has proven transformative for our understanding of the human genome and proteome by illuminating thousands of non-canonical sites of ribosome translation outside of the currently annotated coding sequences (CDSs). A conservative estimate suggests that at least 7,000 non-canonical open reading frames (ORFs) are translated, which, at first glance, has the potential to expand the number of human protein-coding sequences by 30%, from ∼19,500 annotated CDSs to over 26,000. Yet, additional scrutiny of these ORFs has raised numerous questions about what fraction of them truly produce a protein product and what fraction of those can be understood as proteins according to conventional understanding of the term. Adding further complication is the fact that published estimates of non-canonical ORFs vary widely by around 30-fold, from several thousand to several hundred thousand. The summation of this research has left the genomics and proteomics communities both excited by the prospect of new coding regions in the human genome, but searching for guidance on how to proceed. Here, we discuss the current state of non-canonical ORF research, databases, and interpretation, focusing on how to assess whether a given ORF can be said to be "protein-coding".The human genome encodes thousands of non-canonical open reading frames (ORFs) in addition to protein-coding genes. As a nascent field, many questions remain regarding non-canonical ORFs. How many exist? Do they encode proteins? What level of evidence is needed for their verification? Central to these debates has been the advent of ribosome profiling (Ribo-seq) as a method to discern genome-wide ribosome occupancy, and immunopeptidomics as a method to detect peptides that are processed and presented by MHC molecules and not observed in traditional proteomics experiments. This article provides a synthesis of the current state of non-canonical ORF research and proposes standards for their future investigation and reporting.Combined use of Ribo-seq and proteomics-based methods enables optimal confidence in detecting non-canonical ORFs and their protein products.Ribo-seq can provide more sensitive detection of non-canonical ORFs, but data quality and analytical pipelines will impact results.Non-canonical ORF catalogs are diverse and span both high-stringency and low-stringency ORF nominations.A framework for standardized non-canonical ORF evidence will advance the research field.
0

Microscaled Proteogenomic Methods for Precision Oncology

Shankha Satpathy et al.May 7, 2020
+29
K
E
S
Cancer proteogenomics integrates genomics, transcriptomics and mass spectrometry (MS)-based proteomics to gain insights into cancer biology and treatment efficacy. A proteogenomics approach was therefore developed for frozen core biopsies using tissue-sparing specimen processing with a “microscaled” proteomics workflow. For technical proof-of-principle, biopsies from ERBB2 positive breast cancers before and 48-72 hours after the first dose of neoadjuvant trastuzumab-based chemotherapy were analyzed. ERBB2 protein and phosphosite levels, as well as mTOR target phosphosites, were significantly more suppressed upon treatment in cases associated with pathological complete response, suggesting MS-based pharmacodynamics is achievable. Furthermore, integrated analyses indicated potential causes of treatment resistance including the absence of ERBB2 amplification (false-ERBB2 positive) and insufficient ERBB2 activity for therapeutic sensitivity despite ERBB2 amplification (pseudo-ERBB2 positive). Candidate resistance features in true-ERBB2+ cases, including androgen receptor signaling, mucin expression and an inactive immune microenvironment were observed. Thus, proteogenomic analysis of needle core biopsies is feasible and clinical utility should be investigated.
1

Translation of non-canonical open reading frames as a cancer cell survival mechanism in childhood medulloblastoma

Damon Hofman et al.Oct 24, 2023
+21
I
J
D
Summary A hallmark of high-risk childhood medulloblastoma is the dysregulation of RNA translation. Currently, it is unknown whether medulloblastoma dysregulates the translation of putatively oncogenic non-canonical open reading frames. To address this question, we performed ribosome profiling of 32 medulloblastoma tissues and cell lines and observed widespread non-canonical ORF translation. We then developed a step-wise approach to employ multiple CRISPR-Cas9 screens to elucidate functional non-canonical ORFs implicated in medulloblastoma cell survival. We determined that multiple lncRNA-ORFs and upstream open reading frames (uORFs) exhibited selective functionality independent of the main coding sequence. One of these, ASNSD1-uORF or ASDURF, was upregulated, associated with the MYC family oncogenes, and was required for medulloblastoma cell survival through engagement with the prefoldin-like chaperone complex. Our findings underscore the fundamental importance of non-canonical ORF translation in medulloblastoma and provide a rationale to include these ORFs in future cancer genomics studies seeking to define new cancer targets. Highlights Ribo-seq reveals widespread translation of non-canonical ORFs in medulloblastoma High-resolution CRISPR tiling reveals uORF functions in medulloblastoma ASNSD1-uORF controls downstream pathways with the prefoldin-like complex ASNSD1-uORF is necessary for medulloblastoma cell survival
1

Pan-viral ORFs discovery using Massively Parallel Ribosome Profiling

Shira Weingarten-Gabbay et al.Oct 24, 2023
+8
A
M
S
Unveiling the complete proteome of viruses is crucial to our understanding of the viral life cycle and interaction with the host. We developed Massively Parallel Ribosome Profiling (MPRP) to experimentally determine open reading frames (ORFs) in 20,170 designed oligonucleotides across 679 human-associated viral genomes. We identified 5,381 ORFs, including 4,208 non-canonical ORFs, and show successful detection of both annotated coding sequences (CDSs) and reported non-canonical ORFs. By examining immunopeptidome datasets of infected cells, we found class I human leukocyte antigen (HLA-I) peptides originating from non-canonical ORFs identified through MPRP. By inspecting ribosome occupancies on the 5'UTR and CDS regions of annotated viral genes, we identified hundreds of upstream ORFs (uORFs) that negatively regulate the synthesis of canonical viral proteins. The unprecedented source of viral ORFs across a wide range of viral families, including highly pathogenic viruses, expands the repertoire of vaccine targets and exposes new cis-regulatory sequences in viral genomes.
1
0
Save
0

Proteomics Standards Initiative Extended FASTA Format (PEFF)

Pierre‐Alain Binz et al.May 7, 2020
+18
J
J
P
Mass spectrometry-based proteomics enables the high-throughput identification and quantification of proteins, including sequence variants and post-translational modifications (PTMs), in biological samples. However, most workflows require that such variations be included in the search space used to analyze the data, and doing so remains challenging with most analysis tools. In order to facilitate the search for known sequence variants and PTMs, the Proteomics Standards Initiative (PSI) has designed and implemented the PSI Extended FASTA Format (PEFF). PEFF is based on the very popular FASTA format but adds a uniform mechanism for encoding substantially more metadata about the sequence collection as well as individual entries, including support for encoding known sequence variants, PTMs, and proteoforms. The format is very nearly backwards compatible, and as such, existing FASTA parsers will require little or no changes to be able to read PEFF files as FASTA files, although without supporting any of the extra capabilities of PEFF. PEFF is defined by a full specification document, controlled vocabulary terms, a set of example files, software libraries, and a file validator. Popular software and resources are starting to support PEFF, including the sequence search engine Comet and the knowledge bases neXtProt and UniProtKB. Widespread implementation of PEFF is expected to further enable proteogenomics and top-down proteomics applications by providing a standardized mechanism for encoding protein sequences and their known variations. All the related documentation, including the detailed file format specification and example files, are available at .
0

Dual protease type XIII/pepsin digestion offers superior resolution and overlap for the analysis of histone tails by HX-MS

James Mullahoo et al.May 7, 2020
+3
K
T
J
The N-terminal regions of histone proteins (tails) are dynamic elements that protrude from the nucleosome and are involved in many aspects of chromatin organization. Their epigenetic role is well-established, and post-translational modifications (PTMs) present on these regions contribute to transcriptional regulation. While hydrogen/deuterium exchange mass spectrometry (HX-MS) is well-suited for the analysis of dynamic structures, it has seldom been employed to analyze histones due to the poor N-terminal coverage obtained using pepsin. Here, we test the applicability of a dual protease type XIII/pepsin digestion column to this class of proteins. We optimize online digestion conditions using the H4 monomer, and extend the method to the analysis of histones in monomeric states and nucleosome core particles (NCPs). We show that the dual protease column generates many short and overlapping N-terminal peptides. We evaluate our method by performing hydrogen exchange experiments of NCPs for different time points and present full coverage of the tails at excellent resolution. We further employ electron transfer dissociation (ETD) and showcase an unprecedented degree of overlap across multiple peptides that is several fold higher than previously reported methods. The method we report here may be readily applied to the HX-MS investigation of histone dynamics and to the footprints of histone binding proteins on nucleosomes.
0

Thousands of novel unannotated proteins expand the MHC I immunopeptidome in cancer

Tamara Ouspenskaia et al.May 6, 2020
+24
K
T
T
Tumor epitopes – peptides that are presented on surface-bound MHC I proteins - provide targets for cancer immunotherapy and have been identified extensively in the annotated protein-coding regions of the genome. Motivated by the recent discovery of translated novel unannotated open reading frames (nuORFs) using ribosome profiling (Ribo-seq), we hypothesized that cancer-associated processes could generate nuORFs that can serve as a new source of tumor antigens that harbor somatic mutations or show tumor-specific expression. To identify cancer-specific nuORFs, we generated Ribo-seq profiles for 29 malignant and healthy samples, developed a sensitive analytic approach for hierarchical ORF prediction, and constructed a high-confidence database of translated nuORFs across tissues. Peptides from 3,555 unique translated nuORFs were presented on MHC I, based on analysis of an extensive dataset of MHC I-bound peptides detected by mass spectrometry, with >20-fold more nuORF peptides detected in the MHC I immunopeptidomes compared to whole proteomes. We further detected somatic mutations in nuORFs of cancer samples and identified nuORFs with tumor-specific translation in melanoma, chronic lymphocytic leukemia and glioblastoma. NuORFs thus expand the pool of MHC I-presented, tumor-specific peptides, targetable by immunotherapies.
1

Optimized liquid and gas phase fractionation increase HLA-peptidome coverage for primary cell and tissue samples

Susan Klaeger et al.Oct 24, 2023
+14
K
A
S
Abstract Mass spectrometry is the most effective method to directly identify peptides presented on HLA molecules. However, current standard approaches often require many millions of cells for input material to achieve high coverage of the immunopeptidome and are therefore not compatible with the often limited amounts of tissue available from clinical tumor samples. Here, we evaluated microscaled basic reversed-phase fractionation to separate HLA peptide samples off-line followed by ion mobility coupled to LC-MS/MS for analysis. The combination of these two separation methods enabled identification of 20% to 50% more peptides compared to samples analyzed without either prior fractionation or use of ion mobility alone. We demonstrate coverage of HLA immunopeptidomes with up to 8,107 distinct peptides starting with as few as 100 million cells or 150 milligrams of wet weight tumor tissue. This increased sensitivity can improve HLA binding prediction algorithms and enable detection of clinically relevant epitopes such as neoantigens.