HB
Hannah Boekweg
Author with expertise in Mass Spectrometry Techniques with Proteins
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(100% Open Access)
Cited by:
430
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Proteogenomic and metabolomic characterization of human glioblastoma

Liang-Bo Wang et al.Feb 11, 2021
+97
M
A
L
Glioblastoma (GBM) is the most aggressive nervous system cancer. Understanding its molecular pathogenesis is crucial to improving diagnosis and treatment. Integrated analysis of genomic, proteomic, post-translational modification and metabolomic data on 99 treatment-naive GBMs provides insights to GBM biology. We identify key phosphorylation events (e.g., phosphorylated PTPN11 and PLCG1) as potential switches mediating oncogenic pathway activation, as well as potential targets for EGFR-, TP53-, and RB1-altered tumors. Immune subtypes with distinct immune cell types are discovered using bulk omics methodologies, validated by snRNA-seq, and correlated with specific expression and histone acetylation patterns. Histone H2B acetylation in classical-like and immune-low GBM is driven largely by BRDs, CREBBP, and EP300. Integrated metabolomic and proteomic data identify specific lipid distributions across subtypes and distinct global metabolic changes in IDH-mutated tumors. This work highlights biological relationships that could contribute to stratification of GBM patients for more effective treatment.
0
Citation411
0
Save
21

Data-Dependent Acquisition with Precursor Coisolation Improves Proteome Coverage and Measurement Throughput for Label-Free Single-Cell Proteomics

Thy Truong et al.Oct 19, 2022
+7
H
S
T
Abstract The sensitivity of single-cell proteomics (SCP) has increased dramatically in recent years due to advances in experimental design, sample preparation, separations and mass spectrometry instrumentation. Further increasing the sensitivity of SCP methods and instrumentation will enable the study of proteins within single cells that are expressed at copy numbers too small to be measured by current methods. Here we combine efficient nanoPOTS sample preparation and ultra-low-flow liquid chromatography with a newly developed data acquisition and analysis scheme termed wide window acquisition (WWA) to quantify >3,000 proteins from single cells in fast label-free analyses. WWA is based on data-dependent acquisition (DDA) but employs larger precursor isolation windows to intentionally co-isolate and co-fragment additional precursors along with the selected precursor. The resulting chimeric MS2 spectra are then resolved using the CHIMERYS search engine within Proteome Discoverer 3.0. Compared to standard DDA workflows, WWA employing isolation windows of 8-12 Th increases peptide and proteome coverage by ~28% and ~39%, respectively. For a 40-min LC gradient operated at ~15 nL/min, we identified an average of 2,150 proteins per single-cell-sized aliquots of protein digest directly from MS2 spectra, which increased to an average of 3,524 proteins including proteins identified with MS1-level feature matching. Reducing the active gradient to 20 min resulted in a modest 10% decrease in proteome coverage. We also compared the performance of WWA with DIA. DIA underperformed WWA in terms of proteome coverage, especially with faster separations. Average proteome coverage for single HeLa and K562 cells was respectively 1,758 and 1,642 based on MS2 identifications with 1% false discovery rate and 3042 and 2891 with MS1 feature matching. As such, WWA combined with efficient sample preparation and rapid separations extends the depths of the proteome that can be studied at the single-cell level.
21
Citation12
0
Save
1

Benchmarking PSM identification tools for single cell proteomics

Daisha Watt et al.Aug 18, 2021
+4
T
H
D
Abstract Single cell proteomics is an emerging sub-field within proteomics with the potential to revolutionize our understanding of cellular heterogeneity and interactions. Recent efforts have largely focused on technological advancements in sample preparation, chromatography and instrumentation to enable measuring proteins present in these ultra-limited samples. Although advancements in data acquisition have rapidly improved our ability to analyze single cells, the software pipelines used in data analysis were originally written for traditional bulk samples and their performance on single cell data has not been investigated. We benchmarked five popular peptide identification tools on single cell proteomics data. We found that MetaMorpheus achieved the greatest number of peptide spectrum matches at a 1% false discovery rate. Depending on the tool, we also find that post processing machine learning can improve spectrum identification results by up to ∼40%. Although rescoring leads to a greater number of peptide spectrum matches, these new results typically are generated by 3rd party tools and have no way of being utilized by the primary pipeline for quantification. Exploration of novel metrics for machine learning algorithms will continue to improve performance.
0

Calculating sample size requirements for temporal dynamics in single cell proteomics

Hannah Boekweg et al.Dec 9, 2020
+2
E
A
H
Abstract Single cell measurements are uniquely capable of characterizing cell-to-cell heterogeneity, and have been used to explore the large diversity of cell types and physiological functions present in tissues and other complex cell assemblies. An intriguing application of single cell proteomics is the characterization of proteome dynamics during biological transitions, like cellular differentiation or disease progression. Time course experiments, which regularly take measurements during state transitions, rely on the ability to detect dynamic trajectories in a data series. However, in a single cell proteomics experiment, cell-to-cell heterogeneity complicates the confident identification of proteome dynamics as measurement variability may be higher than expected. Therefore, a critical question for these experiments is how many data points need to be acquired during the time course to enable robust statistical analysis. We present here an analysis of the most important variables that affect statistical confidence in the detection of proteome dynamics: fold-change, measurement variability, and the number of cells measured during the time course. Importantly, we show that datasets with less than 16 measurements across the time domain suffer from low accuracy and also have a high false-positive rate. We also demonstrate how to balance competing demands in experimental design to achieve a desired result.
0
Citation1
0
Save
1

Features of peptide fragmentation spectra in single cell proteomics

Hannah Boekweg et al.Aug 18, 2021
+4
E
D
H
Abstract The goal of proteomics is to identify and quantify the complete set of proteins in a biological sample. Single cell proteomics specializes in identification and quantitation of proteins for individual cells, often used to elucidate cellular heterogeneity. The significant reduction in ions introduced into the mass spectrometer for single cell samples could impact the features of MS2 fragmentation spectra. As all peptide identification software tools have been developed on spectra from bulk samples and the associated ion rich spectra, the potential for spectral features to change is of great interest. We characterize the differences between single cell spectra and bulk spectra by examining three fundamental spectral features that are likely to affect peptide identification performance. All features show significant changes in single cell spectra, including loss of annotated fragment ions, blurring signal and background peaks due to diminishing ion intensity and distinct fragmentation pattern compared to bulk spectra. As each of these features is a foundational part of peptide identification algorithms, it is critical to adjust algorithms to compensate for these losses.
1
Citation1
0
Save
0

Pushing the Isotopic Envelope: When carrier channels pollute their neighbors signals

Connor Peterson et al.Apr 20, 2024
S
E
H
C
Individual cells are the foundational unit of biology, and understanding their functions and interactions is critical to advancing our understanding of health and disease. Single cell proteomics has seen intense interest from mass spectrometrists, with a goal of quantifying the proteome of single cells by adapting current techniques used in bulk samples. To date, most method optimizations research has worked towards increasing the proteome coverage of single cells. One prominent technique multiplexes many individual cells into a single data acquisition event using isobaric labels. Accompanying the single cells, one label is typically used for a mixed set of many cells, called a carrier or boost channel. Although this improves peptide identification rates, several groups have examined the impact on quantitative accuracy as more cells are included in the carrier channel, e.g. 100x or 500x. This manuscript explores how impurities in the multiplexing reagent can lead to inaccurate quantification observed as a measurable signal in the wrong channel. We discover that the severe abundance differential between carrier and single cell, combined with the reagent impurities, can overshadow several channels typically used for single cells. For carrier amounts 100x and above, this contamination can be as abundant as true signal from a single cell. Therefore, we suggest limiting the carrier channel to a minimal amount and balance the goals of identification and quantification.
0
Citation1
0
Save
12

Simplified and unified access to cancer proteogenomic data

Caleb Lindgren et al.Nov 17, 2020
+4
B
D
C
Abstract Comprehensive cancer datasets recently generated by the Clinical Proteomic Tumor Analysis Consortium (CPTAC) offer great potential for advancing our understanding of how to combat cancer. These datasets include DNA, RNA, protein, and clinical characterization for tumor and normal samples from large cohorts in many different cancer types. The raw data are publicly available at various Cancer Research Data Commons. However, widespread re-use of these datasets is also facilitated by easy access to the processed quantitative data tables. We have created a Python package, cptac , which is a data API that distributes the finalized processed CPTAC datasets in a consistent, up-to-date format. This consistency makes it easy to integrate the data with common graphing, statistical, and machine learning packages for advanced analysis. Additionally, consistent formatting across all cancer types promotes the investigation of pan-cancer trends. The data API structure of directly streaming data within a programming environment enhances reproducibility. Finally, with the accompanying tutorials, this package provides a novel resource for cancer research education.
29

TDP-43-stratified single-cell proteomic profiling of postmortem human spinal motor neurons reveals protein dynamics in amyotrophic lateral sclerosis

Amanda Guise et al.Jun 10, 2023
+11
Y
T
A
Unbiased proteomics has been employed to interrogate central nervous system (CNS) tissues (brain, spinal cord) and fluid matrices (CSF, plasma) from amyotrophic lateral sclerosis (ALS) patients; yet, a limitation of conventional bulk tissue studies is that motor neuron (MN) proteome signals may be confounded by admixed non-MN proteins. Recent advances in trace sample proteomics have enabled quantitative protein abundance datasets from single human MNs (Cong et al., 2020b). In this study, we leveraged laser capture microdissection (LCM) and nanoPOTS (Zhu et al., 2018c) single-cell mass spectrometry (MS)-based proteomics to query changes in protein expression in single MNs from postmortem ALS and control donor spinal cord tissues, leading to the identification of 2515 proteins across MNs samples (>900 per single MN) and quantitative comparison of 1870 proteins between disease groups. Furthermore, we studied the impact of enriching/stratifying MN proteome samples based on the presence and extent of immunoreactive, cytoplasmic TDP-43 inclusions, allowing identification of 3368 proteins across MNs samples and profiling of 2238 proteins across TDP-43 strata. We found extensive overlap in differential protein abundance profiles between MNs with or without obvious TDP-43 cytoplasmic inclusions that together point to early and sustained dysregulation of oxidative phosphorylation, mRNA splicing and translation, and retromer-mediated vesicular transport in ALS. Our data are the first unbiased quantification of single MN protein abundance changes associated with TDP-43 proteinopathy and begin to demonstrate the utility of pathology-stratified trace sample proteomics for understanding single-cell protein abundance changes in human neurologic diseases.
1

Temporal variation in lymphocyte proteomics

Michaela McCown et al.Jul 30, 2021
+5
D
C
M
Abstract Chronic Lymphocytic Leukemia (CLL) is a slow progressing disease, characterized by a long asymptomatic stage followed by a symptomatic stage during which patients receive treatment. While proteomic studies have discovered differential pathways in CLL, the proteomic evolution of CLL during the asymptomatic stage has not been studied. In this pilot study, we show that by using small sample sizes comprising ~145 cells, we can detect important features of CLL necessary for studying tumor evolution. Our small samples are collected at two time points and reveal large proteomic changes in healthy individuals over time. A meta-analysis of two CLL proteomic papers showed little commonality in differentially expressed proteins and demonstrates the need for larger control populations sampled over time. To account for proteomic variability between time points and individuals, large control populations sampled at multiple time points are necessary for understanding CLL progression. Data is available via ProteomeXchange with identifier PXD027429.