XC
Xue Cai
Author with expertise in Mass Spectrometry Techniques with Proteins
Westlake University, Chengdu University of Technology, Institute for Advanced Study
+ 9 more
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(50% Open Access)
Cited by:
5
h-index:
20
/
i10-index:
27
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Accelerated Protein Biomarker Discovery from FFPE tissue samples using Single-shot, Short Gradient Microflow SWATH MS

Rui Sun et al.May 7, 2020
+13
C
C
R
ABSTRACT We report and evaluated a microflow, single-shot, short gradient SWATH MS method intended to accelerate the discovery and verification of protein biomarkers in clinical specimens. The method uses 15-min gradient microflow-LC peptide separation, an optimized SWATH MS window configuration and OpenSWATH software for data analysis. We applied the method to a cohort 204 of FFPE prostate tissue samples from 58 prostate cancer patients and 10 prostatic hyperplasia patients. Altogether we identified 27,976 proteotypic peptides and 4,043 SwissProt proteins from these 204 samples. Compared to a reference SWATH method with 2-hour gradient the accelerated method consumed only 27% instrument time, quantified 80% proteins and showed reduced batch effects. 3,800 proteins were quantified by both methods in two different instruments with relatively high consistency (r = 0.77). 75 proteins detected by the accelerated method with differential abundance between clinical groups were selected for further validation. A shortlist of 134 selected peptide precursors from the 75 proteins were analyzed using MRM-HR, exhibiting high quantitative consistency with the 15-min SWATH method (r = 0.89) in the same sample set. We further verified the capacity of these 75 proteins in separating benign and malignant tissues (AUC = 0.99) in an independent prostate cancer cohort (n=154). Overall our data show that the single-shot short gradient microflow-LC SWATH MS method achieved about 4-fold acceleration of data acquisition with reduced batch effect and a moderate level of protein attrition compared to a standard SWATH acquisition method. Finally, the results showed comparable ability to separate clinical groups.
0

Proteomic landscape of epithelial ovarian cancer

Liujia Qian et al.Sep 12, 2024
+20
Z
J
L
Epithelial ovarian cancer (EOC) is a deadly disease with limited diagnostic biomarkers and therapeutic targets. Here we conduct a comprehensive proteomic profiling of ovarian tissue and plasma samples from 813 patients with different histotypes and therapeutic regimens, covering the expression of 10,715 proteins. We identify eight proteins associated with tumor malignancy in the tissue specimens, which are further validated as potential circulating biomarkers in plasma. Targeted proteomics assays are developed for 12 tissue proteins and 7 blood proteins, and machine learning models are constructed to predict one-year recurrence, which are validated in an independent cohort. These findings contribute to the understanding of EOC pathogenesis and provide potential biomarkers for early detection and monitoring of the disease. Additionally, by integrating mutation analysis with proteomic data, we identify multiple proteins related to DNA damage in recurrent resistant tumors, shedding light on the molecular mechanisms underlying treatment resistance. This study provides a multi-histotype proteomic landscape of EOC, advancing our knowledge for improved diagnosis and treatment strategies. It remains essential to find clinically relevant biomarkers in epithelial ovarian cancer (EOC). Here, the authors perform a comprehensive proteomic profiling of tissue and plasma samples from EOC and control patients; they find potential biomarkers for EOC early detection and develop methods for tumour recurrence prediction.
0
Citation1
0
Save
4

A comprehensive mass spectral library for human thyroid tissues

Yaoting Sun et al.Oct 24, 2023
+13
W
L
Y
Abstract Thyroid nodules occur in about 60% of the population. Current diagnostic strategies, however, often fail at distinguishing malignant nodules before surgery, thus leading to unnecessary, invasive treatments. As proteins are involved in all physio/pathological processes, a proteome investigation of biopsied nodules may help correctly classify and identify malignant nodules and discover therapeutic targets. Quantitative mass spectrometry data-independent acquisition (DIA) enables highly reproducible and rapid throughput investigation of proteomes. An exhaustive spectral library of thyroid nodules is essential for DIA yet still unavailable. This study presents a comprehensive thyroid spectral library covering five types of thyroid tissue: multinodular goiter, follicular adenoma, follicular and papillary thyroid carcinoma, and normal thyroid tissue. Our library includes 925,330 transition groups, 157,548 peptide precursors, 121,960 peptides, 9941 protein groups, and 9826 proteins from proteotypic peptides. This library resource was evaluated using three papillary thyroid carcinoma samples and their corresponding adjacent normal thyroid tissue, leading to effective quantification of up to 7863 proteins from biopsy-level thyroid tissues.
4
Paper
Citation1
0
Save
0

metaExpertPro: a computational workflow for metaproteomics spectral library construction and data-independent acquisition mass spectrometry data analysis

Yingying Sun et al.Dec 1, 2023
+12
S
Z
Y
Background: Analysis of mass spectrometry-based metaproteomic data, in particular large-scale data-independent acquisition MS (DIA-MS) data, remains a computational challenge. Here, we aim to develop a software tool for efficiently constructing spectral libraries and analyzing extensive datasets of DIA-based metaproteomics. Results: We present a computational pipeline called metaExpertPro for metaproteomics data analysis. This pipeline encompasses spectral library generation using data-dependent acquisition MS (DDA-MS), protein identification and quantification using DIA-MS, functional and taxonomic annotation, as well as quantitative matrix generation for both microbiota and hosts. To enhance accessibility and ease of use, all modules and dependencies are encapsulated within a Docker container. By integrating FragPipe and DIA-NN, metaExpertPro offers compatibility with both Orbitrap-based and PASEF-based DDA and DIA data. To evaluate the depth and accuracy of identification and quantification, we conducted extensive assessments using human fecal samples and benchmark tests. Performance tests conducted on human fecal samples demonstrated that metaExpertPro quantified an average of 45,000 peptides in a 60-minute diaPASEF injection. Notably, metaExpertPro outperformed three existing software tools by characterizing a higher number of peptides and proteins. Importantly, metaExpertPro maintained a low factual False Discovery Rate (FDR) of less than 5% for protein groups across four benchmark tests. Applying a filter of five peptides per genus, metaExpertPro achieved relatively high accuracy (F-score = 0.67-0.90) in genus diversity and demonstrated a high correlation (rSpearman = 0.73-0.82) between the measured and true genus relative abundance in benchmark tests. Additionally, the quantitative results at the protein, taxonomy, and function levels exhibited high reproducibility and consistency across the commonly adopted public human gut microbial protein databases IGC and UHGP. In a metaproteomic analysis of dyslipidemia patients, metaExpertPro revealed characteristic alterations in microbial functions and potential interactions between the microbiota and the host. Conclusions: metaExpertPro presents a robust one-stop computational solution for constructing metaproteomics spectral libraries, analyzing DIA-MS data, and annotating taxonomic as well as functional data.
0

High-throughput proteomic analysis of FFPE tissue samples facilitates tumor stratification

Yi Zhu et al.May 7, 2020
+36
Q
T
Y
Formalin-fixed, paraffin-embedded (FFPE), biobanked tissue samples offer an invaluable resource for clinical and biomarker research. Here we developed a pressure cycling technology (PCT)-SWATH mass spectrometry workflow to analyze FFPE tissue proteomes and applied it to the stratification of prostate cancer (PCa) and diffuse large B-cell lymphoma (DLBCL) samples. We show that the proteome patterns of FFPE PCa tissue samples and their analogous fresh frozen (FF) counterparts have a high degree of similarity and we confirmed multiple proteins consistently regulated in PCa tissues in an independent sample cohort. We further demonstrate temporal stability of proteome patterns from FFPE samples that were stored between one to 15 years in a biobank and show a high degree of the proteome pattern similarity between two types histological region of small FFPE samples, i.e. punched tissue biopsies and thin tissue sections of micrometer thickness, despite the existence of certain degree of biological variations. Applying the method to two independent DLBCL cohorts we identified myeloperoxidase (MPO), a peroxidase enzyme, as a novel prognostic marker. In summary, this study presents a robust proteomic method to analyze bulk and biopsy FFPE tissues and reports the first systematic comparison of proteome maps generated from FFPE and FF samples. Our data demonstrate the practicality and superiority of FFPE over FF samples for proteome in biomarker discovery. Promising biomarker candidates for PCa and DLBCL have been discovered.
0

DPHL: A pan-human protein mass spectrometry library for robust biomarker discovery using Data-Independent Acquisition and Parallel Reaction Monitoring

Tiansheng Zhu et al.May 7, 2020
+73
Y
Y
T
To answer the increasing need for detecting and validating protein biomarkers in clinical specimens, proteomic techniques are required that support the fast, reproducible and quantitative analysis of large clinical sample cohorts. Targeted mass spectrometry techniques, specifically SRM, PRM and the massively parallel SWATH/DIA technique have emerged as a powerful method for biomarker research. For optimal performance, they require prior knowledge about the fragment ion spectra of targeted peptides. In this report, we describe a mass spectrometric (MS) pipeline and spectral resource to support data-independent acquisition (DIA) and parallel reaction monitoring (PRM) based biomarker studies. To build the spectral resource we integrated common open-source MS computational tools to assemble an open source computational workflow based on Docker. It was then applied to generate a comprehensive DIA pan-human library (DPHL) from 1,096 data dependent acquisition (DDA) MS raw files, and it comprises 242,476 unique peptide sequences from 14,782 protein groups and 10,943 SwissProt-annotated proteins expressed in 16 types of cancer samples. In particular, tissue specimens from patients with prostate cancer, cervical cancer, colorectal cancer, hepatocellular carcinoma, gastric cancer, lung adenocarcinoma, squamous cell lung carcinoma, diseased thyroid, glioblastoma multiforme, sarcoma and diffuse large B-cell lymphoma (DLBCL), as well as plasma samples from a range of hematologic malignancies were collected from multiple clinics in China, the Netherlands and Singapore and included in the resource. This extensive spectral resource was then applied to a prostate cancer cohort of 17 patients, consisting of 8 patients with prostate cancer (PCa) and 9 with benign prostate hyperplasia (BPH), respectively. Data analysis of DIA data from these samples identified differential expressions of FASN, TPP1 and SPON2 in prostate tumors. Thereafter, PRM validation was applied to a larger PCa cohort of 57 patients and the differential expressions of FASN, TPP1 and SPON2 in prostate tumors were validated. As a second application, the DPHL spectral resource was applied to a patient cohort consisting of samples from 19 DLBCL patients and 18 healthy individuals. Differential expressions of CRP, CD44 and SAA1 between DLBCL cases and healthy controls were detected by DIA-MS and confirmed by PRM. These data demonstrate that the DPHL supported that DIA-PRM MS pipeline enables robust protein biomarker discoveries.
0

PulseDIA: in-depth data independent acquisition mass spectrometry using enhanced gas phase fractionation

Xue Cai et al.May 7, 2020
+12
X
W
X
An inherent bottleneck of data independent acquisition (DIA) analysis by Orbitrap-based mass spectrometers is the relatively large window width due to the relatively slow scanning rate compared to TOF. Here we present a novel gas phase separation and MS acquisition method called PulseDIA-MS, which improves the specificity and sensitivity of Orbitrap-based DIA analysis. This is achieved by dividing the ordinary DIA-MS analysis covering the entire mass range into multiple injections for DIA-MS analyses with complementary windows. Using standard HeLa digests, the PulseDIA method identified 69,530 peptide precursors from 9,337 protein groups with ten MS injections of 30 min LC gradient. The PulseDIA scheme containing two complementary windows led to the highest gain of peptide and protein identifications per time unit compared to the conventional 30 min DIA method. We further applied the method to profile the proteome of 18 cholangiocarcinoma (CCA) tissue samples (benign and malignant) from nine patients. PulseDIA identified 7,796 protein groups in these CCA samples, with 14% increase of protein identifications, compared to the conventional DIA method. The missing value for protein matrix dropped by 7% with PulseDIA acquisition. 681 proteins were significantly dysregulated in tumorous CCA samples. Together, we presented and benchmarked an alternative DIA method with higher sensitivity and lower missing rate.
8

DPHL v2: An updated and comprehensive DIA pan-human assay library for quantifying more than 14,000 proteins

Zhangzhi Xue et al.Oct 24, 2023
+32
F
T
Z
Summary A comprehensive pan-human spectral library is critical for biomarker discovery using mass spectrometry (MS)-based proteomics. DPHL v1, a previous pan-human library built from 1096 data-dependent acquisition (DDA) MS data of 16 human tissue types, allows quantifying 10,943 proteins. However, a major limitation of DPHL v1 is the lack of semi-tryptic peptides and protein isoforms, which are abundant in clinical specimens. Here, we generated DPHL v2 from 1608 DDA-MS data acquired using Orbitrap mass spectrometers. The data included 586 DDA-MS newly acquired from 17 tissue types, while 1022 files were derived from DPHL v1. DPHL v2 thus comprises data from 24 sample types, including several cancer types (lung, breast, kidney, and prostate cancer, among others). We generated four variants of DPHL v2 to include semi-tryptic peptides and protein isoforms. DPHL v2 was then applied to a publicly available colorectal cancer dataset with 286 DIA-MS files. The numbers of identified and significantly dysregulated proteins increased by at least 21.7% and 14.2%, respectively, compared with DPHL v1. Our findings show that the increased human proteome coverage of DPHL v2 provides larger pools of potential protein biomarkers.