RS
Rui Sun
Author with expertise in Mass Spectrometry Techniques
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
9
(44% Open Access)
Cited by:
3
h-index:
47
/
i10-index:
199
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Accelerated Protein Biomarker Discovery from FFPE tissue samples using Single-shot, Short Gradient Microflow SWATH MS

Rui Sun et al.Jun 20, 2019
+14
C
S
R
ABSTRACT We report and evaluated a microflow, single-shot, short gradient SWATH MS method intended to accelerate the discovery and verification of protein biomarkers in clinical specimens. The method uses 15-min gradient microflow-LC peptide separation, an optimized SWATH MS window configuration and OpenSWATH software for data analysis. We applied the method to a cohort 204 of FFPE prostate tissue samples from 58 prostate cancer patients and 10 prostatic hyperplasia patients. Altogether we identified 27,976 proteotypic peptides and 4,043 SwissProt proteins from these 204 samples. Compared to a reference SWATH method with 2-hour gradient the accelerated method consumed only 27% instrument time, quantified 80% proteins and showed reduced batch effects. 3,800 proteins were quantified by both methods in two different instruments with relatively high consistency (r = 0.77). 75 proteins detected by the accelerated method with differential abundance between clinical groups were selected for further validation. A shortlist of 134 selected peptide precursors from the 75 proteins were analyzed using MRM-HR, exhibiting high quantitative consistency with the 15-min SWATH method (r = 0.89) in the same sample set. We further verified the capacity of these 75 proteins in separating benign and malignant tissues (AUC = 0.99) in an independent prostate cancer cohort (n=154). Overall our data show that the single-shot short gradient microflow-LC SWATH MS method achieved about 4-fold acceleration of data acquisition with reduced batch effect and a moderate level of protein attrition compared to a standard SWATH acquisition method. Finally, the results showed comparable ability to separate clinical groups.
0

PulseDIA: in-depth data independent acquisition mass spectrometry using enhanced gas phase fractionation

Xue Cai et al.Sep 30, 2019
+12
C
J
X
An inherent bottleneck of data independent acquisition (DIA) analysis by Orbitrap-based mass spectrometers is the relatively large window width due to the relatively slow scanning rate compared to TOF. Here we present a novel gas phase separation and MS acquisition method called PulseDIA-MS, which improves the specificity and sensitivity of Orbitrap-based DIA analysis. This is achieved by dividing the ordinary DIA-MS analysis covering the entire mass range into multiple injections for DIA-MS analyses with complementary windows. Using standard HeLa digests, the PulseDIA method identified 69,530 peptide precursors from 9,337 protein groups with ten MS injections of 30 min LC gradient. The PulseDIA scheme containing two complementary windows led to the highest gain of peptide and protein identifications per time unit compared to the conventional 30 min DIA method. We further applied the method to profile the proteome of 18 cholangiocarcinoma (CCA) tissue samples (benign and malignant) from nine patients. PulseDIA identified 7,796 protein groups in these CCA samples, with 14% increase of protein identifications, compared to the conventional DIA method. The missing value for protein matrix dropped by 7% with PulseDIA acquisition. 681 proteins were significantly dysregulated in tumorous CCA samples. Together, we presented and benchmarked an alternative DIA method with higher sensitivity and lower missing rate.
4

Proteomic-based stratification of intermediate-risk prostate cancer patients

Qing Zhong et al.Mar 3, 2023
+28
M
A
Q
ABSTRACT Gleason grading is an important prognostic indicator for prostate adenocarcinoma and is crucial for patient treatment decisions. However, intermediate-risk patients diagnosed in Gleason Grade Groups (GG) 2 and GG3 can harbour either aggressive or non-aggressive disease, resulting in under- or over-treatment of a significant number of patients. Here, we performed proteomic, differential expression, machine learning, and survival analyses for 1,348 matched tumour and benign sample runs from 278 patients. Three proteins (F5, TMEM126B and EARS2) were identified as candidate biomarkers in patients with biochemical recurrence. Multivariate Cox regression yielded 18 proteins, from which a risk score was constructed to dichotomise prostate cancer patients into low- and high-risk groups. This 18-protein signature is prognostic for the risk of biochemical recurrence and completely independent of the intermediate GG. Our results suggest that markers generated by computational proteomic profiling have the potential for clinical applications including integration into prostate cancer management.
0

High-throughput proteomic analysis of FFPE tissue samples facilitates tumor stratification

Yi Zhu et al.Jun 11, 2019
+38
B
R
Y
Formalin-fixed, paraffin-embedded (FFPE), biobanked tissue samples offer an invaluable resource for clinical and biomarker research. Here we developed a pressure cycling technology (PCT)-SWATH mass spectrometry workflow to analyze FFPE tissue proteomes and applied it to the stratification of prostate cancer (PCa) and diffuse large B-cell lymphoma (DLBCL) samples. We show that the proteome patterns of FFPE PCa tissue samples and their analogous fresh frozen (FF) counterparts have a high degree of similarity and we confirmed multiple proteins consistently regulated in PCa tissues in an independent sample cohort. We further demonstrate temporal stability of proteome patterns from FFPE samples that were stored between one to 15 years in a biobank and show a high degree of the proteome pattern similarity between two types histological region of small FFPE samples, i.e. punched tissue biopsies and thin tissue sections of micrometer thickness, despite the existence of certain degree of biological variations. Applying the method to two independent DLBCL cohorts we identified myeloperoxidase (MPO), a peroxidase enzyme, as a novel prognostic marker. In summary, this study presents a robust proteomic method to analyze bulk and biopsy FFPE tissues and reports the first systematic comparison of proteome maps generated from FFPE and FF samples. Our data demonstrate the practicality and superiority of FFPE over FF samples for proteome in biomarker discovery. Promising biomarker candidates for PCa and DLBCL have been discovered.
0

DPHL: A pan-human protein mass spectrometry library for robust biomarker discovery using Data-Independent Acquisition and Parallel Reaction Monitoring

Tiansheng Zhu et al.Feb 3, 2020
+81
Y
R
T
To answer the increasing need for detecting and validating protein biomarkers in clinical specimens, proteomic techniques are required that support the fast, reproducible and quantitative analysis of large clinical sample cohorts. Targeted mass spectrometry techniques, specifically SRM, PRM and the massively parallel SWATH/DIA technique have emerged as a powerful method for biomarker research. For optimal performance, they require prior knowledge about the fragment ion spectra of targeted peptides. In this report, we describe a mass spectrometric (MS) pipeline and spectral resource to support data-independent acquisition (DIA) and parallel reaction monitoring (PRM) based biomarker studies. To build the spectral resource we integrated common open-source MS computational tools to assemble an open source computational workflow based on Docker. It was then applied to generate a comprehensive DIA pan-human library (DPHL) from 1,096 data dependent acquisition (DDA) MS raw files, and it comprises 242,476 unique peptide sequences from 14,782 protein groups and 10,943 SwissProt-annotated proteins expressed in 16 types of cancer samples. In particular, tissue specimens from patients with prostate cancer, cervical cancer, colorectal cancer, hepatocellular carcinoma, gastric cancer, lung adenocarcinoma, squamous cell lung carcinoma, diseased thyroid, glioblastoma multiforme, sarcoma and diffuse large B-cell lymphoma (DLBCL), as well as plasma samples from a range of hematologic malignancies were collected from multiple clinics in China, the Netherlands and Singapore and included in the resource. This extensive spectral resource was then applied to a prostate cancer cohort of 17 patients, consisting of 8 patients with prostate cancer (PCa) and 9 with benign prostate hyperplasia (BPH), respectively. Data analysis of DIA data from these samples identified differential expressions of FASN, TPP1 and SPON2 in prostate tumors. Thereafter, PRM validation was applied to a larger PCa cohort of 57 patients and the differential expressions of FASN, TPP1 and SPON2 in prostate tumors were validated. As a second application, the DPHL spectral resource was applied to a patient cohort consisting of samples from 19 DLBCL patients and 18 healthy individuals. Differential expressions of CRP, CD44 and SAA1 between DLBCL cases and healthy controls were detected by DIA-MS and confirmed by PRM. These data demonstrate that the DPHL supported that DIA-PRM MS pipeline enables robust protein biomarker discoveries.
0

Proteogenomic heterogeneity of localized human prostate cancer progression

Konstantina Charmpi et al.Feb 16, 2020
+27
Q
T
K
Tumor-specific genomic aberrations are routinely determined by high throughput genomic measurements. However, it is unclear how complex genome alterations affect molecular networks through changing protein levels, and consequently biochemical states of tumor tissues. Here, we investigated how tumor heterogeneity evolves during prostate cancer progression. In this study, we performed proteogenomic analyses of 105 prostate samples, consisting of both benign prostatic hyperplasia regions and malignant tumors, from 39 prostate cancer (PCa) patients. Exome sequencing, copy number analysis, RNA sequencing and quantitative proteomic data were integrated using a network-based approach and related to clinical and histopathological features. In general, the number and magnitude of alterations (DNA, RNA and protein) correlated with histopathological tumor grades. Although common sets of proteins were affected in high-grade tumors, the extent to which these proteins changed their concentrations varied considerably across tumors. Our multi-layer network integration identified a sub-network consisting of nine genes whose activity positively correlated with increasingly aggressive tumor phenotypes. Importantly, although the effects on individual gene members were barely detectable, together the perturbation of this sub-network was predictive for recurrence-free survival time. The multi-omics profiling of multiple tumor sites from the same patients revealed cases of likely shared clonal origins as well as the occasional co-existence of multiple clonally independent tumors in the same prostate. Overall, this study revealed molecular networks with remarkably convergent alterations across tumor sites and patients, but it also exposed a diversity of network effects: we could not identify a single sub-network that was perturbed in all high-grade tumor regions.
0

Optimization of Spectral Library Size Improves DIA-MS Proteome Coverage

Weigang Ge et al.Nov 25, 2020
+26
R
N
W
Abstract Efficient peptide and protein identification from data-independent acquisition mass spectrometric (DIA-MS) data typically rely on an experiment-specific spectral library with a suitable size. Here, we report a computational strategy for optimizing the spectral library for a specific DIA dataset based on a comprehensive spectral library, which is accomplished by a priori analysis of the DIA dataset. This strategy achieved up to 44.7% increase in peptide identification and 38.1% increase in protein identification in the test dataset of six colorectal tumor samples compared with the comprehensive pan-human library strategy. We further applied this strategy to 389 carcinoma samples from 15 tumor datasets and observed up to 39.2% increase in peptide identification and 19.0% increase in protein identification. In summary, we present a computational strategy for spectral library size optimization to achieve deeper proteome coverage of DIA-MS data.
0

GeoAB: Towards Realistic Antibody Design and Reliable Affinity Maturation

Haitao Lin et al.May 17, 2024
+6
R
L
H
Abstract Increasing works for antibody design are emerging to generate sequences and structures in Complementarity Determining Regions (CDRs), but problems still exist. We focus on two of them: (i) authenticity of the generated structure and (ii) rationality of the affinity maturation , and propose G EO AB as a solution. In specific, GeoABDesigner generates CDR structures with realistic internal geometries, composed of a generative geometry initializer (Geo-Initializer) and a position refiner (Geo-Refiner); GeoAB-Optimizer achieves affinity maturation by accurately predicting both the mutation effects and structures of mutant antibodies with the same network architecture as Geo-Refiner. Experiments show that G EO AB achieves state-of-the-art performance in CDR co-design and mutation effect predictions, and fulfills the discussed tasks effectively.
0

BatchServer: a web server for batch effect evaluation, visualization and correction

Tiansheng Zhu et al.Mar 25, 2020
+5
F
R
T
Background: Batch effects are unwanted data variations that may obscure biological signals, lead-ing to bias or errors in subsequent data analyses. Effective evaluation and elimination of batch effects is thus necessary for omics data analysis, especially in the context of large cohort of thousands of samples with different experimental platforms. Existing batch effect reducing tools mainly focus on the development of algorithms, while requiring programming skills and the knowledge of data distribution limits their application for many researchers. In order to facilitate evaluation and correction of batch effects, we provided an user-friendly and easy-to-use graphical batch effects analysis web platform. Results: We developed an open-source R/Shiny based web server -- BatchServer that allows users to graphical interactively evaluate, visualize and correct of the batch effects in high-throughput data sets. BatchServer including a modified ComBat, which was a popular batch effect adjustment tool to correct batch effects, PVCA (Principal Variance Component Analysis) and UMAP (Manifold Approximation and Projection) to evaluate and visualize batch effects. BatchServer is an efficient batch effects processing platform, as its application in three publicly available data sets. Conclusion: Our user-friendly online open-source web server BatchServer supports comprehensive batch effects analysis facilitating the batch effect evaluations and corrections for biologists. Batch-Server is deployed at https://lifeinfor.shinyapps.io/batchserver/ as a web server. The source codes are freely available at https://github.com/zhutiansheng/batch_server.