LY
Liang Yue
Author with expertise in Mass Spectrometry Techniques
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
336
h-index:
18
/
i10-index:
28
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

metaExpertPro: a computational workflow for metaproteomics spectral library construction and data-independent acquisition mass spectrometry data analysis

Yingying Sun et al.Jan 1, 2023
Background: Analysis of mass spectrometry-based metaproteomic data, in particular large-scale data-independent acquisition MS (DIA-MS) data, remains a computational challenge. Here, we aim to develop a software tool for efficiently constructing spectral libraries and analyzing extensive datasets of DIA-based metaproteomics. Results: We present a computational pipeline called metaExpertPro for metaproteomics data analysis. This pipeline encompasses spectral library generation using data-dependent acquisition MS (DDA-MS), protein identification and quantification using DIA-MS, functional and taxonomic annotation, as well as quantitative matrix generation for both microbiota and hosts. To enhance accessibility and ease of use, all modules and dependencies are encapsulated within a Docker container. By integrating FragPipe and DIA-NN, metaExpertPro offers compatibility with both Orbitrap-based and PASEF-based DDA and DIA data. To evaluate the depth and accuracy of identification and quantification, we conducted extensive assessments using human fecal samples and benchmark tests. Performance tests conducted on human fecal samples demonstrated that metaExpertPro quantified an average of 45,000 peptides in a 60-minute diaPASEF injection. Notably, metaExpertPro outperformed three existing software tools by characterizing a higher number of peptides and proteins. Importantly, metaExpertPro maintained a low factual False Discovery Rate (FDR) of less than 5% for protein groups across four benchmark tests. Applying a filter of five peptides per genus, metaExpertPro achieved relatively high accuracy (F-score = 0.67-0.90) in genus diversity and demonstrated a high correlation (rSpearman = 0.73-0.82) between the measured and true genus relative abundance in benchmark tests. Additionally, the quantitative results at the protein, taxonomy, and function levels exhibited high reproducibility and consistency across the commonly adopted public human gut microbial protein databases IGC and UHGP. In a metaproteomic analysis of dyslipidemia patients, metaExpertPro revealed characteristic alterations in microbial functions and potential interactions between the microbiota and the host. Conclusions: metaExpertPro presents a robust one-stop computational solution for constructing metaproteomics spectral libraries, analyzing DIA-MS data, and annotating taxonomic as well as functional data.
0

DPHL: A pan-human protein mass spectrometry library for robust biomarker discovery using Data-Independent Acquisition and Parallel Reaction Monitoring

Tiansheng Zhu et al.Feb 3, 2020
To answer the increasing need for detecting and validating protein biomarkers in clinical specimens, proteomic techniques are required that support the fast, reproducible and quantitative analysis of large clinical sample cohorts. Targeted mass spectrometry techniques, specifically SRM, PRM and the massively parallel SWATH/DIA technique have emerged as a powerful method for biomarker research. For optimal performance, they require prior knowledge about the fragment ion spectra of targeted peptides. In this report, we describe a mass spectrometric (MS) pipeline and spectral resource to support data-independent acquisition (DIA) and parallel reaction monitoring (PRM) based biomarker studies. To build the spectral resource we integrated common open-source MS computational tools to assemble an open source computational workflow based on Docker. It was then applied to generate a comprehensive DIA pan-human library (DPHL) from 1,096 data dependent acquisition (DDA) MS raw files, and it comprises 242,476 unique peptide sequences from 14,782 protein groups and 10,943 SwissProt-annotated proteins expressed in 16 types of cancer samples. In particular, tissue specimens from patients with prostate cancer, cervical cancer, colorectal cancer, hepatocellular carcinoma, gastric cancer, lung adenocarcinoma, squamous cell lung carcinoma, diseased thyroid, glioblastoma multiforme, sarcoma and diffuse large B-cell lymphoma (DLBCL), as well as plasma samples from a range of hematologic malignancies were collected from multiple clinics in China, the Netherlands and Singapore and included in the resource. This extensive spectral resource was then applied to a prostate cancer cohort of 17 patients, consisting of 8 patients with prostate cancer (PCa) and 9 with benign prostate hyperplasia (BPH), respectively. Data analysis of DIA data from these samples identified differential expressions of FASN, TPP1 and SPON2 in prostate tumors. Thereafter, PRM validation was applied to a larger PCa cohort of 57 patients and the differential expressions of FASN, TPP1 and SPON2 in prostate tumors were validated. As a second application, the DPHL spectral resource was applied to a patient cohort consisting of samples from 19 DLBCL patients and 18 healthy individuals. Differential expressions of CRP, CD44 and SAA1 between DLBCL cases and healthy controls were detected by DIA-MS and confirmed by PRM. These data demonstrate that the DPHL supported that DIA-PRM MS pipeline enables robust protein biomarker discoveries.
8

DPHL v2: An updated and comprehensive DIA pan-human assay library for quantifying more than 14,000 proteins

Zhangzhi Xue et al.Jan 8, 2023
Summary A comprehensive pan-human spectral library is critical for biomarker discovery using mass spectrometry (MS)-based proteomics. DPHL v1, a previous pan-human library built from 1096 data-dependent acquisition (DDA) MS data of 16 human tissue types, allows quantifying 10,943 proteins. However, a major limitation of DPHL v1 is the lack of semi-tryptic peptides and protein isoforms, which are abundant in clinical specimens. Here, we generated DPHL v2 from 1608 DDA-MS data acquired using Orbitrap mass spectrometers. The data included 586 DDA-MS newly acquired from 17 tissue types, while 1022 files were derived from DPHL v1. DPHL v2 thus comprises data from 24 sample types, including several cancer types (lung, breast, kidney, and prostate cancer, among others). We generated four variants of DPHL v2 to include semi-tryptic peptides and protein isoforms. DPHL v2 was then applied to a publicly available colorectal cancer dataset with 286 DIA-MS files. The numbers of identified and significantly dysregulated proteins increased by at least 21.7% and 14.2%, respectively, compared with DPHL v1. Our findings show that the increased human proteome coverage of DPHL v2 provides larger pools of potential protein biomarkers.
0

Application of MRI-based tumor heterogeneity analysis for identification and pathologic staging of breast phyllodes tumors

Liang Yue et al.Jan 7, 2025
To explore the application value of MRI-based imaging histology and deep learning model in the identification and classification of breast phyllodes tumors. Seventy-seven patients diagnosed as breast phyllodes tumors and fibroadenomas by pathological examination were retrospectively analyzed, and traditional radiomics features, subregion radiomics features, and deep learning features were extracted from MRI images, respectively. The features were screened and modeled using variance selection method, statistical test, random forest importance ranking method, Spearman correlation analysis, least absolute shrinkage and selection operator (LASSO). The efficacy of each model was assessed using the subject operating characteristic (ROC) curve, The DeLong test was used to assess the differences in the AUC values of the different models, and the clinical benefit of each model was assessed using the decision curve (DCA), and the predictive accuracy of the model was assessed using the calibration curve (CCA). Among the constructed models for classification of breast phyllodes tumors, the fusion model (AUC: 0.97) had the best diagnostic efficacy and highest clinical benefit. The traditional radiomics model (AUC: 0.81) had better diagnostic efficacy compared with subregion radiomics model (AUC: 0.70). De-Long test, there is a statistical difference between the fusion model traditional radiomics model, and subregion radiomics model in the training group. Among the models constructed to distinguish phyllodes tumors from fibroadenomas in the breast, the TDT_CIDL model (AUC: 0.974) had the best predictive efficacy and the highest clinical benefit. De-Long test, the TDT_CI combination model was statistically different from the remaining five models in the training group. Traditional radiomics models, subregion radiomics models and deep learning models based on MRI sequences can help to differentiate benign from junctional phyllodes tumors, phyllodes tumors from fibroadenomas, and provide personalized treatment for patients.