AK
Anna Kopeykina
Author with expertise in Advances in Metabolomics Research
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(67% Open Access)
Cited by:
4
h-index:
2
/
i10-index:
0
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Reanalysis of Orbitrap Astral DIA data demonstrates the capabilities of MS/MS-free proteomics to reveal new biological insights in disease-related samples

Mark Ivanov et al.Apr 1, 2024
Abstract Data-independent acquisition (DIA) became a method of choice for quantitative proteomics. With the advent of the combination of Orbitrap FTMS and asymmetric track lossless analyzer Astral these DIA capabilities were further extended with the recent demonstration of quantitative proteomic sample analyses at the speed of up to hundreds of samples per day. In particular, the dataset containing brain samples related to the multiple system atrophy was acquired using 7 and 28 min chromatography gradients and the Orbitrap Astral mass spectrometer (Guzman et al., Nat. Biotech.2024). In this work, we reanalysed the Orbitrap Astral DIA data using MS1 spectra without applying to fragmentation information using the recently introduced DirectMS1 approach. The results were compared with previous study of the same sample cohort by traditional long gradient DDA analysis. While the quantitation efficiency of DirectMS1 was comparable, we found additional five proteins of biological significance relevant to the analyzed tissue samples. Among the findings, DirectMS1 was able to detect decreased caspase activity for Vimentin protein in the multiple system atrophy samples which was barely observed from MS/MS-based methods. Our study suggests that DirectMS1 can be an efficient MS1-only addition to the analysis of DIA data in quantitative proteomic studies.
0
Citation2
0
Save
0

A modified decision tree improves generalization across multiple brains proteomic data sets and reveals the role of ferroptosis in Alzheimer’s disease

Mark Ivanov et al.Aug 7, 2024
Abstract Low generalization to the patient cohort and variety of experimental conditions in the proteomic search for disease biomarkers are among the main reasons for the bumpy road of quantitative proteomics from discovery stage to clinical validation. Only a small fraction of biomarkers discovered so far by proteomic analysis reaches clinical trials. Here, we presented a machine learning-based workflow for proteomics data analysis, which partially solves some of these issues. In particular, we used a customized decision tree model, which was regulated using a newly introduced parameter, min_cohorts_leaf, that resulted in better generalization of trained models. Further, we analyzed the trend of feature importance’s curve as a function of min_cohorts_leaf parameter and found that it could be used for accurate feature selection to obtain a list of proteins with significantly improved generalization. Finally, we demonstrated that the recently introduced DirectMS1 search algorithm for protein identification and quantitation provides a simple, yet, a highly efficient solution for the problem of combining multiple data sets obtained using different experimental settings. The developed workflow was tested using five published LC-MS/MS data sets obtained in the large consortia studies of Alzheimer’s disease brain samples. The selected data sets consist of 535 files in total analyzed using label-free single-shot data-dependent or data-independent acquisitions. Using the proposed modified ExtraTrees model we found that the expressions of two proteins involved in ferroptosis Serotransferrin TRFE and DNA repair nuclease/redox regulator APEX1, are important for explaining a lack of dementia for patients with the presence of neuritic plaques and neurofibrillary tangles.