NJ
Niek Jonge
Author with expertise in Advances in Metabolomics Research
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
4
(100% Open Access)
Cited by:
11
h-index:
4
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
116

FERMO: a Dashboard for Streamlined Rationalized Prioritization of Molecular Features from Mass Spectrometry Data

Mitja Zdouc et al.Dec 22, 2022
ABSTRACT Small molecules can selectively modulate biological processes and thus generate phenotypic variation. Biological samples are complex matrices, and liquid chromatography tandem mass spectrometry often detects hundreds of molecules, of which only a fraction may be associated with this variation. The challenge therefore lies in the prioritization of the most relevant molecules for further investigation. Tools are needed to effectively contextualize mass spectrometric data with phenotypical and environmental (meta)data. To accelerate this task, we developed FERMO, a dashboard application combining mass spectrometry data with qualitative and quantitative biological observations. FERMO’s centralized interface enables users to rapidly inspect data, formulate hypotheses, and prioritize molecules of interest. We demonstrate the applicability of FERMO in a case study on antibiotic activity of bacterial extracts, where we successfully prioritized the bioactive molecule siomycin out of 143 molecular features. We expect that besides natural product discovery, FERMO will find application in a wide range of omics-driven fields.
116
Citation3
0
Save
0

Reproducible MS/MS library cleaning pipeline in matchms

Niek Jonge et al.Jul 29, 2024
Abstract Mass spectral libraries have proven to be essential for mass spectrum annotation, both for library matching and training new machine learning algorithms. A key step in training machine learning models is the availability of high-quality training data. Public libraries of mass spectrometry data that are open to user submission often suffer from limited metadata curation and harmonization. The resulting variability in data quality makes training of machine learning models challenging. Here we present a library cleaning pipeline designed for cleaning tandem mass spectrometry library data. The pipeline is designed with ease of use, flexibility, and reproducibility as leading principles. Scientific contribution This pipeline will result in cleaner public mass spectral libraries that will improve library searching and the quality of machine-learning training datasets in mass spectrometry. This pipeline builds on previous work by adding new functionality for curating and correcting annotated libraries, by validating structure annotations. Due to the high quality of our software, the reproducibility, and improved logging, we think our new pipeline has the potential to become the standard in the field for cleaning tandem mass spectrometry libraries. Graphical Abstract
0
Paper
Citation1
0
Save
0

Reliable cross-ion mode chemical similarity prediction between MS2 spectra

Niek Jonge et al.Mar 29, 2024
Abstract Mass spectrometry is commonly used to characterize metabolites in untargeted metabolomics. This can be done in positive and negative ionization mode, a choice typically guided by the fraction of metabolites a researcher is interested in. During analysis, mass spectral comparisons are widely used to enable annotation through reference libraries and to facilitate data organization through networking. However, until now, such comparisons between mass spectra were restricted to mass spectra of the same ionization mode, as the two modes generally result in very distinct fragmentation spectra. To overcome this barrier, here, we have implemented a machine learning model that can predict chemical similarity between spectra of different ionization modes. Hence, our new MS2DeepScore 2.0 model facilitates the seamless integration of positive and negative ionization mode mass spectra into one analysis pipeline. This creates entirely new options for data exploration, such as mass spectral library searching of negative ion mode spectra in positive ion mode libraries or cross-ionization mode molecular networking. Furthermore, to improve the reliability of predictions and better cope with unseen data, we have implemented a method to estimate the quality of prediction. This will help to avoid false predictions on spectra with low information content or spectra that substantially differ from the training data. We anticipate that the MS2DeepScore 2.0 model will extend our current capabilities in organizing and annotating untargeted metabolomics profiles.