RS
Ray Sajulga
Author with expertise in Mass Spectrometry Techniques with Proteins
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
5
(20% Open Access)
Cited by:
0
h-index:
8
/
i10-index:
8
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Survey of metaproteomics software tools for functional microbiome analysis

Ray Sajulga et al.Jan 8, 2020
+14
M
C
R
To gain a thorough appreciation of microbiome dynamics, researchers characterize the functional role of expressed microbial genes/proteins. This can be accomplished through metaproteomics, which characterizes the protein complement of the microbiome. Several software tools exist for analyzing microbiomes at the functional level by measuring their combined proteome-level response to environmental perturbations. In this survey, we explore the performance of six available tools, so that researchers can make informed decisions regarding software choice based on their research goals.Tandem mass spectrometry-based proteomic data obtained from dental carie plaque samples grown with and without sucrose in paired biofilm reactors were used as representative data for this evaluation. Microbial peptides from one sample pair were identified by the X! Tandem search algorithm via SearchGUI and subjected to functional analysis using software tools including eggNOG-mapper, MEGAN6, MetaGOmics, MetaProteomeAnalyzer (MPA), ProPHAnE, and Unipept to generate functional annotation through Gene Ontology (GO) terms.Among these software tools, notable differences in functional annotation were detected after comparing differentially expressed protein functional groups. Based on the generated GO terms of these tools we performed a peptide-level comparison to evaluate the quality of their functional annotations. A BLAST analysis against the Universal Protein Knowledgebase revealed that the sensitivity and specificity of functional annotation differed between tools. For example, eggNOG-mapper mapped to the most number of GO terms, while Unipept generated the most precise GO terms. Based on our evaluation, metaproteomics researchers can choose the software according to their analytical needs and developers can use the resulting feedback to further optimize their algorithms. To make more of these tools accessible via scalable metaproteomics workflows, eggNOG-mapper and Unipept 4.0 were incorporated into the Galaxy platform.
0

A sectioning and database enrichment approach for improved peptide spectrum matching in large, genome-guided protein sequence databases

Praveen Kumar et al.Nov 15, 2019
+6
C
J
P
Multi-omics approaches focused on mass-spectrometry (MS)-based data, such as metaproteomics, utilize genomic and/or transcriptomic sequencing data to generate a comprehensive protein sequence database. These databases can be very large, containing millions of sequences, which reduces the sensitivity of matching tandem mass spectrometry (MS/MS) data to sequences to generate peptide spectrum matches (PSMs). Here, we describe a sectioning method for generating an enriched database for those protein sequences that are most likely present in the sample. Our evaluation demonstrates how this method helps to increase the sensitivity of PSMs while maintaining acceptable false discovery rate statistics. We demonstrate increased true positive PSM identifications using the sectioning method when compared to the traditional large database searching method, whereas it helped in reducing the false PSM identifications when compared to a previously described two-step method for reducing database size. The sectioning method for large sequence databases enables generation of an enriched protein sequence database and promotes increased sensitivity in identifying PSMs, while maintaining acceptable and manageable FDR. Furthermore, implementation in the Galaxy platform provides access to a usable and automated workflow for carrying out the method. Our results show the utility of this methodology for a wide-range of applications where genome-guided, large sequence databases are required for MS-based proteomics data analysis.
0

Precursor intensity-based label-free quantification software tools for proteomic and multi-omic analysis within the Galaxy Platform.

Subina Mehta et al.Apr 2, 2020
+12
R
C
S
For mass spectrometry-based peptide and protein quantification, label-free quantification (LFQ) based on precursor mass peak (MS1) intensities is considered reliable due to its dynamic range, reproducibility, and accuracy. In LFQ workflows, protein abundance changes are inferred from peptide-level information, including microbial peptides (for metaproteomics) and peptides carrying post-translational modifications (for proteomics) and/or variant sequences (for proteogenomics). Multi-omics studies (such as proteogenomics and metaproteomics) rely on peptide detection and quantification to identify and quantify peptides that map to unique proteoforms and metaproteins. The Galaxy for proteomics (Galaxy-P) platform has proven useful for the development of accessible workflows to identify proteins in these complex multi-omic studies. However, proteomics workflows within the Galaxy platform have lacked well-tested label-free quantification tools. In this study, our main goals were to evaluate two recently published open-source LFQ tools and to implement them within the Galaxy platform, enabling their easy integration with established workflows. These two tools, moFF and FlashLFQ, were selected based on their described peptide quantification capabilities and amenability to Galaxy implementation. Through rigorous testing and communication with the tool developers, we gained insights into the software features necessary for maximizing the performance of each tool. Software features evaluated included: a) match-between-runs (MBR); b) using both Thermo .raw and HUPO standards .mzML file formats as input for improved quantification; c) use of containers and/or conda packages; d) parameters needed for analyzing large input datasets; and e) compatibility with a variety of mass spectrometry peaklist file formats , leading to optimized and validated software performance. This work 1) establishes a process for software implementation, optimization and validation within Galaxy; and 2) makes powerful new tools for LFQ available which should prove highly useful for a variety of proteomics and multi-omics applications employing the Galaxy platform.
0

A Tool for the Assessment of HLA-DQ Heterodimer Variation in Hematopoietic Cell Transplantation

Ray Sajulga et al.Aug 1, 2024
E
M
Y
R
When optimizing transplants, clinical decision-makers consider HLA-A, -B, -C, -DRB1 (8 matched alleles out of 8), and sometimes HLA-DQB1 (10 out of 10) matching between the patient and donor. HLA-DQ is a heterodimer formed by the β chain product of HLA-DQB1 and an α chain product of HLA-DQA1. In addition to molecules defined by the parentally-inherited cis haplotypes, α-β trans-dimerization is possible between certain alleles, leading to unique molecules and a potential source of mismatched molecules. Recently, researchers uncovered that clinical outcome after HLA-DQB1-mismatched unrelated donor HCT depends on the total number of HLA-DQ molecule mismatches and the specific α-β heterodimer mismatch.
0

Multi-omics Visualization Platform: An extensible Galaxy plug-in for multi-omics data visualization and exploration

Thomas McGowan et al.Nov 15, 2019
+4
P
J
T
Background Proteogenomics integrates genomics, transcriptomics and mass spectrometry (MS)-based proteomics data to identify novel protein sequences arising from gene and transcript sequence variants. Proteogenomic data analysis requires integration of disparate ‘omic software tools, as well as customized tools to view and interpret results. The flexible Galaxy platform has proven valuable for proteogenomic data analysis. Here, we describe a novel Multi-omics Visualization Platform (MVP) for organizing, visualizing and exploring proteogenomic results, adding a critically needed tool for data exploration and interpretation.Findings MVP is built as an HTML Galaxy plugin, primarily based on JavaScript. Via the Galaxy API, MVP uses SQLite databases as input -- a custom datatype (mzSQLite) containing MS-based peptide identification information, a variant annotation table, and a coding sequence table. Users can interactively filter identified peptides based on sequence and data quality metrics, view annotated peptide MS data, and visualize protein-level information, along with genomic coordinates. Peptides that pass the user-defined thresholds can be sent back to Galaxy via the API for further analysis; processed data and visualizations can also be saved and shared. MVP leverages the Integrated Genomics Viewer JavaScript (IGVjs) framework, enabling interactive visualization of peptides and corresponding transcript and genomic coding information within the MVP interface.Conclusions MVP provides a powerful, extensible platform for automated, interactive visualization of proteogenomic results within the Galaxy environment, adding a unique and critically needed tool for empowering exploration and interpretation of results. The platform is extensible, providing a basis for further development of new functionalities for proteogenomic data visualization.