YG
Yu Gao
Author with expertise in Mass Spectrometry Techniques with Proteins
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(67% Open Access)
Cited by:
743
h-index:
16
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

ProLuCID: An improved SEQUEST-like algorithm with enhanced sensitivity and specificity

Tao Xu et al.Jul 11, 2015
ProLuCID, a new algorithm for peptide identification using tandem mass spectrometry and protein sequence databases has been developed. This algorithm uses a three tier scoring scheme. First, a binomial probability is used as a preliminary scoring scheme to select candidate peptides. The binomial probability scores generated by ProLuCID minimize molecular weight bias and are independent of database size. A modified cross-correlation score is calculated for each candidate peptide identified by the binomial probability. This cross-correlation scoring function models the isotopic distributions of fragment ions of candidate peptides which ultimately results in higher sensitivity and specificity than that obtained with the SEQUEST XCorr. Finally, ProLuCID uses the distribution of XCorr values for all of the selected candidate peptides to compute a Z score for the peptide hit with the highest XCorr. The ProLuCID Z score combines the discriminative power of XCorr and DeltaCN, the standard parameters for assessing the quality of the peptide identification using SEQUEST, and displays significant improvement in specificity over ProLuCID XCorr alone. ProLuCID is also able to take advantage of high resolution MS/MS spectra leading to further improvements in specificity when compared to low resolution tandem MS data. A comparison of filtered data searched with SEQUEST and ProLuCID using the same false discovery rate as estimated by a target-decoy database strategy, shows that ProLuCID was able to identify as many as 25% more proteins than SEQUEST. ProLuCID is implemented in Java and can be easily installed on a single computer or a computer cluster. This article is part of a Special Issue entitled: Computational Proteomics.
0

MatrisomeDB: the ECM-protein knowledge database

Xinhao Shao et al.Oct 1, 2019
Abstract The extracellular matrix (ECM) is a complex and dynamic meshwork of cross-linked proteins that supports cell polarization and functions and tissue organization and homeostasis. Over the past few decades, mass-spectrometry-based proteomics has emerged as the method of choice to characterize the composition of the ECM of normal and diseased tissues. Here, we present a new release of MatrisomeDB, a searchable collection of curated proteomic data from 17 studies on the ECM of 15 different normal tissue types, six cancer types (different grades of breast cancers, colorectal cancer, melanoma, and insulinoma) and other diseases including vascular defects and lung and liver fibroses. MatrisomeDB (http://www.pepchem.org/matrisomedb) was built by retrieving raw mass spectrometry data files and reprocessing them using the same search parameters and criteria to allow for a more direct comparison between the different studies. The present release of MatrisomeDB includes 847 human and 791 mouse ECM proteoforms and over 350 000 human and 600 000 mouse ECM-derived peptide-to-spectrum matches. For each query, a hierarchically-clustered tissue distribution map, a peptide coverage map, and a list of post-translational modifications identified, are generated. MatrisomeDB is the most complete collection of ECM proteomic data to date and allows the building of a comprehensive ECM atlas.
0
Citation241
0
Save
6

Automated container-less cell processing method for single-cell proteomics

Cory Matsumoto et al.Jul 27, 2022
Abstract Single-cell genomics and transcriptomics studies enabled us to characterize cell heterogeneity in various tissues, which helped us to better understand the biological system and disease progression. Single-cell proteomics, which directly measures the protein expression level, has the potential to further enhance our knowledge by providing not only a more direct measurement but also crucial information cannot be captured by genomics or transcriptomics study, such as protein activation states and post-translation modification events. One of the main challenges of single-cell proteomics is the large sample loss during sample preparation, which is largely unavoidable using standard proteomics protocols. Protein and peptide loss to the container surface is a well-known phenomenon but often overlooked in larger-scale (>1 µg) proteomics experiments. When it comes to single-cell proteomics with only picograms of protein samples, this loss becomes non-negligible and often dictates the outcomes of the experiment. More importantly, sample processing through multiple pipette tips and containers often introduces random errors, which undermine the ability to detect true heterogenous cellular events. To solve these problems and further improve the throughput and reproducibility of the single-cell proteomics experiments, we developed an automated container-less cell processing platform, utilizing acoustic levitation to process cell samples in the air. Our platform automatically performs cell lysis, protein reduction, alkylation, digestion, and peptide labeling in the air, without any sample transfer step or container. The digested and labeled peptides are then directly injected into the capillary LC-MS/MS system for analysis, eliminating manual steps and conserving most of the sample materials for proteomics analysis. Our initial test shows at least 30% improvement in peptide signals over conventional methods. This process can be performed in parallel to further improve sample processing throughput.
6
Citation14
0
Save
0

High-Throughput Proteomics Enabled by a Fully Automated Dual-Trap and Dual-Column LC-MS

Liang Chen et al.Jun 4, 2024
This Technical Note describes a dual-column liquid chromatography system coupled to mass spectrometry (LC-MS) for high-throughput bottom-up proteomic analysis. This system made full use of two 2-position 10-port valves and a binary pump with an integrated loading pump of a commercial LC instrument to provide successive operation of two parallel subsystems. Each subsystem consisted of a set of trap columns and an analytical column. A T-junction union was used to split the mobile phase from the loading pump into two parts. This allowed one set of columns to be washed and equilibrated, followed by the injection of the next sample, while the previous sample was eluting and being analyzed on the other set of columns, thereby greatly increasing the analysis throughput. This approach showed high reproducibility for the analysis of HeLa tryptic digests with average relative standard deviation (RSD) values of 1.75%, 6.90%, and 5.19% for the identification number of proteins, peptides, and peptide-spectrum matches (PSMs), respectively, across 10 consecutive runs. The capacity for peptide and protein identification, as well as proteome depth, of the dual-column LC system was comparable to a conventional single-column system. Due to its simple equipment requirements and set up process, this method should be highly accessible for other laboratories.
0

Quantitative Analysis of Global Protein Stability Rates in Tissues

Daniel McClatchy et al.Jan 15, 2019
Protein degradation is an essential mechanism for maintaining homeostasis in response to internal and external perturbations. Disruption of this process is implicated in many human diseases, but quantitation of global stability rates has not yet been achieved in tissues. We have developed QUAD (Quantification of Azidohomoalanine Degradation), a technique to quantitate global protein degradation using mass spectrometry. Azidohomoalanine (AHA) is pulsed into mouse tissues through their diet. The mice are then returned to a normal diet and the decrease of AHA abundance can be quantitated in the proteome. QUAD analysis reveals that protein stability varied within tissues, but discernible trends in the data suggest that cellular environment is a major factor dictating stability. Within a tissue, different organelles, post-translation modifications, and protein functions were enriched with different stability patterns. Surprisingly, subunits of the TRIC molecular chaperonin possessed markedly distinct stability trajectories in the brain. Further investigation revealed that these subunits also possessed different subcellular localization and expression patterns that were uniquely altered with age and in Alzheimer disease transgenic mice, indicating a potential non-canonical chaperonin. Finally, QUAD analysis demonstrated that protein stability is enhanced with age in the brain but not in the liver. Overall, QUAD allows the first global quantitation of protein stability rates in tissues, which may lead to new insights and hypotheses in basic and translational research.
0

Matrimeres are systemic nanoscale mediators of tissue integrity and function

Koushik Debnath et al.Mar 29, 2024
Abstract Tissue barriers must be rapidly restored after injury to promote regeneration. However, the mechanism behind this process is unclear, particularly in cases where the underlying extracellular matrix is still compromised. Here, we report the discovery of matrimeres as constitutive nanoscale mediators of tissue integrity and function. We define matrimeres as non-vesicular nanoparticles secreted by cells, distinguished by a primary composition comprising at least one matrix protein and DNA molecules serving as scaffolds. Mesenchymal stromal cells assemble matrimeres from fibronectin and DNA within acidic intracellular compartments. Drawing inspiration from this biological process, we have achieved the successful reconstitution of matrimeres without cells. This was accomplished by using purified matrix proteins, including fibronectin and vitronectin, and DNA molecules under optimal acidic pH conditions, guided by the heparin-binding domain and phosphate backbone, respectively. Plasma fibronectin matrimeres circulate in the blood at homeostasis but exhibit a 10-fold decrease during systemic inflammatory injury in vivo . Exogenous matrimeres rapidly restore vascular integrity by actively reannealing endothelial cells post-injury and remain persistent in the host tissue matrix. The scalable production of matrimeres holds promise as a biologically inspired platform for regenerative nanomedicine.
2

Time-lapsed proteomics reveals a role for the novel protein, SNED1, in modulating ECM composition and protein folding

Fred Lee et al.Jan 14, 2022
The extracellular matrix (ECM) is a complex and dynamic meshwork of proteins providing structural support to cells. It also provides biochemical signals governing cellular processes including proliferation and migration. Alterations of ECM structure and/or composition has been shown to lead to, or accompany, many pathological processes including cancer and fibrosis. To understand how the ECM contributes to diseases, we first need to obtain a comprehensive characterization of the ECM of tissues and of its changes during disease progression. Over the past decade, mass-spectrometry-based proteomics has become the state-of-the-art method to profile the protein composition of ECMs. However, existing methods do not fully capture the broad dynamic range of protein abundance in the ECM, nor do they permit to achieve the high coverage needed to gain finer biochemical information, including the presence of isoforms or post-translational modifications. In addition, broadly adopted proteomic methods relying on extended trypsin digestion do not provide structural information on ECM proteins, yet, gaining insights into ECM protein structure is critical to better understanding protein functions. Here, we present the optimization of a time-lapsed proteomic method using limited proteolysis of partially denatured samples and the sequential release of peptides to achieve superior sequence coverage as compared to standard ECM proteomic workflow. Exploiting the spatio-temporal resolution of this method, we further demonstrate how 3-dimensional time-lapsed peptide mapping can identify protein regions differentially susceptible to trypsin and can thus identify sites of post-translational modifications, including protein-protein interactions. We further illustrate how this approach can be leveraged to gain insight on the role of the novel ECM protein SNED1 in ECM homeostasis. We found that the expression of SNED1 expression by mouse embryonic fibroblasts results in the alteration of overall ECM composition and the sequence coverage of certain ECM proteins, raising the possibility that SNED1 could modify accessibility to trypsin by engaging in protein-protein interactions.