SF
Song Feng
Author with expertise in Analysis of Gene Interaction Networks
Pacific Northwest National Laboratory, Icahn School of Medicine at Mount Sinai, Nankai University
+ 8 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(100% Open Access)
Cited by:
58
h-index:
13
/
i10-index:
15
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
2

Hypergraph models of biological networks to identify genes critical to pathogenic viral response

Song Feng et al.Apr 15, 2024
+25
B
E
S
Abstract Background Representing biological networks as graphs is a powerful approach to reveal underlying patterns, signatures, and critical components from high-throughput biomolecular data. However, graphs do not natively capture the multi-way relationships present among genes and proteins in biological systems. Hypergraphs are generalizations of graphs that naturally model multi-way relationships and have shown promise in modeling systems such as protein complexes and metabolic reactions. In this paper we seek to understand how hypergraphs can more faithfully identify, and potentially predict, important genes based on complex relationships inferred from genomic expression data sets. Results We compiled a novel data set of transcriptional host response to pathogenic viral infections and formulated relationships between genes as a hypergraph where hyperedges represent significantly perturbed genes, and vertices represent individual biological samples with specific experimental conditions. We find that hypergraph betweenness centrality is a superior method for identification of genes important to viral response when compared with graph centrality. Conclusions Our results demonstrate the utility of using hypergraphs to represent complex biological systems and highlight central important responses in common to a variety of highly pathogenic viruses.
2
Citation47
1
Save
5

BayesDeBulk: A Flexible Bayesian Algorithm for the Deconvolution of Bulk Tumor Data

Francesca Petralia et al.Oct 24, 2023
+9
A
A
F
Abstract To understand immune activation and evasion mechanisms in cancer, one crucial step is to characterize the composition of immune and stromal cells in the tumor microenvironment (TME). Deconvolution analysis based on bulk transcriptomic data has been used to estimate cell composition in TME. However, these algorithms are sub-optimal for proteomic data, which has hindered research in the rapidly growing field of proteogenomics. Moreover, with the increasing prevalence of multi-omics studies, there is an opportunity to enhance deconvolution analysis by utilizing paired proteomic and transcriptomic profiles of the same tissue samples. To bridge these gaps, we propose BayesDeBulk, a new method for estimating the immune/stromal cell composition based on bulk proteomic and gene expression data. BayesDeBulk utilizes the information of known cell-type-specific markers without requiring their absolute abundance levels as prior knowledge. We compared BayesDeBulk with existing tools on synthetic and real data examples, demonstrating its superior performance and versatility. Availability Software available at http://www.BayesDeBulk.com/ Contact For any information, please contact francesca.petralia@mssm.edu
5
Citation9
0
Save
8

Robust, sensitive, and quantitative single-cell proteomics based on ion mobility filtering

Jongmin Woo et al.Oct 24, 2023
+9
S
G
J
Abstract Unbiased single-cell proteomics (scProteomics) promises to advance our understanding of cell functions within complex biological systems. However, a major challenge for current methods is their ability to identify and provide accurate quantitative information for low abundance proteins. Herein, we describe an ion mobility-enhanced mass spectrometry acquisition and peptide identification method, TIFF (Transferring Identification based on FAIMS Filtering), designed to improve the sensitivity and accuracy of label-free scProteomics. TIFF significantly extends the ion accumulation times for peptide ions by filtering out singly charged background ions. The peptide identities are then assigned by a 3-dimensional MS1 feature matching approach (retention time, accurate mass, and FAIMS compensation voltage). The TIFF method enabled unbiased proteome analysis to a depth of >1,700 proteins in single HeLa cells with >1,100 proteins consistently quantified. As a demonstration, we applied the TIFF method to obtain temporal proteome profiles of >150 single murine macrophage cells during a lipopolysaccharide stimulation experiment and identified time-dependent proteome profiles.
8
Citation2
0
Save
4

Decomprolute: A benchmarking platform designed for multiomics-based tumor deconvolution

Song Feng et al.Oct 24, 2023
+4
P
A
S
Tumor deconvolution is a reliable way to disentangle the diverse cell types that comprise solid tumors. To date, however, both the algorithms developed to deconvolve tumor samples, and the gold standard datasets used to assess the algorithms are geared toward the analysis of gene expression (e.g., RNA-seq) rather than protein levels in tumor cells. While gene expression is less expensive to measure, protein levels provide a more accurate view of immune markers. To facilitate the development as well as improve the reproducibility and reusability of multi-omic deconvolution algorithms, we introduce Decomprolute, a Common Workflow Language framework that leverages containerization to compare tumor deconvolution algorithms across multiomic data sets. Decomprolute incorporates the large-scale multiomic data sets produced by the Clinical Proteomic Tumor Analysis Consortium (CPTAC), which include matched mRNA expression and proteomic data from thousands of tumors across multiple cancer types to build a fully open-source, containerized proteogenomic tumor deconvolution benchmarking platform. The platform consists of modular architecture and it comes with well-defined input and output formats at each module. As a result, it is robust and extendable easily with additional algorithms or analyses. The platform is available for access and use at http://pnnl-compbio.github.io/decomprolute . Motivation To provide a comprehensive platform for algorithm developers and researchers to benchmark and run tumor deconvolution algorithms on multiomic data.
0

Signal integration and integral feedback control with biochemical reaction networks

Steven Andrews et al.May 28, 2024
+3
L
M
S
Biochemical reaction networks perform a variety of signal processing functions, one of which is computing the integrals of signal values. This is often used in integral feedback control, where it enables a system's output to respond to changing inputs, but to then return exactly back to some pre-determined setpoint value afterward. To gain a deeper understanding of how biochemical networks are able to both integrate signals and perform integral feedback control, we investigated these abilities for several simple reaction networks. We found imperfect overlap between these categories, with some networks able to perform both tasks, some able to perform integration but not integral feedback control, and some the other way around. Nevertheless, networks that could either integrate or perform integral feedback control shared key elements. In particular, they included a chemical species that was neutrally stable in the open loop system (no feedback), meaning that this species does not have a unique stable steady-state concentration. Neutral stability could arise from zeroth order decay reactions, binding to a partner that was produced at a constant rate (which occurs in antithetic control), or through a long chain of covalent cycles. Mathematically, it arose from rate equations for the reaction network that were underdetermined when evaluated at steady-state.
1

A Phosphoproteomics Data Resource for Systems-level Modeling of Kinase Signaling Networks

Song Feng et al.Oct 24, 2023
+7
T
J
S
Abstract Building mechanistic models of kinase-driven signaling pathways requires quantitative measurements of protein phosphorylation across physiologically relevant conditions, but this is rarely done because of the insensitivity of traditional technologies. By using a multiplexed deep phosphoproteome profiling workflow, we were able to generate a deep phosphoproteomics dataset of the EGFR-MAPK pathway in non-transformed MCF10A cells across physiological ligand concentrations with a time resolution of <12 min and in the presence and absence of multiple kinase inhibitors. An improved phosphosite mapping technique allowed us to reliably identify >46,000 phosphorylation sites on >6600 proteins, of which >4500 sites from 2110 proteins displayed a >2-fold increase in phosphorylation in response to EGF. This data was then placed into a cellular context by linking it to 15 previously published protein databases. We found that our results were consistent with much, but not all previously reported data regarding the activation and negative feedback phosphorylation of core EGFR-ERK pathway proteins. We also found that EGFR signaling is biphasic with substrates downstream of RAS/MAPK activation showing a maximum response at <3ng/ml EGF while direct substrates, such as HGS and STAT5B, showing no saturation. We found that RAS activation is mediated by at least 3 parallel pathways, two of which depend on PTPN11. There appears to be an approximately 4-minute delay in pathway activation at the step between RAS and RAF, but subsequent pathway phosphorylation was extremely rapid. Approximately 80 proteins showed a >2-fold increase in phosphorylation across all experiments and these proteins had a significantly higher median number of phosphorylation sites (~18) relative to total cellular phosphoproteins (~4). Over 60% of EGF-stimulated phosphoproteins were downstream of MAPK and included mediators of cellular processes such as gene transcription, transport, signal transduction and cytoskeletal arrangement. Their phosphorylation was either linear with respect to MAPK activation or biphasic, corresponding to the biphasic signaling seen at the level of the EGFR. This deep, integrated phosphoproteomics data resource should be useful in building mechanistic models of EGFR and MAPK signaling and for understanding how downstream responses are regulated.