KN
Kristen Naegle
Author with expertise in Mass Spectrometry Techniques with Proteins
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
3
h-index:
16
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

KSTAR: An algorithm to predict patient-specific kinase activities from phosphoproteomic data

Sam Crowl et al.Jul 8, 2021
+2
H
B
S
Abstract Kinase inhibitors are one of the largest classes of FDA-approved drugs and are major targets in oncology. Although kinase inhibitors have played an important role in improving cancer outcomes, major challenges still exist, including the development of resistance and failure to respond to treatments. Improvements for tumor profiling of kinase activity would be an important step in improving treatment outcomes and identifying effective kinase targets. Here, we present a graph- and statistics-based algorithm, called KSTAR, which harnesses the phosphoproteomic profiling of human cells and tissues by predicting kinase activity profiles from the observed phosphorylation of kinase substrates. The algorithm is based on the hypothesis that the more active a kinase is, the more of its substrates will be observed in a phosphoproteomic experiment. This method is error- and bias-aware in its approach, overcoming challenges presented by the variability of phosphoproteomic pipelines, limited information about kinase-substrate relationships, and limitations of global kinase-substrate predictions, such as training set bias and high overlap between predicted kinase networks. We demonstrate that the predicted kinase activities: 1) reproduce physiologically-relevant expectations and generates novel hypotheses within cell-specific experiments, 2) improve the ability to compare phosphoproteomic samples on the same tissues from different labs, and 3) identify tissue-specific kinase profiles. Global benchmarking and comparison to other algorithms demonstrates that KSTAR is particularly superior for predicting tyrosine kinase activities and, given its focus on utilizing more of the available phosphoproteomic data, significantly less sensitive to study bias. Finally, we apply the approach to complex human tissue biopsies in breast cancer, where we find that KSTAR activity predictions complement current clinical standards for identifying HER2-status – KSTAR can identify clinical false positives, patients who will fail to respond to inhibitor therapy, and clinically defined HER2-negative patients that might benefit from HER2-targeted therapy. KSTAR will be useful for both basic biological understanding of signaling networks and for improving clinical outcomes through improved clinical trial design, identification of new and/or combination therapies, and for identifying the failure to respond to targeted kinase therapies.
1
Citation2
0
Save
0

A systematic analysis of the effects of splicing on the diversity of post-translational modifications in protein isoforms

Sam Crowl et al.Jan 12, 2024
+2
A
M
S
Abstract Post-translational modifications (PTMs) and splicing are known to be important regulatory processes for controlling protein function and activity. Despite there being some examples of the interplay between alternative splicing and cell signaling in literature, there have been very few detailed analyses of the impacts of alternative splicing on PTMs, in part due to difficulties in extracting PTM information from splicing measurements. In this work, we bridged the protein- and genome-centric world views to map PTMs to genomic locations for subsequent projection of PTMs onto alternative isoforms, either from known, validated isoforms from Ensembl (ExonPTMapper) or from splice events quantified by RNA-sequencing (PTM-POSE). We then performed a systematic analysis of the diversification of PTMs by alternative splicing across the entire Ensembl transcriptome, including exploration of the modification-specific rates of inclusion across isoforms and how often the regulatory sequences directly flanking a PTM are impacted by splicing, which might indicate altered regulatory or binding interactions in the alternatively spliced isoform. We found that 6-51% of PTMs are excluded from at least one isoform, depending on the modification type. Further, approximately 2% of prospective PTM sites exhibited altered regulatory sequences surrounding the modification site, suggesting that regulatory or binding interactions might be diversified in these proteoforms. Further, to better understand how splicing diversification of PTMs may alter cell phenotype in specific biological contexts, we projected PTMs onto splice events identified within prostate patient tumors from The Cancer Genome Atlas (TCGA) as a result of ESRP1 expression. We identified protein interaction and regulatory networks that may be rewired as a result of both differential inclusion of PTM sites in ribosomal and cytoskeletal proteins and through altering flanking residues surrounding specific phosphorylation sites that may be targets of 14-3-3 proteins and SH2 domains. As a part of this work, we have provided the pipeline for annotating isoforms from either Ensembl (called ExonPTMapper) or novel splicing measurements (called PTM-POSE) with PTMs and their functional consequences as freely available python packages for use by the broader scientific community.
0
Citation1
0
Save
0

ProteoClade: a taxonomic toolkit for multi-species and metaproteomic analysis

Arshag Mooradian et al.Oct 7, 2019
J
K
S
A
We present ProteoClade, a Python toolkit that performs taxa-specific peptide assignment, protein inference, and quantitation for multi-species proteomics experiments. ProteoClade scales to hundreds of millions of protein sequences, requires minimal computational resources, and is open source, multi-platform, and accessible to non-programmers. We demonstrate its utility for processing quantitative proteomic data derived from patient-derived xenografts and its speed and scalability enable a novel de novo proteomic workflow for complex microbiota samples.
0

ASPEN: A methodology for reconstructing protein evolution with improved accuracy using ensemble models

Roman Sloutsky et al.Aug 1, 2017
K
R
Evolutionary reconstruction algorithms produce models of the evolutionary history of proteins: the order of duplications and speciations that led to extant homologous proteins observed across species. Although they are regularly used to gain insight into protein function, these models are estimates of an unknowable truth according to the underlying assumptions inherent in each algorithm, its objective function, and the input sequences supplied for reconstruction. In practice, the generated models are highly sensitive to the sequence inputs. In this work, we asked whether we could identify stronger phylogenetic signal by capitalizing on the variance introduced by perturbing the input to evolutionary reconstruction to explore a rich space of possible models that could explain protein evolution. We subsampled from available protein orthologs, “same” proteins across multiple extant species, and produced an ensemble of topologies representing the duplication history which produced related proteins (paralogs) for simulated protein families and in a real protein family – the LacI transcription factor family. We found that two very important phenomena arise from this approach. First, the reproducibility of an all-sequence, single-alignment reconstruction, measured by comparing topologies inferred from 90% subsamples, directly correlates with the accuracy of that single-alignment reconstruction, producing a measurable value for something that has been traditionally unknowable. Second, if we take a large ensemble of trees inferred from 50% subsamples and cast the ensemble into a form that represents the distribution of pairwise leaf distances observed across the ensemble, then trees that capture the most frequently observed relationships are also the most accurate. We propose a new methodology, ASPEN, a meta-algorithm that finds and ranks the trees that are most consistent with observations across the ensemble. Top-ranked ASPEN trees are significantly more accurate than the single-alignment tree produced from all available sequences. Importantly, our findings suggest that the true tree is currently inaccessible for most real protein families. Instead, applications that rely on evolutionary models should integrate across many trees that are equally likely to represent the true evolutionary history of a protein family.
0

New analysis pipeline for high-throughput domain-peptide affinity experiments improves SH2 interaction data

Tom Ronan et al.Jan 2, 2020
K
R
T
Protein domain interactions with short linear peptides, such as Src homology 2 (SH2) domain interactions with phosphotyrosine-containing peptide motifs (pTyr), are ubiquitous and important to many biochemical processes of the cell - both in their central importance to cell physiology, and to the sheer scale of possible interactions. The desire to map and quantify these interactions has resulted in the development of increased throughput quantitative measurement techniques, such as microarray or plate-based fluorescence polarization assays. For example, in the last 15 years, experiments have progressed from measuring single interactions to having covering 500,000 of the 5.5 million possible SH2-pTyr interactions in the human proteome. However, high variability in affinity measurements and disagreements about positive interactions between published datasets led us to re-evaluate the analysis pipelines of published SH2-pTyr datasets. We identified several opportunities for improving the identification of positive and negative interactions, and the accuracy of affinity measurements. These methods account for protein aggregation and degradation, and use model fitting and evaluation that are more appropriate for the non-linear behavior of binding interaction data. In addition to improve affinity accuracy, and increased certainty in negative interactions, we find the reanalyzed data results in significantly improved classification of binding vs non-binding when using machine learning techniques, suggesting improved coherence in the reanalyzed datasets. In addition to providing the revised dataset, we propose this new analysis pipeline and necessary protein activity controls should be part of the design process of many such high-throughput biochemical measurements.
0

CoDIAC: A comprehensive approach for interaction analysis reveals novel insights into SH2 domain function and regulation

Alekhya Kandoor et al.Jul 22, 2024
+4
J
G
A
Protein domains are conserved structural and functional units and are the functional building blocks of proteins. Evolutionary expansion means that domain families are often represented by many members in a species, which are found in various configurations with other domains, which have evolved new specificity for interacting partners. Here, we develop a structure-based interface analysis to comprehensively map domain interfaces from available experimental and predicted structures, including interfaces with other macromolecules and intraprotein interfaces (such as might exist between domains in a protein). We hypothesized that a comprehensive approach to contact mapping of domains could yield new insights. Specifically, we use it to gain information about how domains selectivity interact with ligands, whether domain-domain interfaces of repeated domain partnerships are conserved across diverse proteins, and identify regions of conserved post-translational modifications, using relationship to interaction interfaces as a method to hypothesize the effect of post-translational modifications (and mutations). We applied this approach to the human SH2 domain family, an extensive modular unit that is the foundation of phosphotyrosine-mediated signaling, where we identified a novel approach to understanding the binding selectivity of SH2 domains and evidence that there is coordinated and conserved regulation of multiple SH2 domain binding interfaces by tyrosine and serine/threonine phosphorylation and acetylation, suggesting that multiple signaling systems can regulate protein activity and SH2 domain interactions in a regulated manner. We provide the extensive features of the human SH2 domain family and this modular approach, as an open source Python package for COmprehensive Domain Interface Analysis of Contacts (Co-DIAC).
1

KinPred: A unified and sustainable approach for harnessing proteome-level human kinase-substrate predictions

Bingjie Xue et al.Aug 10, 2020
K
S
B
B
Tyrosine and serine/threonine kinases are essential regulators of cell processes and are important targets for human therapies. Unfortunately, very little is known about specific kinase-substrate relationships, making it difficult to infer meaning from dysregulated phosphoproteomic datasets or for researchers to identify possible kinases that regulate specific or novel phosphorylation sites. The last two decades have seen an explosion in algorithms to extrapolate from what little is known into the larger unknown – predicting kinase relationships with site-specific substrates using a variety of approaches that include the sequence-specificity of kinase catalytic domains and various other factors, such as evolutionary relationships, coexpression, and protein-protein interaction networks. Unfortunately, a number of limitations prevent researchers from easily harnessing these resources, such as loss of resource accessibility, limited information in publishing that results in a poor mapping to a human reference, and not being updated to match the growth of the human phosphoproteome. Here, we propose a methodological framework for publishing predictions in a unified way, which entails ensuring predictions have been run on a current reference proteome, mapping the same substrates and kinases across resources to a common reference, filtering for the human phosphoproteome, and providing methods for updating the resource easily in the future. We applied this framework on three currently available resources, published in the last decade, which provide kinase-specific predictions in the human proteome. Using the unified datasets, we then explore the role of study bias, the emergent network properties of these predictive algorithms, and comparisons within and between predictive algorithms. The combination of the code for unification and analysis, as well as the unified predictions are available under the resource we named KinPred. We believe this resource will be useful for a wide range of applications and establishes best practices for long-term usability and sustainability for new and existing predictive algorithms.
20

Logic-based mechanistic machine learning on high-content images reveals how drugs differentially regulate cardiac fibroblasts

Anders Nelson et al.Jan 1, 2023
J
K
S
A
Fibroblasts are essential regulators of extracellular matrix deposition following cardiac injury. These cells exhibit highly plastic responses in phenotype during fibrosis in response to environmental stimuli. Here, we test whether and how candidate anti-fibrotic drugs differentially regulate measures of cardiac fibroblast phenotype, which may help identify treatments for cardiac fibrosis. We conducted a high content microscopy screen of human cardiac fibroblasts treated with 13 clinically relevant drugs in the context of TGFβ and/or IL-1β, measuring phenotype across 137 single-cell features. We used the phenotypic data from our high content imaging to train a logic-based mechanistic machine learning model (LogiMML) for fibroblast signaling. The model predicted how pirfenidone and Src inhibitor WH-4-023 reduce actin filament assembly and actin-myosin stress fiber formation, respectively. Validating the LogiMML model prediction that PI3K partially mediates the effects of Src inhibition, we found that PI3K inhibition reduces actin-myosin stress fiber formation and procollagen I production in human cardiac fibroblasts. In this study, we establish a modeling approach combining the strengths of logic-based network models and regularized regression models, apply this approach to predict mechanisms that mediate the differential effects of drugs on fibroblasts, revealing Src inhibition acting via PI3K as a potential therapy for cardiac fibrosis.