Healthy Research Rewards
ResearchHub is incentivizing healthy research behavior. At this time, first authors of open access papers are eligible for rewards. Visit the publications tab to view your eligible publications.
Got it
NJ
Nicolas Jonsson
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(83% Open Access)
Cited by:
31
h-index:
4
/
i10-index:
4
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
206

Conformational ensembles of the human intrinsically disordered proteome: Bridging chain compaction with function and sequence conservation

Giulio Tesei et al.May 8, 2023
Abstract Intrinsically disordered proteins and regions (collectively IDRs) are pervasive across proteomes in all kingdoms of life, help shape biological functions, and are involved in numerous diseases. IDRs populate a diverse set of transiently formed structures, yet defy commonly held sequence-structure-function relationships. Recent developments in protein structure prediction have led to the ability to predict the three-dimensional structures of folded proteins at the proteome scale, and have enabled large-scale studies of structure-function relationships. In contrast, knowledge of the conformational properties of IDRs is scarce, in part because the sequences of disordered proteins are poorly conserved and because only few have been characterized experimentally. We have developed an efficient model to generate conformational ensembles of IDRs, and thereby to predict their conformational properties from sequence only. Here, we applied this model to simulate all IDRs of the human proteome. Examining conformational ensembles of 29,998 IDRs, we show how chain compaction is correlated with cellular function and localization, including in different types of biomolecular condensates. We train a model to predict compaction from sequence and use this to show conservation of structural properties across orthologs. Our results recapitulate observations from previous studies of individual protein systems, and enable us to study the relationship between sequence, conservation, conformational ensembles, biological function and disease variants at the proteome scale.
0

A joint embedding of protein sequence and structure enables robust variant effect predictions

Lasse Blaabjerg et al.Dec 16, 2023
Abstract The ability to predict how amino acid changes may affect protein function has a wide range of applications including in disease variant classification and protein engineering. Many existing methods focus on learning from patterns found in either protein sequences or protein structures. Here, we present a method for integrating information from protein sequences and structures in a single model that we term SSEmb (Sequence Structure Embedding). SSEmb combines a graph representation for the protein structure with a transformer model for processing multiple sequence alignments, and we show that by integrating both types of information we obtain a variant effect prediction model that is more robust to cases where sequence information is scarce. Furthermore, we find that SSEmb learns embeddings of the sequence and structural properties that are useful for other downstream tasks. We exemplify this by training a downstream model to predict protein-protein binding sites at high accuracy using only the SSEmb embeddings as input. We envisage that SSEmb may be useful both for zero-shot predictions of variant effects and as a representation for predicting protein properties that depend on protein sequence and structure.
0

Decoding molecular mechanisms for loss of function variants in the human proteome

Matteo Cagiada et al.May 22, 2024
Abstract Proteins play a critical role in cellular function by interacting with other biomolecules; missense variants that cause loss of protein function can lead to a broad spectrum of genetic disorders. While much progress has been made on predicting which missense variants may cause disease, our ability to predict the underlying molecular mechanisms remain limited. One common mechanism is that missense variants cause protein destabilization resulting in lowered protein abundance and loss of function, while other variants directly disrupt key interactions with other molecules. We have here leveraged machine learning models for protein sequence and structure to disentangle effects on protein function and abundance, and applied our resulting model to all missense variants in the human proteome. We find that approximately half of all missense variants that lead to loss of function and disease do so because they disrupt protein stability. We have predicted functionally important positions in all human proteins, and find that they cluster on protein structures and are often found on the protein surface. Our work provides a resource for interpreting both predicted and experimental variant effects across the human proteome, and a mechanistic starting point for developing therapies towards genetic diseases.