IP
Iva Pritišanac
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
15
(80% Open Access)
Cited by:
49
h-index:
14
/
i10-index:
19
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
84

Systematic identification of conditionally folded intrinsically disordered regions by AlphaFold2

T. Alderson et al.Feb 18, 2022
+3
Đ
T
T
Abstract The AlphaFold Protein Structure Database contains predicted structures for millions of proteins. For the majority of human proteins that contain intrinsically disordered regions (IDRs), which do not adopt a stable structure, it is generally assumed these regions have low AlphaFold2 confidence scores that reflect low-confidence structural predictions. Here, we show that AlphaFold2 assigns confident structures to nearly 15% of human IDRs. By comparison to experimental NMR data for a subset of IDRs that are known to conditionally fold (i.e., upon binding or under other specific conditions), we find that AlphaFold2 often predicts the structure of the conditionally folded state. Based on databases of IDRs that are known to conditionally fold, we estimate that AlphaFold2 can identify conditionally folding IDRs at a precision as high as 88% at a 10% false positive rate, which is remarkable considering that conditionally folded IDR structures were minimally represented in its training data. We find that human disease mutations are nearly 5-fold enriched in conditionally folded IDRs over IDRs in general, and that up to 80% of IDRs in prokaryotes are predicted to conditionally fold, compared to less than 20% of eukaryotic IDRs. These results indicate that a large majority of IDRs in the proteomes of human and other eukaryotes function in the absence of conditional folding, but the regions that do acquire folds are more sensitive to mutations. We emphasize that the AlphaFold2 predictions do not reveal functionally relevant structural plasticity within IDRs and cannot offer realistic ensemble representations of conditionally folded IDRs. Significance Statement AlphaFold2 and other machine learning-based methods can accurately predict the structures of most proteins. However, nearly two-thirds of human proteins contain segments that are highly flexible and do not autonomously fold, otherwise known as intrinsically disordered regions (IDRs). In general, IDRs interconvert rapidly between a large number of different conformations, posing a significant problem for protein structure prediction methods that define one or a small number of stable conformations. Here, we found that AlphaFold2 can readily identify structures for a subset of IDRs that fold under certain conditions (conditional folding). We leverage AlphaFold2’s predictions of conditionally folded IDRs to quantify the extent of conditional folding across the tree of life, and to rationalize disease-causing mutations in IDRs. Classifications : Biological Sciences; Biophysics and Computational Biology
84
Citation35
0
Save
1

Identifying molecular features that are associated with biological function of intrinsically disordered protein regions

Taraneh Zarin et al.Jun 23, 2020
+3
G
B
T
Abstract Previously, we showed that intrinsically disordered regions in proteins (IDRs) contain multiple sequence-distributed molecular features that are conserved over evolution, despite little sequence similarity that can be detected in alignments (Zarin et al. 2019). Here, we aim to use these molecular features to make specific functional predictions for individual IDRs and identify the molecular features within them that are responsible for specific functions. We find that the predictable functions are diverse, identifying previously known associated molecular features, as well as features that were previously not known to be associated with these functions. We experimentally confirm that elevated isoelectric point and hydrophobicity, features that are positively associated with mitochondrial localization, are necessary for mitochondrial targeting function. Remarkably, increasing isoelectric point in a synthetic IDR restores weak mitochondrial targeting. We believe feature analysis represents a new systematic approach to understand how biological functions of IDRs are specified by their protein sequences.
1
Citation3
0
Save
1

Discovering molecular features of intrinsically disordered regions by using evolution for contrastive learning

Alex Lu et al.Jul 30, 2021
+4
I
A
A
Abstract A major challenge to the characterization of intrinsically disordered regions (IDRs), which are widespread in the proteome, but relatively poorly understood, is the identification of molecular features that mediate functions of these regions, such as short motifs, amino acid repeats and physicochemical properties. Here, we introduce a proteome-scale feature discovery approach for IDRs. Our approach, which we call “reverse homology”, exploits the principle that important functional features are conserved over evolution. We use this as a contrastive learning signal for deep learning: given a set of homologous IDRs, the neural network has to correctly choose a held-out homologue from another set of IDRs sampled randomly from the proteome. We pair reverse homology with a simple architecture and standard interpretation techniques, and show that the network learns conserved features of IDRs that can be interpreted as motifs, repeats, or bulk features like charge or amino acid propensities. We also show that our model can be used to produce visualizations of what residues and regions are most important to IDR function, generating hypotheses for uncharacterized IDRs. Our results suggest that feature discovery using unsupervised neural networks is a promising avenue to gain systematic insight into poorly understood protein sequences.
1
Citation2
0
Save
1

Developmental Dynamics of RNA Translation in the Human Brain

Erin Duffy et al.Oct 23, 2021
+21
E
A
E
ABSTRACT The precise regulation of gene expression is fundamental to neurodevelopment, plasticity, and cognitive function. While several studies have deeply profiled mRNA dynamics in the developing human brain, there is a fundamental gap in our understanding of accompanying translational regulation. We perform ribosome profiling from more than 70 human prenatal and adult cortex samples across ontogeny and into adulthood, mapping translation events at nucleotide resolution. In addition to characterizing the translational regulation of annotated open reading frames (ORFs), we identify thousands of previously unknown translation events, including small open reading frames (sORFs) that give rise to human- and/or brain-specific microproteins, many of which we independently verify using size-selected proteomics. Ribosome profiling in stem cell-derived human neuronal cultures further corroborates these findings and shows that several neuronal activity-induced long non-coding RNAs (lncRNAs), including LINC00473 , a primate-specific lncRNA implicated in depression, encode previously undescribed microproteins. Physicochemical analysis of these brain microproteinss identifies a large class harboring arginine-glycine-glycine (RGG) repeats as strong candidates for regulating RNA metabolism. Moreover, we find that, collectively, these previously unknown human brain sORFs are enriched for variants associated with schizophrenia. In addition to significantly expanding the translational landscape of the developing brain, this atlas will serve as a rich resource for the annotation and functional interrogation of thousands of previously unknown brain-specific protein products.
1
Citation2
0
Save
7

MIADE metadata guidelines: Minimum Information About a Disorder Experiment

Bálint Mészáros et al.Jul 14, 2022
+22
N
A
B
Abstract An unambiguous description of an experimental setup and analysis, and the subsequent biological observation is vital for accurate data interpretation and reproducible results. Consequently, experimental analyses should be described in a concise, unequivocal, and digestible manner. The aim of minimum information guidelines is to define the fundamental complement of data that can support an unambiguous conclusion on experimental observations. In this document, we present the Minimum Information About Disorder Experiments (MIADE) guidelines to define the minimal fundamental parameters required for non-experts to understand the key findings of an experiment studying intrinsically disordered proteins (IDPs) or intrinsically disordered protein regions (IDRs). MIADE guidelines provide recommendations for data producers to describe the results of their experiments at source, for curators to annotate experimental data to community resources and for database developers maintaining community resources to disseminate the data. We give examples of the application of these guidelines in common use cases and describe the implementation of an update to the DisProt IDP database to allow MIADE-compliant annotation. The MIADE guidelines will improve the interpretability of experimental results for data consumers, facilitate direct data submission, simplify data curation, improve data exchange among repositories and standardise the dissemination of the key metadata on an IDP experiment by IDP data sources.
5

O-GlcNAcylation reduces phase separation and aggregation of the EWS N-terminal low complexity region

Michael Nosella et al.May 11, 2021
+4
I
M
M
ABSTRACT Many membraneless organelles are thought to be biomolecular condensates formed by phase separation of proteins and other biopolymers. Post-translational modifications (PTMs) can impact protein phase separation behavior, although for many PTMs this aspect of their function is unknown. O -linked β-D- N -acetylglucosaminylation ( O -GlcNAcylation) is an abundant form of intracellular glycosylation whose roles in regulating biomolecular condensate assembly and dynamics have not been delineated. Using an in vitro approach, we found that O -GlcNAcylation reduces the phase separation propensity of the EWS N -terminal low complexity region (LCR N ) under different conditions, including in the presence of the arginine-and glycine-rich RNA-binding domains (RBD). O -GlcNAcylation enhances fluorescence recovery after photobleaching (FRAP) within EWS LCR N condensates and causes the droplets to exhibit more liquid-like relaxation following fusion. Following extended incubation times, EWS LCR N +RBD condensates exhibit diminished FRAP, indicating a loss of fluidity, while condensates containing the O -GlcNAcylated LCR N do not. In HeLa cells, EWS is less O -GlcNAcylated following OGT knockdown and more prone to aggregation based on a filter retardation assay. Relative to the human proteome, O -GlcNAcylated proteins are enriched with regions that are predicted to phase separate, suggesting a general role of O -GlcNAcylation in regulation of biomolecular condensates. Insert Table of Contents artwork here Abstract Figure For Table of Contents only.
5
Citation2
0
Save
1

Flattening the curve - How to get better results with small deep-mutational-scanning datasets

Gregor Wirnsberger et al.Mar 27, 2023
K
G
I
G
Abstract Proteins are utilized in various biotechnological applications, often requiring the optimization of protein properties by introducing specific amino acid exchanges. Deep mutational scanning (DMS) is an effective high-throughput method for evaluating the effects of these exchanges on protein function. DMS data can then inform the training of a neural network to predict the impact of mutations. Most approaches employ some representation of the protein sequence for training and prediction. As proteins are characterized by complex structures and intricate residue interaction networks, directly providing structural information as input reduces the need to learn these features from the data. We introduce a method for encoding protein structures as stacked 2D contact maps, which capture residue interactions, their evolutionary conservation, and mutation-induced interaction changes. Furthermore, we explored techniques to augment neural network training performance on smaller DMS datasets. To validate our approach, we trained three neural network architectures originally used for image analysis on three DMS datasets, and we compared their performances with networks trained solely on protein sequences. The results confirm the effectiveness of the protein structure encoding in machine learning efforts on DMS data. Using structural representations as direct input to the networks, along with data augmentation and pre-training, significantly reduced demands on training data size and improved prediction performance, especially on smaller datasets, while performance on large datasets was on par with state-of-the-art sequence convolutional neural networks. The methods presented here have the potential to provide the same workflow as DMS without the experimental and financial burden of testing thousands of mutants. Additionally, we present an open-source, user-friendly software tool to make these data analysis techniques accessible, particularly to biotechnology and protein engineering researchers who wish to apply them to their mutagenesis data.
0

A Functional Map of the Human Intrinsically Disordered Proteome

Iva Pritišanac et al.Mar 17, 2024
+9
Đ
T
I
Intrinsically disordered regions (IDRs) represent at least one-third of the human proteome and defy the established structure-function paradigm. Because IDRs often have limited positional sequence conservation, the functional classification of IDRs using standard bioinformatics is generally not possible. Here, we show that evolutionarily conserved molecular features of the intrinsically disordered human proteome (IDR-ome), termed evolutionary signatures, enable classification and prediction of IDR functions. Hierarchical clustering of the human IDR-ome based on evolutionary signatures reveals strong enrichments for frequently studied functions of IDRs in transcription and RNA processing, as well as diverse, rarely studied functions, ranging from sub-cellular localization and biomolecular condensates to cellular signaling, transmembrane transport, and the constitution of the cytoskeleton. We exploit the information that is encoded within evolutionary conservation of molecular features to propose functional annotations for every IDR in the human proteome, inspect the conserved molecular features that correlate with different functions, and discover frequently co-occurring IDR functions on the proteome scale. Further, we identify patterns of evolutionary conserved molecular features of IDRs within proteins of unknown function and disease-risk genes for conditions such as cancer and developmental disorders. Our map of the human IDR-ome should be a valuable resource that aids in the discovery of new IDR biology.
0
Citation1
0
Save
0

Glutamate acts on acid-sensing ion channels to worsen ischaemic brain injury

Ke Lai et al.Jul 10, 2024
+10
Z
I
K
Glutamate is traditionally viewed as the first messenger to activate NMDAR (N-methyl-D-aspartate receptor)-dependent cell death pathways in stroke
0
Citation1
0
Save
0

TSC22D,WNKandNRBPgene families exhibit functional buffering and evolved with Metazoa for macromolecular crowd sensing

Yu-Xi Xiao et al.Feb 15, 2024
+30
K
Y
Y
SUMMARY The ability to sense and respond to osmotic fluctuations is critical for the maintenance of cellular integrity. Myriad redundancies have evolved across all facets of osmosensing in metazoans, including among water and ion transporters, regulators of cellular morphology, and macromolecular crowding sensors, hampering efforts to gain a clear understanding of how cells respond to rapid water loss. In this study, we harness the power of gene co-essentiality analysis and genome-scale CRISPR-Cas9 screening to identify an unappreciated relationship between TSC22D2 , WNK1 and NRBP1 in regulating cell volume homeostasis. Each of these genes have paralogs and are functionally buffered for macromolecular crowd sensing and cell volume control. Within seconds of hyperosmotic stress, TSC22D, WNK and NRBP family members physically associate into cytoplasmic biocondensates, a process that is dependent on intrinsically disordered regions (IDRs). A close examination of these protein families across metazoans reveals that TSC22D genes evolved alongside a domain in NRBPs that specifically binds to TSC22D proteins, which we have termed NbrT ( N RBP b inding region with T SC22D), and this co-evolution is concomitant with rapid IDR length expansion in WNK family kinases. Our study identifies functions for unrecognized components of the cell volume sensing machinery and reveals that TSC22D , WNK and NRBP genes evolved as cytoplasmic crowding sensors in metazoans to co-regulate rapid cell volume changes in response to osmolarity.
Load More