MG
Mainak Guharoy
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(80% Open Access)
Cited by:
969
h-index:
21
/
i10-index:
27
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

DisProt: intrinsic protein disorder annotation in 2020

András Hatos et al.Oct 12, 2019
Abstract The Database of Protein Disorder (DisProt, URL: https://disprot.org) provides manually curated annotations of intrinsically disordered proteins from the literature. Here we report recent developments with DisProt (version 8), including the doubling of protein entries, a new disorder ontology, improvements of the annotation format and a completely new website. The website includes a redesigned graphical interface, a better search engine, a clearer API for programmatic access and a new annotation interface that integrates text mining technologies. The new entry format provides a greater flexibility, simplifies maintenance and allows the capture of more information from the literature. The new disorder ontology has been formalized and made interoperable by adopting the OWL format, as well as its structure and term definitions have been improved. The new annotation interface has made the curation process faster and more effective. We recently showed that new DisProt annotations can be effectively used to train and validate disorder predictors. We believe the growth of DisProt will accelerate, contributing to the improvement of function and disorder predictors and therefore to illuminate the ‘dark’ proteome.
0
Citation222
0
Save
0

Integrating multiple omics levels using the human protein complexome as a framework, a multi-omics study of inborn errors of metabolism

Mainak Guharoy et al.Dec 30, 2023
Proteins organize into functional assemblies that drive diverse biological activities. Leveraging a comprehensive dataset of manually curated annotations for the human protein complexome, we investigated biological perturbations at the protein complex level. Using proteomics and transcriptomics data from fibroblasts of patients with inborn errors of metabolism (IEM) and control samples, we globally mapped information onto complex subunits to discern affected processes. Across the patient cohort (consisting of organic acidaemias, fatty acid oxidation defects and mitochondrial respiratory chain defect IEMs), mitochondrial oxidative phosphorylation emerged as the most perturbed pathway, identified through proteomics datasets. Simultaneously, metabolomics highlighted significant regulation of phospholipids in patients with Fatty Acid and Mitochondrial IEM. Moreover, proteomics analysis also revealed the dysregulation of protein complexes involved in histone (de)acetylation, a finding validated through Western Blot analysis measuring histone acetylation levels. This introduces a novel epigenetic dimension to IEM and metabolic research, suggesting avenues for further exploration. Our study demonstrates a multiomics data integration concept that maps proteomics and transcriptomics data onto model organism complexomes. This integrative approach can be extended to metabolomics and lipidomics, associating information with complexes having metabolic functions, such as enzymatic complexes. This global strategy for identifying disease-relevant perturbations offers a systems-wide perspective on molecular-level physiological and pathological changes. Such insights are crucial for devising clinical intervention strategies and prioritizing druggable pathways and complexes. The presented methodology provides a foundation for future investigations, emphasizing the importance of integrating multiomics data to comprehensively understand cellular machinery alterations and facilitate targeted therapeutic approaches.
0

Distance-based metrics for comparing conformational ensembles of intrinsically disordered proteins

Tamás Lázár et al.Apr 7, 2020
Intrinsically disordered proteins (IDPs) are proteins whose native functional states represent ensembles of highly diverse conformations. Such ensembles are a challenge for quantitative structure comparisons as their conformational diversity precludes optimal superimposition of the atomic coordinates, necessary for deriving common similarity measures such as the root-mean-square deviation (RMSD) of these coordinates. Here we introduce superimposition-free metrics, which are based on computing matrices of Cα-Cα distance distributions within ensembles and comparing these matrices between ensembles. Differences between two matrices yield information on the similarity between specific regions of the polypeptide, whereas the global structural similarity is captured by the ens_dRMS, defined as the root-mean-square difference between the medians of the Cα-Cα distance distributions of two ensembles. Together, our metrics enable rigorous investigations of structure-function relationships in conformational ensembles of IDPs derived using experimental restraints or by molecular simulations, and for proteins containing both structured and disordered regions.