JL
Jérémy Leclercq
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
482
h-index:
6
/
i10-index:
5
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

DisProt: intrinsic protein disorder annotation in 2020

András Hatos et al.Oct 12, 2019
Abstract The Database of Protein Disorder (DisProt, URL: https://disprot.org) provides manually curated annotations of intrinsically disordered proteins from the literature. Here we report recent developments with DisProt (version 8), including the doubling of protein entries, a new disorder ontology, improvements of the annotation format and a completely new website. The website includes a redesigned graphical interface, a better search engine, a clearer API for programmatic access and a new annotation interface that integrates text mining technologies. The new entry format provides a greater flexibility, simplifies maintenance and allows the capture of more information from the literature. The new disorder ontology has been formalized and made interoperable by adopting the OWL format, as well as its structure and term definitions have been improved. The new annotation interface has made the curation process faster and more effective. We recently showed that new DisProt annotations can be effectively used to train and validate disorder predictors. We believe the growth of DisProt will accelerate, contributing to the improvement of function and disorder predictors and therefore to illuminate the ‘dark’ proteome.
0
Citation222
0
Save
0

Frameshifts in Tandem Repeats: Consequences on Protein Physicochemical Properties and Function

Zarifa Osmanli et al.Jun 3, 2024
ABSTRACT The genetic code uses three-nucleotide units to encode each amino acid in proteins. Insertions or deletions of nucleotides not divisible by three shift the reading frames, resulting in significantly different protein sequences. These events are disruptive but can also create variability important for evolution. Previous studies suggest that genetic code and gene sequences evolve to minimize frameshift effects, maintaining similar physicochemical properties to their reference proteins. Here, we focused on tandem repeat sequences, known as frameshift hotspots. Using cutting-edge bioinformatics tools, we compared reference and frameshifted protein sequences within tandem repeats across 50 prokaryotic and eukaryotic proteomes. Our analysis revealed several intriguing sequence-structure-function correlations. We showed that in contrast to the general tendency, frameshifts within these regions, especially with short repeats, lead to significant changes: increased hydrophobicity and arginine content, new aggregation-prone and transmembrane regions. Overall, frameshifts have stronger effects on tandem repeat regions compared to non-repetitive sequences, and therefore can be a primary cause of altered functions, cellular localization, and the development of various pathologies.