DH
Déborah Harrus
Author with expertise in Macromolecular Crystallography Techniques
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
4
(100% Open Access)
Cited by:
1
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
8

Unliganded and CMP-Neu5Ac bound structures of human α-2,6-sialyltransferase ST6Gal I at high resolution

Déborah Harrus et al.Jun 7, 2020
ABSTRACT Sialic acid residues found as terminal monosaccharides in various types of glycan chains in cell surface glycoproteins and glycolipids have been identified as important contributors of cell-cell interactions in normal vs. abnormal cellular behavior and are pivotal in diseases such as cancers. In vertebrates, sialic acids are attached to glycan chains by a conserved subset of sialyltransferases with different enzymatic and substrate specificities. ST6Gal I is a sialyltransferase using activated CMP-sialic acids as donor substrates to catalyze the formation of a α2,6-glycosidic bond between the sialic acid residue and the acceptor disaccharide LacNAc. Understanding sialyltransferases at the molecular and structural level shed light into the function. We present here two human ST6Gal I structures, which show for the first time the enzyme in the unliganded state and with the full donor substrate CMP-Neu5Ac bound. Comparison of these structures reveal flexibility of the catalytic loop, since in the unliganded structure Tyr354 adopts a conformation seen also as an alternate conformation in the substrate bound structure. CMP-Neu5Ac is bound with the side chain at C-5 of the sugar residue directed towards empty space at the surface of the protein. Furthermore, the exact binding mode of the sialic acid moiety of the substrate directly involves sialylmotifs L, S and III and positions the sialylmotif VS in the immediate vicinity. PROTEIN DATA BANK ACCESSION CODES Atomic coordinates and structure factors of the human wild-type unliganded and CMP-Neu5Ac bound ST6Gal I have been deposited with the PDB with accession codes 6QVS and 6QVT, respectively.
8
Citation1
0
Save
0

Restraint Validation of Biomolecular Structures Determined by NMR in the Protein Data Bank

Kumaran Baskaran et al.Jan 17, 2024
Summary Biomolecular structure analysis from experimental NMR studies generally relies on restraints derived from a combination of experimental and knowledge-based data. A challenge for the structural biology community has been a lack of standards for representing these restraints, preventing the establishment of uniform methods of model-vs-data structure validation against restraints and limiting interoperability between restraint-based structure modeling programs. The NMR exchange (NEF) and NMR-STAR formats provide a standardized approach for representing commonly used NMR restraints. Using these restraint formats, a standardized validation system for assessing structural models of biopolymers against restraints has been developed and implemented in the wwPDB OneDep data deposition-validation-biocuration system. The resulting wwPDB Restraint Violation Report provides a model vs. data assessment of biomolecule structures determined using distance and dihedral restraints, with extensions to other restraint types currently being implemented. These tools are useful for assessing NMR models, as well as for assessing biomolecular structure predictions based on distance restraints. Graphical Abstract Highlights PDB Structure Validation Report expanded to include Restraint Analysis NMR Exchange Format (NEF) and NMR-STAR for distance restraint representation Standard distance and dihedral restraint formats for model vs. restraint assessment Standardized restraint formats provide interoperability between modeling programs
0

Human-in-the-loop approach to identify functionally important residues of proteins from literature

M. Vollmar et al.Mar 13, 2024
We present a novel system that leverages curators in the loop to develop a dataset and model for detecting residue-level functional annotations and other protein structure features from standard publication text. Our approach involves the integration of data from multiple resources, including PDBe, EuropePMC, PubMedCentral, and PubMed, combined with annotation guidelines from UniProt, while employing LitSuggest and Huggingface models as tools in the annotation process. A team of seven annotators manually curated ten articles for named entities, which we utilized to train a starting PubmedBert model from Huggingface. Using a human-in-the-loop annotation system, we developed the best model with commendable performance metrics of 0.90 for precision, 0.92 for recall, and 0.91 for F1-measure. Our proposed system showcases a successful synergy of machine learning techniques and human expertise in curating a dataset for residue-level functional annotations and protein structure features. The results demonstrate the potential for broader applications in protein research, bridging the gap between advanced machine learning models and the indispensable insights of domain experts.
1

Annotating Macromolecular Complexes in the Protein Data Bank: Improving the FAIRness of Structure Data

Sri Appasamy et al.May 15, 2023
Abstract Macromolecular complexes are essential functional units in nearly all cellular processes, and their atomic-level understanding is critical for elucidating and modulating molecular mechanisms. The Protein Data Bank (PDB) serves as the global repository for experimentally determined structures of macromolecules. Structural data in the PDB offer valuable insights into the dynamics, conformation, and functional states of biological assemblies. However, the current annotation practices lack standardised naming conventions for assemblies in the PDB, complicating the identification of instances representing the same assembly. In this study, we introduce a method leveraging resources external to PDB, such as the Complex Portal, UniProt and Gene Ontology, to describe assemblies and contextualise them within their biological settings accurately. Employing the proposed approach, we assigned standard names and provided value-added annotations to over 90% of unique assemblies in the PDB. This standardisation of assembly data enhances the PDB, facilitating a deeper understanding of these cellular components. Furthermore, the data standardisation improves the PDB’s FAIR attributes, fostering more effective basic and translational research and education across scientific disciplines.