AB
Alexandre Bonvin
Author with expertise in Protein Structure Prediction and Analysis
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
6
(33% Open Access)
Cited by:
6
h-index:
17
/
i10-index:
25
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
28

Cryptic pathogen-sugar interactions revealed by universal saturation transfer analysis

Charles Buchanan et al.Apr 14, 2021
Abstract Many host pathogen interactions such as human viruses (including non-SARS-coronaviruses) rely on attachment to host cell-surface glycans. There are conflicting reports about whether the Spike protein of SARS-CoV-2 binds to sialic acid commonly found on host cell-surface N-linked glycans. In the absence of a biochemical assay, the ability to analyze the binding of glycans to heavily- modified proteins and resolve this issue is limited. Classical Saturation Transfer Difference (STD) NMR can be confounded by overlapping sugar resonances that compound with known experimental constraints. Here we present ‘universal saturation transfer analysis’ (uSTA), an NMR method that builds on existing approaches to provide a general and automated workflow for studying protein-ligand interactions. uSTA reveals that B-origin-lineage-SARS-CoV-2 spike trimer binds sialoside sugars in an ‘end on’ manner and modelling guided by uSTA localises binding to the spike N-terminal domain (NTD). The sialylated-polylactosamine motif is found on tetraantennary human N-linked-glycoproteins in deeper lung and may have played a role in zoonosis. Provocatively, sialic acid binding is abolished by mutations in some subsequent SARS- CoV-2 variants-of-concern. A very high resolution cryo-EM structure confirms the NTD location and ‘end on’ mode; it rationalises the effect of NTD mutations and the structure-activity relationship of sialic acid analogues. uSTA is demonstrated to be a robust, rapid and quantitative tool for analysis of binding, even in the most demanding systems. Extended Abstract The surface proteins found on both pathogens and host cells mediate entry (and exit) and influence disease progression and transmission. Both types can bear host-generated post- translational modifications such as glycosylation that are essential for function but can confound biophysical methods used for dissecting key interactions. Several human viruses (including non- SARS-coronaviruses) attach to host cell-surface N -linked glycans that include forms of sialic acid (sialosides). There remains, however, conflicting evidence as to if or how SARS-associated coronaviruses might use such a mechanism. Here, we demonstrate quantitative extension of ‘saturation transfer’ protein NMR methods to a complete mathematical model of the magnetization transfer caused by interactions between protein and ligand. The method couples objective resonance-identification via a deconvolution algorithm with Bloch-McConnell analysis to enable a structural, kinetic and thermodynamic analysis of ligand binding beyond previously-perceived limits of exchange rates, concentration or system. Using an automated and openly available workflow this ‘universal saturation transfer’ analysis (uSTA) can be readily-applied in a range of even heavily-modified systems in a general manner to now obtain quantitative binding interaction parameters (K D , k Ex ). uSTA proved critical in mapping direct interactions between natural sialoside sugar ligands and relevant virus-surface attachment glycoproteins – SARS-CoV-2-spike and influenza-H1N1-haemagglutinin variants – by quantitating ligand signal in spectral regions otherwise occluded by resonances from mobile protein glycans (that also include sialosides). In B- origin-lineage-SARS-CoV-2 spike trimer ‘end on’-binding to sialoside sugars was revealed contrasting with ‘extended surface’-binding for heparin sugar ligands; uSTA-derived constraints used in structural modelling suggested sialoside-glycan binding sites in a beta-sheet-rich region of spike N-terminal domain (NTD). Consistent with this, uSTA-glycan binding was minimally- perturbed by antibodies that neutralize the ACE2-binding domain (RBD) but strongly disrupted in spike from the B1.1.7/alpha and B1.351/beta variants-of-concern, which possess hotspot mutations in the NTD. Sialoside binding in B-origin-lineage-NTD was unequivocally pinpointed by cryo-EM to a site that is created from residues that are notably deleted in variants (e.g. H69,V70,Y145 in alpha). An analysis of beneficial genetic variances in cohorts of patients from early 2020 suggests a model in which this site in the NTD of B-origin-lineage-SARS-CoV-2 (but not in alpha/beta-variants) may have exploited a specific sialylated-polylactosamine motif found on tetraantennary human N -linked-glycoproteins in deeper lung. Together these confirm a novel binding mode mediated by the unusual NTD of SARS-CoV-2 and suggest how it may drive virulence and/or zoonosis via modulation of glycan attachment. Since cell-surface glycans are widely relevant to biology and pathology, uSTA can now provide ready, quantitative, widespread analysis of complex, host-derived and post-translationally modified proteins with putative ligands relevant to disease even in previously confounding complex systems.
28
Citation6
0
Save
0

An overview of data-driven HADDOCK strategies in CAPRI rounds 38-45.

Panagiotis Koukos et al.Jul 29, 2019
Our information-driven docking approach HADDOCK has demonstrated a sustained performance since the start of its participation to CAPRI. This is due, in part, to its ability to integrate data into the modelling process, and to the robustness of its scoring function. We participated in CAPRI both as server and as manual predictors. In CAPRI rounds 38-45, we have used various strategies depending on the information at hand. These ranged from imposing restraints to a few residues identified from literature as being important for the interaction, to binding pockets identified from homologous complexes or template-based refinement / CACA restraint-guided docking from identified templates. When relevant, symmetry restraints were used to limit the conformational sampling. We also tested for a large decamer target a new implementation of the MARTINI coarse-grained force field in HADDOCK. Overall in the current rounds, we obtained acceptable or better predictions for 13 and 11 server and manual submissions, respectively, out of the 22 interfaces. Our server performance (acceptable models) was better (59%) than the manual (50%) one, in which we typically experiment with various combinations of protocols and data sources. Again, our simple scoring function based on a linear combination of intermolecular van der Waals and electrostatic energies and an empirical desolvation term demonstrated a good performance in the scoring experiment with a 63% success rate across all 22 interfaces. An analysis of model quality indicates that, while we are consistently performing well in generating acceptable models, there is room for improvement for generating/identifying higher quality models.
1

MetaScore: A novel machine-learning based approach to improve traditional scoring functions for scoring protein-protein docking conformations

Yong Jung et al.Oct 9, 2021
Abstract Protein-protein interactions play a ubiquitous role in biological function. Knowledge of the three-dimensional (3D) structures of the complexes they form is essential for understanding the structural basis of those interactions and how they orchestrate key cellular processes. Computational docking has become an indispensable alternative to the expensive and timeconsuming experimental approaches for determining 3D structures of protein complexes. Despite recent progress, identifying near-native models from a large set of conformations sampled by docking - the so-called scoring problem - still has considerable room for improvement. We present here MetaScore, a new machine-learning based approach to improve the scoring of docked conformations. MetaScore utilizes a random forest (RF) classifier trained to distinguish near-native from non-native conformations using a rich set of features extracted from the respective protein-protein interfaces. These include physico-chemical properties, energy terms, interaction propensity-based features, geometric properties, interface topology features, evolutionary conservation and also scores produced by traditional scoring functions (SFs). MetaScore scores docked conformations by simply averaging of the score produced by the RF classifier with that produced by any traditional SF. We demonstrate that (i) MetaScore consistently outperforms each of nine traditional SFs included in this work in terms of success rate and hit rate evaluated over the top 10 predicted conformations; (ii) An ensemble method, MetaScore-Ensemble, that combines 10 variants of MetaScore obtained by combining the RF score with each of the traditional SFs outperforms each of the MetaScore variants. We conclude that the performance of traditional SFs can be improved upon by judiciously leveraging machine-learning.