GP
Guillermo Pérez‐Hernández
Author with expertise in Protein Structure Prediction and Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(83% Open Access)
Cited by:
1,573
h-index:
14
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

PyEMMA 2: A Software Package for Estimation, Validation, and Analysis of Markov Models

Martin Scherer et al.Oct 14, 2015
+6
F
B
M
Markov (state) models (MSMs) and related models of molecular kinetics have recently received a surge of interest as they can systematically reconcile simulation data from either a few long or many short simulations and allow us to analyze the essential metastable structures, thermodynamics, and kinetics of the molecular system under investigation. However, the estimation, validation, and analysis of such models is far from trivial and involves sophisticated and often numerically sensitive methods. In this work we present the open-source Python package PyEMMA (http://pyemma.org) that provides accurate and efficient algorithms for kinetic model construction. PyEMMA can read all common molecular dynamics data formats, helps in the selection of input features, provides easy access to dimension reduction algorithms such as principal component analysis (PCA) and time-lagged independent component analysis (TICA) and clustering algorithms such as k-means, and contains estimators for MSMs, hidden Markov models, and several other models. Systematic model validation and error calculation methods are provided. PyEMMA offers a wealth of analysis functions such that the user can conveniently compute molecular observables of interest. We have derived a systematic and accurate way to coarse-grain MSMs to few states and to illustrate the structures of the metastable states of the system. Plotting functions to produce a manuscript-ready presentation of the results are available. In this work, we demonstrate the features of the software and show new methodological concepts and results produced by PyEMMA.
0

Identification of slow molecular order parameters for Markov model construction

Guillermo Pérez‐Hernández et al.Jul 3, 2013
+2
T
F
G
A goal in the kinetic characterization of a macromolecular system is the description of its slow relaxation processes via (i) identification of the structural changes involved in these processes and (ii) estimation of the rates or timescales at which these slow processes occur. Most of the approaches to this task, including Markov models, master-equation models, and kinetic network models, start by discretizing the high-dimensional state space and then characterize relaxation processes in terms of the eigenvectors and eigenvalues of a discrete transition matrix. The practical success of such an approach depends very much on the ability to finely discretize the slow order parameters. How can this task be achieved in a high-dimensional configuration space without relying on subjective guesses of the slow order parameters? In this paper, we use the variational principle of conformation dynamics to derive an optimal way of identifying the “slow subspace” of a large set of prior order parameters – either generic internal coordinates or a user-defined set of parameters. Using a variational formulation of conformational dynamics, it is shown that an existing method—the time-lagged independent component analysis—provides the optional solution to this problem. In addition, optimal indicators—order parameters indicating the progress of the slow transitions and thus may serve as reaction coordinates—are readily identified. We demonstrate that the slow subspace is well suited to construct accurate kinetic models of two sets of molecular dynamics simulations, the 6-residue fluorescent peptide MR121-GSGSW and the 30-residue intrinsically disordered peptide kinase inducible domain (KID). The identified optimal indicators reveal the structural changes associated with the slow processes of the molecular system under analysis.
6

mdciao: Accessible Analysis and Visualization of Molecular Dynamics Simulation Data

Guillermo Pérez‐Hernández et al.Jul 16, 2022
P
G
ABSTRACT We present mdciao, an open-source command line tool and Python Application-Programmers-Interface (API) for easy, one-shot analysis and representation of molecular dynamics (MD) simulation data. Building upon the widely used concept of residue-residue contact-frequencies, mdciao offers a wide spectrum of further analysis and representations, enriched with domain specific annotations when possible. It tries offer a user-friendly interface, which simplifies most decisions for non-expert users, while keeping customizability for expert ones. Emphasis has been put into automatically producing annotated, paper-ready figures and tables. Furthermore, seamless on-the-fly query and inclusion of consensus nomenclatures for GPCR, G-proteins, and kinases is made possible through the respective online databases, which allows for bulk selection and comparison across different systems. Finally, the fully documented Python API allows users to include the basic or advanced mdciao functions in their analysis workflows, and provides numerous examples and Jupyter Notebook Tutorials. The source code is published under the GNU Lesser General Public License v3.0 or later and hosted on https://github.com/gph82/mdciao .
0

Mechanistic insights into G-protein coupling with an agonist-bound G-protein-coupled receptor

Hossein Batebi et al.Jun 12, 2024
+15
S
G
H
G-protein-coupled receptors (GPCRs) activate heterotrimeric G proteins by promoting guanine nucleotide exchange. Here, we investigate the coupling of G proteins with GPCRs and describe the events that ultimately lead to the ejection of GDP from its binding pocket in the Gα subunit, the rate-limiting step during G-protein activation. Using molecular dynamics simulations, we investigate the temporal progression of structural rearrangements of GDP-bound G
0
Citation1
0
Save
123

Time-resolved cryo-EM of G protein activation by a GPCR

Makaía Papasergi-Scott et al.Mar 21, 2023
+12
H
G
M
Summary G protein-coupled receptors (GPCRs) activate heterotrimeric G proteins by stimulating the exchange of guanine nucleotide in the Gα subunit. To visualize this mechanism, we developed a time-resolved cryo-EM approach that examines the progression of ensembles of pre-steady-state intermediates of a GPCR-G protein complex. Using variability analysis to monitor the transitions of the stimulatory Gs protein in complex with the β 2 -adrenergic receptor (β 2 AR) at short sequential time points after GTP addition, we identified the conformational trajectory underlying G protein activation and functional dissociation from the receptor. Twenty transition structures generated from sequential overlapping particle subsets along this trajectory, compared to control structures, provide a high-resolution description of the order of events driving G protein activation upon GTP binding. Structural changes propagate from the nucleotide-binding pocket and extend through the GTPase domain, enacting alterations to Gα Switch regions and the α5 helix that weaken the G protein-receptor interface. Molecular dynamics (MD) simulations with late structures in the cryo-EM trajectory support that enhanced ordering of GTP upon closure of the alpha-helical domain (AHD) against the nucleotide-bound Ras-homology domain (RHD) correlates with irreversible α5 helix destabilization and eventual dissociation of the G protein from the GPCR. These findings also highlight the potential of time-resolved cryo-EM as a tool for mechanistic dissection of GPCR signaling events.
0

Lessons learned during the journey of data: from experiment to model for predicting kinase affinity, selectivity, polypharmacology, and resistance

Raquel Castro et al.Sep 10, 2024
+12
D
J
R
Recent advances in machine learning (ML) are reshaping drug discovery. Structure-based ML methods use physically-inspired models to predict binding affinities from protein:ligand complexes. These methods promise to enable the integration of data for many related targets, which addresses issues related to data scarcity for single targets and could enable generalizable predictions for a broad range of targets, including mutants. In this work, we report our experiences in building KinoML, a novel framework for ML in target-based small molecule drug discovery with an emphasis on structure-enabled methods. KinoML focuses currently on kinases as the relative structural conservation of this protein superfamily, particularly in the kinase domain, means it is possible to leverage data from the entire superfamily to make structure-informed predictions about binding affinities, selectivities, and drug resistance. Some key lessons learned in building KinoML include: the importance of reproducible data collection and deposition, the harmonization of molecular data and featurization, and the choice of the right data format to ensure reusability and reproducibility of ML models. As a result, KinoML allows users to easily achieve three tasks: accessing and curating molecular data; featurizing this data with representations suitable for ML applications; and running reproducible ML experiments that require access to ligand, protein, and assay information to predict ligand affinity. Despite KinoML focusing on kinases, this framework can be applied to other proteins. The lessons reported here can help guide the development of platforms for structure-enabled ML in other areas of drug discovery.