DF
Daniel Farrell
Author with expertise in Macromolecular Crystallography Techniques
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
16
h-index:
14
/
i10-index:
16
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
30

Outcomes of the 2019 EMDataResource model challenge: validation of cryo-EM models at near-atomic resolution

Catherine Lawson et al.Jun 15, 2020
Abstract This paper describes outcomes of the 2019 Cryo-EM Map-based Model Metrics Challenge sponsored by EMDataResource ( www.emdataresource.org ). The goals of this challenge were (1) to assess the quality of models that can be produced using current modeling software, (2) to check the reproducibility of modeling results from different software developers and users, and (3) compare the performance of current metrics used for evaluation of models. The focus was on near-atomic resolution maps with an innovative twist: three of four target maps formed a resolution series (1.8 to 3.1 Å) from the same specimen and imaging experiment. Tools developed in previous challenges were expanded for managing, visualizing and analyzing the 63 submitted coordinate models, and several novel metrics were introduced. The results permit specific recommendations to be made about validating near-atomic cryo-EM structures both in the context of individual laboratory experiments and holdings of structure data archives such as the Protein Data Bank. Our findings demonstrate the relatively high accuracy and reproducibility of cryo-EM models derived from these benchmark maps by 13 participating teams, representing both widely used and novel modeling approaches. We also evaluate the pros and cons of the commonly used metrics to assess model quality and recommend the adoption of multiple scoring parameters to provide full and objective annotation and assessment of the model, reflective of the observed density in the cryo-EM map.
30
Citation6
0
Save
4

Ensuring scientific reproducibility in bio-macromolecular modeling via extensive, automated benchmarks

Julia Leman et al.Apr 5, 2021
Abstract Each year vast international resources are wasted on irreproducible research. The scientific community has been slow to adopt standard software engineering practices, despite the increases in high-dimensional data, complexities of workflows, and computational environments. Here we show how scientific software applications can be created in a reproducible manner when simple design goals for reproducibility are met. We describe the implementation of a test server framework and 40 scientific benchmarks, covering numerous applications in Rosetta bio-macromolecular modeling. High performance computing cluster integration allows these benchmarks to run continuously and automatically. Detailed protocol captures are useful for developers and users of Rosetta and other macromolecular modeling tools. The framework and design concepts presented here are valuable for developers and users of any type of scientific software and for the scientific community to create reproducible methods. Specific examples highlight the utility of this framework and the comprehensive documentation illustrates the ease of adding new tests in a matter of hours.
4
Citation3
0
Save
4

Robust residue-level error detection in cryo-electron microscopy models

Gabriella Reggiano et al.Sep 13, 2022
ABSTRACT Building accurate protein models into moderate resolution (3-5Å) cryo-electron microscopy (cryo-EM) maps is challenging and error-prone. While the majority of solved cryo-EM structures are at these resolutions, there are few model validation metrics that can precisely evaluate the local quality of atomic models built into these maps. We have developed MEDIC (Model Error Detection in Cryo-EM), a robust statistical model to identify residue-level errors in protein structures built into cryo-EM maps. Trained on a set of errors from obsoleted protein structures, our model draws off two major sources of information to predict errors: the local agreement of model and map compared to expected, and how “native-like” the neighborhood around a residue looks, as predicted by a deep learning model. MEDIC is validated on a set of 28 structures that were subsequently solved to higher-resolutions, where our model identifies the differences between low- and high-resolution structures with 68% precision and 60% recall. We additionally use this model to rebuild 12 deposited structures, fixing 2 sequence registration errors, 51 areas with improper secondary structure, 51 incorrect loops, and 16 incorrect carbonyls, showing the value of this approach to guide model building.
28

Deep learning enables the atomic structure determination of the Fanconi Anemia core complex from cryoEM

Daniel Farrell et al.May 3, 2020
Abstract Cryo-electron microscopy of protein complexes often leads to moderate resolution maps (4-8 Å), with visible secondary structure elements but poorly resolved loops, making model-building challenging. In the absence of high-resolution structures of homologues, only coarse-grained structural features are typically inferred from these maps, and it is often impossible to assign specific regions of density to individual protein subunits. This paper describes a new method for overcoming these difficulties that integrates predicted residue distance distributions from a deep-learned convolutional neural network, computational protein folding using Rosetta, and automated EM-map-guided complex assembly. We apply this method to a 4.6 Å resolution cryoEM map of Fanconi Anemia core complex (FAcc), an E3 ubiquitin ligase required for DNA interstrand crosslink repair, which was previously challenging to interpret as it is comprised of 6557 residues, only 1897 of which are covered by homology models. In the published structure built from this map, only 387 residues could be assigned to specific subunits. By building and placing into density 42 deep-learning guided models containing 4795 residues not included in the previously published structure, we are able to determine an almost-complete atomic model of FAcc, in which 5182 of the 6557 residues were placed. The resulting model is consistent with previously published biochemical data, and facilitates interpretation of disease related mutational data. We anticipate that our approach will be broadly useful for cryoEM structure determination of large complexes containing many subunits for which there are no homologues of known structure.
0

Independent evolution of polymerization in the Actin ATPase clan regulates hexokinase activity

Patrick Stoddard et al.Jul 2, 2019
The actin protein fold is found in cytoskeletal polymers, chaperones, and various metabolic enzymes. Many actin-fold proteins, like the carbohydrate kinases, do not polymerize. We find that Glk1, a Saccharomyces cerevisiae glucokinase, forms two-stranded filaments with unique ultrastructure, distinct from that of cytoskeletal polymers. In cells, Glk1 polymerizes upon sugar addition and depolymerizes upon sugar withdrawal. Glk1 polymerization inhibits its enzymatic activity, thus the Glk1 monomer-polymer equilibrium sets a maximum rate of glucose phosphorylation regardless of Glk1 concentration. A mutation eliminating Glk1 polymerization alleviates concentration-dependent enzyme inhibition, causing glucokinase activity to become unconstrained. Polymerization-based regulation of Glk1 activity serves an important function in vivo : yeast containing non-polymerizing Glk1 are less fit when growing on sugars and more likely to die when refed glucose. Glucokinase polymerization arose within the ascomycete fungi and is conserved across a group of divergent (150-200 mya) yeast. We show that Glk1 polymerization arose independently from other actin-related filaments and allows yeast to rapidly modulate glucokinase activity as nutrient availability changes.One-sentence summary Yeast glucokinase activity is limited by its polymerization, which is critical for cell viability during glucose refeeding.