EY
Erin Yang
Author with expertise in Ecology and Evolution of Viruses in Ecosystems
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(100% Open Access)
Cited by:
15
h-index:
6
/
i10-index:
5
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
200

Accurate Computational Design of 3D Protein Crystals

Zhe Li et al.Nov 19, 2022
Summary Protein crystallization plays a central role in structural biology 1 , with broad impact 2 in pharmaceutical formulation 3 , drug delivery 4 , biosensing 5 , and biocatalysis 6,7 . Despite this importance, the process of protein crystallization remains poorly understood and highly empirical 8–10 , with largely unpredictable crystal contacts, lattice packing arrangements, and space group preferences, and the programming of protein crystallization through precisely engineered sidechain-sidechain interactions across multiple protein-protein interfaces is an outstanding challenge. Here we develop a general computational approach to designing three-dimensional (3D) protein crystals with pre-specified lattice architectures at atomic accuracy that hierarchically constrains the overall degree of freedoms (DOFs) of the system. We use the approach to design three pairs of oligomers that can be individually purified, and upon mixing, spontaneously self-assemble into large 3D crystals (>100 μm). Small-angle X-ray scattering and X-ray crystallography show these crystals are nearly identical to the computational design models, with the design target F 4 1 32 and I 432 space groups and closely corresponding overall architectures and protein-protein interfaces. The crystal unit cell dimensions can be systematically redesigned while retaining space group symmetry and overall architecture, and the crystals are both extremely porous and highly stable, enabling the robust scaffolding of inorganic nanoparticle arrays. Our approach thus enables the computational design of protein crystals with high accuracy, and since both structure and assembly are encoded in the primary sequence, provides a powerful new platform for biological material engineering.
200
Citation7
0
Save
1

Fast and versatile sequence-independent protein docking for nanomaterials design using RPXDock

William Sheffler et al.Oct 26, 2022
Abstract Computationally designed multi-subunit assemblies have shown considerable promise for a variety of applications, including a new generation of potent vaccines. One of the major routes to such materials is rigid body sequence-independent docking of cyclic oligomers into architectures with point group or lattice symmetries. Current methods for docking and designing such assemblies are tailored to specific classes of symmetry and are difficult to modify for novel applications. Here we describe RPXDock, a fast, flexible, and modular software package for sequence-independent rigid-body protein docking across a wide range of symmetric architectures that is easily customizable for further development. RPXDock uses an efficient hierarchical search and a residue-pair transform ( RPX ) scoring method to rapidly search through multidimensional docking space. We describe the structure of the software, provide practical guidelines for its use, and describe the available functionalities including a variety of score functions and filtering tools that can be used to guide and refine docking results towards desired configurations. Author Summary Protein design methodologies are now able to generate, through a stepwise approach, a wide variety of self-assembling protein structures that begin to rival the structural complexity of naturally occurring protein nanomachines. Efficient methods for docking oligomeric protein building blocks in user-defined target symmetries are central to these techniques. We developed RPXDock as a fast and versatile method to systematically dock pre-existing proteins together into a multitude of asymmetrical and symmetrical architectures. RPXdock is also readily extendable to future applications through the addition of new symmetries, score functions, and filtering criteria.
1
Paper
Citation6
0
Save
1

Blueprinting expandable nanomaterials with standardized protein building blocks

Timothy Huddy et al.Jun 9, 2023
Abstract A wooden house frame consists of many different lumber pieces, but because of the regularity of these building blocks, the structure can be designed using straightforward geometrical principles. The design of multicomponent protein assemblies in comparison has been much more complex, largely due to the irregular shapes of protein structures 1 . Here we describe extendable linear, curved, and angled protein building blocks, as well as inter-block interactions that conform to specified geometric standards; assemblies designed using these blocks inherit their extendability and regular interaction surfaces, enabling them to be expanded or contracted by varying the number of modules, and reinforced with secondary struts. Using X-ray crystallography and electron microscopy, we validate nanomaterial designs ranging from simple polygonal and circular oligomers that can be concentrically nested, up to large polyhedral nanocages and unbounded straight “train track” assemblies with reconfigurable sizes and geometries that can be readily blueprinted. Because of the complexity of protein structures and sequence-structure relationships, it has not been previously possible to build up large protein assemblies by deliberate placement of protein backbones onto a blank 3D canvas; the simplicity and geometric regularity of our design platform now enables construction of protein nanomaterials according to “back of an envelope” architectural blueprints.
42

Increasing computational protein design literacy through cohort-based learning for undergraduate students

Erin Yang et al.May 25, 2022
Abstract Undergraduate research experiences can improve student success in graduate education and STEM careers. During the COVID-19 pandemic, undergraduate researchers at our institution and many others lost their work-study research positions due to interruption of in-person research activities. This imposed a financial burden on the students and eliminated an important learning opportunity. To address these challenges, we created a paid, fully-remote, cohort-based research curriculum in computational protein design. Our curriculum used existing protein design methods as a platform to first educate and train undergraduate students and then to test research hypotheses. In the first phase, students learned computational methods to assess the stability of designed protein assemblies. In the second phase, students used a larger dataset to identify factors that could improve the accuracy of current protein design algorithms. This cohort-based program created valuable new research opportunities for undergraduates at our institute and enhanced the undergraduates’ feeling of connection with the lab. Students learned transferable and useful skills such as literature review, programming basics, data analysis, hypothesis testing, and scientific communication. Our program provides a model of structured computational research training opportunities for undergraduate researchers in any field for organizations looking to expand educational access. Graphical Abstract
1

Rapid and automated design of two-component protein nanomaterials using ProteinMPNN

Robbert Haas et al.Aug 4, 2023
The design of novel protein-protein interfaces using physics-based design methods such as Rosetta requires substantial computational resources and manual refinement by expert structural biologists. A new generation of deep learning methods promises to simplify protein-protein interface design and enable its application to a wide variety of problems by researchers from various scientific disciplines. Here we test the ability of a deep learning method for protein sequence design, ProteinMPNN, to design two-component tetrahedral protein nanomaterials and benchmark its performance against Rosetta. ProteinMPNN had a similar success rate to Rosetta, yielding 13 new experimentally confirmed assemblies, but required orders of magnitude less computation and no manual refinement. The interfaces designed by ProteinMPNN were substantially more polar than those designed by Rosetta, which facilitated in vitro assembly of the designed nanomaterials from independently purified components. Crystal structures of several of the assemblies confirmed the accuracy of the design method at high resolution. Our results showcase the potential of deep learning-based methods to unlock the widespread application of designed protein-protein interfaces and self-assembling protein nanomaterials in biotechnology.