SG
Sarah Gurev
Author with expertise in Evolutionary Dynamics of Genetic Adaptation and Mutation
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(67% Open Access)
Cited by:
0
h-index:
4
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
22

Removing bias in sequence models of protein fitness

Ada Shaw et al.Jan 1, 2023
+3
J
H
A
Unsupervised sequence models for protein fitness have emerged as powerful tools for protein design in order to engineer therapeutics and industrial enzymes, yet they are strongly biased towards potential designs that are close to their training data. This hinders their ability to generate functional sequences that are far away from natural sequences, as is often desired to design new functions. To address this problem, we introduce a de-biasing approach that enables the comparison of protein sequences across mutational depths to overcome the extant sequence similarity bias in natural sequence models. We demonstrate our method9s effectiveness at improving the relative natural sequence model predictions of experimentally measured variant functions across mutational depths. Using case studies proteins with very low functional percentages further away from the wild type, we demonstrate that our method improves the recovery of top-performing variants in these sparsely functional regimes. Our method is generally applicable to any unsupervised fitness prediction model, and for any function for any protein, and can thus easily be incorporated into any computational protein design pipeline. These studies have the potential to develop more efficient and cost-effective computational methods for designing diverse functional proteins and to inform underlying experimental library design to best take advantage of machine learning capabilities.
5

Deep generative models predict SARS-CoV-2 Spike infectivity and foreshadow neutralizing antibody escape

Noor Youssef et al.Oct 10, 2023
+21
F
S
N
Abstract Recurrent waves of SARS-CoV-2 infection, driven by the periodic emergence of new viral variants, highlight the need for vaccines and therapeutics that remain effective against future strains. Yet, our ability to proactively evaluate such therapeutics is limited to assessing their effectiveness against previous or circulating variants, which may differ significantly in their antibody escape from future viral evolution. To address this challenge, we developed deep learning methods to predict the effect of mutations on fitness and escape from neutralizing antibodies and used this information to engineer a set of 68 unique SARS-CoV-2 Spike proteins. The designed constructs, which incorporated novel combinations of up to 46 mutations relative to the ancestral strain, were infectious and evaded neutralization by nine well-characterized panels of human polyclonal anti-SARS-CoV-2 immune sera. Designed constructs on previous SARS-CoV-2 strains anticipated the antibody neutralization escape of variants seen subsequently during the COVID-19 pandemic. We demonstrate that designed Spike constructs using data available at the time of the implementation of the 2022 bivalent mRNA booster vaccine foretold the level of neutralizing antibody escape observed in the most recently emerging variants. Our approach provides extensive datasets of antigenically diverse escape variants to evaluate the protective ability of vaccines and therapeutics to inhibit future variants. This approach is generalizable to other viral pathogens.
71

Learning from pre-pandemic data to forecast viral escape

Nicole Thadani et al.Jul 22, 2022
+5
Y
S
N
Summary Effective pandemic preparedness relies on anticipating viral mutations that are able to evade host immune responses in order to facilitate vaccine and therapeutic design. However, current strategies for viral evolution prediction are not available early in a pandemic – experimental approaches require host polyclonal antibodies to test against and existing computational methods draw heavily from current strain prevalence to make reliable predictions of variants of concern. To address this, we developed EVEscape, a generalizable, modular framework that combines fitness predictions from a deep learning model of historical sequences with biophysical structural information. EVEscape quantifies the viral escape potential of mutations at scale and has the advantage of being applicable before surveillance sequencing, experimental scans, or 3D structures of antibody complexes are available. We demonstrate that EVEscape, trained on sequences available prior to 2020, is as accurate as high-throughput experimental scans at anticipating pandemic variation for SARS-CoV-2 and is generalizable to other viruses including Influenza, HIV, and understudied viruses with pandemic potential such as Lassa and Nipah. We provide continually updated escape scores for all current strains of SARS-CoV-2 and predict likely additional mutations to forecast emerging strains as a tool for ongoing vaccine development ( evescape.org ).