JA
Johan Andreasson
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
7
(29% Open Access)
Cited by:
187
h-index:
14
/
i10-index:
15
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

High-throughput biochemical profiling reveals Cas9 off-target binding and unbinding heterogeneity

Evan Boyle et al.Jun 19, 2016
The bacterial adaptive immune system CRISPR-Cas9 has been appropriated as a versatile tool for editing genomes, controlling gene expression, and visualizing genetic loci. To analyze Cas9′s ability to bind DNA rapidly and specifically, we measured the kinetics of catalytically dead Cas9 (dCas9) interactions with a library of potential binding partners. Using a massively parallel assay of protein-DNA interactions derived from a high-throughput sequencing flow cell (HiTS-FLIP) and building on the established importance of protospacer adjacent motif (PAM) and seed recognition, we identify two PAM-distal regions, proximal and distal to the seed region, with distinct behaviors: multiple mismatches in the seed-proximal region work in a highly synergistic manner to reduce Cas9 association whereas seemingly tolerated mismatches in the distal region precipitate comparatively rapid dissociation of Cas9. Together, these observations support a model for Cas9 specificity wherein gRNA-DNA mismatches at distinct domains of PAM-distal bases modulate different biophysical parameters of association and dissociation, opening the possibility of kinetic and thermodynamic tuning of the Cas9-DNA interaction and quantitative prediction of off-target binding behaviors.
0

Prospects for recurrent neural network models to learn RNA biophysics from high-throughput data

Michelle Wu et al.Dec 1, 2017
RNA is a functionally versatile molecule that plays key roles in genetic regulation and in emerging technologies to control biological processes. Computational models of RNA secondary structure are well-developed but often fall short in making quantitative predictions of the behavior of multi-RNA complexes. Recently, large datasets characterizing hundreds of thousands of individual RNA complexes have emerged as rich sources of information about RNA energetics. Meanwhile, advances in machine learning have enabled the training of complex neural networks from large datasets. Here, we assess whether a recurrent neural network model, Ribonet, can learn from high-throughput binding data, using simulation and experimental studies to test model accuracy but also determine if they learned meaningful information about the biophysics of RNA folding. We began by evaluating the model on energetic values predicted by the Turner model to assess whether the neural network could learn a representation that recovered known biophysical principles. First, we trained Ribonet to predict the simulated free energy of an RNA in complex with multiple input RNAs. Our model accurately predicts free energies of new sequences but also shows evidence of having learned base pairing information, as assessed by in silico double mutant analysis. Next, we extended this model to predict the simulated affinity between an arbitrary RNA sequence and a reporter RNA. While these more indirect measurements precluded the learning of basic principles of RNA biophysics, the resulting model achieved sub-kcal/mol accuracy and enabled design of simple RNA input responsive riboswitches with high activation ratios predicted by the Turner model from which the training data were generated. Finally, we compiled and trained on an experimental dataset comprising over 600,000 experimental affinity measurements published on the Eterna open laboratory. Though our tests revealed that the model likely did not learn a physically realistic representation of RNA interactions, it nevertheless achieved good performance of 0.76 kcal/mol on test sets with the application of transfer learning and novel sequence-specific data augmentation strategies. These results suggest that recurrent neural network architectures, despite being naïve to the physics of RNA folding, have the potential to capture complex biophysical information. However, more diverse datasets, ideally involving more direct free energy measurements, may be necessary to train de novo predictive models that are consistent with the fundamentals of RNA biophysics.
0

Automated design of highly diverse riboswitches

Michelle Wu et al.Apr 9, 2019
Riboswitches that couple binding of ligands to recruitment of molecular machines offer sensors and control elements for RNA synthetic biology and medical biotechnology. Current approaches to riboswitch design enable significant changes in output activity in the presence vs. absence of input ligands. However, design of these riboswitches has so far required expert intuition and explicit specification of complete target secondary structures, both of which limit the structure-toggling mechanisms that have been explored. We present a fully automated method called RiboLogic for these design tasks and high-throughput experimental tests of 2,875 molecules using RNA-MaP (RNA on a massively parallel array) technology. RiboLogic designs explore an unprecedented diversity of structure-toggling mechanisms validated through experimental tests. These synthetic molecules consistently modulate their affinity to the MS2 bacteriophage coat protein upon binding of flavin mononucleotide, tryptophan, theophylline, and microRNA miR-208a, achieving activation ratios of up to 20 and significantly better performance than control designs. The data enable dissection of features of structure-toggling mechanisms that correlate with higher performance. The diversity of RiboLogic designs and their quantitative experimental characterization provides a rich resource for further improvement of riboswitch models and design methods.