JB
Jacob Beal
Author with expertise in Stochasticity in Gene Regulatory Networks
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
14
(71% Open Access)
Cited by:
27
h-index:
38
/
i10-index:
103
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Robust Estimation of Bacterial Cell Count from Optical Density

Jacob Beal et al.Oct 13, 2019
+9
T
N
J
Abstract Optical density (OD) is a fast, cheap, and high-throughput measurement widely used to estimate the density of cells in liquid culture. These measurements, however, cannot be compared between instruments without a standardized calibration protocol and are challenging to relate to actual cell count. We address these shortcomings with an interlaboratory study comparing three OD calibration protocols, as applied to eight strains of E. coli engineered to constitutively express varying levels of GFP. These three protocols—comparison with colloidal silica (LUDOX), serial dilution of silica microspheres, and a reference colony-forming unit (CFU) assay—are all simple, low-cost, and highly accessible. Based on the results produced by the 244 teams completing this interlaboratory study, we recommend calibrating OD using serial dilution of silica microspheres, which readily produces highly precise calibration (95.5% of teams having residuals less than 1.2-fold), is easily assessed for quality control, and as a side effect also assesses the effective linear range of an instrument. Moreover, estimates of cell count from silica microspheres can be combined with fluorescence calibration against fluorescein to obtain units of Molecules of Equivalent Fluorescein (MEFL), allowing direct comparison and data fusion with equivalently calibrated flow cytometry measurements: in our study, fluorescence per cell measurements showed only a 1.07-fold mean difference between plate reader and flow cytometry data.
0
Citation10
0
Save
6

Robustness and reproducibility of simple and complex synthetic logic circuit designs using a DBTL loop

Bree Cummins et al.Jun 11, 2022
+29
R
J
B
Abstract Computational tools addressing various components of design-build-test-learn loops (DBTL) for the construction of synthetic genetic networks exist, but do not generally cover the entire DBTL loop. This manuscript introduces an end-to-end sequence of tools that together form a DBTL loop called DART (Design Assemble Round Trip). DART provides rational selection and refinement of genetic parts to construct and test a circuit. Computational support for experimental process, metadata management, standardized data collection, and reproducible data analysis is provided via the previously published Round Trip (RT) test-learn loop. The primary focus of this work is on the Design Assemble (DA) part of the tool chain, which improves on previous techniques by screening up to thousands of network topologies for robust performance using a novel robustness score derived from dynamical behavior based on circuit topology only. In addition, novel experimental support software is introduced for the assembly of genetic circuits. A complete design-through-analysis sequence is presented using several OR and NOR circuit designs, with and without structural redundancy, that are implemented in budding yeast. The execution of DART tested the predictions of the design tools, specifically with regard to robust and reproducible performance under different experimental conditions. The data analysis depended on a novel application of machine learning techniques to segment bimodal flow cytometry distributions. Evidence is presented that, in some cases, a more complex build may impart more robustness and reproducibility across experimental conditions.
1

Excel-SBOL Converter: Creating SBOL from Excel Templates and Vice Versa

Jeanet Mante et al.Aug 31, 2022
+4
S
J
J
Abstract Standards support synthetic biology research by enabling the exchange of component information. However, using formal representations, such as the Synthetic Biology Open Language (SBOL), typically requires either a thorough understanding of these standards or a suite of tools developed in concurrence with the ontologies. Since these tools may be a barrier for use by many practitioners, the Excel-SBOL Converter was developed to allow easier use of SBOL and integration into existing workflows. The converter consists of two Python libraries: one that converts Excel templates to SBOL, and another that converts SBOL to an Excel workbook. Both libraries can be used either directly or via a SynBioHub plugin. We illustrate the operation of the Excel-SBOL Converter with two case studies: uploading experimental data with the study’s metadata linked to the measurements and downloading the Cello part repository. Graphical TOC Entry
1
Paper
Citation3
0
Save
6

Computational Prediction of Synthetic Circuit Function Across Growth Conditions

Bree Cummins et al.Jun 13, 2022
+28
K
J
B
Abstract A challenge in the design and construction of synthetic genetic circuits is that they will operate within biological systems that have noisy and changing parameter regimes that are largely unmeasurable. The outcome is that these circuits do not operate within design specifications or have a narrow operational envelope in which they can function. This behavior is often observed as a lack of reproducibility in function from day to day or lab to lab. Moreover, this narrow range of operating conditions does not promote reproducible circuit function in deployments where environmental conditions for the chassis are changing, as environmental changes can affect the parameter space in which the circuit is operating. Here we describe a computational method for assessing the robustness of circuit function across broad parameter regions. Previously designed circuits are assessed by this computational method and then circuit performance is measured across multiple growth conditions in budding yeast. The computational predictions are correlated with experimental findings, suggesting that the approach has predictive value for assessing the robustness of a circuit design.
12

Highly-Automated, High-Throughput Replication of Yeast-based Logic Circuit Design Assessments

Robert Goldman et al.Jun 1, 2022
+33
N
R
R
Abstract We describe an experimental campaign that replicated the performance assessment of logic gates engineered into cells of S. cerevisiae by Gander, et al . Our experimental campaign used a novel high throughput experimentation framework developed under DARPA’s Synergistic Discovery and Design (SD2) program: a remote robotic lab at Strateos executed a parameterized experimental protocol. Using this protocol and robotic execution, we generated two orders of magnitude more flow cytometry data than the original experiments. We discuss our results, which largely, but not completely, agree with the original report, and make some remarks about lessons learned.
6

Studying Pathogens Degrades BLAST-based Pathogen Identification

Jacob Beal et al.Jul 13, 2022
J
A
J
Abstract As synthetic biology becomes increasingly capable and accessible, it is likewise increasingly critical to be able to make accurate biosecurity determinations regarding the pathogenicity or toxicity of particular nucleic acid or amino acid sequences. At present, this is typically done using the BLAST algorithm to determine the best match with sequences in the NCBI databases. Neither BLAST nor the NCBI databases, however, are actually designed for biosafety determination. Critically, taxonomic errors or ambiguities in the NCBI databases can also cause errors in BLAST-based taxonomic categorization. With heavily studied taxa and frequently used biotechnology tools, even low frequency taxonomic categorization issues can lead to high rates of errors in biosecurity decision-making. Here we focus on the implications for false positives, finding that NCBI BLAST will now incorrectly categorize a number of commonly used biotechnology tool sequences as the pathogens or toxins with which they have been used. Paradoxically, this implies that problems are expected to be most acute for the pathogens and toxins of highest interest and the most widely used biotechnology tools. We thus conclude that biosecurity tools should shift away from BLAST against NCBI and towards new methods that are specifically tailored for biosafety purposes.
6
Paper
Citation2
0
Save
1

Data Representation in the DARPA SD2 Program

Nicholas Roehner et al.Sep 18, 2021
+11
B
J
N
1 SUMMARY Modern scientific enterprises are often highly complex and multidisciplinary, particularly in areas like synthetic biology where the subject at hand is itself inherently complex and multidisciplinary. Collaboration across many organizations is necessary to efficiently tackle such problems [6, 15], but remains difficult. The challenge is further amplified by automation that increases the pace at which new information can be produced, and particularly so for matters of fundamental research, where concepts and definitions are inherently fluid and may rapidly change as an investigation evolves [7]. The DARPA program Synergistic Discovery and Design (SD2) aimed to address these challenges by organizing the development of data-driven methods to accelerate discovery and improve design robustness, with one of the key domains under study being synthetic biology. The program was specifically organized such that teams provided complementary types of expertise and resources, and without any team being in a dominant organizational position, such that subject-matter investigations would necessarily require peer-level collaboration across multiple team boundaries. With more than 100 researchers across more than 20 organizations, several of which ran experimental facilities with high-throughput automation, participants were forced to confront challenges around effective data sharing. The default architecture for scientific collaboration is essentially one of anarchy, with ad-hoc bilateral relations between pairs of collaborators or experimental phases (Figure 1(a)). This was by necessity the case during early phases of the SD2 program as well, in which incorporating new tools into pipelines was ad-hoc and time-consuming, and data was generally disconnected from genetic designs and experimental plans. The other typical approach for collaboration is one of “command and control”, in which a dominant organization determines the data sharing content and format for all participants (Figure 1(b)). This can be efficient, but tends to be limited in flexibility and extensibility, rendering it unsuitable for research collaboration, as indeed was found when we attempted this approach during the first year of the SD2 program. We addressed these problems with the application of distributed standards to create a “flexible rendezvous” model of collaboration (Figure 1(c)), enabling information flow to track evolving collaborative relationships, improving the sharing and utility of information across the community and supporting accelerated rates of experimentation.
1
Citation1
0
Save
3

Building an Open Representation for Biological Protocols

Bryan Bartley et al.Jul 8, 2022
+8
P
J
B
Laboratory protocols are critical to biological research and development, yet difficult to communicate and reproduce across projects, investigators, and organizations. While many attempts have been made to address this challenge, there is currently no available protocol representation that is unambiguous enough for precise interpretation and automation, yet simultaneously abstract enough to enable reuse and adaptation. The Protocol Activity Markup Language (PAML) is a free and open protocol representation aiming to address this gap, building on a foundation of UML, Autoprotocol, and SBOL RDF. PAML provides a representation both for protocols and for records of their execution and the resulting data, as well as a framework for exporting from PAML for execution by either humans or laboratory automation. PAML is currently implemented in the form of an RDF knowledge representation, specification document, and Python library, can be exported for execution as either a manual “paper protocol” or Autoprotocol, and is being further developed as an open community effort.
1

Meeting Measurement Precision Requirements for Effective Engineering of Genetic Regulatory Networks

Jacob Beal et al.Oct 10, 2021
+5
J
B
J
Abstract Reliable, predictable engineering of cellular behavior is one of the key goals of synthetic biology. As the field matures, biological engineers will become increasingly reliant on computer models that allow for the rapid exploration of design space prior to the more costly construction and characterization of candidate designs. The efficacy of such models, however, depends on the accuracy of their predictions, the precision of the measurements used to parameterize the models, and the tolerance of biological devices for imperfections in modeling and measurement. To better understand this relationship, we have derived an Engineering Error Inequality that provides a quantitative mathematical bound on the relationship between predictability of results, model accuracy, measurement precision, and device characteristics. We apply this relation to estimate measurement precision requirements for engineering genetic regulatory networks given current model and device characteristics, recommending a target standard deviation of 1.5-fold. We then compare these requirements with the results of an interlaboratory study to validate that these requirements can be met via flow cytometry with matched instrument channels and an independent calibrant. Based on these results, we recommend a set of best practices for quality control of flow cytometry data and discuss how these might be extended to other measurement modalities and applied to support further development of genetic regulatory network engineering.
0

Highly Distinguished Amino Acid Sequences of 2019-nCoV (Wuhan Coronavirus)

Jacob Beal et al.Feb 2, 2020
+2
D
T
J
Using a method for pathogen screening in DNA synthesis orders, we have identified a number of amino acid sequences that distinguish 2019-nCoV (Wuhan Coronavirus) from all other known viruses in Coronaviridae. We find three main regions of unique sequence: two in the 1ab polyprotein QHO60603.1, one in surface glycoprotein QHO60594.1.
Load More