ZS
Zachary Sun
Author with expertise in Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR-associated proteins
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(58% Open Access)
Cited by:
2,757
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Programming cells by multiplex genome engineering and accelerated evolution

Harris Wang et al.Jul 26, 2009
Genomic diversity is difficult to generate in the laboratory in an efficient way. A new technique called MAGE (multiplex automated genome engineering), described here, simultaneously targets many locations on the chromosome for modification in a single cell or across a population of cells, thereby producing combinatorial genomic diversity. This is an automated and efficient approach that expedites the design and evolution of organisms with new and improved properties. Genomic diversity is difficult to generate in the laboratory in an efficient way. Here, multiplex automated genome engineering (MAGE) is described for large-scale programming and evolution of cells. It is an automated and efficient approach that expedites the design and evolution of organisms with new and improved properties. The breadth of genomic diversity found among organisms in nature allows populations to adapt to diverse environments1,2. However, genomic diversity is difficult to generate in the laboratory and new phenotypes do not easily arise on practical timescales3. Although in vitro and directed evolution methods4,5,6,7,8,9 have created genetic variants with usefully altered phenotypes, these methods are limited to laborious and serial manipulation of single genes and are not used for parallel and continuous directed evolution of gene networks or genomes. Here, we describe multiplex automated genome engineering (MAGE) for large-scale programming and evolution of cells. MAGE simultaneously targets many locations on the chromosome for modification in a single cell or across a population of cells, thus producing combinatorial genomic diversity. Because the process is cyclical and scalable, we constructed prototype devices that automate the MAGE technology to facilitate rapid and continuous generation of a diverse set of genetic changes (mismatches, insertions, deletions). We applied MAGE to optimize the 1-deoxy-d-xylulose-5-phosphate (DXP) biosynthesis pathway in Escherichia coli to overproduce the industrially important isoprenoid lycopene. Twenty-four genetic components in the DXP pathway were modified simultaneously using a complex pool of synthetic DNA, creating over 4.3 billion combinatorial genomic variants per day. We isolated variants with more than fivefold increase in lycopene production within 3 days, a significant improvement over existing metabolic engineering techniques. Our multiplex approach embraces engineering in the context of evolution by expediting the design and evolution of organisms with new and improved properties.
0
Citation1,455
0
Save
0

Protocols for Implementing an <em>Escherichia coli</em> Based TX-TL Cell-Free Expression System for Synthetic Biology

Zachary Sun et al.Sep 16, 2013
Ideal cell-free expression systems can theoretically emulate an in vivo cellular environment in a controlled in vitro platform.1 This is useful for expressing proteins and genetic circuits in a controlled manner as well as for providing a prototyping environment for synthetic biology.2,3 To achieve the latter goal, cell-free expression systems that preserve endogenous Escherichia coli transcription-translation mechanisms are able to more accurately reflect in vivo cellular dynamics than those based on T7 RNA polymerase transcription. We describe the preparation and execution of an efficient endogenous E. coli based transcription-translation (TX-TL) cell-free expression system that can produce equivalent amounts of protein as T7-based systems at a 98% cost reduction to similar commercial systems.4,5 The preparation of buffers and crude cell extract are described, as well as the execution of a three tube TX-TL reaction. The entire protocol takes five days to prepare and yields enough material for up to 3000 single reactions in one preparation. Once prepared, each reaction takes under 8 hr from setup to data collection and analysis. Mechanisms of regulation and transcription exogenous to E. coli, such as lac/tet repressors and T7 RNA polymerase, can be supplemented.6 Endogenous properties, such as mRNA and DNA degradation rates, can also be adjusted.7 The TX-TL cell-free expression system has been demonstrated for large-scale circuit assembly, exploring biological phenomena, and expression of proteins under both T7- and endogenous promoters.6,8 Accompanying mathematical models are available.9,10 The resulting system has unique applications in synthetic biology as a prototyping environment, or "TX-TL biomolecular breadboard."
0
Citation344
0
Save
76

Deep neural language modeling enables functional protein generation across families

Ali Madani et al.Jul 18, 2021
Bypassing nature’s evolutionary trajectory, de novo protein generation—defined as creating artificial protein sequences from scratch—could enable breakthrough solutions for biomedical and environmental challenges. Viewing amino acid sequences as a language, we demonstrate that a deep learning-based language model can generate functional artificial protein sequences across families, akin to generating grammatically and semantically correct natural language sentences on diverse topics. Our protein language model is trained by simply learning to predict the next amino acid for over 280 million protein sequences from thousands of protein families, without biophysical or coevolutionary modeling. We experimentally evaluate model-generated artificial proteins on five distinct antibacterial lysozyme families. Artificial proteins show similar activities and catalytic efficiencies as representative natural lysozymes, including hen egg white lysozyme, while reaching as low as 44% identity to any known naturally-evolved protein. The X-ray crystal structure of an enzymatically active artificial protein recapitulates the conserved fold and positioning of active site residues found in natural proteins. We demonstrate our language model’s ability to be adapted to different protein families by accurately predicting the functionality of artificial chorismate mutase and malate dehydrogenase proteins. These results indicate that neural language models successfully perform de novo protein generation across protein families and may prove to be a tool to shortcut evolution.
0

A cell-free framework for biological systems engineering

Henrike Niederholtmeyer et al.Apr 21, 2015
While complex dynamic biological networks control gene expression and metabolism in all living organisms, engineering comparable synthetic networks remains challenging1,2. Conducting extensive, quantitative and rapid characterization during the design and implementation process of synthetic networks is currently severely limited due to cumbersome molecular cloning and the difficulties associated with measuring parts, components and systems in cellular hosts. Engineering gene networks in a cell-free environment promises to be an efficient and effective approach to rapidly develop novel biological systems and understand their operating regimes3-5. However, it remains questionable whether complex synthetic networks behave similarly in cells and a cell-free environment, which is critical for in vitro approaches to be of significance to biological engineering. Here we show that synthetic dynamic networks can be readily implemented, characterized, and engineered in a cell-free framework and consequently transferred to cellular hosts. We implemented and characterized the “repressilator”6, a three-node negative feedback oscillator in vitro. We then used our cell-free framework to engineer novel three-node, four-node, and five-node negative feedback architectures going from the characterization of circuit components to the rapid analysis of complete networks. We validated our cell-free approach by transferring these novel three-node and five-node oscillators to Escherichia coli, resulting in robust and synchronized oscillations reflecting the in vitro observation. We demonstrate that comprehensive circuit engineering can be performed in a cell-free system and that the in vitro results have direct applicability in vivo. Cell-free synthetic biology thus has the potential to drastically speed up design-build-test cycles in biological engineering and enable the quantitative characterization of synthetic and natural networks.
0

Protein degradation in a TX-TL cell-free expression system using ClpXP protease

Zachary Sun et al.May 22, 2015
An in vitro S30-based Escherichia coli expression system (“Transcription-Translation”, or “TX-TL”) has been developed as an alternative prototyping environment to the cell for synthetic circuits [1-5]. Basic circuit elements, such as switches and cascades, have been shown to function in TX-TL, as well as bacteriophage assembly [2, 6]. Circuits can also be prototyped from basic parts within 8 hours, avoiding cloning and transformation steps [7]. However, most published results have been obtained in a “batch mode” reaction, where factors that play an important role for in vivo circuit dynamics – namely protein degradation and protein dilution – are severely hindered or are not present. This limits the complexity of circuits built in TX-TL without steady-state or continuous-flow solutions [8-10]. However, alternate methods that enable dilution either require extra equipment and expertise or demand lower reaction throughput. We explored the possibility of supplementing TX-TL with ClpXP, an AAA+ protease pair that selectively degrades tagged proteins [11], to provide finely-tuned degradation. The mechanism of ClpXP degradation has been extensively studied both in vitro and in vivo [12-15]. However, it has not been characterized for use in synthetic circuits – metrics such as toxicity, ATP usage, degradation variation over time, and cellular loading need to be determined. In particular, TX-TL in batch mode is known to be resource limited [16], and ClpXP is known to require significant amounts of ATP to unfold different protein targets [17, 18]. We find that ClpXP’s protein degradation dynamics is dependent on protein identity, but can be determined experimentally. Degradation follows Michaels-Menten kinetics, and can be fine tuned by ClpX or ClpP concentration. Added purified ClpX is also not toxic to TX-TL reactions. Therefore, ClpXP provides a controllable way to introduce protein degradation and dynamics into synthetic circuits in TX-TL.
Load More