JZ
Jan Zrimec
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(57% Open Access)
Cited by:
258
h-index:
12
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
80

Supervised generative design of regulatory DNA for gene expression control

Jan Zrimec et al.Jul 15, 2021
Abstract In order to control gene expression, regulatory DNA variants are commonly designed using random synthetic approaches with mutagenesis and screening. This however limits the size of the designed DNA to span merely a part of a single regulatory region, whereas the whole gene regulatory structure including the coding and adjacent non-coding regions is involved in controlling gene expression. Here, we prototype a deep neural network strategy that models whole gene regulatory structures and generates de novo functional regulatory DNA with prespecified expression levels. By learning directly from natural genomic data, without the need for large synthetic DNA libraries, our ExpressionGAN can traverse the whole sequence-expression landscape to produce sequence variants with target mRNA levels as well as natural-like properties, including over 30% dissimilarity to any natural sequence. We experimentally demonstrate that this generative strategy is more efficient than a mutational one when using purely natural genomic data, as 57% of the newly-generated highly-expressed sequences surpass the expression levels of natural controls. We foresee this as a lucrative strategy to expand our knowledge of gene expression regulation as well as increase expression control in any desired organism for synthetic biology and metabolic engineering applications.
80
Citation3
0
Save
0

Gene expression is encoded in all parts of a co-evolving interacting gene regulatory structure

Jan Zrimec et al.Oct 4, 2019
Understanding the genetic regulatory code that governs gene expression is a primary, yet challenging aspiration in molecular biology that opens up possibilities to cure human diseases and solve biotechnology problems. However, the fundamental question of how each of the individual coding and non-coding regions of the gene regulatory structure interact and contribute to the mRNA expression levels remains unanswered. Considering that all the information for gene expression regulation is already present in living cells, here we applied deep learning on over 20,000 mRNA datasets in 7 model organisms ranging from bacteria to Human. We show that in all organisms, mRNA abundance can be predicted directly from the DNA sequence with high accuracy, demonstrating that up to 82% of the variation of gene expression levels is encoded in the gene regulatory structure. Coding and non-coding regions carry both overlapping and orthogonal information and additively contribute to gene expression levels. By searching for DNA regulatory motifs present across the whole gene regulatory structure, we discover that motif interactions can regulate gene expression levels in a range of over three orders of magnitude. The uncovered co-evolution of coding and non-coding regions challenges the current paradigm that single motifs or regions are solely responsible for gene expression levels. Instead, we show that the correct combination of all regulatory regions must be established in order to accurately control gene expression levels. Therefore, the holistic system that spans the entire gene regulatory structure is required to analyse, understand, and design any future gene expression systems.
0

Bayesian genome scale modelling identifies thermal determinants of yeast metabolism

Gang Li et al.Apr 2, 2020
The molecular basis of how temperature affects cell metabolism has been a long-standing question in biology, where the main obstacles are the lack of high-quality data and methods to associate temperature effects on the function of individual proteins as well as to combine them at a systems level. Here we develop and apply a Bayesian modeling approach to resolve the temperature effects in genome scale metabolic models (GEM). The approach minimizes uncertainties in enzymatic thermal parameters and greatly improves the predictive strength of the GEMs. The resulting temperature constrained yeast GEM uncovered enzymes that limit growth at superoptimal temperatures, and squalene epoxidase (ERG1) was predicted to be the most rate limiting. By replacing this single key enzyme with an ortholog from a thermotolerant yeast strain, we obtained a thermotolerant strain that outgrew the wild type, demonstrating the critical role of sterol metabolism in yeast thermosensitivity. Therefore, apart from identifying thermal determinants of cell metabolism and enabling the design of thermotolerant strains, our Bayesian GEM approach facilitates modelling of complex biological systems in the absence of high-quality data and therefore shows promise for becoming a standard tool for genome scale modeling.
36

Plastic-degrading potential across the global microbiome correlates with recent pollution trends

Jan Zrimec et al.Dec 13, 2020
Abstract Poor recycling has accumulated millions of tons of plastic waste in terrestrial and marine environments. While biodegradation is a plausible route towards sustainable management of plastic waste, the global diversity of plastic-degrading enzymes remains poorly understood. Taking advantage of global environmental DNA sampling projects, here we construct HMM models from experimentally-verified enzymes and mine ocean and soil metagenomes to assess the global potential of microorganisms to degrade plastics. By controlling for false positives using gut microbiome data, we compile a catalogue of over 30,000 non-redundant enzyme homologues with the potential to degrade 10 different plastic types. While differences between the ocean and soil microbiomes likely reflect the base compositions of these environments, we find that ocean enzyme abundance might increase with depth as a response to plastic pollution and not merely taxonomic composition. By obtaining further pollution measurements, we reveal that the abundance of the uncovered enzymes in both ocean and soil habitats significantly correlates with marine and country-specific plastic pollution trends. Our study thus uncovers the earth microbiome’s potential to degrade plastics, providing evidence of a measurable effect of plastic pollution on the global microbial ecology as well as a useful resource for further applied research.
0

Multiple plasmid origin-of-transfer substrates enable the spread of natural antimicrobial resistance to human pathogens

Jan ZrimecApr 20, 2020
Antimicrobial resistance poses a great danger to humanity, in part due to the widespread horizontal transfer of plasmids via conjugation. Modeling of plasmid transfer is essential to uncovering the fundamentals of resistance transfer and for development of predictive measures to limit the spread of resistance. However, a major limitation in the current understanding of plasmids is the inadequate characterization of the DNA transfer mechanisms, which conceals the actual potential for plasmid transfer in nature. Here, we consider that the plasmid-borne origin-of-transfer substrates encode specific DNA structural properties that can facilitate finding these regions in large datasets, and develop a DNA structure-based alignment procedure for typing the transfer substrates. Since our method outperforms current sequence-based approaches, we identify thousands of yet undiscovered DNA transfer substrates, showing that plasmid mobility is in fact 2-fold higher and spans almost 2-fold more host species than is currently known. Over half of all mobile plasmids contain the means to transfer between different mobility groups, which links previously confined host ranges across ecological habitats into a vast network of potential plasmid transfers. Certain types of conjugative transfer mechanisms and their corresponding hosts are transfer hubs that help break down the horizontal gene transfer barriers and form a robust gene flow system. We show that this network in fact serves to transfer resistance from the environmental genetic reservoirs to human MDR pathogens, which is an important driver of the observed rapid resistance development in humans and thus an important point of focus for future prevention measures.### Competing Interest StatementThe authors have declared no competing interest.
0

Expanding functional protein sequence space using generative adversarial networks

Donatas Repecka et al.Oct 2, 2019
De novo protein design for catalysis of any desired chemical reaction is a long standing goal in protein engineering, due to the broad spectrum of technological, scientific and medical applications. Currently, mapping protein sequence to protein function is, however, neither computationionally nor experimentally tangible [1][1],[2][2]. Here we developed ProteinGAN, a specialised variant of the generative adversarial network [3][3] that is able to ‘learn’ natural protein sequence diversity and enables the generation of functional protein sequences. ProteinGAN learns the evolutionary relationships of protein sequences directly from the complex multidimensional amino acid sequence space and creates new, highly diverse sequence variants with natural-like physical properties. Using malate dehydrogenase as a template enzyme, we show that 24% of the ProteinGAN-generated and experimentally tested sequences are soluble and display wild-type level catalytic activity in the tested conditions in vitro , even in highly mutated (>100 mutations) sequences. ProteinGAN therefore demonstrates the potential of artificial intelligence to rapidly generate highly diverse novel functional proteins within the allowed biological constraints of the sequence space. [1]: #ref-1 [2]: #ref-2 [3]: #ref-3
0

Integration of multi-omics and deep phenotyping provides novel insights into multiple abiotic stress responses in potato

Maja Zagorščak et al.Jul 23, 2024
Potato, the most important non-cereal crop, is highly water and space efficient but susceptible to abiotic stress such as heat, drought, or flooding. Climate change is severely increasing the likelihood of such stresses to occur individually, sequentially, or simultaneously. However, the understanding of acclimation to abiotic stress in crops in general, especially with multiple stresses, is still very limited. Here, we present a comprehensive one month-long molecular and physiological high-throughput profiling of potato (Solanum tuberosum, cv. Dsir;e) under both single and multiple abiotic stresses, designed to mimic realistic future scenarios. Acclimation time-responses were monitored via daily phenomic analysis and leaf samples were processed for multi-omics spanning from transcriptomics to proteomics and hormonomics. Additionally, critical metabolites of tuber samples were analysed at the end of the period. To facilitate the multi-omics analyses, the dataset was integrated with prior knowledge, which is indispensable for development of high-throughput pipelines in agricultural research. Waterlogging had the most immediate and dramatic effects, with responses similar to drought stress. In addition, we observed distinct stress signatures at multiple molecular levels in response to heat or drought and to a combination of both. In general, there was a downregulation of photosynthesis at different molecular levels, accumulation of minor amino acids and diverse stress induced hormones. Our integrative multi-omics analysis provides global insights into plant stress responses, facilitating improved breeding strategies.
Load More