JV
Jiřı́ Vondrášek
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(83% Open Access)
Cited by:
32
h-index:
35
/
i10-index:
91
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
78

The LOTUS Initiative for Open Natural Products Research: Knowledge Management through Wikidata

Adriano Rutz et al.Mar 1, 2021
+13
M
J
A
Abstract Contemporary bioinformatic and chemoinformatic capabilities hold promise to reshape knowledge management, analysis and interpretation of data in natural products research. Currently, reliance on a disparate set of non-standardized, insular, and specialized databases presents a series of challenges for data access, both within the discipline and for integration and interoperability between related fields. The fundamental elements of exchange are referenced structure-organism pairs that establish relationships between distinct molecular structures and the living organisms from which they were identified. Consolidating and sharing such information via an open platform has strong transformative potential for natural products research and beyond. This is the ultimate goal of the newly established LOTUS initiative, which has now completed the first steps toward the harmonization, curation, validation and open dissemination of 750,000+ referenced structure-organism pairs. LOTUS data is hosted on Wikidata and regularly mirrored on https://lotus.naturalproducts.net . Data sharing within the Wikidata framework broadens data access and interoperability, opening new possibilities for community curation and evolving publication models. Furthermore, embedding LOTUS data into the vast Wikidata knowledge graph will facilitate new biological and chemical insights. The LOTUS initiative represents an important advancement in the design and deployment of a comprehensive and collaborative natural products knowledge base.
78
Citation31
0
Save
1

Unevolved proteins from modern and prebiotic amino acids manifest distinct structural profiles

Vyacheslav Tretyachenko et al.Aug 29, 2021
+3
T
J
V
Abstract Natural proteins represent numerous but tiny structure/function islands in a vast ocean of possible protein sequences, most of which has not been explored by either biological evolution or research. Recent studies have suggested this uncharted sequence space possesses surprisingly high structural propensity, but development of an understanding of this phenomenon has been awaiting a systematic high-throughput approach. Here, we designed, prepared, and characterized two combinatorial protein libraries consisting of randomized proteins, each 105 residues in length. The first library constructed proteins from the entire canonical alphabet of 20 amino acids. The second library used a subset of only 10 residues (A,S,D,G,L,I,P,T,E,V) that represent a consensus view of plausibly available amino acids through prebiotic chemistry. Our study shows that compact conformations resistant to proteolysis are (i) abundant (up to 40%) in random sequence space, (ii) independent of general Hsp70 chaperone system activity, and (iii) not granted solely by “late” and complex amino acid additions. The Hsp70 chaperone system effectively increases solubility and refoldability of the canonical alphabet but has only a minor impact on the “early” library. The early alphabet proteins are inherently more soluble and refoldable, possibly assisted by the cell-like environment in which these assays were performed. Our work indicates that both early and modern amino acids are predisposed to supporting protein structure (either in forms of oligomers or globular/molten globule structures) and that protein structure may not be a unique outcome of evolution.
1
Citation1
0
Save
5

Enzyme catalysis prior to aromatic residues: reverse engineering of a dephosphoCoA kinase

Mikhail Makarov et al.Nov 11, 2020
+7
V
A
M
Abstract It is well-known that the large diversity of protein functions and structures is derived from the broad spectrum of physicochemical properties of the 20 canonical amino acids. According to the generally accepted hypothesis, protein evolution was continuously associated with enrichment of this alphabet, increasing stability, specificity and spectrum of catalytic functions. Aromatic amino acids are considered the latest addition to genetic code. The main objective of this study was to test whether enzymatic catalysis can spare the aromatic amino acids (aromatics) by determining the effect of amino acid alphabet reduction on structure and function of dephospho-CoA kinase (DPCK). We designed two mutant variants of a putative DPCK from Aquifex aeolicus by substituting (i) Tyr, Phe and Trp or (ii) all aromatics (including His), i.e. ∼10% of the total sequence. Their structural characterization indicates that removal of aromatic amino acids may support rich secondary structure content although inevitably impairs a firm globular arrangement. Both variants still possess ATPase activity, although with 150-300 times lower efficiency in comparison with the wild-type phosphotransferase activity. The transfer of the phosphate group to the dephospho-CoA substrate is however heavily uncoupled and only one of the variants is still able to perform the reaction. Here we provide support to the hypothesis that proteins in the early stages of life could support at least some enzymatic activities, despite lower efficiencies resulting from the lack of a firm hydrophobic core. Based on the presented data we hypothesize that further protein scaffolding role may be provided by ligands upon binding. Significance All extant proteins rely on the standard coded amino acid alphabet. However, early proteins lacked some of these amino acids that were incorporated into the genetic code only after the evolution of their respective metabolic pathways, aromatic amino acids being among the last additions. This is intriguing because of their crucial role in hydrophobic core packing, indispensable for enzyme catalysis. We designed two aromatics-less variants of a highly conserved enzyme from the CoA synthesis pathway, capable of enzyme catalysis and showing significant ordering upon substrate binding. To our knowledge, this is the first example of enzyme catalysis in complete absence of aromatic amino acids and presents a possible mechanism of how aromatics-less enzymes could potentially support an early biosphere.
0

Identification of the trail-following pheromone receptor in termites

Souleymane Diallo et al.Jul 25, 2024
+10
J
K
S
ABSTRACT Chemical communication is the cornerstone of eusocial insect societies since it mediates the social hierarchy, division of labor, and concerted activities of colony members. The chemistry of social insect pheromones received considerable attention in both major groups of social insects, the eusocial Hymenoptera and termites. By contrast, current knowledge on molecular mechanisms of social insect pheromone detection by odorant receptors (ORs) is limited to hymenopteran social insects and no OR was yet functionally characterized in termites, the oldest eusocial insect clade. Here, we present the first OR deorphanization in termites. Using the data from antennal transcriptome and genome of the termite Prorhinotermes simplex (Rhinotermitidae), we selected 4 candidate OR sequences, expressed them in Empty Neuron Drosophila , and functionally characterized using single sensillum recording (SSR) and a panel of termite semiochemicals. In one of the selected ORs, PsimOR14, we succeeded in obtaining strong and reliable responses to the main component of P. simplex trail-following pheromone, the monocyclic diterpene neocembrene. PsimOR14 showed a narrow tuning to neocembrene; only one additional compound out of 72 tested (geranylgeraniol) generated non-negligible responses. Subsequently, we used SSR and P. simplex workers to identify the olfactory sensillum specifically responding to neocembrene, thus likely expressing PsimOR14 . We report on homology-based modelling of neocembrene binding by PsimOR14 and show how different ligands impact the receptor dynamicity using molecular dynamics simulations. Finally, we demonstrate that PsimOR14 is significantly more expressed in workers than in soldiers, which correlates with higher sensitivity of workers to neocembrene.
0

SOM-based embedding improves efficiency of high-dimensional cytometry data analysis

Miroslav Kratochvíl et al.Dec 20, 2018
+5
J
A
M
Efficient unbiased data analysis is a major challenge for laboratories handling large flow and mass cytometry datasets. We present EmbedSOM, a non-linear embedding algorithm based on FlowSOM that improves the analysis by providing high-performance embedding method for the cytometry data. The algorithm is designed for linear scaling with number of data points, and speed suitable for interactive analysis of millions of cells without downsampling. At the same time, the visualization quality of single cell distribution within cellular populations and their transition states is competitive with the current state-of-the-art algorithms. We demonstrate EmbedSOM properties on two use-cases, showing benefits of using the interactive algorithm speed in supervised hierarchical dissection of cell populations, and the scalability improvement by efficiently processing very large datasets.
41

GigaSOM.jl: High-performance clustering and visualization of huge cytometry datasets

Miroslav Kratochvíl et al.Aug 4, 2020
+6
L
O
M
Abstract Background The amount of data generated in large clinical and phenotyping studies that use single-cell cytometry is constantly growing. Recent technological advances allow to easily generate data with hundreds of millions of single-cell data points with more than 40 parameters, originating from thousands of individual samples. The analysis of that amount of high-dimensional data becomes demanding in both hardware and software of high-performance computational resources. Current software tools often do not scale to the datasets of such size; users are thus forced to down-sample the data to bearable sizes, in turn losing accuracy and ability to detect many underlying complex phenomena. Results We present GigaSOM.jl, a fast and scalable implementation of clustering and dimensionality-reduction for flow and mass cytometry data. The implementation of GigaSOM.jl in the high-level and high-performance programming language Julia makes it accessible to the scientific community, and allows for efficient handling and processing of datasets with billions of data points using distributed computing infrastructures. We describe the design of GigaSOM.jl, measure its performance and horizontal scaling capability, and showcase the functionality on a large dataset from a recent study. Conclusions GigaSOM.jl facilitates utilization of the commonly available high-performance computing resources to process the largest available datasets within minutes, while producing results of the same quality as the current state-of-art software. Measurements indicate that the performance scales to much larger datasets. The example use on the data from an massive mouse phenotyping effort confirms the applicability of GigaSOM.jl to huge-scale studies. Key points GigaSOM.jl improves the applicability of FlowSOM-style single-cell cytometry data analysis by increasing the acceptable dataset size to billions of single cells. Significant speedup over current methods is achieved by distributed processing and utilization of efficient algorithms. GigaSOM.jl package includes support for fast visualization of multidimensional data.