VR
Vladimir Reinharz
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(56% Open Access)
Cited by:
13
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

On the emergence of structural complexity in RNA replicators

Carlos Oliver et al.Nov 14, 2017
The RNA world hypothesis relies on the ability of ribonucleic acids to spontaneously acquire complex structures capable of supporting essential biological functions. Multiple sophisticated evolutionary models have been proposed for their emergence, but they often assume specific conditions. In this work we explore a simple and parsimonious scenario describing the emergence of complex molecular structures at the early stages of life. We show that at specific GC-content regimes, an undirected replication model is sufficient to explain the apparition of multi-branched RNA secondary structures – a structural signature of many essential ribozymes. We ran a large scale computational study to map energetically stable structures on complete mutational networks of 50-nucleotide-long RNA sequences. Our results reveal that the sequence landscape with stable structures is enriched with multi-branched structures at a length scale coinciding with the appearance of complex structures in RNA databases. A random replication mechanism preserving a 50% GC-content may suffice to explain a natural enrichment of stable complex structures in populations of functional RNAs. By contrast, an evolutionary mechanism eliciting the most stable folds at each generation appears to help reaching multi-branched structures at highest GC content.
0

Unspecific binding but specific disruption of the group I intron by the StpA chaperone

Vladimir Reinharz et al.Nov 7, 2019
Chaperone proteins - the most disordered among all protein groups - help RNAs fold into their functional structure by destabilizing misfolded configurations or stabilizing the functional ones. But disentangling the mechanism underlying RNA chaperoning is challenging, mostly due to inherent disorder of the chaperones and the transient nature of their interactions with RNA. In particular, it is unclear how specific the interactions are and what role is played by amino acid charge and polarity patterns. Here, we address these questions in the RNA chaperone StpA. By adapting direct coupling analysis (DCA) to treat in tandem sequences written in two alphabets, nucleotides and amino acids, we could analyze StpA-RNA interactions and identify a two-pronged mechanism: StpA disrupts specific positions in the group I intron while globally and loosely binding to the entire structure. Moreover, the interaction is governed by the charge pattern: negatively charged regions in the destabilizing StpA N-terminal affect a few specific positions in the RNA, located in stems and in the pseudoknot. In contrast, positive regions in the C-terminal contain strongly coupled amino acids that promote non-specific or weakly-specific binding to the RNA. The present study opens new avenues to examine the functions of disordered proteins and to design disruptive proteins based on their charge patterns.
0

Parallel maximal common subgraphs with labels for molecular biology

Wilfried Agbeto et al.May 14, 2024
Abstract Advances in graph algorithmics have allowed in-depth study of many natural objects from molecular biology or chemistry to social networks. Particularly in molecular biology and cheminformatics, understanding complex structures by identifying conserved sub-structures is a key milestone towards the artificial design of novel components with specific functions. Given a dataset of structures, we are interested in identifying all maximum common connected partial subgraphs between each pair of graphs, a task notoriously NP-Hard. In this work, we present 3 parallel algorithms over shared and distributed memory to enumerate all maximal connected common sub-graphs between pairs of arbitrary multi-directed graphs with labels on their edges. We offer an implementation of these methods and evaluate their performance on the non-redundant dataset of all known RNA 3D structures. We show that we can compute the exact results in a reasonable time for each pairwise comparison while taking into account a much more diverse set of interactions—resulting in much denser graphs—resulting in an order of magnitude more conserved modules. All code is available at https://gitlab.info.uqam.ca/cbe/pasigraph and results in the branch results.
0

Augmented base pairing networks encode RNA-small molecule binding preferences

Carlos Oliver et al.Jul 14, 2019
A bstract Motivation The binding of small molecules to RNAs is an important mechanism which can stabilize 3D structures or activate key molecular functions. To date, computational and experimental efforts toward small molecule binding prediction have primarily focused on protein targets. Considering that a very large portion of the genome is transcribed into non-coding RNAs but only few regions are translated into proteins, successful annotations of RNA elements targeted by small-molecule would likely uncover a vast repertoire of biological pathways and possibly lead to new therapeutic avenues. Results Our work is a first attempt at bringing machine learning approaches to the problem of RNA drug discovery. RNAmigos takes advantage of the unique structural properties of RNA to predict small molecule ligands for unseen binding sites. A key feature of our model is an efficient representation of binding sites as augmented base pairing networks (ABPNs) aimed at encoding important structural patterns. We subject our ligand predictions to two virtual screen settings and show that we are able to rank the known ligand on average in the 73rd percentile, showing a significant improvement over several baselines. Furthermore, we observe that graphs which are augmented with non-Watson Crick (a.k.a non-canonical) base pairs are the only representation which is able to retrieve a significant signal, suggesting that non-canonical interactions are an necessary source of binding specificity in RNAs. We also find that an auxiliary graph representation task significantly boosts performance by providing efficient structural embeddings to the low data setting of ligand prediction. RNAmigos shows that RNA binding data contains structural patterns with potential for drug discovery, and provides methodological insights which can be applied to other structure-function learning tasks. Availability Code and data is freely available at http://csb.cs.mcgill.ca/RNAmigos . Contact jerome@cs.mcgill.ca
0
0
Save
1

Multiphasic hepatitis B virus kinetic patterns in humanized chimeric mice can be explained via stochastic agent-based modeling of intracellular virion production cycles

Atesmachew Hailegiorgis et al.Jan 30, 2022
Abstract Serum hepatitis B virus (HBV) kinetics in urokinase-type plasminogen activator/severe combined immunodeficient (uPA-SCID) mice reconstituted with humanized livers from inoculation to steady state is highly dynamic despite the absence of an adaptive immune response. We developed a stochastic agent-based model that includes virion production cycles in individual infected human hepatocytes. The model was calibrated using a genetic algorithm approach with the serum HBV kinetics observed in mice inoculated with 10 8 HBV genome equivalents and fit the data well when the following viral production parameters were assumed: (1) An eclipse phase lasting 5-50 hours and (2) a post-eclipse phase production rate that is based on increasing production cycles initially starting with a long production cycle of 1 virion per 20 hours that gradually reaches 1 virion per hour after approximately 3-4 days before virion production increases dramatically to reach to a steady state production rate of 4 virions per hour per cell. The model was then validated by showing it could accurately simulate the viral kinetics observed with lower HBV inoculation doses (10 4 -10 7 genome equivalents) in which similar, but delayed patterns were observed. Together, modeling suggests that it is the cyclic nature of the virus lifecycle combined with an initial slow but increasing rate of HBV production from each cell that plays a role in generating the observed multiphasic HBV kinetic patterns in humanized mice.
0

Finding recurrent RNA structural networks with fast maximal common subgraphs of edge-colored graphs

Antoine Soulé et al.Feb 3, 2020
MOTIVATIONs: RNA tertiary structure is crucial to its many non-coding molecular functions. RNA architecture is shaped by its secondary structure composed of stems, stacked canonical base pairs, enclosing loops. While stems are captured by free-energy models, loops composed of non-canonical base pairs are not. Nor are distant interactions linking together those secondary structure elements (SSEs). Databases of conserved 3D geometries (a.k.a. modules) not captured by energetic models are leveraged for structure prediction and design, but the computational complexity has limited their study to local elements, loops, and recently to those covering pairs of SSEs. Systematically capturing recurrent patterns on a large scale is a main challenge in the study of RNA structures. RESULTS: In this paper, we present an efficient algorithm to compute maximal isomorphisms in edge colored graphs. This framework is well suited to RNA structures and allows us to generalize previous approaches. In particular, we apply our techniques to find for the first time modules spanning more than 2 SSEs, while improving speed a hundredfold. We extract all recurrent base pair networks among all non-redundant RNA tertiary structures and identify a module connecting 36 different SSEs common to the 23S ribosome of E. Coli and Thermus thermophilus. We organize this information as a hierarchy of modules sharing similarities in their structure, which can serve as a basis for future research on the emergence of structural patterns. AVAILABILITY: http://csb.cs.mcgill.ca/carnaval2### Competing Interest StatementThe authors have declared no competing interest.
0

Stochastic Sampling of Structural Contexts Improves the Scalability and Accuracy of RNA 3D Module Identification

Roman Sarrazin‐Gendron et al.Nov 8, 2019
RNA structures possess multiple levels of structural organization. Secondary structures are made of canonical (i.e. Watson-Crick and Wobble) helices, connected by loops whose local conformations are critical determinants of global 3D architectures. Such local 3D structures consist of conserved sets of non-canonical base pairs, called RNA modules. Their prediction from sequence data is thus a milestone toward 3D structure modelling. Unfortunately, the computational efficiency and scope of the current 3D module identification methods are too limited yet to benefit from all the knowledge accumulated in modules databases. Here, we introduce BayesPairing 2, a new sequence search algorithm leveraging secondary structure tree decomposition which allows to reduce the computational complexity and improve predictions on new sequences. We benchmarked our methods on 75 modules and 6380 RNA sequences, and report accuracies that are comparable to the state of the art, with considerable running time improvements. When identifying 200 modules on a single sequence, BayesPairing 2 is over 100 times faster than its previous version, opening new doors for genome-wide applications.
7

Concurrent prediction of RNA secondary structures with pseudoknots and local 3D motifs in an Integer Programming framework

Gabriel Loyer et al.Mar 10, 2023
Abstract Motivation The prediction of RNA structure canonical base pairs from a single sequence, especially pseudoknotted ones, remains challenging in a thermodynamic models that approximates the energy of the local 3D motifs joining canonical stems. It has become more and more apparent in recent years that the structural motifs in the loops, composed of non-canonical interactions, are essential for the final shape of the molecule enabling its multiple functions. Our capacity to predict accurate 3D structures is also limited when it comes to the organization of the large intricate network of interactions that form inside those loops. Results We previously developed the integer programming framework RNAMoIP (RNA Motifs over Integer Programming) to reconcile RNA secondary structure and local 3D motif information available in databases. We further develop our model to now simultaneously predict the canonical base pairs (with pseudoknots) from base pair probability matrices with or without alignment. We benchmarked our new method over the all non-redundant RNAs below 150 nucleotides. We show that the joined prediction of canonical base pairs structure and local conserved motifs (i) improves the ratio of well-predicted interactions in the secondary structure, (ii) predicts well canonical and Wobble pairs at the location where motifs are inserted, (iii) is greatly improved with evolutionary information and (iv) non-canonical motifs at kink-turn locations. Availability The source code of the framework is available at https://gitlab.info.uqam.ca/cbe/RNAMoIP and an interactive web server at https://rnamoip.cbe.uqam.ca/