WC
Werngard Czechtizky
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(80% Open Access)
Cited by:
5
h-index:
17
/
i10-index:
27
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Unravelling the Link between Oligonucleotide Structure and Diastereomer Separation in Hydrophilic Interaction Chromatography

Honorine Lardeux et al.Jun 10, 2024
Therapeutic oligonucleotides (ONs) commonly incorporate phosphorothioate (PS) modifications. These introduce chiral centers and generate ON diastereomers. The increasing number of ONs undergoing clinical trials and reaching the market has led to a growing interest to better characterize the ON diastereomer composition, especially for small interfering ribonucleic acids (siRNAs). In this study, and for the first time, we identify higher-order structures as the major cause of ON diastereomer separation in hydrophilic interaction chromatography (HILIC). We have used conformational predictions and melting profiles of several representative full-length ONs to first analyze ON folding and then run mass spectrometry and HILIC to underpin the link between their folding and diastereomer separation. On top, we show how one can either enhance or suppress diastereomer separation depending on chromatographic settings, such as column temperature, pore size, stationary phase, mobile-phase ionic strength, and organic modifier. This work will significantly facilitate future HILIC-based characterization of PS-containing ONs; e.g., enabling monitoring of batch-to-batch diastereomer distributions in full-length siRNAs, a complex task that is now for the first time shown as possible on this delicate class of therapeutic double-stranded ONs.
0
Citation4
0
Save
0

Evaluation of reinforcement learning in transformer-based molecular design

Jiazhen He et al.Aug 8, 2024
Designing compounds with a range of desirable properties is a fundamental challenge in drug discovery. In pre-clinical early drug discovery, novel compounds are often designed based on an already existing promising starting compound through structural modifications for further property optimization. Recently, transformer-based deep learning models have been explored for the task of molecular optimization by training on pairs of similar molecules. This provides a starting point for generating similar molecules to a given input molecule, but has limited flexibility regarding user-defined property profiles. Here, we evaluate the effect of reinforcement learning on transformer-based molecular generative models. The generative model can be considered as a pre-trained model with knowledge of the chemical space close to an input compound, while reinforcement learning can be viewed as a tuning phase, steering the model towards chemical space with user-specific desirable properties. The evaluation of two distinct tasks-molecular optimization and scaffold discovery-suggest that reinforcement learning could guide the transformer-based generative model towards the generation of more compounds of interest. Additionally, the impact of pre-trained models, learning steps and learning rates are investigated.Scientific contributionOur study investigates the effect of reinforcement learning on a transformer-based generative model initially trained for generating molecules similar to starting molecules. The reinforcement learning framework is applied to facilitate multiparameter optimisation of starting molecules. This approach allows for more flexibility for optimizing user-specific property profiles and helps finding more ideas of interest.
11

Sequence-based prediction of the solubility of peptides containing non-natural amino acids

Marc Oeller et al.Mar 3, 2023
Abstract Non-natural amino acids are increasingly used as building blocks in the development of peptide-based drugs, as they expand the available chemical space to tailor function, half-life and other key properties. However, while the chemical space of modified amino acids (mAAs) is potentially vast, experimental methods for measuring the developability properties of mAA-containing peptides are expensive and time consuming. To facilitate developability programs through computational methods, we present CamSol-PTM, a method that enables the fast and reliable sequence-based prediction of the solubility of mAA-containing peptides. From a computational screening of 50,000 mAA-containing variants of three peptides, we selected five different mAAs for a total number of 30 peptide variants for experimental validation. We demonstrate the accuracy of the predictions by comparing the calculated and experimental solubility values. Our results indicate that the computational screening of mAA-containing peptides can extend by over four orders of magnitude the ability to explore the solubility chemical space of peptides. This method is available as a web server at https://www-cohsoftware.ch.cam.ac.uk/index.php/camsolptm .
1

Protein structure dynamic prediction: a Machine Learning/Molecular Dynamic approach to investigate the protein conformational sampling

Martina Audagnotto et al.Dec 1, 2021
Abstract Proteins exist in several different conformations. These structural changes are often associated with fluctuations at the residue level. Recent findings show that co-evolutionary analysis coupled with machine- learning techniques improves the precision by providing quantitative distance predictions between pairs of residues. The predicted statistical distance distribution from Multi Sequence Analysis (MSA) reveals the presence of different local maxima suggesting the flexibility of key residue pairs. Here we investigate the ability of the residue-residue distance prediction to provide insights into the protein conformational ensemble. We combine deep learning approaches with mechanistic modeling to a set of proteins that experimentally showed conformational changes. The predicted protein models were filtered based on energy scores, RMSD clustering, and the centroids selected as the lowest energy structure per cluster. The models were compared to the experimental-Molecular Dynamics (MD) relaxed structure by analyzing the backbone residue torsional distribution and the sidechain orientations. Our pipeline not only allows us to retrieve the global experimental folding but also the experimental structural dynamics. We show the potential correlation between the experimental structure dynamics and the predicted model ensemble demonstrating the susceptibility of the current state-of-the-art methods in protein folding and dynamics prediction and pointing out the areas of improvement.