OS
Ola Spjuth
Author with expertise in Computational Methods in Drug Discovery
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
38
(84% Open Access)
Cited by:
577
h-index:
35
/
i10-index:
89
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Chemistry Development Kit (CDK) v2.0: atom typing, depiction, molecular formulas, and substructure searching

Egon Willighagen et al.Jun 6, 2017
The Chemistry Development Kit (CDK) is a widely used open source cheminformatics toolkit, providing data structures to represent chemical concepts along with methods to manipulate such structures and perform computations on them. The library implements a wide variety of cheminformatics algorithms ranging from chemical structure canonicalization to molecular descriptor calculations and pharmacophore perception. It is used in drug discovery, metabolomics, and toxicology. Over the last 10 years, the code base has grown significantly, however, resulting in many complex interdependencies among components and poor performance of many algorithms. We report improvements to the CDK v2.0 since the v1.2 release series, specifically addressing the increased functional complexity and poor performance. We first summarize the addition of new functionality, such atom typing and molecular formula handling, and improvement to existing functionality that has led to significantly better performance for substructure searching, molecular fingerprints, and rendering of molecules. Second, we outline how the CDK has evolved with respect to quality control and the approaches we have adopted to ensure stability, including a code review mechanism. This paper highlights our continued efforts to provide a community driven, open source cheminformatics library, and shows that such collaborative projects can thrive over extended periods of time, resulting in a high-quality and performant library. By taking advantage of community support and contributions, we show that an open source cheminformatics project can act as a peer reviewed publishing platform for scientific computing software.
1

Integrating cell morphology with gene expression and chemical structure to aid mitochondrial toxicity detection

Srijit Seal et al.Aug 23, 2022
Abstract Mitochondrial toxicity is an important safety endpoint in drug discovery. Models based solely on chemical structure for predicting mitochondrial toxicity are currently limited in accuracy and applicability domain to the chemical space of the training compounds. In this work, we aimed to utilize both -omics and chemical data to push beyond the state-of-the-art. We combined Cell Painting and Gene Expression data with chemical structural information from Morgan fingerprints for 382 chemical perturbants tested in the Tox21 mitochondrial membrane depolarization assay. We observed that mitochondrial toxicants differ from non-toxic compounds in morphological space and identified compound clusters having similar mechanisms of mitochondrial toxicity, thereby indicating that morphological space provides biological insights related to mechanisms of action of this endpoint. We further showed that models combining Cell Painting, Gene Expression features and Morgan fingerprints improved model performance on an external test set of 244 compounds by 60% (in terms of F1 score) and improved extrapolation to new chemical space. The performance of our combined models was comparable with dedicated in vitro assays for mitochondrial toxicity. Our results suggest that combining chemical descriptors with biological readouts enhances the detection of mitochondrial toxicants, with practical implications in drug discovery.
1
Citation38
0
Save
0

Galaxy-Kubernetes integration: scaling bioinformatics workflows in the cloud

Pablo Moreno‐Ger et al.Dec 7, 2018
Summary Making reproducible, auditable and scalable data-processing analysis workflows is an important challenge in the field of bioinformatics. Recently, software containers and cloud computing introduced a novel solution to address these challenges. They simplify software installation, management and reproducibility by packaging tools and their dependencies. In this work we implemented a cloud provider agnostic and scalable container orchestration setup for the popular Galaxy workflow environment. This solution enables Galaxy to run on and offload jobs to most cloud providers (e.g. Amazon Web Services, Google Cloud or OpenStack, among others) through the Kubernetes container orchestrator. Availability All code has been contributed to the Galaxy Project and is available (since Galaxy 17.05) at https://github.com/galaxyproject/ in the galaxy and galaxy-kubernetes repositories. https://public.phenomenal-h2020.eu/ is an example deployment. Suppl. Information Supplementary Files are available online. Contact pmoreno@ebi.ac.uk , European Molecular Biology Laboratory, EMBL-EBI, Wellcome Trust Genome Campus, Hinxton, Cambridge, CB10 1SD, UK, Tel: +44-1223-494267, Fax: +44-1223-484696.
1

ANDROMEDA by Prosilico Software Successfully Predicts Human Clinical Pharmacokinetics of 300 Drugs Out of Reach forIn VitroMethods

Urban Fagerholm et al.Oct 7, 2022
A bstract Introduction In vitro measurements and predictions of human clinical pharmacokinetics (PK) are sometimes hindered and made impossible due to factors such as extensive binding to materials, low methodological sensitivity and large variability. Methods The objective was to find compounds out of reach for in vitro PK-methods and (if possible) predict corresponding human clinical estimates using the ANDROMEDA by Prosilico software. In vitro methods selected for the investigation were human microsomes and hepatocytes for measuring and predicting intrinsic hepatic metabolic clearance (CL int ), Caco-2 and Ralph Russ canine kidney cells (RRCK) cells for measuring apparent intestinal permeability (P app ) for prediction of fraction absorbed (f a ), plasma for measurement and estimation of unbound fraction (f u ), and water and buffers for measuring solubility (S) for prediction of in vivo dissolution potential (f diss ). Results and Conclusion As many as 329 non-quantifiable in vitro PK-measurements for 300 compounds were found in the literature: 191 for CL int , 101 for P app , 11 for f u and 26 for S. ANDROMEDA was successful in predicting all corresponding clinical PK-estimates for the selection of compounds with non-quantifiable in vitro PK, and predicted estimates (1.6-fold median prediction error; n=159) were generally in line with observed in vivo data and results/problems at in vitro laboratories. Thus, ANDROMEDA is applicable for predicting human clinical PK for compounds out of reach for laboratory methods.
1
Citation7
0
Save
0

PhenoMeNal: Processing and analysis of Metabolomics data in the Cloud

Kristian Peters et al.Sep 6, 2018
Abstract Background Metabolomics is the comprehensive study of a multitude of small molecules to gain insight into an organism’s metabolism. The research field is dynamic and expanding with applications across biomedical, biotechnological and many other applied biological domains. Its computationally-intensive nature has driven requirements for open data formats, data repositories and data analysis tools. However, the rapid progress has resulted in a mosaic of independent – and sometimes incompatible – analysis methods that are difficult to connect into a useful and complete data analysis solution. Findings The PhenoMeNal (Phenome and Metabolome aNalysis) e-infrastructure provides a complete, workflow-oriented, interoperable metabolomics data analysis solution for a modern infrastructure-as-a-service (IaaS) cloud platform. PhenoMeNal seamlessly integrates a wide array of existing open source tools which are tested and packaged as Docker containers through the project’s continuous integration process and deployed based on a kubernetes orchestration framework. It also provides a number of standardized, automated and published analysis workflows in the user interfaces Galaxy, Jupyter, Luigi and Pachyderm. Conclusions PhenoMeNal constitutes a keystone solution in cloud infrastructures available for metabolomics. It provides scientists with a ready-to-use, workflow-driven, reproducible and shareable data analysis platform harmonizing the software installation and configuration through user-friendly web interfaces. The deployed cloud environments can be dynamically scaled to enable large-scale analyses which are interfaced through standard data formats, versioned, and have been tested for reproducibility and interoperability. The flexible implementation of PhenoMeNal allows easy adaptation of the infrastructure to other application areas and ‘omics research domains.
1

A Decade in a Systematic Review: The Evolution and Impact of Cell Painting

Srijit Seal et al.May 7, 2024
ABSTRACT High-content image-based assays have fueled significant discoveries in the life sciences in the past decade (2013-2023), including novel insights into disease etiology, mechanism of action, new therapeutics, and toxicology predictions. Here, we systematically review the substantial methodological advancements and applications of Cell Painting. Advancements include improvements in the Cell Painting protocol, assay adaptations for different types of perturbations and applications, and improved methodologies for feature extraction, quality control, and batch effect correction. Moreover, machine learning methods recently surpassed classical approaches in their ability to extract biologically useful information from Cell Painting images. Cell Painting data have been used alone or in combination with other - omics data to decipher the mechanism of action of a compound, its toxicity profile, and many other biological effects. Overall, key methodological advances have expanded Cell Painting’s ability to capture cellular responses to various perturbations. Future advances will likely lie in advancing computational and experimental techniques, developing new publicly available datasets, and integrating them with other high-content data types.
1
Citation4
0
Save
3

Is brightfield all you need for mechanism of action prediction?

Ankit Gupta et al.Oct 13, 2022
Abstract Fluorescence staining techniques, such as Cell Painting, together with fluorescence microscopy have proven invaluable for visualizing and quantifying the effects that drugs and other perturbations have on cultured cells. However, fluorescence microscopy is expensive, time-consuming, and labor-intensive, and the stains applied can be cytotoxic, interfering with the activity under study. The simplest form of microscopy, brightfield microscopy, lacks these downsides, but the images produced have low contrast and the cellular compartments are difficult to discern. Nevertheless, by harnessing deep learning, these brightfield images may still be sufficient for various predictive purposes. In this study, we compared the predictive performance of models trained on fluorescence images to those trained on brightfield images for predicting the mechanism of action (MoA) of different drugs. We also extracted CellProfiler features from the fluorescence images and used them to benchmark the performance. Overall, we found comparable and correlated predictive performance for the two imaging modalities. This is promising for future studies of MoAs in time-lapse experiments.
1

From Pixels to Phenotypes: Integrating Image-Based Profiling with Cell Health Data Improves Interpretability

Srijit Seal et al.Jul 16, 2023
SUMMARY Cell Painting assays generate morphological profiles that are versatile descriptors of biological systems and have been used to predict in vitro and in vivo drug effects. However, Cell Painting features are based on image statistics, and are, therefore, often not readily biologically interpretable. In this study, we introduce an approach that maps specific Cell Painting features into the BioMorph space using readouts from comprehensive Cell Health assays. We validated that the resulting BioMorph space effectively connected compounds not only with the morphological features associated with their bioactivity but with deeper insights into phenotypic characteristics and cellular processes associated with the given bioactivity. The BioMorph space revealed the mechanism of action for individual compounds, including dual-acting compounds such as emetine, an inhibitor of both protein synthesis and DNA replication. In summary, BioMorph space offers a more biologically relevant way to interpret cell morphological features from the Cell Painting assays and to generate hypotheses for experimental validation. GRAPHICAL ABSTRACT IN BRIEF Seal et al. used machine learning models and feature selection approaches to group cell morphological features from Cell Painting assays and to describe the shared role of these morphological features in various cell health phenotypes. The resulting BioMorph space improves the ability to understand the mechanism of action and toxicity of compounds and to generate hypotheses to guide future experiments. HIGHLIGHTS Combining Cell Painting and Cell Health imaging data defines the BioMorph space. BioMorph space allows detecting less common mechanisms for bioactive compounds. BioMorph space can generate MOA hypotheses to guide experimental validation. BioMorph space is more biologically relevant and interpretable than Cell Painting features.
1
Citation3
0
Save
1

An Open-Source Modular Framework for Automated Pipetting and Imaging Applications

Wei Ouyang et al.Jun 24, 2021
The number of samples in biological experiments are continuously increasing, but complex protocols and human experimentation in many cases lead to suboptimal data quality and hence difficulties in reproducing scientific findings. Laboratory automation can alleviate many of these problems by precisely reproducing machine-readable protocols. These instruments generally require high up-front investments and due to lack of open APIs they are notoriously difficult for scientists to customize and control outside of the vendor-supplied software. Here, we demonstrate automated, high-throughput experiments for interdisciplinary research in life science that can be replicated on a modest budget, using open tools to ensure reproducibility by combining the tools Openflexure, Opentrons, ImJoy and UC2. Our automated sample preparation and imaging pipeline can easily be replicated and established in many laboratories as well as in educational contexts through easy-to-understand algorithms and easy-to-build microscopes. Additionally, the creation of feedback loops, with later pipetting or imaging steps depending on analysis of previously acquired images, enables the realization of smart microscopy experiments, featuring completely autonomously performed experiments. All documents and source-files are publicly available ( https://beniroquai.github.io/Hi2 ) to prove the concept of smart lab automation using inexpensive, open tools. We believe this democratizes access to the power and repeatability of automated experiments.
1
Citation3
0
Save
Load More