RA
Russ Altman
Author with expertise in Computational Methods in Drug Discovery
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
30
(53% Open Access)
Cited by:
85
h-index:
48
/
i10-index:
133
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Graph Convolutional Neural Networks for Predicting Drug-Target Interactions

Wen Torng et al.Nov 19, 2018
Abstract Accurate determination of target-ligand interactions is crucial in the drug discovery process. In this paper, we propose a two-staged graph-convolutional (Graph-CNN) framework for predicting protein-ligand interactions. We first describe an unsupervised graph-autoencoder to learn fixed-size representations of protein pockets. Two Graph-CNNs are then trained to automatically extract features from pocket graphs and 2D molecular graphs, respectively. We demonstrate that graph-autoencoders can learn meaningful fixed-size representation for protein pockets of varying sizes and the Graph-CNN framework can effectively capture protein-ligand binding interactions without relying on target-ligand co-complexes. Across several metrics, Graph-CNNs achieved better or comparable performance to 3DCNN ligand-scoring, AutoDock Vina, RF-Score, and NNScore on common virtual screening benchmark datasets. Visualization of key pocket residues and ligand atoms contributing to the classification decisions confirms that our networks recognize meaningful interactions between pockets and ligands. Availability and Implementation Contact: rbaltman@stanford.edu Supplementary information:
1

CRISPRa screening with real world evidence identifies potassium channels as neuronal entry factors and druggable targets for SARS-CoV-2

Chengkun Wang et al.Jul 1, 2021
Abstract Although vaccines for severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) have been successful, there are no good treatments for those who are actively infected. While SARS-CoV-2 primarily infects the respiratory tract, clinical evidence indicates that cells from sensory organs and the brain are also susceptible to infection. While many patients suffer from diverse neurological symptoms, the virus’s neuronal entry remains mysterious. To discover host factors involved in SARS-CoV-2 viral entry, we performed CRISPR activation (CRISPRa) screens targeting all 6000+ human membrane proteins in cells with and without overexpression of ACE2 using Spike-pseudotyped lentiviruses. This unbiased gain-of-function screening identified both novel and previously validated host factors. Notably, newly found host factors have high expression in neuronal and immune cells, including potassium channel KCNA6, protease LGMN, and MHC-II component HLA-DPB1. We validated these factors using replication-competent SARS-CoV-2 infection assays. Notably, the overexpression of KCNA6 led to a marked increase in infection even in cells with undetectable levels of ACE2 expression. Analysis of human olfactory epithelium scRNA-seq data revealed that OLIG2+/TUJ1+ cells--previously identified as sites of infection in COVID-19 autopsy studies-- have high KCNA6 expression and minimal levels of ACE2. The presence of KCNA6 may thus explain sensory/neuronal aspects of COVID-19 symptoms. Further, we demonstrate that FDA-approved compound dalfampridine, an inhibitor of KCNA-family potassium channels, suppresses viral entry in a dosage-dependent manner. Finally, we identified common prescription drugs likely to modulate the top identified host factors, and performed a retrospective analysis of insurance claims of ~8 million patients. This large cohort study revealed a statistically significant association between top drug classes, particularly those targeting potassium channels, and COVID-19 severity. Taken together, the potassium channel KCNA6 facilitates neuronal entry of SARS-CoV-2 and is a promising target for drug repurposing and development.
1
Citation7
0
Save
5

DrugOrchestra: Jointly predicting drug response, targets, and side effects via deep multi-task learning

Yuepeng Jiang et al.Nov 20, 2020
Abstract Massively accumulated pharmacogenomics, chemogenomics, and side effect datasets offer an unprecedented opportunity for drug response prediction, drug target identification and drug side effect prediction. Existing computational approaches limit their scope to only one of these three tasks, inevitably overlooking the rich connection among them. Here, we propose DrugOrchestra, a deep multi-task learning framework that jointly predicts drug response, targets and side effects. DrugOrchestra leverages pre-trained molecular structure-based drug representation to bridge these three tasks. Instead of directly fine-tuning on an individual task, DrugOrchestra uses deep multi-task learning to obtain a phenotype-based drug representation by simultaneously fine-tuning on drug response, target and side effect prediction. By coupling these three tasks together, DrugOrchestra is able to make predictions for unseen drugs by only knowing their molecular structures. We constructed a heterogeneous drug discovery dataset of over 21k drugs by integrating 8 datasets across three tasks. Our method obtained significant improvement in comparison to methods that were trained on a single task or a single dataset. We further revealed the transferability across 8 datasets and 3 tasks, providing novel insights for understanding drug mechanisms. Availability https://github.com/jiangdada1221/DrugOrchestra
5

COLLAPSE: A representation learning framework for identification and characterization of protein structural sites

Alexander Derry et al.Jul 22, 2022
Abstract The identification and characterization of the structural sites which contribute to protein function are crucial for understanding biological mechanisms, evaluating disease risk, and developing targeted therapies. However, the quantity of known protein structures is rapidly outpacing our ability to functionally annotate them. Existing methods for function prediction either do not operate on local sites, suffer from high false positive or false negative rates, or require large site-specific training datasets, necessitating the development of new computational methods for annotating functional sites at scale. We present COLLAPSE (Compressed Latents Learned from Aligned Protein Structural Environments), a framework for learning deep representations of protein sites. COLLAPSE operates directly on the 3D positions of atoms surrounding a site and uses evolutionary relationships between homologous proteins as a self-supervision signal, enabling learned embeddings to implicitly capture structure-function relationships within each site. Our representations generalize across disparate tasks in a transfer learning context, achieving state-of-the-art performance on standardized benchmarks (protein-protein interactions and mutation stability) and on the prediction of functional sites from the P rosite database. We use COLLAPSE to search for similar sites across large protein datasets and to annotate proteins based on a database of known functional sites. These methods demonstrate that COLLAPSE is computationally efficient, tunable, and interpretable, providing a general-purpose platform for computational protein analysis.
5
Citation4
0
Save
20

Analyzing the vast coronavirus literature with CoronaCentral

Jake Lever et al.Dec 22, 2020
Abstract The global SARS-CoV-2 pandemic has caused a surge in research exploring all aspects of the virus and its effects on human health. The overwhelming rate of publications means that human researchers are unable to keep abreast of the research. To ameliorate this, we present the CoronaCentral resource which uses machine learning to process the research literature on SARS-CoV-2 along with articles on SARS-CoV and MERS-CoV. We break the literature down into useful categories and enable analysis of the contents, pace, and emphasis of research during the crisis. These categories cover therapeutics, forecasting as well as growing areas such as “Long Covid” and studies of inequality and misinformation. Using this data, we compare topics that appear in original research articles compared to commentaries and other article types. Finally, using Altmetric data, we identify the topics that have gained the most media attention. This resource, available at https://coronacentral.ai , is updated multiple times per day and provides an easy-to-navigate system to find papers in different categories, focussing on different aspects of the virus along with currently trending articles.
20
Citation3
0
Save
10

Large-Scale Labeling and Assessment of Sex Bias in Publicly Available Expression Data

Emily Flynn et al.Oct 27, 2020
ABSTRACT Women are at more than 1.5-fold higher risk for clinically relevant adverse drug events. While this higher prevalence is partially due to gender-related effects, biological sex differences likely also impact drug response. Publicly available gene expression databases provide a unique opportunity for examining drug response at a cellular level. However, missingness and heterogeneity of metadata prevent large-scale identification of drug exposure studies and limit assessments of sex bias. To address this, we trained organism-specific models to infer sample sex from gene expression data, and used entity normalization to map metadata cell line and drug mentions to existing ontologies. Using this method, we infer sex labels for 450,371 human and 245,107 mouse microarray and RNA-seq samples from refine.bio. Overall, we find slight female bias (52.1%) in human samples and (62.5%) male bias in mouse samples; this corresponds to a majority of single sex studies, split between female-only and male-only (33.3% vs 18.4% in human and 31.0% vs 30.4% in mouse respectively). In drug studies, we find limited evidence for sex-sampling bias overall; however, specific categories of drugs, including human cancer and mouse nervous system drugs, are enriched in female-only and male-only studies respectively. Our expression-based sex labels allow us to further examine the complexity of cell line sex and assess the frequency of metadata sex label misannotations (2-5%). We make our inferred and normalized labels, along with flags for misannotated samples, publicly available to catalyze the routine use of sex as a study variable in future analyses.
4

Comprehensive Assessment of Smoking and Sex Related Effects in Publicly Available Gene Expression Data

Emily Flynn et al.Sep 29, 2021
ABSTRACT Smoking greatly reduces life expectancy in both men and women, but with different patterns of morbidity. After adjusting for smoking history, women have higher risk of respiratory effects and diabetes from smoking, while men show greater mortality from smoking-related cancers. While many smoking-related sex differences have been documented, the underlying molecular mechanisms are not well understood. To date, identification of sex differences in response to smoking has been limited to a small number of studies and the resulting smoking-related effects require further validation. Publicly available gene expression data present a unique opportunity to examine molecular-level sex and smoking effects across many tissues and studies. We performed a systematic search to identify smoking-related studies from healthy tissue samples and found 31 separate studies as well as an additional group of overlapping studies that in total span 2,177 samples and 12 tissues. These samples and studies were overall male-biased. In smoking, while effects appeared to be somewhat tissue-specific and largely autosomal, we identified a small number of genes that were consistently differentially expressed across tissues, including AHRR and GZMH . We also identified one gene, AKR1C3 , encoding an aldo-keto reductase, which showed strong opposite direction, smoking-related effects in blood and airway epithelium, with higher expression in airway epithelium and lower expression in blood of smokers versus non-smokers. By contrast, at similar significance thresholds, sex-related effects were entirely sex chromosomal and consistent across tissues, providing evidence of stronger effects of smoking than sex on autosomal expression. Due to sample size limitations, we only examined interaction effects in the largest study, where we identified 30 genes with sex differential effects in response to smoking, only one of which, CAPN9 , replicated in a held-out analysis. Overall these results present a comprehensive analysis of smoking-related effects across tissues and an initial examination of sex differential smoking effects in public gene expression data.
4
Citation1
0
Save
Load More