SG
Shreshth Gandhi
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
5
(20% Open Access)
Cited by:
0
h-index:
5
/
i10-index:
3
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

cDeepbind: A context sensitive deep learning model of RNA-protein binding

Shreshth Gandhi et al.Jun 12, 2018
+2
A
L
S
Motivation: Determining RNA binding protein(RBP) binding specificity is crucial for understanding many cellular processes and genetic disorders. RBP binding is known to be affected by both the sequence and structure of RNAs. Deep learning can be used to learn generalizable representations of raw data and has improved state of the art in several fields such as image classification, speech recognition and even genomics. Previous work on RBP binding has either used shallow models that combine sequence and structure or deep models that use only the sequence. Here we combine both abilities by augmenting and refining the original Deepbind architecture to capture structural information and obtain significantly better performance. Results: We propose two deep architectures, one a lightweight convolutional network for transcriptome-wide inference and another a Long Short-Term Memory(LSTM) network that is suitable for small batches of data. We incorporate computationally predicted secondary structure features as input to our models and show its effectiveness in boosting prediction performance. Our models achieved significantly higher correlations on held out in-vitro test data compared to previous approaches, and generalise well to in-vivo CLIP-SEQ data achieving higher median AUCs than other approaches. We analysed the output from our model for VTS1 and CPO and provided intuition into its working. Our models confirmed known secondary structure preferences for some proteins as well as found new ones where secondary structure might play a role. We also demonstrated the strengths of our model compared to other approaches such as the ability to combine information from long distances along the input.
0

COSSMO: Predicting Competitive Alternative Splice Site Selection using Deep Learning

Hannes Bretschneider et al.Jan 29, 2018
+2
A
S
H
Motivation: Alternative splice site selection is inherently competitive and the probability of a given splice site to be used also depends strongly on the strength of neighboring sites. Here we present a new model named Competitive Splice Site Model (COSSMO), which explicitly models these competitive effects and predict the PSI distribution over any number of putative splice sites. We model an alternative splicing event as the choice of a 3′ acceptor site conditional on a fixed upstream 5′ donor site, or the choice of a 5′ donor site conditional on a fixed 3′ acceptor site. We build four different architectures that use convolutional layers, communication layers, LSTMS, and residual networks, respectively, to learn relevant motifs from sequence alone. We also construct a new dataset from genome annotations and RNA-Seq read data that we use to train our model. Results: COSSMO is able to predict the most frequently used splice site with an accuracy of 70% on unseen test data, and achieve an R2 of 60% in modeling the PSI distribution. We visualize the motifs that COSSMO learns from sequence and show that COSSMO recognizes the consensus splice site sequences as well as many known splicing factors with high specificity. Availability: Our dataset is available from http://cossmo.deepgenomics.com. Contact: frey@deepgenomics.com
0

ATP7B Variant c.1934T>G p.Met645Arg Causes Wilson Disease by Promoting Exon 6 Skipping

Daniele Merico et al.Jul 5, 2019
+16
M
C
D
Wilson Disease is a recessive genetic disorder caused by pathogenic loss-of-function variants in the ATP7B gene. It is characterized by disrupted copper homeostasis resulting in liver disease and/or neurological abnormalities. The variant NM_000053.3:c.1934T>G (Met645Arg) has been reported as compound heterozygous and is highly prevalent among Wilson Disease patients of Spanish descent. Accordingly, it is classified as pathogenic by leading molecular diagnostic centers. However, functional studies suggest that the amino acid change does not alter protein function, leading one ClinVar submitter to question its pathogenicity. Here we used a minigene system and gene-edited HepG2 cells to demonstrate that c.1934T>G causes approximately 70% skipping of exon 6. Exon 6 skipping results in frameshift and stop gain, which is expected to cause loss of ATP7B function. The elucidation of the mechanistic effect for this variant resolves any doubt about its pathogenicity and enables the development of genetic medicines for restoring correct splicing.
104

An RNA foundation model enables discovery of disease mechanisms and candidate therapeutics

Albi Celaj et al.Jan 1, 2023
+46
P
C
A
Accurately modeling and predicting RNA biology has been a long-standing challenge, bearing significant clinical ramifications for variant interpretation and the formulation of tailored therapeutics. We describe a foundation model for RNA biology, "BigRNA", which was trained on thousands of genome-matched datasets to predict tissue-specific RNA expression, splicing, microRNA sites, and RNA binding protein specificity from DNA sequence. Unlike approaches that are restricted to missense variants, BigRNA can identify pathogenic non-coding variant effects across diverse mechanisms, including polyadenylation, exon skipping and intron retention. BigRNA accurately predicted the effects of steric blocking oligonucleotides (SBOs) on increasing the expression of 4 out of 4 genes, and on splicing for 18 out of 18 exons across 14 genes, including those involved in Wilson disease and spinal muscular atrophy. We anticipate that BigRNA and foundation models like it will have widespread applications in the field of personalized RNA therapeutics.
2

Transcriptome-Wide Off-Target Effects of Steric-Blocking Oligonucleotides

Erle Holgersen et al.Sep 3, 2020
+13
S
M
E
Abstract Steric-blocking oligonucleotides (SBOs) are short, single-stranded nucleic acids designed to modulate gene expression by binding to mRNA and blocking access from cellular machinery such as splicing factors. SBOs have the potential to bind to near-complementary sites in the transcriptome, causing off-target effects. In this study, we used RNA-seq to evaluate the off-target differential splicing events of 81 SBOs and differential expression events of 46 SBOs. Our results suggest that differential splicing events are predominantly hybridization-driven, while differential expression events are more common and driven by other mechanisms. We further evaluated the performance of in silico screens for off-target events, and found an edit distance cutoff of three to result in a sensitivity of 14% and false discovery rate of 99%. A machine learning model incorporating splicing predictions substantially improved the ability to prioritize low edit distance hits, increasing sensitivity from 4% to 26% at a fixed FDR. Despite these large improvements in performance, the approach does not detect the majority of events at a false discovery rate below 99%. Our results suggest that in silico methods are currently of limited use for predicting the off-target effects of SBOs.