Furkan Özden
Author with expertise in Ribosome Structure and Translation Mechanisms
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(100% Open Access)
Cited by:
0
h-index:
3
/
i10-index:
0
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
26

Learning to Generate 5’ UTR Sequences for Optimized Ribosome Load and Gene Expression

Sina Barazandeh et al.Feb 1, 2023
+2
A
F
S
Abstract The 5’ untranslated region (5’ UTR) of the messenger RNA plays a crucial role in the translatability and stability of the molecule. Thus, it is an important component in the design of synthetic biological circuits for high and stable expression of intermediate proteins. Several UTR sequences are patented and used frequently in laboratories. We present a novel model UTRGAN, a Generative Adversarial Network (GAN)-based model designed to generate 5’ UTR sequences coupled with an optimization procedure to ensure a target feature such as high expression for a target gene sequence or high ribosome load and translation efficiency. We rigorously analyze and show that the model can generate sequences that mimic various properties of natural UTR sequences. Then, we show that the optimization procedure yields sequences that are expected to yield (i) 61% higher average expression (up to 5-fold) on a set of target genes, (ii) 53% higher mean ribosome load on average (up to 2-fold for the best 5’ UTR), and (iii) a 34-fold increase on average translation efficiency, compared to the initially generated UTR sequences. We also demonstrate that when there is a single target gene of interest, the expected expression increases by at least 37% on average and up to 8-fold for certain genes (up to 32-fold for the best 5’ UTR).
2

Quantifying uncertainty in off-target activity for CRISPR guide RNAs

Furkan Özden et al.Jun 2, 2023
P
F
Abstract CRISPR-based genome editing technologies have revolutionised the field of molecular biology, offering unprecedented opportunities for precise genetic manipulation. However, off-target effects remain a significant challenge, potentially leading to unintended consequences and limiting the applicability of CRISPR-based genome editing technologies in clinical settings. Current literature predominantly focuses on point predictions for off-target activity, which may not fully capture the range of possible outcomes and associated risks. Here, we present crispAI, a neural network architecture-based approach for predicting uncertainty estimates for off-target cleavage activity, providing a more comprehensive risk assessment and facilitating improved decision-making in single guide RNA (sgRNA) design. Our approach makes use of the count noise model Zero Inflated Negative Binomial (ZINB) to model the uncertainty in the off-target cleavage activity data. In addition, we present the first-of-its-kind genome-wide sgRNA efficiency score, crispAI-aggregate, enabling prioritization among sgRNAs with similar point aggregate predictions by providing richer information compared to existing aggregate scores. We show that uncertainty estimates of our approach are calibrated and its predictive performance is superior to state-of-the-art in silico off-target cleavage activity prediction methods.
18

RNAGEN: A generative adversarial network-based model to generate synthetic RNA sequences to target proteins

Furkan Özden et al.Jul 12, 2023
+2
D
S
F
Abstract RNA - protein binding plays an important role in regulating protein activity by affecting localization and stability. While proteins are usually targeted via small molecules or other proteins, easy-to-design and synthesize small RNAs are a rather unexplored and promising venue. The problem is the lack of methods to generate RNA molecules that have the potential to bind to certain proteins. Here, we propose a method based on generative adversarial networks (GAN) that learn to generate short RNA sequences with natural RNA-like properties such as secondary structure and free energy. Using an optimization technique, we fine-tune these sequences to have them bind to a target protein. We use RNA-protein binding prediction models from the literature to guide the model. We show that even if there is no available guide model trained specifically for the target protein, we can use models trained for similar proteins, such as proteins from the same family, to successfully generate a binding RNA molecule to the target protein. Using this approach, we generated piRNAs that are tailored to bind to SOX2 protein using models trained for its relative (SOX15, SOX14, and SOX7) and experimentally validated in vitro that the top-2 molecules we generated specifically bind to SOX2.
1

ECOLE: Learning to call copy number variants on whole exome sequencing data

Berk Mandiracioglu et al.Nov 17, 2022
+4
M
F
B
Abstract Copy number variants (CNV) are shown to contribute to the etiology of several genetic disor­ders. Accurate detection of CNVs on whole exome sequencing (WES) data has been a long sought-after goal for use in clinics. This was not possible despite recent improvements in performance because algo­rithms mostly suffer from low precision and even lower recall on expert-curated gold standard call sets. Here, we present a deep learning-based somatic and germline CNV caller for WES data, named ECOLE. Based on a variant of the transformer architecture, the model learns to call CNVs per exon, using high-confidence calls made on matched WGS samples. We further train and fine-tune the model with a small set of expert calls via transfer learning. We show that ECOLE achieves high performance on human ex­pert labeled data for the first time with 68.7% precision and 49.6% recall. This corresponds to precision and recall improvements of 18.7% and 30.8% over the next best-performing methods, respectively. We also show that the same fine-tuning strategy using tumor samples enables ECOLE to detect RT-qPCR validated variations in bladder cancer samples without the need for a control sample. ECOLE is available at https://github.com/ciceklab/ECOLE .
1

Polishing Copy Number Variant Calls on Exome Sequencing Data via Deep Learning

Furkan Özden et al.May 10, 2020
A
C
F
Abstract Accurate and efficient detection of copy number variants (CNVs) is of critical importance due to their significant association with complex genetic diseases. Although algorithms that use whole genome sequencing (WGS) data provide stable results with mostly-valid statistical assumptions, copy number detection on whole exome sequencing (WES) data shows comparatively lower accuracy. This is unfortunate as WES data is cost efficient, compact and is relatively ubiquitous. The bottleneck is primarily due to non-contiguous nature of the targeted capture: biases in targeted genomic hybridization, GC content, targeting probes, and sample batching during sequencing. Here, we present a novel deep learning model, DECoNT , which uses the matched WES and WGS data and learns to correct the copy number variations reported by any off-the-shelf WES-based germline CNV caller. We train DECoNT on the 1000 Genomes Project data, and we show that we can efficiently triple the duplication call precision and double the deletion call precision of the state-of-the-art algorithms. We also show that our model consistently improves the performance independent from (i) sequencing technology, (ii) exome capture kit and (iii) CNV caller. Using DECoNT as a universal exome CNV call polisher has the potential to improve the reliability of germline CNV detection on WES data sets.