Ozan Özışık
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(67% Open Access)
Cited by:
323
h-index:
8
/
i10-index:
8
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

pathfindR: An R Package for Comprehensive Identification of Enriched Pathways in Omics Data Through Active Subnetworks

Ege Ülgen et al.Sep 25, 2019
Pathway analysis is often the first choice for studying the mechanisms underlying a phenotype. However, conventional methods for pathway analysis do not take into account complex protein-protein interaction information, resulting in incomplete conclusions. Previously, numerous approaches that utilize protein-protein interaction information to enhance pathway analysis yielded superior results compared to conventional methods. Hereby, we present pathfindR, another approach exploiting protein-protein interaction information and the first R package for active-subnetwork-oriented pathway enrichment analysis for class comparison omics experiments. Using the list of genes obtained from an omics experiment comparing two groups of samples, pathfindR identifies active subnetworks in a protein-protein interaction network. It then performs pathway enrichment analyses on these identified subnetworks. To further reduce the complexity, it provides functionality for clustering the resulting pathways. Moreover, through a scoring function, the overall activity of each pathway in each sample can be estimated. We illustrate the capabilities of our pathway analysis method on three gene expression datasets and compare our results with those obtained from three popular pathway analysis tools. The results demonstrate that literature-supported disease-related pathways ranked higher in our approach compared to the others. Moreover, pathfindR identified additional pathways relevant to the conditions that were not identified by other tools, including pathways named after the conditions.
0
Citation323
0
Save
4

Collaborative network analysis for the interpretation of transcriptomics data in rare diseases, an application to Huntington’s disease

Ozan Özışık et al.Jul 25, 2023
Abstract Background Rare diseases may affect the quality of life of patients and in some cases be life-threatening. Therapeutic opportunities are often limited, in part because of the lack of understanding of the molecular mechanisms that can cause disease. This can be ascribed to the low prevalence of rare diseases and therefore the lower sample sizes available for research. A way to overcome this is to integrate experimental rare disease data with prior knowledge using network-based methods. Taking this one step further, we hypothesized that combining and analyzing the results from multiple network-based methods could provide data-driven hypotheses of pathogenicity mechanisms from multiple perspectives. Results We analyzed a Huntington’s disease (HD) transcriptomics dataset using six network-based methods in a collaborative way. These methods either inherently reported enriched annotation terms or their results were fed into enrichment analyses. The resulting significantly enriched Reactome pathways were then summarized using the ontological hierarchy which allowed the integration and interpretation of outputs from multiple methods. Among the resulting enriched pathways, there are pathways that have been shown previously to be involved in HD and pathways whose direct contribution to disease pathogenesis remains unclear and requires further investigation. Conclusions In summary, our study shows that collaborative network analysis approaches are well-suited to study rare diseases, as they provide hypotheses for pathogenic mechanisms from multiple perspectives. Applying different methods to the same case study can uncover different disease mechanisms that would not be apparent with the application of a single method.
0

System-level analysis of genes mutated in muscular dystrophies reveals a functional pattern associated with muscle weakness distribution

Ozan Özışık et al.Jan 7, 2024
Muscular dystrophies (MDs) are inherited genetic diseases causing weakness and degeneration of muscles. The distribution of muscle weakness differs between MDs, involving distal muscles or proximal muscles. While the mutations in most of the MD-associated genes lead to either distal or proximal onset, there are also genes whose mutations can cause both types of onsets. We hypothesized that the genes associated with different MD onsets code proteins with distinct cellular functions. To investigate this, we collected the MD-associated genes and assigned them to three onset groups: genes mutated only in distal onset dystrophies, genes mutated only in proximal onset dystrophies, and genes mutated in both types of onsets. We then systematically evaluated the cellular functions of these gene sets with computational strategies based on functional enrichment analysis and biological network analysis. Our analyses demonstrate that genes mutated in either distal or proximal onset MDs code proteins linked with two distinct sets of cellular processes. Interestingly, these two sets of cellular processes are relevant for the genes that are associated with both onsets. Moreover, the genes associated with both onsets display high centrality and connectivity in the network of muscular dystrophy genes. Our findings support the hypothesis that the proteins associated with distal or proximal onsets have distinct functional characteristics, whereas the proteins associated with both onsets are multifunctional.
0

PSAP-genomic-regions: a method leveraging population data to prioritize coding and non-coding variants in whole genome sequencing for rare disease diagnosis

Marie-Sophie Ogloblinsky et al.Feb 13, 2024
Abstract The introduction of next generation sequencing technologies in the clinics has improved rare disease diagnosis. Nonetheless, for very heterogeneous or very rare diseases, more than half of cases still lack molecular diagnosis. Novel strategies are needed to prioritize variants within a single individual. The PSAP (Population Sampling Probability) method was developed to meet this aim but only for coding variants in exome data. To address the challenge of the analysis of non-coding variants in whole genome sequencing data, we propose an extension of the PSAP method to the non-coding genome called PSAP-genomic-regions. In this extension, instead of considering genes as testing units (PSAP-genes strategy), we use genomic regions defined over the whole genome that pinpoint potential functional constraints. We conceived an evaluation protocol for our method using artificially-generated disease exomes and genomes, by inserting coding and non-coding pathogenic ClinVar variants in large datasets of exomes and genomes from the general population. We found that PSAP-genomic-regions significantly improves the ranking of these variants compared to using a pathogenicity score alone. Using PSAP-genomic-regions, more than fifty percent of non-coding ClinVar variants, especially those involved in splicing, were among the top 10 variants of the genome. In addition, our approach gave similar results compared to PSAP-genes regarding the scoring of coding variants. On real sequencing data from 6 patients with Cerebral Small Vessel Disease and 9 patients with male infertility, all causal variants were ranked in the top 100 variants with PSAP-genomic-regions. By revisiting the testing units used in the PSAP method to include non-coding variants, we have developed PSAP-genomic-regions, an efficient whole-genome prioritization tool which offers promising results for the diagnosis of unresolved rare diseases. PSAP-genomic-regions is implemented as a user-friendly Snakemake workflow, accessible to both researchers and clinicians which can easily integrate up-to-date annotation from large databases. Author summary In recent years, improvement in DNA sequencing technologies has allowed the identification of many genes involved in rare diseases. Nonetheless, the molecular diagnosis is still unknown for more than half of rare diseases cases. This is in part due to the large heterogeneity of molecular causes in rare diseases. This also highlights the need for the development of new methods to prioritize pathogenic variants from DNA sequencing data at the scale of the whole genome and not only coding regions. With PSAP-genomic-regions, we offer a strategy to prioritize coding and non-coding variants in whole-genome data from a single individual in need of a diagnosis. The PSAP-genomic-regions combines information on the predicted pathogenicity and frequency of variants in the context of functional regions of the genome. In this work, we compare the PSAP-genomic-regions strategy to other variant prioritization strategies on simulated and real data. We show the better performance of PSAP-genomic-regions over a classical approach based on variant pathogenicity scores alone. PSAP-genomic-regions provides a straightforward approach to prioritize causal pathogenic variants, especially non-coding ones, that are often missed with other strategies and could explain the cause of undiagnosed rare diseases.
0

A Scoring System to Evaluate the Impact of SNPs in a Path Related Context to Study Behcet's Disease Aetiology in Japanese Population

Ozan Özışık et al.May 8, 2018
Motivation: Genome-wide association study (GWAS) is a powerful method that can provide a list of single nucleotide polymorphisms (SNPs) that are significantly related to the pathogenesis of a disease. Even though in Mendelian diseases strong associations can be found for certain SNPs, in most of the complex diseases only modest associations can be identified from the GWAS. Therefore, the main challenge in such studies is to understand how multiple SNPs that have modest association with the phenotype interact and contribute to its aetiology. This can only be done via pathway based analysis of modestly associated SNPs and the genes that are affected by these changes. Results: In this study, we propose DAPath, a Disease Associated Path analyzer tool for discovering signaling paths and the pathways that contain these paths which are subjected to cumulative impact of modestly associated variants. We applied our proposed method on Behcet's disease (BD) GWAS dataset from Japanese population. Antigen Processing and Presentation pathway is ranked first with 16 highly affected paths. Th17 cell differentiation, Natural killer cell mediated cytotoxicity, Jak-STAT signaling, and Circadian rhythm pathways are also found to be containing highly affected paths. Availability: The proposed method https://github.com/ozanozisik/DAPath
1

Integrative analysis of CAKUT multi-omics data

Jumamurat Bayjanov et al.Jul 1, 2023
Abstract Congenital Anomalies of the Kidney and Urinary Tract (CAKUT) is the leading cause of childhood end-stage renal disease and a significant cause of chronic kidney disease in adults. Genetic and environmental factors are known to influence CAKUT development, but the currently known disease mechanism remains incomplete. Our goal is to identify affected pathways and networks in CAKUT, and thereby aid in getting a better understanding of its pathophysiology. Multi-omics experiments, including amniotic fluid miRNome, peptidome, and proteome analyses, can shed light on foetal kidney development in non-severe CAKUT patients compared to severe CAKUT cases. We performed FAIRification of these omics data sets to facilitate their integration with external data resources. Furthermore, we analysed and integrated the omics data sets using three different bioinformatics strategies. The three bioinformatics analyses provided complementary features, but all pointed towards an important role for collagen in CAKUT development. We published the three analysis strategies as containerized workflows. These workflows can be applied to other FAIR data sets and help gaining knowledge on other rare diseases.
0

PSAP‐Genomic‐Regions: A Method Leveraging Population Data to Prioritize Coding and Non‐Coding Variants in Whole Genome Sequencing for Rare Disease Diagnosis

Marie-Sophie Ogloblinsky et al.Sep 24, 2024
ABSTRACT The introduction of Next‐Generation Sequencing technologies in the clinics has improved rare disease diagnosis. Nonetheless, for very heterogeneous or very rare diseases, more than half of cases still lack molecular diagnosis. Novel strategies are needed to prioritize variants within a single individual. The Population Sampling Probability (PSAP) method was developed to meet this aim but only for coding variants in exome data. Here, we propose an extension of the PSAP method to the non‐coding genome called PSAP‐genomic‐regions. In this extension, instead of considering genes as testing units (PSAP‐genes strategy), we use genomic regions defined over the whole genome that pinpoint potential functional constraints. We conceived an evaluation protocol for our method using artificially generated disease exomes and genomes, by inserting coding and non‐coding pathogenic ClinVar variants in large data sets of exomes and genomes from the general population. PSAP‐genomic‐regions significantly improves the ranking of these variants compared to using a pathogenicity score alone. Using PSAP‐genomic‐regions, more than 50% of non‐coding ClinVar variants were among the top 10 variants of the genome. On real sequencing data from six patients with Cerebral Small Vessel Disease and nine patients with male infertility, all causal variants were ranked in the top 100 variants with PSAP‐genomic‐regions. By revisiting the testing units used in the PSAP method to include non‐coding variants, we have developed PSAP‐genomic‐regions, an efficient whole‐genome prioritization tool which offers promising results for the diagnosis of unresolved rare diseases.