MG
Mustafa Gunturkun
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
6
(83% Open Access)
Cited by:
24
h-index:
4
/
i10-index:
3
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

Private and sub-family specific mutations of founder haplotypes in the BXD family reveal phenotypic consequences relevant to health and disease

David Ashbrook et al.Apr 21, 2022
+15
M
T
D
Abstract The BXD recombinant inbred (RI) mouse strains are the largest and most deeply phenotyped inbred panel of vertebrate organisms. RIs allow phenotyping of isogenic individuals across virtually any environment or treatment. We performed whole genome sequencing and generated a compendium of SNPs, indels, short tandem repeats, and structural variants in these strains and used them to analyze phenomic data accumulated over the past 50 years. We show that BXDs segregate >6 million variants with high minor allele which are dervied from the C57BL/6J and DBA/2J founders and use this dense variant set to define ‘infinite’ marker maps and a novel family-level pangenome. We additionally characterize rates and spectra de novo variants which have accumulated over 20-200 generations of inbreeding, and have largely been ignored previously. Overall, the uniquely rich phenome when linked with WGS enables a new type of integrative modeling of genotype-to-phenotype relations.
3
Citation16
0
Save
8

GeneCup: mine PubMed for gene relationships using custom ontology and deep learning

Mustafa Gunturkun et al.Sep 18, 2020
+4
M
T
M
Abstract Interpreting and integrating results from omics studies typically requires a comprehensive and time consuming survey of extant literature. Here, we introduce GeneCup, an easy to use literature mining web service that searches all PubMed abstracts for user-provided gene symbols in conjunction with a set of custom keywords organized into a customized ontology, as well as results from human genome-wide association studies (GWAS). As an example, we organized over 300 keywords related to drug addiction into seven categories. The literature search is conducted by querying the NIH PubMed server using a programming interface, which is followed by retrieving abstracts from a local copy of the PubMed archive. The main results presented to the user are individual sentences containing the gene symbol, organized by the keywords they also contain. These sentences are presented through an interactive graphical interface or as tables. GWAS results are displayed using a similar method. All results are linked to the original abstract in PubMed. In addition, a convolutional neural network is employed to distinguish sentences describing systemic stress from those describing cellular stress. The automated and comprehensive search strategy provided by GeneCup facilitates the integration of new discoveries from omic studies with existing literature. GeneCup is free and open source software. The source code of GeneCup and the link to a running instance is available at https://github.com/hakangunturkun/GeneCup
8
Citation5
0
Save
1

Opiate responses are controlled by interactions ofOprm1andFgf12loci in rodents: Correspondence to human GWAS findings

Paige Lemen et al.Mar 12, 2022
+11
P
A
P
Abstract We mapped high-precision time-series data (15 min bins for 3 hours) generated for ~ 700 adult BXD mice across 105 morphine- and naloxone-related traits using new sequence-derived marker maps and a linear-mixed model. We confirm a previously mapped sex-independent effect of initial locomotor responses to morphine (50 mg/kg ip) that maps precisely to Oprm1 on chromosome (Chr) 10, with the linkage score reaching −log 10 P of ~12.4 (with a high B allele) at 75 min and exhausted by 160 min. We detected a new modulator of opiate locomotor activation in both sexes on Chr 16, with a peak linkage that climbs from 105 through to 180 min after injection. This locus includes one compelling candidate— fibroblast growth factor 12 (Fgf12) . We also detected a strong, but transient epistatic interaction between these two loci. Single nuclei transcriptomic analyses in rats demonstrates that expression of Oprm1 and Fgf12 mRNA covary in one specific subtype of Drd1 medium spiny neurons. Our Bayesian network analysis identified that a cascade of MAP kinases— Mapk8ip2, Map3k11 , and Map3k12 —are part of the Oprm1–Fgf12 network. This is the first demonstration of a time-dependent epistatic interaction modulating drug response in mammals with interesting mechanistic implications. Analysis of OPRM1 and FGF12 gene networks in human GWAS data highlights enrichment of signals associated with substance use disorder.
1
Citation2
0
Save
13

SVJAM: Joint Analysis of Structural Variants Using Linked Read Sequencing Data

Mustafa Gunturkun et al.Nov 4, 2021
+3
D
R
M
Abstract Linked-read whole genome sequencing methods, such as the 10x Chromium, attach a unique molecular barcode to each high molecular weight DNA molecule. The samples are then sequenced using short-read technology. During analysis, sequence reads sharing the same barcode are aligned to adjacent genomic locations. The pattern of barcode sharing between genomic regions allows the discovery of large structural variants (SVs) in the range of 1 Kb to a few Mb. Most SV calling methods for these data, such as LongRanger, analyze one sample at a time and often produces inconsistent results for the same genomic location across multiple samples. We developed a method, SVJAM, for joint calling of SVs, using data from 152 members of the BXD family of recombinant inbred strains of mice. Our method first collects candidate SV regions from single sample analysis, such as those produced by LongRanger. We then retrieve barcode overlapping data from all samples for each region. These data are organized as a high dimensional matrix. The dimension of this matrix is then reduced using principal component analysis. Samples projected onto a two dimensional space formed by the first two principal components forms two or three clusters based on their genotype, representing the reference, alternative, or heterozygotic alleles. We developed a novel distance measure for hierarchical clustering and rotating the axes to find the optimal clustering results. We also developed an algorithm to decide whether the pattern of sample distribution is best fitted with one, two, or three genotypes. For each sample, we calculate its membership score for each genotype. We compared results produced by SVJAM with LongRanger and few methods that rely on PacBio or Oxford Nanopore data. In a comparison of SVJAM with SV detected using long-read sequencing data for the DBA/2J strain, we found that our results recovered many SVs missed by LongRanger. We also found many SVs called by LongRanger were assigned with an incorrect SV type. Our algorithm also consistently identified heterozygotic regions.
13
Citation1
0
Save
6

A revamped rat reference genome improves the discovery of genetic diversity in laboratory rats

Tristan Jong et al.Jan 1, 2023
+49
J
C
T
The seventh iteration of the reference genome assembly for Rattus norvegicus, mRatBN7.2, corrects numerous misplaced segments and reduces base-level errors by approximately 9-fold and increases contiguity by 290-fold compared to its predecessor. Gene annotations are now more complete, significantly improving the mapping precision of genomic, transcriptomic, and proteomics data sets. We jointly analyzed 163 short-read whole genome sequencing datasets representing 120 laboratory rat strains and substrains using mRatBN7.2. We defined ~20.0 million sequence variations, of which 18.7 thousand are predicted to potentially impact the function of 6,677 genes. We also generated a new rat genetic map from 1,893 heterogeneous stock rats and annotated transcription start sites and alternative polyadenylation sites. The mRatBN7.2 assembly, along with the extensive analysis of genomic variations among rat strains, enhances our understanding of the rat genome, providing researchers with an expanded resource for studies involving rats.
1

Genome-wide association study of open field behavior in outbred heterogeneous stock rats identifies multiple loci implicated in psychiatric disorders

Mustafa Gunturkun et al.Oct 19, 2021
+11
A
L
M
Abstract Many personality traits are influenced by genetic factors. Rodents models provide an efficient system for analyzing genetic contribution to these traits. Using 1,246 adolescent heterogeneous stock (HS) male and female rats, we conducted a genome-wide association study (GWAS) of behaviors measured in an open field, including locomotion, novel object interaction, and social interaction. We identified 30 genome-wide significant quantitative trait loci (QTL). Using multiple criteria, including the presence of high impact genomic variants and co-localization of cis-eQTL, we identified 13 candidate genes ( Adarb2, Ankrd26, Cacna1c, Clock, Crhr1, Ctu2, Cyp26b1, Eva1a, Fam114a1, Kcnj9, Mlf2, Rab27b, Sec11a ) for these traits. Most of these genes have been implicated by human GWAS of various psychiatric traits. For example, Cacna1c , a gene known to be critical for social behavior in rodents and implicated in human schizophrenia and bipolar disorder, is a candidate gene for distance to the social zone. In addition, the QTL region for total distance to the novel object zone, on Chr1 at 144 Mb, is syntenic to a hotspot on human Chr15 (82.5-90.8 Mb) that contains 14 genes associated with psychiatric or substance abuse traits. Although some of the genes identified by this study appear to replicate findings from prior human GWAS, others likely represent novel findings that can be the catalyst for future molecular and genetic insights into human psychiatric diseases. Together, these findings provide strong support for the use of the HS population to study psychiatric disorders.