SB
Silviu‐Alin Bacanu
Author with expertise in Genomic Studies and Association Analyses
Virginia Commonwealth University, SUNY Downstate Medical Center, Karolinska Institutet
+ 7 more
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
26
(23% Open Access)
Cited by:
1
h-index:
60
/
i10-index:
133
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Distinct genetic liability profiles define clinically relevant patient strata across common diseases

Lucia Trastulla et al.Sep 16, 2024
+94
S
G
L
Abstract Stratified medicine holds great promise to tailor treatment to the needs of individual patients. While genetics holds great potential to aid patient stratification, it remains a major challenge to operationalize complex genetic risk factor profiles to deconstruct clinical heterogeneity. Contemporary approaches to this problem rely on polygenic risk scores (PRS), which provide only limited clinical utility and lack a clear biological foundation. To overcome these limitations, we develop the CASTom-iGEx approach to stratify individuals based on the aggregated impact of their genetic risk factor profiles on tissue specific gene expression levels. The paradigmatic application of this approach to coronary artery disease or schizophrenia patient cohorts identified diverse strata or biotypes. These biotypes are characterized by distinct endophenotype profiles as well as clinical parameters and are fundamentally distinct from PRS based groupings. In stark contrast to the latter, the CASTom-iGEx strategy discovers biologically meaningful and clinically actionable patient subgroups, where complex genetic liabilities are not randomly distributed across individuals but rather converge onto distinct disease relevant biological processes. These results support the notion of different patient biotypes characterized by partially distinct pathomechanisms. Thus, the universally applicable approach presented here has the potential to constitute an important component of future personalized medicine paradigms.
0
Citation1
0
Save
7

Deep Learning-based Phenotype Imputation on Population-scale Biobank Data Increases Genetic Discoveries

Ulzee An et al.Oct 24, 2023
+10
M
A
U
Abstract Biobanks that collect deep phenotypic and genomic data across large numbers of individuals have emerged as a key resource for human genetic research. However, phenotypes acquired as part of Biobanks are often missing across many individuals, limiting the utility of these datasets. The ability to accurately impute or “fill-in” missing phenotypes is critical to harness the power of population-scale Biobank datasets. We propose AutoComplete, a deep learning-based imputation method which can accurately impute missing phenotypes in population-scale Biobank datasets. When applied to collections of phenotypes measured across ≈ 300K individuals from the UK Biobank, AutoComplete improved imputation accuracy over existing 2 methods (average improvement in r 2 of 18% for all phenotypes and 42% for binary phenotypes). We explored the utility of phenotype imputation for improving the power of genome-wide association studies (GWAS) by applying our method to a group of five clinically relevant traits with an average missigness rate of 83% (67% to 94%) leading to an an increase in effective sample size of ≈2-fold on average (0.5 to 3.3-fold across the phenotypes). GWAS on the resulting imputed phenotypes led to an increase in the total number of loci significantly associated to the traits from four to 129. Our results demonstrate the utility of deep-learning based imputation to increase power for genetic discoveries in existing biobank data sets.
0

Trans-ancestral GWAS of alcohol dependence reveals common genetic underpinnings with psychiatric disorders

Raymond Walters et al.May 6, 2020
+160
A
M
R
Liability to alcohol dependence (AD) is heritable, but little is known about its complex polygenic architecture or its genetic relationship with other disorders. To discover loci associated with AD and characterize the relationship between AD and other psychiatric and behavioral outcomes, we carried out the largest GWAS to date of DSM-IV diagnosed AD. Genome-wide data on 14,904 individuals with AD and 37,944 controls from 28 case/control and family-based studies were meta-analyzed, stratified by genetic ancestry (European, N = 46,568; African; N = 6,280). Independent, genome-wide significant effects of different ADH1B variants were identified in European (rs1229984; p = 9.8E-13) and African ancestries (rs2066702; p = 2.2E-9). Significant genetic correlations were observed with schizophrenia, ADHD, depression, and use of cigarettes and cannabis. There was only modest genetic correlation with alcohol consumption and inconsistent associations with problem drinking. The genetic underpinnings of AD only partially overlap with those for alcohol consumption, underscoring the genetic distinction between pathological and non-pathological drinking behaviors.
1

Genome-wide Association Study of Clinical Features in the Schizophrenia Psychiatric Genomics Consortium: Confirmation of Polygenic Effect on Negative Symptoms

Tim Bigdeli et al.May 7, 2020
+26
S
R
T
Schizophrenia is a clinically heterogeneous disorder. Proposed revisions in DSM-5 included dimensional measurement of different symptom domains. We sought to identify common genetic variants influencing these dimensions, and confirm a previous association between polygenic risk of schizophrenia and the severity of negative symptoms. The Psychiatric Genomics Consortium study of schizophrenia comprised 8,432 cases of European ancestry with available clinical phenotype data. Symptoms averaged over the course of illness were assessed using the OPCRIT, PANSS, LDPS, SCAN, SCID, and CASH. Factor analyses of each constituent PGC study identified positive, negative, manic, and depressive symptom dimensions. We examined the relationship between the resultant symptom dimensions and aggregate polygenic risk scores indexing risk of schizophrenia. We performed genome-wide association study (GWAS) of each quantitative traits using linear regression and adjusting for significant effects of sex and ancestry. The negative symptom factor was significantly associated with polygene risk scores for schizophrenia, confirming a previous, suggestive finding by our group in a smaller sample, though explaining only a small fraction of the variance. In subsequent GWAS, we observed the strongest evidence of association for the positive and negative symptom factors, with SNPs in RFX8 on 2q11.2 (P=6.27×10-8) and upstream of WDR72/UNC13C on 15q21.3 (P=7.59×10-8), respectively. We report evidence of association of novel modifier loci for schizophrenia, though no single locus attained established genome-wide significance criteria. As this may have been due to insufficient statistical power, follow-up in additional samples is warranted. Importantly, we replicated our previous finding that polygenic risk explains at least some of the variance in negative symptoms, a core illness dimension.
0

Leveraging genome-wide data to investigate differences between opioid use vs. opioid dependence in 41,176 individuals from the Psychiatric Genomics Consortium

Renato Polimanti et al.May 7, 2020
+41
E
R
R
To provide novel insights into the biology of opioid dependence (OD) and opioid use (i.e., exposure, OE), we completed a genome-wide analysis comparing up to 4,503 OD cases, 4,173 opioid-exposed controls, and 32,500 opioid-unexposed controls. Among the variants identified, rs9291211 was associated with OE (a comparison of exposed vs. unexposed controls; z=-5.39, p=7.2x10-8). This variant regulates the transcriptomic profiles of SLC30A9 and BEND4 in multiple brain tissues and was previously associated with depression, alcohol consumption, and neuroticism. A phenome-wide scan of rs9291211 in the UK Biobank (N>360,000) found association of this variant with propensity to use dietary supplements (p=1.68x10-8). With respect to the same OE phenotype in the gene-based analysis, we identified SDCCAG8 (z=4.69, p=10-6), which was previously associated with educational attainment, risk-taking behaviors, and schizophrenia. In addition, rs201123820 showed a genome-wide significant difference between OD cases and unexposed controls (z=5.55, p=2.9x10-8) and a significant association with musculoskeletal disorders in the UK Biobank (p=4.88x10-7). A polygenic risk score (PRS) based on a GWAS of risk-tolerance (N=466,571) was positively associated with OD (OD cases vs. unexposed controls, p=8.1x10-5; OD cases vs. exposed controls, p=0.054) and OE (exposed controls vs. unexposed controls, p=3.6x10-5). A PRS based on a GWAS of neuroticism (N=390,278) was positively associated with OD (OD cases vs. unexposed controls, p=3.2x10-5; OD cases vs. exposed controls, p=0.002) but not with OE (p=0.671). Our analyses highlight the difference between dependence and exposure and the importance of considering the definition of controls (exposed vs. unexposed) in studies of addiction.
0

A contribution of novel CNVs to schizophrenia from a genome-wide study of 41,321 subjects

Christian Marshall et al.May 6, 2020
+265
D
D
C
Genomic copy number variants (CNVs) have been strongly implicated in the etiology of schizophrenia (SCZ). However, apart from a small number of risk variants, elucidation of the CNV contribution to risk has been difficult due to the rarity of risk alleles, all occurring in less than 1% of cases. We sought to address this obstacle through a collaborative effort in which we applied a centralized analysis pipeline to a SCZ cohort of 21,094 cases and 20,227 controls. We observed a global enrichment of CNV burden in cases (OR=1.11, P=5.7e-15), which persisted after excluding loci implicated in previous studies (OR=1.07, P=1.7e-6). CNV burden is also enriched for genes associated with synaptic function (OR = 1.68, P = 2.8e-11) and neurobehavioral phenotypes in mouse (OR = 1.18, P= 7.3e-5). We identified genome-wide significant support for eight loci, including 1q21.1, 2p16.3 (NRXN1), 3q29, 7q11.2, 15q13.3, distal 16p11.2, proximal 16p11.2 and 22q11.2. We find support at a suggestive level for nine additional candidate susceptibility and protective loci, which consist predominantly of CNVs mediated by non-allelic homologous recombination (NAHR).
78

Phenotype integration improves power and preserves specificity in biobank-based genetic studies of MDD

Andy Dahl et al.Oct 24, 2023
+10
U
M
A
Abstract Biobanks often contain several phenotypes relevant to a given disorder, and researchers face complex tradeoffs between shallow phenotypes (high sample size, low specificity and sensitivity) and deep phenotypes (low sample size, high specificity and sensitivity). Here, we study an extreme case: Major Depressive Disorder (MDD) in UK Biobank. Previous studies found that shallow and deep MDD phenotypes have qualitatively distinct genetic architectures, but it remains unclear which are optimal for scientific study or clinical prediction. We propose a new framework to get the best of both worlds by integrating together information across hundreds of MDD-relevant phenotypes. First, we use phenotype imputation to increase sample size for the deepest available MDD phenotype, which dramatically improves GWAS power (increases #loci ~10 fold) and PRS accuracy (increases R2 ~2 fold). Further, we show the genetic architecture of the imputed phenotype remains specific to MDD using genetic correlation, PRS prediction in external clinical cohorts, and a novel PRS-based pleiotropy metric. We also develop a complementary approach to improve specificity of GWAS on shallow MDD phenotypes by adjusting for phenome-wide PCs. Finally, we study phenotype integration at the level of GWAS summary statistics, which can increase GWAS and PRS power but introduces non-MDD-specific signals. Our work provides a simple and scalable recipe to improve genetic studies in large biobanks by combining the sample size of shallow phenotypes with the sensitivity and specificity of deep phenotypes.
78
0
Save
5

Improving the discovery of rare variants associated with alcohol problems by leveraging machine learning phenotype prediction and functional information.

Mohammad Ahangari et al.Oct 24, 2023
+6
M
A
M
Abstract Alcohol use disorder (AUD) is moderately heritable with significant social and economic impact. Genome-wide association studies (GWAS) have identified common variants associated with AUD, however, rare variant investigations have yet to achieve well-powered sample sizes. In this study, we conducted an interval-based exome-wide analysis of the Alcohol Use Disorder Identification Test Problems subscale (AUDIT-P) using both machine learning (ML) predicted risk and empirical functional weights. This research has been conducted using the UK Biobank Resource (application number 30782.) Filtering the 200k exome release to unrelated individuals of European ancestry resulted in a sample of 147,386 individuals with 51,357 observed and 96,029 unmeasured but predicted AUDIT-P for exome analysis. Sequence Kernel Association Test (SKAT/SKAT-O) was used for rare variant (Minor Allele Frequency (MAF) < 0.01) interval analyses using default and empirical weights. Empirical weights were constructed using annotations found significant by stratified LD Score Regression analysis of predicted AUDIT-P GWAS, providing prior functional weights specific to AUDIT-P. Using only samples with observed AUDIT-P yielded no significantly associated intervals. In contrast, ADH1C and THRA gene intervals were significant (False discovery rate (FDR) <0.05) using default and empirical weights in the predicted AUDIT-P sample, with the most significant association found using predicted AUDIT-P and empirical weights in the ADH1C gene (SKAT-O P Default = 1.06 x 10 -9 and P Empirical weight = 6.25 x 10 -11 ). These findings provide evidence for rare variant association of the ADH1C gene with the AUDIT-P and highlight the successful leveraging of ML to increase effective sample size and prior empirical functional weights based on common variant GWAS data to refine and increase the statistical significance in underpowered phenotypes.
0

FIQT: a simple, powerful method to accurately estimate effect sizes in genome scans

Tim Bigdeli et al.May 7, 2020
+4
B
D
T
Genome scans, including both genome-wide association studies and deep sequencing, continue to discover a growing number of significant association signals for various traits. However, often variants meeting genome-wide significance criteria explain far less of the overall trait variance than “sub-threshold” association signals. To extract these sub-threshold signals, there is a need for methods which accurately estimate the mean of all (normally-distributed) test-statistics from a genome scan (i.e., Z-scores). This is currently achieved by the difficult procedures of adjusting all Z-score (χ_1^2) statistics for “winner’s curse” (multiple testing). Given that multiple testing adjustments are much simpler for p-values, we propose a method for estimating Z-scores means by i) first adjusting their p-values for multiple testing and then ii) transforming the adjusted p-values to upper tail Z-scores with the sign of the original statistics. Because a False Discovery Rate (FDR) procedure is used for multiple testing adjustment, we denote this method FDR Inverse Quantile Transformation (FIQT). When compared to competitors, e.g. Empirical Bayes (including proposed improvements), FIQT is more i) accurate and ii) computationally efficient by orders of magnitude. Its accuracy advantage is substantial at larger sample sizes and/or moderate numbers of association signals. Practical application of FIQT to Z-scores from the first Psychiatric Genetic Consortium (PGC) schizophrenia predicts a non-trivial fraction of the significant signal regions from the subsequent published PGC schizophrenia studies. Finally, we suggest that FIQT might be i) used to improve subject level risk prediction and ii) further improved by modelling the noncentrality of χ_1^2 statistics.
0

Genomic dissection of bipolar disorder and schizophrenia including 28 subphenotypes

Douglas Ruderfer et al.May 6, 2020
+535
A
S
D
Schizophrenia (SCZ) and bipolar disorder (BD) are highly heritable disorders that share a significant proportion of common risk variation. Understanding the genetic factors underlying the specific symptoms of these disorders will be crucial for improving diagnosis, intervention and treatment. In case-control data consisting of 53,555 cases (20,129 BD, 33,426 SCZ) and 54,065 controls, we identified 114 genome-wide significant loci (GWS) when comparing all cases to controls, of which 41 represented novel findings. Two genome-wide significant loci were identified when comparing SCZ to BD and a third was found when directly incorporating functional information. Regional joint association identified a genomic region of overlapping association in BD and SCZ with disease-independent causal variants indicating a fourth region contributing to differences between these disorders. Regional SNP-heritability analyses demonstrated that the estimated heritability of BD based on the SCZ GWS regions was significantly higher than that based on the average genomic region (91 regions, p = 1.2x10-6) while the inverse was not significant (19 regions, p=0.89). Using our BD and SCZ GWAS we calculated polygenic risk scores and identified several significant correlations with: 1) SCZ subphenotypes: negative symptoms (SCZ, p=3.6x10-6) and manic symptoms (BD, p=2x10-5), 2) BD subphenotypes: psychotic features (SCZ p=1.2x10-10, BD p=5.3x10-5) and age of onset (SCZ p=7.9x10-4). Finally, we show that psychotic features in BD has significant SNP-heritability (h2snp=0.15, SE=0.06), and a significant genetic correlation with SCZ (rg=0.34) in addition there is a significant sign test result between SCZ GWAS and a GWAS of BD cases contrasting those with and without psychotic features (p=0.0038, one-side binomial test). For the first time, we have identified specific loci pointing to a potential role of 4 genes (DARS2, ARFGEF2, DCAKD and GATAD2A) that distinguish between BD and SCZ, providing an opportunity to understand the biology contributing to clinical differences of these disorders. Our results provide the best evidence so far of genomic components distinguishing between BD and SCZ that contribute directly to specific symptom dimensions.
Load More