PV
Peter Visscher
Author with expertise in Genomic Studies and Association Analyses
University of Groningen, University Medical Center Groningen, University of Queensland
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
47
(26% Open Access)
Cited by:
49
h-index:
47
/
i10-index:
66
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
41

Leveraging functional genomic annotations and genome coverage to improve polygenic prediction of complex traits within and between ancestries

Zhili Zheng et al.Oct 24, 2023
+11
J
S
Z
Abstract We develop a new method, SBayesRC, that integrates GWAS summary statistics with functional genomic annotations to improve polygenic prediction of complex traits. Our method is scalable to whole-genome variant analysis and refines signals from functional annotations by allowing them to affect both causal variant probability and causal effect distribution. We analyse 28 traits in the UK Biobank using ∼7 million common SNPs and 96 annotations. SBayesRC improves prediction accuracy by 14% in European ancestry and by up to 33% in trans-ancestry prediction, compared to the baseline method SBayesR which does not use annotations, and outperforms state-of-the-art methods LDpred-funct, PolyPred-S and PRS-CSx by 12-15%. Investigation of factors affecting prediction accuracy identified a significant interaction between SNP density and annotation information, encouraging future use of whole-genome sequence variants for prediction. Functional partitioning analysis highlights a major contribution of evolutionary constrained regions to prediction accuracy and the largest per-SNP contribution from non-synonymous SNPs.
0

GWAS on family history of Alzheimer’s disease

Riccardo Marioni et al.May 6, 2020
+14
A
S
R
Abstract Alzheimer’s disease (AD) is a public health priority for the 21 st century. Risk reduction currently revolves around lifestyle changes with much research trying to elucidate the biological underpinnings. Using self-report of parental history of Alzheimer’s dementia for case ascertainment in a genome-wide association study of over 300,000 participants from UK Biobank (32,222 maternal cases, 16,613 paternal cases) and meta-analysing with published consortium data (n=74,046 with 25,580 cases across the discovery and replication analyses), six new AD-associated loci (P<5x10 −8 ) are identified. Three contain genes relevant for AD and neurodegeneration: ADAM10, ADAMTS4, and ACE . Suggestive loci include drug targets such as VKORC1 (warfarin dose) and BZRAP1 (benzodiazepine receptor). We report evidence that association of SNPs and AD at the PVR gene is potentially mediated by both gene expression and DNA methylation in the prefrontal cortex. Our discovered loci may help to elucidate the biological mechanisms underlying AD and, given that many are existing drug targets for other diseases and disorders, warrant further exploration for potential precision medicine applications.
0

New mutations, old statistical challenges

Jeffrey Barrett et al.May 6, 2020
+11
K
J
J
Based on targeted sequencing of 208 genes in 11,730 neurodevelopmental disorder cases, Stessman et al. report the identification of 91 genes associated (at a False Discovery Rate [FDR] of 0.1) with autism spectrum disorders (ASD), intellectual disability (ID), and developmental delay (DD)-including what they characterize as 38 novel genes, not previously reported as connected with these diseases. If true, this would represent a substantial step forward. Unfortunately, each of the two discovery analyses (1. De novo mutation analysis and, 2. a comparison of private mutations with public control data) contain critical statistical flaws. When one accounts for these problems, fewer than half of the genes - and very few, if any, of the novel findings - survive. These errors have implications for how future analyses should be conducted, for understanding the genetic basis of these disorders, and for genomic medicine.
0
Paper
Citation9
0
Save
1

Large effect loci have a prominent role in Darwin’s finch evolution

Erik Enbody et al.Oct 24, 2023
+5
C
A
E
Abstract A fundamental goal in evolutionary biology is to understand the genetic architecture of adaptive traits and its evolutionary relevance. Using whole-genome data of 3,958 Darwin’s finches on the Galápagos Island of Daphne Major we identify six loci of large effect that explain 46% of the variation in beak size of Geospiza fortis , a key ecological trait. Allele frequency changes across 30 years at these loci affected beak morphology in two ways. An abrupt change in beak size occurred in Geospiza fortis as a result of natural selection associated with a drought, and a more gradual change occurred in G. scandens as a result of introgressive hybridization. This study demonstrates how large effect loci are a major contributor to the genetic architecture of rapid diversification during adaptive radiations. One Sentence Summary Allele frequency change at six loci of large effect causes evolutionary change in key ecological traits.
1
Paper
Citation5
0
Save
28

mBAT-combo: a more powerful test to detect gene-trait associations from GWAS data

Ang Li et al.Oct 24, 2023
+8
A
S
A
Abstract Gene-based association tests aggregate multiple SNP-trait associations into sets defined by gene boundaries. Since genes have a direct biological link to downstream function, gene-based test results are widely used in post-GWAS analysis. A common approach for gene-based tests is to combine SNPs associations by computing the sum of χ 2 statistics. However, this strategy ignores the directions of SNP effects, which could result in a loss of power for SNPs with masking effects (e.g., when the product of the effects of two SNPs and their linkage disequilibrium (LD) correlation is negative). Here, we introduce “mBAT-combo”, a new set-based test that is better powered than other methods to detect multi-SNP associations in the context of masking effects. We validate the method through simulations and applications to real data. We find that of 35 blood and urine biomarker traits in the UK Biobank, 34 traits show evidence for masking effects in a total of 4,175 gene-trait pairs, indicating that masking effects in complex traits is common. We further validate the improved power of our method in height, body mass index and schizophrenia with different GWAS sample sizes and show that on average 95.7% of the genes detected only by mBAT-combo with smaller sample sizes can be identified by the single-SNP approach with larger sample sizes (average sample size increased by 1.7-fold). For instance, LRRC4B is significant only in our method for schizophrenia, which has been shown to play a role in presynaptic pathology using genetic fine-mapping and evidence-based synaptic annotations. As a more powerful gene-based method, mBAT-combo is expected to improve the downstream pathway analysis or tissue and cell-type enrichment analysis that takes genes identified from GWAS data as input to understand the biological mechanisms of the trait or disease. Despite our focus on genes in this study, the framework of mBAT-combo is general and can be applied to any set of SNPs to refine trait-association signals hidden in genomic regions with complex LD structures.
0

The Parkinson’s Disease Mendelian Randomization Research Portal

Alastair Noyce et al.May 7, 2020
+19
J
S
A
ABSTRACT Background Mendelian randomization (MR) is a method for exploring observational associations to find evidence of causality. Objective To apply MR between multiple risk factors/phenotypic traits (exposures) and Parkinson’s disease (PD) in a large, unbiased manner, and to create a public resource for research. Methods We used two-sample MR in which the summary statistics relating to SNPs from genome wide association studies (GWASes) of 5,839 exposures curated on MR Base were used to assess causal relationships with PD. We selected the highest quality exposure GWASes for this report (n=401). For the disease outcome, summary statistics from the largest published PD GWAS were used. For each exposure, the causal effect on PD was assessed using the inverse variance weighted (IVW) method, followed by a range of sensitivity analyses. We used a false discovery rate (FDR) corrected p-value of <0.05 from the IVW analysis to prioritize traits of interest. Results We observed evidence for causal associations between twelve exposures and risk of PD. Of these, nine were causal effects related to increasing adiposity and decreasing risk of PD. The remaining top exposures that affected PD risk were tea drinking, time spent watching television and forced vital capacity, but the latter two appeared to be biased by violations of underlying MR assumptions. Discussion We present a new platform which offers MR analyses for a total of 5,839 GWASes versus the largest PD GWASes available ( https://pdgenetics.shinyapps.io/pdgenetics/ ). Alongside, we report further evidence to support a causal role for adiposity on lowering the risk of PD.
22

Improving GWAS discovery and genomic prediction accuracy in Biobank data

Etienne Orliac et al.Oct 24, 2023
+4
S
D
E
Genetically informed and deep-phenotyped biobanks are an important research resource. The cost of phenotyping far outstrips that of genotyping, and therefore it is imperative that the most powerful, versatile and efficient analysis approaches are used. Here, we apply our recently developed Bayesian grouped mixture of regressions model (GMRM) in the UK and Estonian Biobanks and obtain the highest genomic prediction accuracy reported to date across 21 heritable traits. On average, GMRM accuracies were 15% (SE 7%) greater than prediction models run in the LDAK software with SNP annotation marker groups, 18% (SE 3%) greater than a baseline BayesR model without SNP markers grouped into MAF-LD-annotation categories, and 106% (SE 9%) greater than polygenic risk scores calculated from mixed-linear model association (MLMA) estimates. For height, the prediction accuracy R 2 was 47% in a UK Biobank hold-out sample, which was 76% of the estimated . We then extend our GMRM prediction model to provide MLMA SNP marker estimates for GWAS discovery, which increased the independent loci detected to 7,910 in unrelated UK Biobank individuals, as compared to 5,521 from BoltLMM and 5,727 from Regenie, a 43% and 38% increase respectively. The average χ 2 value of the leading markers was 34% (SE 5.11) higher for GMRM as compared to Regenie, and increased by 17% for every 1% increase in prediction accuracy gained over a baseline BayesR model across the traits. Thus, we show that modelling genetic associations accounting for MAF and LD differences among SNP markers, and incorporating prior knowledge of genomic function, is important for both genomic prediction and for discovery in large-scale individual-level biobank-scale studies.
22
Paper
Citation3
0
Save
76

Improved analyses of GWAS summary statistics by reducing data heterogeneity and errors

Wenhan Chen et al.Oct 24, 2023
+4
Z
Y
W
Abstract Summary statistics from genome-wide association studies (GWAS) have facilitated the development of various summary data-based methods, which typically require a reference sample for linkage disequilibrium (LD) estimation. Analyses using these methods may be biased by errors in GWAS summary data and heterogeneity between GWAS and LD reference. Here we propose a quality control method, DENTIST, that leverages LD among genetic variants to detect and eliminate errors in GWAS or LD reference and heterogeneity between the two. Through simulations, we demonstrate that DENTIST substantially reduces false-positive rate (FPR) in detecting secondary signals in the summary-data-based conditional and joint (COJO) association analysis, especially for imputed rare variants (FPR reduced from >28% to <2% in the presence of heterogeneity between GWAS and LD reference). We further show that DENTIST can improve other summary-data-based analyses such as fine-mapping analysis, and integrative analysis of GWAS and expression quantitative trait locus data.
0

Parkinson disease age of onset GWAS: defining heritability, genetic loci and a-synuclein mechanisms

Cornelis Blauwendraat et al.May 7, 2020
+38
C
K
C
Increasing evidence supports an extensive and complex genetic contribution to Parkinson's disease (PD). Previous genome-wide association studies (GWAS) have shed light on the genetic basis of risk for this disease. However, the genetic determinants of PD age of onset are largely unknown. Here we performed an age of onset GWAS based on 28,568 PD cases. We estimated that the heritability of PD age of onset due to common genetic variation was ~0.11, lower than the overall heritability of risk for PD (~0.27) likely in part because of the subjective nature of this measure. We found two genome-wide significant association signals, one at SNCA and the other a protein-coding variant in TMEM175, both of which are known PD risk loci and a Bonferroni corrected significant effect at other known PD risk loci, INPP5F/BAG3, FAM47E/SCARB2, and MCCC1. In addition, we identified that GBA coding variant carriers had an earlier age of onset compared to non-carriers. Notably, SNCA, TMEM175, SCARB2, BAG3 and GBA have all been shown to either directly influence alpha-synuclein aggregation or are implicated in alpha-synuclein aggregation pathways. Remarkably, other well-established PD risk loci such as GCH1, MAPT and RAB7L1/NUCKS1 (PARK16) did not show a significant effect on age of onset of PD. While for some loci, this may be a measure of power, this is clearly not the case for the MAPT locus; thus genetic variability at this locus influences whether but not when an individual develops disease. We believe this is an important mechanistic and therapeutic distinction. Furthermore, these data support a model in which alpha-synuclein and lysosomal mechanisms impact not only PD risk but also age of disease onset and highlights that therapies that target alpha-synuclein aggregation are more likely to be disease-modifying than therapies targeting other pathways.
0

Improved polygenic prediction by Bayesian multiple regression on summary statistics

Luke Lloyd‐Jones et al.May 6, 2020
+12
J
J
L
The capacity to accurately predict an individual's phenotype from their DNA sequence is one of the great promises of genomics and precision medicine. Recently, Bayesian methods for generating polygenic predictors have been successfully applied in human genomics but require the individual level data, which are often limited in their access due to privacy or logistical concerns, and are computationally very intensive. This has motivated methodological frameworks that utilise publicly available genome-wide association studies (GWAS) summary data, which now for some traits include results from greater than a million individuals. In this study, we extend the established summary statistics methodological framework to include a class of point-normal mixture prior Bayesian regression models, which have been shown to generate optimal genetic predictions and can perform heritability estimation, variant mapping and estimate the distribution of the genetic effects. In a wide range of simulations and cross-validation using 10 real quantitative traits and 1.1 million variants on 350,000 individuals from the UK Biobank (UKB), we establish that our summary based method, SBayesR, performs similarly to methods that use the individual level data and outperforms other state-of-the-art summary statistics methods in terms of prediction accuracy and heritability estimation at a fraction of the computational resources. We generate polygenic predictors for body mass index and height in two independent data sets and show that by exploiting summary statistics on 1.1 million variants from the largest GWAS meta-analysis (n ≈ 700, 000) that the SBayesR prediction R2 improved on average across traits by 6.8% relative to that estimated from an individual-level data BayesR analysis of data from the UKB (n ≈ 450, 000). Compared with commonly used state-of-the-art summary- based methods, SBayesR improved the prediction R2 by 4.1% relative to LDpred and by 28.7% relative to clumping and p-value thresholding. SBayesR gave comparable prediction accuracy to the recent RSS method, which has a similar model, but at a computational time that is two orders of magnitude smaller. The methodology is implemented in a very efficient and user-friendly software tool titled GCTB.
Load More