PV
Peter Visscher
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
47
(34% Open Access)
Cited by:
187
h-index:
47
/
i10-index:
66
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Causal associations between risk factors and common diseases inferred from GWAS summary data

Zhihong Zhu et al.Jul 26, 2017
+8
N
P
Z
Abstract Health risk factors such as body mass index (BMI), serum cholesterol and blood pressure are associated with many common diseases. It often remains unclear whether the risk factors are cause or consequence of disease, or whether the associations are the result of confounding. Genetic methods are useful to infer causality because genetic variants are present from birth and therefore unlikely to be confounded with environmental factors. We develop and apply a method (GSMR) that performs a multi-SNP Mendelian Randomization analysis using summary-level data from large genome-wide association studies (sample sizes of up to 405,072) to test the causal associations of BMI, waist-to-hip ratio, serum cholesterols, blood pressures, height and years of schooling (EduYears) with a range of common diseases. We identify a number of causal associations including a protective effect of LDL-cholesterol against type-2 diabetes (T2D) that might explain the side effects of statins on T2D, a protective effect of EduYears against Alzheimer’s disease, and bidirectional associations with opposite effects (e.g. higher BMI increases the risk of T2D but the effect T2D of BMI is negative). HDL-cholesterol has a significant risk effect on age-related macular degeneration, and the effect size remains significant accounting for the other risk factors. Our study develops powerful tools to integrate summary data from large studies to infer causality, and provides important candidates to be prioritized for further studies in medical research and for drug discovery.
0
Citation61
0
Save
0

Identification of 55,000 Replicated DNA Methylation QTL

Allan McRae et al.Jul 21, 2017
+15
N
J
A
DNA methylation plays an important role in the regulation of transcription. Genetic control of DNA methylation is a potential candidate for explaining the many identified SNP associations with disease that are not found in coding regions. We replicated 52,916 cis and 2,025 trans DNA methylation quantitative trait loci (mQTL) using methylation measured on Illumina HumanMethylation450 arrays in the Brisbane Systems Genetics Study (n=614 from 177 families) and the Lothian Birth Cohorts of 1921 and 1936 (combined n = 1366). The trans mQTL SNPs were found to be over-represented in 1Mbp subtelomeric regions, and on chromosomes 16 and 19. There was a significant increase in trans mQTL DNA methylation sites in upstream and 5’ UTR regions. No association was observed between either the SNPs or DNA methylation sites of trans mQTL and telomere length. The genetic heritability of a number of complex traits and diseases was partitioned into components due to mQTL and the remainder of the genome. Significant enrichment was observed for height (p = 2.1x10 −10 ), ulcerative colitis (p = 2x10 −5 ), Crohn’s disease (p = 6x10 −8 ) and coronary artery disease (p = 5.5x10 −6 ) when compared to a random sample of SNPs with matched minor allele frequency, although this enrichment is explained by the genomic location of the mQTL SNPs.
0
Citation23
0
Save
0

Theoretical and empirical quantification of the accuracy of polygenic scores in ancestry divergent populations

Ying Wang et al.Jan 15, 2020
+3
P
J
Y
Abstract Polygenic scores (PGS) have been widely used to predict complex traits and risk of diseases using variants identified from genome-wide association studies (GWASs). To date, most GWASs have been conducted in populations of European ancestry, which limits the use of GWAS-derived PGS in non-European populations. Here, we develop a new theory to predict the relative accuracy (RA, relative to the accuracy in populations of the same ancestry as the discovery population) of PGS across ancestries. We used simulations and real data from the UK Biobank to evaluate our results. We found across various simulation scenarios that the RA of PGS based on trait-associated SNPs can be predicted accurately from modelling linkage disequilibrium (LD), minor allele frequencies (MAF), cross-population correlations of SNP effect sizes and heritability. Altogether, we find that LD and MAF differences between ancestries explain alone up to ~70% of the loss of RA using European-based PGS in African ancestry for traits like body mass index and height. Our results suggest that causal variants underlying common genetic variation identified in European ancestry GWASs are mostly shared across continents.
0
Citation22
0
Save
0

Improved polygenic prediction by Bayesian multiple regression on summary statistics

Luke Lloyd‐Jones et al.Jan 17, 2019
+12
N
J
L
ABSTRACT The capacity to accurately predict an individual’s phenotype from their DNA sequence is one of the great promises of genomics and precision medicine. Recently, Bayesian methods for generating polygenic predictors have been successfully applied in human genomics but require the individual level data, which are often limited in their access due to privacy or logistical concerns, and are computationally very intensive. This has motivated methodological frameworks that utilise publicly available genome-wide association studies (GWAS) summary data, which now for some traits include results from greater than a million individuals. In this study, we extend the established summary statistics methodological framework to include a class of point-normal mixture prior Bayesian regression models, which have been shown to generate optimal genetic predictions and can perform heritability estimation, variant mapping and estimate the distribution of the genetic effects. In a wide range of simulations and cross-validation using 10 real quantitative traits and 1.1 million variants on 350,000 individuals from the UK Biobank (UKB), we establish that our summary based method, SBayesR, performs similarly to methods that use the individual level data and outperforms other state-of-the-art summary statistics methods in terms of prediction accuracy and heritability estimation at a fraction of the computational resources. We generate polygenic predictors for body mass index and height in two independent data sets and show that by exploiting summary statistics on 1.1 million variants from the largest GWAS meta-analysis ( n ≈ 700, 000) that the SBayesR prediction R 2 improved on average across traits by 6.8% relative to that estimated from an individual-level data BayesR analysis of data from the UKB ( n ≈ 450, 000). Compared with commonly used state-of-the-art summary-based methods, SBayesR improved the prediction R 2 by 4.1% relative to LDpred and by 28.7% relative to clumping and p -value thresholding. SBayesR gave comparable prediction accuracy to the recent RSS method, which has a similar model, but at a computational time that is two orders of magnitude smaller. The methodology is implemented in a very efficient and user-friendly software tool titled GCTB.
0
Citation20
0
Save
41

Leveraging functional genomic annotations and genome coverage to improve polygenic prediction of complex traits within and between ancestries

Zhili Zheng et al.Oct 14, 2022
+12
P
J
Z
Abstract We develop a new method, SBayesRC, that integrates GWAS summary statistics with functional genomic annotations to improve polygenic prediction of complex traits. Our method is scalable to whole-genome variant analysis and refines signals from functional annotations by allowing them to affect both causal variant probability and causal effect distribution. We analyse 28 traits in the UK Biobank using ∼7 million common SNPs and 96 annotations. SBayesRC improves prediction accuracy by 14% in European ancestry and by up to 33% in trans-ancestry prediction, compared to the baseline method SBayesR which does not use annotations, and outperforms state-of-the-art methods LDpred-funct, PolyPred-S and PRS-CSx by 12-15%. Investigation of factors affecting prediction accuracy identified a significant interaction between SNP density and annotation information, encouraging future use of whole-genome sequence variants for prediction. Functional partitioning analysis highlights a major contribution of evolutionary constrained regions to prediction accuracy and the largest per-SNP contribution from non-synonymous SNPs.
41
Citation19
0
Save
0

New mutations, old statistical challenges

Jeffrey Barrett et al.Mar 12, 2017
+11
D
M
J
New mutations, old statistical challengesBased on targeted sequencing of 208 genes in 11,730 neurodevelopmental disorder cases, Stessman et al. report the identification of 91 genes associated (at a False Discovery Rate [FDR] of 0.1) with autism spectrum disorders (ASD), intellectual disability (ID), and developmental delay (DD)-including what they characterize as 38 novel genes, not previously reported as connected with these diseases 1 .If true, this would represent a substantial step forward.Unfortunately, each of the two discovery analyses (1.De novo mutation analysis and, 2. a comparison of private mutations with public control data) contain critical statistical flaws.When one accounts for these problems, fewer than half of the genes--and very few, if any, of the novel findings--survive.These errors have implications for how future analyses should be conducted, for understanding the genetic basis of these disorders, and for genomic medicine.We discuss the two main analyses in turn and provide more detailed treatment of the issues in a supplementary technical note.1. Two-stage analysis of de novo mutations.The authors selected 208 genes, consisting of 130 with one or more de novo truncating mutations in prior published studies, along with 78 others belonging to related pathways or having related Mendelian disease association.Of these genes, 19 have an already documented 'genome-wide significant' excess of de novo mutations from 5-6,000 neurodevelopmental disorder patients used as the "discovery sample" by the authors.Moreover, a more recently published exome dataset 2 has convincingly elevated the number of formally genome-wide significant genes to 93.
0
Citation10
0
Save
0

GWAS on family history of Alzheimer’s disease

Riccardo Marioni et al.Jan 15, 2018
+14
Q
A
R
Abstract Alzheimer’s disease (AD) is a public health priority for the 21 st century. Risk reduction currently revolves around lifestyle changes with much research trying to elucidate the biological underpinnings. Using self-report of parental history of Alzheimer’s dementia for case ascertainment in a genome-wide association study of over 300,000 participants from UK Biobank (32,222 maternal cases, 16,613 paternal cases) and meta-analysing with published consortium data (n=74,046 with 25,580 cases across the discovery and replication analyses), six new AD-associated loci (P<5x10 −8 ) are identified. Three contain genes relevant for AD and neurodegeneration: ADAM10, ADAMTS4, and ACE . Suggestive loci include drug targets such as VKORC1 (warfarin dose) and BZRAP1 (benzodiazepine receptor). We report evidence that association of SNPs and AD at the PVR gene is potentially mediated by both gene expression and DNA methylation in the prefrontal cortex. Our discovered loci may help to elucidate the biological mechanisms underlying AD and, given that many are existing drug targets for other diseases and disorders, warrant further exploration for potential precision medicine applications.
0
Citation9
0
Save
1

Large effect loci have a prominent role in Darwin’s finch evolution

Erik Enbody et al.Oct 30, 2022
+6
C
A
E
Abstract A fundamental goal in evolutionary biology is to understand the genetic architecture of adaptive traits and its evolutionary relevance. Using whole-genome data of 3,958 Darwin’s finches on the Galápagos Island of Daphne Major we identify six loci of large effect that explain 46% of the variation in beak size of Geospiza fortis , a key ecological trait. Allele frequency changes across 30 years at these loci affected beak morphology in two ways. An abrupt change in beak size occurred in Geospiza fortis as a result of natural selection associated with a drought, and a more gradual change occurred in G. scandens as a result of introgressive hybridization. This study demonstrates how large effect loci are a major contributor to the genetic architecture of rapid diversification during adaptive radiations. One Sentence Summary Allele frequency change at six loci of large effect causes evolutionary change in key ecological traits.
1
Citation6
0
Save
76

Improved analyses of GWAS summary statistics by reducing data heterogeneity and errors

Wenhan Chen et al.Jul 12, 2020
+4
Z
Y
W
Abstract Summary statistics from genome-wide association studies (GWAS) have facilitated the development of various summary data-based methods, which typically require a reference sample for linkage disequilibrium (LD) estimation. Analyses using these methods may be biased by errors in GWAS summary data and heterogeneity between GWAS and LD reference. Here we propose a quality control method, DENTIST, that leverages LD among genetic variants to detect and eliminate errors in GWAS or LD reference and heterogeneity between the two. Through simulations, we demonstrate that DENTIST substantially reduces false-positive rate (FPR) in detecting secondary signals in the summary-data-based conditional and joint (COJO) association analysis, especially for imputed rare variants (FPR reduced from >28% to <2% in the presence of heterogeneity between GWAS and LD reference). We further show that DENTIST can improve other summary-data-based analyses such as fine-mapping analysis, and integrative analysis of GWAS and expression quantitative trait locus data.
76
Citation6
0
Save
0

The Parkinson’s Disease Mendelian Randomization Research Portal

Alastair Noyce et al.Apr 10, 2019
+19
K
J
A
ABSTRACT Background Mendelian randomization (MR) is a method for exploring observational associations to find evidence of causality. Objective To apply MR between multiple risk factors/phenotypic traits (exposures) and Parkinson’s disease (PD) in a large, unbiased manner, and to create a public resource for research. Methods We used two-sample MR in which the summary statistics relating to SNPs from genome wide association studies (GWASes) of 5,839 exposures curated on MR Base were used to assess causal relationships with PD. We selected the highest quality exposure GWASes for this report (n=401). For the disease outcome, summary statistics from the largest published PD GWAS were used. For each exposure, the causal effect on PD was assessed using the inverse variance weighted (IVW) method, followed by a range of sensitivity analyses. We used a false discovery rate (FDR) corrected p-value of <0.05 from the IVW analysis to prioritize traits of interest. Results We observed evidence for causal associations between twelve exposures and risk of PD. Of these, nine were causal effects related to increasing adiposity and decreasing risk of PD. The remaining top exposures that affected PD risk were tea drinking, time spent watching television and forced vital capacity, but the latter two appeared to be biased by violations of underlying MR assumptions. Discussion We present a new platform which offers MR analyses for a total of 5,839 GWASes versus the largest PD GWASes available ( https://pdgenetics.shinyapps.io/pdgenetics/ ). Alongside, we report further evidence to support a causal role for adiposity on lowering the risk of PD.
0
Citation4
0
Save
Load More