BW
Brooke Wolford
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(55% Open Access)
Cited by:
1,684
h-index:
28
/
i10-index:
44
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Efficiently controlling for case-control imbalance and sample relatedness in large-scale genetic association studies

Wei Zhou et al.Aug 8, 2018
In genome-wide association studies (GWAS) for thousands of phenotypes in large biobanks, most binary traits have substantially fewer cases than controls. Both of the widely used approaches, the linear mixed model and the recently proposed logistic mixed model, perform poorly; they produce large type I error rates when used to analyze unbalanced case-control phenotypes. Here we propose a scalable and accurate generalized mixed model association test that uses the saddlepoint approximation to calibrate the distribution of score test statistics. This method, SAIGE (Scalable and Accurate Implementation of GEneralized mixed model), provides accurate P values even when case-control ratios are extremely unbalanced. SAIGE uses state-of-art optimization strategies to reduce computational costs; hence, it is applicable to GWAS for thousands of phenotypes by large biobanks. Through the analysis of UK Biobank data of 408,961 samples from white British participants with European ancestry for > 1,400 binary phenotypes, we show that SAIGE can efficiently analyze large sample data, controlling for unbalanced case-control ratios and sample relatedness. SAIGE (Scalable and Accurate Implementation of GEneralized mixed model) is a generalized mixed model association test that can efficiently analyze large data sets while controlling for unbalanced case-control ratios and sample relatedness, as shown by applying SAIGE to the UK Biobank data for > 1,400 binary phenotypes.
1
Citation1,026
0
Save
0

Biobank-driven genomic discovery yields new insight into atrial fibrillation biology

Jonas Nielsen et al.Jul 26, 2018
To identify genetic variation underlying atrial fibrillation, the most common cardiac arrhythmia, we performed a genome-wide association study of >1,000,000 people, including 60,620 atrial fibrillation cases and 970,216 controls. We identified 142 independent risk variants at 111 loci and prioritized 151 functional candidate genes likely to be involved in atrial fibrillation. Many of the identified risk variants fall near genes where more deleterious mutations have been reported to cause serious heart defects in humans (GATA4, MYH6, NKX2-5, PITX2, TBX5)1, or near genes important for striated muscle function and integrity (for example, CFL2, MYH7, PKP2, RBM20, SGCG, SSPN). Pathway and functional enrichment analyses also suggested that many of the putative atrial fibrillation genes act via cardiac structural remodeling, potentially in the form of an ‘atrial cardiomyopathy’2, either during fetal heart development or as a response to stress in the adult heart. Large-scale association analyses identify 142 independent risk variants for atrial fibrillation. Pathway and functional enrichment analyses suggest that many of the putative risk genes act via cardiac structural remodeling.
0
Citation639
0
Save
1

Genome-wide association study of cardiac troponin I in the general population

Marta Moksnes et al.May 7, 2021
Circulating cardiac troponin proteins are associated with structural heart disease and predict incident cardiovascular disease in the general population. However, the genetic contribution to cardiac troponin I (cTnI) concentrations and its causal effect on cardiovascular phenotypes are unclear. We combine data from two large population-based studies, the Trøndelag Health Study and the Generation Scotland Scottish Family Health Study, and perform a genome-wide association study of high-sensitivity cTnI concentrations with 48 115 individuals. We further use two-sample Mendelian randomization to investigate the causal effects of circulating cTnI on acute myocardial infarction (AMI) and heart failure (HF). We identified 12 genetic loci (8 novel) associated with cTnI concentrations. Associated protein-altering variants highlighted putative functional genes: CAND2, HABP2, ANO5, APOH, FHOD3, TNFAIP2, KLKB1 and LMAN1. Phenome-wide association tests in 1688 phecodes and 83 continuous traits in UK Biobank showed associations between a genetic risk score for cTnI and cardiac arrhythmias, metabolic and anthropometric measures. Using two-sample Mendelian randomization, we confirmed the non-causal role of cTnI in AMI (5948 cases, 355 246 controls). We found indications for a causal role of cTnI in HF (47 309 cases and 930 014 controls), but this was not supported by secondary analyses using left ventricular mass as outcome (18 257 individuals). Our findings clarify the biology underlying the heritable contribution to circulating cTnI and support cTnI as a non-causal biomarker for AMI in the general population. Using genetically informed methods for causal inference helps inform the role and value of measuring cTnI in the general population.
1
Citation12
0
Save
0

A unified framework for estimating country-specific cumulative incidence for 18 diseases stratified by polygenic risk

Bradley Jermy et al.Jun 12, 2024
Polygenic scores (PGSs) offer the ability to predict genetic risk for complex diseases across the life course; a key benefit over short-term prediction models. To produce risk estimates relevant to clinical and public health decision-making, it is important to account for varying effects due to age and sex. Here, we develop a novel framework to estimate country-, age-, and sex-specific estimates of cumulative incidence stratified by PGS for 18 high-burden diseases. We integrate PGS associations from seven studies in four countries (N = 1,197,129) with disease incidences from the Global Burden of Disease. PGS has a significant sex-specific effect for asthma, hip osteoarthritis, gout, coronary heart disease and type 2 diabetes (T2D), with all but T2D exhibiting a larger effect in men. PGS has a larger effect in younger individuals for 13 diseases, with effects decreasing linearly with age. We show for breast cancer that, relative to individuals in the bottom 20% of polygenic risk, the top 5% attain an absolute risk for screening eligibility 16.3 years earlier. Our framework increases the generalizability of results from biobank studies and the accuracy of absolute risk estimates by appropriately accounting for age- and sex-specific PGS effects. Our results highlight the potential of PGS as a screening tool which may assist in the early prevention of common diseases.
0
Citation4
0
Save
0

Evaluation of polygenic scoring methods in five biobanks shows larger variation between biobanks than methods and finds benefits of ensemble learning

Remo Monti et al.Jun 21, 2024
Methods of estimating polygenic scores (PGSs) from genome-wide association studies are increasingly utilized. However, independent method evaluation is lacking, and method comparisons are often limited. Here, we evaluate polygenic scores derived via seven methods in five biobank studies (totaling about 1.2 million participants) across 16 diseases and quantitative traits, building on a reference-standardized framework. We conducted meta-analyses to quantify the effects of method choice, hyperparameter tuning, method ensembling, and the target biobank on PGS performance. We found that no single method consistently outperformed all others. PGS effect sizes were more variable between biobanks than between methods within biobanks when methods were well tuned. Differences between methods were largest for the two investigated autoimmune diseases, seropositive rheumatoid arthritis and type 1 diabetes. For most methods, cross-validation was more reliable for tuning hyperparameters than automatic tuning (without the use of target data). For a given target phenotype, elastic net models combining PGS across methods (ensemble PGS) tuned in the UK Biobank provided consistent, high, and cross-biobank transferable performance, increasing PGS effect sizes (β coefficients) by a median of 5.0% relative to LDpred2 and MegaPRS (the two best-performing single methods when tuned with cross-validation). Our interactively browsable online-results and open-source workflow prspipe provide a rich resource and reference for the analysis of polygenic scoring methods across biobanks.
0
Citation2
0
Save
0

Clinical implications of identifying pathogenic variants in aortic dissection patients with whole exome sequencing

Brooke Wolford et al.Dec 17, 2018
ABSTRACT Background Thoracic aortic dissection is an emergent life-threatening condition. Routine screening for genetic variants causing thoracic aortic dissection is not currently performed for patients or their family members. Methods We performed whole exome sequencing of 240 patients with thoracic aortic dissection (n=235) or rupture (n=5) and 258 controls matched for age, sex, and ancestry. Blinded to case-control status, we annotated variants in 11 genes for pathogenicity. Results Twenty-four pathogenic variants in 6 genes ( COL3A1, FBN1, LOX, PRKG1, SMAD3, TGFBR2 ) were identified in 26 individuals, representing 10.8% of aortic cases and 0% of controls. Among dissection cases, we compared those with pathogenic variants to those without and found that pathogenic variant carriers had significantly earlier onset of dissection (41 vs. 57 years), higher rates of root aneurysm (54% vs. 30%), less hypertension (15% vs. 57%), lower rates of smoking (19% vs. 45%), and greater incidence of aortic disease in family members. Multivariable logistic regression showed significant risk factors associated with pathogenic variants are age <50 [odds ratio (OR) = 5.5; 95% CI: 1.6-19.7], no history of hypertension (OR=5.6; 95% CI: 1.4-22.3) and family history of aortic disease (mother: OR=5.7; 95% CI: 1.4-22.3, siblings: OR=5.1; 95% CI 1.1-23.9, children: OR=6.0; 95% CI: 1.4-26.7). Conclusions Clinical genetic testing of known hereditary thoracic aortic dissection genes should be considered in patients with aortic dissection, followed by cascade screening of family members, especially in patients with age-of-onset of aortic dissection <50 years old, family history of aortic disease, and no history of hypertension.
0
Citation1
0
Save
0

Loss-of-function genomic variants with impact on liver-related blood traits highlight potential therapeutic targets for cardiovascular disease

Jonas Nielsen et al.Apr 2, 2019
Cardiovascular diseases (CVD), and in particular cerebrovascular and ischemic heart diseases, are leading causes of death globally. Lowering circulating lipids is an important treatment strategy to reduce risk. However, some pharmaceutical mechanisms of reducing CVD may increase risk of fatty liver disease or other metabolic disorders. To identify potential novel therapeutic targets, which may reduce risk of CVD without increasing risk of metabolic disease, we focused on the simultaneous evaluation of quantitative traits related to liver function and CVD. Using a combination of low-coverage (5x) whole-genome sequencing and targeted genotyping, deep genotype imputation based on the TOPMed reference pane, and genome-wide association study (GWAS) meta-analysis, we analyzed 12 liver-related blood traits (including liver enzymes, blood lipids, and markers of iron metabolism) in up to 203,476 people from three population-based cohorts of different ancestries. We identified 88 likely causal protein-altering variants that were associated with one or more liver-related blood traits. We identified several loss-of-function (LoF) variants reducing low-density lipoprotein cholesterol (LDL-C) or risk of CVD without increased risk of liver disease or diabetes, including variants in known lipid genes (e.g. APOB, LPL). A novel LoF variant, ZNF529:p.K405X, was associated with decreased levels of LDL-C (P=1.3x10-8) but demonstrated no association with liver enzymes or non-fasting blood glucose levels. Silencing of ZNF529 in human hepatocytes resulted in upregulation of LDL receptor (LDLR) and increased LDL-C uptake in the cells, suggesting that inhibition of ZNF529 or its gene product could be used for treating hypercholesterolemia and hence reduce the risk of CVD. Taken together, we demonstrate that simultaneous consideration of multiple phenotypes and a focus on rare protein-altering variants may identify promising therapeutic targets.
0

Interactions between genetic variation and cellular environment in skeletal muscle gene expression

D. Taylor et al.Feb 3, 2017
From whole organisms to individual cells, responses to environmental conditions are influenced by genetic makeup, where the effect of genetic variation on a trait depends on the environmental context. RNA-sequencing quantifies gene expression as a molecular trait, and is capable of capturing both genetic and environmental effects. In this study, we explore opportunities of using allele-specific expression (ASE) to discover cis acting genotype-environment interactions (GxE) - genetic effects on gene expression that depend on an environmental condition. Treating 17 common, clinical traits as approximations of the cellular environment of 267 skeletal muscle biopsies, we identify 10 candidate interaction quantitative trait loci (iQTLs) across 6 traits (12 unique gene-environment trait pairs; 10% FDR per trait) including sex, systolic blood pressure, and low-density lipoprotein cholesterol. Although using ASE is in principle a promising approach to detect GxE effects, replication of such signals can be challenging as validation requires harmonization of environmental traits across cohorts and a sufficient sampling of heterozygotes for a transcribed SNP. Comprehensive discovery and replication will require large human transcriptome datasets, or the integration of multiple transcribed SNPs, coupled with standardized clinical phenotyping.
0

Efficiently controlling for case-control imbalance and sample relatedness in large-scale genetic association studies

Wei Zhou et al.Nov 1, 2017
In genome-wide association studies (GWAS) for thousands of phenotypes in large biobanks, most binary traits have substantially fewer cases than controls. Both of the widely used approaches, linear mixed model and the recently proposed logistic mixed model, perform poorly -- producing large type I error rates -- in the analysis of phenotypes with unbalanced case-control ratios. Here we propose a scalable and accurate generalized mixed model association test that uses the saddlepoint approximation (SPA) to calibrate the distribution of score test statistics. This method, SAIGE, provides accurate p-values even when case-control ratios are extremely unbalanced. It utilizes state-of-art optimization strategies to reduce computational time and memory cost of generalized mixed model. The computation cost linearly depends on sample size, and hence can be applicable to GWAS for thousands of phenotypes by large biobanks. Through the analysis of UK-Biobank data of 408,961 white British European-ancestry samples, we show that SAIGE can efficiently analyze large sample data, controlling for unbalanced case-control ratios and sample relatedness.
Load More