GW
Gao Wang
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
19
(58% Open Access)
Cited by:
4,201
h-index:
31
/
i10-index:
50
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The GTEx Consortium atlas of genetic regulatory effects across human tissues

François Aguet et al.Sep 10, 2020
+96
K
S
F
The Genotype-Tissue Expression (GTEx) project dissects how genetic variation affects gene expression and splicing.
0
Citation3,069
0
Save
0

A Simple New Approach to Variable Selection in Regression, with Application to Genetic Fine Mapping

Gao Wang et al.Jul 10, 2020
M
P
A
G
Summary We introduce a simple new approach to variable selection in linear regression, with a particular focus on quantifying uncertainty in which variables should be selected. The approach is based on a new model—the ‘sum of single effects’ model, called ‘SuSiE’—which comes from writing the sparse vector of regression coefficients as a sum of ‘single-effect’ vectors, each with one non-zero element. We also introduce a corresponding new fitting procedure—iterative Bayesian stepwise selection (IBSS)—which is a Bayesian analogue of stepwise selection methods. IBSS shares the computational simplicity and speed of traditional stepwise methods but, instead of selecting a single variable at each step, IBSS computes a distribution on variables that captures uncertainty in which variable to select. We provide a formal justification of this intuitive algorithm by showing that it optimizes a variational approximation to the posterior distribution under SuSiE. Further, this approximate posterior distribution naturally yields convenient novel summaries of uncertainty in variable selection, providing a credible set of variables for each selection. Our methods are particularly well suited to settings where variables are highly correlated and detectable effects are sparse, both of which are characteristics of genetic fine mapping applications. We demonstrate through numerical experiments that our methods outperform existing methods for this task, and we illustrate their application to fine mapping genetic variants influencing alternative splicing in human cell lines. We also discuss the potential and challenges for applying these methods to generic variable-selection problems.
0
Citation599
0
Save
1

Cell type–specific genetic regulation of gene expression across human tissues

Andrew Nobel et al.Sep 10, 2020
+79
Y
Y
A
Cell type composition, estimated from bulk tissue, maps the cellular specificity of genetic variants.
1
Citation462
0
Save
0

A simple new approach to variable selection in regression, with application to genetic fine-mapping

Gao Wang et al.Dec 19, 2018
M
P
A
G
We introduce a simple new approach to variable selection in linear regression, with a particular focus on quantifying uncertainty in which variables should be selected . The approach is based on a new model — the “Sum of Single Effects” ( SuSiE ) model — which comes from writing the sparse vector of regression coefficients as a sum of “single-effect” vectors, each with one non-zero element. We also introduce a corresponding new fitting procedure — Iterative Bayesian Stepwise Selection (IBSS) — which is a Bayesian analogue of stepwise selection methods. IBSS shares the computational simplicity and speed of traditional stepwise methods, but instead of selecting a single variable at each step, IBSS computes a distribution on variables that captures uncertainty in which variable to select. We provide a formal justification of this intuitive algorithm by showing that it optimizes a variational approximation to the posterior distribution under the SuSiE model. Further, this approximate posterior distribution naturally yields convenient novel summaries of uncertainty in variable selection, providing a Credible Set of variables for each selection. Our methods are particularly well-suited to settings where variables are highly correlated and detectable effects are sparse, both of which are characteristics of genetic fine-mapping applications. We demonstrate through numerical experiments that our methods outper-form existing methods for this task, and illustrate their application to fine-mapping genetic variants influencing alternative splicing in human cell-lines. We also discuss the potential and challenges for applying these methods to generic variable selection problems.
0
Citation53
0
Save
28

Fine-mapping from summary data with the “Sum of Single Effects” model

Yuxin Zou et al.Nov 4, 2021
M
G
P
Y
Abstract In recent work, Wang et al introduced the “Sum of Single Effects” ( SuSiE ) model, and showed that it provides a simple and efficient approach to fine-mapping genetic variants from individual-level data. Here we present new methods for fitting the SuSiE model to summary data, for example to single-SNP z -scores from an association study and linkage disequilibrium (LD) values estimated from a suitable reference panel. To develop these new methods, we first describe a simple, generic strategy for extending any individual-level data method to deal with summary data. The key idea is to replace the usual regression likelihood with an analogous likelihood based on summary data. We show that existing fine-mapping methods such as FINEMAP and CAVIAR also (implicitly) use this strategy, but in different ways, and so this provides a common framework for understanding different methods for fine-mapping. We investigate other common practical issues in fine-mapping with summary data, including problems caused by inconsistencies between the z -scores and LD estimates, and we develop diagnostics to identify these inconsistencies. We also present a new refinement procedure that improves model fits in some data sets, and hence improves overall reliability of the SuSiE fine-mapping results. Detailed evaluations of fine-mapping methods in a range of simulated data sets show that SuSiE applied to summary data is competitive, in both speed and accuracy, with the best available fine-mapping methods for summary data. Author summary The goal of fine-mapping is to identify the genetic variants that causally affect some trait of interest. Fine-mapping is challenging because the genetic variants can be highly correlated, due to a phenomenon called linkage disequilibrium (LD). The most successful current approaches to fine-mapping frame the problem as a variable selection problem , and here we focus on one such approach based on the “Sum of Single Effects” ( SuSiE ) model. The main contribution of this paper is to extend SuSiE to work with summary data, which is often accessible when the full genotype and phenotype data are not. In the process of extending SuSiE , we also developed a new mathematical framework that helps to explain existing fine-mapping methods for summary data, why they work well (or not), and under what circumstances. In simulations, we show that SuSiE applied to summary data is competitive with the best available fine-mapping methods for summary data. We also show how different factors such as accuracy of the LD estimates can affect the quality of the fine-mapping.
28
Citation18
0
Save
4

Fast and flexible joint fine-mapping of multiple traits via the Sum of Single Effects model

Yuxin Zou et al.Apr 14, 2023
+2
D
P
Y
We introduce mvSuSiE, a multi-trait fine-mapping method for identifying putative causal variants from genetic association data (individual-level or summary data). mvSuSiE learns patterns of shared genetic effects from data, and exploits these patterns to improve power to identify causal SNPs. Comparisons on simulated data show that mvSuSiE is competitive in speed, power and precision with existing multi-trait methods, and uniformly improves on single-trait fine-mapping (SuSiE) in each trait separately. We applied mvSuSiE to jointly fine-map 16 blood cell traits using data from the UK Biobank. By jointly analyzing the traits and modeling heterogeneous effect sharing patterns, we discovered a much larger number of causal SNPs (>3,000) compared with single-trait fine-mapping, and with narrower credible sets. mvSuSiE also more comprehensively characterized the ways in which the genetic variants affect one or more blood cell traits; 68% of causal SNPs showed significant effects in more than one blood cell type.
24

Cell-subtype specific effects of genetic variation in the aging and Alzheimer cortex

Masashi Fujita et al.Nov 8, 2022
+24
C
Z
M
Abstract The relationship between genetic variation and gene expression in individual brain cell types and subtypes has remained elusive. Here, we generated single-nucleus RNA sequencing data from the dorsolateral prefrontal cortex of 424 individuals of advanced age; analyzing 1.5 million nuclear transcriptomes, we assessed the effect of genetic variants on RNA expression in cis ( cis -eQTL) for 7 cell types and 81 cell subtypes. This effort identified 10,004 eGenes at the cell type level and 8,138 eGenes at the cell subtype level. Many eGenes are only detected within cell subtypes. A new variant influences APOE expression only in microglia and is associated with greater cerebral amyloid angiopathy but not Alzheimer pathology, accounting for the effect of APOEε4 , providing mechanistic insights into both pathologies. While eQTLs are readily detected, only a TMEM106B variant robustly affects the proportion of cell subtypes. Integration of these results with GWAS highlighted the targeted cell type and likely causal gene within susceptibility loci for Alzheimer’s, Parkinson’s, schizophrenia, and educational attainment.
0

Widespread dose-dependent effects of RNA expression and splicing on complex diseases and traits

Alvaro Barbeira et al.Oct 22, 2019
+25
M
D
A
The resources generated by the GTEx consortium offer unprecedented opportunities to advance our understanding of the biology of human traits and diseases. Here, we present an in-depth examination of the phenotypic consequences of transcriptome regulation and a blueprint for the functional interpretation of genetic loci discovered by Genome-Wide Association Studies (GWAS). Across a broad set of complex traits and diseases, we find widespread dose-dependent effects of RNA expression and splicing, with higher impact on molecular phenotypes translating into higher impact downstream. Using colocalization and association approaches that take into account the observed allelic heterogeneity, we propose potential target genes for 47% (2,519 out of 5,385) of the GWAS loci examined. Our results demonstrate the translational relevance of the GTEx resources and highlight the need to increase their resolution and breadth to further our understanding of the genotype-phenotype link.
0

Cell type specific genetic regulation of gene expression across human tissues

Sarah Kim-Hellmuth et al.Oct 16, 2019
+30
M
F
S
The Genotype-Tissue Expression (GTEx) project has identified expression and splicing quantitative trait loci ( cis -QTLs) for the majority of genes across a wide range of human tissues. However, the interpretation of these QTLs has been limited by the heterogeneous cellular composition of GTEx tissue samples. Here, we map interactions between computational estimates of cell type abundance and genotype to identify cell type interaction QTLs for seven cell types and show that cell type interaction eQTLs provide finer resolution to tissue specificity than bulk tissue cis -eQTLs. Analyses of genetic associations to 87 complex traits show a contribution from cell type interaction QTLs and enables the discovery of hundreds of previously unidentified colocalized loci that are masked in bulk tissue.One Sentence Summary Estimated cell type abundances from bulk RNA-seq across tissues reveal the cellular specificity of quantitative trait loci.
0

Allele-specific open chromatin in human iPSC neurons elucidates functional non-coding disease variants

Siwei Zhang et al.Nov 1, 2019
+15
J
M
S
Functional interpretation of noncoding disease variants, which likely regulate gene expression, has been challenging. Chromatin accessibility strongly influences gene expression during neurodevelopment; however, to what extent genetic variants can alter chromatin accessibility in the context of brain disorders/traits is unknown. Using human induced pluripotent stem cell (iPSC)-derived neurons as a neurodevelopmental model, we identified abundant open-chromatin regions absent in adult brain samples and thousands of genetic variants exhibiting allele-specific open-chromatin (ASoC). ASoC variants are overrepresented in brain enhancers, transcription-factor-binding sites, and quantitative-trait-loci associated with gene expression, histone modification, and DNA methylation. Notably, compared to open chromatin regions and other commonly used functional annotations, neuronal ASoC variants showed much stronger enrichments of risk variants for various brain disorders/traits. Our study provides the first snapshot of the neuronal ASoC landscape and a powerful framework for prioritizing functional disease variants.
Load More