GW
Gao Wang
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(42% Open Access)
Cited by:
100
h-index:
44
/
i10-index:
128
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
7

An atlas of alternative polyadenylation quantitative trait loci contributing to complex trait and disease heritability

Lei Li et al.May 13, 2021
Genome-wide association studies have identified thousands of noncoding variants associated with human traits and diseases. However, the functional interpretation of these variants is a major challenge. Here, we constructed a multi-tissue atlas of human 3'UTR alternative polyadenylation (APA) quantitative trait loci (3'aQTLs), containing approximately 0.4 million common genetic variants associated with the APA of target genes, identified in 46 tissues isolated from 467 individuals (Genotype-Tissue Expression Project). Mechanistically, 3'aQTLs can alter poly(A) motifs, RNA secondary structure and RNA-binding protein-binding sites, leading to thousands of APA changes. Our CRISPR-based experiments indicate that such 3'aQTLs can alter APA regulation. Furthermore, we demonstrate that mapping 3'aQTLs can identify APA regulators, such as La-related protein 4. Finally, 3'aQTLs are colocalized with approximately 16.1% of trait-associated variants and are largely distinct from other QTLs, such as expression QTLs. Together, our findings show that 3'aQTLs contribute substantially to the molecular mechanisms underlying human complex traits and diseases.
7
Citation100
0
Save
0

Fine-mapping and QTL tissue-sharing information improve causal gene identification and transcriptome prediction performance

Alvaro Barbeira et al.Mar 20, 2020
The integration of transcriptomic studies and GWAS (genome-wide association studies) via imputed expression has seen extensive application in recent years, enabling the functional characterization and causal gene prioritization of GWAS loci. However, the techniques for imputing transcriptomic traits from DNA variation remain underdeveloped. Furthermore, associations found when linking eQTL studies to complex traits through methods like PrediXcan can lead to false positives due to linkage disequilibrium between distinct causal variants. Therefore, the best prediction performance models may not necessarily lead to more reliable causal gene discovery. With the goal of improving discoveries without increasing false positives, we develop and compare multiple transcriptomic imputation approaches using the most recent GTEx release of expression and splicing data on 17,382 RNA-sequencing samples from 948 post-mortem donors in 54 tissues. We find that informing prediction models with posterior causal probability from fine-mapping (dap-g) and borrowing information across tissues (mashr) lead to better performance in terms of number and proportion of significant associations that are colocalized and the proportion of silver standard genes as indicated by precision-recall and ROC (Receiver Operating Characteristic) curves. All prediction models are made publicly available at predictdb.org.
18

xQTLbiolinks: a comprehensive and scalable tool for integrative analysis of molecular QTLs

Ruofan Ding et al.Apr 29, 2023
ABSTRACT Genome-wide association studies (GWAS) have identified thousands of disease-associated non-coding variants, posing urgent needs for functional interpretation. Molecular quantitative trait loci (xQTLs) such as eQTLs serve as an essential intermediate link between these non-coding variants and disease phenotypes and have been widely used to discover disease-risk genes from many population-scale studies. However, mining and analyzing the xQTLs data presents several significant bioinformatics challenges, particularly when it comes to integration with GWAS data. Here, we developed xQTLbiolinks as the first comprehensive and scalable tool for xQTLs data retrieval, quality controls, and pre-processing from 75 human tissues and cell types. In addition, xQTLbiolinks provided a robust colocalization module through integration with GWAS data. The result generated by xQTLbiolinks can be flexibly visualized or stored in standard R objects that can easily be integrated with other R packages and custom pipelines. We applied xQTLbiolinks to cancer GWAS summary statistics as case studies and demonstrated its robust utility and reproducibility. xQTLbiolinks will profoundly accelerate the interpretation of disease-associated variants, thus promoting a better understanding of disease etiologies. xQTLbiolinks is available at https://github.com/lilab-bioinfo/xQTLbiolinks .
0

A Bayesian method for rare variant analysis using functional annotations and its application to Autism

Shengtong Han et al.Nov 1, 2019
Rare genetic variants make significant contributions to human diseases. Compared to common variants, rare variants have larger effect sizes and are generally free of linkage disequilibrium (LD), which makes it easier to identify causal variants. Numerous methods have been developed to analyze rare variants in a gene or region in association studies, with the goal of finding risk genes by aggregating information of all variants of a gene. These methods, however, often make unrealistic assumptions, e.g. all rare variants in a risk gene would have non-zero effects. In practice, current methods for gene-based analysis often fail to show any advantage over simple single-variant analysis. In this work, we develop a Bayesian method: MIxture model based Rare variant Analysis on GEnes (MIRAGE). MIRAGE captures the heterogeneity of variant effects by treating all variants of a gene as a mixture of risk and non-risk variants, and models the prior probabilities of being risk variants as function of external information of variants, such as allele frequencies and predicted deleterious effects. MIRAGE uses an empirical Bayes approach to estimate these prior probabilities by combining information across genes. We demonstrate in both simulations and analysis of an exome-sequencing dataset of Autism, that MIRAGE significantly outperforms current methods for rare variant analysis. In particular, the top genes identified by MIRAGE are highly enriched with known or plausible Autism risk genes. Our results highlight several novel Autism genes with high Bayesian posterior probabilities and functional connections with Autism. MIRAGE is available at https://xinhe-lab.github.io/mirage .
Load More