GQ
Guanghao Qi
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(62% Open Access)
Cited by:
17
h-index:
10
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A Comprehensive Evaluation of Methods for Mendelian Randomization Using Realistic Simulations and an Analysis of 38 Biomarkers for Risk of Type-2 Diabetes

Guanghao Qi et al.Jul 15, 2019
N
G
Abstract Background Mendelian randomization (MR) has provided major opportunities for understanding the causal relationship among complex traits. Previous studies have often evaluated MR methods based on simulations that do not adequately reflect the data-generating mechanism in GWAS and there are often discrepancies in performance of MR methods in simulations and real datasets. Methods We use a simulation framework that generates data on full GWAS for two traits under realistic model for effect-size distribution coherent with heritability, co-heritability and polygenicity typically observed for complex traits. We further use recent data generated from GWAS of 38 biomarkers in the UK Biobank to investigate their causal effects on risk of type-2 diabetes using externally available GWAS summary-statistics. Results Simulation studies show that weighted mode and MRMix are the only two methods which maintain correct type-I error rate in a diverse set of scenarios. Between the two methods, MRMix tends to be more powerful for larger GWAS while the opposite being true for smaller sample sizes. Among the other methods, random-effect IVW, MR-Robust and MR-RAPS tend to perform best in maintaining low mean squared error when the InSIDE assumption is satisfied, but can produce large bias when InSIDE is violated. In real data analysis, some biomarkers showed major heterogeneity in estimates of their causal effects on risk of type-2 diabetes across the different methods, with patterns similar to those observed in simulation studies. Conclusions Relative performance of different MR methods depends heavily on sample sizes of underlying GWAS, proportion of valid instruments and validity of the InSIDE assumption. Key Messages Many previous simulations studies to evaluate Mendelian randomization methods do not adequately reflect the data-generating mechanism of genome-wide association studies (GWAS). We use a simulation framework that generates data on full GWASs under realistic model informed by recent studies on effect-size distribution. We also used very recent GWAS data available on a large number of biomarkers to evaluate their causal effect on type-2 diabetes using alternative methods. Among the 10 methods that were compared, relative performance of different methods depends heavily on sample sizes of underlying GWAS, proportion of valid instruments and validity of the InSIDE assumption. Weighted mode and MRMix are the only two methods that maintain correct type I error rate in a diverse set of scenarios.
0
Citation7
0
Save
58

Single-Cell Sequencing Reveals Lineage-Specific Dynamic Genetic Regulation of Gene Expression During Human Cardiomyocyte Differentiation

Reem Elorbany et al.Jun 3, 2021
+5
K
J
R
Abstract Dynamic and temporally specific gene regulatory changes may underlie unexplained genetic associations with complex disease. During a dynamic process such as cellular differentiation, the overall cell type composition of a tissue (or an in vitro culture) and the gene regulatory profile of each cell can both experience significant changes over time. To identify these dynamic effects in high resolution, we collected single-cell RNA-sequencing data over a differentiation time course from induced pluripotent stem cells to cardiomyocytes, sampled at 7 unique time points in 19 human cell lines. We employed a flexible approach to map dynamic eQTLs whose effects vary significantly over the course of bifurcating differentiation trajectories, including many whose effects are specific to one of these two lineages. Our study design allowed us to distinguish true dynamic eQTLs affecting a specific cell lineage from expression changes driven by potentially non-genetic differences between cell lines such as cell composition. Additionally, we used the cell type profiles learned from single-cell data to deconvolve and re-analyze data from matched bulk RNA-seq samples. Using this approach, we were able to identify a large number of novel dynamic eQTLs in single cell data while also attributing dynamic effects in bulk to a particular lineage. Overall, we found that using single cell data to uncover dynamic eQTLs can provide new insight into the gene regulatory changes that occur among heterogeneous cell types during cardiomyocyte differentiation.
58
Citation3
0
Save
1

Single-cell allele-specific expression analysis reveals dynamic and cell-type-specific regulatory effects

Guanghao Qi et al.Oct 6, 2022
+2
J
B
G
Abstract Allele-specific expression, which measures the expression of two alleles of a gene in a diploid individual, is a powerful signal to study cis-regulatory effects. Comparing ASE across conditions, or differential ASE, can reveal context-specific gene regulation. Recently, single-cell RNA sequencing (scRNA-seq) has allowed the measurement of ASE at the resolution of individual cells, but there is a lack of statistical methods to analyze such data. We develop DAESC, a statistical method for differential ASE analysis across any condition of interest using scRNA-seq data from multiple individuals. DAESC includes a baseline model based on beta-binomial regression with random effects accounting for multiple cells from the same individual (DAESC-BB), and an extended mixture model that incorporates implicit haplotype phasing (DAESC-Mix). We demonstrate through simulations that DAESC accurately captures differential ASE effects in a wide range of scenarios. Application to scRNA-seq data from 105 induced pluripotent stem cell lines identifies 657 genes that are dynamically regulated during endoderm differentiation. A second application identifies several genes that are differentially regulated in pancreatic endocrine cells between type 2 diabetes patients and controls. In conclusion, DAESC is a powerful method for single-cell differential ASE analysis and can facilitate the discovery of context-specific regulatory effects.
1
Citation2
0
Save
1

Genome-Wide Large-Scale Multi-Trait Analysis Characterizes Global Patterns of Pleiotropy and Unique Trait-Specific Variants

Guanghao Qi et al.Jun 3, 2022
+4
D
S
G
Abstract Genome-wide association studies (GWAS) have found widespread evidence of pleiotropy, but characterization of global patterns of pleiotropy remain highly incomplete due to insufficient power of current approaches. We develop fastASSET, an extension of the method ASSET, to allow computationally efficient detection of variant-level pleiotropic association across a large number of traits. We analyze GWAS summary statistics of 116 complex traits of diverse types collected from the NIH GRASP repository and a number of other large GWAS consortia. We identify a total of 2,293 independent loci at the genome-wide significance level and found that the lead variants in nearly all of these loci (∼99%) to be associated with to two or more (median = 6) traits. Further, the estimated degree of pleiotropy for the detected variants strongly predicted their degree of pleiotropy across a much larger number of traits (K=4,114) in the UK Biobank Study. Follow-up analyses of 21 unique trait-specific variants suggest that they are often linked to the expression in trait-related tissues for a small number of genes, some of which are well known to be involved in relevant biological processes. Our findings provide deeper insight into the nature of complex trait pleiotropy and leads to, for the first time, identification of highly unique trait-specific susceptibility variants.
1
Citation2
0
Save
38

Uncovering context-specific genetic-regulation of gene expression from single-cell RNA-sequencing using latent-factor models

Benjamin Strober et al.Dec 23, 2022
+5
J
K
B
Abstract Genetic regulation of gene expression is a complex process, with genetic effects known to vary across cellular contexts such as cell types and environmental conditions. We developed SURGE, a method for unsupervised discovery of context-specific expression quantitative trait loci (eQTLs) from single-cell transcriptomic data. This allows discovery of the contexts or cell types modulating genetic regulation without prior knowledge. Applied to peripheral blood single-cell eQTL data, SURGE contexts capture continuous representations of distinct cell types and groupings of biologically related cell types. We demonstrate the disease-relevance of SURGE context-specific eQTLs using colocalization analysis and stratified LD-score regression.
38
Citation1
0
Save
0

Genome-wide large-scale multi-trait analysis characterizes global patterns of pleiotropy and unique trait-specific variants

Guanghao Qi et al.Aug 14, 2024
+4
D
S
G
Genome-wide association studies (GWAS) have found widespread evidence of pleiotropy, but characterization of global patterns of pleiotropy remain highly incomplete due to insufficient power of current approaches. We develop fastASSET, a method that allows efficient detection of variant-level pleiotropic association across many traits. We analyze GWAS summary statistics of 116 complex traits of diverse types collected from the GRASP repository and large GWAS Consortia. We identify 2293 independent loci and find that the lead variants in nearly all these loci (~99%) to be associated with $$\ge 2$$ traits (median = 6). We observe that degree of pleiotropy estimated from our study predicts that observed in the UK Biobank for a much larger number of traits (K = 4114) (correlation = 0.43, p-value $$ < 2.2\times {10}^{-16}$$ ). Follow-up analyzes of 21 trait-specific variants indicate their link to the expression in trait-related tissues for a small number of genes involved in relevant biological processes. Our findings provide deeper insight into the nature of pleiotropy and leads to identification of highly trait-specific susceptibility variants. Here, the authors develop fastASSET, a method for efficient detection of variant-level pleiotropic association across many traits. Using this method, they characterize genome-wide pleiotropy and links to genomic features, identifying 21 trait-specific SNPs.
0
Citation1
0
Save
0

Heritability Informed Power Optimization (HIPO) Leads to Enhanced Detection of Genetic Associations Across Multiple Traits

Guanghao Qi et al.Nov 12, 2017
N
G
Abstract Genome-wide association studies have shown that pleiotropy is a common phenomenon that can potentially be exploited for enhanced detection of susceptibility loci. We propose heritability informed power optimization (HIPO) for conducting powerful pleiotropic analysis using summary-level association statistics. We find optimal linear combinations of association coefficients across traits that are expected to maximize non-centrality parameter for the underlying test statistics, taking into account estimates of heritability, sample size variations and overlaps across the traits. Simulation studies show that the proposed method has correct type I error, robust to population stratification and leads to desired genome-wide enrichment of association signals. Application of the proposed method to publicly available data for three groups of genetically related traits, lipids (N=188,577) , psychiatric diseases (N case =33,332, N control =27,888) and social science traits ( N ranging between 161,460 to 298,420 across individual traits) increased the number of genome-wide significant loci by 12%, 200% and 50%, respectively, compared to those found by analysis of individual traits. Evidence of replication is present for many of these loci in subsequent larger studies for individual traits. HIPO can potentially be extended to high-dimensional phenotypes as a way of dimension reduction to maximize power for subsequent genetic association testing.
0
Citation1
0
Save
1

Mendelian Randomization Analysis Using Multiple Biomarkers of an Underlying Common Exposure

Jin Jin et al.Feb 7, 2021
N
Z
G
J
S ummary Mendelian Randomization (MR) analysis is increasingly popular for testing the causal effect of exposures on disease outcomes using data from genome-wide association studies. In some settings, the underlying exposure, such as systematic inflammation, may not be directly observable, but measurements can be available on multiple biomarkers or other types of traits that are coregulated by the exposure. We propose a method for MR analysis on latent exposures (MRLE), which tests the significance for, and the direction of, the effect of a latent exposure by leveraging information from multiple related traits. The method is developed by constructing a set of estimating functions based on the second-order moments of GWAS summary association statistics for the observable traits, under a structural equation model where genetic variants are assumed to have indirect effects through the latent exposure and potentially direct effects on the traits. Simulation studies show that MRLE has well-controlled type I error rates and enhanced power compared to single-trait MR tests under various types of pleiotropy. Applications of MRLE using genetic association statistics across five inflammatory biomarkers (CRP, IL-6, IL-8, TNF-Ξ±, and MCP-1) provide evidence for potential causal effects of inflammation on increasing the risk of coronary artery disease, colorectal cancer, and rheumatoid arthritis, while standard MR analysis for individual biomarkers fails to detect consistent evidence for such effects.
0

Mendelian Randomization Analysis Using Mixture Models (MRMix) for Genetic Effect-Size-Distribution Leads to Robust Estimation of Causal Effects

Guanghao Qi et al.Jul 13, 2018
N
G
We propose a novel method for robust estimation of causal effects in two-sample Mendelian randomization analysis using potentially large number of genetic instruments. We consider a "working model" for bi-variate effect-size distribution across pairs of traits in the form of normal-mixtures which assumes existence of a fraction of the genetic markers that are valid instruments, i.e. they have only direct effect on one trait, while other markers can have potentially correlated, direct and indirect effects, or have no effects at all. We show that model motivates a simple method for estimating causal effect (𝜽) through a procedure for maximizing the probability concentration of the residuals, (πœ·π‘»π’“π’‚π’Šπ’•πŸ βˆ’ πœ½πœ·π‘»π’“π’‚π’Šπ’•πŸ), at the "null" component of a two-component normal-mixture model. Simulation studies showed that MRMix provides nearly unbiased or/and substantially more robust estimates of causal effects compared to alternative methods under various scenarios. Further, the studies showed that MRMix is sensitive to direction and can achieve much higher efficiency (up to 3-4 fold) relative to other comparably robust estimators. We applied the proposed methods for conducting MR analysis using largest publicly available datasets across a number of risk-factors and health outcomes. Notable findings included identification of causal effects of genetically determined BMI and age-at-menarche, which have relationship among themselves, on the risk of breast cancer; detrimental effect of HDL on the risk of breast cancer; no causal effect of HDL and triglycerides on the risk of coronary artery disease; a strong detrimental effect of BMI, but no causal effect of years of education, on the risk of major depressive disorder.
0

Kidney Function and Blood Pressure: A Bi-directional Mendelian Randomisation Study

Zhi Yu et al.Nov 29, 2019
+8
A
N
Z
OBJECTIVE: To evaluate the bi-directional causal relation between kidney function and blood pressure. DESIGN: Mendelian randomisation study. SETTING: We performed two-sample Mendelian randomisation analyses. Genetic instruments of kidney function traits were selected from summary statistics of genome-wide association studies (GWAS) of glomerular filtration rate estimated from serum creatinine (eGFRcr) and blood urea nitrogen (BUN) and were required to be associated with both eGFRcr and BUN to ensure that the instruments were more likely to represent the underlying kidney function. Genetic instruments of blood pressure were selected from summary statistics of GWAS of systolic and diastolic blood pressure. We investigated Mendelian randomisation hypothesis using several alternative approaches, including methods that are most robust to the presence of horizontal pleiotropy. CONCLUSIONS: Mendelian randomisation analyses support causal effects of higher kidney function on lower blood pressure. These results suggest preventing kidney function decline can reduce the public health burden of hypertension.
Load More