ZW
Zhe Wang
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
5
(20% Open Access)
Cited by:
16
h-index:
26
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 10, 2022
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
3
Citation16
0
Save
0

Refining The Accuracy Of Validated Target Identification Through Coding Variant Fine-Mapping In Type 2 Diabetes

Anubha Mahajan et al.May 31, 2017
Identification of coding variant associations for complex diseases offers a direct route to biological insight, but is dependent on appropriate inference concerning the causal impact of those variants on disease risk. We aggregated coding variant data for 81,412 type 2 diabetes (T2D) cases and 370,832 controls of diverse ancestry, identifying 40 distinct coding variant association signals (at 38 loci) reaching significance (p<2.2x10-7). Of these, 16 represent novel associations mapping outside known genome-wide association study (GWAS) signals. We make two important observations. First, despite a threefold increase in sample size over previous efforts, only five of the 40 signals are driven by variants with minor allele frequency <5%, and we find no evidence for low-frequency variants with allelic odds ratio >1.29. Second, we used GWAS data from 50,160 T2D cases and 465,272 controls of European ancestry to fine-map these associated coding variants in their regional context, with and without additional weighting to account for the global enrichment of complex trait association signals in coding exons. At the 37 signals for which we attempted fine-mapping, we demonstrate convincing support (posterior probability >80% under the 'annotation-weighted' model) that coding variants are causal for the association at 16 (including novel signals involving POC5 p.His36Arg, ANKH p.Arg187Gln, WSCD2 p.Thr113Ile, PLCB3 p.Ser778Leu, and PNPLA3 p.Ile148Met). However, at 13 of the 37 loci, the associated coding variants represent 'false leads' and naïve analysis could have led to an erroneous inference regarding the effector transcript mediating the signal. Accurate identification of validated targets is dependent on correct specification of the contribution of coding and non-coding mediated mechanisms at associated loci.
0

Discovering patterns of pleiotropy in genome-wide association studies

Jianan Zhana et al.Feb 28, 2018
Genome-wide association studies have had great success in identifying human genetic variants associated with disease, disease risk factors, and other biomedical phenotypes. Many variants are associated with multiple traits, even after correction for trait-trait correlation. Discovering subsets of variants associated with a shared subset of phenotypes could help reveal disease mechanisms, suggest new therapeutic options, and increase the power to detect additional variants with similar pattern of associations. Here we introduce two methods based on a Bayesian framework, SNP And Pleiotropic PHenotype Organization (SAPPHO), one modeling independent phenotypes (SAPPHO-I) and the other incorporating a full phenotype covariance structure (SAPPHO-C). These two methods learn patterns of pleiotropy from genotype and phenotype data, using identified associations to discover additional associations with shared patterns. The SAPPHO methods, along with other recent approaches for pleiotropic association tests, were assessed using data from the Atherosclerotic Risk in Communities (ARIC) study of 8,000 individuals, whose gold-standard associations were provided by meta-analysis of 40,000 to 100,000 individuals from the CHARGE consortium. Using power to detect gold-standard associations at genome-wide significance (0.05 family-wise error rate) as a metric, SAPPHO performed best. The SAPPHO methods were also uniquely able to select the most significant variants in a parsimonious model, excluding other less likely variants within a linkage disequilibrium block. For meta-analysis, the SAPPHO methods implement summary modes that use sufficient statistics rather than full phenotype and genotype data. Meta-analysis applied to CHARGE detected 16 additional associations to the gold-standard loci, as well as 124 novel loci, at 0.05 false discovery rate. Reasons for the superior performance were explored by performing simulations over a range of scenarios describing different genetic architectures. With SAPPHO we were able to learn genetic structures that were hidden using the traditional univariate tests.
0

Lower hemoglobin levels associate with lower body mass index and healthier metabolic profile

Juha Auvinen et al.Nov 19, 2018
Hemoglobin (Hb) is the main carrier of oxygen. In general, high-end Hb levels within the normal range are considered beneficial for health1. However, activation of the hypoxia response has been shown to protect mice against metabolic dysfunction2-4. We used Hb levels as an indicator for oxygenation status and studied its association with >170 anthropometric and metabolic parameters in two Finnish birth cohorts both in cross-sectional and longitudinal design (max n = 7,175). Here we show a positive linear association between Hb levels and body mass index (BMI). Subjects with the lower Hb levels had better glucose tolerance, lower cholesterol and blood pressure levels, less adverse metabolite profiles and lower inflammatory load. Notably, these associations were not only mediated by the lower BMI, and the effect size of many of them increased with age. Polygenic risk score (PRS) analyses indicated shared genetic determinants between Hb levels and BMI, insulin, triglyceride and HDL cholesterol levels. Mendelian randomization (MR) analyses could not demonstrate causal relationships between Hb and metabolic parameters. However, manipulation of Hb levels by venesection in mice showed evidence for causal associations with body weight and metabolic parameters. Our findings suggest that lower-end normal Hb levels may be favorable for systemic metabolism involving mild chronic activation of the hypoxia response. Therefore modulation of Hb levels could be a novel strategy towards maintenance of metabolic health.
0

Role of Rare and Low Frequency Variants in Gene-Alcohol Interactions on Plasma Lipid Levels

Zhe Wang et al.Feb 28, 2019
Background: Alcohol intake influences plasma lipid levels and such effects may be modulated by genetic variants. Objective: We aimed to characterize the role of aggregated rare and low-frequency variants in gene by alcohol consumption interactions associated with fasting plasma lipid levels. Design: In the Cohorts for Heart and Aging Research in Genomic Epidemiology (CHARGE) consortium, fasting plasma triglycerides (TG), and high- and low-density lipoprotein cholesterol (HDL-c and LDL-c) were measured in 34,153 European Americans from five discovery studies and 32,275 individuals from six replication studies. Rare and low-frequency protein coding variants (minor allele frequency ≤ 5%) measured by an exome array were aggregated by genes and evaluated by a gene-environment interaction (GxE) test and a joint test of genetic main and GxE interaction effects. Two dichotomous self-reported alcohol consumption variables, current drinker, defined as any recurrent drinking behavior, and regular drinker, defined as the subset of current drinkers who consume at least two drinks per week, were considered. Results: We discovered and replicated 21 gene-lipid associations at 13 known lipid loci through the joint test. Eight loci (PCSK9, LPA, LPL, LIPG, ANGPTL4, APOB, APOC3 and CD300LG) remained significant after conditioning on the common index single nucleotide polymorphism (SNP) identified by previous genome-wide association studies, suggesting an independent role for rare and low-frequency variants at these loci. One significant gene-alcohol interaction on TG was discovered at a Bonferroni corrected significance level (p-value <5*10-5) and replicated (p-value <0.013 for the interaction test) in SMC5.