GN
Guiyan Ni
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
34
h-index:
13
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Theoretical and empirical quantification of the accuracy of polygenic scores in ancestry divergent populations

Ying Wang et al.Jan 15, 2020
+3
P
J
Y
Abstract Polygenic scores (PGS) have been widely used to predict complex traits and risk of diseases using variants identified from genome-wide association studies (GWASs). To date, most GWASs have been conducted in populations of European ancestry, which limits the use of GWAS-derived PGS in non-European populations. Here, we develop a new theory to predict the relative accuracy (RA, relative to the accuracy in populations of the same ancestry as the discovery population) of PGS across ancestries. We used simulations and real data from the UK Biobank to evaluate our results. We found across various simulation scenarios that the RA of PGS based on trait-associated SNPs can be predicted accurately from modelling linkage disequilibrium (LD), minor allele frequencies (MAF), cross-population correlations of SNP effect sizes and heritability. Altogether, we find that LD and MAF differences between ancestries explain alone up to ~70% of the loss of RA using European-based PGS in African ancestry for traits like body mass index and height. Our results suggest that causal variants underlying common genetic variation identified in European ancestry GWASs are mostly shared across continents.
0
Citation22
0
Save
0

Estimation of genetic correlation using linkage disequilibrium score regression and genomic restricted maximum likelihood

Guiyan Ni et al.Sep 27, 2017
S
N
G
G
ABSTRACT Genetic correlation is a key population parameter that describes the shared genetic architecture of complex traits and diseases. It can be estimated by current state-of-art methods, i.e. linkage disequilibrium score regression (LDSC) and genomic restricted maximum likelihood (GREML). The massively reduced computing burden of LDSC compared to GREML makes it an attractive tool, although the accuracy (i.e., magnitude of standard errors) of LDSC estimates has not been thoroughly studied. In simulation, we show that the accuracy of GREML is generally higher than that of LDSC. When there is genetic heterogeneity between the actual sample and reference data from which LD scores are estimated, the accuracy of LDSC decreases further. In real data analyses estimating the genetic correlation between schizophrenia (SCZ) and body mass index, we show that GREML estimates based on ~150,000 individuals give a higher accuracy than LDSC estimates based on ~400,000 individuals (from combined meta-data). A GREML genomic partitioning analysis reveals that the genetic correlation between SCZ and height is significantly negative for regulatory regions, which whole genome or LDSC approach has less power to detect. We conclude that LDSC estimates should be carefully interpreted as there can be uncertainty about homogeneity among combined meta-data sets. We suggest that any interesting findings from massive LDSC analysis for a large number of complex traits should be followed up, where possible, with more detailed analyses with GREML methods, even if sample sizes are lesser.
0
Citation12
0
Save
0

A Whole-Genome Approach Discovers Novel Genetic and Non-Genetic Variance Components Modulated by Lifestyle for Cardiovascular Health

Xuan Zhou et al.Jul 14, 2019
+5
G
K
X
Both genetic and non-genetic factors can predispose individuals to cardiovascular risk. Finding ways to alter these predispositions is important for cardiovascular disease (CVD) prevention. Here, we use a novel whole-genome framework to estimate genetic and non-genetic effects on, hence their predispositions to, cardiovascular risk and determine whether they vary with respect to lifestyle factors. We performed analyses on the Atherosclerosis Risk in Communities Study (ARIC, N=6,896-7,180) and validated findings using the UK Biobank (UKBB, N=14,076-34,538). Cardiovascular risk was measured using 23 traits in the ARIC and eight traits in the UKBB, such as body mass index (BMI), resting heart rate, white blood cell count and blood pressure; and lifestyle factors included information on physical activity, smoking, alcohol consumption and dietary intake. Physical activity altered both genetic and non-genetic effects on heart rate and BMI, genetic effects on HDL cholesterol level, and non-genetic effects on waist-to-hip ratio. Alcohol consumption altered both genetic and non-genetic effects on BMI, while smoking altered non-genetic effects on heart rate, pulse pressure, and white blood cell count. In addition, saturated fat intake modified genetic effects on BMI, and total daily energy intake modified non-genetic effects on waist-to-hip ratio. These results highlight the relevance of lifestyle changes for CVD prevention. We also stratified individuals according to their genetic predispositions and showed notable differences in the effects of lifestyle on cardiovascular risk across stratified groups, implying the need for individualizing lifestyle changes for CVD prevention. Finally, we showed that neglecting lifestyle modulation of genetic and non-genetic effects will on average reduce SNP heritability estimates of cardiovascular traits by a small yet significant amount, primarily owing to overestimation of residual variance. Thus, current SNP heritability estimates for cardiovascular traits, which commonly do not consider modulating effects of lifestyle covariates, are likely underestimated.
0

Detecting genotype-population interaction effects by ancestry principal components

Chenglong Yu et al.Jul 30, 2019
+2
J
G
C
Heterogeneity in the phenotypic mean and variance across populations is often observed for complex traits. One way to understand heterogeneous phenotypes lies in uncovering heterogeneity in genetic effects. Previous studies on genetic heterogeneity across populations were typically based on discrete groups of population stratified by different countries or cohorts, which ignored the difference of population characteristics for the individuals within each group and resulted in loss of information. Here we introduce a novel concept of genotype-by-population (G×P) interaction where population is defined by the first and second ancestry principal components (PCs), which are less likely to be confounded with country/cohort-specific factors. We applied a reaction norm model fitting each of 70 complex traits with significant SNP-heritability and the PCs as covariates to examine G×P interactions across diverse populations including white British and other white Europeans from the UK Biobank (N = 22,229). Our results demonstrated a significant population genetic heterogeneity for behavioural traits such as age first had sexual intercourse and qualifications. Our approach may shed light on the latent genetic architecture of complex traits that underlies the modulation of genetic effects across different populations.
0

Age at first birth in women is genetically associated with increased risk of schizophrenia

Guiyan Ni et al.Sep 27, 2017
S
N
J
G
Previous studies have shown an increased risk for a range of mental health issues in children born to both younger and older parents compared to children of average-aged parents. However, until recently, it was not clear if these increased risks are due to psychosocial factors associated with age or if parents at higher genetic risk for psychiatric disorders tend to have children at an earlier or later age. We previously used a novel design to reveal a latent mechanism of genetic association between schizophrenia and age of mothers at the birth of their first child (AFB). Here, we use independent data from the UK Biobank (N=38,892) to replicate the finding of an association between predicted genetic risk of schizophrenia and AFB in women, end to estimate the genetic correlation between schizophrenia and AFB in women stratified into younger and older groups. We find evidence for an association between predicted genetic risk of schizophrenia and AFB in women (P-value=1.12E-05), and we show genetic heterogeneity between younger and older AFB groups (P-value=3.45E-03). The genetic correlation between schizophrenia and AFB in the younger AFB group is -0.16 (SE=0.04) while that between schizophrenia and AFB in the older AFB group is 0.14 (SE=0.08). Our results suggest that early, and perhaps also late, age at first birth in women is associated with increased genetic risk for schizophrenia. These findings contribute new insights into factors contributing to the complex bio-social risk architecture underpinning the association between parental age and offspring mental health.
0

The genetic relationship between female reproductive traits and six psychiatric disorders

Guiyan Ni et al.Oct 3, 2018
+3
X
A
G
Female reproductive behaviors have an important implication in evolutionary fitness and health of offspring. Previous studies have shown that age at first birth of women (AFB) is genetically associated with schizophrenia (SCZ). However, for most other psychiatric disorders and reproductive traits, the latent shared genetic architecture is largely unknown. Here we used the second wave of UK Biobank data (N=220,685) to evaluate the association between five female reproductive traits and polygenetic risk scores (PRS) projected from genome-wide association study summary statistics of six psychiatric disorders (N=429,178). We found that the PRS of attention-deficit/hyperactivity disorder (ADHD) were strongly associated with AFB (genetic correlation of -0.68 +/- 0.03 with p-value = 1.86E-89), age at first sexual intercourse (AFS) (-0.56 +/- 0.03 with p-value = 3.42E-60), number of live births (NLB) (0.36 +/- 0.04 with p-value = 4.01E-17) and age at menopause (-0.27 +/- 0.04 with p-value = 5.71E-13). There were also robustly significant associations between the PRS of eating disorder (ED) and AFB (genetic correlation of 0.35 +/- 0.06), ED and AFS (0.19 +/- 0.06), Major depressive disorder (MDD) and AFB (-0.27 +/- 0.07), MDD and AFS (-0.27 +/- 0.03) and SCZ and AFS (-0.10 +/- 0.03). Our findings reveal the shared genetic architecture between the five reproductive traits in women and six psychiatric disorders, which have a potential implication that helps to improve reproductive health in women, hence better child outcomes. Our findings may also explain, at least in part, an evolutionary hypothesis that causal mutations underlying psychiatric disorders have positive effects on reproductive success.
0

Integrating Single‐Cell and Spatial Transcriptomics Reveals Heterogeneity of Early Pig Skin Development and a Subpopulation with Hair Placode Formation (Adv. Sci. 20/2024)

Yi Wang et al.May 1, 2024
+7
G
Y
Y
0

Genotype-covariate correlation and interaction disentangled by a whole-genome multivariate reaction norm model

Guiyan Ni et al.Jul 26, 2018
+5
E
X
G
The genomics era has brought useful tools to dissect the genetic architecture of complex traits. We propose a reaction norm model (RNM) to tackle genotype-environment correlation and interaction problems in the context of genome-wide association analyses of complex traits. In our approach, an environmental risk factor affecting the trait of interest can be modeled as dependent on a continuous covariate that is itself regulated by genetic as well as environmental factors. Our multivariate RNM approach allows the joint modelling of the relation between the genotype (G) and the covariate (C), so that both their correlation (association) and interaction (effect modification) can be estimated. Hence we jointly estimate genotype-covariate correlation and interaction (GCCI). We demonstrate using simulation that the proposed multivariate RNM performs better than the current state-of-the-art methods that ignore G-C correlation. We apply the method to data from the UK Biobank (N= 66,281) in analysis of body mass index using smoking quantity as a covariate. We find a highly significant G-C correlation, but a negligible G-C interaction. In contrast, when a conventional G-C interaction analysis is applied (i.e., G-C correlation is not included in the model), highly significant G-C interaction estimates are found. It is also notable that we find a significant heterogeneity in the estimated residual variances across different covariate levels probably due to residual-covariate interaction. Using simulation we also show that the residual variances estimated by genomic restricted maximum likelihood (GREML) or linkage disequilibrium score regression (LDSC) can be inflated in the presence of interactions, implying that the currently reported SNP-heritability estimates from these methods should be interpreted with caution. We conclude that it is essential to correctly account for both interaction and correlation in complex trait analyses and that the failure to do so may lead to substantial biases in inferences relating to genetic architecture of complex traits, including estimated SNP-heritability.