NC
Na Cai
Author with expertise in Genomic Studies and Association Analyses
Southwest Forestry University, Helmholtz Zentrum München, Technical University of Munich
+ 8 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
17
(41% Open Access)
Cited by:
16
h-index:
32
/
i10-index:
57
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
136

Cross-trait assortative mating is widespread and inflates genetic correlation estimates

Richard Border et al.Oct 24, 2023
+9
A
G
R
The observation of genetic correlations between disparate traits has been interpreted as evidence of widespread pleiotropy, altered theories of human genetic architecture, and spurred considerable research activity across the natural and social sciences. Here, we introduce cross-trait assortative mating (xAM) as an alternative explanation for observed genetic correlations. We observe that xAM is common across a broad array of phenotypes and that phenotypic cross-mate correlation estimates are strongly associated with genetic correlation estimates ( R 2 = 76%). Then, we present theoretical and simulation-based results demonstrating that, under xAM, genetic correlation estimators yield significant estimates even for traits with entirely distinct genetic bases. We demonstrate that existing xAM plausibly accounts for substantial fractions of genetic correlation estimates in two large samples ( N = 827,960). For example, previously reported genetic correlation estimates between many pairs of psychiatric disorders are fully consistent with xAM alone. Finally, we provide evidence for a history of xAM at the genetic level using a novel approach based on cross-trait even/odd chromosome polygenic score correlations. Together, our results demonstrate that previous reports have likely overestimated the true genetic similarity between many phenotypes.
1

Multi-ancestry GWAS of major depression aids locus discovery, fine-mapping, gene prioritisation, and causal inference

Xiangrui Meng et al.Oct 24, 2023
+71
O
G
X
Abstract Most genome-wide association studies (GWAS) of major depression (MD) have been conducted in samples of European ancestry. Here we report a multi-ancestry GWAS of MD, adding data from 21 studies with 88,316 MD cases and 902,757 controls to previously reported data from individuals of European ancestry. This includes samples of African (36% of effective sample size), East Asian (26%) and South Asian (6%) ancestry and Hispanic/Latinx participants (32%). The multi-ancestry GWAS identified 190 significantly associated loci, 53 of them novel. For previously reported loci from GWAS in European ancestry the power-adjusted transferability ratio was 0.6 in the Hispanic/Latinx group and 0.3 in each of the other groups. Fine-mapping benefited from additional sample diversity: the number of credible sets with ≤5 variants increased from 3 to 12. A transcriptome-wide association study identified 354 significantly associated genes, 205 of them novel. Mendelian Randomisation showed a bidirectional relationship with BMI exclusively in samples of European ancestry. This first multi-ancestry GWAS of MD demonstrates the importance of large diverse samples for the identification of target genes and putative mechanisms.
7

Analysis of independent cohorts of outbred CFW mice reveals novel loci for behavioral and physiological traits and identifies factors determining reproducibility

Jennifer Zou et al.Oct 24, 2023
+7
C
S
J
ABSTRACT Combining samples for genetic association is standard practice in human genetic analysis of complex traits, but is rarely undertaken in rodent genetics. Here, using 23 phenotypes and genotypes from two independent laboratories, we obtained a sample size of 3,076 commercially available outbred mice and identified 70 loci, more than double the number of loci identified in the component studies. Fine-mapping in the combined sample reduced the number of likely causal variants, with a median reduction in set size of 51%, and indicated novel gene associations, including Pnpo, Ttll6 and GM11545 with bone mineral density, and Psmb9 with weight. However replication at a nominal threshold of 0.05 between the two component studies was surprisingly low, with less than a third of loci identified in one study replicated in the second. In addition to overestimates in the effect size in the discovery sample (Winner’s Curse), we also found that heterogeneity between studies explained the poor replication, but the contribution of these two factors varied among traits. Available methods to control Winner’s Curse were contingent on the power of the discovery sample, and depending on the method used, both overestimated and underestimated the true effect. Leveraging these observations we integrated information about replication rates, confounding, and Winner’s Curse corrected estimates of power to assign variants to one of four confidence levels. Our approach addresses concerns about reproducibility, and demonstrates how to obtain robust results from mapping complex traits in any genome-wide association study.
1

Tripartite extended amygdala - basal ganglia CRH circuit drives arousal and avoidance behaviour

Shu‐Ying Chang et al.Oct 24, 2023
+11
C
F
S
Abstract An adaptive stress response involves various mediators and circuits orchestrating a complex interplay of physiological, emotional and behavioural adjustments. We identified a population of corticotropin-releasing hormone (CRH) neurons in the lateral part of the interstitial nucleus of the anterior commissure (IPACL) – a subdivision of the extended amygdala, which exclusively innervate the substantia nigra (SN). Specific stimulation of this circuit elicits arousal and avoidance behaviour contingent on CRH receptor 1 (CRHR1) located at axon terminals in the SN, which originate from external globus pallidus (GPe) neurons. The neuronal activity prompting the observed behaviour is shaped by IPACL CRH and GPe CRHR1 neurons coalescing in the SN. These results delineate a novel tripartite CRH circuit functionally connecting extended amygdala and basal ganglia nuclei to drive arousal and avoidance behaviour. One-Sentence Summary Brain centres involved in emotional and motor control are connected through a stress peptide promoting arousal and avoidance behaviour
1
Citation1
0
Save
0

Systematic assessment of regulatory effects of human disease variants in pluripotent cells

Marc Bonder et al.May 7, 2020
+14
M
C
M
Identifying regulatory genetic effects in pluripotent cells provides important insights into disease variants with potentially transient or developmental origins. Combining existing and newly-generated data, we characterized 1,367 iPSC lines from 948 unique donors, collectively analyzed within the “Integrated iPSC QTL” (i2QTL) Consortium. The sample size of our study allowed us to derive the most comprehensive map of quantitative trait loci (QTL) in pluripotent human cells to date. We mapped the effects of nearby common genetic variants on five expression phenotypes, identifying cis -QTL at gene-, exon-level and transcript-, splicing-, alternative polyadenylation-ratio (APA) for a total of 18,556 genes. For gene-level, we further quantified the effects of rare and singleton variants, and the effect of distal variants that act in trans ( trans -eQTL), which we replicated in independent samples. Our data are a valuable community resource, uncovering novel regulatory effects that have not previously been described in differentiated cells and tissues. Building on this regulatory map, we functionally explore GWAS signals for over 4,336 trait loci, finding evidence for colocalization with common and rare iPSC QTL for traits such as height and BMI, and diseases, such as cancer and coronary artery disease.
0

Re-evaluation of SNP heritability in complex human traits

Doug Speed et al.May 6, 2020
+2
M
N
D
SNP heritability, the proportion of phenotypic variance explained by SNPs, has been reported for many hundreds of traits. Its estimation requires strong prior assumptions about the distribution of heritability across the genome, but the assumptions in current use have not been thoroughly tested. By analyzing imputed data for a large number of human traits, we empirically derive a model that more accurately describes how heritability varies with minor allele frequency, linkage disequilibrium and genotype certainty. Across 19 traits, our improved model leads to estimates of common SNP heritability on average 43% (SD 3) higher than those obtained from the widely-used software GCTA, and 25% (SD 2) higher than those from the recently-proposed extension GCTA-LDMS. Previously, DNaseI hypersensitivity sites were reported to explain 79% of SNP heritability; using our improved heritability model their estimated contribution is only 24%.
78

Phenotype integration improves power and preserves specificity in biobank-based genetic studies of MDD

Andy Dahl et al.Oct 24, 2023
+10
U
M
A
Abstract Biobanks often contain several phenotypes relevant to a given disorder, and researchers face complex tradeoffs between shallow phenotypes (high sample size, low specificity and sensitivity) and deep phenotypes (low sample size, high specificity and sensitivity). Here, we study an extreme case: Major Depressive Disorder (MDD) in UK Biobank. Previous studies found that shallow and deep MDD phenotypes have qualitatively distinct genetic architectures, but it remains unclear which are optimal for scientific study or clinical prediction. We propose a new framework to get the best of both worlds by integrating together information across hundreds of MDD-relevant phenotypes. First, we use phenotype imputation to increase sample size for the deepest available MDD phenotype, which dramatically improves GWAS power (increases #loci ~10 fold) and PRS accuracy (increases R2 ~2 fold). Further, we show the genetic architecture of the imputed phenotype remains specific to MDD using genetic correlation, PRS prediction in external clinical cohorts, and a novel PRS-based pleiotropy metric. We also develop a complementary approach to improve specificity of GWAS on shallow MDD phenotypes by adjusting for phenome-wide PCs. Finally, we study phenotype integration at the level of GWAS summary statistics, which can increase GWAS and PRS power but introduces non-MDD-specific signals. Our work provides a simple and scalable recipe to improve genetic studies in large biobanks by combining the sample size of shallow phenotypes with the sensitivity and specificity of deep phenotypes.
78
0
Save
0

GxEMM: Extending linear mixed models to general gene-environment interactions

Andy Dahl et al.May 6, 2020
N
J
N
A
Gene-environment interaction (GxE) is a well-known source of non-additive inheritance. GxE can be important in applications ranging from basic functional genomics to precision medical treatment. Further, GxE effects elude inherently-linear LMMs and may explain missing heritability. We propose a simple, unifying mixed model for polygenic interactions (GxEMM) to capture the aggregate effect of small GxE effects spread across the genome. GxEMM extends existing LMMs for GxE in two important ways. First, it extends to arbitrary environmental variables, not just categorical groups. Second, GxEMM can estimate and test for environment-specific heritability. In simulations where the assumptions of existing methods do not hold, we show that GxEMM improves estimates of ordinary and GxE heritability and increases power to test for polygenic GxE. We then use GxEMM to prove that the heritability of major depression (MD) is reduced by stress, which we previously conjectured but could not prove with prior methods, and that a tail of polygenic GxE effects remains unexplained by MD GWAS.
7

Deep Learning-based Phenotype Imputation on Population-scale Biobank Data Increases Genetic Discoveries

Ulzee An et al.Oct 24, 2023
+10
M
A
U
Abstract Biobanks that collect deep phenotypic and genomic data across large numbers of individuals have emerged as a key resource for human genetic research. However, phenotypes acquired as part of Biobanks are often missing across many individuals, limiting the utility of these datasets. The ability to accurately impute or “fill-in” missing phenotypes is critical to harness the power of population-scale Biobank datasets. We propose AutoComplete, a deep learning-based imputation method which can accurately impute missing phenotypes in population-scale Biobank datasets. When applied to collections of phenotypes measured across ≈ 300K individuals from the UK Biobank, AutoComplete improved imputation accuracy over existing 2 methods (average improvement in r 2 of 18% for all phenotypes and 42% for binary phenotypes). We explored the utility of phenotype imputation for improving the power of genome-wide association studies (GWAS) by applying our method to a group of five clinically relevant traits with an average missigness rate of 83% (67% to 94%) leading to an an increase in effective sample size of ≈2-fold on average (0.5 to 3.3-fold across the phenotypes). GWAS on the resulting imputed phenotypes led to an increase in the total number of loci significantly associated to the traits from four to 129. Our results demonstrate the utility of deep-learning based imputation to increase power for genetic discoveries in existing biobank data sets.
0

A comprehensive map of genetic variation in the world's largest ethnic group - Han Chinese

Charleston Chiang et al.May 6, 2020
+5
C
S
C
As are most non-European populations around the globe, the Han Chinese are relatively understudied in population and medical genetics studies. From low-coverage whole-genome sequencing of 11,670 Han Chinese women we present a catalog of 25,057,223 variants, including 548,401 novel variants that are seen at least 10 times in our dataset. Individuals from our study come from 19 out of 22 provinces across China, allowing us to study population structure, genetic ancestry, and local adaptation in Han Chinese. We identify previously unrecognized population structure along the East-West axis of China and report unique signals of admixture across geographical space, such as European influences among the Northwestern provinces of China. Finally, we identified a number of highly differentiated loci, indicative of local adaptation in the Han Chinese. In particular, we detected extreme differentiation among the Han Chinese at MTHFR, ADH7, and FADS loci, suggesting that these loci may not be specifically selected in Tibetan and Inuit populations as previously suggested. On the other hand, we find that Neandertal ancestry does not vary significantly across the provinces, consistent with admixture prior to the dispersal of modern Han Chinese. Furthermore, contrary to a previous report, Neandertal ancestry does not explain a significant amount of heritability in depression. Our findings provide the largest genetic data set so far made available for Han Chinese and provide insights into the history and population structure of the world's largest ethnic group.
Load More