NK
Nastassja Koen
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(55% Open Access)
Cited by:
39
h-index:
34
/
i10-index:
68
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Low generalizability of polygenic scores in African populations due to genetic and environmental diversity

Lerato Majara et al.Jan 14, 2021
Abstract African populations are vastly underrepresented in genetic studies but have the most genetic variation and face wide-ranging environmental exposures globally. Because systematic evaluations of genetic prediction had not yet been conducted in ancestries that span African diversity, we calculated polygenic risk scores (PRS) in simulations across Africa and in empirical data from South Africa, Uganda, and the UK to better understand the generalizability of genetic studies. PRS accuracy improves with ancestry-matched discovery cohorts more than from ancestry-mismatched studies. Within ancestrally and ethnically diverse South Africans, we find that PRS accuracy is low for all traits but varies across groups. Differences in African ancestries contribute more to variability in PRS accuracy than other large cohort differences considered between individuals in the UK versus Uganda. We computed PRS in African ancestry populations using existing European-only versus ancestrally diverse genetic studies; the increased diversity produced the largest accuracy gains for hemoglobin concentration and white blood cell count, reflecting large-effect ancestry-enriched variants in genes known to influence sickle cell anemia and the allergic response, respectively. Differences in PRS accuracy across African ancestries originating from diverse regions are as large as across out-of-Africa continental ancestries, requiring commensurate nuance.
1
Citation28
0
Save
1

Multi-ancestry GWAS of major depression aids locus discovery, fine-mapping, gene prioritisation, and causal inference

Xiangrui Meng et al.Jul 21, 2022
Abstract Most genome-wide association studies (GWAS) of major depression (MD) have been conducted in samples of European ancestry. Here we report a multi-ancestry GWAS of MD, adding data from 21 studies with 88,316 MD cases and 902,757 controls to previously reported data from individuals of European ancestry. This includes samples of African (36% of effective sample size), East Asian (26%) and South Asian (6%) ancestry and Hispanic/Latinx participants (32%). The multi-ancestry GWAS identified 190 significantly associated loci, 53 of them novel. For previously reported loci from GWAS in European ancestry the power-adjusted transferability ratio was 0.6 in the Hispanic/Latinx group and 0.3 in each of the other groups. Fine-mapping benefited from additional sample diversity: the number of credible sets with ≤5 variants increased from 3 to 12. A transcriptome-wide association study identified 354 significantly associated genes, 205 of them novel. Mendelian Randomisation showed a bidirectional relationship with BMI exclusively in samples of European ancestry. This first multi-ancestry GWAS of MD demonstrates the importance of large diverse samples for the identification of target genes and putative mechanisms.
1
Citation4
0
Save
0

Concordance of Genetic Variation that Increases Risk for Tourette Syndrome and that Influences its Underlying Neurocircuitry

Mary Mufford et al.Jul 13, 2018
ABSTRACT BACKGROUND There have been considerable recent advances in understanding the genetic architecture of Tourette Syndrome (TS) as well as its underlying neurocircuitry. However, the mechanisms by which genetic variations that increase risk for TS - and its main symptom dimensions - influence relevant brain regions are poorly understood. Here we undertook a genome-wide investigation of the overlap between TS genetic risk and genetic influences on the volume of specific subcortical brain structures that have been implicated in TS. METHODS We obtained summary statistics for the most recent TS genome-wide association study (GWAS) from the TS Psychiatric Genomics Consortium Working Group (4,644 cases and 8,695 controls) and GWAS of subcortical volumes from the ENIGMA consortium (30,717 individuals). We also undertook analyses using GWAS summary statistics of key symptom factors in TS, namely social disinhibition and symmetry behaviour. SNP Effect Concordance Analysis (SECA) was used to examine genetic pleiotropy - the same SNP affecting two traits - and concordance - the agreement in SNP effect directions across these two traits. In addition, a conditional false discovery rate (FDR) analysis was performed, conditioning the TS risk variants on each of the seven subcortical and the intracranial brain volume GWAS. Linkage Disequilibrium Score Regression (LDSR) was used as validation of SECA. RESULTS SECA revealed significant pleiotropy between TS and putaminal ( p =2×10 −4 ) and caudal ( p =4×10 −4 ) volumes, independent of direction of effect, and significant concordance between TS and lower thalamic volume ( p =1×10 −3 ). LDSR lent additional support for the association between TS and thalamic volume ( p =5.85×10 −2 ). Furthermore, SECA revealed significant evidence of concordance between the social disinhibition symptom dimension and lower thalamic volume ( p =1×10 −3 ), as well as concordance between symmetry behaviour and greater putaminal volume ( p =7×10 −4 ). Conditional FDR analysis further revealed novel variants significantly associated with TS ( p <8×10 −7 ) when conditioning on intracranial (rs2708146, q =0.046; and rs72853320, q =0.035 and hippocampal (rs1922786, q =0.001 volumes respectively. CONCLUSION These data indicate concordance for genetic variations involved in disorder risk and subcortical brain volumes in TS. Further work with larger samples is needed to fully delineate the genetic architecture of these disorders and their underlying neurocircuitry.
0
Citation3
0
Save
21

Genetic structure correlates with ethnolinguistic diversity in eastern and southern Africa

Elizabeth Atkinson et al.May 19, 2021
Summary African populations are the most diverse in the world yet are sorely underrepresented in medical genetics research. Here, we examine the structure of African populations using genetic and comprehensive multigenerational ethnolinguistic data from the Neuropsychiatric Genetics of African Populations-Psychosis study (NeuroGAP-Psychosis) consisting of 900 individuals from Ethiopia, Kenya, South Africa, and Uganda. We find that self-reported language classifications meaningfully tag underlying genetic variation that would be missed with consideration of geography alone, highlighting the importance of culture in shaping genetic diversity. Leveraging our uniquely rich multi-generational ethnolinguistic metadata, we track language transmission through the pedigree, observing the disappearance of several languages in our cohort as well as notable shifts in frequency over three generations. We find suggestive evidence for the rate of language transmission in matrilineal groups having been higher than that for patrilineal ones. We highlight both the diversity of variation within the African continent, as well as how within-Africa variation can be informative for broader variant interpretation; many variants appearing rare elsewhere are common in parts of Africa. The work presented here improves the understanding of the spectrum of genetic variation in African populations and highlights the enormous and complex genetic and ethnolinguistic diversity within Africa.
21
Citation2
0
Save
0

Maternal psychosocial risk factors and offspring gestational epigenetic age acceleration in a South African birth cohort study

Nastassja Koen et al.Dec 21, 2018
Epigenetic age (EA) acceleration is associated with higher risk of chronic disease and mortality in adults. However, little is known about whether and how in utero exposures might shape gestational EA acceleration at birth. We aimed to explore associations between maternal psychosocial risk factors and offspring gestational EA acceleration at birth in a South African birth cohort study - the Drakenstein Child Health Study. Maternal psychosocial risk factors included trauma/stressor exposure; posttraumatic stress disorder (PTSD); depression, psychological distress; and alcohol/tobacco use. Offspring gestational EA acceleration at birth was calculated using an epigenetic clock previously devised for neonates. Bivariate linear regression was used to explore unadjusted associations between maternal risk factors and offspring gestational EA acceleration at birth. A stepwise regression method was then used to determine the best multivariable model for adjusted associations. Data from 272 maternal-offspring dyads were included in the current analysis. In the stepwise regression model, maternal trauma exposure (β = 7.92; p<0.01) or PTSD (β = 7.46; p<0.01) were significantly associated with offspring gestational EA acceleration at birth, controlling for ethnicity, offspring sex, head circumference at birth, maternal HIV status, and prenatal tobacco or alcohol use. In site-stratified models, these associations retained statistical significance and direction of effect. Maternal trauma exposure or PTSD may thus be associated with offspring gestational EA acceleration at birth. Given the novelty of this preliminary finding, and its potential translational relevance, further studies to delineate underlying biological pathways and to explore clinical implications of EA acceleration are warranted.
0
Citation1
0
Save
0

Technical variability across the 450K, EPICv1, and EPICv2 DNA methylation arrays: lessons learned for clinical and longitudinal studies

Alexandre Lussier et al.Nov 22, 2024
Abstract DNA methylation (DNAm) is the most commonly measured epigenetic mechanism in human populations, with most studies using Illumina arrays to assess DNAm levels. In 2023, Illumina updated their DNAm arrays to the EPIC version 2 (EPICv2), building on prior iterations, namely the EPIC version 1 (EPICv1) and 450K arrays. Whether DNAm measurements are stable across these three generations of arrays has yet not been investigated, limiting the ability of researchers—especially those with longitudinal data—to compare and replicate results across arrays. Here, we present results from a study of 30 child participants (15 male; 15 female) from the Drakenstein Child Health Study, who had DNAm measured on all three of the latest arrays: 450K, EPICv1, and EPICv2. Using these data, we created an annotation of probe quality across arrays, which includes the intraclass correlations, interquartile ranges, correlations, and array bias (i.e., the extent to which DNAm levels were explained by array type) of all CpGs. We also present results from an analysis of sex differences, where we found that CpGs with lower replicability across arrays had higher array-based variance, suggesting this variance metric help guide replication efforts. We also showed that epigenetic age estimates across arrays were more stable when using the principal component versions of epigenetic clocks. Ultimately, this collection of results provides a framework for investigating the replicability and longitudinal stability of epigenetic changes across multiple versions of Illumina DNAm arrays.
0
Citation1
0
Save
0

Variably methylated regions in the newborn epigenome: environmental, genetic and combined influences

Darina Czamara et al.Oct 17, 2018
Background: Epigenetic processes, including DNA methylation (DNAm), are among the mechanisms allowing integration of genetic and environmental factors to shape cellular function. While many studies have investigated either environmental or genetic contributions to DNAm, few have assessed their integrated effects. We examined the relative contributions of prenatal environmental factors and genotype on DNA methylation in neonatal blood at variably methylated regions (VMRs), defined as consecutive CpGs showing the highest variability of DNAm in 4 independent cohorts (PREDO, DCHS, UCI, MoBa, N=2,934). Results: We used Akaike's information criterion to test which factors best explained variability of methylation in the cohort-specific VMRs: several prenatal environmental factors (E) including maternal demographic, psychosocial and metabolism related phenotypes, genotypes in cis (G), or their additive (G+E) or interaction (GxE) effects. G+E and GxE models consistently best explained variability in DNAm of VMRs across the cohorts, with G explaining the remaining sites best. VMRs best explained by G, GxE or G+E, as well as their associated functional genetic variants (predicted using deep learning algorithms), were located in distinct genomic regions, with different enrichments for transcription and enhancer marks. Genetic variants of not only G and G+E models, but also of variants in GxE models were significantly enriched in genome wide association studies (GWAS) for complex disorders. Conclusion: Genetic and environmental factors in combination best explain DNAm at VMRs. The CpGs best explained by G, G+E or GxE are functionally distinct. The enrichment of GxE variants in GWAS for complex disorders supports their importance for disease risk.
0

Largest genome-wide association study for PTSD identifies genetic risk loci in European and African ancestries and implicates novel biological pathways

Caroline Nievergelt et al.Nov 1, 2018
Post-traumatic stress disorder (PTSD) is a common and debilitating disorder. The risk of PTSD following trauma is heritable, but robust common variants have yet to be identified by genome-wide association studies (GWAS). We have collected a multi-ethnic cohort including over 30,000 PTSD cases and 170,000 controls. We first demonstrate significant genetic correlations across 60 PTSD cohorts to evaluate the comparability of these phenotypically heterogeneous studies. In this largest GWAS meta-analysis of PTSD to date we identify a total of 6 genome-wide significant loci, 4 in European and 2 in African-ancestry analyses. Follow-up analyses incorporated local ancestry and sex-specific effects, and functional studies. Along with other novel genes, a non-coding RNA (ncRNA) and a Parkinson's Disease gene, PARK2, were associated with PTSD. Consistent with previous reports, SNP-based heritability estimates for PTSD range between 10-20%. Despite a significant shared liability between PTSD and major depressive disorder, we show evidence that some of our loci may be specific to PTSD. These results demonstrate the role of genetic variation contributing to the biology of differential risk for PTSD and the necessity of expanding GWAS beyond European ancestry.
Load More