VA
Vivek Appadurai
Author with expertise in Genomic Studies and Association Analyses
University of Cambridge, Mental Health Services, Copenhagen University Hospital
+ 7 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(58% Open Access)
Cited by:
78
h-index:
20
/
i10-index:
30
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
370

Population Genomics of Postglacial Western Eurasia

Morten Allentoft et al.Oct 23, 2023
+161
A
M
M
Summary Western Eurasia witnessed several large-scale human migrations during the Holocene 1–5 . To investigate the cross-continental impacts we shotgun-sequenced 317 primarily Mesolithic and Neolithic genomes from across Northern and Western Eurasia. These were imputed alongside published data to obtain diploid genotypes from >1,600 ancient humans. Our analyses revealed a ‘Great Divide’ genomic boundary extending from the Black Sea to the Baltic. Mesolithic hunter-gatherers (HGs) were highly genetically differentiated east and west of this zone, and the impact of the neolithisation was equally disparate. Large-scale ancestry shifts occurred in the west as farming was introduced, including near-total replacements of HGs in many areas, whereas no substantial ancestry shifts happened east of the zone during the same period. Similarly, relatedness decreased in the west from the Neolithic transition onwards, while east of the Urals relatedness remained high until ∼4,000 BP, consistent with persistence of localised HG groups. The boundary dissolved when Yamnaya-related ancestry spread across western Eurasia around 5,000 BP resulting in a second major turnover that reached most parts of Europe within a 1,000-year span. The genetic origin and fate of the Yamnaya have remained elusive but we demonstrate that HGs from the Middle Don region contributed ancestry to them. Yamnaya-groups later admixed with individuals associated with the Globular Amphora Culture before expanding into Europe. Similar turnovers occurred in western Siberia, where we report new genomic data from a ‘Neolithic steppe’ cline spanning the Siberian forest steppe to Lake Baikal. These prehistoric migrations had profound and lasting effects on the genetic diversity of Eurasian populations.
370
Citation28
0
Save
6

The Norwegian Mother, Father, and Child cohort study (MoBa) genotyping data resource: MoBaPsychGen pipeline v.1

Elizabeth Corfield et al.Oct 24, 2023
+22
A
O
E
Abstract Background The Norwegian Mother, Father, and Child Cohort Study (MoBa) is a population-based pregnancy cohort, which includes approximately 114,500 children, 95,200 mothers, and 75,200 fathers. Genotyping of MoBa has been conducted through multiple research projects, spanning several years; using varying selection criteria, genotyping arrays, and genotyping centres. MoBa contains numerous interrelated families, which necessitated the implementation of a family-based quality control (QC) pipeline that verifies and accounts for diverse types of relatedness. Methods The MoBaPsychGen pipeline, comprising pre-imputation QC, phasing, imputation, and post-imputation QC, was developed based on current best-practice protocols and implemented to account for the complex structure of the MoBa genotype data. The pipeline includes QC on both single nucleotide polymorphism (SNP) and individual level. Phasing and imputation were performed using the publicly available Haplotype Reference Consortium release 1.1 panel as a reference. Information from the Medical Birth Registry of Norway and MoBa questionnaires were used to identify biological sex, year of birth, reported parent-offspring (PO) relationships, and multiple births (only available in the offspring generation). Results In total, 207,569 unique individuals (90% of the unique individuals included in the study) and 6,981,748 SNPs passed the MoBaPsychGen pipeline. The relatedness checks performed throughout the pipeline allowed identification of within-generation and across-generation first-degree, second-degree, and third-degree relatives. The individuals passing post-imputation QC comprised 64,471 families ranging in size from singletons to 84 unique individuals (singletons are included as families as other family members may not have been genotyped, imputed, or passed post-imputation QC). The relationships identified include 287 monozygotic twin pairs, 22,884 full siblings, 117,004 PO pairs, 23,299 second-degree relative pairs, and 10,828 third-degree relative pairs. Discussion MoBa contains a highly complex relatedness structure, with a variety of family structures including singletons, PO duos, full (mother, father, child) PO trios, nuclear families, blended families, and extended families. The availability of robustly quality-controlled genetic data for such a large cohort with a unique extended family structure will allow many novel research questions to be addressed. Furthermore, the MoBaPsychGen pipeline has potential utility in similar cohorts.
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
212

Genome-wide association study of school grades identifies a genetic overlap between language ability, psychopathology and creativity

Veera Rajagopal et al.Oct 24, 2023
+23
J
A
V
Abstract Individuals with psychiatric disorders perform differently in school compared to the general population. Genetic factors contribute substantially to such differences. It is however unclear if differential performance is seen across all cognitive domains such as math and language. Here we report a genome-wide association study (GWAS) of school grades in 30,982 individuals (18,495 with and 12,487 without one or more of six major psychiatric disorders) and a replication study in 4,547 individuals. GWAS of overall school performance yielded results that were highly similar to the results of a previous GWAS of educational attainment. Analyzing subject specific grades, we observed that math performance was severely affected whereas language performance (Danish and English) was relatively unaffected or enhanced in those with psychiatric disorders compared to controls. We found that the genetic variants associated with poor math performance, but better language performance were also associated with increased risk for multiple psychiatric disorders. The same variants were also associated with creativity, which we show through a polygenic score analysis of 2953 creative professionals and 164,622 controls. The results overall suggest that risk for psychiatric disorders, language ability and creativity might have overlapping genetic roots.
0

Population-Based Risk of Psychiatric Disorders Associated With Recurrent Copy Number Variants

Morteza Vaez et al.Sep 6, 2024
+34
X
S
M
Importance Recurrent copy number variants (rCNVs) have been associated with increased risk of psychiatric disorders in case-control studies, but their population-level impact is unknown. Objective To provide unbiased population-based estimates of prevalence and risk associated with psychiatric disorders for rCNVs and to compare risks across outcomes, rCNV dosage type (deletions or duplications), and locus features. Design, Setting, and Participants This genetic association study is an analysis of data from the Lundbeck Foundation Initiative for Integrative Psychiatric Research (iPSYCH) case-cohort sample of individuals born in Denmark in 1981-2008 and followed up until 2015, including (1) all individuals (n = 92 531) with a hospital discharge diagnosis of attention-deficit/hyperactivity disorder (ADHD), autism spectrum disorder (ASD), bipolar disorder, major depressive disorder (MDD), or schizophrenia spectrum disorder (SSD) and (2) a subcohort (n = 50 625) randomly drawn from the source population. Data were analyzed from January 2021 to August 2023. Exposures Carrier status of deletions and duplications at 27 autosomal rCNV loci was determined from neonatal blood samples genotyped on single-nucleotide variant microarrays. Main Outcomes and Measures Population-based rCNV prevalence was estimated with a survey model using finite population correction to account for oversampling of cases. Hazard ratio (HR) estimates and 95% CIs for psychiatric disorders were derived using weighted Cox proportional hazard models. Risks were compared across outcomes, dosage type, and locus features using generalized estimating equation models. Results A total of 3547 rCNVs were identified in 64 735 individuals assigned male at birth (53.8%) and 55 512 individuals assigned female at birth (46.2%) whose age at the end of follow-up ranged from 7.0 to 34.7 years (mean, 21.8 years). Most observed increases in rCNV-associated risk for ADHD, ASD, or SSD were moderate, and risk estimates were highly correlated across these disorders. Notable exceptions included high ASD-associated risk observed for Prader-Willi/Angelman syndrome duplications (HR, 20.8; 95% CI, 7.9-55). No rCNV was associated with increased MDD risk. Also, rCNV-associated risk was positively correlated with locus size and gene constraint but not with dosage type. Comparison with published case-control and community-based studies revealed a higher prevalence of deletions and lower associated increase in risk for several rCNVs in iPSYCH2015. Conclusions and Relevance This study found that several rCNVs were more prevalent and conferred less risk of psychiatric disorders than estimated previously. Most case-control studies overestimate rCNV-associated risk of psychiatric disorders, likely because of selection bias. In an era where genetics is increasingly being clinically applied, these results highlight the importance of population-based risk estimates for genetics-based predictions.
0
Citation2
0
Save
17

Accuracy of haplotype estimation and whole genome imputation affects complex trait analyses in complex biobanks

Vivek Appadurai et al.Oct 24, 2023
+11
M
J
V
Abstract Sample recruitment for research consortia, hospitals, biobanks, and personal genomics companies span years, necessitating genotyping in batches, using different technologies. As marker content on genotyping arrays varies systematically, integrating such datasets is non-trivial and its impact on haplotype estimation (phasing) and whole genome imputation, necessary steps for complex trait analysis, remains under-evaluated. Using the iPSYCH consortium dataset, comprising 130,438 individuals, genotyped in two stages, on different arrays, we evaluated phasing and imputation performance across multiple phasing methods and data integration protocols. While phasing accuracy varied both by choice of method and data integration protocol, imputation accuracy varied mostly between data integration protocols. We demonstrate an attenuation in imputation accuracy within samples of non-European origin, highlighting challenges to studying complex traits in diverse populations. Finally, imputation errors can modestly bias association tests and reduce predictive utility of polygenic scores. This is the largest, most comprehensive comparison of data integration approaches in the context of a large psychiatric biobank.
0

Genome-wide association study of suicide attempt in psychiatric disorders identifies association with major depression polygenic risk scores

Niamh Mullins et al.May 7, 2020
+111
A
T
N
Objective: Over 90% of suicide attempters have a psychiatric diagnosis, however twin and family studies suggest that the genetic etiology of suicide attempt (SA) is partially distinct from that of the psychiatric disorders themselves. Here, we present the largest genome-wide association study (GWAS) on suicide attempt using major depressive disorder (MDD), bipolar disorder (BIP) and schizophrenia (SCZ) cohorts from the Psychiatric Genomics Consortium. Method: Samples comprise 1622 suicide attempters and 8786 non-attempters with MDD, 3264 attempters and 5500 non-attempters with BIP and 1683 attempters and 2946 non-attempters with SCZ. SA GWAS were performed comparing attempters to non-attempters in each disorder followed by meta-analysis across disorders. Polygenic risk scoring investigated the genetic relationship between SA and the psychiatric disorders. Results: Three genome-wide significant loci for SA were found: one associated with SA in MDD, one in BIP, and one in the meta-analysis of SA in mood disorders. These associations were not replicated in independent mood disorder cohorts from the UK Biobank and iPSYCH. Polygenic risk scores for major depression were significantly associated with SA in MDD (P=0.0002), BIP (P=0.0006) and SCZ (P=0.0006). Conclusions: This study provides new information on genetic associations and the genetic etiology of SA across psychiatric disorders. The finding that polygenic risk scores for major depression predict suicide attempt across disorders provide a possible starting point for predictive modelling and preventative strategies. Further collaborative efforts to increase sample size hold potential to robustly identify genetic associations and gain biological insights into the etiology of suicide attempt.
0

Variants in the fetal genome near pro-inflammatory cytokine genes on 2q13 are associated with gestational duration

Xueping Liu et al.May 7, 2020
+71
L
D
X
The duration of pregnancy is influenced by fetal and maternal genetic and non-genetic factors. We conducted a fetal genome-wide association meta-analysis of gestational duration, and early preterm, preterm, and postterm birth in 84,689 infants. One locus on chromosome 2q13 was associated with gestational duration; the association was replicated in 9,291 additional infants (combined P = 3.96 x 10-14). Analysis of 15,536 mother-child pairs showed that the association was driven by fetal rather than maternal genotype. Functional experiments showed that the lead SNP, rs7594852, alters the binding of the HIC1 transcriptional repressor. Genes at the locus include several interleukin 1 family members with roles in pro-inflammatory pathways that are central to the process of parturition. Further understanding of the underlying mechanisms will be of great public health importance, since giving birth either before or after the window of term gestation is associated with increased morbidity and mortality.
78

Phenotype integration improves power and preserves specificity in biobank-based genetic studies of MDD

Andy Dahl et al.Oct 24, 2023
+10
U
M
A
Abstract Biobanks often contain several phenotypes relevant to a given disorder, and researchers face complex tradeoffs between shallow phenotypes (high sample size, low specificity and sensitivity) and deep phenotypes (low sample size, high specificity and sensitivity). Here, we study an extreme case: Major Depressive Disorder (MDD) in UK Biobank. Previous studies found that shallow and deep MDD phenotypes have qualitatively distinct genetic architectures, but it remains unclear which are optimal for scientific study or clinical prediction. We propose a new framework to get the best of both worlds by integrating together information across hundreds of MDD-relevant phenotypes. First, we use phenotype imputation to increase sample size for the deepest available MDD phenotype, which dramatically improves GWAS power (increases #loci ~10 fold) and PRS accuracy (increases R2 ~2 fold). Further, we show the genetic architecture of the imputed phenotype remains specific to MDD using genetic correlation, PRS prediction in external clinical cohorts, and a novel PRS-based pleiotropy metric. We also develop a complementary approach to improve specificity of GWAS on shallow MDD phenotypes by adjusting for phenome-wide PCs. Finally, we study phenotype integration at the level of GWAS summary statistics, which can increase GWAS and PRS power but introduces non-MDD-specific signals. Our work provides a simple and scalable recipe to improve genetic studies in large biobanks by combining the sample size of shallow phenotypes with the sensitivity and specificity of deep phenotypes.
78
0
Save
0

Spatial gene-by-environment mapping for schizophrenia reveals locale of upbringing effects beyond urban-rural differences

Chun Fan et al.May 7, 2020
+10
V
J
C
Identification of mechanisms underlying the incidence of psychiatric disorders has been hampered by the difficulty in discovering highly-predictive environmental risk factors. For example, prior efforts have failed to establish environmental effects predicting geospatial clustering of schizophrenia incidence beyond urban-rural differences. Here, we employ a novel statistical framework for decomposing the geospatial risk for schizophrenia based on locale of upbringing (place of residence, ages 0-7 years) and its synergistic effects with genetic liabilities (polygenic risk for schizophrenia). We use this statistical framework to analyze unprecedented geolocation and genotyping data in a case-cohort study of n=24,028 subjects, drawn from the 1.47 million Danish persons born between 1981 and 2005. Using this framework we estimate the effects of upbringing locale (E) and gene-by-locale interactions (GxE). After controlling for potential confounding variables, upbringing at high-risk locales increases the risk for schizophrenia on average by 122%, while GxE modulates genetic risk for schizophrenia on average by 78%. Within the boundaries of Copenhagen (the largest and most densely populated city of Denmark) specific locales vary substantially in their E and GxE effects, with hazard ratios ranging from 0.26 to 9.26 for E and from 0.20 to 5.95 for GxE. This study provides insight into the degree of geospatial clustering of schizophrenia risk, and our novel analytic procedure provides a framework for decomposing variation in geospatial risk into G, E, and GxE components.
Load More