VA
Vivek Appadurai
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(64% Open Access)
Cited by:
1,377
h-index:
20
/
i10-index:
32
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Shared molecular neuropathology across major psychiatric disorders parallels polygenic overlap

Michael Gandal et al.Feb 9, 2018
+83
N
J
M
Genes overlap across psychiatric disease Many genome-wide studies have examined genes associated with a range of neuropsychiatric disorders. However, the degree to which the genetic underpinnings of these diseases differ or overlap is unknown. Gandal et al. performed meta-analyses of transcriptomic studies covering five major psychiatric disorders and compared cases and controls to identify coexpressed gene modules. From this, they found that some psychiatric disorders share global gene expression patterns. This overlap in polygenic traits in neuropsychiatric disorders may allow for better diagnosis and treatment. Science , this issue p. 693
1
Citation920
0
Save
0

A saturated map of common genetic variants associated with human height

Loïc Yengo et al.Oct 12, 2022
+97
A
F
L
Abstract Common single-nucleotide polymorphisms (SNPs) are predicted to collectively explain 40–50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes 1 . Here, using data from a genome-wide association study of 5.4 million individuals of diverse ancestries, we show that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a mean size of around 90 kb, covering about 21% of the genome. The density of independent associations varies across the genome and the regions of increased density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs (or all SNPs in the HapMap 3 panel 2 ) account for 40% (45%) of phenotypic variance in populations of European ancestry but only around 10–20% (14–24%) in populations of other ancestries. Effect sizes, associated regions and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely to be explained by linkage disequilibrium and differences in allele frequency within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than are needed to implicate causal genes and variants. Overall, this study provides a comprehensive map of specific genomic regions that contain the vast majority of common height-associated variants. Although this map is saturated for populations of European ancestry, further research is needed to achieve equivalent saturation in other ancestries.
0
Citation370
0
Save
370

Population Genomics of Postglacial Western Eurasia

Morten Allentoft et al.May 5, 2022
+167
A
A
M
Summary Western Eurasia witnessed several large-scale human migrations during the Holocene 1–5 . To investigate the cross-continental impacts we shotgun-sequenced 317 primarily Mesolithic and Neolithic genomes from across Northern and Western Eurasia. These were imputed alongside published data to obtain diploid genotypes from >1,600 ancient humans. Our analyses revealed a ‘Great Divide’ genomic boundary extending from the Black Sea to the Baltic. Mesolithic hunter-gatherers (HGs) were highly genetically differentiated east and west of this zone, and the impact of the neolithisation was equally disparate. Large-scale ancestry shifts occurred in the west as farming was introduced, including near-total replacements of HGs in many areas, whereas no substantial ancestry shifts happened east of the zone during the same period. Similarly, relatedness decreased in the west from the Neolithic transition onwards, while east of the Urals relatedness remained high until ∼4,000 BP, consistent with persistence of localised HG groups. The boundary dissolved when Yamnaya-related ancestry spread across western Eurasia around 5,000 BP resulting in a second major turnover that reached most parts of Europe within a 1,000-year span. The genetic origin and fate of the Yamnaya have remained elusive but we demonstrate that HGs from the Middle Don region contributed ancestry to them. Yamnaya-groups later admixed with individuals associated with the Globular Amphora Culture before expanding into Europe. Similar turnovers occurred in western Siberia, where we report new genomic data from a ‘Neolithic steppe’ cline spanning the Siberian forest steppe to Lake Baikal. These prehistoric migrations had profound and lasting effects on the genetic diversity of Eurasian populations.
370
Citation28
0
Save
6

The Norwegian Mother, Father, and Child cohort study (MoBa) genotyping data resource: MoBaPsychGen pipeline v.1

Elizabeth Corfield et al.Jun 26, 2022
+24
O
N
E
Abstract Background The Norwegian Mother, Father, and Child Cohort Study (MoBa) is a population-based pregnancy cohort, which includes approximately 114,500 children, 95,200 mothers, and 75,200 fathers. Genotyping of MoBa has been conducted through multiple research projects, spanning several years; using varying selection criteria, genotyping arrays, and genotyping centres. MoBa contains numerous interrelated families, which necessitated the implementation of a family-based quality control (QC) pipeline that verifies and accounts for diverse types of relatedness. Methods The MoBaPsychGen pipeline, comprising pre-imputation QC, phasing, imputation, and post-imputation QC, was developed based on current best-practice protocols and implemented to account for the complex structure of the MoBa genotype data. The pipeline includes QC on both single nucleotide polymorphism (SNP) and individual level. Phasing and imputation were performed using the publicly available Haplotype Reference Consortium release 1.1 panel as a reference. Information from the Medical Birth Registry of Norway and MoBa questionnaires were used to identify biological sex, year of birth, reported parent-offspring (PO) relationships, and multiple births (only available in the offspring generation). Results In total, 207,569 unique individuals (90% of the unique individuals included in the study) and 6,981,748 SNPs passed the MoBaPsychGen pipeline. The relatedness checks performed throughout the pipeline allowed identification of within-generation and across-generation first-degree, second-degree, and third-degree relatives. The individuals passing post-imputation QC comprised 64,471 families ranging in size from singletons to 84 unique individuals (singletons are included as families as other family members may not have been genotyped, imputed, or passed post-imputation QC). The relationships identified include 287 monozygotic twin pairs, 22,884 full siblings, 117,004 PO pairs, 23,299 second-degree relative pairs, and 10,828 third-degree relative pairs. Discussion MoBa contains a highly complex relatedness structure, with a variety of family structures including singletons, PO duos, full (mother, father, child) PO trios, nuclear families, blended families, and extended families. The availability of robustly quality-controlled genetic data for such a large cohort with a unique extended family structure will allow many novel research questions to be addressed. Furthermore, the MoBaPsychGen pipeline has potential utility in similar cohorts.
6
Citation23
0
Save
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 10, 2022
+569
C
T
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
3
Citation16
0
Save
212

Genome-wide association study of school grades identifies a genetic overlap between language ability, psychopathology and creativity

Veera Rajagopal et al.May 10, 2020
+23
J
A
V
Abstract Individuals with psychiatric disorders perform differently in school compared to the general population. Genetic factors contribute substantially to such differences. It is however unclear if differential performance is seen across all cognitive domains such as math and language. Here we report a genome-wide association study (GWAS) of school grades in 30,982 individuals (18,495 with and 12,487 without one or more of six major psychiatric disorders) and a replication study in 4,547 individuals. GWAS of overall school performance yielded results that were highly similar to the results of a previous GWAS of educational attainment. Analyzing subject specific grades, we observed that math performance was severely affected whereas language performance (Danish and English) was relatively unaffected or enhanced in those with psychiatric disorders compared to controls. We found that the genetic variants associated with poor math performance, but better language performance were also associated with increased risk for multiple psychiatric disorders. The same variants were also associated with creativity, which we show through a polygenic score analysis of 2953 creative professionals and 164,622 controls. The results overall suggest that risk for psychiatric disorders, language ability and creativity might have overlapping genetic roots.
212
Citation10
0
Save
78

Phenotype integration improves power and preserves specificity in biobank-based genetic studies of MDD

Andy Dahl et al.Aug 15, 2022
+10
U
M
A
Abstract Biobanks often contain several phenotypes relevant to a given disorder, and researchers face complex tradeoffs between shallow phenotypes (high sample size, low specificity and sensitivity) and deep phenotypes (low sample size, high specificity and sensitivity). Here, we study an extreme case: Major Depressive Disorder (MDD) in UK Biobank. Previous studies found that shallow and deep MDD phenotypes have qualitatively distinct genetic architectures, but it remains unclear which are optimal for scientific study or clinical prediction. We propose a new framework to get the best of both worlds by integrating together information across hundreds of MDD-relevant phenotypes. First, we use phenotype imputation to increase sample size for the deepest available MDD phenotype, which dramatically improves GWAS power (increases #loci ~10 fold) and PRS accuracy (increases R2 ~2 fold). Further, we show the genetic architecture of the imputed phenotype remains specific to MDD using genetic correlation, PRS prediction in external clinical cohorts, and a novel PRS-based pleiotropy metric. We also develop a complementary approach to improve specificity of GWAS on shallow MDD phenotypes by adjusting for phenome-wide PCs. Finally, we study phenotype integration at the level of GWAS summary statistics, which can increase GWAS and PRS power but introduces non-MDD-specific signals. Our work provides a simple and scalable recipe to improve genetic studies in large biobanks by combining the sample size of shallow phenotypes with the sensitivity and specificity of deep phenotypes.
78
Citation5
0
Save
17

Accuracy of haplotype estimation and whole genome imputation affects complex trait analyses in complex biobanks

Vivek Appadurai et al.Jun 29, 2022
+12
M
J
V
Abstract Sample recruitment for research consortia, hospitals, biobanks, and personal genomics companies span years, necessitating genotyping in batches, using different technologies. As marker content on genotyping arrays varies systematically, integrating such datasets is non-trivial and its impact on haplotype estimation (phasing) and whole genome imputation, necessary steps for complex trait analysis, remains under-evaluated. Using the iPSYCH consortium dataset, comprising 130,438 individuals, genotyped in two stages, on different arrays, we evaluated phasing and imputation performance across multiple phasing methods and data integration protocols. While phasing accuracy varied both by choice of method and data integration protocol, imputation accuracy varied mostly between data integration protocols. We demonstrate an attenuation in imputation accuracy within samples of non-European origin, highlighting challenges to studying complex traits in diverse populations. Finally, imputation errors can modestly bias association tests and reduce predictive utility of polygenic scores. This is the largest, most comprehensive comparison of data integration approaches in the context of a large psychiatric biobank.
17
Citation3
0
Save
0

Population-Based Risk of Psychiatric Disorders Associated With Recurrent Copy Number Variants

Morteza Vaez et al.Jun 26, 2024
+34
M
D
M
Importance Recurrent copy number variants (rCNVs) have been associated with increased risk of psychiatric disorders in case-control studies, but their population-level impact is unknown. Objective To provide unbiased population-based estimates of prevalence and risk associated with psychiatric disorders for rCNVs and to compare risks across outcomes, rCNV dosage type (deletions or duplications), and locus features. Design, Setting, and Participants This genetic association study is an analysis of data from the Lundbeck Foundation Initiative for Integrative Psychiatric Research (iPSYCH) case-cohort sample of individuals born in Denmark in 1981-2008 and followed up until 2015, including (1) all individuals (n = 92 531) with a hospital discharge diagnosis of attention-deficit/hyperactivity disorder (ADHD), autism spectrum disorder (ASD), bipolar disorder, major depressive disorder (MDD), or schizophrenia spectrum disorder (SSD) and (2) a subcohort (n = 50 625) randomly drawn from the source population. Data were analyzed from January 2021 to August 2023. Exposures Carrier status of deletions and duplications at 27 autosomal rCNV loci was determined from neonatal blood samples genotyped on single-nucleotide variant microarrays. Main Outcomes and Measures Population-based rCNV prevalence was estimated with a survey model using finite population correction to account for oversampling of cases. Hazard ratio (HR) estimates and 95% CIs for psychiatric disorders were derived using weighted Cox proportional hazard models. Risks were compared across outcomes, dosage type, and locus features using generalized estimating equation models. Results A total of 3547 rCNVs were identified in 64 735 individuals assigned male at birth (53.8%) and 55 512 individuals assigned female at birth (46.2%) whose age at the end of follow-up ranged from 7.0 to 34.7 years (mean, 21.8 years). Most observed increases in rCNV-associated risk for ADHD, ASD, or SSD were moderate, and risk estimates were highly correlated across these disorders. Notable exceptions included high ASD-associated risk observed for Prader-Willi/Angelman syndrome duplications (HR, 20.8; 95% CI, 7.9-55). No rCNV was associated with increased MDD risk. Also, rCNV-associated risk was positively correlated with locus size and gene constraint but not with dosage type. Comparison with published case-control and community-based studies revealed a higher prevalence of deletions and lower associated increase in risk for several rCNVs in iPSYCH2015. Conclusions and Relevance This study found that several rCNVs were more prevalent and conferred less risk of psychiatric disorders than estimated previously. Most case-control studies overestimate rCNV-associated risk of psychiatric disorders, likely because of selection bias. In an era where genetics is increasingly being clinically applied, these results highlight the importance of population-based risk estimates for genetics-based predictions.
0
Citation2
0
Save
0

Variants in the fetal genome near pro-inflammatory cytokine genes on 2q13 are associated with gestational duration

Xueping Liu et al.Sep 23, 2018
+73
G
M
X
The duration of pregnancy is influenced by fetal and maternal genetic and non-genetic factors. We conducted a fetal genome-wide association meta-analysis of gestational duration, and early preterm, preterm, and postterm birth in 84,689 infants. One locus on chromosome 2q13 was associated with gestational duration; the association was replicated in 9,291 additional infants (combined P = 3.96 x 10-14). Analysis of 15,536 mother-child pairs showed that the association was driven by fetal rather than maternal genotype. Functional experiments showed that the lead SNP, rs7594852, alters the binding of the HIC1 transcriptional repressor. Genes at the locus include several interleukin 1 family members with roles in pro-inflammatory pathways that are central to the process of parturition. Further understanding of the underlying mechanisms will be of great public health importance, since giving birth either before or after the window of term gestation is associated with increased morbidity and mortality.
Load More