CF
Christian Fuchsberger
Author with expertise in Genomic Studies and Association Analyses
Institute for Biomedicine, Eurac Research, Innsbruck Medical University
+ 8 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
17
(35% Open Access)
Cited by:
23
h-index:
59
/
i10-index:
111
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
0

The Trans-Ancestral Genomic Architecture of Glycaemic Traits

Ji Chen et al.May 30, 2024
+405
G
C
J
Abstract Glycaemic traits are used to diagnose and monitor type 2 diabetes, and cardiometabolic health. To date, most genetic studies of glycaemic traits have focused on individuals of European ancestry. Here, we aggregated genome-wide association studies in up to 281,416 individuals without diabetes (30% non-European ancestry) with fasting glucose, 2h-glucose post-challenge, glycated haemoglobin, and fasting insulin data. Trans-ancestry and single-ancestry meta-analyses identified 242 loci (99 novel; P <5×10 -8 ), 80% with no significant evidence of between-ancestry heterogeneity. Analyses restricted to European ancestry individuals with equivalent sample size would have led to 24 fewer new loci. Compared to single-ancestry, equivalent sized trans-ancestry fine-mapping reduced the number of estimated variants in 99% credible sets by a median of 37.5%. Genomic feature, gene-expression and gene-set analyses revealed distinct biological signatures for each trait, highlighting different underlying biological pathways. Our results increase understanding of diabetes pathophysiology by use of trans-ancestry studies for improved power and resolution.
43

South Asian Patient Population Genetics Reveal Strong Founder Effects and High Rates of Homozygosity – New Resources for Precision Medicine

Jeffrey Wall et al.Oct 24, 2023
+35
R
J
J
Abstract Population-scale genetic studies can identify drug targets and allow disease risk to be predicted with resulting benefit for management of individual health risks and system-wide allocation of health care delivery resources. Although population-scale projects are underway in many parts of the world, genetic variation between population groups means that additional projects are warranted. South Asia has a population whose genetics is the least characterized of any of the world’s major populations. Here we describe GenomeAsia studies that characterize population structure in South Asia and that create tools for economical and accurate genotyping at population-scale. Prior work on population structure characterized isolated population groups, the relevance of which to large-scale studies of disease genetics is unclear. For our studies we used whole genome sequence information from 4,807 individuals recruited in the health care delivery systems of Pakistan, India and Bangladesh to ensure relevance to population-scale studies of disease genetics. We combined this with WGS data from 927 individuals from isolated South Asian population groups, and developed a custom SNP array (called SARGAM) that is optimized for future human genetic studies in South Asia. We find evidence for high rates of reproductive isolation, endogamy and consanguinity that vary across the subcontinent and that lead to levels of homozygosity that approach 100 times that seen in outbred populations. We describe founder effects that increase the power to associate functional variants with disease processes and that make South Asia a uniquely powerful place for population-scale genetic studies.
43
Citation3
0
Save
57

A multi-layer functional genomic analysis to understand noncoding genetic variation in lipids

Shweta Ramdas et al.Oct 24, 2023
+532
S
J
S
Abstract A major challenge of genome-wide association studies (GWAS) is to translate phenotypic associations into biological insights. Here, we integrate a large GWAS on blood lipids involving 1.6 million individuals from five ancestries with a wide array of functional genomic datasets to discover regulatory mechanisms underlying lipid associations. We first prioritize lipid-associated genes with expression quantitative trait locus (eQTL) colocalizations, and then add chromatin interaction data to narrow the search for functional genes. Polygenic enrichment analysis across 697 annotations from a host of tissues and cell types confirms the central role of the liver in lipid levels, and highlights the selective enrichment of adipose-specific chromatin marks in high-density lipoprotein cholesterol and triglycerides. Overlapping transcription factor (TF) binding sites with lipid-associated loci identifies TFs relevant in lipid biology. In addition, we present an integrative framework to prioritize causal variants at GWAS loci, producing a comprehensive list of candidate causal genes and variants with multiple layers of functional evidence. Two prioritized genes, CREBRF and RRBP1 , show convergent evidence across functional datasets supporting their roles in lipid biology.
1

Performing highly parallelized and reproducible GWAS analysis on biobank-scale data

Sebastian Schönherr et al.Oct 24, 2023
+6
S
J
S
Abstract Motivation Genome-wide association studies (GWAS) in large biobanks are transforming genetic research and enable the detection of novel genotype-phenotype relationships. In the last two decades, over 60,000 genetic associations across thousands of human diseases and traits have been discovered using a GWAS approach. Due to denser genotyping and increasing sample sizes, researchers are increasingly faced with computational challenges when executing GWAS analysis. A reproducible, modular and extensible pipeline with a focus on parallelization is essential to simplify data analysis and to allow researchers to devote their time to other essential tasks such as result interpretation and downstream analysis. Results Here we present nf-gwas, a Nextflow pipeline to run biobank-scale GWAS analysis. The pipeline automatically performs numerous pre- and post-processing steps, integrates regression modeling from the REGENIE package and currently supports single-variant, gene-based and interaction testing. nf-gwas also includes an extensive reporting functionality that allows to inspect thousands of phenotypes and navigate interactive Manhattan plots directly in the web browser. The pipeline is extensively tested using the unit-style testing framework nf-test to ensure code maintainability, a crucial requirement in clinical and pharmaceutical settings. Furthermore, we validated the pipeline against published GWAS datasets and benchmarked the pipeline on high-performance computing and cloud infrastructures to provide cost estimations to end users. Availability nf-gwas is free available at https://github.com/genepi/nf-gwas . Contact lukas.forer@i-med.ac.at
1
Paper
Citation1
0
Save
0

Sequencing and Imputation in GWAS: Cost-Effective Strategies to Increase Power and Genomic Coverage Across Diverse Populations

Corbin Quick et al.May 7, 2020
+8
S
P
C
A key aim for current genome-wide association studies (GWAS) is to interrogate the full spectrum of genetic variation underlying human traits, including rare variants, across populations. Deep whole-genome sequencing is the gold standard to capture the full spectrum of genetic variation, but remains prohibitively expensive for large samples. Array genotyping interrogates a sparser set of variants, which can be used as a scaffold for genotype imputation to capture variation across a wider set of variants. However, imputation coverage and accuracy depend crucially on the reference panel size and genetic distance from the target population. Here, we consider a strategy in which a subset of study participants is sequenced and the rest array-genotyped and imputed using a reference panel that comprises the sequenced study participants and individuals from an external reference panel. We systematically assess how imputation quality and statistical power for association depend on the number of individuals sequenced and included in the reference panel for two admixed populations (African and Latino Americans) and two European population isolates (Sardinians and Finns). We develop a framework to identify powerful and cost-effective GWAS designs in these populations given current sequencing and array genotyping costs. For populations that are well-represented in current reference panels, we find that array genotyping alone is cost-effective and well-powered to detect both common- and rare-variant associations. For poorly represented populations, we find that sequencing a subset of study participants to improve imputation is often more cost-effective than array genotyping alone, and can substantially increase genomic coverage and power.
0

Loss-of-function genomic variants with impact on liver-related blood traits highlight potential therapeutic targets for cardiovascular disease

Nielsen Jb et al.May 7, 2020
+99
I
O
N
Cardiovascular diseases (CVD), and in particular cerebrovascular and ischemic heart diseases, are leading causes of death globally. Lowering circulating lipids is an important treatment strategy to reduce risk. However, some pharmaceutical mechanisms of reducing CVD may increase risk of fatty liver disease or other metabolic disorders. To identify potential novel therapeutic targets, which may reduce risk of CVD without increasing risk of metabolic disease, we focused on the simultaneous evaluation of quantitative traits related to liver function and CVD. Using a combination of low-coverage (5x) whole-genome sequencing and targeted genotyping, deep genotype imputation based on the TOPMed reference pane, and genome-wide association study (GWAS) meta-analysis, we analyzed 12 liver-related blood traits (including liver enzymes, blood lipids, and markers of iron metabolism) in up to 203,476 people from three population-based cohorts of different ancestries. We identified 88 likely causal protein-altering variants that were associated with one or more liver-related blood traits. We identified several loss-of-function (LoF) variants reducing low-density lipoprotein cholesterol (LDL-C) or risk of CVD without increased risk of liver disease or diabetes, including variants in known lipid genes (e.g. APOB, LPL). A novel LoF variant, ZNF529:p.K405X, was associated with decreased levels of LDL-C (P=1.3x10-8) but demonstrated no association with liver enzymes or non-fasting blood glucose levels. Silencing of ZNF529 in human hepatocytes resulted in upregulation of LDL receptor (LDLR) and increased LDL-C uptake in the cells, suggesting that inhibition of ZNF529 or its gene product could be used for treating hypercholesterolemia and hence reduce the risk of CVD. Taken together, we demonstrate that simultaneous consideration of multiple phenotypes and a focus on rare protein-altering variants may identify promising therapeutic targets.
0

Narrow-sense heritability estimation of complex traits using identity-by-descent information.

Luke Evans et al.May 7, 2020
+122
M
R
L
Heritability is a fundamental parameter in genetics. Traditional estimates based on family or twin studies can be biased due to shared environmental or non-additive genetic variance. Alternatively, those based on genotyped or imputed variants typically underestimate narrow-sense heritability contributed by rare or otherwise poorly-tagged causal variants. Identical-by-descent (IBD) segments of the genome share all variants between pairs of chromosomes except new mutations that have arisen since the last common ancestor. Therefore, relating phenotypic similarity to degree of IBD sharing among classically unrelated individuals is an appealing approach to estimating the near full additive genetic variance while avoiding biases that can occur when modeling close relatives. We applied an IBD-based approach (GREML-IBD) to estimate heritability in unrelated individuals using phenotypic simulation with thousands of whole genome sequences across a range of stratification, polygenicity levels, and the minor allele frequencies of causal variants (CVs). IBD-based heritability estimates were unbiased when using unrelated individuals, even for traits with extremely rare CVs, but stratification led to strong biases in IBD-based heritability estimates with poor precision. We used data on two traits in ~120,000 people from the UK Biobank to demonstrate that, depending on the trait and possible confounding environmental effects, GREML-IBD can be applied successfully to very large genetic datasets to infer the contribution of very rare variants lost using other methods. However, we observed apparent biases in this real data that were not predicted from our simulation, suggesting that more work may be required to understand factors that influence IBD-based estimates.
0

KCND3 is a novel susceptibility locus for early repolarization

Alexander Teumer et al.May 7, 2020
+48
T
T
A
The presence of an early repolarization pattern (ERP) on the surface electrocardiogram (ECG) is associated with risk of ventricular fibrillation and sudden cardiac death. Family studies have shown that ERP is a highly heritable trait but molecular genetic determinants are unknown. We assessed the ERP in 12-lead ECGs of 39,456 individuals and conducted a two-stage meta-analysis of genome-wide association studies (GWAS). In the discovery phase, we included 2,181 cases and 23,641 controls from eight European ancestry studies and identified 19 genome-wide significant (p<5E-8) variants in the KCND3 (potassium voltage gated channel subfamily D member 3) gene with a p-value of 4.6E-10. Replication of two loci in four additional studies including 1,124 cases and 12,510 controls confirmed the association at the KCND3 gene locus with a pooled odds ratio of 0.82, p=7.7E-12 (rs1545300 minor allele T). A subsequent GWAS meta-analysis combining all samples did not reveal additional loci. The lead SNP of the discovery stage (rs12090194) was in strong linkage disequilibrium with rs1545300 (r2=0.96, Dprime=1). Summary statistics based conditional analysis did not reveal any secondary signals. Co-localization analyses indicate causal effects of KCND3 gene expression levels on ERP in both the left ventricle of the heart and in tibial artery. In this study we identified for the first time a genome-wide significant association of a genetic variant with ERP. Our findings of a locus in the KCND3 gene not only provide insights into the genetic determinants but also into the pathophysiological mechanism of ERP, revealing a promising candidate for functional studies.
0

Multi-ancestry GWAS of the electrocardiographic PR interval identifies 210 loci underlying cardiac conduction

Ιωάννα Ντάλλα et al.May 7, 2020
+183
J
L
Ι
The electrocardiographic PR interval reflects atrioventricular conduction, and is associated with conduction abnormalities, pacemaker implantation, atrial fibrillation (AF), and cardiovascular mortality[1][1],[2][2]. We performed multi-ancestry (N=293,051) and European only (N=271,570) genome-wide association (GWAS) meta-analyses for the PR interval, discovering 210 loci of which 149 are novel. Variants at all loci nearly doubled the percentage of heritability explained, from 33.5% to 62.6%. We observed enrichment for genes involved in cardiac muscle development/contraction and the cytoskeleton highlighting key regulation processes for atrioventricular conduction. Additionally, 19 novel loci harbour genes underlying inherited monogenic heart diseases suggesting the role of these genes in cardiovascular pathology in the general population. We showed that polygenic predisposition to PR interval duration is an endophenotype for cardiovascular disease risk, including distal conduction disease, AF, atrioventricular pre-excitation, non-ischemic cardiomyopathy, and coronary heart disease. These findings advance our understanding of the polygenic basis of cardiac conduction, and the genetic relationship between PR interval duration and cardiovascular disease. [1]: #ref-1 [2]: #ref-2
Load More