ZK
Zoltán Kutalik
Author with expertise in Genomic Studies and Association Analyses
University of Lausanne, SIB Swiss Institute of Bioinformatics, Centro Universitário Filadélfia
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
45
(49% Open Access)
Cited by:
93
h-index:
96
/
i10-index:
254
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
7

Sex- and age-dependent genetics of longevity in a heterogeneous mouse population

Maroun Sleiman et al.Sep 30, 2022
+11
A
S
M
DNA variants that modulate life span provide insight into determinants of health, disease, and aging. Through analyses in the UM-HET3 mice of the Interventions Testing Program (ITP), we detected a sex-independent quantitative trait locus (QTL) on chromosome 12 and identified sex-specific QTLs, some of which we detected only in older mice. Similar relations between life history and longevity were uncovered in mice and humans, underscoring the importance of early access to nutrients and early growth. We identified common age- and sex-specific genetic effects on gene expression that we integrated with model organism and human data to create a hypothesis-building interactive resource of prioritized longevity and body weight genes. Finally, we validated Hipk1 , Ddost , Hspg2 , Fgd6 , and Pdk1 as conserved longevity genes using Caenorhabditis elegans life-span experiments.
7
Citation32
9
Save
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
58

Correction for participation bias in the UK Biobank reveals non-negligible impact on genetic associations and downstream analyses

Tabea Schoeler et al.Oct 24, 2023
+3
E
D
T
Abstract While large-scale volunteer-based studies such as the UK Biobank (UKBB) have become the cornerstone of genetic epidemiology, the study participants are rarely representative of their target population. Here, we aim to evaluate the impact of non-random participation in the UKBB, and to pin down areas of research that are particularly susceptible to biases when using non-representative samples for genome-wide discovery. By comparing 14 harmonized characteristics of the UKBB participants to that of a representative sample, we derived a model for participation probability. We then conducted inverse probability weighted genome-wide association analyses (wGWA) on 19 UKBB traits. Comparing the output obtained from wGWA (N effective =94,643 – 102,215) to standard GWA analyses (N=263,464 – 283,749), we assessed the impact of participation bias on three estimated quantities, namely 1) genotype-phenotype associations, 2) heritability and genetic correlation estimates and 3) exposure-outcome causal effect estimates obtained from Mendelian Randomization. Participation bias can lead to both overestimation (e.g., cancer, education) and underestimation (e.g., coffee intake, depression/anxiety) of SNP effects. Novel SNPs were identified in wGWA for 12 of the included traits, highlighting SNPs missed as a result of participation bias. While the impact of participation bias on heritability estimates was small (average change in h 2 : 1.5%, maximum: 5%), substantial distortions were present for genetic correlations (average absolute change in r g : 0.07, maximum: 0.31) and Mendelian Randomization estimates (average absolute change in standardized estimates: 0.04, maximum: 0.15), most markedly for socio-behavioural traits including education, smoking and BMI. Overall, the bias mainly affected the magnitude of effects, rather than direction. In contrast, genome-wide findings for more molecular/physical traits (e.g., LDL, SBP) exhibited less bias as a result of selective participation. Our results highlight that participation bias can distort genomic findings obtained in non-representative samples, and we propose a viable solution to reduce such bias. Moving forward, more efforts ensuring either sample representativeness or correcting for participation bias are paramount, especially when investigating the genetic underpinnings of behaviour, lifestyles and social outcomes.
1

Causality-Enriched Epigenetic Age Uncouples Damage and Adaptation

Kejun Ying et al.Oct 24, 2023
+7
A
H
K
Abstract Machine learning models based on DNA methylation data can predict biological age but often lack causal insights. By harnessing large-scale genetic data through epigenome-wide Mendelian Randomization, we identified CpG sites potentially causal for aging-related traits. Neither the existing epigenetic clocks nor age-related differential DNA methylation are enriched in these sites. These CpGs include sites that contribute to aging and protect against it, yet their combined contribution negatively affects age-related traits. We established a novel framework to introduce causal information into epigenetic clocks, resulting in DamAge and AdaptAge—clocks that track detrimental and adaptive methylation changes, respectively. DamAge correlates with adverse outcomes, including mortality, while AdaptAge is associated with beneficial adaptations. These causality-enriched clocks exhibit sensitivity to short-term interventions. Our findings provide a detailed land-scape of CpG sites with putative causal links to lifespan and healthspan, facilitating the development of aging biomarkers, assessing interventions, and studying reversibility of age-associated changes.
1
Citation10
0
Save
0

Improved imputation of summary statistics for admixed populations

Sina Ruëger et al.May 7, 2020
Z
A
S
Abstract Motivation Summary statistics imputation can be used to infer association summary statistics of an already conducted, genotype-based meta-analysis to higher ge-nomic resolution. This is typically needed when genotype imputation is not feasible for some cohorts. Oftentimes, cohorts of such a meta-analysis are variable in terms of (country of) origin or ancestry. This violates the assumption of current methods that an external LD matrix and the covariance of the Z-statistics are identical. Results To address this issue, we present variance matching, an extention to the existing summary statistics imputation method, which manipulates the LD matrix needed for summary statistics imputation . Based on simulations using real data we find that accounting for ancestry admixture yields noticeable improvement only when the total reference panel size is > 1000. We show that for population specific variants this effect is more pronounced with increasing F ST .
46

Genetic insights into the causal relationship between physical activity and cognitive functioning

Boris Cheval et al.Oct 24, 2023
+6
K
L
B
Abstract Physical activity and cognitive functioning are strongly intertwined. However, the causal relationships underlying this association are still unclear. Physical activity can enhance brain functions, but healthy cognition may also promote engagement in physical activity. Here, we assessed the bidirectional relationships between physical activity and general cognitive functioning using Latent Heritable Confounder Mendelian Randomization (LHC-MR). Association data were drawn from two large-scale genome-wide association studies (UK Biobank and COGENT) on accelerometer-measured moderate, vigorous, and average physical activity (N = 91,084) and cognitive functioning (N = 257,841). After Bonferroni correction, we observed significant LHC-MR associations suggesting that increased fraction of both moderate (b = 0.32, CI 95% = [0.17,0.47], P = 2.89e-05) and vigorous physical activity (b = 0.22, CI 95% = [0.06,0.37], P = 0.007) lead to increased cognitive functioning. In contrast, we found no evidence of a causal effect of average physical activity on cognitive functioning, and no evidence of a reverse causal effect (cognitive functioning on any physical activity measures). These findings provide new evidence supporting a beneficial role of moderate and vigorous physical activity (MVPA) on cognitive functioning.
0

The Trans-Ancestral Genomic Architecture of Glycaemic Traits

Ji Chen et al.May 30, 2024
+405
G
C
J
Abstract Glycaemic traits are used to diagnose and monitor type 2 diabetes, and cardiometabolic health. To date, most genetic studies of glycaemic traits have focused on individuals of European ancestry. Here, we aggregated genome-wide association studies in up to 281,416 individuals without diabetes (30% non-European ancestry) with fasting glucose, 2h-glucose post-challenge, glycated haemoglobin, and fasting insulin data. Trans-ancestry and single-ancestry meta-analyses identified 242 loci (99 novel; P <5×10 -8 ), 80% with no significant evidence of between-ancestry heterogeneity. Analyses restricted to European ancestry individuals with equivalent sample size would have led to 24 fewer new loci. Compared to single-ancestry, equivalent sized trans-ancestry fine-mapping reduced the number of estimated variants in 99% credible sets by a median of 37.5%. Genomic feature, gene-expression and gene-set analyses revealed distinct biological signatures for each trait, highlighting different underlying biological pathways. Our results increase understanding of diabetes pathophysiology by use of trans-ancestry studies for improved power and resolution.
0

The role of gene expression on human sexual dimorphism: too early to call

Eleonora Porcu et al.May 7, 2020
+5
K
A
E
Abstract The genetic underpinning of sexual dimorphism is very poorly understood. The prevalence of many diseases differs between men and women, which could be in part caused by sex-specific genetic effects. Nevertheless, only a few published genome-wide association studies (GWAS) were performed separately in each sex. The reported enrichment of expression quantitative trait loci (eQTLs) among GWAS–associated SNPs suggests a potential role of sex-specific eQTLs in the sex-specific genetic mechanism underlying complex traits. To explore this scenario, we performed a genome-wide analysis of sex-specific whole blood RNA-seq eQTLs from 3,447 individuals. Among 9 million SNP-gene pairs showing sex-combined associations, we found 18 genes with significant sex-specific cis -eQTLs (FDR 5%). Our phenome-wide association study of the 18 top sex-specific eQTLs on >700 traits unraveled that these eQTLs do not systematically translate into detectable sex-specific trait-associations. Power analyses using real eQTL- and causal effect sizes showed that millions of samples would be necessary to observe sex-specific trait associations that are fully driven by sex-specific cis -eQTLs. Compensatory effects may further hamper their detection. In line with this observation, we confirmed that the sex-specific trait-associations detected so far are not driven by sex-specific cis -eQTLs.
1

Polynomial Mendelian Randomization reveals widespread non-linear causal effects in the UK Biobank

Jonathan Sulc et al.Oct 24, 2023
Z
J
J
Abstract Causal inference is a critical step in improving our understanding of biological processes and Mendelian randomisation (MR) has emerged as one of the foremost methods to efficiently interrogate diverse hypotheses using large-scale, observational data from biobanks. Although many extensions have been developed to address the three core assumptions of MR-based causal inference (relevance, exclusion restriction, and exchangeability), most approaches implicitly assume that any putative causal effect is linear. Here we propose PolyMR, an MR-based method which provides a polynomial approximation of an (arbitrary) causal function between an exposure and an outcome. We show that this method provides accurate inference of the shape and magnitude of causal functions with greater accuracy than existing methods. We applied this method to data from the UK Biobank, testing for effects between anthropometric traits and continuous health-related phenotypes and found most of these (84%) to have causal effects which deviate significantly from linear. These deviations ranged from slight attenuation at the extremes of the exposure distribution, to large changes in the magnitude of the effect across the range of the exposure (e.g. a 1 kg/m 2 change in BMI having stronger effects on glucose levels if the initial BMI was higher), to non-monotonic causal relationships (e.g. the effects of BMI on cholesterol forming an inverted U shape). Finally, we show that the linearity assumption of the causal effect may lead to the misinterpretation of health risks at the individual level or heterogeneous effect estimates when using cohorts with differing average exposure levels.
0

Evidence that lower socioeconomic position accentuates genetic susceptibility to obesity

Jessica Tyrrell et al.May 7, 2020
+14
R
A
J
Abstract Susceptibility to obesity in today’s environment has a strong genetic component. Lower socioeconomic position (SEP) is associated with a higher risk of obesity but it is not known if it accentuates genetic susceptibility to obesity. We aimed to use up to 120,000 individuals from the UK Biobank study to test the hypothesis that measures of socioeconomic position accentuate genetic susceptibility to obesity. We used the Townsend deprivation index (TDI) as the main measure of socioeconomic position, and a 69-variant genetic risk score (GRS) as a measure of genetic susceptibility to obesity. We also tested the hypothesis that interactions between BMI genetics and socioeconomic position would result in evidence of interaction with individual measures of the obesogenic environment and behaviours that correlate strongly with socioeconomic position, even if they have no obesogenic role. These measures included self-reported TV watching, diet and physical activity, and an objective measure of activity derived from accelerometers. We performed several negative control tests, including a simulated environment correlated with BMI but not TDI, and sun protection use. We found evidence of gene-environment interactions with TDI (P interaction =3×10 −10 ) such that, within the group of 50% living in the most relatively deprived situations, carrying 10 additional BMI-raising alleles was associated with approximately 3.8 kg extra weight in someone 1.73m tall. In contrast, within the group of 50% living in the least deprivation, carrying 10 additional BMI-raising alleles was associated with approximately 2.9 kg extra weight. We also observed evidence of interaction between sun protection use and BMI genetics, suggesting that residual confounding may result in evidence of non-causal interactions. Our findings provide evidence that relative social deprivation best captures aspects of the obesogenic environment that accentuate the genetic predisposition to obesity in the UK.
Load More