JP
Jean‐Baptiste Pingault
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(38% Open Access)
Cited by:
85
h-index:
33
/
i10-index:
61
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
200

Within-sibship GWAS improve estimates of direct genetic effects

Laurence Howe et al.Mar 7, 2021
Abstract Estimates from genome-wide association studies (GWAS) represent a combination of the effect of inherited genetic variation (direct effects), demography (population stratification, assortative mating) and genetic nurture from relatives (indirect genetic effects). GWAS using family-based designs can control for demography and indirect genetic effects, but large-scale family datasets have been lacking. We combined data on 159,701 siblings from 17 cohorts to generate population (between-family) and within-sibship (within-family) estimates of genome-wide genetic associations for 25 phenotypes. We demonstrate that existing GWAS associations for height, educational attainment, smoking, depressive symptoms, age at first birth and cognitive ability overestimate direct effects. We show that estimates of SNP-heritability, genetic correlations and Mendelian randomization involving these phenotypes substantially differ when calculated using within-sibship estimates. For example, genetic correlations between educational attainment and height largely disappear. In contrast, analyses of most clinical phenotypes (e.g. LDL-cholesterol) were generally consistent between population and within-sibship models. We also report compelling evidence of polygenic adaptation on taller human height using within-sibship data. Large-scale family datasets provide new opportunities to quantify direct effects of genetic variation on human traits and diseases.
200
Citation65
0
Save
58

Correction for participation bias in the UK Biobank reveals non-negligible impact on genetic associations and downstream analyses

Tabea Schoeler et al.Sep 28, 2022
Abstract While large-scale volunteer-based studies such as the UK Biobank (UKBB) have become the cornerstone of genetic epidemiology, the study participants are rarely representative of their target population. Here, we aim to evaluate the impact of non-random participation in the UKBB, and to pin down areas of research that are particularly susceptible to biases when using non-representative samples for genome-wide discovery. By comparing 14 harmonized characteristics of the UKBB participants to that of a representative sample, we derived a model for participation probability. We then conducted inverse probability weighted genome-wide association analyses (wGWA) on 19 UKBB traits. Comparing the output obtained from wGWA (N effective =94,643 – 102,215) to standard GWA analyses (N=263,464 – 283,749), we assessed the impact of participation bias on three estimated quantities, namely 1) genotype-phenotype associations, 2) heritability and genetic correlation estimates and 3) exposure-outcome causal effect estimates obtained from Mendelian Randomization. Participation bias can lead to both overestimation (e.g., cancer, education) and underestimation (e.g., coffee intake, depression/anxiety) of SNP effects. Novel SNPs were identified in wGWA for 12 of the included traits, highlighting SNPs missed as a result of participation bias. While the impact of participation bias on heritability estimates was small (average change in h 2 : 1.5%, maximum: 5%), substantial distortions were present for genetic correlations (average absolute change in r g : 0.07, maximum: 0.31) and Mendelian Randomization estimates (average absolute change in standardized estimates: 0.04, maximum: 0.15), most markedly for socio-behavioural traits including education, smoking and BMI. Overall, the bias mainly affected the magnitude of effects, rather than direction. In contrast, genome-wide findings for more molecular/physical traits (e.g., LDL, SBP) exhibited less bias as a result of selective participation. Our results highlight that participation bias can distort genomic findings obtained in non-representative samples, and we propose a viable solution to reduce such bias. Moving forward, more efforts ensuring either sample representativeness or correcting for participation bias are paramount, especially when investigating the genetic underpinnings of behaviour, lifestyles and social outcomes.
58
Citation18
0
Save
0

Thepfactor: Genetic analyses support a general dimension of psychopathology in childhood and adolescence

Andrea Allegrini et al.Mar 28, 2019
Abstract Background Diverse behaviour problems in childhood correlate phenotypically, suggesting a general dimension of psychopathology that has been called the p factor. The shared genetic architecture between childhood psychopathology traits also supports a genetic p. This study systematically investigates the manifestation of this common dimension across self-, parent- and teacher-rated measures in childhood and adolescence. Methods The sample included 7,026 twin pairs from the Twins Early Development Study (TEDS). First, we employed multivariate twin models to estimate common genetic and environmental influences on p based on diverse measures of behaviour problems rated by children, parents and teachers at ages 7, 9, 12 and 16 (depressive symptoms, emotional problems, peer problems, autistic symptoms, hyperactivity, antisocial, conduct and psychopathic symptoms). Second, to assess the stability of genetic and environmental influences on p across time, we conducted longitudinal twin modelling of the first phenotypic principal components of childhood psychopathological measures across each of the four ages. Third, we created a genetic p factor in 7,026 unrelated genotyped individuals based on eight polygenic scores for adult psychiatric disorders to estimate how a general polygenic predisposition to adult psychiatric disorders relates to childhood p. Results Behaviour problems were consistently correlated phenotypically and genetically across ages and raters. The p factor is substantially heritable (50-60%), and manifests consistently across diverse ages and raters. Genetic correlations of p components across childhood and adolescence suggest stability over time (49-78%). A polygenic general psychopathology factor, derived from studies of adult psychiatric disorders consistently predicted a general phenotypic p factor across development. Conclusions Diverse forms of psychopathology consistently load on a common p factor, which is highly heritable. There are substantial genetic influences on the stability of p across childhood. Our analyses indicate genetic overlap between general risk for psychiatric disorders in adulthood and p in childhood, even as young as age 7. The p factor has far-reaching implications for genomic research and, eventually, for diagnosis and treatment of behaviour problems.
0
Citation2
0
Save
0

Estimating the sensitivity of associations between risk factors and outcomes to shared genetic effects

Jean‐Baptiste Pingault et al.Mar 30, 2019
Objective: Countless associations between risk factors and outcomes are reported in epidemiological research, but often without estimating the contribution from genetics. However most outcomes and risk factors are substantially heritable, and genetic influences can confound these associations. Here we propose a two-stage approach for evaluating the role of shared genetic effects in explaining these observed associations. Method: Genotyped unrelated participants from the Twins Early Development Study are included (N from 3,663 to 4,693 depending on the outcome) in our analyses. As an example for our proposed approach, we focus on maternal educational attainment, a risk factor known to associate with a variety of offspring social and health outcomes, including child educational achievement, Body Mass Index, and Attention Deficit Hyperactivity Disorders (ADHD). In the first stage of our approach we estimate how much of the phenotypic associations between maternal education and child outcomes can be attributed to shared genetic effects via regressions controlling for increasingly powerful polygenic scores. In the second stage, we estimate shared genetic effects using heritability estimates and genetic correlations equal to those derived in both SNP-based and twin-based studies. Finally, evidence from the two stages are evaluated in conjunction to provide an overall assessment of the likelihood that the association is explained by genetics. Results: Associations between maternal education and the three developmental outcomes are highly significant. The magnitude of these associations decrease when using polygenic scores to account for shared genetic effects, explaining between 14.3% and 24.3% of the original associations. For the three outcomes, the magnitude of these associations further decrease under a SNP-based heritability scenario and are almost entirely or entirely explained by genetics under a twin-based heritability scenario. Conclusions: Observed association between maternal education and child educational attainment, BMI and ADHD symptoms may be largely explained by genetics. To the extent that available estimates of SNP-based and twin-based heritabilities are accurate, the present findings represent a call for caution when interpreting non-genetically informed epidemiology studies of the role of maternal education or other 'environmental' risk factors. The two-stage approach that we propose adds a new tool to probe the robustness of findings regarding the role of a range of risk factors. Our approach, akin to a genetically informed sensitivity analysis, only requires a genotyped cohort with adequate phenotypic measurements, and has the potential to be widely applied across the life and social sciences.
1

Identifying Potential Causal Risk Factors for Self-Harm: A Polygenic Risk Scoring and Mendelian Randomisation Approach

Kai Lim et al.Jun 21, 2019
Background: Multiple individual vulnerabilities and traits are phenotypically associated with suicidal and non-suicidal self-harm. However, associations between these risk factors and self-harm are subject to confounding. We implemented genetically informed methods to better identify individual risk factors for self-harm. Methods: Using genotype data and online Mental Health Questionnaire responses in the UK Biobank sample (N = 125,925), polygenic risk scores (PRS) were generated to index 24 plausible individual risk factors for self-harm in the following domains: mental health vulnerabilities, substance use phenotypes, cognitive traits, personality traits and physical traits. PRS were entered as predictors in binomial regression models to predict self-harm. Multinomial regressions were used to model suicidal and non-suicidal self-harm. To further probe the causal nature of these relationships, two-sample Mendelian Randomisation (MR) analyses were conducted for significant risk factors identified in PRS analyses. Outcomes: Self-harm was predicted by PRS indexing six individual risk factors, which are major depressive disorder (MDD), attention deficit/hyperactivity disorder (ADHD), bipolar disorder, schizophrenia, alcohol dependence disorder (ALC) and lifetime cannabis use. Effect sizes ranged from β = 0.044 (95% CI: 0.016 to 0.152) for PRS for lifetime cannabis use, to β = 0.179 (95% CI: 0.152 to 0.207) for PRS for MDD. No systematic distinctions emerged between suicidal and non-suicidal self-harm. In follow-up MR analyses, MDD, ADHD and schizophrenia emerged as plausible causal risk factors for self-harm. Interpretation: Among a range of potential risk factors leading to self-harm, core predictors were found among psychiatric disorders. In addition to MDD, liabilities for schizophrenia and ADHD increased the risk for self-harm. Detection and treatment of core symptoms of these conditions, such as psychotic or impulsivity symptoms, may benefit self-harming patients.
0

Identifying risk factors involved in the common versus specific liabilities to substance abuse: A genetically informed approach

Eleonora Iob et al.Apr 5, 2019
The co-occurrence of abuse of multiple substances is thought to stem from a common liability that is partly genetic in origin. Genetic risk may indirectly contribute to a common liability through genetically influenced individual vulnerabilities and traits. To disentangle the aetiology of common versus specific liabilities to substance abuse, polygenic scores can be used as genetic proxies indexing such risk and protective individual vulnerabilities or traits. In this study, we used genomic data from a UK birth cohort study (ALSPAC, N=4218) to generate 18 polygenic scores indexing mental health vulnerabilities, personality traits, cognition, physical traits, and substance abuse. Common and substance-specific factors were identified based on four classes of substance abuse (alcohol, cigarettes, cannabis, other illicit substances) assessed over time (age 17, 20, and 22). In multivariable regressions, we then tested the independent contribution of selected polygenic scores to the common and substance-specific factors. Our findings implicated several genetically influenced traits and vulnerabilities in the common liability to substance abuse, most notably risk taking (bstandardized = 0.14; 95%CI: 0.10,0.17), followed by extraversion (bstandardized =-0.10; 95%CI: - 0.13,-0.06), and schizophrenia risk (bstandardized = 0.06; 95%CI: 0.02;0.09). Educational attainment (EA) and body mass index (BMI) had opposite effects on substance-specific liabilities such as cigarettes (bstandardized-EA = -0.15; 95%CI: -0.19,-0.12; bstandardized-BMI = 0.05; 95%CI: 0.02,0.09), alcohol (bstandardized-EA = 0.07; 95%CI: 0.03,0.11; bstandardized-BMI = -0.06; 95%CI: -0.10,-0.02), and other illicit substances (bstandardized-EA = 0.12; 95%CI: 0.07,0.17; bstandardized-BMI = -0.08; 95%CI:-0.13,-0.04). This is the first study based on genomic data that clarifies the aetiological architecture underlying the common versus substance-specific liabilities, providing novel insights for the prevention and treatment of substance abuse.
0

Comparing within- and between-family polygenic score prediction

Saskia Selzam et al.Apr 10, 2019
Polygenic scores are a popular tool for prediction of complex traits. However, prediction estimates in samples of unrelated participants can include effects of population stratification, assortative mating and environmentally mediated parental genetic effects, a form of genotype-environment correlation (rGE). Comparing genome-wide polygenic score (GPS) predictions in unrelated individuals with predictions between siblings in a within-family design is a powerful approach to identify these different sources of prediction. Here, we compared within- to between-family GPS predictions of eight life outcomes (anthropometric, cognitive, personality and health) for eight corresponding GPSs. The outcomes were assessed in up to 2,366 dizygotic (DZ) twin pairs from the Twins Early Development Study from age 12 to age 21. To account for family clustering, we used mixed-effects modelling, simultaneously estimating within- and between-family effects for target- and cross-trait GPS prediction of the outcomes. There were three main findings: (1) DZ twin GPS differences predicted DZ differences in height, BMI, intelligence, educational achievement and ADHD symptoms; (2) target and cross-trait analyses indicated that GPS prediction estimates for cognitive traits (intelligence and educational achievement) were on average 60% greater between families than within families, but this was not the case for non-cognitive traits; and (3) this within- and between-family difference for cognitive traits disappeared after controlling for family socio-economic status (SES), suggesting that SES is a source of between-family prediction through rGE mechanisms. These results provide novel insights into the patterns by which rGE contributes to GPS prediction, while ruling out confounding due to population stratification and assortative mating.
0

Genomic prediction of cognitive traits in childhood and adolescence

Andrea Allegrini et al.Sep 17, 2018
Recent advances in genomics are producing powerful DNA predictors of complex traits, especially cognitive abilities. Here, we leveraged summary statistics from the most recent genome-wide association studies of intelligence and educational attainment to build prediction models of general cognitive ability and educational achievement. To this end, we compared the performances of multi-trait genomic and polygenic scoring methods. In a representative UK sample of 7,026 children at age 12 and 16, we show that we can now predict up to 11 percent of the variance in intelligence and 16 percent in educational achievement. We also show that predictive power increases from age 12 to age 16 and that genomic predictions do not differ for girls and boys. Multivariate genomic methods were effective in boosting predictive power and, even though prediction accuracy varied across polygenic scores approaches, results were similar using different multivariate and polygenic score methods. Polygenic scores for educational attainment and intelligence are the most powerful predictors in the behavioural sciences and exceed predictions that can be made from parental phenotypes such as educational attainment and occupational status.