DB
Dorret Boomsma
Author with expertise in Genomic Studies and Association Analyses
Vrije Universiteit Amsterdam, Public Health Service of Amsterdam, Center for Human Reproduction
+ 27 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
58
(29% Open Access)
Cited by:
97
h-index:
184
/
i10-index:
1238
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
2

Functional genomics analysis identifies T and NK cell activation as a driver of epigenetic clock progression

Thomas Jonkman et al.Jan 31, 2022
+9
R
K
T
Abstract Background Epigenetic clocks use DNA methylation (DNAm) levels of specific sets of CpG dinucleotides to accurately predict individual chronological age. A popular application of these clocks is to explore whether the deviation of predicted age from chronological age is associated with disease phenotypes, where this deviation is interpreted as a potential biomarker of biological age. This wide application, however, contrasts with the limited insight in the processes that may drive the running of epigenetic clocks. Results We perform a functional genomics analysis on four epigenetic clocks, including Hannum’s blood predictor and Horvath’s multi-tissue predictor, using blood DNA methylome and transcriptome data from 3132 individuals. The four clocks result in similar predictions of individual chronological age, and their constituting CpGs are correlated in DNAm level and are enriched for similar histone modifications and chromatin states. Interestingly, DNAm levels of CpGs from the clocks are commonly associated with gene expression in trans . The gene sets involved are highly overlapping and enriched for T cell processes. Further analysis of the transcriptome and methylome of sorted blood cell types identifies differences in DNAm between naive and activated T and NK cells as a probable contributor to the clocks. Indeed, within the same donor, the four epigenetic clocks predict naive cells to be up to 40 years younger than activated cells. Conclusions The ability of epigenetic clocks to predict chronological age involves their ability to detect changes in proportions of naive and activated immune blood cells, an established feature of immuno-senescence. This finding may contribute to the interpretation of associations between clock-derived measures and age-related health outcomes.
2
Paper
Citation37
1
Save
3

Large-scale association analyses identify host factors influencing human gut microbiome composition

Alexander Kurilshikov et al.Dec 29, 2020
+100
R
C
A
Abstract To study the effect of host genetics on gut microbiome composition, the MiBioGen consortium curated and analyzed genome-wide genotypes and 16S fecal microbiome data from 18,340 individuals (24 cohorts). Microbial composition showed high variability across cohorts: only 9 out of 410 genera were detected in more than 95% samples. A genome-wide association study (GWAS) of host genetic variation in relation to microbial taxa identified 31 loci affecting microbiome at a genome-wide significant (P<5×10 −8 ) threshold. One locus, the lactase ( LCT ) gene locus, reached study-wide significance (GWAS signal P=1.28×10 −20 ), and it showed an age-dependent association with Bifidobacterium abundance. Other associations were suggestive (1.95×10 −10 <P<5×10 −8 ) but enriched for taxa showing high heritability and for genes expressed in the intestine and brain. A phenome-wide association study and Mendelian randomization identified enrichment of microbiome trait loci in the metabolic, nutrition and environment domains and suggested the microbiome has causal effects in ulcerative colitis and rheumatoid arthritis.
0

Validating biomarkers and models for epigenetic inference of alcohol consumption from blood

Silvana Maas et al.Aug 1, 2024
+23
A
A
S
Abstract Background Information on long-term alcohol consumption is relevant for medical and public health research, disease therapy, and other areas. Recently, DNA methylation-based inference of alcohol consumption from blood was reported with high accuracy, but these results were based on employing the same dataset for model training and testing, which can lead to accuracy overestimation. Moreover, only subsets of alcohol consumption categories were used, which makes it impossible to extrapolate such models to the general population. By using data from eight population-based European cohorts ( N = 4677), we internally and externally validated the previously reported biomarkers and models for epigenetic inference of alcohol consumption from blood and developed new models comprising all data from all categories. Results By employing data from six European cohorts ( N = 2883), we empirically tested the reproducibility of the previously suggested biomarkers and prediction models via ten-fold internal cross-validation. In contrast to previous findings, all seven models based on 144-CpGs yielded lower mean AUCs compared to the models with less CpGs. For instance, the 144-CpG heavy versus non-drinkers model gave an AUC of 0.78 ± 0.06, while the 5 and 23 CpG models achieved 0.83 ± 0.05, respectively. The transportability of the models was empirically tested via external validation in three independent European cohorts ( N = 1794), revealing high AUC variance between datasets within models. For instance, the 144-CpG heavy versus non-drinkers model yielded AUCs ranging from 0.60 to 0.84 between datasets. The newly developed models that considered data from all categories showed low AUCs but gave low AUC variation in the external validation. For instance, the 144-CpG heavy and at-risk versus light and non-drinkers model achieved AUCs of 0.67 ± 0.02 in the internal cross-validation and 0.61–0.66 in the external validation datasets. Conclusions The outcomes of our internal and external validation demonstrate that the previously reported prediction models suffer from both overfitting and accuracy overestimation. Our results show that the previously proposed biomarkers are not yet sufficient for accurate and robust inference of alcohol consumption from blood. Overall, our findings imply that DNA methylation prediction biomarkers and models need to be improved considerably before epigenetic inference of alcohol consumption from blood can be considered for practical applications.
0

Incorporating polygenic scores in the twin model to estimate genotype-environment covariance: exploration of statistical power

Conor Dolan et al.May 7, 2020
+2
C
R
C
Abstract The assumption in the twin model that genotypic and environmental variables are uncorrelated is primarily made to ensure parameter identification, not because researchers necessarily think that these variables are uncorrelated. Although the biasing effects of such correlations are well understood, it would be useful to be able to estimate these parameters in the twin model. Here we consider the possibility of relaxing this assumption by adding polygenic score to the (univariate) twin model. We demonstrated numerically and analytically this extension renders the additive genetic (A) – unshared environmental correlation (E) and the additive genetic (A) - shared environmental (C) correlations simultaneously identified. We studied the statistical power to detect A-C and A-E correlations in the ACE model, and to detect A-E correlation in the AE model. The results showed that the power to detect these covariance terms, given 1000 MZ and 1000 DZ twin pairs (α=0.05), depends greatly on the parameter settings of the model. We show fixing the estimated percentage of variance in the outcome trait that is due to the polygenic scores greatly increases statistical power.
0
Citation5
0
Save
0

Genome-wide association analyses of risk tolerance and risky behaviors in over 1 million individuals identify hundreds of loci and shared genetic influences1

Pietro Biroli et al.May 6, 2020
+87
S
E
P
Abstract Humans vary substantially in their willingness to take risks. In a combined sample of over one million individuals, we conducted genome-wide association studies (GWAS) of general risk tolerance, adventurousness, and risky behaviors in the driving, drinking, smoking, and sexual domains. We identified 611 approximately independent genetic loci associated with at least one of our phenotypes, including 124 with general risk tolerance. We report evidence of substantial shared genetic influences across general risk tolerance and risky behaviors: 72 of the 124 general risk tolerance loci contain a lead SNP for at least one of our other GWAS, and general risk tolerance is moderately to strongly genetically correlated ( to 0.50) with a range of risky behaviors. Bioinformatics analyses imply that genes near general-risk-tolerance-associated SNPs are highly expressed in brain tissues and point to a role for glutamatergic and GABAergic neurotransmission. We find no evidence of enrichment for genes previously hypothesized to relate to risk tolerance.
0

The Trans-Ancestral Genomic Architecture of Glycaemic Traits

Ji Chen et al.May 30, 2024
+405
G
C
J
Abstract Glycaemic traits are used to diagnose and monitor type 2 diabetes, and cardiometabolic health. To date, most genetic studies of glycaemic traits have focused on individuals of European ancestry. Here, we aggregated genome-wide association studies in up to 281,416 individuals without diabetes (30% non-European ancestry) with fasting glucose, 2h-glucose post-challenge, glycated haemoglobin, and fasting insulin data. Trans-ancestry and single-ancestry meta-analyses identified 242 loci (99 novel; P <5×10 -8 ), 80% with no significant evidence of between-ancestry heterogeneity. Analyses restricted to European ancestry individuals with equivalent sample size would have led to 24 fewer new loci. Compared to single-ancestry, equivalent sized trans-ancestry fine-mapping reduced the number of estimated variants in 99% credible sets by a median of 37.5%. Genomic feature, gene-expression and gene-set analyses revealed distinct biological signatures for each trait, highlighting different underlying biological pathways. Our results increase understanding of diabetes pathophysiology by use of trans-ancestry studies for improved power and resolution.
0

Understanding the genetic complexity of puberty timing across the allele frequency spectrum

Katherine Kentistou et al.Sep 6, 2024
+212
S
L
K
Abstract Pubertal timing varies considerably and is associated with later health outcomes. We performed multi-ancestry genetic analyses on ~800,000 women, identifying 1,080 signals for age at menarche. Collectively, these explained 11% of trait variance in an independent sample. Women at the top and bottom 1% of polygenic risk exhibited ~11 and ~14-fold higher risks of delayed and precocious puberty, respectively. We identified several genes harboring rare loss-of-function variants in ~200,000 women, including variants in ZNF483 , which abolished the impact of polygenic risk. Variant-to-gene mapping approaches and mouse gonadotropin-releasing hormone neuron RNA sequencing implicated 665 genes, including an uncharacterized G-protein-coupled receptor, GPR83 , which amplified the signaling of MC3R , a key nutritional sensor. Shared signals with menopause timing at genes involved in DNA damage response suggest that the ovarian reserve might signal centrally to trigger puberty. We also highlight body size-dependent and independent mechanisms that potentially link reproductive timing to later life disease.
0
Paper
Citation3
0
Save
0

Multivariate GWAS elucidates the genetic architecture of alcohol consumption and misuse, corrects biases, and reveals novel associations with disease

Travis Mallard et al.Jun 3, 2024
+22
E
J
T
ABSTRACT Genome-wide association studies (GWASs) of the Alcohol Use Disorder Identification Test (AUDIT), a ten-item screener for alcohol use disorder (AUD), have elucidated novel loci for alcohol consumption and misuse. However, these studies also revealed that GWASs can be influenced by numerous biases (e.g., measurement error, selection bias), which have led to inconsistent genetic correlations between alcohol involvement and AUD, as well as paradoxically negative genetic correlations between alcohol involvement and psychiatric disorders/medical conditions. To explore these unexpected differences in genetic correlations, we conducted the first item-level and largest GWAS of AUDIT items (N=160,824), and applied a multivariate framework to mitigate previous biases. In doing so, we identified novel patterns of similarity (and dissimilarity) among the AUDIT items, and found evidence of a correlated two-factor structure at the genetic level (Consumption and Problems, rg=.80). Moreover, by applying empirically-derived weights to each of the AUDIT items, we constructed an aggregate measure of alcohol consumption that is strongly associated with alcohol dependence (rg=.67) and several other psychiatric disorders, and no longer positively associated with health and positive socioeconomic outcomes. Lastly, by performing polygenic analyses in three independent cohorts that differed in their ascertainment and prevalence of AUD, we identified novel genetic associations between alcohol consumption, alcohol misuse, and human health. Our work further emphasizes the value of AUDIT for both clinical and genetic studies of AUD, and the importance of using multivariate methods to study genetic associations that are more closely related to AUD.
0

Brain‐age prediction: Systematic evaluation of site effects, and sample age range and size

Yuetong Yu et al.Sep 12, 2024
+78
S
H
Y
Abstract Structural neuroimaging data have been used to compute an estimate of the biological age of the brain (brain‐age) which has been associated with other biologically and behaviorally meaningful measures of brain development and aging. The ongoing research interest in brain‐age has highlighted the need for robust and publicly available brain‐age models pre‐trained on data from large samples of healthy individuals. To address this need we have previously released a developmental brain‐age model. Here we expand this work to develop, empirically validate, and disseminate a pre‐trained brain‐age model to cover most of the human lifespan. To achieve this, we selected the best‐performing model after systematically examining the impact of seven site harmonization strategies, age range, and sample size on brain‐age prediction in a discovery sample of brain morphometric measures from 35,683 healthy individuals (age range: 5–90 years; 53.59% female). The pre‐trained models were tested for cross‐dataset generalizability in an independent sample comprising 2101 healthy individuals (age range: 8–80 years; 55.35% female) and for longitudinal consistency in a further sample comprising 377 healthy individuals (age range: 9–25 years; 49.87% female). This empirical examination yielded the following findings: (1) the accuracy of age prediction from morphometry data was higher when no site harmonization was applied; (2) dividing the discovery sample into two age‐bins (5–40 and 40–90 years) provided a better balance between model accuracy and explained age variance than other alternatives; (3) model accuracy for brain‐age prediction plateaued at a sample size exceeding 1600 participants. These findings have been incorporated into CentileBrain ( https://centilebrain.org/#/brainAGE2 ), an open‐science, web‐based platform for individualized neuroimaging metrics.
0

Multilevel Twin Models: Geographical Region as a Third Level Variable

Zenab Tamimy et al.Jun 6, 2024
+7
J
S
Z
Abstract The classical twin model can be reparametrized as an equivalent multilevel model. The multilevel parameterization has underexplored advantages, such as the possibility to include higher-level clustering variables in which lower levels are nested. When this higher-level clustering is not modeled, its variance is captured by the common environmental variance component. In this paper we illustrate the application of a 3-level multilevel model to twin data by analyzing the regional clustering of 7-year-old children’s height in the Netherlands. Our findings show that 1.8%, of the phenotypic variance in children’s height is attributable to regional clustering, which is 7% of the variance explained by between-family or common environmental components. Since regional clustering may represent ancestry, we also investigate the effect of region after correcting for genetic principal components, in a subsample of participants with genome-wide SNP data. After correction, region did no longer explain variation in height. Our results suggest that the phenotypic variance explained by region actually represent ancestry effects on height.
Load More