TG
Tom Gaunt
Author with expertise in Genomic Studies and Association Analyses
University of Bristol, University Hospitals Bristol NHS Foundation Trust, NIHR Bristol Biomedical Research Centre
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
43
(40% Open Access)
Cited by:
253
h-index:
77
/
i10-index:
221
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Repositioning of the global epicentre of non-optimal cholesterol

Cristina Taddei et al.Aug 1, 2024
+854
H
B
C
Abstract High blood cholesterol is typically considered a feature of wealthy western countries 1,2 . However, dietary and behavioural determinants of blood cholesterol are changing rapidly throughout the world 3 and countries are using lipid-lowering medications at varying rates. These changes can have distinct effects on the levels of high-density lipoprotein (HDL) cholesterol and non-HDL cholesterol, which have different effects on human health 4,5 . However, the trends of HDL and non-HDL cholesterol levels over time have not been previously reported in a global analysis. Here we pooled 1,127 population-based studies that measured blood lipids in 102.6 million individuals aged 18 years and older to estimate trends from 1980 to 2018 in mean total, non-HDL and HDL cholesterol levels for 200 countries. Globally, there was little change in total or non-HDL cholesterol from 1980 to 2018. This was a net effect of increases in low- and middle-income countries, especially in east and southeast Asia, and decreases in high-income western countries, especially those in northwestern Europe, and in central and eastern Europe. As a result, countries with the highest level of non-HDL cholesterol—which is a marker of cardiovascular risk—changed from those in western Europe such as Belgium, Finland, Greenland, Iceland, Norway, Sweden, Switzerland and Malta in 1980 to those in Asia and the Pacific, such as Tokelau, Malaysia, The Philippines and Thailand. In 2017, high non-HDL cholesterol was responsible for an estimated 3.9 million (95% credible interval 3.7 million–4.2 million) worldwide deaths, half of which occurred in east, southeast and south Asia. The global repositioning of lipid-related risk, with non-optimal cholesterol shifting from a distinct feature of high-income countries in northwestern Europe, north America and Australasia to one that affects countries in east and southeast Asia and Oceania should motivate the use of population-based policies and personal interventions to improve nutrition and enhance access to treatment throughout the world.
0
Citation162
0
Save
76

Brain expression quantitative trait locus and network analysis reveals downstream effects and putative drivers for brain-related diseases

Nigel Klein et al.Oct 11, 2023
+17
M
E
N
Abstract Gaining insight into the downstream consequences of non-coding variants is an essential step towards the identification of therapeutic targets from genome-wide association study (GWAS) findings. Here we have harmonized and integrated 8,727 RNA-seq samples with accompanying genotype data from multiple brain-regions from 14 datasets. This sample size enabled us to perform both cis - and trans -expression quantitative locus (eQTL) mapping. Upon comparing the brain cortex cis -eQTLs (for 12,307 unique genes at FDR<0.05) with a large blood cis- eQTL analysis (n=31,684 samples), we observed that brain eQTLs are more tissue specific than previously assumed. We inferred the brain cell type for 1,515 cis -eQTLs by using cell type proportion information. We conducted Mendelian Randomization on 31 brain-related traits using cis -eQTLs as instruments and found 159 significant findings that also passed colocalization. Furthermore, two multiple sclerosis (MS) findings had cell type specific signals, a neuron-specific cis- eQTL for CYP24A1 and a macrophage specific cis -eQTL for CLECL1 . To further interpret GWAS hits, we performed trans -eQTL analysis. We identified 2,589 trans -eQTLs (at FDR<0.05) for 373 unique SNPs, affecting 1,263 unique genes, and 21 replicated significantly using single-nucleus RNA-seq data from excitatory neurons. We also generated a brain-specific gene-coregulation network that we used to predict which genes have brain-specific functions, and to perform a novel network analysis of Alzheimer’s disease (AD), amyotrophic lateral sclerosis (ALS), multiple sclerosis (MS) and Parkinson’s disease (PD) GWAS data. This resulted in the identification of distinct sets of genes that show significantly enriched co-regulation with genes inside the associated GWAS loci, and which might reflect drivers of these diseases.
1

An efficient and robust tool for colocalisation: Pair-wise Conditional and Colocalisation (PWCoCo)

Jamie Robinson et al.Oct 24, 2023
+6
M
G
J
Abstract Genetic colocalisation is an important tool to test for shared genetic aetiology and is commonly used to strengthen causal inference in genetic studies of molecular traits and drug targets. However, the single causal variant assumption of the original colocalization method is a considerable limitation in genomic regions with multiple causal effects. We integrated conditional analyses (GCTA-COJO) and colocalisation analyses (coloc), into a novel analysis tool called Pair-Wise Conditional Colocalization (PWCoCo). PWCoCo performs conditional analyses to identify independent signals for the two tested traits in a genomic region and then conducts colocalisation of each pair of conditionally independent signals for the two traits using summary-level data. This allows for the stringent single-variant assumption to hold for each pair of colocalisation analysis. We found that the computational efficiency of PWCoCo is on average better than colocalisation with Sum of Single Effects Regression using Summary Stats (SuSiE-RSS), with greater gains in efficiency for high-throughput analysis. In a case study using GWAS data for multiple sclerosis and brain cortex-derived eQTLs (MetaBrain), we recapitulated all previously identified genes, which showcased the robustness of the method. We further found colocalisation evidence for secondary signals in nine additional loci, which was not identifiable in conventional GWAS and/or colocalisation. PWCoCo offers key improvements over existing methods, including: (1) robust colocalisation when the single variant assumption is violated; (2) independent colocalisation of secondary signals, which enables identification of novel disease-causing variants; (3) an easy-to-use and computationally efficient tool to test for colocalisation of high-dimensional omics data.
43

The variant call format provides efficient and robust storage of GWAS summary statistics

Matthew Lyon et al.Oct 24, 2023
+3
B
S
M
Genome-wide association study (GWAS) summary statistics are a fundamental resource for a variety of research applications 1–6 . Yet despite their widespread utility, no common storage format has been widely adopted, hindering tool development and data sharing, analysis and integration. Existing tabular formats 7,8 often ambiguously or incompletely store information about genetic variants and their associations, and also lack essential metadata increasing the possibility of errors in data interpretation and post-GWAS analyses. Additionally, data in these formats are typically not indexed, requiring the whole file to be read which is computationally inefficient. To address these issues, we propose an adaptation of the variant call format 9 (GWAS-VCF) and have produced a suite of open-source tools for using this format in downstream analyses. Simulation studies determine GWAS-VCF is 9-46x faster than tabular alternatives when extracting variant(s) by genomic position. Our results demonstrate the GWAS-VCF provides a robust and performant solution for sharing, analysis and integration of GWAS data. We provide open access to over 10,000 complete GWAS summary datasets converted to this format (available from: https://gwas.mrcieu.ac.uk ).
0

PhenoSpD: an integrated toolkit for phenotypic correlation estimation and multiple testing correction using GWAS summary statistics

Jie Zheng et al.May 7, 2020
+5
L
T
J
Abstract Background Identifying phenotypic correlations between complex traits and diseases can provide useful etiological insights. Restricted access to individual-level phenotype data makes it difficult to estimate large-scale phenotypic correlation across the human phenome. State-of-the-art methods, metaCCA and LD score regression, provide an alternative approach to estimate phenotypic correlation using genome-wide association study (GWAS) summary statistics. Results Here, we present an integrated R toolkit, PhenoSpD, to 1) apply metaCCA (or LD score regression) to estimate phenotypic correlations using GWAS summary statistics; and 2) to utilize the estimated phenotypic correlations to inform correction of multiple testing for complex human traits using the spectral decomposition of matrices (SpD). The simulations suggest it is possible to estimate phenotypic correlation using samples with only a partial overlap, but as overlap decreases correlations will attenuate towards zero and multiple testing correction will be more stringent than in perfectly overlapping samples. In a case study, PhenoSpD using GWAS results suggested 324.4 independent tests among 452 metabolites, which is close to the 296 independent tests estimated using true phenotypic correlation. We further applied PhenoSpD to estimated 7,503 pair-wise phenotypic correlations among 123 metabolites using GWAS summary statistics from Kettunen et al. and PhenoSpD suggested 44.9 number of independent tests for theses metabolites. Conclusion PhenoSpD integrates existing methods and provides a simple and conservative way to reduce dimensionality for complex human traits using GWAS summary statistics, which is particularly valuable for post-GWAS analysis of complex molecular traits. Availability R code and documentation for PhenoSpD V1.0.0 is available online ( https://github.com/MRCIEU/PhenoSpD ).
28

EpiGraphDB: A database and data mining platform for health data science

Yi Liu et al.Oct 24, 2023
+5
P
B
Y
Abstract Motivation The wealth of data resources on human phenotypes, risk factors, molecular traits and therapeutic interventions presents new opportunities for population health sciences. These opportunities are paralleled by a growing need for data integration, curation and mining to increase research efficiency, reduce mis-inference and ensure reproducible research. Results We developed EpiGraphDB ( https://epigraphdb.org/ ), a graph database containing an array of different biomedical and epidemiological relationships and an analytical platform to support their use in human population health data science. In addition, we present three case studies that illustrate the value of this platform. The first uses EpiGraphDB to evaluate potential pleiotropic relationships, addressing mis-inference in systematic causal analysis. In the second case study we illustrate how protein-protein interaction data offer opportunities to identify new drug targets. The final case study integrates causal inference using Mendelian randomization with relationships mined from the biomedical literature to “triangulate” evidence from different sources. Availability The EpiGraphDB platform is openly available at https://epigraphdb.org . Code for replicating case study results is available at https://github.com/MRCIEU/epigraphdb as Jupyter notebooks using the API, and https://mrcieu.github.io/epigraphdb-r using the R package. Contact yi6240.liu@bristol.ac.uk , ben.elsworth@bristol.ac.uk , Tom.Gaunt@bristol.ac.uk
1

Genetic effect modification of cis-acting C-reactive protein variants in cardiometabolic disease status

Jie Zheng et al.Oct 24, 2023
+8
M
H
J
Summary Mendelian randomization (MR) studies carried out among patients with a particular health condition should establish the genetic instrument influences the exposure in that subgroup, however this is normally investigated in the general population. Here, we investigated whether the genetic associations of four cis-acting C-reactive protein (CRP) variants differed between participants with and without three cardiometabolic conditions: obesity, type 2 diabetes, and cardiovascular disease. Associations of cis-genetic variants with CRP differed between obese and non-obese individuals. A multivariable analysis suggested strong independent associations of the gene-by-body mass index (BMI) interaction on CRP (P<1.18×10 −8 for the CRP variants). Applying MR, we observed strong causal effect of BMI on CRP (P=2.14×10 −65 ). In summary, our study indicates that genetic associations with CRP differ across disease sub-groups, with evidence to suggest that BMI is an effect modifier. MR studies of disease progression should report on the genetic instrument-exposure association in the disease subgroup under investigation.
1

Evaluating the potential benefits and pitfalls of combining protein and expression quantitative trait loci in evidencing drug targets

Jamie Robinson et al.Oct 24, 2023
+5
D
T
J
Abstract Molecular quantitative trait loci (molQTL), which can provide functional evidence on the mechanisms underlying phenotype-genotype associations, are increasingly used in drug target validation and safety assessment. In particular, protein abundance QTLs (pQTLs) and gene expression QTLs (eQTLs) are the most commonly used for this purpose. However, questions remain on how to best consolidate results from pQTLs and eQTLs for target validation. In this study, we combined blood cell-derived eQTLs and plasma-derived pQTLs to form QTL pairs representing each gene and its product. We performed a series of enrichment analyses to identify features of QTL pairs that provide consistent evidence for drug targets based on the concordance of the direction of effect of the pQTL and eQTL. We repeated these analyses using eQŢLs derived in 49 tissues. We found that 25-30% of blood-cell derived QTL pairs have discordant effects. The difference in tissues of origin for molecular markers contributes to, but is not likely a major source of, this observed discordance. Finally, druggable genes were as likely to have discordant QTL pairs as concordant. Our analyses suggest combining and consolidating evidence from pQTLs and eQTLs for drug target validation is crucial and should be done whenever possible, as many potential drug targets show discordance between the two molecular phenotypes that could be misleading if only one is considered. We also encourage investigating QTL tissue-specificity in target validation applications to help identify reasons for discordance and emphasise that concordance and discordance of QTL pairs across tissues are both informative in target validation.
4

Epigenome-wide change and variation in DNA methylation from birth to late adolescence

Rosa Mulder et al.Oct 24, 2023
+13
C
A
R
Abstract DNA methylation (DNAm) is known to play a pivotal role in childhood health and development, but a comprehensive characterization of genome-wide DNAm trajectories across this age period is currently lacking. We have therefore performed a series of epigenome-wide association studies in 5,019 blood samples collected at multiple time-points from birth to late adolescence from 2,348 participants of two large independent cohorts. DNAm profiles of autosomal CpG sites (CpGs) were generated using the Illumina Infinium HumanMethylation450 BeadChip. Change over time was widespread, observed at over one-half (53%) of CpGs. In most cases DNAm was decreasing (36% of CpGs). Inter-individual variation in linear trajectories was similarly widespread (27% of CpGs). Evidence for nonlinear change and inter-individual variation in nonlinear trajectories was somewhat less common (11% and 8% of CpGs, respectively). Very little inter-individual variation in change was explained by sex differences (0.4% of CpGs) even though sex-specific DNAm was observed at 5% of CpGs. DNAm trajectories were distributed non-randomly across the genome. For example, CpGs with decreasing DNAm were enriched in gene bodies and enhancers and were annotated to genes enriched in immune-developmental functions. By contrast, CpGs with increasing DNAm were enriched in promoter regions and annotated to genes enriched in neurodevelopmental functions. These findings depict a methylome undergoing widespread and often nonlinear change throughout childhood. They support a developmental role for DNA methylation that extends beyond birth into late adolescence and has implications for understanding life-long health and disease. DNAm trajectories can be visualized at http://epidelta.mrcieu.ac.uk .
4
Paper
Citation2
0
Save
1

Characterizing the human methylome across the life course: findings from eight UK-based studies

Esther Walton et al.Oct 24, 2023
+16
H
R
E
Abstract Variation in DNA methylation (DNAm) is associated with multiple biological processes that track growth and development, ageing and age-related diseases. However, there is little understanding of what constitutes typical patterns of DNAm variation and how these patterns change across the life course. In this study, we synthesised a map of the human methylome across the life course, focussing on changes in variability and mean DNAm. Harmonizing DNAm datasets across eight longitudinal and cross-sectional UK-based studies, we meta-analysed n=13,215 blood samples from n=7,037 unique individuals from birth to 98 years of age. Changes in CpG-specific variability and means were described across the life course using a meta-regression framework. CpG-specific associations of variability or mean DNAm in relation to the likelihood of association with 100 traits linked to environmental exposures, health and disease were tested within and across ten developmental age bins across the life course. Age was linked to DNAm variability at 29,212 CpG sites. On average, we observed a 1.26 fold increase in DNAm variability per year across the life course. 33,730 CpGs displayed changes in mean DNAm, with 64% of these loci showing decreases in DNAm over time. CpG sites linked to traits were in general more variable across the life course. Our study provides, for the first time, a map of the human methylome across the life course, which is publicly accessible through a searchable online database. This resource allows researchers to query CpG-specific trajectories from birth to old age and link these to health and disease.
1
Paper
Citation2
0
Save
Load More