JM
Josine Min
Author with expertise in Epigenetic Modifications and Their Functional Implications
University of Bristol, Medical Research Council, MRC Epidemiology Unit
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(30% Open Access)
Cited by:
13
h-index:
38
/
i10-index:
62
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
48

Genome-wide association studies identify 137 loci for DNA methylation biomarkers of ageing

Daniel McCartney et al.Oct 24, 2023
+106
R
J
D
Abstract Biological ageing estimators derived from DNA methylation (DNAm) data are heritable and correlate with morbidity and mortality. Leveraging DNAm and SNP data from >41,000 individuals, we identify 137 genome-wide significant loci (113 novel) from meta-analyses of four epigenetic clocks and epigenetic surrogate markers for granulocyte proportions and plasminogen activator inhibitor 1 levels, respectively. We report strong genetic correlations with longevity and lifestyle factors such as smoking, education, and obesity. Significant associations are observed in polygenic risk score analysis and to a lesser extent in Mendelian randomization analyses. This study illuminates the genetic architecture underlying epigenetic ageing and its shared genetic contributions with lifestyle factors and longevity.
48
Citation13
0
Save
0

GARFIELD - GWAS Analysis of Regulatory or Functional Information Enrichment with LD correction

Valentina Iotchkova et al.May 6, 2020
+7
M
G
V
Loci discovered by genome-wide association studies (GWAS) predominantly map outside protein-coding genes. The interpretation of functional consequences of non-coding variants can be greatly enhanced by catalogs of regulatory genomic regions in cell lines and primary tissues. However, robust and readily applicable methods are still lacking to systematically evaluate the contribution of these regions to genetic variation implicated in diseases or quantitative traits. Here we propose a novel approach that leverages GWAS findings with regulatory or functional annotations to classify features relevant to a phenotype of interest. Within our framework, we account for major sources of confounding that current methods do not offer. We further assess enrichment statistics for 27 GWAS traits within regulatory regions from the ENCODE and Roadmap projects. We characterise unique enrichment patterns for traits and annotations, driving novel biological insights. The method is implemented in standalone software and R package to facilitate its application by the research community.
0

Meffil: efficient normalisation and analysis of very large DNA methylation samples

Josine Min et al.May 6, 2020
+2
G
G
J
Background. Technological advances in high throughput DNA methylation microarrays have allowed dramatic growth of a new branch of epigenetic epidemiology. DNA methylation datasets are growing ever larger in terms of the number of samples profiled, the extent of genome coverage, and the number of studies being meta-analysed. Novel computational solutions are required to efficiently handle these data. Methods. We have developed meffil, an R package designed to quality control, normalize and perform epigenome-wide association studies (EWAS) efficiently on large samples of Illumina Infinium HumanMethylation450 and MethylationEPIC BeadChip microarrays. We tested meffil by applying it to 6000 450k microarrays generated from blood collected for two different datasets. Results. A complete reimplementation of functional normalization minimizes computational memory requirements to 5% of that required by other R packages, without increasing running time. Incorporating fixed and random fixed effects alongside functional normalization, and automated estimation of functional normalisation parameters reduces technical variation in DNA methylation levels, thus reducing false positive associations and improving power. We also demonstrate that the ability to normalize datasets distributed across physically different locations without sharing any biologically-based individual-level data may reduce heterogeneity in meta-analyses of epigenome-wide association studies. However, when batch is perfectly confounded with cases and controls functional normalization is unable to prevent spurious associations. Conclusions. meffil is available online (https://github.com/perishky/meffil/) along with tutorials covering typical use cases.
0

Epigenetic regulation of PAR4-related platelet activation: mechanistic links between environmental exposure and cardiovascular disease

Laura Corbin et al.May 7, 2020
+21
S
A
L
Protease-activated receptor 4 (PAR4) is a potent thrombin receptor. Epigenetic control of the F2RL3 locus (which encodes for PAR4) via DNA methylation is associated with both smoking and cardiovascular disease. We examined the association between DNA hypomethylation at F2RL3 and risk of cardiovascular disease, focusing on acute myocardial infarction (AMI) (n=853/2,352 cases/controls). We used in vitro cell models to dissect the role of DNA methylation in regulating expression of F2RL3. We investigated the interplay between F2RL3 DNA methylation and platelet function in human (n=41). Lastly, we used Mendelian randomization to unify observational and functional work by assessing evidence for causal relationships using data from UK Biobank (n=407,141) and CARDIoGRAMplusC4D (n=184,305). Observationally, one standard deviation (SD) decrease in DNA methylation at F2RL3 was associated with a 25% increase in the odds of AMI. In vitro, short-term exposure of cells to cigarette smoke reduced F2RL3 DNA methylation and increased gene expression. Transcriptional assays flagged a role for a CEBP recognition sequence in modulating the enhancer activity of F2RL3 exon 2. Lower DNA methylation at F2RL3 was associated with increased platelet reactivity in human. The estimated casual odds ratio of ischaemic heart disease was 1.03 (95% CI: 1.00, 1.07) per 1 SD decrease in F2RL3 DNA. In conclusion, we show that DNA methylation-dependent platelet activation is part of a complex system of features contributing to cardiovascular health. Tailoring therapeutic intervention to new knowledge of F2RL3/PAR4 function should be explored to ameliorate the detrimental effects of this risk factor on cardiovascular health.
0

Narrow-sense heritability estimation of complex traits using identity-by-descent information.

Luke Evans et al.May 7, 2020
+122
M
R
L
Heritability is a fundamental parameter in genetics. Traditional estimates based on family or twin studies can be biased due to shared environmental or non-additive genetic variance. Alternatively, those based on genotyped or imputed variants typically underestimate narrow-sense heritability contributed by rare or otherwise poorly-tagged causal variants. Identical-by-descent (IBD) segments of the genome share all variants between pairs of chromosomes except new mutations that have arisen since the last common ancestor. Therefore, relating phenotypic similarity to degree of IBD sharing among classically unrelated individuals is an appealing approach to estimating the near full additive genetic variance while avoiding biases that can occur when modeling close relatives. We applied an IBD-based approach (GREML-IBD) to estimate heritability in unrelated individuals using phenotypic simulation with thousands of whole genome sequences across a range of stratification, polygenicity levels, and the minor allele frequencies of causal variants (CVs). IBD-based heritability estimates were unbiased when using unrelated individuals, even for traits with extremely rare CVs, but stratification led to strong biases in IBD-based heritability estimates with poor precision. We used data on two traits in ~120,000 people from the UK Biobank to demonstrate that, depending on the trait and possible confounding environmental effects, GREML-IBD can be applied successfully to very large genetic datasets to infer the contribution of very rare variants lost using other methods. However, we observed apparent biases in this real data that were not predicted from our simulation, suggesting that more work may be required to understand factors that influence IBD-based estimates.
0

The effect of pre-analytical conditions on blood metabolomics in epidemiological studies

Diana Ferreira et al.May 7, 2020
+6
M
H
D
Background: Serum and plasma are commonly used biofluids for large-scale metabolomic-epidemiology studies. Their metabolomic profile is susceptible to changes due to variability in pre-analytical conditions and the impact of this is unclear. Methods: Participant-matched EDTA-plasma and serum samples were collected from 37 non-fasting volunteers and profiled using a targeted nuclear magnetic resonance (NMR) metabolomics platform (N=151 traits). Metabolic concentrations were compared between reference (pre-storage: 4C, 1.5h; post-storage: no sample preparation or NMR-analysis delays) and four, pre-storage, blood processing conditions, where samples were incubated at (i) 4C, 24h; (ii) 4C, 48h; (iii) 21C, 24h; (iv) 21C, 48h, before centrifugation; and two, post-storage, sample processing conditions in which samples (i) thawed overnight, then left for 24h before addition of sodium buffer followed by immediate NMR analysis; (ii) thawed overnight, addition of sodium buffer, then left for 24h before profiling. Linear regression models with random-intercepts were used to assess the impact of these six pre-analytical conditions on EDTA-plasma/serum metabolome. Results: Fatty acids, beta-hydroxybutyrate, glycoprotein-acetyls and most lipid-related traits, in serum and plasma, were robust to the tested pre and post-storage conditions. Pre-storage conditions impacted concentrations of glycolysis metabolites, acetate, albumin and amino-acids by levels that could potentially bias research results (up to 1.4SD difference compared with reference). Post-storage conditions affected histidine, phenylalanine and LDL-particle-size, with differences up to 1.4SD. Conclusions: Most metabolic traits are robust to the pre- and post-storage conditions tested here and that may commonly occur in large-scale cohorts. However, concentrations of glycolysis metabolites, and amino-acids may be compromised.
0

Low-frequency variation in TP53 has large effects on head circumference and intracranial volume

Simon Haworth et al.May 7, 2020
+32
C
C
S
Cranial growth and development affects the closely related traits of head circumference (HC) and intracranial volume (ICV). Here we model the developmental genetic architecture of HC, showing this is genetically stable and correlated with genetic determinants of ICV. Investigating up to 46,000 children and adults of European descent, we identify association with final HC and/or final ICV+HC at 9 novel common and low-frequency loci, illustrating that genetic variation from a wide allele frequency spectrum contributes to cranial growth. The largest effects are reported for low-frequency variants within TP53, with 0.5 cm wider heads in increaser-allele carriers versus non-carriers during mid-childhood.
1

DNA co-methylation has a stable structure and is related to specific aspects of genome regulation

Sarah Watkins et al.Oct 24, 2023
+7
G
M
S
Abstract Background DNA methylation (DNAm) is an epigenetic mark that can be used to understand interindividual variability in genomic regulation, and it is influenced by many genetic and environmental factors. Co-methylation between DNAm sites is a known phenomenon but the full architecture of relationships between the approximately 450,000 (450k) sites most commonly measured in epidemiological studies has not been described. We investigate whether the cis and trans interindividual co-methylation structure amongst the 450k sites changes across the lifecourse, whether it differs between UK-born White and Pakistani individuals, and how it may be related to genome regulation. Results We find stability across the life course (birth to adolescence), across cohorts, and between two ethnic groups. Highly correlated DNAm sites in close proximity are highly heritable, influenced by nearby genetic variants ( cis mQTLs), and are enriched for transcription factor (TF) binding sites related to regulation of short RNAs essential for cellular function transcribed by RNA polymerase III. Highly correlated sites that are either distant, or on different chromosomes, are driven by both common and unique environmental factors, and methylation at these sites is less likely to be driven by genotype. They are enriched for a multitude of TF binding sites and for inter-chromosomal chromatin contact sites, suggesting that DNA co-methylation of distant sites may be related to long-range cooperative TF interactions. Conclusions We conclude that DNA co-methylation, especially in cis , has a stable structure from birth to adolescence and between white British and Pakistani individuals. We hypothesise that co-methylation may have roles in genome regulation in humans, including 3D chromatin architecture. The stable structure we have identified might have implications for the future design and interpretation of epigenetic studies.
0

A reference panel of 64,976 haplotypes for genotype imputation

Shane McCarthy et al.May 6, 2020
+107
W
D
S
We describe a reference panel of 64,976 human haplotypes at 39,235,157 SNPs constructed using whole genome sequence data from 20 studies of predominantly European ancestry. Using this resource leads to accurate genotype imputation at minor allele frequencies as low as 0.1%, a large increase in the number of SNPs tested in association studies and can help to discover and refine causal loci. We describe remote server resources that allow researchers to carry out imputation and phasing consistently and efficiently.
14

Evidence of positive and negative selection associated with DNA methylation

Charlie Hatcher et al.Oct 24, 2023
+3
S
G
C
Abstract Signatures of negative selection are pervasive amongst complex traits and diseases. However, it is unclear whether such signatures exist for DNA methylation (DNAm) that has been proposed to have a functional role in disease. We estimate polygenicity, SNP-based heritability and model the joint distribution of effect size and minor allele frequency (MAF) to estimate a selection coefficient ( S ) for 2000 heritable DNAm sites in 1774 individuals from the Avon Longitudinal Study of Parents and Children. Additionally, we estimate S for meta stable epi alleles and DNAm sites associated with aging and mortality, birthweight and body mass index. Quantification of MAF-dependent genetic architectures estimated from genotype and DNAm reveal evidence of positive ( S > 0) and negative selection ( S < 0) and confirm previous evidence of negative selection for birthweight. Evidence of both negative and positive selection highlights the role of DNAm as an intermediary in multiple biological pathways with competing function.