TG
T.J. Gorrie-Stone
Author with expertise in Epigenetic Modifications and Their Functional Implications
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(75% Open Access)
Cited by:
742
h-index:
14
/
i10-index:
19
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Guidance for DNA methylation studies: statistical insights from the Illumina EPIC array

Georgina Mansell et al.May 14, 2019
There has been a steady increase in the number of studies aiming to identify DNA methylation differences associated with complex phenotypes. Many of the challenges of epigenetic epidemiology regarding study design and interpretation have been discussed in detail, however there are analytical concerns that are outstanding and require further exploration. In this study we seek to address three analytical issues. First, we quantify the multiple testing burden and propose a standard statistical significance threshold for identifying DNA methylation sites that are associated with an outcome. Second, we establish whether linear regression, the chosen statistical tool for the majority of studies, is appropriate and whether it is biased by the underlying distribution of DNA methylation data. Finally, we assess the sample size required for adequately powered DNA methylation association studies. We quantified DNA methylation in the Understanding Society cohort (n = 1175), a large population based study, using the Illumina EPIC array to assess the statistical properties of DNA methylation association analyses. By simulating null DNA methylation studies, we generated the distribution of p-values expected by chance and calculated the 5% family-wise error for EPIC array studies to be 9 × 10− 8. Next, we tested whether the assumptions of linear regression are violated by DNA methylation data and found that the majority of sites do not satisfy the assumption of normal residuals. Nevertheless, we found no evidence that this bias influences analyses by increasing the likelihood of affected sites to be false positives. Finally, we performed power calculations for EPIC based DNA methylation studies, demonstrating that existing studies with data on ~ 1000 samples are adequately powered to detect small differences at the majority of sites. We propose that a significance threshold of P < 9 × 10− 8 adequately controls the false positive rate for EPIC array DNA methylation studies. Moreover, our results indicate that linear regression is a valid statistical methodology for DNA methylation studies, despite the fact that the data do not always satisfy the assumptions of this test. These findings have implications for epidemiological-based studies of DNA methylation and provide a framework for the interpretation of findings from current and future studies.
0
Citation234
0
Save
49

Fragment Binding to the Nsp3 Macrodomain of SARS-CoV-2 Identified Through Crystallographic Screening and Computational Docking

M. Schuller et al.Nov 24, 2020
ABSTRACT The SARS-CoV-2 macrodomain (Mac1) within the non-structural protein 3 (Nsp3) counteracts host-mediated antiviral ADP-ribosylation signalling. This enzyme is a promising antiviral target because catalytic mutations render viruses non-pathogenic. Here, we report a massive crystallographic screening and computational docking effort, identifying new chemical matter primarily targeting the active site of the macrodomain. Crystallographic screening of diverse fragment libraries resulted in 214 unique macrodomain-binding fragments, out of 2,683 screened. An additional 60 molecules were selected from docking over 20 million fragments, of which 20 were crystallographically confirmed. X-ray data collection to ultra-high resolution and at physiological temperature enabled assessment of the conformational heterogeneity around the active site. Several crystallographic and docking fragment hits were validated for solution binding using three biophysical techniques (DSF, HTRF, ITC). Overall, the 234 fragment structures presented explore a wide range of chemotypes and provide starting points for development of potent SARS-CoV-2 macrodomain inhibitors.
49
Citation19
0
Save
21

Structure, Mechanism and Crystallographic fragment screening of the SARS-CoV-2 NSP13 helicase

Joseph Newman et al.Mar 15, 2021
Abstract The global COVID-19 pandemic is caused by the SARS-CoV-2 virus and has infected over 100 million and caused over 2 million fatalities worldwide at the point of writing. There is currently a lack of effective drugs to treat people infected with SARS-CoV-2. The SARS-CoV-2 Non-structural protein 13 (NSP13) is a superfamily1B helicase that has been identified as a possible target for anti-viral drugs due to its high sequence conservation and essential role in viral replication. In this study we present crystal structures of SARS-CoV-2 NSP13 solved in the APO form and in the presence of both phosphate and the non-hydrolysable ATP analogue (AMP-PNP). Comparisons of these structures reveal details of global and local conformational changes that are induced by nucleotide binding and hydrolysis and provide insights into the helicase mechanism and possible modes of inhibition. Structural analysis reveals two pockets on NSP13 that are classified as “druggable” and include one of the most conserved sites in the entire SARS-CoV-2 proteome. To identify possible starting points for anti-viral drug development we have performed a crystallographic fragment screen against SARS-CoV-2 NSP13 helicase. The fragment screen reveals 65 fragment hits across 52 datasets, with hot spots in pockets predicted to be of functional importance, including the druggable nucleotide and nucleic acid binding sites, opening the way to structure guided development of novel antiviral agents.
21
Citation11
0
Save
8

interpolatedXY: a two-step strategy to normalise DNA methylation microarray data avoiding sex bias

Yucheng Wang et al.Oct 1, 2021
Abstract Motivation Data normalization is an essential step to reduce technical variation within and between arrays. Due to the different karyotypes and the effects of X chromosome inactivation, females and males exhibit distinct methylation patterns on sex chromosomes, thus it poses a significant challenge to normalise sex chromosome data without introducing bias. Currently, existing methods do not provide unbiased solutions to normalise sex chromosome data, usually, they just process autosomal and sex chromosomes indiscriminately. Results Here, we demonstrate that ignoring this sex difference will lead to introducing artificial sex bias, especially for thousands of autosomal CpGs. We present a novel two-step strategy (interpolatedXY) to address this issue, which is applicable to all quantile-based normalisation methods. By this new strategy, the autosomal CpGs are first normalised independently by conventional methods, such as funnorm or dasen; then the corrected methylation values of sex chromosome linked CpGs are estimated as the weighted average of their nearest neighbours on autosomes. The proposed two-step strategy can also be applied to other non-quantile-based normalisation methods, as well as other array-based data types. Moreover, we propose a useful concept: the sex explained fraction of variance, to quantitatively measure the normalisation effect. Availability The proposed methods are available by calling the function ‘adjustedDasen’ or ‘adjustedFunnorm’ in the latest wateRmelon package ( https://github.com/schalkwyk/wateRmelon ), with methods compatible with all the major workflows, including minfi. Contact xzhai@essex.ac.uk ; lschal@essex.ac.uk Supplementary information Supplementary data are available at...
8
Citation4
0
Save
45

DNA methylation covariation in human whole blood and sperm: implications for studies of intergenerational epigenetic effects

Fredrika Åsenius et al.May 2, 2020
Abstract Background Epidemiological studies suggest that paternal obesity may increase the risk of fathering small for gestational age offspring. Studies in non-human mammals suggest that such associations could be mediated by DNA methylation changes in spermatozoa that influence offspring development in utero. Human obesity is associated with differential DNA methylation in peripheral blood. It is unclear, however, whether this differential DNA methylation is reflected in spermatozoa. We profiled genome-wide DNA methylation using the Illumina MethylationEPIC array in matched human blood and sperm from lean (discovery n=47; replication n=21) and obese (n=22) males to analyse tissue covariation of DNA methylation, and identify whether this covariation is influenced by obesity. Results DNA methylation signatures of human blood and spermatozoa are highly discordant, and methylation levels are correlated at only a minority of CpG sites (∼1%). While at the majority of these sites, DNA methylation appears to be influenced by genetic variation, obesity-associated DNA methylation in blood was not generally reflected in spermatozoa, and obesity did not influence covariation patterns. However, one cross-tissue obesity-specific hypermethylated site (cg19357369; chr4:2429884; P =8.95 × 10 −8 ; beta=0.02) was identified, warranting replication and further investigation. When compared to a wide range of human somatic tissue samples (n=5,917), spermatozoa displayed differential DNA methylation in pathways enriched in transcriptional regulation. Conclusions Human sperm displays a unique DNA methylation profile that is highly discordant to, and practically uncorrelated with, that of matched peripheral blood. Obesity only nominally influences sperm DNA methylation, making it an unlikely mediator of intergenerational effects of metabolic traits.
45
Citation2
0
Save
22

DNA methylation-based sex classifier to predict sex and identify sex chromosome aneuploidy

Yucheng Wang et al.Oct 19, 2020
Abstract Sex is an important covariate of epigenome-wide association studies due to its strong influence on DNA methylation patterns across numerous genomic positions. Nevertheless, many samples on the Gene Expression Omnibus (GEO) frequently lack a sex annotation or are incorrectly labelled. Considering the influence that sex imposes on DNA methylation patterns, it is necessary to ensure that methods for filtering poor samples and checking of sex assignment are accurate and widely applicable. In this paper, we presented a novel method to predict sex using only DNA methylation density signals, which can be readily applied to almost all DNA methylation datasets of different formats (raw IDATs or text files with only density signals) uploaded to GEO. We identified 4345 significantly ( p < 0.01) sex-associated CpG sites present on both 450K and EPIC arrays, and constructed a sex classifier based on the two first components of PCAs from the two sex chromosomes. The proposed method is constructed using whole blood samples and exhibits good performance across a wide range of tissues. We further demonstrated that our method can be used to identify samples with sex chromosome aneuploidy, this function is validated by five Turner syndrome cases and one Klinefelter syndrome case. The proposed method has been integrated into the wateRmelon Bioconductor package.
22
Citation1
0
Save
14

Uncertainty quantification of reference based cellular deconvolution algorithms

Dorothea Vellame et al.Jun 17, 2022
Abstract The majority of epigenetic epidemiology studies to date have generated genome-wide profiles from bulk tissues (e.g. whole blood) however these are vulnerable to confounding from variation in cellular composition. Proxies for cellular composition can be mathematically derived from the bulk tissue profiles using a deconvolution algorithm however, there is no method to assess the validity of these estimates for a dataset where the true cellular proportions are unknown. In this study, we describe, validate and characterise a sample level accuracy metric for derived cellular heterogeneity variables. The CETYGO score captures the deviation between a sample’s DNAm profile and its expected profile given the estimated cellular proportions and cell type reference profiles.We demonstrate that the CETYGO score consistently distinguishes inaccurate and incomplete deconvolutions when applied to reconstructed whole blood profiles. By applying our novel metric to > 6,300 empirical whole blood profiles, we find that estimating accurate cellular composition is influenced by both technical and biological variation. In particular, we show that when using the standard reference panel for whole blood, less accurate estimates are generated for females, neonates, older individuals and smokers. Our results highlight the utility of a metric to assess the accuracy of cellular deconvolution, and describe how it can enhance studies of DNA methylation that are reliant on statistical proxies for cellular heterogeneity. To facilitate incorporating our methodology into existing pipelines, we have made it freely available as an R package ( https://github.com/ds420/CETYGO ).
0

Properties of the epigenetic clock and age acceleration

Louis Khoury et al.Jul 6, 2018
Background: The methylation status of numerous CpG sites in the human genome varies with age. The Horvath epigenetic clock used a wide variety of published DNA methylation data to produce an age prediction that has been widely used to, predict age in unknown samples, and draw conclusions about speed of ageing in various tissues, environments, and diseases. Despite its utility, there are a number of assumptions in the model that require examination. We explore the characteristics of the model in whole blood and multiple brain regions from older people, who are not well represented in the original training data, and in blood from a cross-sectional population study. Results: We find that the model systematically underestimates age in tissues from older people. A decrease in slope of the predicted ages were observed at approximately 60 years, indicating that some loci in the model may change differently with age, and that age acceleration measures will themselves be age-dependent. This is seen most strongly in the cerebellum but is also present in other examined tissues, and is consistently observed in multiple datasets. An apparent association of Alzheimer s disease with age acceleration disappears when age is used as a covariate. Association tests in the literature use a variety of methods for calculating age acceleration and often do not use age as a covariate. This is a potential cause of misleading findings. Conclusions: Associations of phenotypes with age acceleration should be evaluated cautiously, and chronological age should be included as a covariate in all analyses.
Load More