KS
Kerrin Small
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(42% Open Access)
Cited by:
26
h-index:
16
/
i10-index:
15
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Tissue-Specific Alteration of Metabolic Pathways Influences Glycemic Regulation

Natasha Ng et al.Oct 3, 2019
+260
J
S
N
Summary Metabolic dysregulation in multiple tissues alters glucose homeostasis and influences risk for type 2 diabetes (T2D). To identify pathways and tissues influencing T2D-relevant glycemic traits (fasting glucose [FG], fasting insulin [FI], two-hour glucose [2hGlu] and glycated hemoglobin [HbA1c]), we investigated associations of exome-array variants in up to 144,060 individuals without diabetes of multiple ancestries. Single-variant analyses identified novel associations at 21 coding variants in 18 novel loci, whilst gene-based tests revealed signals at two genes, TF (HbA1c) and G6PC (FG, FI). Pathway and tissue enrichment analyses of trait-associated transcripts confirmed the importance of liver and kidney for FI and pancreatic islets for FG regulation, implicated adipose tissue in FI and the gut in 2hGlu, and suggested a role for the non-endocrine pancreas in glucose homeostasis. Functional studies demonstrated that a novel FG/FI association at the liver-enriched G6PC transcript was driven by multiple rare loss-of-function variants. The FG/HbA1c-associated, islet-specific G6PC2 transcript also contained multiple rare functional variants, including two alleles within the same codon with divergent effects on glucose levels. Our findings highlight the value of integrating genomic and functional data to maximize biological inference. Highlights 23 novel coding variant associations (single-point and gene-based) for glycemic traits 51 effector transcripts highlighted different pathway/tissue signatures for each trait The exocrine pancreas and gut influence fasting and 2h glucose, respectively Multiple variants in liver-enriched G6PC and islet-specific G6PC2 influence glycemia
0
Citation11
0
Save
0

The Trans-Ancestral Genomic Architecture of Glycaemic Traits

Ji Chen et al.Jul 25, 2020
+411
J
T
J
Abstract Glycaemic traits are used to diagnose and monitor type 2 diabetes, and cardiometabolic health. To date, most genetic studies of glycaemic traits have focused on individuals of European ancestry. Here, we aggregated genome-wide association studies in up to 281,416 individuals without diabetes (30% non-European ancestry) with fasting glucose, 2h-glucose post-challenge, glycated haemoglobin, and fasting insulin data. Trans-ancestry and single-ancestry meta-analyses identified 242 loci (99 novel; P <5×10 -8 ), 80% with no significant evidence of between-ancestry heterogeneity. Analyses restricted to European ancestry individuals with equivalent sample size would have led to 24 fewer new loci. Compared to single-ancestry, equivalent sized trans-ancestry fine-mapping reduced the number of estimated variants in 99% credible sets by a median of 37.5%. Genomic feature, gene-expression and gene-set analyses revealed distinct biological signatures for each trait, highlighting different underlying biological pathways. Our results increase understanding of diabetes pathophysiology by use of trans-ancestry studies for improved power and resolution.
0
Citation10
0
Save
1

Rare coding variants in 35 genes associate with circulating lipid levels – a multi-ancestry analysis of 170,000 exomes

George Hindy et al.Dec 23, 2020
+185
M
P
G
Abstract Large-scale gene sequencing studies for complex traits have the potential to identify causal genes with therapeutic implications. We performed gene-based association testing of blood lipid levels with rare (minor allele frequency<1%) predicted damaging coding variation using sequence data from >170,000 individuals from multiple ancestries: 97,493 European, 30,025 South Asian, 16,507 African, 16,440 Hispanic/Latino, 10,420 East Asian, and 1,182 Samoan. We identified 35 genes associated with circulating lipid levels. Ten of these: ALB , SRSF2 , JAK2, CREB3L3 , TMEM136 , VARS , NR1H3 , PLA2G12A , PPARG and STAB1 have not been implicated for lipid levels using rare coding variation in population-based samples. We prioritize 32 genes identified in array-based genome-wide association study (GWAS) loci based on gene-based associations, of which three: EVI5, SH2B3 , and PLIN1 , had no prior evidence of rare coding variant associations. Most of the associated genes showed evidence of association in multiple ancestries. Also, we observed an enrichment of gene-based associations for low-density lipoprotein cholesterol drug target genes, and for genes closest to GWAS index single nucleotide polymorphisms (SNP). Our results demonstrate that gene-based associations can be beneficial for drug target development and provide evidence that the gene closest to the array-based GWAS index SNP is often the functional gene for blood lipid levels.
1
Citation4
0
Save
0

Mapping eQTLs With RNA-Seq Reveals Novel SLE Susceptibility Genes, Non-Coding RNAs, and Alternative-Splicing Events That Are Concealed Using Microarrays

Christopher Odhams et al.Sep 19, 2016
+8
D
K
C
Abstract Studies attempting to functionally interpret complex-disease susceptibility loci by GWAS and eQTL integration have predominantly employed microarrays to quantify gene-expression. RNA-Seq has the potential to discover a more comprehensive set of eQTLs and illuminate the underlying molecular consequence. We examine the functional outcome of 39 variants associated with Systemic Lupus Erythematosus (SLE) through integration of GWAS and eQTL data from the TwinsUK microarray and RNA-Seq cohort in lymphoblastoid cell lines. We use conditional analysis and a Bayesian colocalisation method to provide evidence of a shared causal-variant, then compare the ability of each quantification type to detect disease relevant eQTLs and eGenes. We discovered a greater frequency of candidate-causal eQTLs using RNA-Seq, and identified novel SLE susceptibility genes that were concealed using microarrays (e.g. NADSYN1 , SKP1 , and TCF7 ). Many of these eQTLs were found to influence the expression of several genes, suggesting risk haplotypes may harbour multiple functional effects. We pinpointed eQTLs modulating expression of four non-coding RNAs; three of which were replicated in whole-blood. Novel SLE associated splicing events were identified in the T-reg restricted transcription factor, IKZF2 , the autophagy-related gene WDFY4 , and the redox coenzyme NADSYN1 , through asQTL mapping using the Geuvadis cohort. We have significantly increased our understanding of the genetic control of gene-expression in SLE by maximising the leverage of RNA-Seq and performing integrative GWAS-eQTL analysis against gene, exon, and splice-junction quantifications. In doing so, we have identified novel SLE candidate genes and specific molecular mechanisms that will serve as the basis for targeted follow-up studies.
0
Citation1
0
Save
0

Epigenetic findings in periodontitis in UK twins: a cross sectional study

Yuko Kurushima et al.Aug 2, 2018
+9
P
K
Y
Background: Genetic and environmental risk factors contribute to periodontal disease, but the underlying susceptibility pathways are not fully understood. Epigenetic mechanisms are malleable regulators of gene function that can change in response to genetic and environmental stimuli, thereby providing a potential mechanism mediating risk effects in periodontitis. The aim of this study is to identify epigenetic changes across tissues that are associated with periodontal disease. Methods: Self-reported gingival bleeding, and history of gum disease or tooth mobility were used as indicators of periodontal disease. DNA methylation profiles were generated using the Infinium HumanMethylation450 BeadChip in whole blood, buccal, and adipose samples from predominantly older female twins (mean age 58) from the TwinsUK cohort. Epigenome-wide association scans (EWAS) of gingival bleeding and tooth mobility were conducted in whole blood in 528 and 492 twins, respectively. Subsequently, targeted candidate gene analysis including 28 genomic signals was performed for phenotype-methylation associations in 41 (Tooth mobility) and 43 (Gingival bleeding) buccal samples, and 501 (Tooth mobility) and 556 (Gingival bleeding) adipose DNA samples. Results: Epigenome-wide analyses in blood identified one CpG-site (cg21245277 in ZNF804A) associated with gingival bleeding (FDR=0.03, nominal p-value=7.17e-8), and 58 sites associated with tooth mobility (FDR<0.05) with the top signals in IQCE and XKR6. Epigenetic variation at 28 candidate regions (256 CpG-sites) for chronic periodontitis showed a strong enrichment for association with periodontal traits, and signals in eight genes (VDR, IL6ST, TMCO6, IL1RN, CD44, IL1B, WHAMM, and CXCL1) were significant in both traits. The methylation-phenotype association signals validated in buccal samples, and a subset (25%) also validated in adipose tissue. Conclusions: Epigenome-wide analyses in female adult twins identified specific DNA methylation changes linked to self-reported periodontal disease. Future work will explore the environmental basis and functional impact of these results to infer potential for strategic personalized treatments and prevention of chronic periodontitis.
0

Exploratory analysis and error modeling of a sequencing technology

Michael Inouye et al.Mar 11, 2016
+10
Y
M
M
Next generation DNA sequencing methods have created an unprecedented leap in sequence data generation, thus novel computational tools and statistical models are required to optimize and assess the resulting data. In this report, we explore underlying causes of error for the Illumina Genome Analyzer (IGA) sequencing technology and attempt to quantify their effects using a human bacterial artificial chromosome sequenced to 60,000 fold coverage. Seven potential error predictors are considered: Phred score, read entropy, tile coordinates, local tile density, base position within read, nucleotide call, and lane. With these parameters, logistic regression and log-linear models are constructed and used to show that each of the potential predictors contributes to error (P<1x10-4). With this additional information, we apply the logistic model and achieve a 3% improvement in both the sensitivity and specificity to detect IGA errors. Further, we demonstrate that these modeling approaches can be used as a feedback loop to inform laboratory methods and identify specific machine or run bias.
0

Transcriptome Sequencing Reveals Widespread Gene-Gene and Gene-Environment Interactions

Alfonso Buil et al.Oct 19, 2014
+10
T
A
A
Understanding the genetic architecture of gene expression is an intermediate step to understand the genetic architecture of complex diseases. RNA-seq technologies have improved the quantification of gene expression and allow to measure allelic specific expression (ASE)1-3. ASE is hypothesized to result from the direct effect of cis regulatory variants, but a proper estimation of the causes of ASE has not been performed to date. In this study we take advantage of a sample of twins to measure the relative contribution of genetic and environmental effects on ASE and we found substantial effects of gene x gene (GxG) and gene x environment (GxE) interactions. We propose a model where ASE requires genetic variability in cis, a difference in the sequence of both alleles, but the magnitude of the ASE effect depends on trans genetic and environmental factors that interact with the cis genetic variants. We uncover large GxG and GxE effects on gene expression and likely complex phenotypes that currently remain elusive.
19

Analysis of nucleus and cytoplasm-specific RNA fractions demonstrates that a significant proportion of the genetic regulation of gene expression across the human brain occurs post-transcriptionally

Karishma D’Sa et al.Jul 1, 2022
+8
J
D
K
ABSTRACT Gaining insight into the genetic regulation of gene expression in human brain is key to the interpretation of genome-wide association studies for major neurological and neuropsychiatric diseases. Expression quantitative trait loci (eQTL) analyses have largely been used to achieve this, providing valuable insights into the genetic regulation of steady-state RNA in human brain, but not distinguishing between molecular processes regulating transcription and stability. RNA quantification within cellular fractions can disentangle these processes in cell types and tissues which are challenging to model in vitro. We investigated the underlying molecular processes driving the genetic regulation of gene expression specific to a cellular fraction using allele-specific expression (ASE). Applying ASE analysis to genomic and transcriptomic data from paired nuclear and cytoplasmic fractions of anterior prefrontal cortex, cerebellar cortex and putamen tissues from 4 post-mortem neuropathologically-confirmed control human brains, we demonstrate that a significant proportion of genetic regulation of gene expression occurs post-transcriptionally in the cytoplasm, with genes undergoing this form of regulation more likely to be synaptic. These findings have implications for understanding the structure of gene expression regulation in human brain, and importantly the interpretation of rapidly growing single-nucleus brain RNA-sequencing and eQTL datasets, where cytoplasm-specific regulatory events could be missed.
0

Introducing ExHiBITT – Exploring Host microbiome inTeractions in Twins-, a colon multiomic cohort study

Marina Mora-Ortiz et al.Oct 7, 2019
+8
K
N
M
The colon is populated by approximately 1012 microorganisms, but the relationships between this microbiome and the host health status are still not completely understood. Participants from the TwinsUK cohort were recruited to study the interactions between the microbiome and host adaptive immunity. In total, 205 monozygotic twins were recruited from the wider TwinsUK cohort. They completed health questionnaires, and provided saliva, blood, colon biopsies from three different locations, caecal fluid, and two faecal- samples. Here, our objective is to present the cohort characteristics of ExHiBITT including i) biomedical phenotypes, ii) environmental factors and ii) colonoscopic findings. A significant proportion of this apparently normal cohort had colonic polyps (28%), which are of interest as potential precursors of colorectal cancer, and as expected, the number of polyps found was significantly correlated with BMI and age. Hitherto undiagnosed diverticulosis was also not infrequently found during colonoscopy (26%) and was associated in changes in Hybrid Th1-17 cells in the colon. Twin proband cooccurrence rate for diverticulosis (82%), was much higher than for polyps (42%). Familial factors affecting morphology or tolerance may contribute to the ease of endoscopy, as both the time to reach the caecum, and pain perceived were highly concordant (proband concordance: 85% and 56% respectively). We found the expected positive relationship between BMI and colonoscopic anomalies such as diverticular disease and polyps in the whole population, but within twin pairs this association was reversed. This suggests that familial factors confound these associations. Host and microbial Next Generation Sequencing and metabolomics of the samples collected are planned in this cohort.
0

Quantifying the degree of sharing of genetic and non-genetic causes of gene expression variability across four tissues.

Alfonso Buil et al.May 13, 2016
+9
K
M
A
Gene expression can provide biological mechanisms which underlie genetic associations with complex traits and diseases, but often the most relevant tissue for the trait is inaccessible and a proxy is the only alternative. Here, we investigate shared and tissue specific patterns of variability in expression in multiple tissues, to quantify the degree of sharing of causes (genetic or non-genetic) of variability in gene expression among tissues. Using gene expression in ~800 female twins from the TwinsUK cohort in skin, fat, whole blood and lymphoblastoid cell lines (LCLs), we identified 9166 significant cis-eQTLs in fat, 9551 in LCLs, 8731 in skin and 5313 in blood (1% FDR). We observed up to 80% of cis-eQTLs are shared in pairs of tissues. In addition, the cis genetic correlation between tissues is > 90% for 35% of the genes, indicating for these genes a largely tissue-shared component of cis regulation. However, variance components show that cis genetic signals explain only a small fraction of the variation in expression, with from 67-87% of the variance explained by environmental factors, and 53% of the genetic effects occurring in trans. We observe a trans genetic correlation of 0 for all genes except a few which show correlation between fat and skin expression. The environmental effects are also observed to be entirely tissue specific, despite related tissues largely sharing exposures. These results demonstrate that patterns of gene expression are largely tissue specific, strongly supporting the need to study higher order regulatory interactions in the appropriate tissue context with large samples sizes and diversity of environmental contexts.
Load More