ML
Megan Leask
Author with expertise in Uric Acid in Cardiovascular and Renal Health
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
4
(25% Open Access)
Cited by:
1
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
17

SNVformer: An Attention-based Deep Neural Network for GWAS Data

Kieran Elmes et al.Jul 10, 2022
Abstract Despite being the widely-used gold standard for linking common genetic variations to phenotypes and disease, genome-wide association studies (GWAS) suffer major limitations, partially attributable to the reliance on simple, typically linear, models of genetic effects. More elaborate methods, such as epistasis-aware models, typically struggle with the scale of GWAS data. In this paper, we build on recent advances in neural networks employing Transformer-based architectures to enable such models at a large scale. As a first step towards replacing linear GWAS with a more expressive approximation, we demonstrate prediction of gout, a painful form of inflammatory arthritis arising when monosodium urate crystals form in the joints under high serum urate conditions, from Single Nucleotide Variants (SNVs) using a scalable (long input) variant of the Transformer architecture. Furthermore, we show that sparse SNVs can be efficiently used by these Transformer-based networks without expanding them to a full genome. By appropriately encoding SNVs, we are able to achieve competitive initial performance, with an AUROC of 83% when classifying a balanced test set using genotype and demographic information. Moreover, the confidence with which the network makes its prediction is a good indication of the prediction accuracy. Our results indicate a number of opportunities for extension, enabling full genome-scale data analysis using more complex and accurate genotype-phenotype association models.
17
Citation1
0
Save
0

Molecular evolutionary trends and feeding ecology diversification in the Hemiptera, anchored by the milkweed bug genome

Kristen Panfilio et al.Oct 11, 2017
Background: The Hemiptera (aphids, cicadas, and true bugs) are a key insect order whose members offer a close outgroup to the Holometabola, with high diversity within the order for feeding ecology and excellent experimental tractability for molecular genetics. Sequenced genomes have recently become available for hemipteran pest species such as phloem-feeding aphids and blood-feeding bed bugs. To complement and build upon these resources, we present the genome sequence and comparative analyses centered on the large milkweed bug, Oncopeltus fasciatus, a seed feeder of the family Lygaeidae. Results: The 926-Mb genome of Oncopeltus is relatively well represented by the current assembly and official gene set, which supports Oncopeltus as a fairly conservative hemipteran species for anchoring molecular comparisons. We use our genomic and RNA-seq data not only to characterize features of the protein-coding gene repertoire and perform isoform-specific RNAi, but also to elucidate patterns of molecular evolution and physiology. We find ongoing, lineage-specific expansion and diversification of repressive C2H2 zinc finger proteins and of intron gain and turnover in the Hemiptera. These analyses also weigh the relative importance of lineage and genome size as predictors of gene structure evolution in insects. Furthermore, we identify enzymatic gains and losses that correlate with hemipteran feeding biology, particularly for reductions in chemoreceptor family size and loss of metabolic reactions within species with derived, fluid-nutrition feeding modes. Conclusions: With the milkweed bug genome, for the first time we have a critical mass of sequenced species representing a hemimetabolous insect order, substantially improving the diversity of insect genomics beyond holometabolans such as flies and ants. We use this addition to define commonalities among the Hemiptera and then delve into how hemipteran species' genomes reflect their feeding ecology types. Our novel and detailed analyses integrate global and rigorous manual approaches, generating hypotheses and identifying specific sets of genes for future investigation. Given Oncopeltus's strength as an experimental research model, we take particular care to evaluate the sequence resources presented here, augmenting its foundation for molecular research and highlighting potentially general considerations exemplified in the assembly and annotation of this medium-sized genome.
0

A non-coding genetic variant maximally associated with serum urate levels is functionally linked to HNF4A-dependent PDZK1 expression

Sarada Ketharnathan et al.Jul 8, 2018
Several dozen genetic variants associate with serum urate levels, but the precise molecular mechanisms by which they affect serum urate are unknown. Here we tested for functional linkage of the maximally-associated genetic variant rs1967017 at the PDZK1 locus to elevated PDZK1 expression. We performed expression quantitative trait locus (eQTL) and likelihood analyses followed by gene expression assays. Zebrafish were used to determine the ability of rs1967017 to direct tissue-specific gene expression. Luciferase assays in HEK293 and HepG2 cells measured the effect of rs1967017 on transcription amplitude. PAINTOR analysis revealed rs1967017 as most likely to be causal and rs1967017 was an eQTL for PDZK1 in the intestine. The region harboring rs1967017 was capable of directly driving green fluorescent protein expression in the kidney, liver and intestine of zebrafish embryos, consistent with a conserved ability to confer tissue-specific expression. The urate-increasing T-allele of rs1967017 strengthens a binding site for the transcription factor HNF4A. siRNA depletion of HNF4A reduced endogenous PDZK1 expression in HepG2 cells. Luciferase assays showed that the T-allele of rs1967017 gains enhancer activity relative to the urate-decreasing C-allele, with T-allele enhancer activity abrogated by HNF4A depletion. HNF4A physically binds the rs1967017 region, suggesting direct transcriptional regulation of PDZK1 by HNF4A. With other reports our data predict that the urate-raising T-allele of rs1967017 enhances HNF4A binding to the PDZK1 promoter, thereby increasing PDZK1 expression. As PDZK1 is a scaffold protein for many ion channel transporters, increased expression can be predicted to increase activity of urate transporters and alter excretion of urate.
0

Genomic dissection of 43 serum urate-associated loci provides multiple insights into molecular mechanisms of urate control.

James Boocock et al.Aug 22, 2019
Serum urate is the end-product of purine metabolism. Elevated serum urate is causal of gout and a predictor of renal disease, cardiovascular disease and other metabolic conditions. Genome-wide association studies (GWAS) have reported dozens of loci associated with serum urate control, however there has been little progress in understanding the molecular basis of the associated loci. Here we employed trans-ancestral meta-analysis using data from European and East Asian populations to identify ten new loci for serum urate levels. Genome-wide colocalization with cis-expression quantitative trait loci (eQTL) identified a further five new loci. By cis- and trans-eQTL colocalization analysis we identified 24 and 20 genes respectively where the causal eQTL variant has a high likelihood that it is shared with the serum urate-associated locus. One new locus identified was SLC22A9 that encodes organic anion transporter 7 (OAT7). We demonstrate that OAT7 is a very weak urate-butyrate exchanger. Newly implicated genes identified in the eQTL analysis include those encoding proteins that make up the dystrophin complex, a scaffold for signaling proteins and transporters at the cell membrane; MLXIP that, with the previously identified MLXIPL, is a transcription factor that may regulate serum urate via the pentose-phosphate pathway; and MRPS7 and IDH2 that encode proteins necessary for mitochondrial function. Trans-ancestral functional fine-mapping identified six loci (RREB1, INHBC, HLF, UBE2Q2, SFMBT1, HNF4G) with colocalized eQTL that contained putative causal SNPs (posterior probability of causality > 0.8). This systematic analysis of serum urate GWAS loci has identified candidate causal genes at 19 loci and a network of previously unidentified genes likely involved in control of serum urate levels, further illuminating the molecular mechanisms of urate control.