MR
Magnus Rattray
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
24
(54% Open Access)
Cited by:
462
h-index:
47
/
i10-index:
107
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

C9ORF72 GGGGCC Expanded Repeats Produce Splicing Dysregulation which Correlates with Disease Severity in Amyotrophic Lateral Sclerosis

Johnathan Cooper‐Knock et al.May 27, 2015
+8
P
J
J
Objective An intronic GGGGCC-repeat expansion of C9ORF72 is the most common genetic variant of amyotrophic lateral sclerosis (ALS) and frontotemporal dementia. The mechanism of neurodegeneration is unknown, but a direct effect on RNA processing mediated by RNA foci transcribed from the repeat sequence has been proposed. Methods Gene expression profiling utilised total RNA extracted from motor neurons and lymphoblastoid cell lines derived from human ALS patients, including those with an expansion of C9ORF72, and controls. In lymphoblastoid cell lines, expansion length and the frequency of sense and antisense RNA foci was also examined. Results Gene level analysis revealed a number of differentially expressed networks and both cell types exhibited dysregulation of a network functionally enriched for genes encoding ‘RNA splicing’ proteins. There was a significant overlap of these genes with an independently generated list of GGGGCC-repeat protein binding partners. At the exon level, in lymphoblastoid cells derived from C9ORF72-ALS patients splicing consistency was lower than in lines derived from non-C9ORF72 ALS patients or controls; furthermore splicing consistency was lower in samples derived from patients with faster disease progression. Frequency of sense RNA foci showed a trend towards being higher in lymphoblastoid cells derived from patients with shorter survival, but there was no detectable correlation between disease severity and DNA expansion length. Significance Up-regulation of genes encoding predicted binding partners of the C9ORF72 expansion is consistent with an attempted compensation for sequestration of these proteins. A number of studies have analysed changes in the transcriptome caused by C9ORF72 expansion, but to date findings have been inconsistent. As a potential explanation we suggest that dynamic sequestration of RNA processing proteins by RNA foci might lead to a loss of splicing consistency; indeed in our samples measurement of splicing consistency correlates with disease severity.
0
Citation441
0
Save
0

Analysis of chromatin organization and gene expression in T cells identifies functional genes for rheumatoid arthritis

Jing Yang et al.Nov 1, 2019
+10
P
A
J
Abstract Genome-wide association studies have identified genetic variation contributing to complex disease risk. However, assigning causal genes and mechanisms has been more challenging because disease-associated variants are often found in distal regulatory regions with cell-type specific behaviours. Here, we collect ATAC-seq, Hi-C, Capture Hi-C and nuclear RNA-seq data in stimulated CD4+ T-cells over 24 hours, to identify functional enhancers regulating gene expression. We characterise changes in DNA interaction and activity dynamics that correlate with changes gene expression, and find that the strongest correlations are observed within 200 kb of promoters. Using rheumatoid arthritis as an example of T-cell mediated disease, we demonstrate interactions of expression quantitative trait loci with target genes, and confirm assigned genes or show complex interactions for 20% of disease associated loci, including FOXO1, which we confirm using CRISPR/Cas9.
0
Citation11
0
Save
1

Non-parametric modelling of temporal and spatial counts data from RNA-seq experiments

Nuha Bintayyash et al.Jul 30, 2020
+4
S
S
N
A bstract Motivation The negative binomial distribution has been shown to be a good model for counts data from both bulk and single-cell RNA-sequencing (RNA-seq). Gaussian process (GP) regression provides a useful non-parametric approach for modeling temporal or spatial changes in gene expression. However, currently available GP regression methods that implement negative binomial likelihood models do not scale to the increasingly large datasets being produced by single-cell and spatial transcriptomics. Results The GPcounts package implements GP regression methods for modelling counts data using a negative binomial likelihood function. Computational efficiency is achieved through the use of variational Bayesian inference. The GP function models changes in the mean of the negative binomial likelihood through a logarithmic link function and the dispersion parameter is fitted by maximum likelihood. We validate the method on simulated time course data, showing that it is better able to identify changes in over-dispersed counts data than methods based on Gaussian or Poisson likelihoods. To demonstrate temporal inference, we apply GPcounts to single-cell RNA-seq datasets after pseudotime and branching inference. To demonstrate spatial inference, we apply GPcounts to data from the mouse olfactory bulb to identify spatially variable genes and compare to two published GP methods. We also provide the option of modelling additional dropout using a zero-inflated negative binomial. Our results show that GPcounts can be used to model temporal and spatial counts data in cases where simpler Gaussian and Poisson likelihoods are unrealistic. Availability GPcounts is implemented using the GPflow library in Python and is available at https://github.com/ManchesterBioinference/GPcounts along with the data, code and notebooks required to reproduce the results presented here. Contact nuha.bintayyash@manchester.ac.uk or magnus.rattray@manchester.ac.uk
15

Scalable inference of transcriptional kinetic parameters from MS2 time series data

Jonathan Bowles et al.Dec 6, 2020
M
H
C
J
A bstract Motivation The MS2-McP (MS2 coat protein) live imaging system allows for visualisation of transcription dynamics through the introduction of hairpin stem-loop sequences into a gene. A fluorescent signal at the site of nascent transcription in the nucleus quantifies mRNA production. computational modelling can be used to infer the promoter states along with the kinetic parameters governing transcription, such as promoter switching frequency and polymerase loading rate. However, modelling of the fluorescent trace presents a challenge due its persistence; the observed fluorescence at a given time point depends on both current and previous promoter states. A memory-adjusted Hidden Markov Model (mHMM) was recently introduced to allow inference of promoter activity from MS2-McP data. However, the computational time for inference scales exponentially with gene length and the mHMM is therefore not currently practical for application to many eukaryotic genes. Results We present a scalable implementation of the mHMM for fast inference of promoter activity and transcriptional kinetic parameters. This new method can model genes of arbitrary length through the use of a time-adaptive truncated compound state space. The truncated state space provides a good approximation to the full state space by retaining the most likely set of states at each time during the forward pass of the algorithm. Testing on MS2-MCP fluorescent data collected from early Drosophila melanogaster embryos indicates that the method provides accurate inference of kinetic parameters within a computationally feasible timeframe. The inferred promoter traces generated by the model can also be used to infer single-cell transcriptional parameters. Availability Python implementation available at https://github.com/ManchesterBioinference/burstInfer , along with code to reproduce the examples presented here.
15
Citation2
0
Save
1

A cell atlas of the developing human outflow tract of the heart and its adult derivatives

Rotem Leshem et al.Apr 6, 2023
+8
J
S
R
Abstract The outflow tract (OFT) of the heart carries blood away from the heart into the great arteries. During embryogenesis, the OFT divides to form the aorta and pulmonary trunk, creating the double circulation present in mammals. Defects in this area account for one-third of all congenital heart disease cases. Here, we present comprehensive transcriptomic data on the developing OFT at two distinct timepoints (embryonic and fetal) and its adult derivatives, the aortic valves, and use spatial transcriptomics to define the distribution of cell populations. We uncover that distinctive embryonic signatures persist in adult cells and can be used as labels to retrospectively attribute relationships between cells separated by a large time scale. Our findings define the cellular and molecular signatures of the OFT and its distinct cell lineages, which is critical for understanding congenital heart defects and developing cardiac tissue for regenerative medicine.
1
Citation2
0
Save
20

Single molecule imaging and modelling of mRNA decay dynamics in theDrosophilaembryo

Lauren Beadle et al.Mar 18, 2022
+3
Y
J
L
Abstract Regulation of mRNA degradation is critical for a diverse array of cellular processes and developmental cell fate decisions. Many methods for determining mRNA half-lives rely on transcriptional inhibition or metabolic labelling. Here we use a non-invasive method for estimating half-lives for hundreds of mRNAs in the early Drosophila embryo. This approach uses the intronic and exonic reads from a total RNA-seq time series and Gaussian process regression to model the dynamics of premature and mature mRNAs. We show how regulation of mRNA stability is used to establish a range of mature mRNA dynamics during embryogenesis, despite shared transcription profiles. Using single molecule imaging we provide evidence that, for the mRNAs tested, there is a correlation between short half-life and mRNA association with P-bodies. Moreover, we detect an enrichment of mRNA 3’ ends in P-bodies in the early embryo, consistent with 5’ to 3’ degradation occurring in P-bodies for at least a subset of mRNAs. We discuss our findings in relation to recently published data suggesting that the primary function of P-bodies in other biological contexts is mRNA storage.
20
Citation1
0
Save
21

Inferring kinetic parameters of oscillatory gene regulation from single cell time series data

Joshua Burton et al.May 13, 2021
+2
M
C
J
Abstract Gene expression dynamics, such as stochastic oscillations and aperiodic fluctuations, have been associated with cell fate changes in multiple contexts, including development and cancer. Single cell live imaging of protein expression with endogenous reporters is widely used to observe such gene expression dynamics. However, the experimental investigation of regulatory mechanisms underlying the observed dynamics is challenging, since these mechanisms include complex interactions of multiple processes, including transcription, translation, and protein degradation. Here, we present a Bayesian method to infer kinetic parameters of oscillatory gene expression regulation using an auto-negative feedback motif with delay. Specifically, we use a delay-adapted nonlinear Kalman filter within a Metropolis-adjusted Langevin algorithm to identify posterior probability distributions. Our method can be applied to time series data on gene expression from single cells and is able to infer multiple parameters simultaneously. We apply it to published data on murine neural progenitor cells and show that it outperforms alternative methods. We further analyse how parameter uncertainty depends on the duration and time resolution of an imaging experiment, to make experimental design recommendations. This work demonstrates the utility of parameter inference on time course data from single cells and enables new studies on cell fate changes and population heterogeneity.
21
Citation1
0
Save
0

Uncovering tissue-specific binding features from differential deep learning

Mike Phuycharoen et al.Apr 11, 2019
+5
L
P
M
Motivation Transcription factors (TFs) can bind DNA in a cooperative manner, enabling a mutual increase in occupancy. Through this type of interaction, alternative binding sites can be preferentially bound in different tissues to regulate tissue-specific expression programmes. Recently, deep learning models have become state-of-the-art in various pattern analysis tasks, including applications in the field of genomics. We therefore investigate the application of convolutional neural network (CNN) models to the discovery of sequence features determining cooperative and differential TF binding across tissues.Results We analyse ChIP-seq data from MEIS, TFs which are broadly expressed across mouse branchial arches, and HOXA2, which is expressed in the second and more posterior branchial arches. By developing models predictive of MEIS differential binding in all three tissues we are able to accurately predict HOXA2 co-binding sites. We evaluate transfer-like and multitask approaches to regularising the high-dimensional classification task with a larger regression dataset, allowing for creation of deeper and more accurate models. We test the performance of perturbation and gradient-based attribution methods in identifying the HOXA2 sites from differential MEIS data. Our results show that deep regularised models significantly outperform shallow CNNs as well as k-mer methods in the discovery of tissue-specific sites bound in vivo .Availability For implementation and models please visit .
0

Modulation of promoter occupancy dictates the transcriptional response to graded BMP signalling levels in the Drosophila embryo

Caroline Hoppe et al.Nov 10, 2019
+4
T
J
C
Morphogen gradients specify cell fates during development, with a classic example being the BMP gradient’s conserved role in embryonic dorsal-ventral axis patterning. Here we use quantitative imaging and computational modelling to determine how the BMP gradient is interpreted at single-cell resolution in the Drosophila embryo. We show that BMP signalling levels are decoded by modulating promoter occupancy, the time the promoter is active, predominantly through regulating the promoter activation rate. As a result, graded mRNA numbers are detected for BMP target genes in cells across their expression domains. Introducing a heterologous promoter into a BMP target gene changes burst amplitude but not promoter occupancy suggesting that, while the promoter sequence controls amplitude, occupancy depends on the amount of BMP signal decoded by the enhancer. We provide evidence that graded mRNA output is a general feature of morphogen gradient interpretation and discuss how this can impact on cell fate decisions.
0

HOX paralogs selectively convert binding of ubiquitous transcription factors into tissue-specific patterns of enhancer activation

Laure Bridoux et al.Dec 11, 2019
+8
J
P
L
Gene expression programs determine cell fate in embryonic development and their dysregulation results in disease. Transcription factors (TFs) control gene expression by binding to enhancers, but how TFs select and activate their target enhancers is still unclear. HOX TFs share conserved homeodomains with highly similar sequence recognition properties, yet they impart the identity of different animal body parts. To understand how HOX TFs control their specific transcriptional programs in vivo, we compared HOXA2 and HOXA3 binding profiles in the mouse embryo. HOXA2 and HOXA3 directly cooperate with TALE TFs and selectively target different subsets of a broad TALE chromatin platform. Binding of HOX and tissue-specific TFs convert low affinity TALE binding into high confidence, tissue-specific binding events, which bear the mark of active enhancers. We propose that HOX paralogs, alone and in combination with tissue-specific TFs, generate tissue-specific transcriptional outputs by modulating the activity of TALE TFs at selected enhancers.
Load More