RS
R Smith
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
This user has not unlocked any achievements yet.
Key Stats
Upvotes received:
0
Publications:
5
(20% Open Access)
Cited by:
0
h-index:
10
/
i10-index:
10
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Information Theory and Stem Cell Biology

R Smith et al.Mar 14, 2017
B
R
Purpose of Review: To outline how ideas from Information Theory may be used to analyze single cell data and better understand stem cell behaviour. Recent findings: Recent technological breakthroughs in single cell profiling have made it possible to interrogate cell-to-cell variability in a multitude of contexts, including the role it plays in stem cell dynamics. Here we review how measures from information theory are being used to extract biological meaning from the complex, high-dimensional and noisy datasets that arise from single cell profiling experiments. We also discuss how concepts linking information theory and statistical mechanics are being used to provide insight into cellular identity, variability and dynamics. Summary: We provide a brief introduction to some basic notions from information theory and how they may be used to understand stem cell identities at the single cell level. We also discuss how work in this area might develop in the near future.
0

Stem cell differentiation is a stochastic process with memory

Patrick Stumpf et al.Jan 17, 2017
+9
M
R
P
Pluripotent stem cells are able to self-renew indefinitely in culture and differentiate into all somatic cell types in vivo. While much is known about the molecular basis of pluripotency, the molecular mechanisms of lineage commitment are complex and only partially understood. Here, using a combination of single cell profiling and mathematical modeling, we examine the differentiation dynamics of individual mouse embryonic stem cells (ESCs) as they progress from the ground state of pluripotency along the neuronal lineage. In accordance with previous reports we find that cells do not transit directly from the pluripotent state to the neuronal state, but rather first stochastically permeate an intermediate primed pluripotent state, similar to that found in the maturing epiblast in development. However, analysis of rate at which individual cells enter and exit this intermediate metastable state using a hidden Markov model reveals that the observed ESC and epiblast-like 'macrostates' conceal a chain of unobserved cellular 'microstates', which individual cells transit through stochastically in sequence. These hidden microstates ensure that individual cells spend well-defined periods of time in each functional macrostate and encode a simple form of epigenetic 'memory' that allows individual cells to record their position on the differentiation trajectory. To examine the generality of this model we also consider the differentiation of mouse hematopoietic stem cells along the myeloid lineage and observe remarkably similar dynamics, suggesting a general underlying process. Based upon these results we suggest a statistical mechanics view of cellular identities that distinguishes between functionally-distinct macrostates and the many functionally-similar molecular microstates associated with each macrostate. Taken together these results indicate that differentiation is a discrete stochastic process amenable to analysis using the tools of statistical mechanics.
0

Mapping biology from mouse to man using transfer learning

Patrick Stumpf et al.Dec 28, 2019
+12
D
K
P
Biomedical research often involves conducting experiments on model organisms in the anticipation that the biology learnt from these experiments will transfer to the human. Yet, it is commonly the case that biology does not transfer effectively, often for unknown reasons. Despite its importance to translational research this transfer process is not currently rigorously quantified. Here, we show that transfer learning - the branch of machine learning that concerns passing information from one domain to another - can be used to efficiently map biology from mouse to man, using the bone marrow (BM) as a representative example of a complex tissue. We first trained an artificial neural network (ANN) to accurately recognize various different cell types in mouse BM using data obtained from single-cell RNA-sequencing (scRNA-Seq) experiments. We found that this ANN, trained exclusively on mouse data, was able to identify individual human cells obtained from comparable scRNA-Seq experiments of human BM with 83% overall accuracy. However, while some human cell types were easily identified, others were not, indicating important differences in biology. To obtain a more accurate map of the human BM we then retrained the mouse ANN using scRNA-Seq data from a limited sample of human BM cells. Typically, less than 10 human cells of a given type were needed to accurately learn its representation in the updated model. In some cases, human cell identities could be inferred directly from the mouse ANN without retraining, via a process of biologically-guided zero-shot learning. These results show how machine learning can be used to reconstruct complex biology from limited data and have broad implications for biomedical research.
0

Dual Dean entrainment with volume ratio modulation for efficient co-encapsulation: Extreme single-cell indexing

Jack Harrington et al.Apr 9, 2021
+12
J
L
J
Abstract The future of single cell diversity screens involves ever-larger sample sizes, dictating the need for higher throughput methods with low analytical noise to accurately describe the nature of the cellular system. Current approaches are limited by the Poisson statistic, requiring dilute cell suspensions and associated losses in throughput. In this contribution, we apply Dean entrainment to both cell and bead inputs, defining different volume packets to effect efficient co-encapsulation. Volume ratio scaling was explored to identify optimal conditions. This enabled the co-encapsulation of single cells with reporter beads at rates of ~1 million cells/hour, while increasing assay signal-to-noise with cell multiplet rates of ~2.5% and capturing ~70% of cells. The method, called Pirouette-seq, extends our capacity to investigate biological systems. TOC Abstract Pirouette-seq involves cell and reporter bead inertial ordering for efficient co-encapsulation, achieving a throughput of 1 million cells/hour, a 2.5% multiplet rate and a 70% cell capture efficiency.
0

Nanog fluctuations in ES cells highlight the problem of measurement in cell biology

R Smith et al.Jun 28, 2016
+4
S
P
R
A number of important pluripotency regulators, including the transcription factor Nanog, are observed to fluctuate stochastically in individual embryonic stem (ES) cells. By transiently priming cells for commitment to different lineages, these fluctuations are thought to be important to the maintenance of, and exit from, pluripotency. However, since temporal changes in intracellular protein abundances cannot be measured directly in live cells, these fluctuations are typically assessed using genetically engineered reporter cell lines that produce a fluorescent signal as a proxy for protein expression. Here, using a combination of mathematical modeling and experiment, we show that there are unforeseen ways in which widely used reporter strategies can systemically disturb the dynamics they are intended to monitor, sometimes giving profoundly misleading results. In the case of Nanog we show how genetic reporters can compromise the behavior of important pluripotency-sustaining positive feedback loops, and induce a bifurcation in the underlying dynamics that gives rise to heterogeneous Nanog expression patterns in reporter cell lines that are not representative of the wild-type. These findings help explain the range of published observations of Nanog variability and highlight a fundamental measurement problem in cell biology.