MT
Matt Thomson
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
31
(81% Open Access)
Cited by:
575
h-index:
12
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Pluripotency Factors in Embryonic Stem Cells Regulate Differentiation into Germ Layers

Matt Thomson et al.Jun 1, 2011
Cell fate decisions are fundamental for development, but we do not know how transcriptional networks reorganize during the transition from a pluripotent to a differentiated cell state. Here, we asked how mouse embryonic stem cells (ESCs) leave the pluripotent state and choose between germ layer fates. By analyzing the dynamics of the transcriptional circuit that maintains pluripotency, we found that Oct4 and Sox2, proteins that maintain ESC identity, also orchestrate germ layer fate selection. Oct4 suppresses neural ectodermal differentiation and promotes mesendodermal differentiation; Sox2 inhibits mesendodermal differentiation and promotes neural ectodermal differentiation. Differentiation signals continuously and asymmetrically modulate Oct4 and Sox2 protein levels, altering their binding pattern in the genome, and leading to cell fate choice. The same factors that maintain pluripotency thus also integrate external signals and control lineage selection. Our study provides a framework for understanding how complex transcription factor networks control cell fate decisions in progenitor cells.PaperClip/cms/asset/5a34493e-2b6a-44c4-a6f7-8ec5962b9ffb/mmc2.mp3Loading ...(mp3, 2.21 MB) Download audio
0
Citation526
0
Save
180

Enhanced recovery of single-cell RNA-sequencing reads for missing gene expression data

Allan-Hermann Pool et al.Apr 27, 2022
Abstract Droplet-based 3’ single-cell RNA-sequencing (scRNA-seq) methods have proved transformational in characterizing cellular diversity and generating valuable hypotheses throughout biology 1,2 . Here we outline a common problem with 3’ scRNA-seq datasets where genes that have been documented to be expressed with other methods, are either completely missing or are dramatically under-represented thereby compromising the discovery of cell types, states, and genetic mechanisms. We show that this problem stems from three main sources of sequencing read loss: (1) reads mapping immediately 3’ to known gene boundaries due to poor 3’ UTR annotation; (2) intronic reads stemming from unannotated exons or pre-mRNA; (3) discarded reads due to gene overlaps 3 . Each of these issues impacts the detection of thousands of genes even in well-characterized mouse and human genomes rendering downstream analysis either partially or fully blind to their expression. We outline a simple three-step solution to recover the missing gene expression data that entails compiling a hybrid pre-mRNA reference to retrieve intronic reads 4 , resolving gene collision derived read loss through removal of readthrough and premature start transcripts, and redefining 3’ gene boundaries to capture false intergenic reads. We demonstrate with mouse brain and human peripheral blood datasets that this approach dramatically increases the amount of sequencing data included in downstream analysis revealing 20 - 50% more genes per cell and incorporates 15-20% more sequencing reads than with standard solutions 5 . These improvements reveal previously missing biologically relevant cell types, states, and marker genes in the mouse brain and human blood profiling data. Finally, we provide scRNA-seq optimized transcriptomic references for human and mouse data as well as simple algorithmic implementation of these solutions that can be deployed to both thoroughly as well as poorly annotated genomes. Our results demonstrate that optimizing the sequencing read mapping step can significantly improve the analysis resolution as well as biological insight from scRNA-seq. Moreover, this approach warrants a fresh look at preceding analyses of this popular and scalable cellular profiling technology.
180
Citation6
0
Save
1

Deep parallel characterization of AAV tropism and AAV-mediated transcriptional changes via single-cell RNA sequencing

David Brown et al.Jun 25, 2021
Abstract Engineered variants of recombinant adeno-associated viruses (rAAVs) are being developed rapidly to meet the need for gene-therapy delivery vehicles with particular cell-type and tissue tropisms. While high-throughput AAV engineering and selection methods have generated numerous variants, subsequent tropism and response characterization have remained low throughput and lack resolution across the many relevant cell and tissue types. To fully leverage the output of these large screening paradigms across multiple targets, we have developed an experimental and computational single-cell RNA sequencing (scRNA-seq) pipeline for in vivo characterization of barcoded rAAV pools at unprecedented resolution. Using our platform, we have corroborated previously reported viral tropisms and discovered unidentified AAV capsid targeting biases. As expected, we observed that the tropism profile of AAV.CAP-B10 in mice was shifted toward neurons and away from astrocytes when compared with AAV-PHP.eB. Our transcriptomic analysis revealed that this neuronal bias is mainly due to increased targeting efficiency for glutamatergic neurons, which we confirmed by RNA fluorescence in situ hybridization. We further uncovered cell subtype tropisms of AAV variants in vascular and glial cells, such as low transduction of pericytes and Myoc+ astrocytes. Additionally, we have observed cell-type-specific responses to systemic AAV-PHP.eB administration, such as upregulation of genes involved in p53 signaling in endothelial cells three days post-injection, which return to control levels by day twenty-five. Such ability to parallelize the characterization of AAV tropism and simultaneously measure the transcriptional response of transduction will facilitate the advancement of safe and precise gene delivery vehicles.
1
Citation6
0
Save
1

Commensal bacteria promote type I interferon signaling to maintain immune tolerance

Adriana Ayala et al.Oct 21, 2021
ABSTRACT Type I interferons (IFN) exert a broad range of biological effects important in coordinating immune responses. Host and microbial factors regulate IFN production, triggering a signaling cascade that has classically been studied in the context of pathogen clearance. In particular, commensal bacteria have been shown to induce IFN to protect against viral infections. Yet, whether immunomodulatory bacteria operate through IFN pathways to support immune tolerance remains elusive. Here, we demonstrate microbiota-dependent IFN signaling is required for priming tolerogenic T regulatory cells (Tregs) by intestinal dendritic cells (DCs). DCs deficient in IFN signaling through deletion of IFNAR-1 display dysregulated cytokine production in response to the commensal bacteria Bacteroides fragilis , resulting in blunted downstream Treg responses. Single cell RNA sequencing of gut tissues demonstrated that colonization with B. fragilis promotes a distinct type I IFN gene signature in Tregs during homeostasis and intestinal inflammation. Moreover, B. fragilis- mediated protection during experimental colitis was abrogated in IFNAR1-deficient mice. Altogether, our findings demonstrate an important role of microbiota-mediated immune tolerance via tonic type I IFN signaling.
1
Citation5
0
Save
0

Controlling Organization and Forces in Active Matter Through Optically-Defined Boundaries

Tyler Ross et al.Dec 21, 2018
Abstract Living systems are capable of locomotion, reconfiguration, and replication. To perform these tasks, cells spatiotemporally coordinate the interactions of force-generating, “active” molecules that create and manipulate non-equilibrium structures and force fields that span up to millimeter length scales [1–3]. Experimental active matter systems of biological or synthetic molecules are capable of spontaneously organizing into structures [4, 5] and generating global flows [6–9]. However, these experimental systems lack the spatiotemporal control found in cells, limiting their utility for studying non-equilibrium phenomena and bioinspired engineering. Here, we uncover non-equilibrium phenomena and principles by optically controlling structures and fluid flow in an engineered system of active biomolecules. Our engineered system consists of purified microtubules and light-activatable motor proteins that crosslink and organize microtubules into distinct structures upon illumination. We develop basic operations, defined as sets of light patterns, to create, move, and merge microtubule structures. By composing these basic operations, we are able to create microtubule networks that span several hundred microns in length and contract at speeds up to an order of magnitude faster than the speed of an individual motor. We manipulate these contractile networks to generate and sculpt persistent fluid flows. The principles of boundary-mediated control we uncover may be used to study emergent cellular structures and forces and to develop programmable active matter devices.
0
Citation3
0
Save
9

TRILL: Orchestrating Modular Deep-Learning Workflows for Democratized, Scalable Protein Analysis and Engineering

Zachary Martinez et al.Oct 27, 2023
Deep-learning models have been rapidly adopted by many fields, partly due to the deluge of data humanity has amassed. In particular, the petabases of biological sequencing data enable the unsupervised training of protein language models that learn the "language of life." However, due to their prohibitive size and complexity, contemporary deep-learning models are often unwieldy, especially for scientists with limited machine learning backgrounds. TRILL (TRaining and Inference using the Language of Life) is a platform for creative protein design and discovery. Leveraging several state-of-the-art models such as ESM-2, DiffDock, and RFDiffusion, TRILL allows researchers to generate novel proteins, predict 3-D structures, extract high-dimensional representations of proteins, functionally classify proteins and more. What sets TRILL apart is its ability to enable complex pipelines by chaining together models and effectively merging the capabilities of different models to achieve a sum greater than its individual parts. Whether using Google Colab with one GPU or a supercomputer with hundreds, TRILL allows scientists to effectively utilize models with millions to billions of parameters by using optimized training strategies such as ZeRO-Offload and distributed data parallel. Therefore, TRILL not only bridges the gap between complex deep-learning models and their practical application in the field of biology, but also simplifies the orchestration of these models into comprehensive workflows, democratizing access to powerful methods. Documentation: https://trill.readthedocs.io/en/latest/home.html.
0

Unexplored regions of the protein sequence-structure map revealed at scale by a library of foldtuned language models

Arjuna Subramanian et al.Dec 23, 2023
Abstract Nature has likely sampled only a fraction of all protein sequences and structures allowed by the laws of biophysics. However, the combinatorial scale of amino-acid sequence-space has traditionally precluded substantive study of the full protein sequence-structure map. In particular, it remains unknown how much of the vast uncharted landscape of far-from-natural sequences consists of alternate ways to encode the familiar ensemble of natural folds; proteins in this category also represent an opportunity to diversify candidates for downstream applications. Here, we characterize sequence-structure mapping in far-from-natural regions of sequence-space guided by the capacity of protein language models (pLMs) to explore sequences outside their natural training data through generation. We demonstrate that pre-trained generative pLMs sample a limited structural snapshot of the natural protein universe, including >350 common (sub)domain elements. Incorporating pLM, structure prediction, and structure-based search techniques, we surpass this limitation by developing a novel “foldtuning” strategy that pushes a pretrained pLM into a generative regime that maintains structural similarity to a target protein fold (e.g. TIM barrel, thioredoxin, etc) while maximizing dissimilarity to natural amino-acid sequences. We apply “foldtuning” to build a library of pLMs for >700 naturally-abundant folds in the SCOP database, accessing swaths of proteins that take familiar structures yet lie far from known sequences, spanning targets that include enzymes, immune ligands, and signaling proteins. By revealing protein sequence-structure information at scale outside of the context of evolution, we anticipate that this work will enable future systematic searches for wholly novel folds and facilitate more immediate protein design goals in catalysis and medicine.
0
Citation2
0
Save
1

Control of spatio-temporal patterning via cell density in a multicellular synthetic gene circuit

Marco Santorelli et al.Oct 5, 2022
Abstract A major goal in synthetic development is to design and construct gene regulatory circuits that control the patterning and morphogenesis of synthetic multicellular structures. In natural development, an interplay between mechanical and chemical communication shapes the dynamics of gene regulatory circuits that underlie patterning and morphogenesis. However, for synthetic gene circuits, how the non-genetic properties of the growth environment impact circuit behavior remains poorly understood. Here, we describe an occurrence of mechano-chemical coupling in synthetic contact-dependent synNotch patterning circuits demonstrating that cell density modulates the transduction of signal between a sender and receiver cell. By exploiting density-dependent signaling, we construct multicellular signal propagation circuits with synNotch and control the patterning outcome both temporally and spatially via cell density gradients established in vitro via plating or small-molecule mediated modulation of proliferation. Our work demonstrates that synthetic gene circuits can be critically impacted by their context, providing an alternate means for programming multi-cellular circuit patterning outcomes.
1
Citation2
0
Save
Load More