AS
Alan Simmons
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
13
(62% Open Access)
Cited by:
21
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
15

Cancer Hallmarks Define a Continuum of Plastic Cell States between Small Cell Lung Cancer Archetypes

Sarah Groves et al.Jan 24, 2021
Abstract Small Cell Lung Cancer (SCLC) tumors are heterogeneous mixtures of transcriptional subtypes. Understanding subtype dynamics could be key to explaining the aggressive properties that make SCLC a recalcitrant cancer. Applying archetype analysis and evolutionary theory to bulk and single-cell transcriptomics, we show that SCLC cells reside within a cell-state continuum rather than in discrete subtype clusters. Gene expression signatures and ontologies indicate each vertex of the continuum corresponds to a functional phenotype optimized for a cancer hallmark task: three neuroendocrine archetypes specialize in proliferation/survival, inflammation and immune evasion, and two non-neuroendocrine archetypes in angiogenesis and metabolic dysregulation. Single cells can trade-off between these defined tasks to increase fitness and survival. SCLC cells can easily transition from specialists that optimize a single task to generalists that fall within the continuum, suggesting that phenotypic plasticity may be a mechanism by which SCLC cells become recalcitrant to treatment and adaptable to diverse microenvironments. We show that plasticity is uncoupled from the phenotype of single cells using a novel RNA-velocity-based metric, suggesting both specialist and generalist cells have the capability of becoming destabilized and transitioning to other phenotypes. We use network simulations to identify transcription factors such as MYC that promote plasticity and resistance to treatment. Our analysis pipeline is suitable to elucidate the role of phenotypic plasticity in any cancer type, and positions SCLC as a prime candidate for treatments that target plasticity.
15
Citation16
0
Save
16

Human colorectal pre-cancer atlas identifies distinct molecular programs underlying two major subclasses of pre-malignant tumors

Bob Chen et al.Jan 13, 2021
Abstract Most colorectal cancers (CRCs) develop from either adenomas (ADs) or sessile serrated lesions (SSLs). The origins and molecular landscapes of these histologically distinct pre-cancerous polyps remain incompletely understood. Here, we present an atlas at single-cell resolution of sporadic conventional tubular/tubulovillous ADs, SSLs, hyperplastic polyps (HPs), microsatellite stable (MSS) and unstable (MSI-H) CRC, and normal colonic mucosa. Using single-cell transcriptomics and multiplex imaging, we studied 69 datasets from 33 participants. We also examined separate sets of 66 and 274 polyps for RNA and targeted gene sequencing, respectively. We performed multiplex imaging on a tissue microarray of 14 ADs and 15 CRCs, and we integrated pre-cancer polyp data with published single-cell and The Cancer Genome Atlas (TCGA) bulk CRC data to establish potential polyp-cancer relationships. Striking differences were observed between ADs and SSLs that extended to MSS and MSI-H CRCs, respectively, reflecting their distinct origins and trajectories. ADs arose from WNT pathway dysregulation in stem cells, which aberrantly expanded and expressed a Hippo and ASCL2 regenerative program. In marked contrast, SSLs were depleted of stem cell-like populations and instead exhibited a program of gastric metaplasia in the setting of elevated cytotoxic inflammation. Using subtype-specific gene regulatory networks and shared genetic variant analysis, we implicated serrated polyps, including some HPs conventionally considered benign, as arising from a metaplastic program in committed absorptive cells. ADs and SSLs displayed distinct patterns of immune cell infiltration that may influence their natural history. Our multi-omic atlas provides novel insights into the malignant potential of colorectal polyps and serves as a framework for precision surveillance and prevention of sporadic CRC.
16
Citation3
0
Save
1

Petagraph: A large-scale unifying knowledge graph framework for integrating biomolecular and biomedical data

Benjamin Stear et al.Feb 13, 2023
Abstract The use of biomedical knowledge graphs (BMKG) for knowledge representation and data integration has increased drastically in the past several years due to the size, diversity, and complexity of biomedical datasets and databases. Data extraction from a single dataset or database is usually not particularly challenging. However, if a scientific question must rely on integrative analysis across multiple databases or datasets, it can often take many hours to correctly and reproducibly extract and integrate data towards effective analysis. To overcome this issue, we created Petagraph, a large-scale BMKG that integrates biomolecular data into a schema incorporating the Unified Medical Language System (UMLS). Petagraph is instantiated on the Neo4j graph platform, and to date, has fifteen integrated biomolecular datasets. The majority of the data consists of entities or relationships related to genes, animal models, human phenotypes, drugs, and chemicals. Quantitative data sets containing values from gene expression analyses, chromatin organization, and genetic analyses have also been included. By incorporating models of biomolecular data types, the datasets can be traversed with hundreds of ontologies and controlled vocabularies native to the UMLS, effectively bringing the data to the ontologies. Petagraph allows users to analyze relationships between complex multi-omics data quickly and efficiently.
15

A contamination focused approach for optimizing the single-cell RNA-seq experiment

Deronisha Arceneaux et al.Oct 27, 2022
Abstract Achieving high data quality in single-cell RNA-seq (scRNA-seq) experiments has always been a significant challenge stemming from minute signal that can be detected in individual cells. Droplet-based scRNA-seq additionally suffers from ambient contamination, comprising nucleic acid materials released by dead cells into the loading buffer and co-encapsulated with real cells, which further washes out real biological signals. Here, we developed quantitative, ambient contamination-based metrics and an associated software package that can both evaluate current datasets and guide new experimental optimizations. We performed a series of experimental optimizations using the inDrops platform to address the mechanical and microfluidic cell encapsulation aspect of an scRNA-seq experiment, with a focus on minimizing ambient contamination. We report improvements that can be achieved via cell fixation, microfluidic loading, microfluidic dilution, and nuclei versus cell preparation; many of these parameters are inaccessible on commercial platforms. We provide insights into previously obscured factors that can affect scRNA-seq data quality and suggest mitigation strategies that can guide future experiments.
15
Paper
Citation1
0
Save
0

Quantitative assessment of cell population diversity in single-cell landscapes

Qi Liu et al.May 30, 2018
Single-cell RNA-sequencing (scRNA-seq) has become a powerful tool for the systematic investigation of cellular diversity. As a number of computational tools have been developed to identify and visualize cell populations within a single scRNA-seq dataset, there is a need for methods to quantitatively and statistically define proportional shifts in cell population structures across datasets, such expansion or shrinkage, or emergence or disappearance of cell populations. Here we present sc-UniFrac, a framework to statistically quantify compositional diversity in cell populations between single-cell transcriptome landscapes. sc-UniFrac enables sensitive and robust quantification in simulated and experimental datasets in terms of both population identity and quantity. We have demonstrated the utility of sc-UniFrac in multiple applications, including assessment of biological and technical replicates, classification of tissue phenotypes, identification and definition of altered cell populations, and benchmarking batch correction tools. sc-UniFrac provides a framework for quantifying diversity or alterations in cell populations across conditions, and has broad utility for gaining insight on how cell populations respond to perturbations.
0

An Inter-species Translation Model Implicates Integrin Signaling in Infliximab-Resistant Colonic Crohn's Disease

Douglas Brubaker et al.Sep 23, 2019
Anti-TNF therapy resistance is a major clinical challenge in Crohns Disease (CD), partly due to insufficient understanding of disease-site, protein-level mechanisms of CD and anti-TNF treatment resistance. Although some proteomics data from CD mouse models exists, data type and phenotype discrepancies contribute to confounding attempts to translate between preclinical animal models of disease and human clinical cohorts. To meet this important challenge, we develop and demonstrate here an approach called Translatable Components Regression (TransComp-R) to overcome inter-species and trans-omic discrepancies between CD mouse models and human subjects. TransComp-R combines CD mouse model proteomic data with patient pre-treatment transcriptomic data to identify molecular features discernable in the mouse data predictive of patient response to anti-TNF therapy. Interrogating the TransComp-R models predominantly revealed upregulated integrin pathway signaling via collagen-binding integrin ITGA1 in anti-TNF resistant colonic CD (cCD) patients. Toward validation, we performed single-cell RNA sequencing on biopsies from a cCD patient and analyzed publicly available immune cell proteomics data to characterize the immune and intestinal cell types contributing to anti-TNF resistance. We found that ITGA1 is indeed expressed in colonic T-cell populations and that interactions between collagen-binding integrins on T-cells and colonic cell types expressing secreted collagens are associated with anti-TNF therapy resistance. Biologically, TransComp-R linked previously disparate observations about collagen and ITGA1 signaling to a potential therapeutic avenue for overcoming anti-TNF therapy resistance in cCD. Methodologically, TransComp-R provides a flexible, generalizable framework for addressing inter-species, inter-omic, and inter-phenotypic discrepancies between animal models and patients to deliver translationally relevant biological insights.
0

Dual indexed design of in-Drop single-cell RNA-seq libraries improves sequencing quality and throughput

Austin Southard-Smith et al.Nov 8, 2019
The increasing demand of single-cell RNA-sequencing (scRNA-seq) experiments, such as the number of experiments and cells queried per experiment, necessitates higher sequencing depth coupled to high data quality. New high-throughput sequencers, such as the Illumina NovaSeq 6000, enables this demand to be filled in a cost-effective manner. However, current scRNA-seq library designs present compatibility challenges with newer sequencing technologies, such as index-hopping, and their ability to generate high quality data has yet to be systematically evaluated. Here, we engineered a new dual-indexed library structure, called TruDrop, on top of the inDrop scRNA-seq platform to solve these compatibility challenges, such that TruDrop libraries and standard Illumina libraries can be sequenced alongside each other on the NovaSeq. We overcame the index-hopping issue, demonstrated significant improvements in base-calling accuracy, and provided an example of multiplexing twenty-four scRNA-seq libraries simultaneously. We showed favorable comparisons in transcriptional diversity of TruDrop compared with prior library structures. Our approach enables cost-effective, high throughput generation of sequencing data with high quality, which should enable more routine use of scRNA-seq technologies.
0

Clinically adaptable polymer enables simultaneous spatial analysis of colonic tissues and biofilms

Mary Macedonia et al.Apr 17, 2020
Microbial influences on host cells depend upon the identities of the microbes, their spatial localization, and the responses they invoke on specific host cell populations. Multi-modal analyses of both microbes and host cells in a spatially-resolved fashion would enable studies into these complex interactions in native tissue environments, potentially in clinical specimens. While techniques to preserve each of the microbial and host cell compartments have been used to examine tissues and microbes separately, we endeavored to develop approaches to simultaneously analyze both compartments. Herein, we established an original method for mucus preservation using Poloxamer 407 (also known as Pluronic F-127), a thermoreversible polymer with mucus-adhesive characteristics. We demonstrate that this approach can preserve spatially-defined compartments of the mucus bi-layer in the colon and the bacterial communities within, compared with their marked absence when tissues were processed with traditional formalin-fixed paraffin-embedded (FFPE) pipelines. Additionally, antigens for antibody staining of host cells were preserved and signal intensity for 16S rRNA fluorescence in situ hybridization (FISH) was enhanced in Poloxamer-fixed samples. This in turn enabled us to integrate multi-modal analysis using a modified multiplex immunofluorescence (MxIF) protocol. Importantly, we have formulated Poloxamer 407 to polymerize and crosslink at room temperature for use in clinical workflows. These results suggest that the fixative formulation of Poloxamer 407 can be integrated into biospecimen collection pipelines for simultaneous analysis of microbes and host cells.### Competing Interest StatementCLS receives research funding from Bristol Myers Squibb and Janssen and a personal fee from Merck & Co. in 2019 for an advisory role. The authors declare that there are no other competing interests.
11

Combinatorial transcriptional profiling of mouse and human enteric neurons identifies shared and disparate subtypes in situ

Aaron May‐Zhang et al.Jul 4, 2020
A bstract BACKGROUND & AIMS The enteric nervous system (ENS) coordinates essential intestinal functions through the concerted action of diverse enteric neurons (EN). However, integrated molecular knowledge of EN subtypes is lacking. To compare human and mouse ENs, we transcriptionally profiled healthy ENS from adult humans and mice. We aimed to identify transcripts marking discrete neuron subtypes and visualize conserved EN subtypes for humans and mice in multiple bowel regions. METHODS Human myenteric ganglia and adjacent smooth muscle were isolated by laser-capture microdissection for RNA-Seq. Ganglia-specific transcriptional profiles were identified by computationally subtracting muscle gene signatures. Nuclei from mouse myenteric neurons were isolated and subjected to single-nucleus RNA-Seq (snRNA-Seq), totaling over four billion reads and 25,208 neurons. Neuronal subtypes were defined using mouse snRNA-Seq data. Comparative informatics between human and mouse datasets identified shared EN subtype markers, which were visualized in situ using hybridization chain reaction (HCR). RESULTS Several EN subtypes in the duodenum, ileum, and colon are conserved between humans and mice based on orthologous gene expression. However, some EN subtype-specific genes from mice are expressed in completely distinct morphologically defined subtypes in humans. In mice, we identified several neuronal subtypes that stably express gene modules across all intestinal segments, with graded, regional expression of one or more marker genes. CONCLUSIONS Our combined transcriptional profiling of human myenteric ganglia and mouse EN provides a rich foundation for developing novel intestinal therapeutics. There is congruency among some EN subtypes, but we note multiple species differences that should be carefully considered when relating findings from mouse ENS research to human GI studies. Graphical Abstract
Load More