CH
Cody Heiser
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(80% Open Access)
Cited by:
34
h-index:
11
/
i10-index:
12
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
10

Multiplexed 3D atlas of state transitions and immune interactions in colorectal cancer

Jia-Ren Lin et al.Apr 2, 2021
+8
S
S
J
SUMMARY Advanced solid cancers are complex assemblies of tumor, immune, and stromal cells characterized by high intratumoral variation. We use highly multiplexed tissue imaging, 3D reconstruction, spatial statistics, and machine learning to identify cell types and states underlying morphological features of known diagnostic and prognostic significance in colorectal cancer. Quantitation of these features in high-plex marker space reveals recurrent transitions from one tumor morphology to the next, some of which are coincident with long-range gradients in the expression of oncogenes and epigenetic regulators. At the tumor invasive margin, where tumor, normal, and immune cells compete, T-cell suppression involves multiple cell types and 3D imaging shows that seemingly localized 2D features such as tertiary lymphoid structures are commonly interconnected and have graded molecular properties. Thus, while cancer genetics emphasizes the importance of discrete changes in tumor state, whole-specimen imaging reveals large-scale morphological and molecular gradients analogous to those in developing tissues.
10
Citation27
0
Save
16

Human colorectal pre-cancer atlas identifies distinct molecular programs underlying two major subclasses of pre-malignant tumors

Bob Chen et al.Jan 13, 2021
+27
T
J
B
Abstract Most colorectal cancers (CRCs) develop from either adenomas (ADs) or sessile serrated lesions (SSLs). The origins and molecular landscapes of these histologically distinct pre-cancerous polyps remain incompletely understood. Here, we present an atlas at single-cell resolution of sporadic conventional tubular/tubulovillous ADs, SSLs, hyperplastic polyps (HPs), microsatellite stable (MSS) and unstable (MSI-H) CRC, and normal colonic mucosa. Using single-cell transcriptomics and multiplex imaging, we studied 69 datasets from 33 participants. We also examined separate sets of 66 and 274 polyps for RNA and targeted gene sequencing, respectively. We performed multiplex imaging on a tissue microarray of 14 ADs and 15 CRCs, and we integrated pre-cancer polyp data with published single-cell and The Cancer Genome Atlas (TCGA) bulk CRC data to establish potential polyp-cancer relationships. Striking differences were observed between ADs and SSLs that extended to MSS and MSI-H CRCs, respectively, reflecting their distinct origins and trajectories. ADs arose from WNT pathway dysregulation in stem cells, which aberrantly expanded and expressed a Hippo and ASCL2 regenerative program. In marked contrast, SSLs were depleted of stem cell-like populations and instead exhibited a program of gastric metaplasia in the setting of elevated cytotoxic inflammation. Using subtype-specific gene regulatory networks and shared genetic variant analysis, we implicated serrated polyps, including some HPs conventionally considered benign, as arising from a metaplastic program in committed absorptive cells. ADs and SSLs displayed distinct patterns of immune cell infiltration that may influence their natural history. Our multi-omic atlas provides novel insights into the malignant potential of colorectal polyps and serves as a framework for precision surveillance and prevention of sporadic CRC.
16
Citation3
0
Save
0

Automated quality control and cell identification of droplet-based single-cell data using dropkick

Cody Heiser et al.Oct 9, 2020
+2
B
V
C
Abstract A major challenge for droplet-based single-cell sequencing technologies is distinguishing true cells from uninformative barcodes in datasets with disparate library sizes confounded by high technical noise (i.e. batch-specific ambient RNA). We present dropkick, a fully automated software tool for quality control and filtering of single-cell RNA sequencing (scRNA-seq) data with a focus on excluding ambient barcodes and recovering real cells bordering the quality threshold. By automatically determining dataset-specific training labels based on predictive global heuristics, dropkick learns a gene-based representation of real cells and ambient noise, calculating a cell probability score for each barcode. Using simulated and real-world scRNA-seq data, we benchmarked dropkick against a conventional thresholding approach and EmptyDrops, a popular computational method, demonstrating greater recovery of rare cell types and exclusion of empty droplets and noisy, uninformative barcodes. We show for both low and high-background datasets that dropkick’s weakly supervised model reliably learns which genes are enriched in ambient barcodes and draws a multidimensional boundary that is more robust to dataset-specific variation than existing filtering approaches. dropkick provides a fast, automated tool for reproducible cell identification from scRNA-seq data that is critical to downstream analysis and compatible with popular single-cell analysis Python packages.
15

A contamination focused approach for optimizing the single-cell RNA-seq experiment

Deronisha Arceneaux et al.Oct 27, 2022
+10
Q
A
D
Abstract Achieving high data quality in single-cell RNA-seq (scRNA-seq) experiments has always been a significant challenge stemming from minute signal that can be detected in individual cells. Droplet-based scRNA-seq additionally suffers from ambient contamination, comprising nucleic acid materials released by dead cells into the loading buffer and co-encapsulated with real cells, which further washes out real biological signals. Here, we developed quantitative, ambient contamination-based metrics and an associated software package that can both evaluate current datasets and guide new experimental optimizations. We performed a series of experimental optimizations using the inDrops platform to address the mechanical and microfluidic cell encapsulation aspect of an scRNA-seq experiment, with a focus on minimizing ambient contamination. We report improvements that can be achieved via cell fixation, microfluidic loading, microfluidic dilution, and nuclei versus cell preparation; many of these parameters are inaccessible on commercial platforms. We provide insights into previously obscured factors that can affect scRNA-seq data quality and suggest mitigation strategies that can guide future experiments.
15
Paper
Citation1
0
Save
1

Consensus tissue domain detection in spatial multi-omics data using MILWRM

Harsimran Kaur et al.Feb 3, 2023
+7
E
C
H
Spatially resolved molecular assays provide high dimensional genetic, transcriptomic, proteomic, and epigenetic information in situ and at various resolutions. Pairing these data across modalities with histological features enables powerful studies of tissue pathology in the context of an intact microenvironment and tissue structure. Increasing dimensions across molecular analytes and samples require new data science approaches to functionally annotate spatially resolved molecular data. A specific challenge is data-driven cross-sample domain detection that allows for analysis within and between consensus tissue compartments across high volumes of multiplex datasets stemming from tissue atlasing efforts. Here, we present MILWRM – multiplex image labeling with regional morphology – a Python package for rapid, multi-scale tissue domain detection and annotation. We demonstrate MILWRM’s utility in identifying histologically distinct compartments in human colonic polyps and mouse brain slices through spatially-informed clustering in two different spatial data modalities. Additionally, we used tissue domains detected in human colonic polyps to elucidate molecular distinction between polyp subtypes. We also explored the ability of MILWRM to identify anatomical regions of mouse brain and their respective distinct molecular profiles.
0

GammaGateR: semi-automated marker gating for single-cell multiplexed imaging

Jiangmei Xiong et al.Jun 1, 2024
+8
C
H
J
Abstract Motivation Multiplexed immunofluorescence (mIF) is an emerging assay for multichannel protein imaging that can decipher cell-level spatial features in tissues. However, existing automated cell phenotyping methods, such as clustering, face challenges in achieving consistency across experiments and often require subjective evaluation. As a result, mIF analyses often revert to marker gating based on manual thresholding of raw imaging data. Results To address the need for an evaluable semi-automated algorithm, we developed GammaGateR, an R package for interactive marker gating designed specifically for segmented cell-level data from mIF images. Based on a novel closed-form gamma mixture model, GammaGateR provides estimates of marker-positive cell proportions and soft clustering of marker-positive cells. The model incorporates user-specified constraints that provide a consistent but slide-specific model fit. We compared GammaGateR against the newest unsupervised approach for annotating mIF data, employing two colon datasets and one ovarian cancer dataset for the evaluation. We showed that GammaGateR produces highly similar results to a silver standard established through manual annotation. Furthermore, we demonstrated its effectiveness in identifying biological signals, achieved by mapping known spatial interactions between CD68 and MUC5AC cells in the colon and by accurately predicting survival in ovarian cancer patients using the phenotype probabilities as input for machine learning methods. GammaGateR is a highly efficient tool that can improve the replicability of marker gating results, while reducing the time of manual segmentation. Availability and implementation The R package is available at https://github.com/JiangmeiRubyXiong/GammaGateR.
0

GammaGateR: semi-automated marker gating for single-cell multiplexed imaging

Jiangmei Xiong et al.Jan 1, 2023
+8
C
H
J
Multiplexed immunofluorescence (mIF) is an emerging assay for multichannel protein imaging that can decipher cell-level spatial features in tissues. However, existing automated cell phenotyping methods, such as clustering, face challenges in achieving consistency across experiments and often require subjective evaluation. As a result, mIF analyses often revert to marker gating based on manual thresholding of raw imaging data. To address the need for an evaluable semi-automated algorithm, we developed GammaGateR, an R package for interactive marker gating designed specifically for segmented cell-level data from mIF images. Based on a novel closed-form gamma mixture model, GammaGateR provides estimates of marker-positive cell proportions and soft clustering of marker-positive cells. The model incorporates user-specified constraints that provide a consistent but slide-specific model fit. We compared GammaGateR against the newest unsupervised approach for annotating mIF data, employing two colon datasets and one ovarian cancer dataset for the evaluation. We showed that GammaGateR produces highly similar results to a silver standard established through manual annotation. Furthermore, we demonstrated its effectiveness in identifying biological signals, achieved by mapping known spatial interactions between CD68 and MUC5AC cells in the colon and by accurately predicting survival in ovarian cancer patients using the phenotype probabilities as input for machine learning methods. GammaGateR is a highly efficient tool that can improve the replicability of marker gating results, while reducing the time of manual segmentation.
0

Single-cell transcriptomics reveals heterogenous thymic dendritic cell subsets with distinct functions and requirements for thymocyte-regulated crosstalk

Jayashree Srinivasan et al.Dec 19, 2023
+8
Y
B
J
SUMMARY Dendritic cells (DCs) are essential for establishing central tolerance in the thymus; however, mechanisms supporting their homeostasis and activation remain unresolved. Through single-cell transcriptomics and functional assays, we identify seven thymic conventional DC (cDC) subsets and discriminate their abilities to present self-antigens and induce regulatory T cells (Tregs). Mice blocked at different stages of T-cell development reveal that CD4 + single-positive (SP) and CD8SP thymocytes differentially support homeostasis and activation of cDC1s versus cDC2s/ plasmacytoid DCs (pDCs), respectively. CD8SP regulate cDCs via interferon signaling, while CD4SP promote NF-kB activation. CD40, which activates non-canonical NF-kB signaling, is required for both activation and homeostasis of cDC1s, although only activation is driven by cognate interactions with CD4SPs. Surprisingly, some DCs display an activated signature in the absence of mature thymocytes. Altogether, this study comprehensively identifies functionally distinct thymic DC subsets and elucidates requirements for crosstalk with thymocyte subsets that support their homeostasis and activation.
0

A quantitative framework for evaluating single-cell data structure preservation by dimensionality reduction techniques

Cody Heiser et al.Jun 27, 2019
K
C
High-dimensional data, such as those generated using single-cell RNA sequencing, present challenges in interpretation and visualization. Numerical and computational methods for dimensionality reduction allow for low- dimensional representation of genome-scale expression data for downstream clustering, trajectory reconstruction, and biological interpretation. However, a comprehensive and quantitative evaluation of the performance of these techniques has not been established. We present an unbiased framework that defines metrics of global and local structure preservation in dimensionality reduction transformations. Using discrete and continuous scRNA-seq datasets, we find that input cell distribution and method parameters are largely determinant of global, local, and organizational data structure preservation by eleven published dimensionality reduction methods. Code available at github.com/KenLauLab/DR-structure-preservation allows for rapid evaluation of further datasets and methods. Keywords: Dimensionality reduction, single-cell transcriptomics, single-cell analysis, unsupervised learning
24

Molecular cartography uncovers evolutionary and microenvironmental dynamics in sporadic colorectal tumors

Cody Heiser et al.Mar 12, 2023
+22
F
A
C
Colorectal cancer exhibits dynamic cellular and genetic heterogeneity during progression from precursor lesions toward malignancy. Leveraging spatial molecular information to construct a phylogeographic map of tumor evolution can reveal individualized growth trajectories with diagnostic and therapeutic potential. Integrative analysis of spatial multi-omic data from 31 colorectal specimens revealed simultaneous microenvironmental and clonal alterations as a function of progression. Copy number variation served to re-stratify microsatellite stable and unstable tumors into chromosomally unstable (CIN+) and hypermutated (HM) classes. Phylogeographical maps classified tumors by their evolutionary dynamics, and clonal regions were placed along a global pseudotemporal progression trajectory. Cell-state discovery from a single-cell cohort revealed recurring epithelial gene signatures and infiltrating immune states in spatial transcriptomics. Charting these states along progression pseudotime, we observed a transition to immune exclusion in CIN+ tumors as characterized by a novel gene expression signature comprised of DDR1, TGFBI, PAK4, and DPEP1 . We demonstrated how these genes and their protein products are key regulators of extracellular matrix components, are associated with lower cytotoxic immune infiltration, and show prognostic value in external cohorts. Through high-dimensional data integration, this atlas provides insights into co-evolution of tumors and their microenvironments, serving as a resource for stratification and targeted treatment of CRC.