SH
Sahand Hormoz
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(71% Open Access)
Cited by:
427
h-index:
20
/
i10-index:
28
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Synthetic recording and in situ readout of lineage information in single cells

Kirsten Frieda et al.Nov 17, 2016
+6
S
J
K
A new system, termed MEMOIR, allows cells to record lineage and gene expression history within their own genome in a format that can be read out in single cells in situ. It is difficult to establish cell division history and lineage relationships for tissues that are not easily accessed. DNA barcoding approaches can provide this information, but do not offer spatial data. This collaboration between the labs of Long Cai and Michael Elowitz harnesses the power of CRISPR/Cas9-mediated mutagenesis and multiplexed single-molecule RNA fluorescence hybridization (smFISH) to build a new tool, termed MEMOIR, which they use to follow mouse embryonic stem cell divisions. MEMOIR gives access to lineage information in situ and at the single-cell level, while at the same time monitoring changes in gene expression state. Reconstructing the lineage relationships and dynamic event histories of individual cells within their native spatial context is a long-standing challenge in biology. Many biological processes of interest occur in optically opaque or physically inaccessible contexts, necessitating approaches other than direct imaging. Here we describe a synthetic system that enables cells to record lineage information and event histories in the genome in a format that can be subsequently read out of single cells in situ. This system, termed memory by engineered mutagenesis with optical in situ readout (MEMOIR), is based on a set of barcoded recording elements termed scratchpads. The state of a given scratchpad can be irreversibly altered by CRISPR/Cas9-based targeted mutagenesis, and later read out in single cells through multiplexed single-molecule RNA fluorescence hybridization (smFISH). Using MEMOIR as a proof of principle, we engineered mouse embryonic stem cells to contain multiple scratchpads and other recording components. In these cells, scratchpads were altered in a progressive and stochastic fashion as the cells proliferated. Analysis of the final states of scratchpads in single cells in situ enabled reconstruction of lineage information from cell colonies. Combining analysis of endogenous gene expression with lineage reconstruction in the same cells further allowed inference of the dynamic rates at which embryonic stem cells switch between two gene expression states. Finally, using simulations, we show how parallel MEMOIR systems operating in the same cell could enable recording and readout of dynamic cellular event histories. MEMOIR thus provides a versatile platform for information recording and in situ, single-cell readout across diverse biological systems.
0
Citation393
0
Save
34

Droplet-based single cell RNA sequencing of bacteria identifies known and previously unseen cellular states

Ryan McNulty et al.Mar 10, 2021
+2
S
D
R
Abstract Clonal bacterial populations rely on transcriptional variation to differentiate into specialized cell states that increase the community’s fitness. Such heterogeneous gene expression is implicated in many fundamental microbial processes including sporulation, cell communication, detoxification, substrate utilization, competence, biofilm formation, motility, pathogenicity, and antibiotic resistance 1 . To identify these specialized cell states and determine the processes by which they develop, we need to study isogenic bacterial populations at the single cell level 2,3 . Here, we develop a method that uses DNA probes and leverages an existing commercial microfluidic platform (10X Chromium) to conduct bacterial single cell RNA sequencing. We sequenced the transcriptome of over 15,000 individual bacterial cells, detecting on average 365 transcripts mapping to 265 genes per cell in B. subtilis and 329 transcripts mapping to 149 genes per cell in E. coli . Our findings correctly identify known cell states and uncover previously unreported cell states. Interestingly, we find that some metabolic pathways segregate into distinct subpopulations across different bacteria and growth conditions, suggesting that some cellular processes may be more prone to differentiation than others. Our high throughput, highly resolved single cell transcriptomic platform can be broadly used for understanding heterogeneity in microbial populations.
34
Citation18
0
Save
0

Deciphering cell states and genealogies of human hematopoiesis

Chen Weng et al.Jan 22, 2024
+24
D
F
C
0
Citation7
-1
Save
46

Reconstructing the lineage histories and differentiation trajectories of individual cancer cells in JAK2-mutant myeloproliferative neoplasms

Debra Egeren et al.Aug 24, 2020
+18
M
J
D
ABSTRACT Some cancers originate from a single mutation event in a single cell. For example, blood cancers known as myeloproliferative neoplasms (MPN) are thought to originate through the acquisition of a driver mutation (most commonly JAK2 -V617F) in a hematopoietic stem cell (HSC). However, when the mutation first occurs in individual patients and how it impacts the behavior of HSCs in their native context is not known. Here we quantified the impact of the JAK2- V617F mutation on the proliferation dynamics of HSCs and the differentiation trajectories of their progenies in individual MPN patients. We reconstructed the lineage history of individual HSCs obtained from MPN patients using the patterns of spontaneous somatic mutations accrued in their genomes over time. Strikingly, we found that the JAK2- V617F mutation occurred in a single HSC several decades before MPN diagnosis — at age 9±2 years in a 34-year-old patient, and at age 19±3 years in a 63-year-old patient. For each patient, we inferred the number of mutated HSCs over time and computed their fitness. The population of JAK2 -mutated HSCs grew exponentially by 63±15% and 44±13% every year in the two patients, respectively. To contrast the differentiation trajectories of the JAK2 -mutated HSCs with those of healthy HSCs, we simultaneously measured the full transcriptome and somatic mutations in single hematopoietic stem and progenitor cells (HSPCs). We found that the fraction of JAK2 -mutant HSPCs varied significantly across different myeloid cell types within the same patient. The erythroid progenitor cells were often entirely JAK2 -mutant, even when the peripheral blood JAK2 -V617F allele burden was low. The novel biological insights uncovered by this work have implications for the prevention and treatment of MPN, as well as the accurate assessment of disease burden in patients. The technology platforms and computational frameworks developed here are broadly applicable to other types of hematological malignancies and cancers.
46
Citation4
0
Save
1

Paraxial mesoderm organoids model development of human somites

Christoph Budjan et al.Mar 22, 2021
+4
A
S
C
Abstract During the development of the vertebrate embryo, segmented structures called somites are periodically formed from the presomitic mesoderm (PSM), and give rise to the vertebral column. While somite formation has been studied in several animal models, it is less clear how well this process is conserved in humans. Recent progress has made it possible to study aspects of human paraxial mesoderm development such as the human segmentation clock in vitro using human pluripotent stem cells (hPSCs), however, somite formation has not been observed in these monolayer cultures. Here, we describe the generation of human paraxial mesoderm (PM) organoids from hPSCs (termed Somitoids), which recapitulate the molecular, morphological and functional features of paraxial mesoderm development, including formation of somite-like structures in vitro . Using a quantitative image-based screen, we identify critical parameters such as initial cell number and signaling modulations that reproducibly yielded somite formation in our organoid system. In addition, using single-cell RNA sequencing and 3D imaging, we show that PM organoids both transcriptionally and morphologically resemble their in vivo counterparts and can be differentiated into somite derivatives. Our organoid system is reproducible and scalable, allowing for the systematic and quantitative analysis of human spinal cord development and disease in vitro .
1
Citation2
0
Save
6

Collective polymerase dynamics emerge from DNA supercoiling during transcription

Stuart Sevier et al.Nov 25, 2021
S
S
All biological processes ultimately come from physical interactions. The mechanical properties of DNA play a critical role in transcription. RNA polymerase can over or under twist DNA (referred to as DNA supercoiling) when it moves along a gene resulting in mechanical stresses in DNA that impact its own motion and that of other polymerases. For example, when enough supercoiling accumulates, an isolated polymerase halts and transcription stops. DNA supercoiling can also mediate non-local interactions between polymerases that shape gene expression fluctuations. Here, we construct a comprehensive model of transcription that captures how RNA polymerase motion changes the degree of DNA supercoiling which in turn feeds back into the rate at which polymerases are recruited and move along the DNA. Surprisingly, our model predicts that a group of three or more polymerases move together at a constant velocity and sustain their motion (forming what we call a polymeton) whereas one or two polymerases would have halted. We further show that accounting for the impact of DNA supercoiling on both RNA polymerase recruitment and velocity recapitulates empirical observations of gene expression fluctuations. Finally, we propose a mechanical toggle switch whereby interactions between genes are mediated by DNA twisting as opposed to proteins. Understanding the mechanical regulation of gene expression provides new insights into how endogenous genes can interact and informs the design of new forms of engineered interactions. PACS numbers:
6
Citation1
0
Save
107

Accuratede novodetection of somatic mutations in high-throughput single-cell profiling data sets

Francesc Muyas et al.Nov 24, 2022
+3
T
R
F
Abstract Characterization of somatic mutations at single-cell resolution is essential to study cancer evolution, clonal mosaicism, and cell plasticity. However, detection of mutations in single cells remains technically challenging. Here, we describe SComatic, an algorithm designed for the detection of somatic mutations in single-cell transcriptomic and ATAC-seq data sets without requiring matched bulk or single-cell DNA sequencing data. Using >1.5M single cells from 383 single-cell RNAseq and single-cell ATAC-seq data sets spanning cancer and non-neoplastic samples, we show that SComatic detects mutations in single cells, even in differentiated cells from polyclonal tissues not amenable to mutation detection using existing methods. In addition, SComatic permits the estimation of mutational burdens and de novo mutational signature analysis at single-cell and cell-type resolution. Notably, using matched exome and single-cell RNAseq data, we show that SComatic achieves a 20 to 40-fold increase in precision as compared to existing algorithms for somatic SNV calling without compromising sensitivity. Overall, SComatic opens the possibility to study somatic mutagenesis at unprecedented scale and resolution using high-throughput single-cell profiling data sets.
107
Citation1
0
Save
0

scAI-SNP: a method for inferring ancestry from single-cell data

Sang Hong et al.May 17, 2024
S
I
F
S
Collaborative efforts, such as the Human Cell Atlas, are rapidly accumulating large amounts of single-cell data. To ensure that single-cell atlases are representative of human genetic diversity, we need to determine the ancestry of the donors from whom single-cell data are generated. Self-reporting of race and ethnicity, although important, can be biased and is not always available for the datasets already collected. Here, we introduce scAI-SNP, a tool to infer ancestry directly from single-cell genomics data. To train scAI-SNP, we identified 4.5 million ancestry-informative single-nucleotide polymorphisms (SNPs) in the 1000 Genomes Project dataset across 3201 individuals from 26 population groups. For a query single-cell data set, scAI-SNP uses these ancestry-informative SNPs to compute the contribution of each of the 26 population groups to the ancestry of the donor from whom the cells were obtained. Using diverse single-cell data sets with matched whole-genome sequencing data, we show that scAI-SNP is robust to the sparsity of single-cell data, can accurately and consistently infer ancestry from samples derived from diverse types of tissues and cancer cells, and can be applied to different modalities of single-cell profiling assays, such as single-cell RNA-seq and single-cell ATAC-seq. Finally, we argue that ensuring that single-cell atlases represent diverse ancestry, ideally alongside race and ethnicity, is ultimately important for improved and equitable health outcomes by accounting for human diversity.
0
Citation1
0
Save
0

The role of LEDGF in transcription is exploited by HIV-1 to position integration

Rakesh Pathak et al.Jul 2, 2024
+10
R
C
R
Abstract HIV-1 integration occurs across actively transcribed genes due to the interaction of integrase with host chromatin factor LEDGF. Although LEDGF was originally isolated as a co-activator that stimulates promoter activity in purified systems, this role is inconsistent with LEDGF-mediated integration across gene bodies and with data indicating LEDGF is a histone chaperone that promotes transcriptional elongation. We found LEDGF is enriched in pronounced peaks that match the enrichments of H3K4me3 and RNA Pol II at transcription start sites (TSSs) of active promoters. Our genome-wide chromatin mapping revealed that MLL1 had a dominant role in recruiting LEDGF to promoters and the presence of LEDGF recruits RNA Pol II. Enrichment of LEDGF at TSSs correlates strongly with levels of integration across the transcribed sequences, indicating that LEDGF at TSSs contributed to integration across gene bodies. Although the N-terminal Pro-Trp-Trp-Pro (PWWP) domain of LEDGF interacts with nucleosomes containing H3K36me3, a modification thought to recruit LEDGF to chromatin, we found H3K36me3 does not contribute to gene specificity of integration. These data support a dual role model of LEDGF where it is tethered to promoters by MLL1 and recruits RNA Pol II. Subsequently, LEDGF travels across genes to effect HIV-1 integration. Our data also provides a mechanistic context for the contribution made by LEDGF to MLL1-based infant acute leukemia and acute myeloid leukemia in adults.
0

An engineered CRISPR/Cas9 mouse line for simultaneous readout of lineage histories and gene expression profiles in single cells

Sarah Bowling et al.Oct 17, 2019
+9
D
S
S
Tracing the lineage history of cells is key to answering diverse and fundamental questions in biology. Particularly in the context of stem cell biology, analysis of single cell lineages in their native state has elucidated novel fates and highlighted heterogeneity of function. Coupling of such ancestry information with other molecular readouts represents an important goal in the field. Here, we describe the CARLIN (for CRISPR Array Repair LINeage tracing) mouse line and corresponding analysis tools that can be used to simultaneously interrogate the lineage and transcriptomic information of single cells in vivo . This model exploits CRISPR technology to generate up to 44,000 transcribed barcodes in an inducible fashion at any point during development or adulthood, is compatible with sequential barcoding, and is fully genetically defined. We have used CARLIN to identify intrinsic biases in the activity of fetal liver hematopoietic stem cell (HSC) clones and to uncover a previously unappreciated clonal bottleneck in the response of HSCs to injury. CARLIN also allows the unbiased identification of transcriptional signatures based on in vivo stem cell function without a need for markers or cell sorting.
Load More