AB
A. Booeshaghi
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
23
(83% Open Access)
Cited by:
493
h-index:
14
/
i10-index:
19
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Modular, efficient and constant-memory single-cell RNA-seq preprocessing

Páll Melsted et al.Apr 1, 2021
+7
L
A
P
We describe a workflow for preprocessing of single-cell RNA-sequencing data that balances efficiency and accuracy. Our workflow is based on the kallisto and bustools programs, and is near optimal in speed with a constant memory requirement providing scalability for arbitrarily large datasets. The workflow is modular, and we demonstrate its flexibility by showing how it can be used for RNA velocity analyses. A preprocessing workflow for single-cell RNA-seq data achieves near-optimal speed.
0
Citation321
0
Save
0

An integrated transcriptomic and epigenomic atlas of mouse primary motor cortex cell types

Zizhen Yao et al.Mar 2, 2020
+81
T
S
Z
Abstract Single cell transcriptomics has transformed the characterization of brain cell identity by providing quantitative molecular signatures for large, unbiased samples of brain cell populations. With the proliferation of taxonomies based on individual datasets, a major challenge is to integrate and validate results toward defining biologically meaningful cell types. We used a battery of single-cell transcriptome and epigenome measurements generated by the BRAIN Initiative Cell Census Network (BICCN) to comprehensively assess the molecular signatures of cell types in the mouse primary motor cortex (MOp). We further developed computational and statistical methods to integrate these multimodal data and quantitatively validate the reproducibility of the cell types. The reference atlas, based on more than 600,000 high quality single-cell or -nucleus samples assayed by six molecular modalities, is a comprehensive molecular account of the diverse neuronal and non-neuronal cell types in MOp. Collectively, our study indicates that the mouse primary motor cortex contains over 55 neuronal cell types that are highly replicable across analysis methods, sequencing technologies, and modalities. We find many concordant multimodal markers for each cell type, as well as thousands of genes and gene regulatory elements with discrepant transcriptomic and epigenomic signatures. These data highlight the complex molecular regulation of brain cell types and will directly enable design of reagents to target specific MOp cell types for functional analysis.
0
Citation62
0
Save
215

Depth normalization for single-cell genomics count data

A. Booeshaghi et al.May 6, 2022
L
Á
I
A
Single-cell genomics analysis requires normalization of feature counts that stabilizes variance while accounting for variable cell sequencing depth. We discuss some of the trade-offs present with current widely used methods, and analyze their performance on 526 single-cell RNA-seq datasets. The results lead us to recommend proportional fitting prior to log transformation followed by an additional proportional fitting.
215
Citation23
0
Save
0

Decrease inACE2mRNA expression in aged mouse lung

A. Booeshaghi et al.Apr 5, 2020
L
A
Angiotensin-converting enzyme 2 ( ACE2 ) has been identified as a critical receptor for severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2). This has led to extensive speculation on the role of ACE2 in disease severity, and in particular, whether variation in its expression can explain higher mortality in older individuals. We examine this question in mouse lung and show that 24-month old mice have significantly reduced ACE2 mRNA expression relative to 3-month old mice. The differences appear to be localized to ciliated cells.
0
Citation18
0
Save
207

A multimodal cell census and atlas of the mammalian primary motor cortex

Ricky Adkins et al.Oct 21, 2020
+254
Y
M
R
ABSTRACT We report the generation of a multimodal cell census and atlas of the mammalian primary motor cortex (MOp or M1) as the initial product of the BRAIN Initiative Cell Census Network (BICCN). This was achieved by coordinated large-scale analyses of single-cell transcriptomes, chromatin accessibility, DNA methylomes, spatially resolved single-cell transcriptomes, morphological and electrophysiological properties, and cellular resolution input-output mapping, integrated through cross-modal computational analysis. Together, our results advance the collective knowledge and understanding of brain cell type organization: First, our study reveals a unified molecular genetic landscape of cortical cell types that congruently integrates their transcriptome, open chromatin and DNA methylation maps. Second, cross-species analysis achieves a unified taxonomy of transcriptomic types and their hierarchical organization that are conserved from mouse to marmoset and human. Third, cross-modal analysis provides compelling evidence for the epigenomic, transcriptomic, and gene regulatory basis of neuronal phenotypes such as their physiological and anatomical properties, demonstrating the biological validity and genomic underpinning of neuron types and subtypes. Fourth, in situ single-cell transcriptomics provides a spatially-resolved cell type atlas of the motor cortex. Fifth, integrated transcriptomic, epigenomic and anatomical analyses reveal the correspondence between neural circuits and transcriptomic cell types. We further present an extensive genetic toolset for targeting and fate mapping glutamatergic projection neuron types toward linking their developmental trajectory to their circuit function. Together, our results establish a unified and mechanistic framework of neuronal cell type organization that integrates multi-layered molecular genetic and spatial information with multi-faceted phenotypic properties.
207
Citation18
0
Save
0

Voyager: exploratory single-cell genomics data analysis with geospatial statistics

Lambda Moses et al.Jul 22, 2023
+6
K
P
L
Exploratory spatial data analysis (ESDA) can be a powerful approach to understanding single-cell genomics datasets, but it is not yet part of standard data analysis workflows. In particular, geospatial analyses, which have been developed and refined for decades, have yet to be fully adapted and applied to spatial single-cell analysis. We introduce the Voyager platform, which systematically brings the geospatial ESDA tradition to (spatial) -omics, with local, bivariate, and multivariate spatial methods not yet commonly applied to spatial -omics, united by a uniform user interface. Using Voyager, we showcase biological insights that can be derived with its methods, such as biologically relevant negative spatial autocorrelation. Underlying Voyager is the SpatialFeatureExperiment data structure, which combines Simple Feature with SingleCellExperiment and AnnData to represent and operate on geometries bundled with gene expression data. Voyager has comprehensive tutorials demonstrating ESDA built on GitHub Actions to ensure reproducibility and scalability, using data from popular commercial technologies. Voyager is implemented in both R/Bioconductor and Python/PyPI, and features compatibility tests to ensure that both implementations return consistent results.
0
Citation10
0
Save
0

Isoform cell type specificity in the mouse primary motor cortex

A. Booeshaghi et al.Mar 5, 2020
+4
C
Z
A
Full-length SMART-Seq single-cell RNA-seq can be used to measure gene expression at isoform resolution, making possible the identification of isoform markers for cell types and for an isoform atlas. In a comprehensive analysis of 6,160 mouse primary motor cortex cells assayed with SMART-Seq, we find numerous examples of isoform specificity in cell types, including isoform shifts between cell types that are masked in gene-level analysis. These findings can be used to refine spatial gene expression information to isoform resolution. Our results highlight the utility of full-length single-cell RNA-seq when used in conjunction with other single-cell RNA-seq technologies.
0
Citation7
0
Save
37

Quantifying orthogonal barcodes for sequence census assays

A. Booeshaghi et al.Oct 10, 2022
L
J
K
A
Abstract Barcode-based sequence census assays utilize custom or random oligonucloetide sequences to label various biological features, such as cell-surface proteins or CRISPR perturbations. These assays all rely on barcode quantification, a task that is complicated by barcode design and technical noise. We introduce a modular approach to quantifying barcodes that achieves speed and memory improvements over existing tools. We also introduce a set of quality control metrics, and accompanying tool, for validating barcode designs.
37
Citation6
0
Save
54

Assessing the multimodal tradeoff

A. Booeshaghi et al.Dec 10, 2021
L
F
A
Abstract Single-cell and single-nucleus genomics assays are becoming increasingly complex, with multiple measurements of distinct modalities performed concurrently resulting in “multimodal” readouts. While multimodal single-cell and single-nucleus genomics offers the potential to better understand how distinct cellular processes are coordinated, there can be technical and cost tradeoffs associated with increasing the number of measurement modes. To assess some of the tradeoffs inherent in multimodal assays, we have developed snATAK for preprocessing sequencing-based high-throughput assays that measure single-nucleus chromatin accessibility. Coupled with kallisto bustools for single-nucleus RNA-seq preprocessing, the snATAK workflow can be used for uniform preprocessing of 10x Genomics’ Multiome and single-nucleus ATAC-seq, SHARE-seq, ISSAAC-seq, spatial ATAC-seq and other chromatin-related assays. Using snATAK, we are able to perform cross-platform comparisons and quantify some of the tradeoffs between Multiome and unregistered single-nucleus RNA-seq/ATAC-seq experiments. We also show that snATAK can be used to assess allele concordance between paired RNAseq and ATACseq. snATAK is available at https://github.com/pachterlab/snATAK/ .
54
Citation5
0
Save
Load More