PK
Peter Kharchenko
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Harvard University, Harvard Stem Cell Institute, Shanghai Institute for Science of Science
+ 7 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
34
(68% Open Access)
Cited by:
497
h-index:
69
/
i10-index:
111
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

An integrated transcriptomic and epigenomic atlas of mouse primary motor cortex cell types

Zizhen Yao et al.May 6, 2020
+80
F
H
Z
Abstract Single cell transcriptomics has transformed the characterization of brain cell identity by providing quantitative molecular signatures for large, unbiased samples of brain cell populations. With the proliferation of taxonomies based on individual datasets, a major challenge is to integrate and validate results toward defining biologically meaningful cell types. We used a battery of single-cell transcriptome and epigenome measurements generated by the BRAIN Initiative Cell Census Network (BICCN) to comprehensively assess the molecular signatures of cell types in the mouse primary motor cortex (MOp). We further developed computational and statistical methods to integrate these multimodal data and quantitatively validate the reproducibility of the cell types. The reference atlas, based on more than 600,000 high quality single-cell or -nucleus samples assayed by six molecular modalities, is a comprehensive molecular account of the diverse neuronal and non-neuronal cell types in MOp. Collectively, our study indicates that the mouse primary motor cortex contains over 55 neuronal cell types that are highly replicable across analysis methods, sequencing technologies, and modalities. We find many concordant multimodal markers for each cell type, as well as thousands of genes and gene regulatory elements with discrepant transcriptomic and epigenomic signatures. These data highlight the complex molecular regulation of brain cell types and will directly enable design of reagents to target specific MOp cell types for functional analysis.
0
Citation45
0
Save
86

Case-control analysis of single-cell RNA-seq studies

Viktor Petukhov et al.Oct 24, 2023
+4
R
A
V
Summary Single-cell RNA-seq (scRNA-seq) assays are being increasingly utilized to investigate specific hypotheses in both basic biology and clinically-applied studies. The design of most such studies can be often reduced to a comparison between two or more groups of samples, such as disease cases and healthy controls, or treatment and placebo. Comparative analysis between groups of scRNA-seq samples brings additional statistical considerations, and currently there is a lack of tools to address this common scenario. Based on our experience with comparative designs, here we present a computational suite ( Cacoa – ca se- co ntrol a nalysis ) to carry out statistical tests, exploration, and visualization of scRNA-seq sample cohorts. Using multiple example datasets, we demonstrate how application of these techniques can provide additional insights, and avoid issues stemming from inter-individual variability, limited sample size, and high dimensionality of the data.
86
Paper
Citation19
0
Save
207

A multimodal cell census and atlas of the mammalian primary motor cortex

Ricky Adkins et al.Oct 13, 2023
+254
S
A
R
ABSTRACT We report the generation of a multimodal cell census and atlas of the mammalian primary motor cortex (MOp or M1) as the initial product of the BRAIN Initiative Cell Census Network (BICCN). This was achieved by coordinated large-scale analyses of single-cell transcriptomes, chromatin accessibility, DNA methylomes, spatially resolved single-cell transcriptomes, morphological and electrophysiological properties, and cellular resolution input-output mapping, integrated through cross-modal computational analysis. Together, our results advance the collective knowledge and understanding of brain cell type organization: First, our study reveals a unified molecular genetic landscape of cortical cell types that congruently integrates their transcriptome, open chromatin and DNA methylation maps. Second, cross-species analysis achieves a unified taxonomy of transcriptomic types and their hierarchical organization that are conserved from mouse to marmoset and human. Third, cross-modal analysis provides compelling evidence for the epigenomic, transcriptomic, and gene regulatory basis of neuronal phenotypes such as their physiological and anatomical properties, demonstrating the biological validity and genomic underpinning of neuron types and subtypes. Fourth, in situ single-cell transcriptomics provides a spatially-resolved cell type atlas of the motor cortex. Fifth, integrated transcriptomic, epigenomic and anatomical analyses reveal the correspondence between neural circuits and transcriptomic cell types. We further present an extensive genetic toolset for targeting and fate mapping glutamatergic projection neuron types toward linking their developmental trajectory to their circuit function. Together, our results establish a unified and mechanistic framework of neuronal cell type organization that integrates multi-layered molecular genetic and spatial information with multi-faceted phenotypic properties.
207
Citation18
0
Save
97

Bayesian segmentation of spatially resolved transcriptomics data

Viktor Petukhov et al.Oct 24, 2023
P
K
R
V
Spatial transcriptomics is an emerging stack of technologies, which adds spatial dimension to conventional single-cell RNA-sequencing. New protocols, based on in situ sequencing or multiplexed RNA fluorescent in situ hybridization register positions of single molecules in fixed tissue slices. Analysis of such data at the level of individual cells, however, requires accurate identification of cell boundaries. While many existing methods are able to approximate cell center positions using nuclei stains, current protocols do not report robust signal on the cell membranes, making accurate cell segmentation a key barrier for downstream analysis and interpretation of the data. To address this challenge, we developed a tool for Bayesian Segmentation of Spatial Transcriptomics Data ( Baysor ), which optimizes segmentation considering the likelihood of transcriptional composition, size and shape of the cell. The Bayesian approach can take into account nuclear or cytoplasm staining, however can also perform segmentation based on the detected transcripts alone. We show that Baysor segmentation can in some cases nearly double the number of the identified cells, while reducing contamination. Importantly, we demonstrate that Baysor performs well on data acquired using five different spatially-resolved protocols, making it a useful general tool for analysis of high-resolution spatial data.
97
Citation18
0
Save
1

Tensor decomposition reveals coordinated multicellular patterns of transcriptional variation that distinguish and stratify disease individuals

Joseph Mitchel et al.Oct 24, 2023
+4
R
M
J
Summary Tissue- and organism-level biological processes often involve coordinated action of multiple distinct cell types. Current computational methods for the analysis of single-cell RNA-sequencing (scRNA-seq) data, however, are not designed to capture co-variation of cell states across samples, in part due to the low number of biological samples in most scRNA-seq datasets. Recent advances in sample multiplexing have enabled population-scale scRNA-seq measurements of tens to hundreds of samples. To take advantage of such datasets, here we introduce a computational approach called single-cell Interpretable Tensor Decomposition (scITD). This method extracts “multicellular gene expression patterns” that capture how sample-specific expression states of a cell type are correlated with the expression states of other cell types. Such multicellular patterns can reveal molecular mechanisms underlying coordinated changes of different cell types within the tissue, and can be used to stratify individuals in a clinically-relevant and reproducible manner. We first validated the performance of scITD using in vitro experimental data and simulations. We then applied scITD to scRNA-seq data on peripheral blood mononuclear cells (PBMCs) from 115 patients with systemic lupus erythematosus and 56 healthy controls. We recapitulated a well-established pan-cell-type signature of interferon-signaling that was associated with the presence of anti-dsDNA autoantibodies and a disease activity index. We further identified a novel multicellular pattern linked to nephritis, which was characterized by an expansion of activated memory B cells along with helper T cell activation. Our approach also sheds light on ligand-receptor interactions potentially mediating these multicellular patterns. As validation, we demonstrated that these expression patterns also stratified donors from a pediatric SLE dataset by the same phenotypic attributes. Lastly, we found the interferon multicellular pattern and others to be conserved in a COVID-19 dataset, pointing to the presence of both general and disease-specific patterns of inter-individual immune variation. Overall, scITD is a flexible method for exploring co-variation of cell states in multi-sample single-cell datasets, which can yield new insights into complex non-cell-autonomous dependencies that define and stratify disease.
27

Selective vulnerability of supragranular layer neurons in schizophrenia

Mykhailo Batiuk et al.Oct 24, 2023
+14
S
T
M
ABSTRACT Schizophrenia is one of the most wide-spread mental brain disorders with complex and largely unknown etiology. To characterize the impact of schizophrenia at a cellular level, we performed single nucleus RNA sequencing of >190,000 neurons from the dorsolateral prefrontal cortex of patients with schizophrenia and matched controls (7 vs 11, respectively). In addition, to correlate data with cortical anatomy, >100,000 neurons were analyzed topographically by immunohistochemistry in an extended cohort of cases with schizophrenia and controls (10 vs 10). Compositional analysis of RNA sequencing data revealed reduction in relative abundance across all families of GABAergic neurons and a concomitant increase in principal neurons, which was most pronounced for supragranular subtypes (layers 2-3). Moreover, supragranular subtypes of GABAergic interneurons showed most dramatic transcriptomic changes. These results were substantiated by histological analysis, which revealed a reduction in the density of calretinin, calbindin and parvalbumin GABAergic interneurons particularly in layer 2. Common effect of schizophrenia on supragranular neuronal networks was underlined by downregulation of protein processing genes and upregulation of neuronal development/plasticity genes across supragranular subtypes of principal neurons and GABAergic interneurons. In situ hybridization and spatial transcriptomics further confirmed supragranular layer neuron vulnerability, revealing complexity of schizophrenia-affected cortical circuits. These point towards general network impairment within supragranular layers being a core substrate associated with schizophrenia symptomatology.
27
Citation10
0
Save
0

Human prostate cancer bone metastases have an actionable immunosuppressive microenvironment

Ninib Baryawno et al.May 7, 2020
+13
N
Y
N
Abstract Bone metastases are devastating complications of cancer. They are particularly common in prostate cancer, represent incurable disease and are refractory to immunotherapy. We sought to define distinct features of the bone marrow microenvironment by analyzing single cells from prostate cancer patients’ involved bone, uninvolved bone and distant bone sites as well as bone from cancer-free, orthopedic patients and healthy individuals. Metastatic prostate cancer was associated with multifaceted immune distortion, specifically exhaustion of distinct T cell subsets, appearance of macrophages with states specific to prostate cancer bone metastases. The chemokine CCL20 was notably overexpressed by myeloid cells, as was its cognate CCR6 receptor on T cells. Disruption of the CCL20-CCR6 axis in mice with syngeneic prostate bone metastases restored T cell reactivity and significantly prolonged animal survival. Comparative high resolution analysis of prostate cancer bone metastasis shows a targeted approach for relieving local immunosuppression for therapeutic effect.
0

Comparison of Principal Component Analysis and t-Stochastic Neighbor Embedding with Distance Metric Modifications for Single-cell RNA-sequencing Data Analysis

Hyun-Wung Kwon et al.May 6, 2020
P
J
H
Abstract Recent developments in technological tools such as next generation sequencing along with peaking interest in the study of single cells has enabled single-cell RNA-sequencing, in which whole transcriptomes are analyzed on a single-cell level. Studies, however, have been hindered by the ability to effectively analyze these single cell RNA-seq datasets, due to the high-dimensional nature and intrinsic noise in the data. While many techniques have been introduced to reduce dimensionality of such data for visualization and subpopulation identification, the utility to identify new cellular subtypes in a reliable and robust manner remains unclear. Here, we compare dimensionality reduction visualization methods including principle component analysis and t-stochastic neighbor embedding along with various distance metric modifications to visualize single-cell RNA-seq datasets, and assess their performance in identifying known cellular subtypes. Our results suggest that selecting variable genes prior to analysis on single-cell RNA-seq data is vital to yield reliable classification, and that when variable genes are used, the choice of distance metric modification does not particularly influence the quality of classification. Still, in order to take advantage of all the gene expression information, alternative methods must be used for a reliable classification.
4

Integrated single-cell and spatial transcriptomic analyses unravel the heterogeneity of the prostate tumor microenvironment

Taghreed Hirz et al.Oct 24, 2023
+17
H
S
T
Summary The treatment of primary prostate cancer delicately balances an active surveillance approach for low-risk disease with multimodal treatment including surgery, radiation therapy, and hormonal therapy for high-risk disease. Recurrence and development of metastatic disease remains a clinical problem, without a clear understanding of what drives immune escape and tumor progression. Here, we sought to comprehensively describe the tumor microenvironment of localized prostate cancer contrasting this with adjacent normal samples and healthy controls. We performed single-cell RNA sequencing and high-resolution spatial transcriptomic analysis. This revealed tumor context dependent changes in gene expression. Our data point towards an immune suppressive tumor microenvironment associated with suppressive myeloid populations and exhausted T-cells, in addition to high stromal angiogenic activity. We inferred cell-to-cell relationships at an unprecedented scale for ligand-receptor interactions within undissociated tissue sections. Our work provides a highly detailed and comprehensive resource of the prostate tumor microenvironment as well as tumor-stromal cell interactions. Highlights Characterization of prostate cancer by combined scRNA-seq and spatial transcriptomic analysis Primary prostate cancer establishes a suppressive immune microenvironment The prostate tumor microenvironment exhibits a high angiogenic gene expression pattern A new computational analysis pipeline to deconvolute context-specific differential gene expression
2

Single-nuclei transcriptomes from human adrenal gland reveals distinct cellular identities of low and high-risk neuroblastoma tumors

Oscar Bedoya-Reina et al.Oct 24, 2023
+13
M
W
O
Abstract Childhood neuroblastoma has a remarkable variability in outcome. Age at diagnosis is one of the most important prognostic factors, with children less than 1 year old having favorable outcomes. We studied single-cell and single-nuclei transcriptomes of neuroblastoma with different clinical risk groups and stages, including healthy adrenal gland. We compared tumor cell populations with embryonic mouse sympatho-adrenal derivatives, and post-natal human adrenal gland. We provide evidence that low and high-risk neuroblastoma have different cell identities, representing two disease entities. Low-risk neuroblastoma presents a transcriptome that resembles sympatho- and chromaffin cells, whereas malignant cells enriched in high-risk neuroblastoma resembles an unknown subtype of TRKB+ cholinergic progenitor population identified in human post-natal gland. Analyses of these populations revealed different gene expression programs for worst and better survival in correlation with age at diagnosis. Our findings reveal two cellular identities and a composition of human neuroblastoma tumors reflecting clinical heterogeneity and outcome.
2
Citation2
0
Save
Load More