JM
Jingsi Ming
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(89% Open Access)
Cited by:
54
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Tabula Microcebus: A transcriptomic cell atlas of mouse lemur, an emerging primate model organism

Camille Ezran et al.Dec 12, 2021
ABSTRACT Mouse lemurs are the smallest, fastest reproducing, and among the most abundant primates, and an emerging model organism for primate biology, behavior, health and conservation. Although much has been learned about their physiology and their Madagascar ecology and phylogeny, little is known about their cellular and molecular biology. Here we used droplet- and plate-based single cell RNA-sequencing to profile 226,000 cells from 27 mouse lemur organs and tissues opportunistically procured from four donors clinically and histologically characterized. Using computational cell clustering, integration, and expert cell annotation, we defined and biologically organized over 750 mouse lemur molecular cell types and their full gene expression profiles. These include cognates of most classical human cell types, including stem and progenitor cells, and the developmental programs for spermatogenesis, hematopoiesis, and other adult tissues. We also described dozens of previously unidentified or sparsely characterized cell types and subtypes. We globally compared cell type expression profiles to define the molecular relationships of cell types across the body, and explored primate cell and gene expression evolution by comparing mouse lemur cell transcriptomes to those of human, mouse, and macaque. This revealed cell type specific patterns of primate specialization, as well as many cell types and genes for which lemur provides a better human model than mouse. The atlas provides a cellular and molecular foundation for studying this primate model organism, and establishes a general approach for other emerging model organisms.
1
Citation18
0
Save
33

RNA splicing programs define tissue compartments and cell types at single cell resolution

Julia Olivieri et al.May 2, 2021
Abstract More than 95% of human genes are alternatively spliced. Yet, the extent splicing is regulated at single-cell resolution has remained controversial due to both available data and methods to interpret it. We apply the SpliZ, a new statistical approach that is agnostic to transcript annotation, to detect cell-type-specific regulated splicing in > 110K carefully annotated single cells from 12 human tissues. Using 10x data for discovery, 9.1% of genes with computable SpliZ scores are cell-type specifically spliced. These results are validated with RNA FISH, single cell PCR, and in high throughput with Smart-seq2. Regulated splicing is found in ubiquitously expressed genes such as actin light chain subunit MYL6 and ribosomal protein RPS24 , which has an epithelial-specific microexon. 13% of the statistically most variable splice sites in cell-type specifically regulated genes are also most variable in mouse lemur or mouse. SpliZ analysis further reveals 170 genes with regulated splicing during sperm development using, 10 of which are conserved in mouse and mouse lemur. The statistical properties of the SpliZ allow model-based identification of subpopulations within otherwise indistinguishable cells based on gene expression, illustrated by subpopulations of classical monocytes with stereotyped splicing, including an un-annotated exon, in SAT1 , a Diamine acetyltransferase. Together, this unsupervised and annotation-free analysis of differential splicing in ultra high throughput droplet-based sequencing of human cells across multiple organs establishes splicing is regulated cell-type-specifically independent of gene expression.
33
Citation4
0
Save
7

Mouse lemur transcriptomic atlas elucidates primate genes, physiology, disease, and evolution

Camille Ezran et al.Aug 7, 2022
ABSTRACT Mouse lemurs ( Microcebus spp.) are an emerging model organism for primate biology, behavior, health, and conservation. Although little has been known about their cellular and molecular biology, in the accompanying paper we used large-scale single cell RNA-sequencing of 27 organs and tissues to identify over 750 molecular cell types and their full transcriptomic profiles. Here we use this extensive transcriptomic dataset to uncover thousands of previously unidentified genes and hundreds of thousands of new splice junctions in the reference genome that globally define lemur gene structures and cell-type selective expression and splicing and to investigate gene expression evolution. We use the atlas to explore the biology and function of the lemur immune system, including the expression profiles across the organism of all MHC genes and chemokines in health and disease, and the mapping of neutrophil and macrophage development, trafficking, and activation, their local and global responses to infection, and primate-specific aspects of the program. We characterize other examples of primate-specific physiology and disease such as unique features of lemur adipocytes that may underlie their dramatic seasonal rhythms, and spontaneous metastatic endometrial cancer that models the human gynecological malignancy. We identify and describe the organism-wide expression profiles of over 400 primate genes missing in mice, some implicated in human disease. Thus, an organism-wide molecular cell atlas and molecular cell autopsies can enhance gene discovery, structure definition, and annotation in a new model organism, and can identify and elucidate primate-specific genes, physiology, diseases, and evolution.
7
Citation2
0
Save
18

FIRM: Flexible Integration of single-cell RNA-sequencing data for large-scale Multi-tissue cell atlas datasets

Jingsi Ming et al.Jun 3, 2020
Abstract Single-cell RNA-sequencing (scRNA-seq) is being used extensively to measure the mRNA expression of individual cells from deconstructed tissues, organs, and even entire organisms to generate cell atlas references, leading to discoveries of novel cell types and deeper insight into biological trajectories. These massive datasets are usually collected from many samples using different scRNA-seq technology platforms, including the popular SMART-Seq2 (SS2) and 10X platforms. Inherent heterogeneities between platforms, tissues, and other batch effects makes scRNA-seq data difficult to compare and integrate, especially in large-scale cell atlas efforts; yet, accurate integration is essential for gaining deeper insights into cell biology. Through comprehensive data exploration, we found that accurate integration is often hampered by differences in cell-type compositions. Herein we describe FIRM, an algorithm that addresses this problem and achieves efficient and accurate integration of heterogeneous scRNA-seq datasets across multiple tissue types, platforms, and experimental batches. We applied FIRM to numerous large-scale scRNA-seq datasets from mouse, mouse lemur, and human, comparing its performance in dataset integration with other state-of-the-art methods. FIRM-integrated datasets show accurate mixing of shared cell type identities and superior preservation of original structure without overcorrection, generating robust integrated datasets for downstream exploration and analysis. It is also a facile way to transfer cell type labels and annotations from one dataset to another, making it a reliable and versatile tool for scRNA-seq analysis, especially for cell atlas data integration.
18
Citation1
0
Save
1

Adversarial domain translation networks for fast and accurate integration of large-scale atlas-level single-cell datasets

Jidong Zhao et al.Nov 19, 2021
Abstract The rapid emergence of large-scale atlas-level single-cell RNA-seq datasets presents remarkable opportunities for broad and deep biological investigations through integrative analyses. However, harmonizing such datasets requires integration approaches to be not only computationally scalable, but also capable of preserving a wide range of fine-grained cell populations. We created Portal, a unified framework of adversarial domain translation to learn harmonized representations of datasets. With innovation in model and algorithm designs, Portal achieves superior performance in preserving biological variation during integration, while achieving integration of millions of cells in minutes with low memory consumption. We show that Portal is widely applicable to integrating datasets across samples, platforms and data types (including scRNA-seq, snRNA-seq and scATAC-seq). Finally, we demonstrate the power of Portal by applying it to the integration of cross-species datasets with limited shared information among them, elucidating biological insights into the similarities and divergences in the spermatogenesis process among mouse, macaque and human.
0

Spatial transcriptomics: a new frontier in cancer research

Siyuan Huang et al.Jun 4, 2024
Abstract Tumor research is a fundamental focus of medical science, yet the intrinsic heterogeneity and complexity of tumors present challenges in understanding their biological mechanisms of initiation, progression, and metastasis. Recent advancements in single-cell transcriptomic sequencing have revolutionized the way researchers explore tumor biology by providing unprecedented resolution. However, a key limitation of single-cell sequencing is the loss of spatial information during single-cell preparation. Spatial transcriptomics (ST) emerges as a cutting-edge technology in tumor research that preserves the spatial information of RNA transcripts, thereby facilitating a deeper understanding of the tumor heterogeneity, the intricate interplay between tumor cells and the tumor microenvironment. This review systematically introduces ST technologies and summarizes their latest applications in tumor research. Furthermore, we provide a thorough overview of the bioinformatics analysis workflow for ST data and offer an online tutorial ( https://github.com/SiyuanHuang1/ST_Analysis_Handbook ). Lastly, we discuss the potential future directions of ST. We believe that ST will become a powerful tool in unraveling tumor biology and offer new insights for effective treatment and precision medicine in oncology.
0
Citation1
0
Save
0

LPM: a latent probit model to characterize the relationship among complex traits using summary statistics from multiple GWASs and functional annotations

Jingsi Ming et al.Oct 11, 2018
Much effort has been made toward understanding the genetic architecture of complex traits and diseases. Recent results from genome-wide association studies (GWASs) suggest the importance of regulatory genetic effects and pervasive pleiotropy among complex traits. In this study, we propose a unified statistical approach, aiming to characterize relationship among complex traits, and prioritize risk variants by leveraging regulatory information collected in functional annotations. Specifically, we consider a latent probit model (LPM) to integrate summary-level GWAS data and functional annotations. The developed computational framework not only makes LPM scalable to hundreds of annotations and phenotypes, but also ensures its statistically guaranteed accuracy. Through comprehensive simulation studies, we evaluated LPM's performance and compared it with related methods. Then we applied it to analyze 44 GWASs with nine genic category annotations and 127 cell-type specific functional annotations. The results demonstrate the benefits of LPM and gain insights of genetic architecture of complex traits. The LPM package is available at https://github.com/mingjingsi/LPM.