MP
Minshi Peng
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
1,678
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Large-Scale Exome Sequencing Study Implicates Both Developmental and Functional Changes in the Neurobiology of Autism

F. Satterstrom et al.Jan 23, 2020
+97
J
C
F

Summary

 We present the largest exome sequencing study of autism spectrum disorder (ASD) to date (n = 35,584 total samples, 11,986 with ASD). Using an enhanced analytical framework to integrate de novo and case-control rare variation, we identify 102 risk genes at a false discovery rate of 0.1 or less. Of these genes, 49 show higher frequencies of disruptive de novo variants in individuals ascertained to have severe neurodevelopmental delay, whereas 53 show higher frequencies in individuals ascertained to have ASD; comparing ASD cases with mutations in these groups reveals phenotypic differences. Expressed early in brain development, most risk genes have roles in regulation of gene expression or neuronal communication (i.e., mutations effect neurodevelopmental and neurophysiological changes), and 13 fall within loci recurrently hit by copy number variants. In cells from the human cortex, expression of risk genes is enriched in excitatory and inhibitory neuronal lineages, consistent with multiple paths to an excitatory-inhibitory imbalance underlying ASD.
1
Citation1,677
0
Save
0

cFIT: Integration and transfer learning of single cell transcriptomes, illustrated by fetal brain cell development

Minshi Peng et al.Aug 31, 2020
+2
B
Y
M
Abstract Large, comprehensive collections of scRNA-seq data sets have been generated that allow for the full transcriptional characterization of cell types across a wide variety of biological and clinical conditions. As new methods arise to measure distinct cellular modalities, a key analytical challenge is to integrate these data sets or transfer knowledge from one to the other to better understand cellular identity and functions. Here, we present a simple yet surprisingly effective method named cFIT for capturing various batch effects across experiments, technologies, subjects, and even species. The proposed method models the shared information between various data sets by a common factor space, while allowing for unique distortions and shifts in gene-wise expression in each batch. The model parameters are learned under an iterative non-negative matrix factorization (NMF) framework and then used for synchronized integration from across-domain assays. In addition, the model enables transferring via low-rank matrix from more informative data to allow for precise identification in data of lower quality. Compared to existing approaches, our method imposes weaker assumptions on the cell composition of each individual data set, however, is shown to be more reliable in preserving biological variations. We apply cFIT to multiple scRNA-seq data sets of developing brain from human and mouse, varying by technologies and developmental stages. The successful integration and transfer uncover the transcriptional resemblance across systems. The study helps establish a comprehensive landscape of brain cell type diversity and provides insights into brain development.
0

Large-scale exome sequencing study implicates both developmental and functional changes in the neurobiology of autism

F. Satterstrom et al.Nov 30, 2018
+155
M
J
F
We present the largest exome sequencing study of autism spectrum disorder (ASD) to date (n=35,584 total samples, 11,986 with ASD). Using an enhanced Bayesian framework to integrate de novo and case-control rare variation, we identify 102 risk genes at a false discovery rate ≤ 0.1. Of these genes, 49 show higher frequencies of disruptive de novo variants in individuals ascertained for severe neurodevelopmental delay, while 53 show higher frequencies in individuals ascertained for ASD; comparing ASD cases with mutations in these groups reveals phenotypic differences. Expressed early in brain development, most of the risk genes have roles in regulation of gene expression or neuronal communication (i.e., mutations effect neurodevelopmental and neurophysiological changes), and 13 fall within loci recurrently hit by copy number variants. In human cortex single-cell gene expression data, expression of risk genes is enriched in both excitatory and inhibitory neuronal lineages, consistent with multiple paths to an excitatory/inhibitory imbalance underlying ASD.
0

Whole-genome and RNA sequencing reveal variation and transcriptomic coordination in the developing human prefrontal cortex

Donna Werling et al.Mar 22, 2019
+31
M
Z
D
Variation in gene expression underlies neurotypical development, while genomic variants contribute to neuropsychiatric disorders. BrainVar is a unique resource of paired whole-genome sequencing and bulk-tissue RNA-sequencing from the human dorsolateral prefrontal cortex of 176 neurotypical individuals across prenatal and postnatal development, providing the opportunity to assay genomic and transcriptomic variation in tandem. Leveraging this resource, we identified rare premature stop codons with commensurate reduced and allele-specific expression of corresponding genes, and common variants that alter gene expression (expression quantitative trait loci, eQTLs). Categorizing eQTLs by prenatal and postnatal effect, genes affected by temporally-specific eQTLs, compared to constitutive eQTLs, are enriched for haploinsufficiency, protein-protein interactions, and neuropsychiatric disorder risk loci. Expression levels of over 12,000 genes rise or fall in a concerted late-fetal transition, with the transitional genes enriched for cell type specific genes and neuropsychiatric disorder loci, underscoring the importance of cataloguing developmental trajectories in understanding cortical physiology and pathology.
8

Cell Type Hierarchy Reconstruction via Reconciliation of Multi-resolution Cluster Tree

Minshi Peng et al.Feb 8, 2021
+3
A
B
M
Abstract A wealth of clustering algorithms are available for Single-cell RNA sequencing (scRNA-seq), but it remains challenging to compare and characterize the features across different scales of resolution. To resolve this challenge Multi-resolution Reconciled Tree (MRtree), builds a hierarchical tree structure based on multi-resolution partitions that is highly flexible and can be coupled with most scRNA-seq clustering algorithms. MRtree out-performs bottom-up or divisive hierarchical clustering approaches because it inherits the robustness and versatility of a flat clustering approach, while maintaining the hierarchical structure of cells. Application to fetal brain cells yields insight into subtypes of cells that can be reliably estimated.