JZ
Jiaqiang Zhu
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
330
h-index:
10
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Heritability Estimation and Differential Analysis with Generalized Linear Mixed Models in Genomic Sequencing Studies

Shuang Sun et al.Jun 29, 2018
ABSTRACT Motivation Genomic sequencing studies, including RNA sequencing and bisulfite sequencing studies, are becoming increasingly common and increasingly large. Large genomic sequencing studies open doors for accurate molecular trait heritability estimation and powerful differential analysis. Heritability estimation and differential analysis in sequencing studies requires the development of statistical methods that can properly account for the count nature of the sequencing data and that are computationally efficient for large data sets. Results Here, we develop such a method, PQLseq (Penalized Quasi-Likelihood for sequencing count data), to enable effective and efficient heritability estimation and differential analysis using the generalized linear mixed model framework. With extensive simulations and comparisons to previous methods, we show that PQLseq is the only method currently available that can produce unbiased heritability estimates for sequencing count data. In addition, we show that PQLseq is well suited for differential analysis in large sequencing studies, providing calibrated type I error control and more power compared to the standard linear mixed model methods. Finally, we apply PQLseq to perform gene expression heritability estimation and differential expression analysis in a large RNA sequencing study in the Hutterites. Availability and implementation PQLseq is implemented as an R package with source code freely available at www.xzlab.org/software.html and https://cran.r-project.org/web/packages/PQLseq/index.html . Contact XZ ( xzhousph@umich.edu ) Supplementary information Supplementary data are available online.
0
Citation3
0
Save
0

Statistical Analysis of Spatial Expression Pattern for Spatially Resolved Transcriptomic Studies

Shuang Sun et al.Oct 21, 2019
Recent development of various spatially resolved transcriptomic techniques has enabled gene expression profiling on complex tissues with spatial localization information. Identifying genes that display spatial expression pattern in these studies is an important first step towards characterizing the spatial transcriptomic landscape. Detecting spatially expressed genes requires the development of statistical methods that can properly model spatial count data, provide effective type I error control, have sufficient statistical power, and are computationally efficient. Here, we developed such a method, SPARK. SPARK directly models count data generated from various spatial resolved transcriptomic techniques through generalized linear spatial models. With a new efficient penalized quasi-likelihood based algorithm, SPARK is scalable to data sets with tens of thousands of genes measured on tens of thousands of samples. Importantly, SPARK relies on newly developed statistical formulas for hypothesis testing, producing well-calibrated p-values and yielding high statistical power. We illustrate the benefits of SPARK through extensive simulations and in-depth analysis of four published spatially resolved transcriptomic data sets. In the real data applications, SPARK is up to ten times more powerful than existing approaches. The high power of SPARK allows us to identify new genes and pathways that reveal new biology in the data that otherwise cannot be revealed by existing approaches.
0

Accuracy, Robustness and Scalability of Dimensionality Reduction Methods for Single Cell RNAseq Analysis

Shuang Sun et al.May 17, 2019
Background Dimensionality reduction (DR) is an indispensable analytic component for many areas of single cell RNA sequencing (scRNAseq) data analysis. Proper DR can allow for effective noise removal and facilitate many downstream analyses that include cell clustering and lineage reconstruction. Unfortunately, despite the critical importance of DR in scRNAseq analysis and the vast number of DR methods developed for scRNAseq studies, however, few comprehensive comparison studies have been performed to evaluate the effectiveness of different DR methods in scRNAseq.Results Here, we aim to fill this critical knowledge gap by providing a comparative evaluation of a variety of commonly used DR methods for scRNAseq studies. Specifically, we compared 18 different DR methods on 30 publicly available scRNAseq data sets that cover a range of sequencing techniques and sample sizes. We evaluated the performance of different DR methods for neighborhood preserving in terms of their ability to recover features of the original expression matrix, and for cell clustering and lineage reconstruction in terms of their accuracy and robustness. We also evaluated the computational scalability of different DR methods by recording their computational cost.Conclusions Based on the comprehensive evaluation results, we provide important guidelines for choosing DR methods for scRNAseq data analysis. We also provide all analysis scripts used in the present study at [www.xzlab.org/reproduce.html][1]. Together, we hope that our results will serve as an important practical reference for practitioners to choose DR methods in the field of scRNAseq analysis. [1]: http://www.xzlab.org/reproduce.html
1

ASXL3 controls cortical neuron fate specification through extrinsic self-renewal pathways

BT McGrath et al.Jul 21, 2021
ABSTRACT During corticogenesis, transcription plasticity is fundamental to the restriction of neural progenitor cell (NPC) multipotency and production of cortical neuron heterogeneity. Human and mouse genetic studies have highlighted the role of Polycomb transcriptional regulation in this process. ASXL3 , which encodes a component of the Polycomb repressive deubiquitination (PR-DUB) complex, has been identified as a high confidence autism spectrum disorder (ASD) risk gene. Genetic inactivation of Asxl3, in a mouse model that carries a clinically relevant ASXL3 frameshift ( Asxl3 fs ) variant, disrupts lateral expansion of NPCs and delays cortical neuron differentiation. Single-cell RNA sequencing analysis implicates Notch signaling, which alters the composition of excitatory neurons and fidelity of cortical layer deposition. Our data provides a new link between extrinsic signaling cues and intrinsic epigenetic regulation that together control the timing of cell fate programs. Furthermore, transcriptomic analysis revealed dysregulation of other known ASD risk genes indicating that a convergent developmental pathway is affected. Collectively our work provides important insights about developmental mechanisms that contribute to ASD neuropathology.