JW
Jiebiao Wang
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
17
(76% Open Access)
Cited by:
2,003
h-index:
19
/
i10-index:
27
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Large eQTL meta-analysis reveals differing patterns between cerebral cortical and cerebellar brain regions

Solveig Sieberts et al.Oct 12, 2020
Abstract The availability of high-quality RNA-sequencing and genotyping data of post-mortem brain collections from consortia such as CommonMind Consortium (CMC) and the Accelerating Medicines Partnership for Alzheimer’s Disease (AMP-AD) Consortium enable the generation of a large-scale brain cis- eQTL meta-analysis. Here we generate cerebral cortical eQTL from 1433 samples available from four cohorts (identifying >4.1 million significant eQTL for >18,000 genes), as well as cerebellar eQTL from 261 samples (identifying 874,836 significant eQTL for >10,000 genes). We find substantially improved power in the meta-analysis over individual cohort analyses, particularly in comparison to the Genotype-Tissue Expression (GTEx) Project eQTL. Additionally, we observed differences in eQTL patterns between cerebral and cerebellar brain regions. We provide these brain eQTL as a resource for use by the research community. As a proof of principle for their utility, we apply a colocalization analysis to identify genes underlying the GWAS association peaks for schizophrenia and identify a potentially novel gene colocalization with lncRNA RP11-677M14.2 (posterior probability of colocalization 0.975).
1
Citation305
0
Save
6

Bayesian estimation of cell-type-specific gene expression per bulk sample with prior derived from single-cell data

Jiebiao Wang et al.Aug 6, 2020
Abstract When assessed over a large number of samples, bulk RNA sequencing provides reliable data for gene expression at the tissue level. Single-cell RNA sequencing (scRNA-seq) deepens those analyses by evaluating gene expression at the cellular level. Both data types lend insights into disease etiology. With current technologies, however, scRNA-seq data are known to be noisy. Moreover, constrained by costs, scRNA-seq data are typically generated from a relatively small number of subjects, which limits their utility for some analyses, such as identification of gene expression quantitative trait loci (eQTLs). To address these issues while maintaining the unique advantages of each data type, we develop a Bayesian method (bMIND) to integrate bulk and scRNA-seq data. With a prior derived from scRNA-seq data, we propose to estimate sample-level cell-type-specific (CTS) expression from bulk expression data. The CTS expression enables large-scale sample-level downstream analyses, such as detecting CTS differentially expressed genes (DEGs) and eQTLs. Through simulations, we demonstrate that bMIND improves the accuracy of sample-level CTS expression estimates and power to discover CTS-DEGs when compared to existing methods. To further our understanding of two complex phenotypes, autism spectrum disorder and Alzheimer’s disease, we apply bMIND to gene expression data of relevant brain tissue to identify CTS-DEGs. Our results complement findings for CTS-DEGs obtained from snRNA-seq studies, replicating certain DEGs in specific cell types while nominating other novel genes in those cell types. Finally, we calculate CTS-eQTLs for eleven brain regions by analyzing GTEx V8 data, creating a new resource for biological insights.
6
Citation9
0
Save
10

Expansion of RNA sequence diversity and RNA editing rates throughout human cortical development

Winston Cuddleston et al.Jun 10, 2021
ABSTRACT Post-transcriptional modifications by RNA editing are essential for neurodevelopment, yet their developmental and regulatory features remain poorly resolved. We constructed a full temporal view of base-specific RNA editing in the developing human cortex, from early progenitors through fully mature cells found in the adult brain. Developmental regulation of RNA editing is characterized by an increase in editing rates for more than 10,000 selective editing sites, shifting between mid-fetal development and infancy, and a massive expansion of RNA hyper-editing sites that amass in the cortex through postnatal development into advanced age. These sites occur disproportionally in 3’UTRs of essential neurodevelopmental genes. These profiles are preserved in non-human primate and murine models, illustrating evolutionary conserved regulation of RNA editing in mammalian cortical development. RNA editing levels are commonly genetically regulated (editing quantitative trait loci, edQTLs) consistently across development or predominantly during prenatal or postnatal periods. Both consistent and temporal-predominant edQTLs co-localize with risk loci associated with neurological traits and disorders, including attention deficit hyperactivity disorder, schizophrenia, and sleep disorders. These findings expand the repertoire of highly regulated RNA editing sites in the brain and provide insights of how epitranscriptional sequence diversity by RNA editing contributes to neurodevelopment.
10
Citation3
0
Save
25

Transcriptional alterations in opioid use disorder reveal an interplay between neuroinflammation and synaptic remodeling

Marianne Seney et al.Sep 15, 2020
Abstract Background Prevalence rates of opioid use disorder (OUD) have increased dramatically, accompanied by a surge of overdose deaths. While opioid dependence has been extensively studied in preclinical models, an understanding of the biological alterations that occur in the brains of people who chronically use opioids and who are diagnosed with OUD remains limited. To address this limitation, RNA-sequencing (RNA-seq) was conducted on the dorsolateral prefrontal cortex (DLPFC) and nucleus accumbens (NAc), regions heavily implicated in OUD, from postmortem brains in subjects with OUD. Methods We performed RNA-seq on the DLPFC and NAc from unaffected comparison subjects (n=20) and subjects diagnosed with OUD (n=20). Our transcriptomic analyses identified differentially expressed (DE) transcripts and investigated the transcriptional coherence between brain regions using rank-rank hypergeometric ordering (RRHO). Weighted gene co-expression analyses (WGCNA) also identified OUD-specific modules and gene networks. Integrative analyses between DE transcripts and GWAS datasets using linkage disequilibrium score (LDSC) assessed the genetic liability psychiatric-related phenotypes. Results RRHO analyses revealed extensive overlap in transcripts between DLPFC and NAc in OUD, primarily relating to synaptic remodeling and neuroinflammation. Identified transcripts were enriched for factors that control pro-inflammatory cytokine-mediated, chondroitin sulfate, and extracellular matrix signaling. Cell-type deconvolution implicated a role for microglia as a critical driver for opioid-induced neuroplasticity. Using LDSC, we discovered genetic liabilities for risky behavior, attention deficit hyperactivity disorder, and depression. Conclusions Overall, our findings reveal new connections between the brain’s immune system and opioid dependence in the human brain.
25
Citation3
0
Save
1

scMD: cell type deconvolution using single-cell DNA methylation references

Manqi Cai et al.Aug 6, 2023
Abstract The proliferation of single-cell RNA sequencing data has led to the widespread use of cellular deconvolution, aiding the extraction of cell type-specific information from extensive bulk data. However, those advances have been mostly limited to transcriptomic data. With recent development in single-cell DNA methylation (scDNAm), new avenues have been opened for deconvolving bulk DNAm data, particularly for solid tissues like the brain that lack cell-type references. Due to technical limitations, current scDNAm sequences represent a small proportion of the whole genome for each single cell, and those detected regions differ across cells. This makes scDNAm data ultrahigh dimensional and ultra-sparse. To deal with these challenges, we introduce scMD (single cell Methylation Deconvolution), a cellular deconvolution framework to reliably estimate cell type fractions from tissue-level DNAm data. To analyze large-scale complex scDNAm data, scMD employs a statistical approach to aggregate scDNAm data at the cell cluster level, identify cell-type marker DNAm sites, and create a precise cell-type signature matrix that surpasses state-of-the-art sorted-cell or RNA-derived references. Through thorough benchmarking in several datasets, we demonstrate scMD’s superior performance in estimating cellular fractions from bulk DNAm data. With scMD-estimated cellular fractions, we identify cell type fractions and cell type-specific differentially methylated cytosines associated with Alzheimer’s disease.
1
Citation2
0
Save
11

Integrative Analysis of Spatial Transcriptome with Single-cell Transcriptome and Single-cell Epigenome in Mouse Lungs after Immunization

Zhongli Xu et al.Sep 20, 2021
ABSTRACT Immunological memory is key to productive adaptive immunity. An unbiased, high throughput gene expression profiling of tissue-resident memory T cells at their precise anatomical locations within the lung is fundamental to understanding lung immunity, but such spatial information has yet to be characterized. In this study, using a well-established Klebsiella pneumoniae infection model, we performed an integrative analysis of spatial transcriptome with single-cell RNA-seq and single-cell ATAC-seq on lung cells from mice after immunization using the 10x Genomics Chromium and Visium platform. We employed several deconvolution algorithms and established an optimized deconvolution pipeline to accurately decipher specific cell-type composition by anatomic location. We identified and located 12 major cell types by scRNA-seq and spatial transcriptomic analysis. Integrating scATAC-seq data from the same cells processed in parallel with scRNA-seq, we found epigenomic profiles provide more robust cell type identification, especially for lineage-specific T helper cells. When combining all three data modalities, we observed a dynamic change in the location of T helper cells as well as their corresponding chemokines for chemotaxis. Furthermore, cell-cell communication analysis of spatial transcriptome provided evidence of lineage-specific T helper cells receiving designated cytokine signaling. In summary, our first-in-class study demonstrated the power of multi-omics analysis to uncover intrinsic spatial- and cell-type-dependent molecular mechanisms of lung immunity. Our data provides a rich research resource of single cell multi-omics data as a reference for understanding spatial dynamics of lung immunization.
11
Citation2
0
Save
0

ESCO: single cell expression simulation incorporating gene co-expression

Jinjin Tian et al.Oct 21, 2020
Abstract Motivation Gene-gene co-expression networks (GCN) are of biological interest for the useful information they provide for understanding gene-gene interactions. The advent of single cell RNA-sequencing allows us to examine more subtle gene co-expression occurring within a cell type. Many imputation and denoising methods have been developed to deal with the technical challenges observed in single cell data; meanwhile, several simulators have been developed for benchmarking and assessing these methods. Most of these simulators, however, either do not incorporate gene co-expression or generate co-expression in an inconvenient manner. Results Therefore, with the focus on gene co-expression, we propose a new simulator, ESCO, which adopts the idea of the copula to impose gene co-expression, while preserving the highlights of available simulators, which perform well for simulation of gene expression marginally. Using ESCO, we assess the performance of imputation methods on GCN recovery and find that imputation generally helps GCN recovery when the data are not too sparse, and the ensemble imputation method works best among leading methods. In contrast, imputation fails to help in the presence of an excessive fraction of zero counts, where simple data aggregating methods are a better choice. These findings are further verified with mouse and human brain cell data. Availability The ESCO implementation is available as R package SplatterESCO ( https://github.com/JINJINT/SplatterESCO ). Contact roeder@andrew.cmu.edu
0
Citation1
0
Save
18

DeepGAMI: Deep biologically guided auxiliary learning for multimodal integration and imputation to improve phenotype prediction

Pramod Chandrashekar et al.Aug 16, 2022
Abstract Genotype-phenotype association is found in many biological systems, such as brain-related diseases and behavioral traits. Despite the recent improvement in the prediction of phenotypes from genotypes, they can be further improved and explainability of these predictions remains challenging, primarily due to complex underlying molecular and cellular mechanisms. Emerging multimodal data enables studying such mechanisms at different scales from genotype to phenotypes involving intermediate phenotypes like gene expression. However, due to the black-box nature of many machine learning techniques, it is challenging to integrate these multi-modalities and interpret the biological insights in prediction, especially when some modality is missing. Biological knowledge has recently been incorporated into machine learning modeling to help understand the reasoning behind the choices made by these models. To this end, we developed DeepGAMI, an interpretable deep learning model to improve genotype-phenotype prediction from multimodal data. DeepGAMI uses prior biological knowledge to define the neural network architecture. Notably, it embeds an auxiliary-learning layer for cross-modal imputation while training the model from multimodal data. Using this pre-trained layer, we can impute latent features of additional modalities and thus enable predicting phenotypes from a single modality only. Finally, the model uses integrated gradient to prioritize multimodal features and links for phenotypes. We applied DeepGAMI to multiple emerging multimodal datasets: (1) population-level genotype and bulk-tissue gene expression data for predicting schizophrenia, (2) population-level genotype and gene expression data for predicting clinical phenotypes in Alzheimer’s Disease, (3) gene expression and electrophysiological data of single neuronal cells in the mouse visual cortex, and (4) cell-type gene expression and genotype data for predicting schizophrenia. We found that DeepGAMI outperforms existing state-of-the-art methods and provides a profound understanding of gene regulatory mechanisms from genotype to phenotype, especially at cellular resolution. DeepGAMI is an open-source tool and is available at https://github.com/daifengwanglab/DeepGAMI .
18
Citation1
0
Save
19

Transcriptome alterations are enriched for synapse-associated genes in the striatum of subjects with obsessive-compulsive disorder

Sean Piantadosi et al.Jul 24, 2020
ABSTRACT Background Obsessive compulsive disorder (OCD) is a chronic and severe psychiatric disorder for which effective treatment options are limited. Structural and functional neuroimaging studies have consistently implicated the orbitofrontal cortex (OFC) and striatum in the pathophysiology of the disorder. Recent genetic evidence points to involvement of components of the excitatory synapse in the etiology of OCD. However, the transcriptional alterations that could link genetic risk to known structural and functional abnormalities remain mostly unknown. Methods To assess potential transcriptional changes in the OFC and two striatal regions (caudate nucleus and nucleus accumbens) of OCD subjects relative to unaffected comparison subjects, we sequenced messenger RNA transcripts from these brain regions. Results In a joint analysis of all three regions, 904 transcripts were differentially expressed between 7 OCD versus 8 unaffected comparison subjects. Region-specific analyses highlight a smaller number of differences, which concentrate in caudate and nucleus accumbens. Pathway analyses of the 904 differentially expressed transcripts showed enrichment for genes involved in synaptic signaling, with these synapse-associated genes displaying lower expression in OCD subjects relative to unaffected comparison subjects. Finally, we estimate that cell type fractions of medium spiny neurons are lower whereas vascular cells and astrocyte fractions are higher in tissue of OCD subjects. Conclusions Together, these data provide the first unbiased examination of differentially expressed transcripts in both OFC and striatum of OCD subjects. These transcripts encode synaptic proteins more often than expected by chance, and thus implicate the synapse as a vulnerable molecular compartment for OCD.
Load More