JW
Jia Wen
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
18
(100% Open Access)
Cited by:
858
h-index:
19
/
i10-index:
31
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Multi-platform discovery of haplotype-resolved structural variation in human genomes

Mark Chaisson et al.Sep 23, 2017
ABSTRACT The incomplete identification of structural variants (SVs) from whole-genome sequencing data limits studies of human genetic diversity and disease association. Here, we apply a suite of long-read, short-read, and strand-specific sequencing technologies, optical mapping, and variant discovery algorithms to comprehensively analyze three human parent–child trios to define the full spectrum of human genetic variation in a haplotype-resolved manner. We identify 818,054 indel variants (<50 bp) and 27,622 SVs (≥50 bp) per human genome. We also discover 156 inversions per genome—most of which previously escaped detection. Fifty-eight of the inversions we discovered intersect with the critical regions of recurrent microdeletion and microduplication syndromes. Taken together, our SV callsets represent a sevenfold increase in SV detection compared to most standard high-throughput sequencing studies, including those from the 1000 Genomes Project. The method and the dataset serve as a gold standard for the scientific community and we make specific recommendations for maximizing structural variation sensitivity for future large-scale genome sequencing studies.
0
Citation54
0
Save
0

3D Epigenomic Characterization Reveals Insights Into Gene Regulation and Lineage Specification During Corticogenesis

Michael Song et al.Feb 25, 2020
Abstract Lineage-specific epigenomic changes during human corticogenesis have previously remained elusive due to challenges with tissue heterogeneity and sample availability. Here, we analyze cis-regulatory chromatin interactions, open chromatin regions, and transcriptomes for radial glia, intermediate progenitor cells, excitatory neurons, and interneurons isolated from mid-gestational human brain samples. We show that chromatin looping underlies transcriptional regulation for lineage-specific genes, with transcription factor motifs, families of transposable elements, and disease-associated variants enriched at distal interacting regions in a cell type-specific manner. A subset of promoters exhibit unusually high degrees of chromatin interactivity, which we term super interactive promoters. Super interactive promoters are enriched for critical lineage-specific genes, suggesting that interactions at these loci contribute to the fine-tuning of cell type-specific transcription. Finally, we present CRISPRview, a novel approach for validating distal interacting regions in primary cells. Our study presents the first characterization of cell type-specific 3D epigenomic landscapes during human corticogenesis, advancing our understanding of gene regulation and lineage specification during human brain development.
0
Citation6
0
Save
2

A comprehensive comparison on cell type composition inference for spatial transcriptomics data

Jiawen Chen et al.Feb 22, 2022
Abstract Spatial transcriptomic (ST) technologies allow researchers to examine high-quality RNA-sequencing data along with maintained two-dimensional positional information as well as a co-registered histology image. A popular use of ST omics data is to provide insights about tissue structure and spatially unique features. However, due to the technical nature unique to most ST data, the resolution varies from a diameter of 2-10 μm to 50-100 μm instead of single-cell resolution, which brings uncertainty into cell number and cell mixture within each ST spot. Motivated by the important role for spatial arrangement of cell types within a tissue in physiology and disease pathogenesis, several ST deconvolution methods have been developed and are being used to explore gene expression variation and identification of spatial domains. The aim of this work is to review state-of-the-art methods for ST deconvolution, while comparing their strengths and weaknesses. Specifically, we use four real datasets to examine the performance of eight methods across different tissues and technological platforms. Key Points Cell mixture inference is a critical step in the analysis of spatial transcriptomics (ST) data to prevent downstream analysis suffering from confounding factors at the spot level. Existing ST deconvolution methods can be classified into three groups: probabilistic-based, non-negative matrix factorization and non-negative least squares based, and other deep learning framework-based methods. We compared eight ST deconvolution methods by using two single cell level resolution datasets and two spot level resolution ST datasets. We provided practical guidelines for the choice of method under different scenarios as well as the optimal subsets of genes to use for each method.
11

From GWAS Variant to Function: a Study of ~148,000 Variants for Blood Cell Traits

Quan Sun et al.Feb 16, 2021
Abstract Genome-wide association studies (GWAS) have identified hundreds of thousands of genetic variants associated with complex diseases and traits. However, most variants are noncoding and not clearly linked to genes, making it challenging to interpret these GWAS signals. We present a systematic variant-to-function study, prioritizing the most likely functional elements of the genome for experimental follow-up, for >148,000 variants identified for hematological traits. Specifically, we developed VAMPIRE: Variant Annotation Method Pointing to Interesting Regulatory Effects, an interactive web application implemented in R Shiny ( http://shiny.bios.unc.edu/vampire/ ). This tool efficiently integrates and displays information from multiple complementary sources, including epigenomic signatures from blood cell relevant tissues or cells, functional and conservation summary scores, variant impact on protein and gene expression, chromatin conformation information, as well as publicly available GWAS and phenome-wide association study (PheWAS) results. Leveraging data generated from independently performed functional validation experiments, we demonstrate that our prioritized variants, genes, or variant-gene links are significantly more likely to be experimentally validated. This study not only has important implications for systematic and efficient revelation of functional mechanisms underlying GWAS variants for hematological traits, but also provides a prototype that can be adapted to many other complex traits, paving the path for efficient variant to function (V2F) analyses.
11
Citation3
0
Save
1

Functional characterization of gene regulatory elements and neuropsychiatric disease-associated risk loci in iPSCs and iPSC-derived neurons

Xiaoyu Yang et al.Aug 30, 2023
Abstract Genome-wide association studies (GWAS) have identified thousands of non-coding variants that contribute to psychiatric disease risks, likely by perturbing cis -regulatory elements (CREs). However, our ability to interpret and explore their mechanisms of action is hampered by a lack of annotation of functional CREs (fCREs) in neural cell types. Here, through genome-scale CRISPR screens of 22,000 candidate CREs (cCREs) in human induced pluripotent stem cells (iPSCs) undergoing differentiation to excitatory neurons, we identify 2,847 and 5,540 fCREs essential for iPSC fitness and neuronal differentiation, respectively. These fCREs display dynamic epigenomic features and exhibit increased numbers and genomic spans of chromatin interactions following terminal neuronal differentiation. Furthermore, fCREs essential for neuronal differentiation show significantly greater enrichment of genetic heritability for neurodevelopmental diseases including schizophrenia (SCZ), attention deficit hyperactivity disorder (ADHD), and autism spectrum disorders (ASD) than cCREs. Using high-throughput prime editing screens we experimentally confirm 45 SCZ risk variants that act by affecting the function of fCREs. The extensive and in-depth functional annotation of cCREs in neuronal types therefore provides a crucial resource for interpreting non-coding risk variants of neuropsychiatric disorders.
1
Citation2
0
Save
7

Ancient genomes redate the extinction of Sussemionus, a subgenus of Equus, to late Holocene

Dawei Cai et al.Sep 16, 2021
Abstract The exceptionally-rich fossil record available for the equid family has provided textbook examples of macroevolutionary changes. Horses, asses and zebras represent three extant subgenus of Equus lineage, while the Sussemionus subgenus is another remarkable Equus lineage ranging from North America to Ethiopia in Pleistocene. We sequenced 26 archaeological specimens from northern China in Holocene showing morphological features reminiscent of Equus ovodovi , a species representative of Sussemionus , and further confirmed them as this species by genetic analyses. Thus, we present the first high-quality complete genome of the Sussemionus that we sequenced to 12.0× depth-of-coverage and demonstrate that it survived until ∼3,500 years ago, despite the continued demographic collapse during the Last Glacial Maximum and the great human expansion in East Asia. We also confirmed the Equus phylogenetic tree, and found Sussemionus diverged from the ancestor of non-caballine equids ∼2.3-2.7 Million years ago and admixture events could have taken place between them. Our works suggest the small genetic diversity but not the enhanced inbreeding mainly limited the chances of survival of the species, and illustrates how ancient DNA can inform on extinction dynamics and the long-term resilience of species surviving in cryptic population pockets.
7
Citation2
0
Save
15

THUNDER: A reference-free deconvolution method to infer cell type proportions from bulk Hi-C data

Bryce Rowland et al.Nov 12, 2020
Abstract Hi-C data provide population averaged estimates of three-dimensional chromatin contacts across cell types and states in bulk samples. Effective analysis of Hi-C data entails controlling for the potential confounding factor of differential cell type proportions across heterogeneous bulk samples. We propose a novel unsupervised deconvolution method for inferring cell type composition from bulk Hi-C data, the Two-step Hi-c UNsupervised DEconvolution appRoach (THUNDER). We conducted extensive simulations to test THUNDER based on combining two published single-cell Hi-C (scHi-C) datasets. THUNDER more accurately estimates the underlying cell type proportions compared to supervised and unsupervised methods (e.g., MuSiC, TOAST, and NMF). We further demonstrate the practical utility of THUNDER to estimate cell type proportions and identify cell-type-specific interactions in Hi-C data from adult human cortex tissue samples. THUNDER will be a useful tool in adjusting for varying cell type composition in population samples, facilitating valid and more powerful downstream analysis such as differential chromatin organization studies. Additionally, THUNDER estimated contact profiles provide a useful exploratory framework to investigate cell-type-specificity of the chromatin interactome while experimental data is still rare.
15
Citation1
0
Save
Load More