CZ
Chongzhi Zang
Author with expertise in Regulation of Chromatin Structure and Function
University of Virginia, Office of Public Health Genomics, Charlottesville Medical Research
+ 5 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
25
(52% Open Access)
Cited by:
26
h-index:
36
/
i10-index:
51
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Temporal dynamics of the multi-omic response to endurance exercise training across tissues

David Amar et al.Oct 24, 2023
+180
P
N
D
Abstract Regular exercise promotes whole-body health and prevents disease, yet the underlying molecular mechanisms throughout a whole organism are incompletely understood. Here, the Molecular Transducers of Physical Activity Consortium (MoTrPAC) profiled the temporal transcriptome, proteome, metabolome, lipidome, phosphoproteome, acetylproteome, ubiquitylproteome, epigenome, and immunome in whole blood, plasma, and 18 solid tissues in Rattus norvegicus over 8 weeks of endurance exercise training. The resulting data compendium encompasses 9466 assays across 19 tissues, 25 molecular platforms, and 4 training time points in young adult male and female rats. We identified thousands of shared and tissue- and sex-specific molecular alterations. Temporal multi-omic and multi-tissue analyses demonstrated distinct patterns of tissue remodeling, with widespread regulation of immune, metabolism, heat shock stress response, and mitochondrial pathways. These patterns provide biological insights into the adaptive responses to endurance training over time. For example, exercise training induced heart remodeling via altered activity of the Mef2 family of transcription factors and tyrosine kinases. Translational analyses revealed changes that are consistent with human endurance training data and negatively correlated with disease, including increased phospholipids and decreased triacylglycerols in the liver. Sex differences in training adaptation were widespread, including those in the brain, adrenal gland, lung, and adipose tissue. Integrative analyses generated novel hypotheses of disease relevance, including candidate mechanisms that link training adaptation to non-alcoholic fatty liver disease, inflammatory bowel disease, cardiovascular health, and tissue injury and recovery. The data and analysis results presented in this study will serve as valuable resources for the broader community and are provided in an easily accessible public repository ( https://motrpac-data.org/ ). Highlights Multi-tissue resource identifies 35,439 analytes regulated by endurance exercise training at 5% FDR across 211 combinations of tissues and molecular platforms. Interpretation of systemic and tissue-specific molecular adaptations produced hypotheses to help describe the health benefits induced by exercise. Robust sex-specific responses to endurance exercise training are observed across multiple organs at the molecular level. Deep multi-omic profiling of six tissues defines regulatory signals for tissue adaptation to endurance exercise training. All data are available in a public repository, and processed data, analysis results, and code to reproduce major analyses are additionally available in convenient R packages.
1
Paper
Citation12
0
Save
30

Cell-specific chromatin landscape of human coronary artery resolves regulatory mechanisms of disease risk

Adam Turner et al.Oct 24, 2023
+20
J
S
A
Abstract Coronary artery disease (CAD) is a complex inflammatory disease involving genetic influences across several cell types. Genome-wide association studies (GWAS) have identified over 170 loci associated with CAD, where the majority of risk variants reside in noncoding DNA sequences impacting cis -regulatory elements (CREs). Here, we applied single-cell ATAC-seq to profile 28,316 cells across coronary artery segments from 41 patients with varying stages of CAD, which revealed 14 distinct cellular clusters. We mapped ~320,000 accessible sites across all cells, identified cell type-specific elements, transcription factors, and prioritized functional CAD risk variants via quantitative trait locus and sequence-based predictive modeling. We identified a number of candidate mechanisms for smooth muscle cell transition states and identified putative binding sites for risk variants. We further employed CRE to gene linkage to nominate disease-associated key driver transcription factors such as PRDM16 and TBX2. This single cell atlas provides a critical step towards interpreting cis -regulatory mechanisms in the vessel wall across the continuum of CAD risk.
12

Accurate estimation of intrinsic biases for improved analysis of bulk and single-cell chromatin accessibility sequencing data using SELMA

Shengen Hu et al.Oct 24, 2023
+6
Q
L
S
Abstract Genome-wide profiling of chromatin accessibility by DNase-seq or ATAC-seq has been widely used to identify regulatory DNA elements and transcription factor binding sites. However, enzymatic DNA cleavage exhibits intrinsic sequence biases that confound chromatin accessibility profiling data analysis. Existing computational tools are limited in their ability to account for such intrinsic biases and not designed for analyzing single-cell data. Here, we present Simplex Encoded Linear Model for Accessible Chromatin (SELMA), a computational method for systematic estimation of intrinsic cleavage biases from genomic chromatin accessibility profiling data. We demonstrate that SELMA yields accurate and robust bias estimation from both bulk and single-cell DNase-seq and ATAC-seq data. SELMA can utilize internal mitochondrial DNA data to improve bias estimation. We show that transcription factor binding inference from DNase footprints can be improved by incorporating estimated biases using SELMA. Furthermore, we show strong effects of intrinsic biases in single-cell ATAC-seq data, and develop the first single-cell ATAC-seq intrinsic bias correction model to improve cell clustering. SELMA can enhance the performance of existing bioinformatics tools and improve the analysis of both bulk and single-cell chromatin accessibility sequencing data.
12
Citation3
0
Save
35

Integrative single-cell meta-analysis reveals disease-relevant vascular cell states and markers in human atherosclerosis

Jose Mosquera et al.Oct 24, 2023
+15
D
G
J
Abstract Coronary artery disease (CAD) and atherosclerosis are characterized by plaque formation in the arteries wall. CAD progression involves complex interactions and phenotypic plasticity within and between distinct vascular and immune cell lineages. Single-cell RNA-seq (scRNA-seq) studies have highlighted lineage-specific transcriptomic signatures, but the reported cell phenotypes in humans remain controversial. Here, we meta-analyzed four scRNA-seq datasets, creating the first map of human cell diversity in atherosclerosis. We generated an atlas of 118,578 high-quality cells, characterized cell-type diversity and provided insights into smooth muscle cell (SMC) phenotypic modulation, transcription factor activity and cell-cell communication. We integrated genome-wide association study (GWAS) data and uncovered a critical role for modulated SMC phenotypes in CAD and coronary calcification. Finally, we identified candidate markers of fibromyocyte and fibrochondrogenic human SMCs ( LTBP1 and CRTAC1 ) that may serve as proxies of atherosclerosis progression. Altogether, we created a unified cellular map of atherosclerosis informing cell state-specific mechanistic and translational studies of cardiovascular diseases.
35
Paper
Citation1
0
Save
7

Nonparametric Interrogation of Transcriptional Regulation in Single-Cell RNA and Chromatin Accessibility Multiomic Data

Y. Jiang et al.Oct 24, 2023
+3
Z
Y
Y
Abstract Epigenetic control of gene expression is highly cell-type- and context-specific. Yet, despite its complexity, gene regulatory logic can be broken down into modular components consisting of a transcription factor (TF) activating or repressing the expression of a target gene through its binding to a cis -regulatory region. Recent advances in joint profiling of transcription and chromatin accessibility with single-cell resolution offer unprecedented opportunities to interrogate such regulatory logic. Here, we propose a nonparametric approach, TRIPOD, to detect and characterize three-way relationships between a TF, its target gene, and the accessibility of the TF’s binding site, using single-cell RNA and ATAC multiomic data. We apply TRIPOD to interrogate cell-type-specific regulatory logic in peripheral blood mononuclear cells and contrast our results to detections from enhancer databases, cis -eQTL studies, ChIP-seq experiments, and TF knockdown/knockout studies. We then apply TRIPOD to mouse embryonic brain data during neurogenesis and gliogenesis and identified known and novel putative regulatory relationships, validated by ChIP-seq and PLAC-seq. Finally, we demonstrate TRIPOD on SHARE-seq data of differentiating mouse hair follicle cells and identify lineage-specific regulation supported by histone marks for gene activation and super-enhancer annotations.
7
Paper
Citation1
0
Save
0

An integrative ENCODE resource for cancer genomics

Jing Zhang et al.May 7, 2020
+55
V
D
J
ENCODE comprises thousands of functional genomics datasets, and the encyclopedia covers hundreds of cell types, providing a universal annotation for genome interpretation. However, for particular applications, it may be advantageous to use a customized annotation. Here, we develop such a custom annotation by leveraging advanced assays, such as eCLIP, Hi-C, and whole-genome STARR-seq on a number of data-rich ENCODE cell types. A key aspect of this annotation is comprehensive and experimentally derived networks of both transcription factors and RNA-binding proteins (TFs and RBPs). Cancer, a disease of system-wide dysregulation, is an ideal application for such a network-based annotation. Specifically, for cancer-associated cell types, we put regulators into hierarchies and measure their network change (rewiring) during oncogenesis. We also extensively survey TF-RBP crosstalk, highlighting how SUB1, a previously uncharacterized RBP, drives aberrant tumor expression and amplifies the effect of MYC, a well-known oncogenic TF. Furthermore, we show how our annotation allows us to place oncogenic transformations in the context of a broad cell space; here, many normal-to-tumor transitions move towards a stem-like state, while oncogene knockdowns show an opposing trend. Finally, we organize the resource into a coherent workflow to prioritize key elements and variants, in addition to regulators. We showcase the application of this prioritization to somatic burdening, cancer differential expression and GWAS. Targeted validations of the prioritized regulators, elements and variants using siRNA knockdowns, CRISPR-based editing, and luciferase assays demonstrate the value of the ENCODE resource.
1

Spatially clustered pattern of transcription factor binding reveals phase-separated transcriptional condensates at super-enhancers

Zhenjia Wang et al.Oct 24, 2023
C
S
Z
ABSTRACT Many transcription factors (TFs) have been shown to bind at super-enhancers, forming transcriptional condensates to activate transcription in many cellular systems. Genomic and epigenomic determinants of phase-separated transcriptional condensates are not well understood. Here we systematically analyzed DNA sequence motifs and TF binding profiles across human cell types to identify the molecular features that contribute to the formation of transcriptional condensates. We found that most DNA sequence motifs are not distributed randomly in the genome, but exhibiting spatially clustered patterns associated with super-enhancers. TF binding sites are further clustered and enriched at cell-type-specific super-enhancers. TFs exhibiting clustered binding patterns also have high liquid-liquid phase separation abilities. Compared to regular TF binding, densely clustered TF binding sites are more enriched at cell-type-specific super-enhancers with higher chromatin accessibility, higher chromatin interaction, and higher association with cancer outcome. Our results indicate that the clustered pattern of genomic binding and the phase separation properties of TFs collectively contribute to the formation of transcriptional condensates.
0

DARDN: Identifying transcription factor binding motifs from long DNA sequences using multi-CNNs and DeepLIFT

Hyun Cho et al.Nov 21, 2023
+3
Y
Z
H
Motivation Characterization of regulatory elements in DNA sequence is a key task in functional genomics. CTCF exhibits specific binding patterns in the genome of cancer cells and has a non-canonical function to facilitate oncogenic transcription program by cooperating with transcription factors bound at flanking distal regions. Identification of sequence motifs from a broad genomic region surrounding cancer-specific CTCF binding sites can help find active transcription factors in a cancer type. However, the long DNA sequences without localization information makes it difficult to perform conventional motif enrichment analysis. Results We present DNAResDualNet (DARDN), a computational method that utilizes convolutional neural networks (CNNs) coupled with feature discovery using DeepLIFT, for identifying DNA sequence features that can differentiate two sets of lengthy DNA sequences. Evaluation on DNA sequences associated with CTCF binding sites in T-cell acute lymphoblastic leukemia (T-ALL) and other cancer types demonstrates DARDN9s ability in classifying DNA sequences surrounding cancer-specific CTCF binding from control constitutive CTCF binding and identifying sequence motifs for transcription factors potentially active in each specific cancer type. We identified motifs for potential oncogenic transcription factors in T-ALL, acute myeloid leukemia (AML), breast cancer (BRCA), colorectal cancer (CRC), lung adenocarcinoma (LUAD), and prostate cancer (PRAD). Our work demonstrates the power of advanced machine learning and feature discovery approach in finding biologically meaningful information from complex DNA sequence data.
0
0
Save
0

Cancer-specific CTCF binding facilitates oncogenic transcriptional dysregulation

Celestia Fang et al.May 7, 2020
+10
C
Z
C
Background: The three-dimensional genome organization is critical for gene regulation and can malfunction in diseases like cancer. As a key regulator of genome organization, CCCTC-binding factor (CTCF) has been characterized as a DNA-binding protein with important functions in maintaining the topological structure of chromatin and inducing DNA looping. Among the prolific binding sites in the genome, several events with altered CTCF occupancy have been reported as associated with effects in physiology or disease. However, there is no hitherto a comprehensive survey of genome-wide CTCF binding patterns across different human cancers. Results: To dissect functions of CTCF binding, we systematically analyze over 700 CTCF ChIP-seq profiles across human tissues and cancers and identify cancer-specific CTCF binding patterns in six cancer types. We show that cancer-specific lost and gained CTCF binding events are associated with altered chromatin interactions in patient samples, but not always with DNA methylation changes or sequence mutations. While lost bindings primarily occur near gene promoters, most gained CTCF binding events are induced by oncogenic transcription factors and exhibit enhancer activities. We validate these findings in T-cell acute lymphoblastic leukemia and show that oncogenic NOTCH1 induces specific CTCF binding and they cooperatively activate expression of target genes, indicating transcriptional condensation phenomena. Conclusions: Cancer-specific CTCF binding events are not always associated with DNA methylation changes or mutations, but can be induced by other transcription factors to regulate oncogenic gene expression. Our results substantiate CTCF binding alteration as a functional epigenomic signature of cancer.
0
0
Save
0

BARTweb: a web server for transcription factor association analysis

Wenjing Ma et al.May 7, 2020
+3
Y
Z
W
Identifying active transcription factors (TFs) that bind to cis-regulatory regions in the genome to regulate differential gene expression is a key task in gene regulation research. TF binding profiles from numerous existing ChIP-seq data can be utilized for association analysis with query data for TF identification, as alternative to DNA sequence motif analysis. Here, we present BARTweb, an interactive webserver for identifying TFs whose genomic binding patterns associate with input genomic features, by leveraging over 13,000 public ChIP-seq datasets for human and mouse. Using an updated Binding Analysis for Regulation of Transcription (BART) algorithm, BARTweb can identify functional TFs that regulate a gene set, or have a binding profile correlated with a ChIP-seq profile or enriched in a genomic region set, without a priori information of the cell type. Compared with the original BART package, BARTweb substantially reduces the execution time of a typical job by two orders of magnitude. We also show that BARTweb outperforms other existing tools in identifying true TFs from collected experimental data. BARTweb is a useful webserver for performing functional analysis of gene regulation. BARTweb is freely available at http://bartweb.org.
Load More