RH
Ross Hardison
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
23
(52% Open Access)
Cited by:
8,821
h-index:
73
/
i10-index:
174
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Principles of regulatory information conservation between mouse and human

Yong Cheng et al.Nov 18, 2014
To broaden our understanding of the evolution of gene regulation mechanisms, we generated occupancy profiles for 34 orthologous transcription factors (TFs) in human–mouse erythroid progenitor, lymphoblast and embryonic stem-cell lines. By combining the genome-wide transcription factor occupancy repertoires, associated epigenetic signals, and co-association patterns, here we deduce several evolutionary principles of gene regulatory features operating since the mouse and human lineages diverged. The genomic distribution profiles, primary binding motifs, chromatin states, and DNA methylation preferences are well conserved for TF-occupied sequences. However, the extent to which orthologous DNA segments are bound by orthologous TFs varies both among TFs and with genomic location: binding at promoters is more highly conserved than binding at distal elements. Notably, occupancy-conserved TF-occupied sequences tend to be pleiotropic; they function in several tissues and also co-associate with many TFs. Single nucleotide variants at sites with potential regulatory functions are enriched in occupancy-conserved TF-occupied sequences. As part of the mouse ENCODE project, genome-wide transcription factor (TF) occupancy repertoires and co-association patterns in mice and humans are studied; many aspects are conserved but the extent to which orthologous DNA segments are bound by TFs in mice and humans varies both among TFs and genomic location, and TF-occupied sequences whose occupancy is conserved tend to be pleiotropic and enriched for single nucleotide variants with known regulatory potential. As part of the mouse ENCODE project Mike Snyder and colleagues studied the genome-wide transcription factor (TF) occupancy repertoires, associated epigenetic signals, and TF co-association patterns in mice and humans to broaden our understanding of the evolution of gene regulation mechanisms in mammals. The results indicate that although many aspects of TF occupied sequences are conserved in both species, the extent to which orthologous DNA segments are bound by orthologous TFs in human and mouse varies both among TFs and with genomic location. Importantly, TF occupied sequences with conserved occupancy tend to be pleiotropic; they are also enriched for single nucleotide variants (SNVs) that are known to have regulatory potential or are associated with known phenotypes.
1
Citation267
-1
Save
0

HiCRep: assessing the reproducibility of Hi-C data using a stratum-adjusted correlation coefficient

Tao Yang et al.Jan 18, 2017
Abstract Hi-C is a powerful technology for studying genome-wide chromatin interactions. However, current methods for assessing Hi-C data reproducibility can produce misleading results because they ignore spatial features in Hi-C data, such as domain structure and distance dependence. We present HiCRep, a framework for assessing the reproducibility of Hi-C data that systematically accounts for these features. In particular, we introduce a novel similarity measure, the stratum adjusted correlation coefficient (SCC), for quantifying the similarity between Hi-C interaction matrices. Not only does it provide a statistically sound and reliable evaluation of reproducibility, SCC can also be used to quantify differences between Hi-C contact matrices and to determine the optimal sequencing depth for a desired resolution. The measure consistently shows higher accuracy than existing approaches in distinguishing subtle differences in reproducibility and depicting interrelationships of cell lineages. The proposed measure is straightforward to interpret and easy to compute, making it well-suited for providing standardized, interpretable, automatable, and scalable quality control. The freely available R package HiCRep implements our approach.
0
Citation10
0
Save
85

Domain adaptive neural networks improve cross-species prediction of transcription factor binding

Kelly Cochran et al.Feb 14, 2021
The intrinsic DNA sequence preferences and cell-type specific cooperative partners of transcription factors (TFs) are typically highly conserved. Hence, despite the rapid evolutionary turnover of individual TF binding sites, predictive sequence models of cell-type specific genomic occupancy of a TF in one species should generalize to closely matched cell types in a related species. To assess the viability of cross-species TF binding prediction, we train neural networks to discriminate ChIP-seq peak locations from genomic background and evaluate their performance within and across species. Cross-species predictive performance is consistently worse than within-species performance, which we show is caused in part by species-specific repeats. To account for this domain shift, we use an augmented network architecture to automatically discourage learning of training species-specific sequence features. This domain adaptation approach corrects for prediction errors on species-specific repeats and improves overall cross-species model performance. Our results demonstrate that cross-species TF binding prediction is feasible when models account for domain shifts driven by species-specific repeats.
85
Citation5
0
Save
14

CTCF and transcription influence chromatin structure re-configuration after mitosis

Haoyue Zhang et al.Jun 28, 2021
Abstract During mitosis, transcription is globally attenuated and chromatin architecture is dramatically reconfigured. Here we exploited the M- to G1-phase progression to interrogate the contributions of the architectural factor CTCF and the process of transcription to re-sculpting the genome in newborn nuclei. Depletion of CTCF specifically during the M- to G1-phase transition altered the re-establishment of local short-range compartmentalization after mitosis. Chromatin domain boundary reformation was impaired upon CTCF loss, but a subset (∼27%) of boundaries, characterized by transitions in chromatin states, was established normally. Without CTCF, structural loops failed to form, leading to illegitimate contacts between cis -regulatory elements (CREs). Transient CRE contacts that are normally resolved after telophase persisted deeply into G1-phase in CTCF depleted cells. CTCF loss-associated gains in transcription were often linked to increased, normally illegitimate enhancer-promoter contacts. In contrast, at genes whose expression declined upon CTCF loss, CTCF seems to function as a conventional transcription activator, independent of its architectural role. CTCF-anchored structural loops facilitated formation CRE loops nested within them, especially those involving weak CREs. Transcription inhibition did not elicit global architectural changes and left transcription start site-associated boundaries intact. However, ongoing transcription contributed considerably to the formation of gene domains, regions of enriched contacts spanning the length of gene bodies. Notably, gene domains formed rapidly in ana/telophase prior to the completion of the first round of transcription, suggesting that epigenetic features in gene bodies contribute to genome reconfiguration prior to transcription. The focus on the de novo formation of nuclear architecture during G1 entry yielded novel insights into how CTCF and transcription contribute to the dynamic re-configuration of chromatin architecture during the mitosis to G1 phase progression.
14
Citation4
0
Save
0

S3V2-IDEAS: a package for normalizing, denoising and integrating epigenomic datasets across different cell types

Guanjue Xiang et al.Sep 9, 2020
Abstract Summary Epigenetic modifications reflect key aspects of transcriptional regulation, and many epigenomic data sets have been generated under many biological contexts to provide insights into regulatory processes. However, the technical noise in epigenomic data sets and the many dimensions (features) examined make it challenging to effectively extract biologically meaningful inferences from these data sets. We developed a package that reduces noise while normalizing the epigenomic data by a novel normalization method, followed by integrative dimensional reduction by learning and assigning epigenetic states. This package, called S3V2-IDEAS, can be used to identify epigenetic states for multiple features, or identify signal intensity states and a master peak list across different cell types for a single feature. We illustrate the outputs and performance of S3V2-IDEAS using 137 epigenomics data sets from the VISION project that provides V al I dated S ystematic I ntegrati ON of epigenomic data in hematopoiesis. Availability and implementation S3V2-IDEAS pipeline is freely available as open source software released under an MIT license at: https://github.com/guanjue/S3V2_IDEAS_ESMP Contact rch8@psu.edu , gzx103@psu.edu Supplementary information S3V2-IDEAS-bioinfo-supplementary-materials.pdf
0
Citation2
0
Save
0

Effects of sheared chromatin length on ChIP-seq quality and sensitivity

Cheryl Keller et al.Sep 30, 2020
Abstract Chromatin immunoprecipitation followed by massively parallel, high throughput sequencing (ChIP-seq) is the method of choice for identifying, on a genome-wide scale, the segments of DNA bound by specific transcription factors (TFs) or in chromatin with particular histone modifications. However, the quality of ChIP-seq datasets vary over a wide range, with a substantial fraction being of intermediate to poor quality. Such experimental variability can lead to many false positives or false negatives, impairing the ability to interpret the data. Thus, it is important to discern and control the factors that contribute to variation in ChIP-seq. In this study, we focus on the sonication step to produce sheared chromatin, a variable controllable by the user and applicable to all ChIP-seq protocols. We systematically varied the amount of shearing of fixed chromatin from a mouse erythroid cell line, carefully measured the distribution of resultant fragment lengths using the Agilent Bioanalzyer 2100, and then immunoprecipitated these batches of chromatin using highly specific antibodies against either TAL1 or CTCF. We found that the level of sonication, which was affected by both the number of sonication cycles, as well as the starting cell number, had a pronounced impact on the quality of resulting ChIP-seq signals. Specifically, over-sonication led to degradation of quality (e.g. increased background and reduction in signal), while the impact of under-sonication of chromatin differed between the two transcription factors, leading to the loss of sites occupied by TAL1 but not those bound by CTCF. We leveraged these findings to produce a set of CTCF ChIP-seq datasets in primary hematopoietic progenitor cells, including several rare cell types. Together, these results suggest that the amount of sonication is a key variable in success of ChIP-seq experiments, and that carefully monitoring the level of chromatin sonication is one way to improve ChIP-seq quality and reproducibility, which in turn facilitates low input ChIP-seq in rare cell types.
0
Citation1
0
Save
0

Accurate and Reproducible Functional Maps in 127 Human Cell Types via 2D Genome Segmentation

Yu Zhang et al.Mar 20, 2017
The Roadmap Epigenomics consortium has published whole-genome functional annotation maps in 127 human cell types and cancer cell lines by integrating data from multiple epigenetic marks. These maps have thereby been widely used by the community for studying gene regulation in cell type specific contexts and predicting functional impacts of DNA mutations on disease. Here, we present a new map of functional elements produced by a recently published method called IDEAS on the same data set. The IDEAS method has several unique advantages and was shown to outperform existing methods, including the one used by the Roadmap Epigenomics consortium. We further introduce a simple but highly effective pipeline to greatly improve the reproducibility of functional annotation. Using five categories of independent experimental results, we extensively compared the annotation produced by IDEAS and the Roadmap Epigenomics consortium. While the overall concordance between the two maps was high, we observed many differences in the details and in the position-wise consistency of annotation across cell types. We show that the IDEAS annotation was uniformly and often substantially more accurate than the Roadmap Epigenomics result. This study therefore reports on the quality of an existing functional map in 127 human genomes and provides an alternative and better map to be used by the community. The annotation result can be visualized in the UCSC genome browser via the hub at http://bx.psu.edu/~yuzhang/Roadmap_ideas/ideas_hub.txt
Load More