CC
Chao Cheng
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
29
(62% Open Access)
Cited by:
5,552
h-index:
55
/
i10-index:
142
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Architecture of the human regulatory network derived from ENCODE data

Mark Gerstein et al.Sep 1, 2012
Transcription factors bind in a combinatorial fashion to specify the on-and-off states of genes; the ensemble of these binding events forms a regulatory network, constituting the wiring diagram for a cell. To examine the principles of the human transcriptional regulatory network, we determined the genomic binding information of 119 transcription-related factors in over 450 distinct experiments. We found the combinatorial, co-association of transcription factors to be highly context specific: distinct combinations of factors bind at specific genomic locations. In particular, there are significant differences in the binding proximal and distal to genes. We organized all the transcription factor binding into a hierarchy and integrated it with other genomic information (for example, microRNA regulation), forming a dense meta-network. Factors at different levels have different properties; for instance, top-level transcription factors more strongly influence expression and middle-level ones co-regulate targets to mitigate information-flow bottlenecks. Moreover, these co-regulations give rise to many enriched network motifs (for example, noise-buffering feed-forward loops). Finally, more connected network components are under stronger selection and exhibit a greater degree of allele-specific activity (that is, differential binding to the two parental alleles). The regulatory information obtained in this study will be crucial for interpreting personal genome sequences and understanding basic principles of human biology and disease. A description is given of the ENCODE consortium’s efforts to examine the principles of human transcriptional regulatory networks; the results are integrated with other genomic information to form a hierarchical meta-network where different levels have distinct properties. This manuscript describes the effort of the ENCODE (Encyclopedia of DNA Elements) Consortium to examine the principles of human transcriptional regulatory networks, using a subset of 119 transcription factors. The results are integrated with other genomic information to form a multi-level meta-network in which different levels have distinct properties. The findings will aid future interpretations of human genomics and help us to understand the basic principles of human biology and disease.
0
Citation1,449
0
Save
0

A cis-regulatory map of the Drosophila genome

Nicolas Nègre et al.Mar 1, 2011
Three papers in this issue of Nature report on the modENCODE initiative, which aims to characterize functional DNA elements in the fruitfly Drosophila melanogaster and the roundworm Caenorhabditis elegans. Kharchenko et al. present a genome-wide chromatin landscape of the fruitfly, based on 18 histone modifications. They describe nine prevalent chromatin states. Integrating these analyses with other data types reveals individual characteristics of different genomic elements. Graveley et al. have used RNA-Seq, tiling microarrays and cDNA sequencing to explore the transcriptome in 30 distinct developmental stages of the fruitfly. Among the results are scores of new genes, coding and non-coding transcripts, as well as splicing and editing events. Finally, Nègre et al. have produced a map of the regulatory part of the fruitfly genome, defining a vast array of putative regulatory elements, such as enhancers, promoters, insulators and silencers. As part of the modENCODE initiative, which aims to characterize functional DNA elements in D. melanogaster and C. elegans, this study created a map of the regulatory part of the fruitfly genome. On the basis of the developmental dynamics of chromatin modifications, polymerase and transcription factor occupancy this work defines a vast array of putative regulatory elements, such as enhancers, promoters, insulators and silencers. This resource represents the first attempt at a comprehensive annotation of cis-regulatory elements in a metazoan genome. Systematic annotation of gene regulatory elements is a major challenge in genome science. Direct mapping of chromatin modification marks and transcriptional factor binding sites genome-wide1,2 has successfully identified specific subtypes of regulatory elements3. In Drosophila several pioneering studies have provided genome-wide identification of Polycomb response elements4, chromatin states5, transcription factor binding sites6,7,8,9, RNA polymerase II regulation8 and insulator elements10; however, comprehensive annotation of the regulatory genome remains a significant challenge. Here we describe results from the modENCODE cis-regulatory annotation project. We produced a map of the Drosophila melanogaster regulatory genome on the basis of more than 300 chromatin immunoprecipitation data sets for eight chromatin features, five histone deacetylases and thirty-eight site-specific transcription factors at different stages of development. Using these data we inferred more than 20,000 candidate regulatory elements and validated a subset of predictions for promoters, enhancers and insulators in vivo. We identified also nearly 2,000 genomic regions of dense transcription factor binding associated with chromatin activity and accessibility. We discovered hundreds of new transcription factor co-binding relationships and defined a transcription factor network with over 800 potential regulatory relationships.
0
Citation516
0
Save
0

Life Span Extension by Calorie Restriction Depends on Rim15 and Transcription Factors Downstream of Ras/PKA, Tor, and Sch9

Min Wei et al.Jan 17, 2008
Calorie restriction (CR), the only non-genetic intervention known to slow aging and extend life span in organisms ranging from yeast to mice, has been linked to the down-regulation of Tor, Akt, and Ras signaling. In this study, we demonstrate that the serine/threonine kinase Rim15 is required for yeast chronological life span extension caused by deficiencies in Ras2, Tor1, and Sch9, and by calorie restriction. Deletion of stress resistance transcription factors Gis1 and Msn2/4, which are positively regulated by Rim15, also caused a major although not complete reversion of the effect of calorie restriction on life span. The deletion of both RAS2 and the Akt and S6 kinase homolog SCH9 in combination with calorie restriction caused a remarkable 10-fold life span extension, which, surprisingly, was only partially reversed by the lack of Rim15. These results indicate that the Ras/cAMP/PKA/Rim15/Msn2/4 and the Tor/Sch9/Rim15/Gis1 pathways are major mediators of the calorie restriction-dependent stress resistance and life span extension, although additional mediators are involved. Notably, the anti-aging effect caused by the inactivation of both pathways is much more potent than that caused by CR.
0
Citation436
0
Save
0

CircNet: a database of circular RNAs derived from transcriptome sequencing data

Yu‐Chen Liu et al.Oct 7, 2015
Circular RNAs (circRNAs) represent a new type of regulatory noncoding RNA that only recently has been identified and cataloged. Emerging evidence indicates that circRNAs exert a new layer of post-transcriptional regulation of gene expression. In this study, we utilized transcriptome sequencing datasets to systematically identify the expression of circRNAs (including known and newly identified ones by our pipeline) in 464 RNA-seq samples, and then constructed the CircNet database (http://circnet.mbc.nctu.edu.tw/) that provides the following resources: (i) novel circRNAs, (ii) integrated miRNA-target networks, (iii) expression profiles of circRNA isoforms, (iv) genomic annotations of circRNA isoforms (e.g. 282 948 exon positions), and (v) sequences of circRNA isoforms. The CircNet database is to our knowledge the first public database that provides tissue-specific circRNA expression profiles and circRNA–miRNA-gene regulatory networks. It not only extends the most up to date catalog of circRNAs but also provides a thorough expression analysis of both previously reported and novel circRNAs. Furthermore, it generates an integrated regulatory network that illustrates the regulation between circRNAs, miRNAs and genes.
0
Citation320
0
Save
0

Comparative analysis of the transcriptome across distant species

Mark Gerstein et al.Aug 26, 2014
Uniform processing and detailed annotation of human, worm and fly RNA-sequencing data reveal ancient, conserved features of the transcriptome, shared co-expression modules (many enriched in developmental genes), matched expression patterns across development and similar extent of non-canonical, non-coding transcription; furthermore, the data are used to create a single, universal model to predict gene-expression levels for all three organisms from chromatin features at the promoter. In this paper the modENCODE consortium reports on a comparative analysis of transcriptome data for human, worm and fly, revealing ancient, conserved features such as shared co-expression modules enriched in developmental genes. Expression patterns are used to align the stages in worm and fly development. Gene expression levels, both coding and non-coding, in all three organisms can be quantitatively predicted from chromatin features at the promoter using a model based on a single set of organism-independent parameters. The transcriptome is the readout of the genome. Identifying common features in it across distant species can reveal fundamental principles. To this end, the ENCODE and modENCODE consortia have generated large amounts of matched RNA-sequencing data for human, worm and fly. Uniform processing and comprehensive annotation of these data allow comparison across metazoan phyla, extending beyond earlier within-phylum transcriptome comparisons and revealing ancient, conserved features1,2,3,4,5,6. Specifically, we discover co-expression modules shared across animals, many of which are enriched in developmental genes. Moreover, we use expression patterns to align the stages in worm and fly development and find a novel pairing between worm embryo and fly pupae, in addition to the embryo-to-embryo and larvae-to-larvae pairings. Furthermore, we find that the extent of non-canonical, non-coding transcription is similar in each organism, per base pair. Finally, we find in all three organisms that the gene-expression levels, both coding and non-coding, can be quantitatively predicted from chromatin features at the promoter using a ‘universal model’ based on a single set of organism-independent parameters.
0
Citation301
0
Save
0

Modeling gene expression using chromatin features in various cellular contexts

Xianjun Dong et al.Jan 1, 2012
Previous work has demonstrated that chromatin feature levels correlate with gene expression. The ENCODE project enables us to further explore this relationship using an unprecedented volume of data. Expression levels from more than 100,000 promoters were measured using a variety of high-throughput techniques applied to RNA extracted by different protocols from different cellular compartments of several human cell lines. ENCODE also generated the genome-wide mapping of eleven histone marks, one histone variant, and DNase I hypersensitivity sites in seven cell lines. We built a novel quantitative model to study the relationship between chromatin features and expression levels. Our study not only confirms that the general relationships found in previous studies hold across various cell lines, but also makes new suggestions about the relationship between chromatin features and gene expression levels. We found that expression status and expression levels can be predicted by different groups of chromatin features, both with high accuracy. We also found that expression levels measured by CAGE are better predicted than by RNA-PET or RNA-Seq, and different categories of chromatin features are the most predictive of expression for different RNA measurement methods. Additionally, PolyA+ RNA is overall more predictable than PolyA- RNA among different cell compartments, and PolyA+ cytosolic RNA measured with RNA-Seq is more predictable than PolyA+ nuclear RNA, while the opposite is true for PolyA- RNA. Our study provides new insights into transcriptional regulation by analyzing chromatin features in different cellular contexts.
0
Citation270
0
Save
0

Classification of human genomic regions based on experimentally determined binding sites of more than 100 transcription-related factors

Kevin Yip et al.Sep 5, 2012
Transcription factors function by binding different classes of regulatory elements. The Encyclopedia of DNA Elements (ENCODE) project has recently produced binding data for more than 100 transcription factors from about 500 ChIP-seq experiments in multiple cell types. While this large amount of data creates a valuable resource, it is nonetheless overwhelmingly complex and simultaneously incomplete since it covers only a small fraction of all human transcription factors.As part of the consortium effort in providing a concise abstraction of the data for facilitating various types of downstream analyses, we constructed statistical models that capture the genomic features of three paired types of regions by machine-learning methods: firstly, regions with active or inactive binding; secondly, those with extremely high or low degrees of co-binding, termed HOT and LOT regions; and finally, regulatory modules proximal or distal to genes. From the distal regulatory modules, we developed computational pipelines to identify potential enhancers, many of which were validated experimentally. We further associated the predicted enhancers with potential target transcripts and the transcription factors involved. For HOT regions, we found a significant fraction of transcription factor binding without clear sequence motifs and showed that this observation could be related to strong DNA accessibility of these regions.Overall, the three pairs of regions exhibit intricate differences in chromosomal locations, chromatin features, factors that bind them, and cell-type specificity. Our machine learning approach enables us to identify features potentially general to all transcription factors, including those not included in the data.
0
Citation265
0
Save
Load More