KY
Koon‐Kiu Yan
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(62% Open Access)
Cited by:
1,951
h-index:
21
/
i10-index:
29
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Architecture of the human regulatory network derived from ENCODE data

Mark Gerstein et al.Sep 1, 2012
Transcription factors bind in a combinatorial fashion to specify the on-and-off states of genes; the ensemble of these binding events forms a regulatory network, constituting the wiring diagram for a cell. To examine the principles of the human transcriptional regulatory network, we determined the genomic binding information of 119 transcription-related factors in over 450 distinct experiments. We found the combinatorial, co-association of transcription factors to be highly context specific: distinct combinations of factors bind at specific genomic locations. In particular, there are significant differences in the binding proximal and distal to genes. We organized all the transcription factor binding into a hierarchy and integrated it with other genomic information (for example, microRNA regulation), forming a dense meta-network. Factors at different levels have different properties; for instance, top-level transcription factors more strongly influence expression and middle-level ones co-regulate targets to mitigate information-flow bottlenecks. Moreover, these co-regulations give rise to many enriched network motifs (for example, noise-buffering feed-forward loops). Finally, more connected network components are under stronger selection and exhibit a greater degree of allele-specific activity (that is, differential binding to the two parental alleles). The regulatory information obtained in this study will be crucial for interpreting personal genome sequences and understanding basic principles of human biology and disease. A description is given of the ENCODE consortium’s efforts to examine the principles of human transcriptional regulatory networks; the results are integrated with other genomic information to form a hierarchical meta-network where different levels have distinct properties. This manuscript describes the effort of the ENCODE (Encyclopedia of DNA Elements) Consortium to examine the principles of human transcriptional regulatory networks, using a subset of 119 transcription factors. The results are integrated with other genomic information to form a multi-level meta-network in which different levels have distinct properties. The findings will aid future interpretations of human genomics and help us to understand the basic principles of human biology and disease.
0
Citation1,449
0
Save
0

Comparative analysis of the transcriptome across distant species

Mark Gerstein et al.Aug 26, 2014
Uniform processing and detailed annotation of human, worm and fly RNA-sequencing data reveal ancient, conserved features of the transcriptome, shared co-expression modules (many enriched in developmental genes), matched expression patterns across development and similar extent of non-canonical, non-coding transcription; furthermore, the data are used to create a single, universal model to predict gene-expression levels for all three organisms from chromatin features at the promoter. In this paper the modENCODE consortium reports on a comparative analysis of transcriptome data for human, worm and fly, revealing ancient, conserved features such as shared co-expression modules enriched in developmental genes. Expression patterns are used to align the stages in worm and fly development. Gene expression levels, both coding and non-coding, in all three organisms can be quantitatively predicted from chromatin features at the promoter using a model based on a single set of organism-independent parameters. The transcriptome is the readout of the genome. Identifying common features in it across distant species can reveal fundamental principles. To this end, the ENCODE and modENCODE consortia have generated large amounts of matched RNA-sequencing data for human, worm and fly. Uniform processing and comprehensive annotation of these data allow comparison across metazoan phyla, extending beyond earlier within-phylum transcriptome comparisons and revealing ancient, conserved features1,2,3,4,5,6. Specifically, we discover co-expression modules shared across animals, many of which are enriched in developmental genes. Moreover, we use expression patterns to align the stages in worm and fly development and find a novel pairing between worm embryo and fly pupae, in addition to the embryo-to-embryo and larvae-to-larvae pairings. Furthermore, we find that the extent of non-canonical, non-coding transcription is similar in each organism, per base pair. Finally, we find in all three organisms that the gene-expression levels, both coding and non-coding, can be quantitatively predicted from chromatin features at the promoter using a ‘universal model’ based on a single set of organism-independent parameters.
0
Citation301
0
Save
0

The ModERN Resource: Genome-Wide Binding Profiles for Hundreds ofDrosophilaandCaenorhabditis elegansTranscription Factors

Michelle Kudron et al.Dec 28, 2017
Abstract The model organism Encylopedia of Regulatory Elements (modERN) project was designed to generate genome-wide binding profiles for the majority of transcription... To develop a catalog of regulatory sites in two major model organisms, Drosophila melanogaster and Caenorhabditis elegans, the modERN (model organism Encyclopedia of Regulatory Networks) consortium has systematically assayed the binding sites of transcription factors (TFs). Combined with data produced by our predecessor, modENCODE (Model Organism ENCyclopedia Of DNA Elements), we now have data for 262 TFs identifying 1.23 M sites in the fly genome and 217 TFs identifying 0.67 M sites in the worm genome. Because sites from different TFs are often overlapping and tightly clustered, they fall into 91,011 and 59,150 regions in the fly and worm, respectively, and these binding sites span as little as 8.7 and 5.8 Mb in the two organisms. Clusters with large numbers of sites (so-called high occupancy target, or HOT regions) predominantly associate with broadly expressed genes, whereas clusters containing sites from just a few factors are associated with genes expressed in tissue-specific patterns. All of the strains expressing GFP-tagged TFs are available at the stock centers, and the chromatin immunoprecipitation sequencing data are available through the ENCODE Data Coordinating Center and also through a simple interface (http://epic.gs.washington.edu/modERN/) that facilitates rapid accessibility of processed data sets. These data will facilitate a vast number of scientific inquiries into the function of individual TFs in key developmental, metabolic, and defense and homeostatic regulatory pathways, as well as provide a broader perspective on how individual TFs work together in local networks and globally across the life spans of these two key model organisms.
0
Citation199
0
Save
2

Interrogation of SLFN11 in pediatric sarcomas uncovers an unexpected biological role and a novel therapeutic approach to overcoming resistance to replicative stress

Jessica Gartrell et al.Nov 5, 2020
Abstract Pediatric sarcomas represent a heterogeneous group of malignancies that exhibit variable response to DNA damaging chemotherapy. Schlafen family member 11 protein (SLFN11) increases sensitivity to replicative stress, and SLFN11 gene silencing has been implicated as a common mechanism of drug resistance in tumors in adults. We found SLFN11 to be widely expressed in our cohort of pediatric sarcomas. In sarcoma cell lines, protein expression strongly correlated with response to the PARP inhibitor talazoparib (TAL) and the topoisomerase I inhibitor irinotecan (IRN), with SLFN11 knockout resulting in significant loss of sensitivity in vitro and in vivo. However, SLFN11 expression was not associated with favorable outcomes in a retrospective analysis of our patient cohort; instead, the protein was retained and promoted tumor growth and evasion. Furthermore, we show that pediatric sarcomas develop resistance to TAL and IRN through impaired intrinsic apoptosis, and that resistance can be reversed by selective inhibition of BCL-XL. Statement of Significance The role of SLFN11 in pediatric sarcomas has not been thoroughly explored. In contrast to its activity in adult tumors, SLFN11 did not predict favorable outcomes in pediatric patients, was not silenced, and promoted tumor growth. Resistance to replicative stress in SLFN11-expressing sarcomas was reversed by selective inhibition of BCL-XL.
2
Citation1
0
Save
5

Single-cell analysis identifies TCF4 and ID3 as a molecular switch of mammary epithelial stem cell differentiation

Koon‐Kiu Yan et al.Aug 17, 2020
ABSTRACT It is well known that the expansion of the mammary epithelium during the ovarian cycles in female mammals is supported by the transient increase in mammary epithelial stem cells (MaSCs). However, dissecting the molecular mechanisms that govern MaSC function and differentiation is poorly understood due to the lack of standardized methods for their identification and isolation. The development of robust single-cell mRNA sequencing () technologies and the computational methods to analyze them provides us with novel tools to approach the challenge of studying MaSCs in a completely unbiased way without. Here, we have performed the largest scRNA-seq analysis of individual mammary epithelial cells (~70,000 cells). Our study identified a distinct cell population presenting molecular features of MaSCs. Importantly, further purification and additional in-depth single-cell analysis of these cells revealed that they are not a fully homogenous entity. Instead, we identified three subpopulations representing early stages of lineage commitment. By tracking their molecular evolution through single-cell network analysis we found that one of these subpopulations represents bipotent MaSCs from which luminal and basal lineages diverge. Importantly, we also confirmed the presence of these cells in human mammary glands. Finally, through expression and network analysis studies, we have uncovered transcription factors that are activated early during lineage commitment. These data identified E2-2 (Tcf4) and ID3 as a potential molecular switch of mammary epithelial stem cell differentiation.
5
Citation1
0
Save
4

scMINER: a mutual information-based framework for identifying hidden drivers from single-cell omics data

Liang Ding et al.Jan 27, 2023
The sparse nature of single-cell omics data makes it challenging to dissect the wiring and rewiring of the transcriptional and signaling drivers that regulate cellular states. Many of the drivers, referred to as "hidden drivers", are difficult to identify via conventional expression analysis due to low expression and inconsistency between RNA and protein activity caused by post-translational and other modifications. To address this issue, we developed scMINER, a mutual information (MI)-based computational framework for unsupervised clustering analysis and cell-type specific inference of intracellular networks, hidden drivers and network rewiring from single-cell RNA-seq data. We designed scMINER to capture nonlinear cell-cell and gene-gene relationships and infer driver activities. Systematic benchmarking showed that scMINER outperforms popular single-cell clustering algorithms, especially in distinguishing similar cell types. With respect to network inference, scMINER does not rely on the binding motifs which are available for a limited set of transcription factors, therefore scMINER can provide quantitative activity assessment for more than 6,000 transcription and signaling drivers from a scRNA-seq experiment. As demonstrations, we used scMINER to expose hidden transcription and signaling drivers and dissect their regulon rewiring in immune cell heterogeneity, lineage differentiation, and tissue specification. Overall, activity-based scMINER is a widely applicable, highly accurate, reproducible and scalable method for inferring cellular transcriptional and signaling networks in each cell state from scRNA-seq data. The scMINER software is publicly accessible via: https://github.com/jyyulab/scMINER.
3

miR-424(322) is a molecular switch controlling pro-inflammatory vs anti-inflammatory skin DC subset differentiation by modulating TGF-β signaling

Victoria Zyulina et al.Sep 8, 2020
Abstract TGF-β family ligands are key regulators of dendritic cell (DC) differentiation and activation. Epidermal Langerhans cells (LCs) require TGF- β family signaling for their differentiation and canonical TGF-β1 signaling secures a non-activated LC state. LCs reportedly control skin inflammation and are replenished from peripheral blood monocytes, which also give rise to pro-inflammatory monocyte-derived DCs (moDCs). Among all the miRNAs differentially expressed in LC vs moDCs, we observed miR-424 to be strongly induced during moDC differentiation from monocytes. We discovered that miR-424 is required for moDC differentiation from human and murine precursor cells in vitro and for inflammation-associated moDC in vivo . Mechanistically we found that low levels of miR-424 facilitate TGF-β1-dependent LC differentiation at the expense of moDC differentiation. Loss of miR-424 in monocyte/DC precursors resulted in the induction of TGF-β pathway. Therefore, miR-424 plays a decisive role in anti-inflammatory LC vs pro-inflammatory moDC differentiation from monocytes, and its repression allows TGF-β ligands to promote LC differentiation. Short summary Monocytes give rise to two distinct DC subsets in skin inflammation, exhibiting opposite roles in inflammation. This study identified miR-424(322) as a molecular switch controlling pro-inflammatory (moDC) vs anti-inflammatory LC subset differentiation by modulating TGF-β signaling.
0

An integrative ENCODE resource for cancer genomics

Jing Zhang et al.Jul 18, 2019
ENCODE comprises thousands of functional genomics datasets, and the encyclopedia covers hundreds of cell types, providing a universal annotation for genome interpretation. However, for particular applications, it may be advantageous to use a customized annotation. Here, we develop such a custom annotation by leveraging advanced assays, such as eCLIP, Hi-C, and whole-genome STARR-seq on a number of data-rich ENCODE cell types. A key aspect of this annotation is comprehensive and experimentally derived networks of both transcription factors and RNA-binding proteins (TFs and RBPs). Cancer, a disease of system-wide dysregulation, is an ideal application for such a network-based annotation. Specifically, for cancer-associated cell types, we put regulators into hierarchies and measure their network change (rewiring) during oncogenesis. We also extensively survey TF-RBP crosstalk, highlighting how SUB1, a previously uncharacterized RBP, drives aberrant tumor expression and amplifies the effect of MYC, a well-known oncogenic TF. Furthermore, we show how our annotation allows us to place oncogenic transformations in the context of a broad cell space; here, many normal-to-tumor transitions move towards a stem-like state, while oncogene knockdowns show an opposing trend. Finally, we organize the resource into a coherent workflow to prioritize key elements and variants, in addition to regulators. We showcase the application of this prioritization to somatic burdening, cancer differential expression and GWAS. Targeted validations of the prioritized regulators, elements and variants using siRNA knockdowns, CRISPR-based editing, and luciferase assays demonstrate the value of the ENCODE resource.
0

A cross-organism framework for supervised enhancer prediction with epigenetic pattern recognition and targeted validation

Anurag Sethi et al.Aug 5, 2018
Enhancers are important noncoding elements, but they have been traditionally hard to characterize experimentally. Only a few mammalian enhancers have been validated, making it difficult to train statistical models for their identification properly. Instead, postulated patterns of genomic features have been used heuristically for identification. The development of massively parallel assays allows for the characterization of large numbers of enhancers for the first time. Here, we developed a framework that uses Drosophila STARR-seq data to create shape-matching filters based on enhancer-associated meta-profiles of epigenetic features. We combined these features with supervised machine learning algorithms (e.g., support vector machines) to predict enhancers. We demonstrated that our model could be applied to predict enhancers in mammalian species (i.e., mouse and human). We comprehensively validated the predictions using a combination of in vivo and in vitro approaches, involving transgenic assays in mouse and transduction-based reporter assays in human cell lines. Overall, the validations involved 153 enhancers in 6 mouse tissues and 4 human cell lines. The results confirmed that our model can accurately predict enhancers in different species without re-parameterization. Finally, we examined the transcription-factor binding patterns at predicted enhancers and promoters in human cell lines. We demonstrated that these patterns enable the construction of a secondary model effectively discriminating between enhancers and promoters.
Load More