JE
J Engreitz
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(88% Open Access)
Cited by:
16
h-index:
2
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Compatibility logic of human enhancer and promoter sequences

Drew Bergman et al.Oct 24, 2021
Abstract Gene regulation in the human genome is controlled by distal enhancers that activate specific nearby promoters. One model for the specificity of enhancer-promoter regulation is that different promoters might have sequence-encoded preferences for distinct classes of enhancers, for example mediated by interacting sets of transcription factors or cofactors. This “biochemical compatibility” model has been supported by observations at individual human promoters and by genome-wide measurements in Drosophila . However, the degree to which human enhancers and promoters are intrinsically compatible or specific has not been systematically measured, and how their activities combine to control RNA expression remains unclear. To address these questions, we designed a high-throughput reporter assay called enhancer x promoter (ExP) STARR-seq and applied it to examine the combinatorial compatibilities of 1,000 enhancer and 1,000 promoter sequences in human K562 cells. We identify a simple logic for enhancer-promoter compatibility – virtually all enhancers activated all promoters by similar amounts, and intrinsic enhancer and promoter activities combine multiplicatively to determine RNA output ( R 2 =0.82). In addition, two classes of enhancers and promoters showed subtle preferential effects. Promoters of housekeeping genes contained built-in activating sequences, corresponding to motifs for factors such as GABPA and YY1, that correlated with both stronger autonomous promoter activity and enhancer activity, and weaker responsiveness to distal enhancers. Promoters of context-specific genes lacked these motifs and showed stronger responsiveness to enhancers. Together, this systematic assessment of enhancer-promoter compatibility suggests a multiplicative model tuned by enhancer and promoter class to control gene transcription in the human genome.
1
Citation3
0
Save
6

Selective Enhancer Dependencies inMYC-Intact andMYC-Rearranged Germinal Center B-cell Diffuse Large B-cell Lymphoma

Ashwin Iyer et al.May 3, 2023
High expression of MYC and its target genes define a subset of germinal center B-cell diffuse large B-cell lymphoma (GCB-DLBCL) associated with poor outcomes. Half of these high-grade cases show chromosomal rearrangements between the MYC locus and heterologous enhancer-bearing loci, while focal deletions of the adjacent non-coding gene PVT1 are enriched in MYC -intact cases. To identify genomic drivers of MYC activation, we used high-throughput CRISPR-interference (CRISPRi) profiling of candidate enhancers in the MYC locus and rearrangement partner loci in GCB-DLBCL cell lines and mantle cell lymphoma (MCL) comparators that lacked common rearrangements between MYC and immunoglobulin (Ig) loci. Rearrangements between MYC and non-Ig loci were associated with unique dependencies on specific enhancer subunits within those partner loci. Notably, fitness dependency on enhancer modules within the BCL6 super-enhancer ( BCL6 -SE) cluster regulated by a transcription factor complex of MEF2B, POU2F2, and POU2AF1 was higher in cell lines bearing a recurrent MYC::BCL6 -SE rearrangement. In contrast, GCB-DLBCL cell lines without MYC rearrangement were highly dependent on a previously uncharacterized 3' enhancer within the MYC locus itself (GCBME-1), that is regulated in part by the same triad of factors. GCBME-1 is evolutionarily conserved and active in normal germinal center B cells in humans and mice, suggesting a key role in normal germinal center B cell biology. Finally, we show that the PVT1 promoter limits MYC activation by either native or heterologous enhancers and demonstrate that this limitation is bypassed by 3' rearrangements that remove PVT1 from its position in cis with the rearranged MYC gene.CRISPR-interference screens identify a conserved germinal center B cell MYC enhancer that is essential for GCB-DLBCL lacking MYC rearrangements. Functional profiling of MYC partner loci reveals principles of MYC enhancer-hijacking activation by non-immunoglobulin rearrangements.
6
Citation2
0
Save
0

Gapped-kmer sequence modeling robustly identifies regulatory vocabularies and distal enhancers conserved between evolutionarily distant mammals

J Engreitz et al.Jul 31, 2024
Gene regulatory elements drive complex biological phenomena and their mutations are associated with common human diseases. The impacts of human regulatory variants are often tested using model organisms such as mice. However, mapping human enhancers to conserved elements in mice remains a challenge, due to both rapid enhancer evolution and limitations of current computational methods. We analyze distal enhancers across 45 matched human/mouse cell/tissue pairs from a comprehensive dataset of DNase-seq experiments, and show that while cell-specific regulatory vocabulary is conserved, enhancers evolve more rapidly than promoters and CTCF binding sites. Enhancer conservation rates vary across cell types, in part explainable by tissue specific transposable element activity. We present an improved genome alignment algorithm using gapped-kmer features, called gkm-align, and make genome wide predictions for 1,401,803 orthologous regulatory elements. We show that gkm-align discovers 23,660 novel human/mouse conserved enhancers missed by previous algorithms, with strong evidence of conserved functional activity. Here the authors develop an alignment algorithm to more reliably detect regulatory DNA sequences conserved between humans and other mammal species with a focus on mouse. This should aid testing of disease mechanisms in model organisms.
0
Citation1
0
Save
123

Multi-center integrated analysis of non-coding CRISPR screens

David Yao et al.Dec 22, 2022
Abstract The ENCODE Consortium’s efforts to annotate non-coding, cis -regulatory elements (CREs) have advanced our understanding of gene regulatory landscapes which play a major role in health and disease. Pooled, non-coding CRISPR screens are a promising approach for systematically investigating gene regulatory mechanisms. Here, the ENCODE Functional Characterization Centers report 109 screens comprising 346,970 individual perturbations across 13.3Mb of the genome, using a variety of methods, readouts, and statistical analyses. Across 332 functionally confirmed CRE-gene links, we identify principles for screening endogenous, non-coding elements for causal regulatory mechanisms. Nearly all CREs show strong evidence of open chromatin, and targeting accessibility peak summits is a critical component of our proposed sgRNA design rules. We provide experimental guidelines to accurately detect CREs with variable, often low, transcriptional effects. We discover a previously undescribed DNA strand-bias for CRISPRi in transcribed regions with implications for screen design and analysis. Benchmarking five screen analysis tools, we find CASA produces the most conservative CRE calls and is robust to artifacts of low-specificity sgRNAs. Together, we provide an accessible data resource, predesigned sgRNAs targeting 3,275,697 ENCODE SCREEN candidate CREs, and screening guidelines to accelerate functional characterization of the non-coding genome.
7

Gapped-kmer sequence modeling robustly identifies regulatory vocabularies and distal enhancers conserved between evolutionarily distant mammals

J Engreitz et al.Oct 6, 2023
Gene regulatory elements drive many complex biological phenomena such as fetal development, and their mutations are linked to a multitude of common human diseases. The phenotypic impacts of regulatory variants are often tested using their conserved orthologous counterparts in model organisms such as mice. However, mapping human enhancers to conserved elements in mice remains a challenge, due to both rapid evolution of enhancers and limitations of current computational methods to detect conserved regulatory sequences. To improve upon existing computational methods and to better understand the sources of this apparent regulatory divergence, we comprehensively measured the evolutionary dynamics of distal enhancers across 45 matched human/mouse cell/tissue pairs from more than 1,000 DNase-seq experiments. Using this expansive dataset, we show that while cell-specific regulatory vocabulary is conserved, enhancers evolve more rapidly than other genomic elements such as promoters and CTCF binding sites. We observed surprisingly high levels of cell-specific variability in enhancer conservation rates, in part explainable by tissue specific transposable element activity. To improve orthologous enhancer mapping, we developed an improved genome alignment algorithm using gapped-kmer sequence features, and using the matched cell/tissue pairs, we show that this novel computational method, gkm-align, discovers 23,660 novel human/mouse conserved enhancers missed by standard alignment algorithms.
106

A single-cell and spatial atlas of autopsy tissues reveals pathology and cellular targets of SARS-CoV-2

Toni Delorey et al.Feb 25, 2021
The SARS-CoV-2 pandemic has caused over 1 million deaths globally, mostly due to acute lung injury and acute respiratory distress syndrome, or direct complications resulting in multiple-organ failures. Little is known about the host tissue immune and cellular responses associated with COVID-19 infection, symptoms, and lethality. To address this, we collected tissues from 11 organs during the clinical autopsy of 17 individuals who succumbed to COVID-19, resulting in a tissue bank of approximately 420 specimens. We generated comprehensive cellular maps capturing COVID-19 biology related to patients' demise through single-cell and single-nucleus RNA-Seq of lung, kidney, liver and heart tissues, and further contextualized our findings through spatial RNA profiling of distinct lung regions. We developed a computational framework that incorporates removal of ambient RNA and automated cell type annotation to facilitate comparison with other healthy and diseased tissue atlases. In the lung, we uncovered significantly altered transcriptional programs within the epithelial, immune, and stromal compartments and cell intrinsic changes in multiple cell types relative to lung tissue from healthy controls. We observed evidence of: alveolar type 2 (AT2) differentiation replacing depleted alveolar type 1 (AT1) lung epithelial cells, as previously seen in fibrosis; a concomitant increase in myofibroblasts reflective of defective tissue repair; and, putative TP63 + intrapulmonary basal-like progenitor (IPBLP) cells, similar to cells identified in H1N1 influenza, that may serve as an emergency cellular reserve for severely damaged alveoli. Together, these findings suggest the activation and failure of multiple avenues for regeneration of the epithelium in these terminal lungs. SARS-CoV-2 RNA reads were enriched in lung mononuclear phagocytic cells and endothelial cells, and these cells expressed distinct host response transcriptional programs. We corroborated the compositional and transcriptional changes in lung tissue through spatial analysis of RNA profiles in situ and distinguished unique tissue host responses between regions with and without viral RNA, and in COVID-19 donor tissues relative to healthy lung. Finally, we analyzed genetic regions implicated in COVID-19 GWAS with transcriptomic data to implicate specific cell types and genes associated with disease severity. Overall, our COVID-19 cell atlas is a foundational dataset to better understand the biological impact of SARS-CoV-2 infection across the human body and empowers the identification of new therapeutic interventions and prevention strategies.