BB
Beatrice Borsari
Author with expertise in Regulation of RNA Processing and Function
Centre for Genomic Regulation, Yale University, Pompeu Fabra University
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
20
h-index:
9
/
i10-index:
7
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
19

The EN-TEx resource of multi-tissue personal epigenomes & variant-impact models

Joel Rozowsky et al.Oct 24, 2023
+96
Y
J
J
ABSTRACT Understanding how genetic variants impact molecular phenotypes is a key goal of functional genomics, currently hindered by reliance on a single haploid reference genome. Here, we present the EN-TEx resource of personal epigenomes, for ∼25 tissues and >10 assays in four donors (>1500 open-access functional genomic and proteomic datasets, in total). Each dataset is mapped to a matched, diploid personal genome, which has long-read phasing and structural variants. The mappings enable us to identify >1 million loci with allele-specific behavior. These loci exhibit coordinated epigenetic activity along haplotypes and less conservation than matched, non-allele-specific loci, in a fashion broadly paralleling tissue-specificity. Surprisingly, they can be accurately modelled just based on local nucleotide-sequence context. Combining EN-TEx with existing genome annotations reveals strong associations between allele-specific and GWAS loci and enables models for transferring known eQTLs to difficult-to-profile tissues. Overall, EN-TEx provides rich data and generalizable models for more accurate personal functional genomics.
19
Citation9
0
Save
29

Intronic enhancers regulate the expression of genes involved in tissue-specific functions and homeostasis

Beatrice Borsari et al.Oct 24, 2023
+4
H
P
B
Abstract Tissue function and homeostasis reflect the gene expression signature by which the combination of ubiquitous and tissue-specific genes contribute to the tissue maintenance and stimuli-responsive function. Enhancers are central to control this tissue-specific gene expression pattern. Here, we explore the correlation between the genomic location of enhancers and their role in tissue-specific gene expression. We found that enhancers showing tissue-specific activity are highly enriched in intronic regions and regulate the expression of genes involved in tissue-specific functions, while housekeeping genes are more often controlled by intergenic enhancers. Notably, an intergenic-to-intronic active enhancers continuum is observed in the transition from developmental to adult stages: the most differentiated tissues present higher rates of intronic enhancers, while the lowest rates are observed in embryonic stem cells. Altogether, our results suggest that the genomic location of active enhancers is key for the tissue-specific control of gene expression.
29
Citation6
0
Save
6

Dynamics of gene expression and chromatin marking during cell state transition

Beatrice Borsari et al.Oct 24, 2023
+9
C
A
B
Summary We have monitored the transcriptomic and epigenomic status of cells at twelve time-points during the transdifferentiation of human pre-B cells into macrophages. Using this data, we have investigated some fundamental questions regarding the role of chromatin in gene expression. We have found that, over time, genes are characterized by a limited number of chromatin states (combinations of histone modifications), and that, consistently, chromatin changes over genes tend to occur in a coordinated manner. We have observed strong association between these changes and gene expression only at the time of initial gene activation. Activation is preceded by H3K4me1 and H3K4me2, and followed in a precise order by most other histone modifications. Further changes in gene expression, comparable or even stronger than those at initial activation, occur without associated changes in histone modifications. The data generated here constitutes, thus, a unique resource to investigate transcriptomic and epigenomic dynamics during a differentiation process.
6
Citation5
0
Save
0

Novel autoregulatory cases of alternative splicing coupled with nonsense-mediated mRNA decay

Dmitri Pervouchine et al.May 7, 2020
+3
A
I
D
Nonsense-mediated decay (NMD) is a eukaryotic mRNA surveillance system that selectively degrades transcripts with premature termination codons (PTC). Many RNA-binding proteins (RBP) regulate their expression levels by a negative feedback loop, in which RBP binds its own pre-mRNA and causes alternative splicing to introduce a PTC. We present a bioinformatic framework to identify novel such autoregulatory feedback loops by combining eCLIP assays for a large panel of RBPs with the data on shRNA inactivation of NMD pathway, and shRNA-depletion of RBPs followed by RNA-seq. We show that RBPs frequently bind their own pre-mRNAs and respond prominently to NMD pathway disruption. Poison and essential exons, i.e., exons that trigger NMD when included in the mRNA or skipped, respectively, respond oppositely to the inactivation of NMD pathway and to the depletion of their host genes, which allows identification of novel autoregulatory mechanisms for a number of human RBPs. For example, SRSF7 binds its own pre-mRNA and facilitates the inclusion of two poison exons; SFPQ binding promotes switching to an alternative distal 3'-UTR that is targeted by NMD; RPS3 activates a poison 5'-splice site in its pre-mRNA that leads to a frame shift; U2AF1 binding activates one of its two mutually exclusive exons, leading to NMD; TBRG4 is regulated by cluster splicing of its two essential exons. Our results indicate that autoregulatory negative feedback loop of alternative splicing and NMD is a generic form of post-transcriptional control of gene expression.
132

The ENCODE4 long-read RNA-seq collection reveals distinct classes of transcript structure diversity

Fairlie Reese et al.Oct 24, 2023
+42
G
B
F
The majority of mammalian genes encode multiple transcript isoforms that result from differential promoter use, changes in exonic splicing, and alternative 3' end choice. Detecting and quantifying transcript isoforms across tissues, cell types, and species has been extremely challenging because transcripts are much longer than the short reads normally used for RNA-seq. By contrast, long-read RNA-seq (LR-RNA-seq) gives the complete structure of most transcripts. We sequenced 264 LR-RNA-seq PacBio libraries totaling over 1 billion circular consensus reads (CCS) for 81 unique human and mouse samples. We detect at least one full-length transcript from 87.7% of annotated human protein coding genes and a total of 200,000 full-length transcripts, 40% of which have novel exon junction chains. To capture and compute on the three sources of transcript structure diversity, we introduce a gene and transcript annotation framework that uses triplets representing the transcript start site, exon junction chain, and transcript end site of each transcript. Using triplets in a simplex representation demonstrates how promoter selection, splice pattern, and 3' processing are deployed across human tissues, with nearly half of multi-transcript protein coding genes showing a clear bias toward one of the three diversity mechanisms. Evaluated across samples, the predominantly expressed transcript changes for 74% of protein coding genes. In evolution, the human and mouse transcriptomes are globally similar in types of transcript structure diversity, yet among individual orthologous gene pairs, more than half (57.8%) show substantial differences in mechanism of diversification in matching tissues. This initial large-scale survey of human and mouse long-read transcriptomes provides a foundation for further analyses of alternative transcript usage, and is complemented by short-read and microRNA data on the same samples and by epigenome data elsewhere in the ENCODE4 collection.
132
0
Save
22

Identification and analysis of splicing quantitative trait loci across multiple tissues in the human genome

Diego Garrido-Martín et al.Oct 24, 2023
+2
M
B
D
Abstract We have developed an efficient and reproducible pipeline for the discovery of genetic variants affecting splicing (sQTLs), based on an approach that captures the intrinsically multivariate nature of this phenomenon. We employed it to analyze the multi-tissue transcriptome GTEx dataset, generating a comprehensive catalogue of sQTLs in the human genome. A core set of these sQTLs is shared across multiple tissues. Downstream analyses of this catalogue contribute to the understanding of the mechanisms underlying splicing regulation. We found that sQTLs often target the global splicing pattern of genes, rather than individual splicing events. Many of them also affect gene expression, but not always of the same gene, potentially uncovering regulatory loci that act on different genes through different mechanisms. sQTLs tend to be preferentially located in introns that are post-transcriptionally spliced, which would act as hotspots for splicing regulation. While many variants affect splicing patterns by directly altering the sequence of splice sites, many more modify the binding of RNA-binding proteins (RBPs) to target sequences within the transcripts. Genetic variants affecting splicing can have a phenotypic impact comparable or even stronger than variants affecting expression, with those that alter RBP binding playing a prominent role in disease.
0

Functional Annotation of Human Long Non-Coding RNAs via Molecular Phenotyping

Jordan Ramilowski et al.May 6, 2020
+113
S
C
J
Long non-coding RNAs (lncRNAs) constitute the majority of transcripts in mammalian genomes and yet, their functions remain largely unknown. We systematically suppressed 285 lncRNAs in human dermal fibroblasts and quantified cellular growth, morphological changes, and transcriptomic responses using Capped Analysis of Gene Expression (CAGE). The resulting transcriptomic profiles recapitulated the observed cellular phenotypes, yielding specific roles for over 40% of analyzed lncRNAs in regulating distinct biological pathways, transcriptional machinery, alternative promoter activity and architecture usage. Overall, combining cellular and molecular profiling provided a powerful approach to unravel the distinct functions of lncRNAs, which we highlight with specific functional roles for ZNF213-AS1 and lnc-KHDC3L-2 .
0

chronODE: A framework to integrate time-series multi-omics data based on ordinary differential equations combined with machine learning

Beatrice Borsari et al.Dec 14, 2023
+4
E
M
B
Most functional genomic studies are conducted in steady-state conditions, therefore providing a description of molecular processes at a particular moment of cell differentiation or organismal development. Longitudinal studies can offer a deeper understanding of the kinetics underlying epigenetic events and their contribution to defining cell-type-specific transcriptional programs. Here we develop chronODE, a mathematical framework based on ordinary differential equations that uniformly models the kinetics of temporal changes in gene expression and chromatin features. chronODE employs biologically interpretable parameters that capture tissue-specific kinetics of genes and regulatory elements. We further integrate this framework with a neural-network architecture that can link and predict changes across different data modalities by solving multivariate time-series regressions. Next, we apply this framework to investigate region-specific kinetics of epigenome rewiring in the developing mouse brain, and we demonstrate that changes in chromatin accessibility within regulatory elements can accurately predict changes in the expression of putative target genes over the same time period. Finally, by integrating single-cell ATAC-seq data generated during the same time course, we show that regulatory elements characterized by fast activation kinetics in bulk measurements are active in early-appearing cell types, such as radial glial and other neural progenitors, whereas elements characterized by slow activation kinetics are specific to more differentiated cell types that emerge at later stages of brain development.