JE
Juan Entizne
Author with expertise in Regulation of RNA Processing and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(57% Open Access)
Cited by:
491
h-index:
8
/
i10-index:
7
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

SUPPA2: fast, accurate, and uncertainty-aware differential splicing analysis across multiple conditions

Juan Trincado et al.Mar 23, 2018
+4
M
B
J
Despite the many approaches to study differential splicing from RNA-seq, many challenges remain unsolved, including computing capacity and sequencing depth requirements. Here we present SUPPA2, a new method that addresses these challenges, and enables streamlined analysis across multiple conditions taking into account biological variability. Using experimental and simulated data, we show that SUPPA2 achieves higher accuracy compared to other methods, especially at low sequencing depth and short read length. We use SUPPA2 to identify novel Transformer2-regulated exons, novel microexons induced during differentiation of bipolar neurons, and novel intron retention events during erythroblast differentiation.
0
Citation461
0
Save
1

TranSuite: a software suite for accurate translation and characterization of transcripts

Juan Entizne et al.Dec 16, 2020
+5
C
W
J
ABSTRACT Protein translation programs often select the longest open reading frame (ORF) in a transcript leading to numerous inaccurate and mis-annotated ORFs in databases. Unproductive transcript isoforms containing premature termination codons (PTCs) are potential substrates for nonsense-mediated decay (NMD). These transcripts often contain truncated ORFs but are incorrectly annotated due to selection of a long ORF beginning at an AUG downstream of the PTC despite the transcript containing the authentic translation start AUG. In gene expression and alternative splicing analyses, it is important to identify transcript isoforms which code for different protein variants and to distinguish these from potential NMD substrates. Here, we present TranSuite, a pipeline of bioinformatics tools that address these challenges by performing accurate translations, characterizing alternative ORFs and identifying NMD and other features of transcripts in newly assembled and existing transcriptomes. Directly comparing ORFs defined by TranSuite and TransDecoder for the Arabidopsis transcriptome AtRTD2 identified ORF mis-calling in over 16k (27%) of transcripts by TransDecoder.
1
Citation18
0
Save
29

BaRTv2: A highly resolved barley reference transcriptome for accurate transcript-specific RNA-seq quantification

Max Coulter et al.Sep 11, 2021
+13
W
J
M
ABSTRACT Accurate characterization of splice junctions as well as transcription start and end sites in reference transcriptomes allows precise quantification of transcripts from RNA-seq data and enable detailed investigations of transcriptional and post-transcriptional regulation. Using novel computational methods and a combination of PacBio Iso-seq and Illumina short read sequences from 20 diverse tissues and conditions, we generated a comprehensive and highly resolved barley reference transcript dataset (RTD) from the European 2-row spring barley cultivar Barke (BaRTv2.18). Stringent and thorough filtering was carried out to maintain the quality and accuracy of the splice junctions and transcript start and end sites. BaRTv2.18 shows increased transcript diversity and completeness compared to an earlier version, BaRTv1.0. The accuracy of transcript level quantification, splice junctions and transcript start and end sites has been validated extensively using parallel technologies and analysis, including high resolution RT PCR and 5’ RACE. BaRTv2.18 contains 39,434 genes and 148,260 transcripts, representing the most comprehensive and resolved reference transcriptome in barley to date. It provides an important and high-quality resource for advanced transcriptomic analyses, including both transcriptional and post-transcriptional regulation, with exceptional resolution and precision.
29
Citation7
0
Save
120

A high resolution single molecule sequencing-based Arabidopsis transcriptome using novel methods of Iso-seq analysis

Runxuan Zhang et al.Sep 3, 2021
+36
T
A
R
Abstract Background Accurate and comprehensive annotation of transcript sequences is essential for transcript quantification and differential gene and transcript expression analysis. Single molecule long read sequencing technologies provide improved integrity of transcript structures including alternative splicing, and transcription start and polyadenylation sites. However, accuracy is significantly affected by sequencing errors, mRNA degradation or incomplete cDNA synthesis. Results We present a new and comprehensive Arabidopsis thaliana Reference Transcript Dataset 3 (AtRTD3). AtRTD3 contains over 160k transcripts - twice that of the best current Arabidopsis transcriptome and including over 1,500 novel genes. 79% of transcripts are from Iso-seq with accurately defined splice junctions and transcription start and end sites. We developed novel methods to determine splice junctions and transcription start and end sites accurately. Mis- match profiles around splice junctions provided a powerful feature to distinguish correct splice junctions and remove false splice junctions. Stratified approaches identified high confidence transcription start/end sites and removed fragmentary transcripts due to degradation. AtRTD3 is a major improvement over existing transcriptomes as demonstrated by analysis of an Arabidopsis cold response RNA-seq time-series. AtRTD3 provided higher resolution of transcript expression profiling and identified cold- and light-induced differential transcription start and polyadenylation site usage. Conclusions AtRTD3 is the most comprehensive Arabidopsis transcriptome currently available. It improves the precision of differential gene and transcript expression, differential alternative splicing, and transcription start/end site usage from RNA-seq data. The novel methods for identifying accurate splice junctions and transcription start/end sites are widely applicable and will improve single molecule sequencing analysis from any species.
120
Citation5
0
Save
0

Rapid and dynamic alternative splicing impacts the Arabidopsis cold response transcriptome

Cristiane Calixto et al.Jan 22, 2018
+7
A
W
C
Background: Plants have adapted to tolerate and survive constantly changing environmental conditions by re-programming gene expression. The scale of the contribution of alternative splicing (AS) to stress responses has been underestimated due to limitations in RNA-seq analysis programs and poor representation of AS transcripts in plant databases. Significantly, the dynamics of the AS response have not been investigated but this is now possible with accurate transcript quantification programs and AtRTD2, a new, comprehensive transcriptome for Arabidopsis. Results: Using ultra-deep RNA-sequencing of a time-course of Arabidopsis thaliana plants exposed to cold treatment, we identified 8,949 genes with altered expression of which 2,442 showed significant differential alternative splicing (DAS) and 1,647 genes were regulated only at the level of AS (DAS-only). The high temporal resolution demonstrated the rapid induction of both transcription and AS resulting in coincident waves of differential expression (transcription) and differential alternative splicing in the first 6-9 hours of cold. The differentially expressed and DAS gene sets were largely non-overlapping, each comprising thousands of genes. The dynamic analysis of AS identified genes with rapid and sensitive AS within 3 h of transfer to the cold (early AS genes), which were enriched for splicing and transcription factors. A detailed investigation of the novel cold-response DAS-only gene, U2B2-LIKE, suggested that it regulates AS and is required for tolerance to freezing. Conclusions: Our data indicate that transcription and AS are the major regulators of transcriptome reprogramming that together govern the physiological and survival responses of plants to low temperature.
0

Nonsense mediated RNA decay factor UPF1 is critical for post-transcriptional and translational gene regulation in Arabidopsis

Vivek Raxwal et al.Mar 3, 2020
+6
J
C
V
Nonsense mediated RNA decay (NMD) is an evolutionary conserved RNA control mechanism that has also been implicated in the broader regulation of gene expression. Nevertheless, a role for NMD in genome regulation has not been fully assessed, partially because NMD inactivation is lethal in many organisms. Here, we performed in depth comparative analysis of Arabidopsis mutants lacking key proteins involved in different steps of NMD. We observed that UPF3, UPF1, and SMG7 have different impacts on NMD and the Arabidopsis transcriptome, with UPF1 having the biggest effect. Transcriptome assembly using stringent pipeline in UPF1-null plants revealed genome wide changes in alternative splicing, including switches in mRNA variants, suggesting a role for UPF1 in splicing. We further found that UPF1 inactivation leads to translational repression, manifested by a global shift in mRNAs from polysomes to monosomes and a downregulation of genes involved in translation and ribosome biogenesis. Despite this global change, NMD targets and low-expressed mRNAs with short half-lives were enriched in polysomes, indicating that UPF1 specifically suppresses the translation of aberrant RNAs. Particularly striking was an increase in the translation of TIR domain-containing, nucleotide-binding, leucine-rich repeat (TNL) immune receptors. The regulation of TNLs via UPF1/NMD-mediated mRNA stability and translational de-repression offers a dynamic mechanism for the rapid activation of TNLs in response to pathogen attack.
0

SUPPA2 provides fast, accurate, and uncertainty-aware differential splicing analysis across multiple conditions

Juan Trincado et al.Nov 10, 2016
+4
G
J
J
Despite the many approaches to study differential splicing from RNA-seq, many challenges remain unsolved, including computing capacity and sequencing depth requirements. Here we present SUPPA2, a new method for differential splicing analysis that addresses these challenges and enables streamlined analysis across multiple conditions taking into account biological variability. Using experimental and simulated data SUPPA2 achieves higher accuracy compared to other methods; especially at low sequencing depth and short read length, with important implications for cost-effective use of RNA-seq for splicing; and was able to identify novel Transformer2-regulated exons. We further analyzed two differentiation series to support the applicability of SUPPA2 beyond binary comparisons. This identified clusters of alternative splicing events enriched in microexons induced during differentiation of bipolar neurons, and a cluster enriched in intron retention events that are present at late stages during erythroblast differentiation. Our data suggest that SUPPA2 is a valuable tool for the robust investigation of the biological complexity of alternative splicing.