MI
Maxim Ivanov
Author with expertise in Molecular Mechanisms of Plant Development and Regulation
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(60% Open Access)
Cited by:
218
h-index:
17
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
18

TrancriptomeReconstructoR: data-driven annotation of complex transcriptomes

Maxim Ivanov et al.May 31, 2021
Abstract Background The quality of gene annotation determines the interpretation of results obtained in transcriptomic studies. The growing number of genome sequence information calls for experimental and computational pipelines for de novo transcriptome annotation. Ideally, gene and transcript models should be called from a limited set of key experimental data. Results We developed TranscriptomeReconstructoR, an R package which implements a pipeline for automated transcriptome annotation. It relies on integrating features from independent and complementary datasets: (i) full-length RNA-seq for detection of splicing patterns and (ii) high-throughput 5′ and 3′ tag sequencing data for accurate definition of gene borders. The pipeline can also take a nascent RNA-seq dataset to supplement the called gene model with transient transcripts. We reconstructed de novo the transcriptional landscape of wild type Arabidopsis thaliana seedlings and Saccharomyces cerevisiae cells as a proof-of-principle. A comparison to the existing transcriptome annotations revealed that our gene model is more accurate and comprehensive than the most commonly used community gene models, TAIR10 and Araport11 for A.thaliana and SacCer3 for S.cerevisiae . In particular, we identify multiple transient transcripts missing from the existing annotations. Our new annotations promise to improve the quality of A.thaliana and S.cerevisiae genome research. Conclusions Our proof-of-concept data suggest a cost-efficient strategy for rapid and accurate annotation of complex eukaryotic transcriptomes. We combine the choice of library preparation methods and sequencing platforms with the dedicated computational pipeline implemented in the TranscriptomeReconstructoR package. The pipeline only requires prior knowledge on the reference genomic DNA sequence, but not the transcriptome. The package seamlessly integrates with Bioconductor packages for downstream analysis.
18
Citation13
0
Save
1

Atrans-acting long non-coding RNA represses flowering inArabidopsis

Yu Jin et al.Nov 16, 2021
Abstract Eukaryotic genomes give rise to thousands of long non-coding RNAs (lncRNAs), yet the purpose of lncRNAs remains largely enigmatic. Functional characterization of lncRNAs is challenging due to multiple orthogonal hypothesis for molecular activities of lncRNA loci. Here, we identified a fl owering a ssociated i ntergenic l ncRNA ( FLAIL ) that represses flowering in Arabidopsis . An allelic series of flail loss-of-function mutants generated by CRISPR/Cas9 and T-DNA mutagenesis showed an early flowering phenotype. Gene expression analyses in flail mutants revealed differentially expressed genes linked to the regulation of flowering. A genomic rescue fragment of FLAIL introduced in flail mutants complemented gene expression defects and early flowering, consistent with trans- acting effects of the FLAIL RNA. Knock-down of FLAIL RNA levels using the artificial microRNA approach revealed an early flowering phenotype shared with genomic mutations, indicating a trans- acting role of FLAIL RNA in the repression of flowering time. Genome-wide detection of FLAIL -DNA interactions by ChIRP-seq suggested that FLAIL may directly bind genomic regions. FLAIL bound to genes involved in regulation of flowering that were differentially expressed in flail , consistent with the interpretation of FLAIL as a trans- acting lncRNA directly shaping gene expression. Our findings highlight FLAIL as a trans- acting lncRNA that affects flowering in Arabidopsis , likely through mediating transcriptional regulation of genes directly bound by FLAIL .
1
Citation1
0
Save
21

TrancriptomeReconstructoR: data-driven annotation of complex transcriptomes

Maxim Ivanov et al.Dec 11, 2020
Abstract Background The quality of gene annotation determines the interpretation of results obtained in transcriptomic studies. The growing number of genome sequence information calls for experimental and computational pipelines for de novo transcriptome annotation. Ideally, gene and transcript models should be called from a limited set of key experimental data. Results We developed TranscriptomeReconstructoR, an R package which implements a pipeline for automated transcriptome annotation. It relies on integrating features from independent and complementary datasets: i) full-length RNA-seq for detection of splicing patterns and ii) high-throughput 5’ and 3’ tag sequencing data for accurate definition of gene borders. The pipeline can also take a nascent RNA-seq dataset to supplement the called gene model with transient transcripts. We reconstructed de novo the transcriptional landscape of wild type Arabidopsis thaliana seedlings as a proof-of-principle. A comparison to the existing transcriptome annotations revealed that our gene model is more accurate and comprehensive than the two most commonly used community gene models, TAIR10 and Araport11. In particular, we identify thousands of transient transcripts missing from the existing annotations. Our new annotation promises to improve the quality of A.thaliana genome research. Conclusions Our proof-of-concept data suggest a cost-efficient strategy for rapid and accurate annotation of complex eukaryotic transcriptomes. We combine the choice of library preparation methods and sequencing platforms with the dedicated computational pipeline implemented in the TranscriptomeReconstructoR package. The pipeline only requires prior knowledge on the reference genomic DNA sequence, but not the transcriptome. The package seamlessly integrates with Bioconductor packages for downstream analysis.
21
Citation1
0
Save
0

Native Elongation Transcript sequencing reveals temperature dependent dynamics of nascent RNAPII transcription in Arabidopsis

Peter Kindgren et al.Nov 8, 2019
Temperature profoundly affects the kinetics of biochemical reactions, yet how large molecular complexes such as the transcription machinery accommodate changing temperatures to maintain cellular function is poorly understood. Here, we developed plant native elongating transcripts sequencing (plaNET-seq) to profile genome-wide nascent RNA polymerase II (RNAPII) transcription during the cold-response of Arabidopsis thaliana with single-nucleotide resolution. Combined with temporal resolution, these data revealed transient genome-wide reprogramming of nascent RNAPII transcription during cold, including characteristics of RNAPII elongation and thousands of non-coding transcripts connected to gene expression. Our results suggest a role for promoter-proximal RNAPII stalling in predisposing genes for transcriptional activation during plant-environment interactions. At gene 3'-ends, cold initially facilitated transcriptional termination by limiting the distance of read-through transcription. Within gene bodies, cold reduced the kinetics of co-transcriptional splicing leading to increased intragenic stalling. Our data resolved multiple distinct mechanisms by which temperature transiently altered the dynamics of nascent RNAPII transcription and associated RNA processing, illustrating potential biotechnological solutions and future focus areas to promote food security in the context of a changing climate.
0

A data‐driven genome annotation approach for cassava

Chenna Swetha et al.Jun 3, 2024
Genome annotation files play a critical role in dictating the quality of downstream analyses by providing essential predictions for gene positions and structures. These files are pivotal in decoding the complex information encoded within DNA sequences. Here, we generated experimental data resolving RNA 5'- and 3'-ends as well as full-length RNAs for cassava TME12 sticklings in ambient temperature and cold. We used these data to generate genome annotation files using the TranscriptomeReconstructoR (TR) tool. A careful comparison to high-quality genome annotations suggests that our new TR genome annotations identified additional genes, resolved the transcript boundaries more accurately and identified additional RNA isoforms. We enhanced existing cassava genome annotation files with the information from TR that maintained the different transcript models as RNA isoforms. The resultant merged annotation was subsequently utilized for comprehensive analysis. To examine the effects of genome annotation files on gene expression studies, we compared the detection of differentially expressed genes during cold using the same RNA-seq data but alternative genome annotation files. We found that our merged genome annotation that included cold-specific TR gene models identified about twice as many cold-induced genes. These data indicate that environmentally induced genes may be missing in off-the-shelf genome annotation files. In conclusion, TR offers the opportunity to enhance crop genome annotations with implications for the discovery of differentially expressed candidate genes during plant-environment interactions.
0

Transcriptional read-through of the long non-coding RNA SVALKA governs plant cold acclimation

Peter Kindgren et al.Mar 23, 2018
Most DNA in the genomes of higher organisms does not encode proteins, but is transcribed by RNA polymerase II (RNAPII) into long non-coding RNA (lncRNA). The biological significance of most lncRNA is largely unclear. Here, we identify a lncRNA (SVALKA) in a cold-sensitive region of the Arabidopsis genome. Mutations in SVALKA affect the timing of maximal CBF1 expression and freezing tolerance. RNAPII read-through transcription of SVALKA results in a cryptic lncRNA overlapping CBF1 on the antisense strand, termed asCBF1. asCBF1 transcription is anti-correlated with CBF1 expression. Our molecular dissection reveals that CBF1 is suppressed by RNAPII collision stemming from the SVALKA-asCBF1 lncRNA cascade. The SVK-asCBF1 cascade provides a mechanism to tightly control CBF1 expression and timing that could be exploited to maximize freezing tolerance with mitigated fitness costs. Inversion of the transcriptional direction of a lncRNA cascade relative to the genes in a co-regulated cluster provides an elegant inbuilt negative feedback for cluster expression. Our results provide a compelling example of local gene regulation by lncRNA transcription having a profound impact on the ability of plants to appropriately acclimate to suboptimal environmental conditions.
0

Characterization of Arabidopsis thaliana promoter bidirectionality and antisense RNAs by depletion of nuclear RNA decay enzymes

Axel Thieffry et al.Oct 17, 2019
In animals, transcription by RNA polymerase II initiates bidirectionally from gene promoters to produce pre-mRNAs on the forward strand and promoter upstream transcripts (PROMPTs) on the reverse strand. PROMPTs are rapidly degraded by the nuclear exosome. Similarly, active enhancer regions in animals initiate transcription of exosome-sensitive enhancer RNAs (eRNAs). Previous studies based on nascent RNA approaches concluded that Arabidopsis thaliana does not produce PROMPTs. Here, we used steady-state RNA sequencing methods in mutants defective in nuclear RNA decay, including by the exosome, to reassess the existence of PROMPTs and eRNAs in A. thaliana . While PROMPTs are overall rare in A. thaliana , about 100 clear cases of exosome-sensitive PROMPTs and 113 loci producing eRNA-like transcripts were identified. In addition, we found ∼200 transcription start sites within 3’-UTR-encoding regions that produce unspliced exosome-sensitive antisense RNAs covering much of the cognate pre-mRNA. A typical representative of this class of RNAs is the previously characterized non-coding RNA controlling the expression of the key seed dormancy regulator, DELAY OF GERMINATION1 . Exosome-sensitive antisense RNAs are overrepresented in transcription factor genes, suggesting a potential for widespread control of gene expression. Lastly, we assess the use of alternative promoters in A. thaliana and compare the accuracy of existing TSS annotations.