CF
Colette Felton
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
4
(100% Open Access)
Cited by:
11
h-index:
2
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
27

Detection of alternative isoforms of gene fusions from long-read RNA-seq with FLAIR-fusion

Colette Felton et al.Aug 3, 2022
Abstract Gene fusions are important cancer drivers and drug targets, but are difficult to reliably identify with short-read RNA-sequencing. Long-read RNA sequencing data are more likely to span a fusion breakpoint and provide more sequence context around the breakpoint. This allows for more reliable identification of gene fusions and for detecting alternative splicing in gene fusions. Notably, alternative splicing of fusions has been shown to be a mechanism for drug resistance and altered levels of oncogenicity. Here, we present FLAIR-fusion, a computational tool to identify gene fusions and their isoforms from long-read RNA-sequencing data. FLAIR-fusion can detect fusions and their isoforms with high precision and recall, even with error-prone reads. We also investigated different library preparation methods and found that direct-cDNA has a higher incidence of artifactual chimeras than direct-RNA and PCR-cDNA methods. FLAIR-fusion is able to filter these technical artifacts from all of these library prep methods and consistently identify known fusions and their isoforms across cell lines. We ran FLAIR-fusion on amplicon sequencing from multiple tumor samples and cell lines and detected alternative splicing in the previously validated fusion GUCYA2-PIWIL4, which shows that long-read sequencing can detect novel splicing events from cancer gene panels. We also detect fusion isoforms from long-read sequencing in chronic lymphocytic leukemias with the splicing factor mutation SF3B1 K700E , and find that up to 10% of gene fusions had more than one unique isoform. We also compared long-read fusion detection tools with short-read fusion detection tools on the same samples and found greater consensus in the long-read tools. Our results demonstrate that gene fusion isoforms can be effectively detected from long-read RNA-sequencing and are important in the characterization of the full complexity of cancer transcriptomes.
27
Citation1
0
Save
93

Systematic assessment of long-read RNA-seq methods for transcript identification and quantification

Francisco Pardo-Palacios et al.Jul 27, 2023
Abstract The Long-read RNA-Seq Genome Annotation Assessment Project (LRGASP) Consortium was formed to evaluate the effectiveness of long-read approaches for transcriptome analysis. The consortium generated over 427 million long-read sequences from cDNA and direct RNA datasets, encompassing human, mouse, and manatee species, using different protocols and sequencing platforms. These data were utilized by developers to address challenges in transcript isoform detection and quantification, as well as de novo transcript isoform identification. The study revealed that libraries with longer, more accurate sequences produce more accurate transcripts than those with increased read depth, whereas greater read depth improved quantification accuracy. In well-annotated genomes, tools based on reference sequences demonstrated the best performance. When aiming to detect rare and novel transcripts or when using reference-free approaches, incorporating additional orthogonal data and replicate samples are advised. This collaborative study offers a benchmark for current practices and provides direction for future method development in transcriptome analysis.
0

Probing chromatin accessibility with small molecule DNA intercalation and nanopore sequencing

Gali Bai et al.Mar 22, 2024
ABSTRACT Genome-wide identification of chromatin organization and structure has been generally probed by measuring accessibility of the underlying DNA to nucleases or methyltransferases. These methods either only observe the positioning of a single nucleosome or rely on large enzymes to modify or cleave the DNA. We developed adduct sequencing (Add-seq), a method to probe chromatin accessibility by treating chromatin with the small molecule angelicin, which preferentially intercalates into DNA not bound to core nucleosomes. We show that Nanopore sequencing of the angelicin-modified DNA is possible and allows visualization and analysis of long single molecules with distinct chromatin structure. The angelicin modification can be detected from the Nanopore current signal data using a neural network model trained on unmodified and modified chromatin-free DNA. Applying Add-seq to Saccharomyces cerevisiae nuclei, we identified expected patterns of accessibility around annotated gene loci in yeast. We also identify individual clusters of single molecule reads displaying different chromatin structure at specific yeast loci, which demonstrates heterogeneity in the chromatin structure of the yeast population. Thus, using Add-seq, we are able to profile DNA accessibility in the yeast genome across long molecules. GRAPHICAL ABSTRACT