AT
Alexandre Thiéry
Author with expertise in Role of Long Noncoding RNAs in Cancer and Development
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(60% Open Access)
Cited by:
416
h-index:
24
/
i10-index:
45
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
47

Detection of m6A from direct RNA sequencing using a Multiple Instance Learning framework

Christopher Hendra et al.Sep 22, 2021
Abstract RNA modifications such as m6A methylation form an additional layer of complexity in the transcriptome. Nanopore direct RNA sequencing captures this information in the raw current signal for each RNA molecule, enabling the detection of RNA modifications using supervised machine learning. However, experimental approaches provide only site-level training data, whereas the modification status for each single RNA molecule is missing. Here we present m6Anet, a neural network-based method that leverages the Multiple Instance Learning framework to specifically handle missing read-level modification labels in site-level training data. m6Anet outperforms existing computational methods, shows similar accuracy as experimental approaches, and generalises to different cell lines with almost identical accuracy. We demonstrate that m6Anet captures the underlying read-level stoichiometry that can be used to approximate differences in modification rates. m6Anet achieves this without retraining model parameters, enabling the transcriptome-wide identification and quantification of m6A from a single run of direct RNA sequencing. Code Availability The source code for m6Anet is available at https://github.com/GoekeLab/m6anet . Installation instructions and online documentation is available at https://m6anet.readthedocs.io/en/latest/ .
47
Citation15
0
Save
0

Detection of differential RNA modifications from direct RNA sequencing of human cell lines

Naruemon Pratanwanich et al.Jun 20, 2020
Abstract Differences in RNA expression can provide insights into the molecular identity of a cell, pathways involved in human diseases, and variation in RNA levels across patients associated with clinical phenotypes. RNA modifications such as m6A have been found to contribute to molecular functions of RNAs. However, quantification of differences in RNA modifications has been challenging. Here we develop a computational method (xPore) to identify differential RNA modifications from direct RNA sequencing data. We evaluate our method on transcriptome-wide m6A profiling data, demonstrating that xPore identifies positions of m6A sites at single base resolution, estimates the fraction of modified RNAs in the cell, and quantifies the differential modification rate across conditions. We apply the method to direct RNA-Sequencing data from 6 cell lines and find that many m6A sites are preserved, while a subset of m6A sites show significant differences in their modification rates across cell types. Together, we show that RNA modifications can be identified from direct RNA-sequencing with high accuracy, enabling the analysis of differential modifications and expression from a single high throughput experiment. Availability xPore is available as open source software ( https://github.com/GoekeLab/xpore )
0
Citation13
0
Save
147

A systematic benchmark of Nanopore long read RNA sequencing for transcript level analysis in human cell lines

Ying Chen et al.Apr 22, 2021
Abstract The human genome contains more than 200,000 gene isoforms. However, different isoforms can be highly similar, and with an average length of 1.5kb remain difficult to study with short read sequencing. To systematically evaluate the ability to study the transcriptome at a resolution of individual isoforms we profiled 5 human cell lines with short read cDNA sequencing and Nanopore long read direct RNA, amplification-free direct cDNA, PCR-cDNA sequencing. The long read protocols showed a high level of consistency, with amplification-free RNA and cDNA sequencing being most similar. While short and long reads generated comparable gene expression estimates, they differed substantially for individual isoforms. We find that increased read length improves read-to-transcript assignment, identifies interactions between alternative promoters and splicing, enables the discovery of novel transcripts from repetitive regions, facilitates the quantification of full-length fusion isoforms and enables the simultaneous profiling of m6A RNA modifications when RNA is sequenced directly. Our study demonstrates the advantage of long read RNA sequencing and provides a comprehensive resource that will enable the development and benchmarking of computational methods for profiling complex transcriptional events at isoform-level resolution.
0

NanoVar: Accurate Characterization of Patients' Genomic Structural Variants Using Low-Depth Nanopore Sequencing

Cheng Tham et al.Jun 17, 2019
Despite the increasing relevance of structural variants (SV) in the development of many human diseases, progress in novel pathological SV discovery remains impeded, partly due to the challenges of accurate and routine SV characterization in patients. The recent advent of third-generation sequencing (3GS) technologies brings promise for better characterization of genomic aberrations by virtue of having longer reads. However, the applications of 3GS are restricted by their high sequencing error rates and low sequencing throughput. To overcome these limitations, we present NanoVar, an accurate, rapid and low-depth (4X) 3GS SV caller utilizing long-reads generated by Oxford Nanopore Technologies. NanoVar employs split-reads and hard-clipped reads for SV detection and utilizes a neural network classifier for true SV enrichment. In simulated data, NanoVar demonstrated the highest SV detection accuracy (F1 score = 0.91) amongst other long-read SV callers using 12 gigabases (4X) of sequencing data. In patient samples, besides the detection of genomic aberrations, NanoVar also uncovered many normal alternative sequences or alleles which were present in healthy individuals. The low sequencing depth requirements of NanoVar enable the use of Nanopore sequencing for accurate SV characterization at a lower sequencing cost, an approach compatible with clinical studies and large-scale SV-association research.