TP
Tim Pooter
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
1,443
h-index:
18
/
i10-index:
25
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Null mutations in progranulin cause ubiquitin-positive frontotemporal dementia linked to chromosome 17q21

Marc Cruts et al.Jul 16, 2006
+19
S
P
M
0
Citation1,429
0
Save
0

Accurate characterization of expanded tandem repeat length and sequence through whole genome long-read sequencing on PromethION

Arne Roeck et al.Oct 9, 2018
+8
L
W
A
Abstract Tandem repeats (TRs) can cause disease through their length, sequence motif interruptions, and nucleotide modifications. For many TRs, however, these features are very difficult - if not impossible - to assess, requiring low-throughput and labor-intensive assays. One example is a VNTR in ABCA7 for which we recently discovered that expanded alleles strongly increase risk of Alzheimer’s disease. Here, we investigated the potential of long-read whole genome sequencing to surmount these challenges, using the high-throughput PromethION platform from Oxford Nanopore Technologies. To overcome the limitations of conventional base calling and alignment, we developed an algorithm to study the TR size and sequence directly on raw PromethION current data. We report the long-read sequencing of multiple human genomes (n = 11) using only a single sequencing run and flow cell per individual. With the use of fresh DNA extractions, DNA shearing to approximately 20kb and size selection, we obtained an average output of 70 gigabases (Gb) per flow cell, corresponding to a 21x genome coverage, and a maximum yield of 98 Gb (30x genome coverage). All ABCA7 VNTR alleles, including expansions up to 10,000 bases, were spanned by long sequencing reads, validated by Southern blotting. Classical approaches of TR length estimation suffered from low accuracy, low precision, DNA strand effects and/or inability to call pathogenic repeat expansions. In contrast, our novel NanoSatellite algorithm, which circumvents base calling by using dynamic time warping on raw PromethION current data, achieved more than 90% accuracy and high precision (5.6% relative standard deviation) of TR length estimation, and detected all clinically relevant repeat expansions. In addition, we identified alternative TR sequence motifs with high consistency, allowing determination of TR sequence and distinction of VNTR alleles with homozygous length. In conclusion, we validated the robustness of single-experiment whole genome long-read sequencing on PromethION, a prerequisite for application of long-read sequencing in the clinic. In addition, we outperformed Southern blotting, enabling improved characterization of the role of expanded ABCA7 VNTR alleles in Alzheimer’s disease, and opening new opportunities for TR research.
0
Citation9
0
Save
14

What are the reference strains of Acinetobacter baumannii referring to?

Chantal Philippe et al.Feb 27, 2022
+9
C
A
C
Abstract We assembled the whole genome sequence (WGS) of a collection of 43 non-redundant modern clinical isolates and four broadly used reference strains of Acinetobacter baumannii . Comparison of these isolates and their WGS confirmed the high heterogeneity in capsule loci, sequence types, the presence of virulence and antibiotic resistance genes. However, a significant portion of clinical isolates strongly differ when compared to several reference strains in the light of colony morphology, cellular density, capsule production, natural transformability and in vivo virulence. These genetic and phenotypic differences between current circulating strains of A. baumannii and established reference strains could hamper the study of A. baumannii as an entity. The broadly used reference strains led to the current state of the art of the A. baumannii field, however, we propose that established reference strains in the A. baumannii field should be carefully used, because of the high genetic and phenotypic heterogeneities. In this study, we generated a collection of high-quality nucleotide sequences of 43 modern clinical isolates with the corresponding multi-level phenotypic characterizations. Beside the contribution of novel fundamental observations generated in this study, the phenotypic and genetic data, along with the bacterial strains themselves, will be further accessible using the first open access online platform called “Acinetobase”. Therefore, a rational choice of modern strains will be possible to select the ones that suit the needs of specific biological questions.
14
Citation3
0
Save
0

The European Reference Genome Atlas: piloting a decentralised approach to equitable biodiversity genomics

Ann Cartney et al.Sep 17, 2024
+93
A
G
A
A genomic database of all Earth's eukaryotic species could contribute to many scientific discoveries; however, only a tiny fraction of species have genomic information available. In 2018, scientists across the world united under the Earth BioGenome Project (EBP), aiming to produce a database of high-quality reference genomes containing all ~1.5 million recognized eukaryotic species. As the European node of the EBP, the European Reference Genome Atlas (ERGA) sought to implement a new decentralised, equitable and inclusive model for producing reference genomes. For this, ERGA launched a Pilot Project establishing the first distributed reference genome production infrastructure and testing it on 98 eukaryotic species from 33 European countries. Here we outline the infrastructure and explore its effectiveness for scaling high-quality reference genome production, whilst considering equity and inclusion. The outcomes and lessons learned provide a solid foundation for ERGA while offering key learnings to other transnational, national genomic resource projects and the EBP.
0
Citation1
0
Save
0

Scywalker: scalable end-to-end data analysis workflow for nanopore single-cell transcriptome sequencing

Peter Rijk et al.Feb 24, 2024
+17
J
F
P
Abstract We introduce scywalker , an innovative and scalable package developed to comprehensively analyze long-read nanopore sequencing data of full-length single-cell or single-nuclei cDNA. Existing nanopore single-cell data analysis tools showed severe limitations in handling current data sizes. We developed novel scalable methods for cell barcode demultiplexing and single-cell isoform calling and quantification and incorporated these in an easily deployable package. Scywalker streamlines the entire analysis process, from sequenced fragments in FASTQ format to demultiplexed pseudobulk isoform counts, into a single command suitable for execution on either server or cluster. Scywalker includes data quality control, cell type identification, and an interactive report. Assessment of datasets from the human brain, Arabidopsis leaves, and previously benchmarked data from mixed cell lines, demonstrate excellent correlation with short-read analyses at both the cell-barcoding and gene quantification levels. At the isoform level, we show that scywalker facilitates the direct identification of cell-type-specific expression of novel isoforms.
0
Citation1
0
Save
6

Methylmap: visualization of modified nucleotides for large cohort sizes

Elise Coopman et al.Nov 30, 2022
+5
T
M
E
Summary Methylmap is a tool developed for visualization of modified nucleotide frequencies per position, especially for large numbers of samples. Various input possibilities are supported, including the standardized BAM/CRAM files containing MM and ML tags. Availability and implementation Methylmap is written in Python3 and available through PyPI and bioconda. The source code is released under MIT license and can be found at https://github.com/EliseCoopman/methylmap .