AP
Andrew Page
Author with expertise in RNA Sequencing Data Analysis
Quadram Institute, Norwich Research Park, University of East Anglia
+ 7 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
17
(65% Open Access)
Cited by:
23
h-index:
25
/
i10-index:
39
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

AlbaTraDIS: Comparative analysis of large datasets from parallel transposon mutagenesis experiments

Andrew Page et al.May 7, 2020
+5
M
S
A
Abstract Background Bacteria have evolved over billions of years to survive in a wide range of environments. Currently, there is an incomplete understanding of the genetic basis for mechanisms underpinning survival in stressful conditions, such as the presence of anti-microbials. Transposon mutagenesis has been proven to be a powerful tool to identify genes and networks which are involved in survival and fitness under a given condition by simultaneously assaying the fitness of millions of mutants, thereby relating genotype to phenotype and contributing to an understanding of bacterial cell biology. A recent refinement of this approach allows the roles of essential genes in conditional stress survival to be inferred by altering their expression. These advancements combined with the rapidly falling costs of sequencing now allows comparisons between multiple experiments to identify commonalities in stress responses to different conditions. This capacity however poses a new challenge for analysis of multiple data sets in conjunction. Results To address this analysis need, we have developed ‘AlbaTraDIS’; a software application for rapid large-scale comparative analysis of TraDIS experiments that predicts the impact of transposon insertions on nearby genes. AlbaTraDIS can identify genes which are up or down regulated, or inactivated, between multiple conditions, producing a filtered list of genes for further experimental validation as well as several accompanying data visualisations. We demonstrate the utility of our new approach by applying it to identify genes used by Escherichia coli to survive in a wide range of different concentrations of the biocide Triclosan. AlbaTraDIS automatically identified all well characterised Triclosan resistance genes, including the primary target, fabI . A number of new loci were also implicated in Triclosan resistance and the predicted phenotypes for a selection of these were validated experimentally and results showed high consistency with predictions. Conclusions AlbaTraDIS provides a simple and rapid method to analyse multiple transposon mutagenesis data sets allowing this technology to be used at large scale. To our knowledge this is the only tool currently available that can perform these tasks. AlbaTraDIS is written in Python 3 and is available under the open source licence GNU GPL 3 from https://github.com/quadram-institute-bioscience/albatradis .
0

Socru: Typing of genome level order and orientation in bacteria

Andrew Page et al.May 7, 2020
G
A
Abstract Summary Genome rearrangements occur in bacteria between repeat sequences and impact growth and gene expression. Homologous recombination can occur between ribosomal operons, which are found in multiple copies in many bacteria. Inversion between indirect repeats and excision/translocation between direct repeats enable structural genome rearrangement. To identify what these rearrangements are by sequencing, reads of several thousand bases are required to span the ribosomal operons. With long read sequencing aiding the routine generation of complete bacterial assemblies, we have developed socru , a typing method for the order and orientation of genome fragments between ribosomal operons, defined against species-specific baselines. It allows for a single identifier to convey the order and orientation of genome level structure and 434 of the most common bacterial species are supported. Additionally, socru can be used to identify large scale misassemblies. Availability and implementation Socru is written in Python 3, runs on Linux and OSX systems and is available under the open source license GNU GPL 3 from https://github.com/quadram-institute-bioscience/socru . Contact gemma.langridge@quadram.ac.uk
0
Paper
Citation6
0
Save
1

Genomic Surveillance of SARS CoV2 in COVID-19 vaccinated healthcare workers in Lebanon

Habib Kalamouni et al.Oct 24, 2023
+10
M
F
H
Abstract The emergence of SARS-CoV-2 variants including the Delta and Omicron along with waning of vaccine-induced immunity over time contributed to increased rates of breakthrough infection specifically among healthcare workers (HCWs). SARS-CoV-2 genomic surveillance is an important tool for timely detection and characterization of circulating variants as well as monitoring the emergence of new strains. Our study is the first national SARS-CoV-2 genomic surveillance among HCWs in Lebanon. We collected 250 samples from five hospitals across Lebanon between December 2021 and January 2022. We extracted viral RNA and performed whole genome sequencing using the Illumina NextSeq 500 platform. A total of 133 (57.1%) samples belonging to the Omicron (BA.1.1) sub-lineage were identified, as well as 44 (18.9%) samples belonging to the BA.1 sub-lineage, 28 (12%) belonging to the BA.2 sub-lineage, and only 15 (6.6%) samples belonging to the Delta variant sub-lineage B.1.617.2. These results show that Lebanon followed the global trend in terms of circulating SARS-CoV-2 variants with Delta rapidly replaced by the Omicron variant. This study underscores the importance of continuous genomic surveillance programs in Lebanon for the timely detection and characterization of circulating variants. The latter is critical to guide public health policy making and to timely implement public health interventions.
28

Rapid Mycobacterium tuberculosis spoligotyping from uncorrected long reads using Galru

Andrew Page et al.Oct 24, 2023
+2
M
N
A
Abstract Spoligotyping of Mycobacterium tuberculosis provides a subspecies classification of this major human pathogen. Spoligotypes can be predicted from short read genome sequencing data; however, no methods exist for long read sequence data such as from Nanopore or PacBio. We present a novel software package Galru, which can rapidly detect the spoligotype of a Mycobacterium tuberculosis sample from as little as a single uncorrected long read. It allows for near real-time spoligotyping from long read data as it is being sequenced, giving rapid sample typing. We compare it to the existing state of the art software and find it performs identically to the results obtained from short read sequencing data. Galru is freely available from https://github.com/quadram-institute-bioscience/galru under the GPLv3 open source licence.
32

Linking carbohydrate structure with function in the human gut microbiome using hybrid metagenome assemblies

Anuradha Ravi et al.Oct 24, 2023
+11
J
P
A
Abstract Background Complex carbohydrates that escape digestion in the small intestine, are broken down in the large intestine by enzymes encoded by the gut microbiome. This is a symbiotic relationship between particular microbes and the host, resulting in metabolic products that influence host gut health and are exploited by other microbes. However, the role of carbohydrate structure in directing microbiota community composition and the succession of carbohydrate-degrading microbes is not fully understood. Here we take the approach of combining data from long and short read sequencing allowing recovery of large numbers of high quality genomes, from which we can predict carbohydrate degrading functions, and impact of carbohydrate on microbial communities. Results In this study we evaluate species-level compositional variation within a single microbiome in response to six structurally distinct carbohydrates in a controlled model gut using hybrid metagenome assemblies. We identified 509 high-quality metagenome-assembled genomes (MAGs) belonging to ten bacterial classes and 28 bacterial families. We found dynamic variations in the microbiome amongst carbohydrate treatments, and over time. Using these data, the MAGs were characterised as primary (0h to 6h) and secondary degraders (12h to 24h). Annotating the MAG’s with the Carbohydrate Active Enzyme (CAZyme) database we are able to identify species which are enriched through time and have the potential to actively degrade carbohydrate substrates. Conclusions Recent advances in sequencing technology allowed us to identify significant unexplored diversity amongst starch degrading species in the human gut microbiota including CAZyme profiles and complete MAGs. We have identified changes in microbial community composition in response to structurally distinct carbohydrate substrates, which can be directly related to the CAZyme complement of the enriched MAG’s. Through this approach, we have identified a number of species which have not previously been implicated in starch degradation, but which have the potential to play an important role.
32
Citation2
0
Save
32

Tatajuba ― Exploring the distribution of homopolymer tracts

Leonardo Martins et al.Oct 24, 2023
+3
E
S
L
Abstract Length variation of homopolymeric tracts, which induces phase variation, is known to regulate gene expression leading to phenotypic variation in a wide range of bacterial species. There is no specialised bioinformatics software which can, at scale, exhaustively explore and describe these features from sequencing data. Identifying these is non-trivial as sequencing and bioinformatics methods are prone to introducing artefacts when presented with homopolymeric tracts due to the decreased base diversity. We present tatajuba, which can automatically identify potential homopolymeric tracts and their putative phenotypic impact, allowing for rapid investigation. We use it to detect all tracts in two separate datasets, one of Campylobacter jejuni and one of three Bordetella species, and to highlight those tracts that are polymorphic across samples. With this we confirm homopolymer tract variation with phenotypic impact found in previous studies and additionally find many more with potential variability. The software is written in C and is available under the open source license GNU GPL version 3 from https://github.com/quadram-institute-bioscience/tatajuba .
32
Paper
Citation2
0
Save
23

LoRTIS Software Suite: Transposon mutant analysis using long-read sequencing

Martin Lott et al.Oct 24, 2023
+4
A
M
M
Abstract To date transposon insertion sequencing (TIS) methodologies have used short-read nucleotide sequencing technology. However, short-read sequences are unlikely to be matched correctly within repeated genomic regions which are longer than the sequence read. This drawback may be overcome using long-read sequencing technology. We have developed a suite of new analysis tools, the “LoRTIS software suite” (LoRTIS-SS), that produce transposon insertion site mapping data for a reference genome using long-read nucleotide sequence data. Long-read nucleotide sequence data can be applied to TIS, this enables the unique mapping of transposon insertion sites within long genomic repeated sequences. Here we present long-read TIS analysis software, LoRTIS-SS, which uses the Snakemake framework to manage the workflow. A docker image is provided, complete with dependencies and ten scripts are included for experiment specific data processing before or after use of the main workflow. The workflow uses long-read nucleotide sequence data such as those generated by the MinION sequencer (Oxford Nanopore Technologies). The unique mapping properties of long-read sequence data were exemplified by reference to the ribosomal RNA genes of Escherichia coli strain BW25113, of which there are 7 copies of ∼4.9 kbases in length that are at least 99% similar. Of reads that matched within rRNA genes, approximately half matched uniquely. The software workflow outputs data compatible with the established Bio-TraDIS analysis toolkit allowing for existing workflows to be easily upgraded to support long-read sequencing.
0

Rapid multi-locus sequence typing direct from uncorrected long reads using Krocus

Andrew Page et al.May 6, 2020
J
A
Genome sequencing is rapidly being adopted in reference labs and hospitals for bacterial outbreak investigation and diagnostics where time is critical. Seven gene multi-locus sequence typing is a standard tool for broadly classifying samples into sequence types, allowing, in many cases, to rule a sample in or out of an outbreak, or allowing for general characteristics about a bacterial strain to be inferred. Long read sequencing technologies, such as from PacBio or Oxford Nanopore, can produce read data within minutes of an experiment starting, unlike short read sequencing technologies which require many hours/days. However, the error rates of raw uncorrected long read data are very high. We present Krocus which can predict a sequence type directly from uncorrected long reads, and which was designed to consume read data as it is produced, providing results in minutes. It is the only tool which can do this from uncorrected long reads. We tested Krocus on over 600 samples sequenced with using long read sequencing technologies from PacBio and Oxford Nanopore. It provides sequence types on average within 90 seconds, with a sensitivity of 94% and specificity of 97%, directly from uncorrected raw sequence reads. The software is written in Python and is available under the open source license GNU GPL version 3.
1

Characterisation of neonatalStaphylococcus capitisNRCS-A isolates compared with non NRCS-AStaphylococcus capitisfrom neonates and adults

Heather Felgate et al.Oct 24, 2023
+11
K
D
H
Abstract Staphylococcus capitis is a frequent cause of Late-Onset Sepsis (LOS) in neonates admitted to Neonatal Intensive Care Units (NICU). The NRCS-A clone of S. capitis has been isolated from NICUs globally although the reasons for the global success of this clone are not understood. We analysed a collection of S. capitis colonising babies admitted to two NICUs, one in the UK and one in Germany as well as corresponding pathological clinical isolates. Genome analysis identified 3 groups; non-NRCS-A isolates, NRCS-A isolates, and a group of ‘proto NRCS-A’ - isolates closely related to NRCS-A but not associated with neonatal infection. All bloodstream isolates belonged to the NRCS-A group and were indistinguishable from strains carried on the skin or in the gut. NRCS-A isolates showed increased tolerance to chlorhexidine and antibiotics relative to the other S. capitis as well as enhanced ability to grow at higher pH values. Analysis of 138 pangenomes of the clades identified characteristic nsr and tarJ genes in the NRCS-A and proto groups with a CRISPR-cas system only seen in NRCS-A isolates which also showed enrichment of genes for metal acquisition and transport. We found evidence for transmission of S. capitis NRCS-A within NICU, with related isolates shared between babies and multiple acquisitions by some babies. Our data show NRCS-A strains commonly colonise uninfected babies in NICU representing a potential reservoir for potential infection. This work provides more evidence that adaptation to survive in the gut and on skin facilitates spread of NRCS-A, and that metal acquisition and tolerance may be important to the biology of NRCS-A. Understanding how NRCS-A survives in NICUs can help develop infection control procedures against this clone.
0

ARIBA: rapid antimicrobial resistance genotyping directly from sequencing reads

Martin Hunt et al.May 6, 2020
+4
L
A
M
Antimicrobial resistance (AMR) is one of the major threats to human and animal health worldwide, yet few high-throughput tools exist to analyse and predict the resistance of a bacterial isolate from sequencing data. Here we present a new tool, ARIBA, that identifies AMR-associated genes and single nucleotide polymorphisms directly from short reads, and generates detailed and customisable output. The accuracy and advantages of ARIBA over other tools are demonstrated on three datasets from Gram-positive and Gram-negative bacteria, with ARIBA outperforming existing methods. ARIBA is available at https://github.com/sanger-pathogens/ariba.
Load More