CC
Catherine Carrillo
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
1
h-index:
23
/
i10-index:
43
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

An Optimized Pipeline for Detection of Salmonella Sequences in Shotgun Metagenomics Datasets

Lauren Bradford et al.Jul 30, 2023
Abstract Background Culture-independent diagnostic tests (CIDTs) are gaining popularity as tools for detecting pathogens in food. Shotgun sequencing holds substantial promise for food testing as it provides abundant information on microbial communities, but the challenge is in analyzing large and complex sequencing datasets with a high degree of both sensitivity and specificity. Falsely classifying sequencing reads as originating from pathogens can lead to unnecessary food recalls or production shutdowns, while low sensitivity resulting in false negatives could lead to preventable illness. Results We have developed a bioinformatic pipeline for identifying Salmonella as a model pathogen in metagenomic datasets with very high sensitivity and specificity. We tested this pipeline on mock communities of closely related bacteria and with simulated Salmonella reads added to published metagenomic datasets. Salmonella -derived reads could be found at very low abundances (high sensitivity) without false positives (high specificity). Carefully considering software parameters and database choices is essential to avoiding false positive sample calls. With well-chosen parameters plus additional steps to confirm the taxonomic origin of reads, it is possible to detect pathogens with very high specificity and sensitivity.
1
Citation1
0
Save
0

Development of a multi-locus typing scheme for an Enterobacteriaceae linear plasmid that mediates inter-species transfer of flagella

James Robertson et al.Jun 7, 2019
Due to the public health importance of flagellar genes for typing, it is important to understand mechanisms that could alter their expression or presence. Phenotypic novelty in flagellar genes arise predominately through accumulation of mutations but horizontal transfer is known to occur. A linear plasmid termed pBSSB1 previously identified in Salmonella Typhi, was found to encode a flagellar operon that can mediate phase variation, which results in the rare z66 flagella phenotype. The identification and tracking of homologs of pBSSB1 is limited because it falls outside the normal replicon typing schemes for plasmids. Here we report the generation of nine new pBSSB1-family sequences using Illumina and Nanopore sequence data. Homologs of pBSSB1 were identified in 154 genomes representing 25 distinct serotypes from 67,758 Salmonella public genomes. Pangenome analysis of pBSSB1-family contigs was performed using Roary and we identified three core genes amenable to a minimal MLST scheme. Population structure analysis based on the newly developed MLST scheme identified three major lineages representing 35 sequence types, and the distribution of these sequence types was found to span multiple serovars across the globe. This MLST scheme has shown utility in tracking and subtyping pBSSB1-family plasmids and it has been incorporated into the plasmid MLST database under the name “pBSSB1-family”.
0

Limit of detection ofSalmonellaser. Enteritidis using culture-based versus culture-independent diagnostic approaches

Lauren Bradford et al.Feb 7, 2024
ABSTRACT In order to prevent the spread of foodborne illnesses, the presence of pathogens in the food chain is monitored by government agencies and food producers. The culture-based methods currently employed are sensitive but time-and labour-intensive, leading to increasing interest in exploring culture-independent diagnostic tests (CIDTs) for pathogen detection. However, sensitivity and reliability of these CIDTs relative to current approaches has not been well established. To address this issue, we conducted a comparison of the limit of detection (LOD 50 ) for Salmonella between a culture-based method and three CIDT methods: qPCR (targeting invA and stn ), metabarcode (16S) sequencing, and shotgun metagenomic sequencing. Samples of chicken feed and chicken caecal contents were spiked with Salmonella serovar Enteritidis and subjected to culture-and DNA-based detection methods. To explore the impact of non-selective enrichment on LOD 50 , all samples underwent both immediate DNA extraction and an overnight enrichment prior to gDNA extraction. In addition to this spike-in experiment, feed and caecal samples acquired from the field were tested with culturing, qPCR, and metabarcoding. In general, LOD 50 was comparable between qPCR and shotgun sequencing methods. Overnight microbiological enrichment resulted in an improvement in LOD 50 with up to a three log decrease, comparable to culture-based detection. However, Salmonella reads were detected in some unspiked feed samples, suggesting false-positive detection of Salmonella . Additionally, the LOD 50 in feeds was three logs lower than in caecal contents, underscoring the impact of background microbiota on Salmonella detection using all methods. IMPORTANCE The appeal of CIDTs is increased speed with lowered cost, as well as the potential to detect multiple pathogen species in a single analysis and to monitor other areas of concern such as antimicrobial resistance genes or virulence factors. Understanding the sensitivity of CIDTs relative to current approaches will help determine the feasibility of implementing these methods in pathogen surveillance programs.
1

Genetic characterization of extended-β-lactamase (ESBL) plasmids captured from dairy manures

Tam Tran et al.Mar 20, 2023
ABSTRACT This study was to assess the gene diversity and characterize a large set of plasmids harboring extended β-lactamase (ESBL) genes from raw and digested dairy manure. A total of eighty-four plasmids that were captured in this E. coli recipient were sequenced using Illumina MiSeq sequencing technology. Twenty-four plasmids of interest were subsequently sequenced using MinION technology in order that a hybrid assembly could be performed on short-and long-read sequences to circularize and complete these plasmids. The size of sequenced plasmids ranged between 40 and 260 kb with various incompatibility groups: IncC, IncI1, IncN, IncY, IncB/O/K/Z, IncX1, IncHI2, IncHI2A, IncFIB(K), IncFII. A variety of extended β-lactamase genes were identified: bla CTXM -1 , bla CTXM -14 , bla CTXM -15 , bla CTXM-27 , bla CTXM-55 , bla CTXM-61 , bla PER-1, bla IMP-27 . Interestingly, the bla IMP-27 gene, a novel metallo-β-lactamase discovered in the last decade, was found located on an integrated region in the host chromosome. And one plasmid carrying the bla CMY-2 gene, an AmpC gene, also expressed ESBL phenotype. Four virulence factors, including cia, cib, traT and terC, were detected on some of these plasmids. In addition, six type-2 toxin-antitoxin systems were detected: MazF/E, PemK/I, HipA/B, YdcE/D, RelB/E and HigB/A. Twenty-two out of twenty-four complete plasmids carried putative prophage regions; and most of prophage hits were marked as incomplete, except that the largest plasmid pT525A and the IncY plasmid pT415A had prophage hits with higher scores. IMPORTANCE The widespread of antibiotic resistant bacteria is largely due to the exchange of mobile genetic elements such as plasmids. Plasmids harboring extended β-lactamase (ESBL) genes originated from dairy manure potentially become entrained in manured soil, which subsequently enter the human food chain. Currently there is a lack of detailed information on these plasmids in the environment, specifically in dairy manure. This study unveils the abundance and diversity of ESBL-carrying plasmids from both raw and digested manures which were captured in gfp- labelled E. coli CV601. In addition, the study provides insightful information of plasmid characteristics including incompatibility groups, ESBL genes combined with other resistance genes, mobile genetic elements (transposons, insertion sequence), toxin-antitoxin systems, virulence factors and prophage sequences.
0

Managing false positives during detection of pathogen sequences in shotgun metagenomics datasets

Lauren Bradford et al.Dec 3, 2024
Culture-independent diagnostic tests are gaining popularity as tools for detecting pathogens in food. Shotgun sequencing holds substantial promise for food testing as it provides abundant information on microbial communities, but the challenge is in analyzing large and complex sequencing datasets with a high degree of both sensitivity and specificity. Falsely classifying sequencing reads as originating from pathogens can lead to unnecessary food recalls or production shutdowns, while low sensitivity resulting in false negatives could lead to preventable illness. We used simulated and published shotgun sequencing datasets containing Salmonella-derived reads to explore the appearance and mitigation of false positive results using the popular taxonomic annotation softwares Kraken2 and Metaphlan4. Using default parameters, Kraken2 is sensitive but prone to false positives, while Metaphlan4 is more specific but unable to detect Salmonella at low abundance. We then developed a bioinformatic pipeline for identifying and removing reads falsely identified as Salmonella by Kraken2 while retaining high sensitivity. Carefully considering software parameters and database choices is essential to avoiding false positive sample calls. With well-chosen parameters plus additional steps to confirm the taxonomic origin of reads, it is possible to detect pathogens with very high specificity and sensitivity.
0

Rapid and accurate SNP genotyping of clonal bacterial pathogens with BioHansel

Geneviève Labbé et al.Jan 11, 2020
BioHansel performs high-resolution genotyping of bacterial isolates by identifying phylogenetically informative single nucleotide polymorphisms (SNPs), also known as canonical SNPs, in whole genome sequencing (WGS) data. The application uses a fast k-mer matching algorithm to map pathogen WGS data to canonical SNPs contained in hierarchically structured schemas and assigns genotypes based on the detected SNP profile. Using modest computing resources, BioHansel efficiently types isolates from raw sequence reads or assembled contigs in a matter of seconds, making it attractive for use by public health, food safety, environmental, and agricultural authorities that wish to apply WGS methodologies for their surveillance, diagnostics, and research programs. BioHansel currently provides canonical SNP genotyping schemas for four prevalent Salmonella serovars: Typhi, Typhimurium, Enteritidis and Heidelberg, as well as a schema for Mycobacterium tuberculosis. Users can also supply their own schemas for genotyping other organisms. Its quality assurance system assesses the validity of the genotyping results and can identify low quality data, contaminated datasets, and misidentified organisms. BioHansel is targeted to support surveillance, source attribution, risk assessment, diagnostics, and rapid screening for public health purposes, such as product recalls. BioHansel is an open source application with packages available for PyPI, Conda, and the Galaxy workflow manager. In summary, BioHansel performs efficient, rapid, accurate, and high-resolution classification of bacterial genomes from sequence reads or assembled contigs on standard computing hardware. BioHansel is suitable for use as a general research tool as well as in fully operationalized WGS workflows at the front lines of infectious disease surveillance, diagnostics, and outbreak investigation and response.
0

BenchAMRking: a Galaxy-based platform for illustrating the major issues associated with current antimicrobial resistance (AMR) gene prediction workflows

Nikolaos Strepis et al.Jan 10, 2025
The Joint Programming Initiative on Antimicrobial Resistance (JPIAMR) networks 'Seq4AMR' and 'B2B2B AMR Dx' were established to promote collaboration between microbial whole genome sequencing (WGS) and antimicrobial resistance (AMR) stakeholders. A key topic discussed was the frequent variability in results obtained between different microbial WGS-related AMR gene prediction workflows. Further, comparative benchmarking studies are difficult to perform due to differences in AMR gene prediction accuracy and a lack of agreement in the naming of AMR genes (semantic conformity) for the results obtained. To illustrate this problem, and as a capacity-building exercise to encourage stakeholder involvement, a comparative Galaxy-based BenchAMRking platform was developed and validated using datasets from bacterial species with PCR-verified AMR gene presence or absence information from abritAMR. The Galaxy-based BenchAMRking platform ( https://erasmusmc-bioinformatics.github.io/benchAMRking/ ) specifically focusses on the steps involved in identifying AMR genes from raw reads and sequence assemblies. The platform currently comprises four well-characterised and published workflows that have previously been used to identify AMR genes using WGS data from several different bacterial species. These four workflows, which include the ISO certified abritAMR workflow, make use of different computational tools (or tool versions), and interrogate different AMR gene sequence databases. By utilising their own data, users can investigate potential AMR gene-calling problems associated with their own in silico workflows/protocols, with a potential use case outlined in this publication. BenchAMRking is a Galaxy-based comparison platform where users can access, visualise, and explore some of the major discrepancies associated with AMR gene prediction from microbial WGS data.