VG
Victor Gannon
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(67% Open Access)
Cited by:
1,041
h-index:
44
/
i10-index:
87
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The Salmonella In Silico Typing Resource (SISTR): An Open Web-Accessible Tool for Rapidly Typing and Subtyping Draft Salmonella Genome Assemblies

Catherine Yoshida et al.Jan 22, 2016
For nearly 100 years serotyping has been the gold standard for the identification of Salmonella serovars. Despite the increasing adoption of DNA-based subtyping approaches, serotype information remains a cornerstone in food safety and public health activities aimed at reducing the burden of salmonellosis. At the same time, recent advances in whole-genome sequencing (WGS) promise to revolutionize our ability to perform advanced pathogen characterization in support of improved source attribution and outbreak analysis. We present the Salmonella In Silico Typing Resource (SISTR), a bioinformatics platform for rapidly performing simultaneous in silico analyses for several leading subtyping methods on draft Salmonella genome assemblies. In addition to performing serovar prediction by genoserotyping, this resource integrates sequence-based typing analyses for: Multi-Locus Sequence Typing (MLST), ribosomal MLST (rMLST), and core genome MLST (cgMLST). We show how phylogenetic context from cgMLST analysis can supplement the genoserotyping analysis and increase the accuracy of in silico serovar prediction to over 94.6% on a dataset comprised of 4,188 finished genomes and WGS draft assemblies. In addition to allowing analysis of user-uploaded whole-genome assemblies, the SISTR platform incorporates a database comprising over 4,000 publicly available genomes, allowing users to place their isolates in a broader phylogenetic and epidemiological context. The resource incorporates several metadata driven visualizations to examine the phylogenetic, geospatial and temporal distribution of genome-sequenced isolates. As sequencing of Salmonella isolates at public health laboratories around the world becomes increasingly common, rapid in silico analysis of minimally processed draft genome assemblies provides a powerful approach for molecular epidemiology in support of public health investigations. Moreover, this type of integrated analysis using multiple sequence-based methods of sub-typing allows for continuity with historical serotyping data as we transition towards the increasing adoption of genomic analyses in epidemiology. The SISTR platform is freely available on the web at https://lfz.corefacility.ca/sistr-app/.
0
Citation446
0
Save
0

Seasonal relationships among indicator bacteria, pathogenic bacteria, Cryptosporidium oocysts, Giardia cysts, and hydrological indices for surface waters within an agricultural landscape

Graham Wilkes et al.Feb 18, 2009
The South Nation River basin in eastern Ontario, Canada is characterized by mixed agriculture. Over 1600 water samples were collected on a bi-weekly basis from up to 24 discrete sampling sites on river tributaries of varying stream order within the river basin between 2004 and 2006. Water samples were analyzed for: densities of indicator bacteria (Escherichia coli, Clostridium perfringens, enterococci, total and fecal coliforms), the presence of pathogenic bacteria (Listeria monocytogenes, E. coli O157:H7, Salmonella spp., Campylobacter spp.), and densities of parasite Giardia cysts and Cryptosporidium oocysts. Relationships between indicator bacteria, pathogens, and parasite oocysts/cysts were overall weak, seasonally dependent, site specific, but primarily positive. However, L. monocytogenes was inversely related with indicator bacteria densities. Campylobacter, Salmonella, Giardia cysts and Cryptosporidium oocysts were most frequently detected in the fall. E. coli O157:H7 was detected at a very low frequency. Exploratory decision tree analyses found overall that E. coli densities were the most utilitarian classifiers of parasite/pathogen presence and absence, followed closely by fecal coliforms, and to a lesser extent enterococci and total coliforms. Indicator bacteria densities that classified pathogen presence and absence groupings, were all below 100 CFU per 100 mL(-1). Microorganism relationships with rainfall indices and tributary discharge variables were globally weak to modest, and generally inconsistent among season, site and microorganism. But, overall rainfall and discharge were primarily positively associated with indicator bacteria densities and pathogen detection. Instances where a pathogen was detected in the absence of a detectable bacterial indicator were extremely infrequent; thus, the fecal indicators were conservative surrogates for a variety of pathogenic microorganisms in this agricultural setting. The results from this study indicate that no one indicator or simple hydrological index is entirely suitable for all environmental systems and pathogens/parasites, even within a common geographic setting. These results place more firmly into context that robust prediction and/or indicator utility will require a more firm understanding of microorganism distribution in the landscape, the nature of host sources, and transport/environmental fate affinities among pathogens and indicators.
0
Citation329
0
Save
0

Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions

Chad Laing et al.Sep 15, 2010
Abstract Background The pan-genome of a bacterial species consists of a core and an accessory gene pool. The accessory genome is thought to be an important source of genetic variability in bacterial populations and is gained through lateral gene transfer, allowing subpopulations of bacteria to better adapt to specific niches. Low-cost and high-throughput sequencing platforms have created an exponential increase in genome sequence data and an opportunity to study the pan-genomes of many bacterial species. In this study, we describe a new online pan-genome sequence analysis program, Panseq. Results Panseq was used to identify Escherichia coli O157:H7 and E. coli K-12 genomic islands. Within a population of 60 E. coli O157:H7 strains, the existence of 65 accessory genomic regions identified by Panseq analysis was confirmed by PCR. The accessory genome and binary presence/absence data, and core genome and single nucleotide polymorphisms (SNPs) of six L. monocytogenes strains were extracted with Panseq and hierarchically clustered and visualized. The nucleotide core and binary accessory data were also used to construct maximum parsimony (MP) trees, which were compared to the MP tree generated by multi-locus sequence typing (MLST). The topology of the accessory and core trees was identical but differed from the tree produced using seven MLST loci. The Loci Selector module found the most variable and discriminatory combinations of four loci within a 100 loci set among 10 strains in 1 s, compared to the 449 s required to exhaustively search for all possible combinations; it also found the most discriminatory 20 loci from a 96 loci E. coli O157:H7 SNP dataset. Conclusion Panseq determines the core and accessory regions among a collection of genomic sequences based on user-defined parameters. It readily extracts regions unique to a genome or group of genomes, identifies SNPs within shared core genomic regions, constructs files for use in phylogeny programs based on both the presence/absence of accessory regions and SNPs within core regions and produces a graphical overview of the output. Panseq also includes a loci selector that calculates the most variable and discriminatory loci among sets of accessory loci or core gene SNPs. Availability Panseq is freely available online at http://76.70.11.198/panseq . Panseq is written in Perl.
0
Citation266
0
Save