FM
Finlay Maguire
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(86% Open Access)
Cited by:
3,033
h-index:
19
/
i10-index:
29
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

CARD 2020: antibiotic resistome surveillance with the comprehensive antibiotic resistance database

Brian Alcock et al.Oct 9, 2019
+31
T
A
B
Abstract The Comprehensive Antibiotic Resistance Database (CARD; https://card.mcmaster.ca) is a curated resource providing reference DNA and protein sequences, detection models and bioinformatics tools on the molecular basis of bacterial antimicrobial resistance (AMR). CARD focuses on providing high-quality reference data and molecular sequences within a controlled vocabulary, the Antibiotic Resistance Ontology (ARO), designed by the CARD biocuration team to integrate with software development efforts for resistome analysis and prediction, such as CARD’s Resistance Gene Identifier (RGI) software. Since 2017, CARD has expanded through extensive curation of reference sequences, revision of the ontological structure, curation of over 500 new AMR detection models, development of a new classification paradigm and expansion of analytical tools. Most notably, a new Resistomes & Variants module provides analysis and statistical summary of in silico predicted resistance variants from 82 pathogens and over 100 000 genomes. By adding these resistance variants to CARD, we are able to summarize predicted resistance using the information included in CARD, identify trends in AMR mobility and determine previously undescribed and novel resistance variants. Here, we describe updates and recent expansions to CARD and its biocuration process, including new resources for community biocuration of AMR molecular reference data.
0
Citation2,497
0
Save
0

CARD 2023: expanded curation, support for machine learning, and resistome prediction at the Comprehensive Antibiotic Resistance Database

Brian Alcock et al.Oct 20, 2022
+42
R
W
B
Abstract The Comprehensive Antibiotic Resistance Database (CARD; card.mcmaster.ca) combines the Antibiotic Resistance Ontology (ARO) with curated AMR gene (ARG) sequences and resistance-conferring mutations to provide an informatics framework for annotation and interpretation of resistomes. As of version 3.2.4, CARD encompasses 6627 ontology terms, 5010 reference sequences, 1933 mutations, 3004 publications, and 5057 AMR detection models that can be used by the accompanying Resistance Gene Identifier (RGI) software to annotate genomic or metagenomic sequences. Focused curation enhancements since 2020 include expanded β-lactamase curation, incorporation of likelihood-based AMR mutations for Mycobacterium tuberculosis, addition of disinfectants and antiseptics plus their associated ARGs, and systematic curation of resistance-modifying agents. This expanded curation includes 180 new AMR gene families, 15 new drug classes, 1 new resistance mechanism, and two new ontological relationships: evolutionary_variant_of and is_small_molecule_inhibitor. In silico prediction of resistomes and prevalence statistics of ARGs has been expanded to 377 pathogens, 21,079 chromosomes, 2,662 genomic islands, 41,828 plasmids and 155,606 whole-genome shotgun assemblies, resulting in collation of 322,710 unique ARG allele sequences. New features include the CARD:Live collection of community submitted isolate resistome data and the introduction of standardized 15 character CARD Short Names for ARGs to support machine learning efforts.
0
Citation486
0
Save
49

Genomic and transcriptomic characterization of Delta SARS-CoV-2 infection in free-ranging white-tailed deer (Odocoileus virginianus)

Jonathon Kotwa et al.Jan 21, 2022
+19
A
B
J
Abstract White-tailed deer are susceptible to SARS-CoV-2 and represent a highly important species for surveillance. Nasal swabs and retropharyngeal lymph nodes from white-tailed deer (n=258) collected in November 2021 from Québec, Canada were analyzed for SARS-CoV-2 RNA. We employed viral genomics and transcriptomics to further characterize infection and investigate host response to infection. We detected Delta SARS-CoV-2 (AY.44) in deer from the Estrie region; sequences clustered with human sequences from GISAID collected in October 2021 from Vermont, USA, which borders this region. Mutations in the S-gene and a deletion in ORF8 encoding a truncated protein were detected. Host expression patterns in SARS-CoV-2 infected deer were associated with the innate immune response, including signalling pathways related to anti-viral, pro- and anti-inflammatory signalling, and host damage. Our findings provide preliminary insights of host response to SARS-CoV-2 infection in deer and underscores the importance of ongoing surveillance of key wildlife species for SARS-CoV-2.
49
Citation23
0
Save
0

Metagenome-Assembled Genome Binning Methods with Short Reads Disproportionately Fail for Plasmids and Genomic Islands

Finlay Maguire et al.Apr 2, 2020
+3
K
B
F
Abstract Metagenomic methods are an important tool in the life sciences, as they enable simultaneous characterisation of all microbes in a community without time-consuming and bias-inducing culturing. Metagenome-assembled genome (MAG) binning methods have emerged as a promising approach to recover individual genomes from metagenomic data. However, MAG binning has not been well assessed for its ability to recover mobile genetic elements (MGEs), such as plasmids and genomic islands (GIs), that have very high clinical/agricultural/environmental importance. Certain antimicrobial resistance (AMR) genes and virulence factor (VF) genes are noted to be disproportionately associated with MGEs, making studying their transmission a public health priority. However, the variable copy number and sequence composition of MGEs relative to the majority of the host genome makes them potentially problematic for MAG binning methods. To systematically investigate this, we simulated a low-complexity metagenome comprising 30 GI-rich and plasmid-containing bacterial genomes. MAGs were then recovered using 12 current prediction pipelines and evaluated for recovery of MGE-associated AMR/VF genes. Here we show that while 82-94% of chromosomes could be correctly recovered and binned, only 38-44% of GIs were recovered and, even more notably, only 1-29% of plasmid sequences were found. Most strikingly, no plasmid-borne VF or AMR genes were recovered and within GIs, only between 0-45% of AMR or VF genes were identified. We conclude that short-read MAGs are largely ineffective for the analysis of mobile genes, including those of public-health importance like AMR and VF genes. We propose that microbiome researchers should instead primarily utilise unassembled short reads and/or long-read approaches to more accurately analyse metagenomic data
0
Citation19
0
Save
44

Emergent RNA-RNA interactions can promote stability in a nascent phototrophic endosymbiosis

Benjamin Jenkins et al.Apr 11, 2021
+6
G
F
B
ABSTRACT Eukaryote-eukaryote endosymbiosis was responsible for the spread of chloroplast (plastid) organelles. Stability is required for the metabolic and genetic integration that drives the establishment of new organelles, yet the mechanisms which act to stabilise nascent endosymbioses – between two fundamentally selfish biological organisms – are unclear. Theory suggests that enforcement mechanisms, which punish misbehaviour, may act to stabilise such interactions by resolving conflict. However, how such mechanisms can emerge in a nascent endosymbiosis has yet to be explored. Here, we propose that endosymbiont-host RNA-RNA interactions, arising from digestion of the endosymbiont population, can result in a cost to host growth for breakdown of the endosymbiosis. Using the model nascent endosymbiosis, Paramecium bursaria – Chlorella spp., we demonstrate that this mechanism is dependent on the host RNA-interference (RNAi) system. We reveal through small RNA (sRNA) sequencing that endosymbiont-derived mRNA released upon endosymbiont digestion can be processed by the host RNAi system into 23-nt sRNA. We predict multiple regions of shared sequence identity between endosymbiont and host mRNA, and demonstrate through delivery of synthetic endosymbiont sRNA that exposure to these regions can knock-down expression of complementary host genes, resulting in a cost to host growth. This process of host gene knock-down in response to endosymbiont-derived RNA processing by host RNAi factors, which we term ‘RNAi-collisions’, represents a mechanism which can promote stability in a nascent eukaryote-eukaryote endosymbiosis. By imposing a cost for breakdown of the endosymbiosis, endosymbiont-host RNA-RNA interactions may drive maintenance of the symbiosis across fluctuating ecological conditions and symbiotic status. SIGNIFICANCE STATEMENT Stable endosymbiosis between eukaryotic microbes has driven the evolution of further cellular complexity. Yet the mechanisms which can act to stabilise a nascent eukaryote-eukaryote endosymbiosis are unclear. Using the model nascent endosymbiotic system, Paramecium bursaria–Chlorella , we demonstrate that endosymbiont-host RNA-RNA interactions can drive a cost to host growth upon endosymbiont digestion, punishing the host for misbehaviour. These RNA-RNA interactions are facilitated by the host RNA-interference system. For endosymbiont mRNA sharing a high-level of sequence identity with host transcripts, this process can result in host gene knock-down. We propose that these endosymbiont-host RNA-RNA interactions–‘RNAi collisions’–represent a viable enforcement mechanism to sanction the host for breakdown of the endosymbiosis, promoting the stability of a nascent endosymbiotic interaction.
44
Citation3
0
Save
118

Immunogenicity of convalescent and vaccinated sera against clinical isolates of ancestral SARS-CoV-2, beta, delta, and omicron variants

Arinjay Banerjee et al.Jan 13, 2022
+20
A
J
A
ABSTRACT The omicron variant of concern (VOC) of SARS-CoV-2 was first reported in November 2021 in Botswana and South Africa. Omicron has evolved multiple mutations within the spike protein and the receptor binding domain (RBD), raising concerns of increased antibody evasion. Here, we isolated infectious omicron from a clinical specimen obtained in Canada. The neutralizing activity of sera from 65 coronavirus disease (COVID-19) vaccine recipients and convalescent individuals against clinical isolates of ancestral SARS-CoV-2, beta, delta, and omicron VOCs was assessed. Convalescent sera from unvaccinated individuals infected by the ancestral virus during the first wave of COVID-19 in Canada (July, 2020) demonstrated reduced neutralization against beta and omicron VOCs. Convalescent sera from unvaccinated individuals infected by the delta variant (May-June, 2021) neutralized omicron to significantly lower levels compared to the delta variant. Sera from individuals that received three doses of the Pfizer or Moderna vaccines demonstrated reduced neutralization of the omicron variant relative to ancestral SARS-CoV-2. Sera from individuals that were naturally infected with ancestral SARS-CoV-2 and subsequently received two doses of the Pfizer vaccine induced significantly higher neutralizing antibody levels against ancestral virus and all VOCs. Importantly, infection alone, either with ancestral SARS-CoV-2 or the delta variant was not sufficient to induce high neutralizing antibody titers against omicron. This data will inform current booster vaccination strategies, and we highlight the need for additional studies to identify longevity of immunity against SARS-CoV-2 and optimal neutralizing antibody levels that are necessary to prevent infection and/or severe COVID-19.
118
Citation1
0
Save
0

PHA4GE quality control contextual data tags: standardized annotations for sharing public health sequence datasets with known quality issues to facilitate testing and training

Emma Griffiths et al.Jun 11, 2024
+20
F
C
E
As public health laboratories expand their genomic sequencing and bioinformatics capacity for the surveillance of different pathogens, labs must carry out robust validation, training, and optimization of wet- and dry-lab procedures. Achieving these goals for algorithms, pipelines and instruments often requires that lower quality datasets be made available for analysis and comparison alongside those of higher quality. This range of data quality in reference sets can complicate the sharing of sub-optimal datasets that are vital for the community and for the reproducibility of assays. Sharing of useful, but sub-optimal datasets requires careful annotation and documentation of known issues to enable appropriate interpretation, avoid being mistaken for better quality information, and for these data (and their derivatives) to be easily identifiable in repositories. Unfortunately, there are currently no standardized attributes or mechanisms for tagging poor-quality datasets, or datasets generated for a specific purpose, to maximize their utility, searchability, accessibility and reuse. The Public Health Alliance for Genomic Epidemiology (PHA4GE) is an international community of scientists from public health, industry and academia focused on improving the reproducibility, interoperability, portability, and openness of public health bioinformatic software, skills, tools and data. To address the challenges of sharing lower quality datasets, PHA4GE has developed a set of standardized contextual data tags, namely fields and terms, that can be included in public repository submissions as a means of flagging pathogen sequence data with known quality issues, increasing their discoverability. The contextual data tags were developed through consultations with the community including input from the International Nucleotide Sequence Data Collaboration (INSDC), and have been standardized using ontologies - community-based resources for defining the tag properties and the relationships between them. The standardized tags are agnostic to the organism and the sequencing technique used and thus can be applied to data generated from any pathogen using an array of sequencing techniques. The tags can also be applied to synthetic (lab created) data. The list of standardized tags is maintained by PHA4GE and can be found at https://github.com/pha4ge/contextual_data_QC_tags . Definitions, ontology IDs, examples of use, as well as a JSON representation, are provided. The PHA4GE QC tags were tested, and are now implemented, by the FDA’s GenomeTrakr laboratory network as part of its routine submission process for SARS-CoV-2 wastewater surveillance. We hope that these simple, standardized tags will help improve communication regarding quality control in public repositories, in addition to making datasets of variable quality more easily identifiable. Suggestions for additional tags can be submitted to PHA4GE via the New Term Request Form in the GitHub repository. By providing a mechanism for feedback and suggestions, we also expect that the tags will evolve with the needs of the community.
0
Citation1
0
Save
0

hAMRonization: Enhancing antimicrobial resistance prediction using the PHA4GE AMR detection specification and tooling

CI Mendes et al.Mar 11, 2024
+38
E
A
C
Abstract The detection of antimicrobial resistance (AMR) markers directly from genomic or metagenomic data is becoming a standard clinical and public health procedure. This has resulted in the development of a number of different bioinformatic AMR prediction tools. Although many may implement similar principles, these tools differ significantly in their supported inputs, search algorithms, parameterisation, and underlying reference databases. Each of these tools generates a report of detected AMR genes or variants in a distinct, non-standard, format. This presents a huge barrier to the comparison of results and to the modularity of tools for AMR gene prediction within bioinformatic workflows. In collaboration with 17 public health laboratories across 10 countries, the Public Health Alliance for Genomic Epidemiology (PHA4GE) ( https://pha4ge.org ) data structures working group has developed and piloted a standardized output specification for the bioinformatic detection of AMR from microbial genomes. In this report, we discuss hAMRonization, a python package and command-line utility, which implements PHA4GE’s AMR specification to combine the outputs of disparate antimicrobial resistance gene detection tools into a single unified format. hAMRonization can be easily extended and currently supports 18 different tools (both species-agnostic and species-specific) for the detection of genes and/or variants conferring AMR. The harmonized reports are available in tabular form, JSON format or through an interactive HTML file (e.g., https://maguire-lab.github.io/assets/interactive_report_demo.html ) that can be opened within the browser for navigable data exploration. As of 2024-03-07 hAMRonization has been downloaded ∼12,500 times, incorporated into >9 public bioinformatic tools and workflows, and been internally adopted by several national and international public health groups. The hAMRonization tool and underlying specification are open-source and freely available through PyPI, conda and GitHub ( https://github.com/pha4ge/hAMRonization ).
0
Citation1
0
Save
8

Exploring the mobilome and resistome of Enterococcus faecium in a One Health context across two continents

Haley Sanderson et al.Apr 11, 2022
+19
J
A
H
Abstract Enterococcus faecium is a ubiquitous opportunistic pathogen that is exhibiting increasing levels of antimicrobial resistance (AMR). Many of the genes that confer resistance and pathogenic functions are localized on mobile genetic elements (MGEs), which facilitate their transfer between lineages. Here, features including resistance determinants, virulence factors, and MGEs were profiled in a set of 1273 E. faecium genomes from two disparate geographic locations (in the UK and Canada) from a range of agricultural, clinical, and associated habitats. Neither lineages of E. faecium nor MGEs are constrained by geographic proximity, but our results show evidence of a strong association of many profiled genes and MGEs with habitat. Many features were associated with a group of clinical and municipal wastewater genomes that are likely forming a new human-associated ecotype. The evolutionary dynamics of E. faecium make it a highly versatile emerging pathogen, and its ability to acquire, transmit, and lose features presents a high risk for the emergence of new pathogenic variants and novel resistance combinations. This study provides a workflow for MGE-centric surveillance of AMR in Enterococcus that can be adapted to other pathogens.
8
Citation1
0
Save
12

Characterisation of the RNA-interference pathway as a Tool for Genetics in the Nascent Phototrophic Endosymbiosis, Paramecium bursaria

Benjamin Jenkins et al.Dec 16, 2020
+5
G
F
B
ABSTRACT Endosymbiosis was fundamental for the evolution of eukaryotic complexity. Endosymbiotic interactions can be dissected through forward and reverse-genetic experiments, such as RNA-interference (RNAi). However, distinguishing small (s)RNA pathways in a eukaryote-eukaryote endosymbiotic interaction is challenging. Here, we investigate the repertoire of RNAi pathway protein-encoding genes in the model nascent endosymbiotic system, Paramecium bursaria – Chlorella spp. Using comparative genomics and transcriptomics supported by phylogentics, we identify essential proteome components of the small interfering (si)RNA, scan (scn)RNA, and internal eliminated sequence (ies)RNA pathways. Our analyses reveal that copies of these components have been retained throughout successive whole genome duplication (WGD) events in the Paramecium clade. We then validate feeding-induced siRNA-based RNAi in P. bursaria via knock-down of the splicing factor, u2af1 , which we show to be crucial to host growth. Finally, using simultaneous knock-down paradox controls to rescue the effect u2af1 knock-down, we demonstrate that feeding-induced RNAi in P. bursaria is dependent upon a core pathway of host-encoded Dcr1 , Piwi and Pds1 components. Our experiments confirm the presence of a functional, host-derived RNAi pathway in P. bursaria that generates 23-nt siRNA, validating use of the P. bursaria - Chlorella spp. system to investigate the genetic basis of a nascent endosymbiosis.
12
Citation1
0
Save
Load More