MG
Morag Graham
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
5
(60% Open Access)
Cited by:
422
h-index:
36
/
i10-index:
59
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Virulence control in group AStreptococcusby a two-component gene regulatory system: Global expression profiling andin vivoinfection modeling

Morag Graham et al.Oct 7, 2002
+7
C
L
M
Two-component gene regulatory systems composed of a membrane-bound sensor and cytoplasmic response regulator are important mechanisms used by bacteria to sense and respond to environmental stimuli. Group A Streptococcus, the causative agent of mild infections and life-threatening invasive diseases, produces many virulence factors that promote survival in humans. A two-component regulatory system, designated covRS (cov, control of virulence; csrRS), negatively controls expression of five proven or putative virulence factors (capsule, cysteine protease, streptokinase, streptolysin S, and streptodornase). Inactivation of covRS results in enhanced virulence in mouse models of invasive disease. Using DNA microarrays and quantitative RT-PCR, we found that CovR influences transcription of 15% (n = 271) of all chromosomal genes, including many that encode surface and secreted proteins mediating host-pathogen interactions. CovR also plays a central role in gene regulatory networks by influencing expression of genes encoding transcriptional regulators, including other two-component systems. Differential transcription of genes influenced by covR also was identified in mouse soft-tissue infection. This analysis provides a genome-scale overview of a virulence gene network in an important human pathogen and adds insight into the molecular mechanisms used by group A Streptococcus to interact with the host, promote survival, and cause disease.
0
Citation371
0
Save
0

Evolutionary Origin and Emergence of a Highly Successful Clone of Serotype M1 Group AStreptococcusInvolved Multiple Horizontal Gene Transfer Events

Paul Sumby et al.Aug 5, 2005
+8
A
S
P
To better understand the molecular events involved in the origin of new pathogenic bacteria, we studied the evolution of a highly virulent clone of serotype M1 group A Streptococcus (GAS). Genomic, DNA-DNA microarray, and single-nucleotide polymorphism analyses indicated that this clone evolved through a series of horizontal gene transfer events that involved (1) the acquisition of prophages encoding streptococcal pyrogenic exotoxin A and extracellular DNases and (2) the reciprocal recombination of a 36-kb chromosomal region encoding the extracellular toxins NAD+-glycohydrolase (NADase) and streptolysin O (SLO). These gene transfer events were associated with significantly increased production of SLO and NADase. Virtual identity in the 36-kb region present in contemporary serotype M1 and M12 isolates suggests that a serotype M12 strain served as the donor of this region. Multiple horizontal gene transfer events were a crucial factor in the evolutionary origin and emergence of a very abundant contemporary clone of serotype M1 GAS
0
Citation349
0
Save
0

SNVPhyl: A Single Nucleotide Variant Phylogenomics pipeline for microbial genomic epidemiology

A. Petkau et al.Dec 9, 2016
+15
P
E
A
Abstract Motivation The recent widespread application of whole-genome sequencing (WGS) for microbial disease investigations has spurred the development of new bioinformatics tools, including a notable proliferation of phylogenomics pipelines designed for infectious disease surveillance and outbreak investigation. Transitioning the use of WGS data out of the research lab and into the front lines of surveillance and outbreak response requires user-friendly, reproducible, and scalable pipelines that have been well validated. Results SNVPhyl (Single Nucleotide Variant Phylogenomics) is a bioinformatics pipeline for identifying high-quality SNVs and constructing a whole genome phylogeny from a collection of WGS reads and a reference genome. Individual pipeline components are integrated into the Galaxy bioinformatics framework, enabling data analysis in a user-friendly, reproducible, and scalable environment. We show that SNVPhyl can detect SNVs with high sensitivity and specificity and identify and remove regions of high SNV density (indicative of recombination). SNVPhyl is able to correctly distinguish outbreak from non-outbreak isolates across a range of variant-calling settings, sequencing-coverage thresholds, or in the presence of contamination. Availability SNVPhyl is available as a Galaxy workflow, Docker and virtual machine images, and a Unix-based command-line application. SNVPhyl is released under the Apache 2.0 license and available at http://snvphyl.readthedocs.io/ or at https://github.com/phac-nml/snvphyl-galaxy .
0
Citation51
0
Save
1

Proportionality-based association metrics in count compositional data

Kevin McGregor et al.Aug 24, 2023
+21
R
N
K
Abstract Motivation Compositional data comprise vectors that describe the constituent parts of a whole. Data arising from various -omics platforms such as 16S and RNA-sequencing are compositional in nature. However, correlations between features on raw counts have no meaningful interpretation. Metrics of proportionality were formulated to address this problem. However, there is an inherent bias that arises when calculating these metrics empirically on count-based measures due to variability in read depths. Results We quantify the bias introduced by empirically calculating proportionality-based association metrics in count data. Additionally, we propose a means of estimating these metrics within a logit-normal multinomial model in pursuit of more accurate estimates. The model-based estimates are shown to outperform empirical estimates in simulated data, and are additionally applied to a mouse embryonic stem-cell single-cell sequencing dataset as well as a pediatric-onset multiple sclerosis metagenomic dataset. Availability and Implementation An R package is available at https://CRAN.R-project.org/package=countprop . Supplementary information Supplementary data are available at Bioinformatics online.
0

Neptune: A Bioinformatics Tool for Rapid Discovery of Genomic Variation in Bacterial Populations

Eric Marinier et al.Nov 18, 2015
+8
C
R
E
The ready availability of vast amounts of genomic sequence data has created the need to rethink comparative genomics algorithms using "big data" approaches. Neptune is an efficient system for rapidly locating differentially abundant genomic content in bacterial populations using an exact k-mer matching strategy, while accommodating k-mer mismatches. Neptune's loci discovery process identifies sequences that are sufficiently common to a group of target sequences and sufficiently absent from non-targets using probabilistic models. Neptune uses parallel computing to efficiently identify and extract these loci from draft genome assemblies without requiring multiple sequence alignments or other computationally expensive comparative sequence analyses. Tests on simulated and real data sets showed that Neptune rapidly identifies regions that are both sensitive and specific. We demonstrate that this system can identify trait-specific loci from different bacterial lineages. Neptune is broadly applicable for comparative bacterial analyses, yet will particularly benefit pathogenomic applications, owing to efficient and sensitive discovery of differentially abundant genomic loci.
0

The Integrated Rapid Infectious Disease Analysis (IRIDA) Platform

Thomas Matthews et al.Jul 31, 2018
+29
F
E
T
Whole genome sequencing (WGS) is a powerful tool for public health infectious disease investigations owing to its higher resolution, greater efficiency, and cost-effectiveness over traditional genotyping methods. Implementation of WGS in routine public health microbiology laboratories is impeded by a lack of user-friendly automated and semi-automated pipelines, restrictive jurisdictional data sharing policies, and the proliferation of non-interoperable analytical and reporting systems. To address these issues, we developed the Integrated Rapid Infectious Disease Analysis (IRIDA) platform (irida.ca), a user-friendly, decentralized, open-source bioinformatics and analytical web platform to support real-time infectious disease outbreak investigations using WGS data. Instances can be independently installed on local high-performance computing infrastructure, enabling private and secure data management and analyses according to organizational policies and governance. IRIDA's data management capabilities enable secure upload, storage and sharing of all WGS data and metadata. The core platform currently includes pipelines for quality control, assembly, annotation, variant detection, phylogenetic analysis, in silico serotyping, multi-locus sequence typing, and genome distance calculation. Analysis pipeline results can be visualized within the platform through dynamic line lists and integrated phylogenomic clustering for research and discovery, and for enhancing decision-making support and hypothesis generation in epidemiological investigations. Communication and data exchange between instances are provided through customizable access controls. IRIDA complements centralized systems, empowering local analytics and visualizations for genomics-based microbial pathogen investigations. IRIDA is currently transforming the Canadian public health ecosystem and is freely available at https://github.com/phac-nml/irida and www.irida.ca.