MB
Matthew Bull
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(50% Open Access)
Cited by:
1,397
h-index:
26
/
i10-index:
44
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Evaluating the Effects of SARS-CoV-2 Spike Mutation D614G on Transmissibility and Pathogenicity

Derek Fairley et al.Nov 19, 2020
+97
J
T
D
Global dispersal and increasing frequency of the SARS-CoV-2 spike protein variant D614G are suggestive of a selective advantage but may also be due to a random founder effect. We investigate the hypothesis for positive selection of spike D614G in the United Kingdom using more than 25,000 whole genome SARS-CoV-2 sequences. Despite the availability of a large dataset, well represented by both spike 614 variants, not all approaches showed a conclusive signal of positive selection. Population genetic analysis indicates that 614G increases in frequency relative to 614D in a manner consistent with a selective advantage. We do not find any indication that patients infected with the spike 614G variant have higher COVID-19 mortality or clinical severity, but 614G is associated with higher viral load and younger age of patients. Significant differences in growth and size of 614G phylogenetic clusters indicate a need for continued study of this variant.
0
Citation972
0
Save
0

Recurrent emergence of SARS-CoV-2 spike deletion H69/V70 and its role in the Alpha variant B.1.1.7

Bo Meng et al.Jun 1, 2021
+97
G
S
B
We report severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) spike ΔH69/V70 in multiple independent lineages, often occurring after acquisition of receptor binding motif replacements such as N439K and Y453F, known to increase binding affinity to the ACE2 receptor and confer antibody escape. In vitro, we show that, although ΔH69/V70 itself is not an antibody evasion mechanism, it increases infectivity associated with enhanced incorporation of cleaved spike into virions. ΔH69/V70 is able to partially rescue infectivity of spike proteins that have acquired N439K and Y453F escape mutations by increased spike incorporation. In addition, replacement of the H69 and V70 residues in the Alpha variant B.1.1.7 spike (where ΔH69/V70 occurs naturally) impairs spike incorporation and entry efficiency of the B.1.1.7 spike pseudotyped virus. Alpha variant B.1.1.7 spike mediates faster kinetics of cell-cell fusion than wild-type Wuhan-1 D614G, dependent on ΔH69/V70. Therefore, as ΔH69/V70 compensates for immune escape mutations that impair infectivity, continued surveillance for deletions with functional effects is warranted.
0
Citation404
0
Save
1

MAJORA: Continuous integration supporting decentralised sequencing for SARS-CoV-2 genomic surveillance

Samuel Nicholls et al.Oct 7, 2020
+21
M
R
S
Abstract Genomic epidemiology has become an increasingly common tool for epidemic response. Recent technological advances have made it possible to sequence genomes rapidly enough to inform outbreak response, and cheaply enough to justify dense sampling of even large epidemics. With increased availability of sequencing it is possible for agile networks of sequencing facilities to collaborate on the sequencing and analysis of epidemic genomic data. In response to the ongoing SARS-CoV-2 pandemic in the United Kingdom, the COVID-19 Genomics UK (COG-UK) consortium was formed with the aim of rapidly sequencing SARS-CoV-2 genomes as part of a national-scale genomic surveillance strategy. The network consists of universities, academic institutes, regional sequencing centres and the four UK Public Health Agencies. We describe the development and deployment of Majora, an encompassing digital infrastructure to address the challenge of collecting and integrating both genomic sequencing data and sample-associated metadata produced across the COG-UK network. The system was designed and implemented pragmatically to stand up capacity rapidly in a pandemic caused by a novel virus. This approach has underpinned the success of COG-UK, which has rapidly become the leading contributor of SARS-CoV-2 genomes to international databases and has generated over 60,000 sequences to date.
1
Citation21
0
Save
0

CLIMB (the Cloud Infrastructure for Microbial Bioinformatics): an online resource for the medical microbiology community

Thomas Connor et al.Jul 19, 2016
+12
S
N
T
The increasing availability and decreasing cost of high-throughput sequencing has transformed academic medical microbiology, delivering an explosion in available genomes while also driving advances in bioinformatics. However, many microbiologists are unable to exploit the resulting large genomics datasets because they do not have access to relevant computational resources and to an appropriate bioinformatics infrastructure. Here, we present the Cloud Infrastructure for Microbial Bioinformatics (CLIMB) facility, a shared computing infrastructure that has been designed from the ground up to provide an environment where microbiologists can share and reuse methods and data.
0

Influenza Classification from Short Reads with VAPOR Facilitates Robust Mapping Pipelines and Zoonotic Strain Detection for Routine Surveillance Applications

Joel Southgate et al.Apr 3, 2019
+6
C
M
J
Background: Influenza viruses are associated with a significant global public health burden. The segmented RNA genome of influenza changes continually due to mutation, and the accumulation of these changes within the antigenic recognition sites of haemagglutinin (HA) and neuraminidase (NA) in turn leads to annual epidemics. Influenza A is also zoonotic, allowing for exchange of segments between human and non-human viruses, resulting in new strains with pandemic potential. These processes necessitate a global surveillance system for influenza monitoring. To this end, whole-genome sequencing (WGS) has begun to emerge as a useful tool. However, due to the diversity and mutability of the influenza genome, and noise in short-read data, bioinformatics processing can present challenges. Results: Conventional mapping approaches can be insufficient when a sub-optimal reference strain is chosen. For short-read datasets simulated from influenza H1N1 HA sequences, read recovery after single-reference mapping was routinely as low as 90% for human-origin influenza sequences, and often lower than 10% for those from avian hosts. To this end, we developed a de Bruijn Graph (DBG)-based classifier of influenza WGS datasets: VAPOR. In real data benchmarking using 257 WGS read sets with corresponding de novo assemblies, VAPOR provided classifications for all samples with a mean of >99.8% identity to assembled contigs. This resulted in an increase in the number of mapped reads by 6.8% on average, up to a maximum of 13.3%. Additionally, using simulations, we demonstrate that classification from reads may be applied to detection of reassorted strains. Conclusions: VAPOR has potential to simplify bioinformatics pipelines for surveillance, providing a novel method for detection of influenza strains of human and non-human origin directly from reads, minimization of potential data loss and bias associated with conventional mapping, and allowing visualization of alignments that would otherwise require slow de novo assembly. Whilst with expertise and time these pitfalls can largely be avoided, with pre-classification they are remedied in a single step. Furthermore, our algorithm could be adapted in future to surveillance of other RNA viruses. VAPOR is available at https://github.com/connor-lab/vapor.
0

Kill and cure: genomic phylogeny and bioactivity of a diverse collection of Burkholderia gladioli bacteria capable of pathogenic and beneficial lifestyles

Jones Ca et al.Apr 11, 2020
+9
A
G
J
Burkholderia gladioli is one of few bacteria with a broad ecology spanning disease in humans, animals, and plants, and encompassing beneficial interactions with multiple eukaryotic hosts. It is a plant pathogen, a bongkrekic acid toxin producing food-poisoning agent, and a lung pathogen in people with cystic fibrosis (CF). Contrasting beneficial traits include antifungal production exploited by insects to protect their eggs, plant protective abilities and antibiotic biosynthesis. We explored the ecological diversity and specialized metabolite biosynthesis of 206 B. gladioli strains, phylogenomically defining 5 evolutionary clades. Historical disease pathovars (pv) B. gladioli pv. allicola and B. gladioli pv. cocovenenans were phylogenetically distinct, while B. gladioli pv. gladioli and B. gladioli pv. agaricicola were indistinguishable. Soft-rot disease and CF infection pathogenicity traits were conserved across all pathovars. Biosynthetic gene clusters for toxoflavin, caryoynencin and enacyloxin were dispersed across B. gladioli , but bongkrekic acid and gladiolin production were clade specific. Strikingly, 13% of CF-infection strains characterised (n=194) were bongkrekic acid toxin positive, uniquely linking this food-poisoning risk factor to chronic lung disease. Toxin production was suppressed by exposing strains to the antibiotic trimethoprim, providing a potential therapeutic strategy to minimise poisoning risk in CF.### Competing Interest StatementThe authors have declared no competing interest.