WB
William Boulton
Author with expertise in Cancer Stem Cells and Tumor Metastasis
Indiana University Bloomington, University of East Anglia, Norwich Research Park
+ 3 more
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
3
(100% Open Access)
Cited by:
9
h-index:
5
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
29

phastSim: efficient simulation of sequence evolution for pandemic-scale datasets

Nicola Maio et al.Oct 24, 2023
+4
L
W
N
Abstract Sequence simulators are fundamental tools in bioinformatics, as they allow us to test data processing and inference tools, as well as being part of some inference methods. The ongoing surge in available sequence data is however testing the limits of our bioinformatics software. One example is the large number of SARS-CoV-2 genomes available, which are beyond the processing power of many methods, and simulating such large datasets is also proving difficult. Here we present a new algorithm and software for efficiently simulating sequence evolution along extremely large trees (e.g. < 100, 000 tips) when the branches of the tree are short, as is typical in genomic epidemiology. Our algorithm is based on the Gillespie approach, and implements an efficient multi-layered search tree structure that provides high computational efficiency by taking advantage of the fact that only a small proportion of the genome is likely to mutate at each branch of the considered phylogeny. Our open source software is available from https://github.com/NicolaDM/phastSim and allows easy integration with other Python packages as well as a variety of evolutionary models, including indel models and new hypermutatability models that we developed to more realistically represent SARS-CoV-2 genome evolution. Author summary One of the most influential responses to the SARS-CoV-2 pandemic has been the widespread adoption of genome sequencing to keep track of viral spread and evolution. This has resulted in vast availability of genomic sequence data, that, while extremely useful and promising, is also increasingly hard to store and process efficiently. An important task in the processing of this genetic data is simulation, that is, recreating potential histories of past and future virus evolution, to benchmark data analysis methods and make statistical inference. Here, we address the problem of efficiently simulating large numbers of closely related genomes, similar to those sequenced during SARS-CoV-2 pandemic, or indeed to most scenarios in genomic epidemiology. We develop a new algorithm to perform this task, that provides not only computational efficiency, but also extreme flexibility in terms of possible evolutionary models, allowing variation in mutation rates, non-stationary evolution, and indels; all phenomena that play an important role in SARS-CoV-2 evolution, as well as many other real-life epidemiological scenarios.
0

Single-cell multi-omics reveals insights into differentiation of rare cell types in mucinous colorectal cancer

Christopher Ladaika et al.May 27, 2024
+2
W
A
C
Neuroendocrine cells have been implicated in therapeutic resistance and worse overall survival in many cancer types. Mucinous colorectal cancer (mCRC) is uniquely enriched for enteroendocrine cells (EECs), the neuroendocrine cell of the normal colon epithelium, as compared to non-mucinous CRC. Therefore, targeting EEC differentiation may have clinical value in mCRC. Here, single cell multi-omics was used to uncover epigenetic alterations that accompany EEC differentiation, identify STAT3 as a novel regulator of EEC specification, and discover a rare cancer-specific cell type with enteric neuron-like characteristics. Further experiments demonstrated that lysine-specific demethylase 1 (LSD1) and CoREST2 mediate STAT3 demethylation and regulate STAT3 chromatin binding. Knockdown of CoREST2 in an orthotopic xenograft mouse model resulted in decreased primary tumor growth and lung metastases. In culmination, these results provide rationale for new LSD1 inhibitors that target the interaction between LSD1 with STAT3 or CoREST2, which may improve clinical outcomes for patients with mCRC.
13

SWAMPy: Simulating SARS-CoV-2 Wastewater Amplicon Metagenomes with Python

William Boulton et al.Oct 24, 2023
+2
H
F
W
Abstract Motivation Tracking SARS-CoV-2 variants through genomic sequencing has been an important part of the global response to the pandemic. As well as whole-genome sequencing of clinical samples, this surveillance effort has been aided by amplicon sequencing of wastewater samples, which proved effective in real case studies. Because of its relevance to public healthcare decisions, testing and benchmarking wastewater sequencing analysis methods is also crucial, which necessitates a simulator. Although metagenomic simulators exist, none are fit for the purpose of simulating the metagenomes produced through amplicon sequencing of wastewater. Results Our new simulation tool, SWAMPy ( S imulating SARS-CoV-2 W astewater A mplicon M etagenomes with Py thon), is intended to provide realistic simulated SARS-CoV-2 wastewater sequencing datasets with which other programs that rely on this type of data can be evaluated and improved. Availability The code for this project is available at https://github.com/goldman-gp-ebi/SWAMPy It can be installed on any Unix-based operating system and is available under the GPL-v3 license.