TB
Thomas Booth
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(80% Open Access)
Cited by:
17
h-index:
13
/
i10-index:
19
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

cblaster: a remote search tool for rapid identification and visualisation of homologous gene clusters

Cameron Gilchrist et al.Nov 9, 2020
+4
B
T
C
Abstract Genes involved in coordinated biological pathways, including metabolism, drug resistance and virulence, are often collocalised as gene clusters. Identifying homologous gene clusters aids in the study of their function and evolution, however existing tools are limited to searching local sequence databases. Tools for remotely searching public databases are necessary to keep pace with the rapid growth of online genomic data. Here, we present cblaster , a Python based tool to rapidly detect collocated genes in local and remote databases. cblaster is easy to use, offering both a command line and a user-friendly graphical user interface (GUI). It generates outputs that enable intuitive visualisations of large datasets, and can be readily incorporated into larger bioinformatic pipelines. cblaster is a significant update to the comparative genomics toolbox. cblaster source code and documentation is freely available from GitHub under the MIT license (github.com/gamcil/cblaster).
1
Citation9
0
Save
10

Bifurcation drives the evolution of assembly-line biosynthesis

Thomas Booth et al.Jun 23, 2021
+3
K
T
T
Abstract Reprogramming biosynthetic assembly-lines is a topic of intense interest. This is unsurprising as the scaffolds of most antibiotics in current clinical use are produced by such pathways. The modular nature of assembly-lines provides a direct relationship between the sequence of enzymatic domains and the chemical structure of the product, but rational reprogramming efforts have been met with limited success. To gain greater insight into the design process, we wanted to examine how Nature creates assembly-lines and searched for biosynthetic pathways that might represent evolutionary transitions. By examining the biosynthesis of the anti-tubercular wollamides, we show how whole gene duplication and neofunctionalization can result in pathway bifurcation. Importantly, we show that neofunctionalization occurs primarily through intragenomic recombination. This pathway bifurcation leads to redundancy, providing the genetic robustness required to enable large structural changes during the evolution of antibiotic structures. Should the new product be none-functional, gene loss can restore the original genotype. However, if the new product confers an advantage, depreciation and eventual loss of the original gene creates a new linear pathway. This provides the blind watchmaker equivalent to the ‘design, build, test’ cycle of synthetic biology.
10
Citation3
0
Save
73

getphylo: rapid and automatic generation of multi-locus phylogenetic trees

Thomas Booth et al.Jul 29, 2023
T
S
T
Abstract Motivation Phylogenetic trees are the primary tool for visualising evolutionary relationships. Traditionally, phylogenies are inferred from manually curated sets of marker genes. As available genomic data increases, there is increasing demand for tools to automatically build phylogenies from assembled genomes. Existing tools rely on reference databases of preselected marker genes, limiting their taxonomic scope. We sought to develop a tool that could quickly build phylogeny from input genomes alone. Results We developed getphylo , a tool to automatically generate multi-locus phylogenetic trees from GenBank files. It has a low barrier to entry with minimal dependencies. getphylo uses a parallelised, heuristic workflow to keep runtime and system requirements as low as possible. getphylo consistently produces trees with topologies comparable to other tools in less time. Furthermore, as getphylo does not rely on reference databases, it has a virtually unlimited scope in terms of taxonomy (e.g., not limited to bacteria) and genetic scale (e.g., can analyse plasmids, prophage, and gene clusters). This combination of speed and flexibility makes getphylo a valuable addition to the phylogenetics toolkit. Availability getphylo is freely available and is downloadable through the Python Package Index ( pip install getphylo ; https://pypi.org/project/getphylo/ ) and GitHub ( https://github.com/drboothtj/getphylo ).
73
Citation2
0
Save
0

A treasure trove of 1034 actinomycete genomes

Tue Jørgensen et al.Jun 22, 2024
+10
E
O
T
Abstract Filamentous Actinobacteria, recently renamed Actinomycetia, are the most prolific source of microbial bioactive natural products. Studies on biosynthetic gene clusters benefit from or require chromosome-level assemblies. Here, we provide DNA sequences from &gt;1000 isolates: 881 complete genomes and 153 near-complete genomes, representing 28 genera and 389 species, including 244 likely novel species. All genomes are from filamentous isolates of the class Actinomycetia from the NBC culture collection. The largest genus is Streptomyces with 886 genomes including 742 complete assemblies. We use this data to show that analysis of complete genomes can bring biological understanding not previously derived from more fragmented sequences or less systematic datasets. We document the central and structured location of core genes and distal location of specialized metabolite biosynthetic gene clusters and duplicate core genes on the linear Streptomyces chromosome, and analyze the content and length of the terminal inverted repeats which are characteristic for Streptomyces. We then analyze the diversity of trans-AT polyketide synthase biosynthetic gene clusters, which encodes the machinery of a biotechnologically highly interesting compound class. These insights have both ecological and biotechnological implications in understanding the importance of high quality genomic resources and the complex role synteny plays in Actinomycetia biology.
0
Citation1
0
Save
0

A treasure trove of 1,034 actinomycete genomes

Tue Jørgensen et al.Jan 16, 2024
+11
E
O
T
Abstract Filamentous Actinobacteria, previously Actinomycetia, are the most prolific source of microbial bioactive natural products. Studies on biosynthetic gene clusters benefit from or require chromosome-level assemblies. Here, we provide DNA sequences from more than 1,000 isolates: 881 complete genomes and 153 near-complete genomes, representing 28 genera and 389 species, including 244 likely novel species. All genomes are from filamentous isolates of the class Actinomycetia from the NBC culture collection. The largest genus is Streptomyces with 886 genomes including 742 complete assemblies. We use this data to show that analysis of complete genomes can bring biological understanding not previously derived from more fragmented sequences or less systematic datasets. We document the central and structured location of core genes and distal location of specialized metabolite biosynthetic gene clusters and duplicate core genes on the linear Streptomyces chromosome, and analyze the content and length of the terminal inverted repeats which are characteristic for Streptomyces . We then analyze the diversity of trans-AT polyketide synthase biosynthetic gene clusters, which encodes the machinery of a biotechnologically highly interesting compound class. These insights have both ecological and biotechnological implications in understanding the importance of high quality genomic resources and the complex role synteny plays in Actinomycetia biology.
0
Citation1
0
Save
0

Pangenome mining of theStreptomycesgenus redefines their biosynthetic potential

Omkar Mohite et al.Feb 22, 2024
+5
T
T
O
Abstract Background Streptomyces is a highly diverse genus known for the production of secondary or specialized metabolites with a wide range of applications in the medical and agricultural industries. Several thousand complete or nearly-complete Streptomyces genome sequences are now available, affording the opportunity to deeply investigate the biosynthetic potential within these organisms and to advance natural product discovery initiatives. Result We performed pangenome analysis on 2,371 Streptomyces genomes, including approximately 1,200 complete assemblies. Employing a data-driven approach based on genome similarities, the Streptomyces genus was classified into 7 primary and 42 secondary MASH-clusters, forming the basis for a comprehensive pangenome mining. A refined workflow for grouping biosynthetic gene clusters (BGCs) redefined their diversity across different MASH-clusters. This workflow also reassigned 2,729 known BGC families to only 440 families, a reduction caused by inaccuracies in BGC boundary detections. When the genomic location of BGCs is included in the analysis, a conserved genomic structure (synteny) among BGCs becomes apparent within species and MASH-clusters. This synteny suggests that vertical inheritance is a major factor in the acquisition of new BGCs. Conclusion Our analysis of a genomic dataset at a scale of thousands of genomes refined predictions of BGC diversity using MASH-clusters as a basis for pangenome analysis. The observed conservation in the order of BGCs’ genomic locations showed that the BGCs are vertically inherited. The presented workflow and the in-depth analysis pave the way for large-scale pangenome investigations and enhance our understanding of the biosynthetic potential of the Streptomyces genus.
0
Citation1
0
Save
60

CAGECAT: The CompArative GEne Cluster Analysis Toolbox for rapid search and visualisation of homologous gene clusters

Matthias Belt et al.Feb 10, 2023
+3
C
M
M
ABSTRACT Background Co-localized sets of genes that encode specialized functions are common across microbial genomes and occur in genomes of larger eukaryotes as well. Important examples include Biosynthetic Gene Clusters (BGCs) that produce specialized metabolites with medicinal, agricultural, and industrial value (e.g. antimicrobials). Comparative analysis of BGCs can aid in the discovery of novel metabolites by highlighting distribution and identifying variants in public genomes. Unfortunately, gene-cluster-level homology detection remains inaccessible, time-consuming and difficult to interpret. Results The comparative gene cluster analysis toolbox (CAGECAT) is a rapid and user-friendly platform to mitigate difficulties in comparative analysis of whole gene clusters. The software provides homology searches and downstream analyses without the need for command-line or programming expertise. By leveraging remote BLAST databases, which always provide up-to-date results, CAGECAT can yield relevant matches that aid in the comparison, taxonomic distribution, or evolution of an unknown query. The service is extensible and interoperable and implements the cblaster and clinker pipelines to perform homology search, filtering, gene neighbourhood estimation, and dynamic visualisation of resulting variant BGCs. With the visualisation module, publication-quality figures can be customized directly from a web-browser, which greatly accelerates their interpretation via informative overlays to identify conserved genes in a BGC query. Conclusion Overall, CAGECAT is an extensible software that can be interfaced via a standard web-browser for whole region homology searches and comparison on continually updated genomes from NCBI. The public web server and installable docker image are open source and freely available without registration at: https://cagecat.bioinformatics.nl
1

Yersinia pestis genomes reveal plague in Britain 4,000 years ago

Pooja Swali et al.Jan 26, 2022
+14
A
R
P
Abstract Extinct lineages of Yersinia pestis , the causative agent of the plague, have been identified in several individuals from Central Europe and Asia between 5,000 and 3,500 years before present (BP). One of these, the ‘LNBA lineage’ (Late Neolithic and Bronze Age), has been suggested to have spread into Central Europe with human groups expanding from the Eurasian steppes. Here, we show that LNBA plague was spread to Europe’s northwestern periphery by sequencing Yersinia pestis genomes from two individuals dating to ~4,000 cal BP from an unusual mass burial context in Somerset, England, UK. This represents the earliest evidence of plague in Britain documented to date. These British Yersinia pestis genomes belong to a sublineage previously observed in two Bronze Age individuals from Central Europe that had lost the putative virulence factor yapC . This sublineage is later found in Central Asia ~3,600 BP. While the severity of disease is currently unclear, the wide geographic distribution within a few centuries suggests substantial transmissibility.
8

Biosynthesis of the azoxy compound azodyrecin from Streptomyces mirabilis P8-A2

Matiss Maleckis et al.Jan 1, 2023
+9
T
M
M
Azoxy compounds are a distinctive group of bioactive secondary metabolites, characterized by a unique RN=N+(O-)R moiety. The azoxy moiety is present in various classes of metabolites that exhibit various biological activities. The enzymatic mechanisms underlying azoxy bond formation remain enigmatic. Azodyrecins are cytotoxic azoxy metabolites produced by Streptomyces mirabilis P8-A2. Here we cloned and confirmed the putative azd biosynthetic gene cluster through CATCH cloning followed by expression and production of azodyrecins in two heterologous hosts, S. albidoflavus J1074 and S. coelicolor M1146, respectively. We explored the function of 14 enzymes in azodyrecin biosynthesis through gene knock-out using CRISPR-Cas9 base editing in the native producer, S. mirabilis P8-A2. The key intermediates were analyzed in the mutants through MS/MS fragmentation studies, revealing azoxy bond formation via the conversion of hydrazine to azo compound; followed by further oxygenation. Additionally, N-oxygenase and dehydrogenase activities were confirmed among 8 core biosynthetic genes and five helper genes. Moreover, the distribution of the azoxy biosynthetic gene clusters across Streptomyces spp. genomes is explored, highlighting the presence of these clusters in over 20% of the Streptomyces spp. genomes and revealing that azoxymycin and valanimycin are scarce, while azodyrecin and KA57A like clusters are widely distributed across the phylogenetic tree.
0

The Beaker Phenomenon And The Genomic Transformation Of Northwest Europe

Ïñigo Olalde et al.May 9, 2017
+108
M
S
Ï
Bell Beaker pottery spread across western and central Europe beginning around 2750 BCE before disappearing between 2200-1800 BCE. The mechanism of its expansion is a topic of long-standing debate, with support for both cultural diffusion and human migration. We present new genome-wide ancient DNA data from 170 Neolithic, Copper Age and Bronze Age Europeans, including 100 Beaker-associated individuals. In contrast to the Corded Ware Complex, which has previously been identified as arriving in central Europe following migration from the east, we observe limited genetic affinity between Iberian and central European Beaker Complex-associated individuals, and thus exclude migration as a significant mechanism of spread between these two regions. However, human migration did have an important role in the further dissemination of the Beaker Complex, which we document most clearly in Britain using data from 80 newly reported individuals dating to 3900-1200 BCE. British Neolithic farmers were genetically similar to contemporary populations in continental Europe and in particular to Neolithic Iberians, suggesting that a portion of the farmer ancestry in Britain came from the Mediterranean rather than the Danubian route of farming expansion. Beginning with the Beaker period, and continuing through the Bronze Age, all British individuals harboured high proportions of Steppe ancestry and were genetically closely related to Beaker-associated individuals from the Lower Rhine area. We use these observations to show that the spread of the Beaker Complex to Britain was mediated by migration from the continent that replaced >90% of Britain's Neolithic gene pool within a few hundred years, continuing the process that brought Steppe ancestry into central and northern Europe 400 years earlier.