JS
Jacob Steenwyk
Author with expertise in Diversity and Evolution of Fungal Pathogens
Howard Hughes Medical Institute, University of California, Berkeley, Vanderbilt University
+ 4 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
46
(67% Open Access)
Cited by:
61
h-index:
27
/
i10-index:
45
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
107

ClipKIT: a multiple sequence alignment-trimming algorithm for accurate phylogenomic inference

Jacob Steenwyk et al.Oct 24, 2023
+2
Y
T
J
Abstract Highly divergent sites in multiple sequence alignments, which stem from erroneous inference of homology and saturation of substitutions, are thought to negatively impact phylogenetic inference. Trimming methods aim to remove these sites before phylogenetic inference, but recent analysis suggests that doing so can worsen inference. We introduce ClipKIT, a trimming method that instead aims to retain phylogenetically-informative sites; phylogenetic inference using ClipKIT-trimmed alignments is accurate, robust, and time-saving.
107
Citation15
0
Save
207

A genome-scale phylogeny of Fungi; insights into early evolution, radiations, and the relationship between taxonomy and phylogeny

Yuanning Li et al.Oct 24, 2023
+9
Y
J
Y
Abstract Phylogenomic studies based on genome-scale amounts of data have greatly improved understanding of the tree of life. Despite their diversity, ecological significance, and biomedical and industrial importance, large-scale phylogenomic studies of Fungi are lacking. Furthermore, several evolutionary relationships among major fungal lineages remain controversial, especially those at the base of the fungal phylogeny. To begin filling these gaps and assess progress toward a genome-scale phylogeny of the entire fungal kingdom, we compiled a phylogenomic data matrix of 290 genes from the genomes of 1,644 fungal species that includes representatives from most major fungal lineages; we also compiled 11 additional data matrices by subsampling genes or taxa based on filtering criteria previously shown to improve phylogenomic inference. Analyses of these 12 data matrices using concatenation- and coalescent-based approaches yielded a robust phylogeny of the kingdom in which ∼85% of internal branches were congruent across data matrices and approaches used. We found support for several relationships that have been historically contentious (e.g., for the placement of Wallemiomycotina (Basidiomycota), as sister to Agaricomycotina), as well as evidence for polytomies likely stemming from episodes of ancient diversification (e.g., at the base of Basidiomycota). By examining the relative evolutionary divergence of taxonomic groups of equivalent rank, we found that fungal taxonomy is broadly aligned with genome sequence divergence, but also identified lineages, such as the subphylum Saccharomycotina, where current taxonomic circumscription does not fully account for their high levels of evolutionary divergence. Our results provide a robust phylogenomic framework to explore the tempo and mode of fungal evolution and directions for future fungal phylogenetic and taxonomic studies.
207
Paper
Citation14
0
Save
89

Genome-scale phylogeny and contrasting modes of genome evolution in the fungal phylum Ascomycota

Xing‐Xing Shen et al.Oct 24, 2023
+7
A
J
X
Abstract Ascomycota, the largest and best-studied phylum of fungi, contains three subphyla: Saccharomycotina (budding yeasts), Pezizomycotina (filamentous fungi), and Taphrinomycotina (fission yeasts); organisms from all three subphyla have been invaluable as models in diverse fields (e.g., biotechnology, cell biology, genetics, and medicine). Despite its importance, we still lack a comprehensive genome-scale phylogeny or understanding of the similarities and differences in the mode of genome evolution within this phylum. To address these gaps, we examined 1,107 genomes from Saccharomycotina (332), Pezizomycotina (761), and Taphrinomycotina (14) species to infer the Ascomycota phylogeny, estimate its timetree, and examine the evolution of key genomic properties. We inferred a robust genome-wide phylogeny that resolves several contentious relationships and estimated that the Ascomycota last common ancestor likely originated in the Ediacaran (~563 ± 68 million years ago). Comparisons of genomic properties revealed that Saccharomycotina and Pezizomycotina, the two taxon-rich subphyla, differed greatly in their genome properties. Saccharomycotina typically have smaller genomes, lower GC contents, lower numbers of genes, and higher rates of molecular sequence evolution compared to Pezizomycotina. Ancestral state reconstruction showed that the genome properties of the Saccharomycotina and Pezizomycotina last common ancestors were very similar, enabling inference of the direction of evolutionary change. For example, we found that a lineage-specific acceleration led to a 1.6-fold higher evolutionary rate in Saccharomycotina, whereas the 10% difference in GC content between Saccharomycotina and Pezizomycotina genomes stems from a trend toward AT bases within budding yeasts and toward GC bases within filamentous fungi. These results provide a robust evolutionary framework for understanding the diversification of the largest fungal phylum.
89
Paper
Citation8
0
Save
0

Functional characterization of clinical isolates of the opportunistic fungal pathogen Aspergillus nidulans

Rafael Bastos et al.May 7, 2020
+22
L
C
R
Abstract Aspergillus nidulans is an opportunistic fungal pathogen in patients with immunodeficiency and virulence of A. nidulans isolates has mainly been studied in the context of the chronic granulomatous disease (CGD), with characterization of clinical isolates obtained from non-CGD patients remaining elusive. This study therefore carried out a detailed biological characterization of two A. nidulans clinical isolates (CIs), obtained from a patient with breast carcinoma and pneumonia and from a patient with cystic fibrosis that underwent lung transplantation, and compared them to the reference, non-clinical A4 strain. Both CIs presented increased growth in comparison to the reference strain in the presence of physiologically-relevant carbon sources. Metabolomic analyses showed that the three strains are metabolically very different from each other in these carbon sources. Furthermore, the CIs were highly susceptible to cell wall perturbing agents but not to other physiologically-relevant stresses. Genome analyses identified several frame-shift variants in genes encoding cell wall integrity (CWI) signalling components. Significant differences in CWI signalling were confirmed by western blotting among the three strains. In vivo virulence studies using several different models revealed that strain MO80069 had significantly higher virulence in hosts with impaired neutrophil function when compared to the other strains. In summary, this study presents detailed biological characterization of two A. nidulans sensu stricto clinical isolates. Just like in A. fumigatus, strain heterogeneity exists in A. nidulans clinical strains that can define virulence traits. Further studies are required to fully characterize A. nidulans strain-specific virulence traits and pathogenicity. Importance Immunocompromised patients are susceptible to infections with opportunistic filamentous fungi from the genus Aspergillus. Although A. fumigatus is the main etiological agent of Aspergillus spp.-related infections, other species, such as A. nidulans are prevalent in a condition-specific manner. A. nidulans is a predominant infective agent in patients suffering from chronic granulomatous disease (CGD). A. nidulans isolates have mainly been studied in the context of CGD, although infection with A. nidulans also occurs in non-CGD patients. This study carried out a detailed biological characterization of two non-CGD A. nidulans clinical isolates and compared it to a reference strain. Phenotypic, metabolomic and genomic analyses highlight fundamental differences in carbon source utilization, stress responses and maintenance of cell wall integrity among the strains. One clinical strain had increased virulence in models with impaired neutrophil function. Just as in A. fumigatus, strain heterogeneity exists in A. nidulans clinical strains that can define virulence traits.
40

Genomic and phenotypic analysis of COVID-19-associated pulmonary aspergillosis isolates of Aspergillus fumigatus

Jacob Steenwyk et al.Oct 24, 2023
+14
P
M
J
Abstract The ongoing global pandemic caused by the severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) is responsible for the coronavirus disease 2019 (COVID-19) first described from Wuhan, China. A subset of COVID-19 patients has been reported to have acquired secondary infections by microbial pathogens, such as fungal opportunistic pathogens from the genus Aspergillus . To gain insight into COVID-19 associated pulmonary aspergillosis (CAPA), we analyzed the genomes and characterized the phenotypic profiles of four CAPA isolates of Aspergillus fumigatus obtained from patients treated in the area of North Rhine-Westphalia, Germany. By examining the mutational spectrum of single nucleotide polymorphisms, insertion-deletion polymorphisms, and copy number variants among 206 genes known to modulate A. fumigatus virulence, we found that CAPA isolate genomes do not exhibit major differences from the genome of the Af293 reference strain. By examining virulence in an invertebrate moth model, growth in the presence of osmotic, cell wall, and oxidative stressors, and the minimum inhibitory concentration of antifungal drugs, we found that CAPA isolates were generally, but not always, similar to A. fumigatus reference strains Af293 and CEA17. Notably, CAPA isolate D had more putative loss of function mutations in genes known to increase virulence when deleted (e.g., in the FLEA gene, which encodes a lectin recognized by macrophages). Moreover, CAPA isolate D was significantly more virulent than the other three CAPA isolates and the A. fumigatus reference strains tested. These findings expand our understanding of the genomic and phenotypic characteristics of isolates that cause CAPA.
0

Examination of gene loss in the DNA mismatch repair pathway and its mutational consequences in a fungal phylum

Megan Phillips et al.Jun 1, 2024
A
X
J
M
Abstract The DNA mismatch repair (MMR) pathway corrects mismatched bases produced during DNA replication and is highly conserved across the tree of life, reflecting its fundamental importance for genome integrity. Loss of function in one or a few MMR genes can lead to increased mutation rates and microsatellite instability, as seen in some human cancers. While loss of MMR genes has been documented in the context of human disease and in hypermutant strains of pathogens, examples of entire species and species lineages that have experienced substantial MMR gene loss are lacking. We examined the genomes of 1,107 species in the fungal phylum Ascomycota for the presence of 52 genes known to be involved in the MMR pathway of fungi. We found that the median ascomycete genome contained 49 / 52 MMR genes. In contrast, four closely related species of obligate plant parasites from the powdery mildew genera Erysiphe and Blumeria , have lost between 5 and 21 MMR genes, including MLH3 , EXO1 , and DPB11 . The lost genes span MMR functions, include genes that are conserved in all other ascomycetes, and loss of function of any of these genes alone has been previously linked to increased mutation rate. Consistent with the hypothesis that loss of these genes impairs MMR pathway function, we found that powdery mildew genomes with higher levels of MMR gene loss exhibit increased numbers of mononucleotide runs, longer microsatellites, accelerated sequence evolution, elevated mutational bias in the A|T direction, and decreased GC content. These results identify a striking example of macroevolutionary loss of multiple MMR pathway genes in a eukaryotic lineage, even though the mutational outcomes of these losses appear to resemble those associated with detrimental MMR dysfunction in other organisms. Significance Statement The DNA mismatch repair pathway corrects nucleotide base errors that occur during the replication of DNA; loss of these genes leads to cancer. We examined the conservation of the DNA mismatch repair pathway’s genes across more than 1,000 species in a fungal phylum and found a lineage of powdery mildews, a group of fungi that infect the leaves of plants, which have experienced extensive loss of multiple, otherwise highly conserved, genes. The genomes of these powdery mildews show elevated rates of diverse types of mutation, raising the hypothesis that these organisms have diversified while lacking genes thought to be essential for the accurate replication of DNA.
0
Paper
Citation3
0
Save
7

Aspergillus fumigatusacetate utilisation impacts virulence traits and pathogenicity

Laure Ries et al.Oct 24, 2023
+17
L
P
L
Abstract Aspergillus fumigatus is a major opportunistic fungal pathogen of immunocompromised and immunocompetent hosts. To successfully establish an infection, A. fumigatus needs to use host carbon sources, such as acetate, present in the body fluids and peripheral tissues. However, utilisation of acetate as a carbon source by fungi in the context of infection has not been investigated. This work shows that acetate is metabolised via different pathways in A. fumigatus and that acetate utilisation is under the regulatory control of a transcription factor (TF), FacB. A. fumigatus acetate utilisation is subject to carbon catabolite repression (CCR), although this is only partially dependent on the TF and main regulator of CCR CreA. The available extracellular carbon source, in this case glucose and acetate, significantly affected A. fumigatus virulence traits such as secondary metabolite secretion and cell wall composition, with the latter having consequences for resistance to oxidative stress, to anti-fungal drugs and to human neutrophil-mediated killing. Furthermore, deletion of facB significantly impaired the in vivo virulence of A. fumigatus in both insect and mammalian models of invasive aspergillosis. This is the first report on acetate utilisation in A. fumigatus and this work further highlights the importance of available host-specific carbon sources in shaping fungal virulence traits and subsequent disease outcome, and a potential target for the development of anti-fungal strategies. Importance Aspergillus fumigatus is an opportunistic fungal pathogen in humans. During infection, A. fumigatus is predicted to use host carbon sources, such as acetate, present in body fluids and peripheral tissues, to sustain growth and promote colonisation and invasion. This work shows that A. fumigatus metabolises acetate via different pathways, a process that is dependent on the transcription factor FacB. Furthermore, the type and concentration of the extracellular available carbon source were determined to shape A. fumigatus virulence determinants such as secondary metabolite secretion and cell wall composition. Subsequently, interactions with immune cells are altered in a carbon source-specific manner. FacB is required for A. fumigatus in vivo virulence in both insect and mammalian models of invasive aspergillosis. This is the first report that characterises acetate utilisation in A. fumigatus and highlights the importance of available host-specific carbon sources in shaping virulence traits and potentially subsequent disease outcome.
17

Phylogenomics reveals extensive misidentification of fungal strains from the genusAspergillus

Jacob Steenwyk et al.Oct 24, 2023
+10
H
C
J
Abstract Modern taxonomic classification is often based on phylogenetic analyses of a few molecular markers, although single-gene studies are still common. However, the use of one or few molecular markers can lead to inaccurate inferences of species history and errors in classification. Here, we leverage genome-scale molecular phylogenetics (phylogenomics) of species and populations to reconstruct evolutionary relationships in a dense dataset of 711 fungal genomes from the biomedically and technologically important genus Aspergillus . To do so, we generated a novel set of 1,362 high-quality molecular markers specific for Aspergillus and provide profile Hidden Markov Models for each, facilitating others to use these molecular markers. Examination of the resulting genome-scale phylogeny: (1) helped resolve ongoing taxonomic controversies and identified new ones; (2) revealed extensive strain misidentification, underscoring the importance of population-level sampling in species classification; and (3) identified novel lineages that may shed light on the early evolution of an important genus. These findings suggest that phylogenomics of species and populations can facilitate accurate taxonomic classifications and reconstructions of the tree of life.
17
Citation2
0
Save
75

BioKIT: a versatile toolkit for processing and analyzing diverse types of sequence data

Jacob Steenwyk et al.Oct 24, 2023
+9
C
T
J
Abstract Bioinformatic analysis—such as genome assembly quality assessment, alignment summary statistics, relative synonymous codon usage, paired-end aware quality trimming and filtering of sequencing reads, file format conversion, and processing and analysis—is integrated into diverse disciplines in the biological sciences. Several command-line pieces of software have been developed to conduct some of these individual analyses; however, the lack of a unified toolkit that conducts all these analyses can be a barrier in workflows. To address this obstacle, we introduce BioKIT, a versatile toolkit for the UNIX shell environment with 40 functions, several of which were community-sourced, that conduct routine and novel processing and analysis of genome assemblies, multiple sequence alignments, coding sequences, sequencing data, and more. To demonstrate the utility of BioKIT, we assessed the quality and characteristics of 901 eukaryotic genome assemblies, calculated alignment summary statistics for 10 phylogenomic data matrices, determined relative synonymous codon usage across 171 fungal genomes including those that use alternative genetic codes, and demonstrate that a novel metric, gene-wise relative synonymous codon usage, can accurately estimate gene-wise codon optimization. BioKIT will be helpful in facilitating and streamlining sequence analysis workflows. BioKIT is freely available under the MIT license from GitHub ( https://github.com/JLSteenwyk/BioKIT ), PyPi ( https://pypi.org/project/jlsteenwykbiokit/ ), and the Anaconda Cloud ( https://anaconda.org/jlsteenwyk/jlsteenwyk-biokit ). Documentation, user tutorials, and instructions for requesting new features are available online ( https://jlsteenwyk.com/BioKIT ).
6

Feature Frequency Profile-based phylogenies are inaccurate

Yuanning Li et al.Oct 24, 2023
+3
X
K
Y
Abstract Choi and Kim (PNAS, 117: 3678-3686; first published February 4, 2020; https://doi.org/10.1073/pnas.1915766117 ) used the alignment-free Feature Frequency Profile (FFP) method to reconstruct a broad sketch of the tree of life based on proteome data from 4,023 taxa. The FFP-based reconstruction reports many relationships that strongly contradict the current consensus view of the tree of life and its accuracy has not been tested. Comparison of FFP with current standard approaches, such as concatenation and coalescence, using simulation analyses shows that FFP performs poorly. We conclude that the phylogeny of the tree of life reconstructed by Choi and Kim is suspect based on methodology as well as prior phylogenetic evidence.
Load More