MP
Morgan Price
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
36
(58% Open Access)
Cited by:
18,505
h-index:
47
/
i10-index:
82
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

FastTree 2 – Approximately Maximum-Likelihood Trees for Large Alignments

Morgan Price et al.Mar 9, 2010
A
P
M
Background We recently described FastTree, a tool for inferring phylogenies for alignments with up to hundreds of thousands of sequences. Here, we describe improvements to FastTree that improve its accuracy without sacrificing scalability. Methodology/Principal Findings Where FastTree 1 used nearest-neighbor interchanges (NNIs) and the minimum-evolution criterion to improve the tree, FastTree 2 adds minimum-evolution subtree-pruning-regrafting (SPRs) and maximum-likelihood NNIs. FastTree 2 uses heuristics to restrict the search for better trees and estimates a rate of evolution for each site (the “CAT” approximation). Nevertheless, for both simulated and genuine alignments, FastTree 2 is slightly more accurate than a standard implementation of maximum-likelihood NNIs (PhyML 3 with default settings). Although FastTree 2 is not quite as accurate as methods that use maximum-likelihood SPRs, most of the splits that disagree are poorly supported, and for large alignments, FastTree 2 is 100–1,000 times faster. FastTree 2 inferred a topology and likelihood-based local support values for 237,882 distinct 16S ribosomal RNAs on a desktop computer in 22 hours and 5.8 gigabytes of memory. Conclusions/Significance FastTree 2 allows the inference of maximum-likelihood phylogenies for huge alignments. FastTree 2 is freely available at http://www.microbesonline.org/fasttree.
0

An improved Greengenes taxonomy with explicit ranks for ecological and evolutionary analyses of bacteria and archaea

Daniel McDonald et al.Dec 1, 2011
+6
J
M
D
Abstract Reference phylogenies are crucial for providing a taxonomic framework for interpretation of marker gene and metagenomic surveys, which continue to reveal novel species at a remarkable rate. Greengenes is a dedicated full-length 16S rRNA gene database that provides users with a curated taxonomy based on de novo tree inference. We developed a ‘taxonomy to tree’ approach for transferring group names from an existing taxonomy to a tree topology, and used it to apply the Greengenes, National Center for Biotechnology Information (NCBI) and cyanoDB (Cyanobacteria only) taxonomies to a de novo tree comprising 408 315 sequences. We also incorporated explicit rank information provided by the NCBI taxonomy to group names (by prefixing rank designations) for better user orientation and classification consistency. The resulting merged taxonomy improved the classification of 75% of the sequences by one or more ranks relative to the original NCBI taxonomy with the most pronounced improvements occurring in under-classified environmental sequences. We also assessed candidate phyla (divisions) currently defined by NCBI and present recommendations for consolidation of 34 redundantly named groups. All intermediate results from the pipeline, which includes tree inference, jackknifing and transfer of a donor taxonomy to a recipient tree (tax2tree) are available for download. The improved Greengenes taxonomy should provide important infrastructure for a wide range of megasequencing projects studying ecosystems on scales ranging from our own bodies (the Human Microbiome Project) to the entire planet (the Earth Microbiome Project). The implementation of the software can be obtained from http://sourceforge.net/projects/tax2tree/.
0
Citation4,695
0
Save
0

Mutant phenotypes for thousands of bacterial genes of unknown function

Morgan Price et al.May 14, 2018
+19
R
K
M
One-third of all protein-coding genes from bacterial genomes cannot be annotated with a function. Here, to investigate the functions of these genes, we present genome-wide mutant fitness data from 32 diverse bacteria across dozens of growth conditions. We identified mutant phenotypes for 11,779 protein-coding genes that had not been annotated with a specific function. Many genes could be associated with a specific condition because the gene affected fitness only in that condition, or with another gene in the same bacterium because they had similar mutant phenotypes. Of the poorly annotated genes, 2,316 had associations that have high confidence because they are conserved in other bacteria. By combining these conserved associations with comparative genomics, we identified putative DNA repair proteins; in addition, we propose specific functions for poorly annotated enzymes and transporters and for uncharacterized protein families. Our study demonstrates the scalability of microbial genetics and its utility for improving gene annotations. A large-scale mutagenesis screen identifies mutant phenotypes for over 11,000 protein-coding genes in bacteria that had previously not been assigned a specific function.
0
Citation490
0
Save
0

MicrobesOnline: an integrated portal for comparative and functional genomics

Paramvir Dehal et al.Nov 11, 2009
+10
K
G
P
Since 2003, MicrobesOnline (http://www.microbesonline.org) has been providing a community resource for comparative and functional genome analysis. The portal includes over 1000 complete genomes of bacteria, archaea and fungi and thousands of expression microarrays from diverse organisms ranging from model organisms such as Escherichia coli and Saccharomyces cerevisiae to environmental microbes such as Desulfovibrio vulgaris and Shewanella oneidensis. To assist in annotating genes and in reconstructing their evolutionary history, MicrobesOnline includes a comparative genome browser based on phylogenetic trees for every gene family as well as a species tree. To identify co-regulated genes, MicrobesOnline can search for genes based on their expression profile, and provides tools for identifying regulatory motifs and seeing if they are conserved. MicrobesOnline also includes fast phylogenetic profile searches, comparative views of metabolic pathways, operon predictions, a workbench for sequence analysis and integration with RegTransBase and other microbial genome resources. The next update of MicrobesOnline will contain significant new functionality, including comparative analysis of metagenomic sequence data. Programmatic access to the database, along with source code and documentation, is available at http://microbesonline.org/programmers.html.
0
Citation439
0
Save
0

Rapid Quantification of Mutant Fitness in Diverse Bacteria by Sequencing Randomly Bar-Coded Transposons

Kelly Wetmore et al.May 14, 2015
+8
R
M
K
Transposon mutagenesis with next-generation sequencing (TnSeq) is a powerful approach to annotate gene function in bacteria, but existing protocols for TnSeq require laborious preparation of every sample before sequencing. Thus, the existing protocols are not amenable to the throughput necessary to identify phenotypes and functions for the majority of genes in diverse bacteria. Here, we present a method, random bar code transposon-site sequencing (RB-TnSeq), which increases the throughput of mutant fitness profiling by incorporating random DNA bar codes into Tn5 and mariner transposons and by using bar code sequencing (BarSeq) to assay mutant fitness. RB-TnSeq can be used with any transposon, and TnSeq is performed once per organism instead of once per sample. Each BarSeq assay requires only a simple PCR, and 48 to 96 samples can be sequenced on one lane of an Illumina HiSeq system. We demonstrate the reproducibility and biological significance of RB-TnSeq with Escherichia coli, Phaeobacter inhibens, Pseudomonas stutzeri, Shewanella amazonensis, and Shewanella oneidensis. To demonstrate the increased throughput of RB-TnSeq, we performed 387 successful genome-wide mutant fitness assays representing 130 different bacterium-carbon source combinations and identified 5,196 genes with significant phenotypes across the five bacteria. In P. inhibens, we used our mutant fitness data to identify genes important for the utilization of diverse carbon substrates, including a putative d-mannose isomerase that is required for mannitol catabolism. RB-TnSeq will enable the cost-effective functional annotation of diverse bacteria using mutant fitness profiling.A large challenge in microbiology is the functional assessment of the millions of uncharacterized genes identified by genome sequencing. Transposon mutagenesis coupled to next-generation sequencing (TnSeq) is a powerful approach to assign phenotypes and functions to genes. However, the current strategies for TnSeq are too laborious to be applied to hundreds of experimental conditions across multiple bacteria. Here, we describe an approach, random bar code transposon-site sequencing (RB-TnSeq), which greatly simplifies the measurement of gene fitness by using bar code sequencing (BarSeq) to monitor the abundance of mutants. We performed 387 genome-wide fitness assays across five bacteria and identified phenotypes for over 5,000 genes. RB-TnSeq can be applied to diverse bacteria and is a powerful tool to annotate uncharacterized genes using phenotype data.
0
Citation424
0
Save
0

A novel method for accurate operon predictions in all sequenced prokaryotes

Morgan PriceFeb 18, 2005
M
We combine comparative genomic measures and the distance separating adjacent genes to predict operons in 124 completely sequenced prokaryotic genomes. Our method automatically tailors itself to each genome using sequence information alone, and thus can be applied to any prokaryote. For Escherichia coli K12 and Bacillus subtilis, our method is 85 and 83% accurate, respectively, which is similar to the accuracy of methods that use the same features but are trained on experimentally characterized transcripts. In Halobacterium NRC-1 and in Helicobacter pylori, our method correctly infers that genes in operons are separated by shorter distances than they are in E.coli, and its predictions using distance alone are more accurate than distance-only predictions trained on a database of E.coli transcripts. We use microarray data from six phylogenetically diverse prokaryotes to show that combining intergenic distance with comparative genomic measures further improves accuracy and that our method is broadly effective. Finally, we survey operon structure across 124 genomes, and find several surprises: H.pylori has many operons, contrary to previous reports; Bacillus anthracis has an unusual number of pseudogenes within conserved operons; and Synechocystis PCC 6803 has many operons even though it has unusually wide spacings between conserved adjacent genes.
0
Citation371
0
Save
16

Systematic discovery of pseudomonad genetic factors involved in sensitivity to tailocins

Sean Carim et al.Mar 1, 2021
+8
A
A
S
Tailocins are bactericidal protein complexes produced by a wide variety of bacteria that kill closely related strains and may play a role in microbial community structure. Thanks to their high specificity, tailocins have been proposed as precision antibacterial agents for therapeutic applications. Compared to tailed phages, with whom they share an evolutionary and morphological relationship, bacterially produced tailocins kill their host upon production but producing strains display resistance to self-intoxication. Though lipopolysaccharide (LPS) has been shown to act as a receptor for tailocins, the breadth of factors involved in tailocin sensitivity, and the mechanisms behind resistance to self-intoxication, remain unclear. Here, we employed genome-wide screens in four non-model pseudomonads to identify mutants with altered fitness in the presence of tailocins produced by closely related pseudomonads. Our mutant screens identified O-antigen composition and display as most important in defining sensitivity to our tailocins. In addition, the screens suggest LPS thinning as a mechanism by which resistant strains can become more sensitive to tailocins. We validate many of these novel findings, and extend these observations of tailocin sensitivity to 130 genome-sequenced pseudomonads. This work offers insights into tailocin-bacteria interactions, informing the potential use of tailocins in microbiome manipulation and antibacterial therapy.
16
Citation32
0
Save
29

Systematic Discovery of Pseudomonad Genetic Factors Involved in Sensitivity to Tailocins

Sean Carim et al.May 27, 2020
+6
A
A
S
Abstract Tailocins are bactericidal protein complexes produced by a wide variety of bacteria to compete against closely related strains. Like tailed bacteriophages, with whom they share an evolutionary and morphological relationship, tailocins bind and kill a narrow spectrum of target cells. Thanks to their high specificity, tailocins have garnered recent attention for their potential as precision antibacterial agents. Nevertheless, the field currently lacks a systematic investigation of genetic determinants of tailocin sensitivity. Here, we employed barcoded transposon-insertion mutant libraries and comparative genomics to assess genetic contributions to tailocin sensitivity in pseudomonads. Our mutant screens identified O-specific antigen (OSA) composition and display as most important in defining sensitivity to our tailocins. Additionally, the screens suggest lipopolysaccharide (LPS) thinning as a mechanism by which resistant strains can become more sensitive to tailocins. Our comparative genomics analyses show a loose relationship between OSA biosynthetic genes and tailocin sensitivity, as well as sensitivity nuances that require further investigation. Overall, our data reinforces the model that LPS molecules can act as either a receptor for, or shield against, tailocin binding and killing. This work offers insight into the specificity of tailocins and tailocin-mediated competition, informing the potential use of tailocins in microbiome manipulation and antibacterial therapy.
29
Citation8
0
Save
15

Critical assessment ofE. coligenome-scale metabolic model with high-throughput mutant fitness data

David Bernstein et al.Jan 5, 2023
A
M
B
D
Abstract The E. coli genome-scale metabolic model (GEM) is a gold standard for the simulation of cellular metabolism. Experimental validation of model predictions is essential to pinpoint model uncertainty and ensure continued development of accurate models. Here we assessed the accuracy of the E. coli GEM using published mutant fitness data for the growth of gene knockout mutants across thousands of genes and 25 different carbon sources. We explored the progress of the E. coli GEM versions over time and further investigated errors in the latest version of the model (iML1515). We observed that model size is increasing while prediction accuracy is decreasing. We identified several adjustments that improve model accuracy – the addition of vitamins/cofactors and re-assignment of reaction reversibility and isoenzyme gene to reaction mapping. Furthermore, we applied a machine learning approach which identified hydrogen ion exchange and central metabolism branch points as important determinants of model accuracy. Continued integration of experimental data to validate GEMs will improve predictive modeling of the mapping from genotype to metabolic phenotype in E. coli and beyond. Synopsis E. coli genome-scale metabolic model flux balance analysis (FBA) prediction accuracy was quantified with published experimental data assaying gene knockout mutant growth across different carbon sources. Insights into model development trends and sources of inaccuracy were revealed. Model representational power (size) has been increasing over time, while accuracy has been decreasing. Adding vitamins/cofactors to the model environment and re-assigning reaction reversibility and isoenzyme gene-to-reaction mapping improves correspondence between model predictions and experimental data. Machine learning reveals hydrogen ion exchange and central metabolism branch points as important features in the determination of model accuracy.
15
Citation4
0
Save
1

A fast comparative genome browser for diverse bacteria and archaea

Morgan Price et al.Aug 24, 2023
A
M
Abstract Genome sequencing has revealed an incredible diversity of bacteria and archaea, but there are no fast and convenient tools for browsing across these genomes. It is cumbersome to view the prevalence of homologs for a protein of interest, or the gene neighborhoods of those homologs, across the diversity of the prokaryotes. We developed a web-based tool, fast . genomics , that uses two strategies to support fast browsing across the diversity of prokaryotes. First, the database of genomes is split up. The main database contains one representative from each of the 6,377 genera that have a high-quality genome, and additional databases for each taxonomic order contain up to 10 representatives of each species. Second, homologs of proteins of interest are identified quickly by using accelerated searches, usually in a few seconds. Once homologs are identified, fast . genomics can quickly show their prevalence across taxa, view their neighboring genes, or compare the prevalence of two different proteins. Fast . genomics is available at https://fast.genomics.lbl.gov . Importance Now that we have genome sequences for tens of thousands of species of bacteria and archaea, we would like to predict the functions of their proteins. One common strategy is comparative genomics: by considering which genomes contain similar proteins, and which proteins are often encoded near each other, we can often guess the proteins’ functions. But there was no good way to do these analyses quickly. We built a website that performs them in a few seconds. We used two strategies to speed up the key step, which is finding similar proteins. First, we split up the database of genomes into a main database with one representative for each genus, and sub-databases for each taxonomic order. Either way, searches against fewer genomes are much faster. Second, we use accelerated searches to find similar proteins, with only a slight loss of sensitivity.
1
Citation3
0
Save
Load More