BH
Brian Haas
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
51
(86% Open Access)
Cited by:
72,026
h-index:
78
/
i10-index:
163
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

UCHIME improves sensitivity and speed of chimera detection

Robert Edgar et al.Jun 23, 2011
Abstract Motivation: Chimeric DNA sequences often form during polymerase chain reaction amplification, especially when sequencing single regions (e.g. 16S rRNA or fungal Internal Transcribed Spacer) to assess diversity or compare populations. Undetected chimeras may be misinterpreted as novel species, causing inflated estimates of diversity and spurious inferences of differences between populations. Detection and removal of chimeras is therefore of critical importance in such experiments. Results: We describe UCHIME, a new program that detects chimeric sequences with two or more segments. UCHIME either uses a database of chimera-free sequences or detects chimeras de novo by exploiting abundance data. UCHIME has better sensitivity than ChimeraSlayer (previously the most sensitive database method), especially with short, noisy sequences. In testing on artificial bacterial communities with known composition, UCHIME de novo sensitivity is shown to be comparable to Perseus. UCHIME is &gt;100× faster than Perseus and &gt;1000× faster than ChimeraSlayer. Contact: robert@drive5.com Availability: Source, binaries and data: http://drive5.com/uchime. Supplementary information: Supplementary data are available at Bioinformatics online.
0
0

Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons

Brian Haas et al.Jan 6, 2011
Bacterial diversity among environmental samples is commonly assessed with PCR-amplified 16S rRNA gene (16S) sequences. Perceived diversity, however, can be influenced by sample preparation, primer selection, and formation of chimeric 16S amplification products. Chimeras are hybrid products between multiple parent sequences that can be falsely interpreted as novel organisms, thus inflating apparent diversity. We developed a new chimera detection tool called Chimera Slayer (CS). CS detects chimeras with greater sensitivity than previous methods, performs well on short sequences such as those produced by the 454 Life Sciences (Roche) Genome Sequencer, and can scale to large data sets. By benchmarking CS performance against sequences derived from a controlled DNA mixture of known organisms and a simulated chimera set, we provide insights into the factors that affect chimera formation such as sequence abundance, the extent of similarity between 16S genes, and PCR conditions. Chimeras were found to reproducibly form among independent amplifications and contributed to false perceptions of sample diversity and the false identification of novel taxa, with less-abundant species exhibiting chimera rates exceeding 70%. Shotgun metagenomic sequences of our mock community appear to be devoid of 16S chimeras, supporting a role for shotgun metagenomics in validating novel organisms discovered in targeted sequence surveys.
0
Citation3,277
0
Save
0

Genome sequence and analysis of the Irish potato famine pathogen Phytophthora infestans

Brian Haas et al.Sep 1, 2009
The genome of Phytophthora infestans, the pathogen that triggered the Irish potato famine in the nineteenth century, has been sequenced. It remains a devastating pathogen, with late blight destroying crops worth billions of dollars each year. Blight is difficult to control, in part because it adapts so quickly to genetically resistant potato strains. Comparison with two other Phytophthora genomes shows rapid turnover and extensive expansion of specific families of secreted disease effector proteins, including many genes induced during infection that have activities thought to alter host physiology. These fast evolving effector genes are found in highly dynamic and expanded regions of the genome, a factor that may contribute to its rapid adaptability to host plants. The P. infestans genome is the biggest so far sequenced, at about 240 megabases, with an extremely high repeat content of close to 75%. It is a model organism for the oomycetes, a distinct lineage of fungus-like eukaryotes related to organisms such as brown algae and diatoms. Phytophthora infestans is a fungus-like eukaryote and the most destructive pathogen of potato, with current annual worldwide potato crop losses due to late blight estimated at $6.7 billion. Here, the sequence of the P. infestans genome is reported. Comparison with two other Phytophthora genomes showed rapid turnover and extensive expansion of certain secreted disease effector proteins, probably explaining the rapid adaptability of the pathogen to host plants. Phytophthora infestans is the most destructive pathogen of potato and a model organism for the oomycetes, a distinct lineage of fungus-like eukaryotes that are related to organisms such as brown algae and diatoms. As the agent of the Irish potato famine in the mid-nineteenth century, P. infestans has had a tremendous effect on human history, resulting in famine and population displacement1. To this day, it affects world agriculture by causing the most destructive disease of potato, the fourth largest food crop and a critical alternative to the major cereal crops for feeding the world’s population1. Current annual worldwide potato crop losses due to late blight are conservatively estimated at $6.7 billion2. Management of this devastating pathogen is challenged by its remarkable speed of adaptation to control strategies such as genetically resistant cultivars3,4. Here we report the sequence of the P. infestans genome, which at ∼240 megabases (Mb) is by far the largest and most complex genome sequenced so far in the chromalveolates. Its expansion results from a proliferation of repetitive DNA accounting for ∼74% of the genome. Comparison with two other Phytophthora genomes showed rapid turnover and extensive expansion of specific families of secreted disease effector proteins, including many genes that are induced during infection or are predicted to have activities that alter host physiology. These fast-evolving effector genes are localized to highly dynamic and expanded regions of the P. infestans genome. This probably plays a crucial part in the rapid adaptability of the pathogen to host plants and underpins its evolutionary potential.
0
Citation1,416
0
Save
0

Genomic sequence of the pathogenic and allergenic filamentous fungus Aspergillus fumigatus

William Nierman et al.Dec 21, 2005
More than 300 labs worldwide are using the fungus Aspergillus nidulans as a model system for molecular genetics, and other species of this fungus are important in everyday life. A package of three genomics papers in this issue covers the Aspergillus field comprehensively. Galagan et al. report the genome sequence of the laboratory classic A. nidulans, and Nierman et al. have sequenced A. fumigatus, known chiefly as a human pathogen and allergen. And finally Machida et al. present genome sequencing and analysis of A. oryzae, focusing in particular on the expansion of genes in its genome, which is almost 25% bigger than the other two genomes. A. oryzae is used in traditional Chinese and Japanese food fermentation (think soy sauce) and also in enzyme production by biotechnologists. Aspergillus fumigatus is exceptional among microorganisms in being both a primary and opportunistic pathogen as well as a major allergen1,2,3. Its conidia production is prolific, and so human respiratory tract exposure is almost constant4. A. fumigatus is isolated from human habitats5 and vegetable compost heaps6,7. In immunocompromised individuals, the incidence of invasive infection can be as high as 50% and the mortality rate is often about 50% (ref. 2). The interaction of A. fumigatus and other airborne fungi with the immune system is increasingly linked to severe asthma and sinusitis8. Although the burden of invasive disease caused by A. fumigatus is substantial, the basic biology of the organism is mostly obscure. Here we show the complete 29.4-megabase genome sequence of the clinical isolate Af293, which consists of eight chromosomes containing 9,926 predicted genes. Microarray analysis revealed temperature-dependent expression of distinct sets of genes, as well as 700 A. fumigatus genes not present or significantly diverged in the closely related sexual species Neosartorya fischeri, many of which may have roles in the pathogenicity phenotype. The Af293 genome sequence provides an unparalleled resource for the future understanding of this remarkable fungus.
0
Citation1,353
0
Save
Load More