MW
Michael Weinstein
Author with expertise in Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR-associated proteins
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
1,100
h-index:
31
/
i10-index:
38
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

FIGARO: An efficient and objective tool for optimizing microbiome rRNA gene trimming parameters

Michael Weinstein et al.Apr 16, 2019
ABSTRACT Summary Microbiome studies continue to provide tremendous insight into the importance of microorganism populations to the macroscopic world. High-throughput DNA sequencing technology (i.e., Next-generation Sequencing) has enabled the cost-effective, rapid assessment of microbial populations when combined with bioinformatic tools capable of identifying microbial taxa and calculating the diversity and composition of biological and environmental samples. Ribosomal RNA gene sequencing, where 16S and 18S rRNA gene sequences are used to identify prokaryotic and eukaryotic species, respectively, is one of the most widely-used techniques currently employed in microbiome analysis. Prior to bioinformatic analysis of these sequences, trimming parameters must be set so that post-trimming sequence information is maximized while expected errors in the sequences themselves are minimized. In this application note, we present FIGARO: a Python–based application designed to maximize read retention after trimming and filtering for quality. FIGARO was designed specifically to increase reproducibility and minimize trial-and-error in trimming parameter selection for a DADA2–based pipeline and will likely be useful for optimizing trimming parameters and minimizing sequence errors in other pipelines as well where paired-end overlap is required. Availability and implementation The FIGARO application is freely available as source code at https://github.com/Zymo-Research/figaro .
0
Citation62
0
Save
0

Predicting off-target effects for end-to-end CRISPR guide design

Jennifer Listgarten et al.Oct 5, 2016
The CRISPR-Cas9 system provides unprecedented genome editing capabilities. However, off-target effects lead to sub-optimal usage and additionally are a bottleneck in development of therapeutic uses. Herein, we introduce the first machine learning-based approach to this problem, yielding a state-of-the-art predictive model for CRISPR-Cas9 off-target effects which outperforms all other guide design services. Our approach, Elevation, consists of two inter-related machine learning models--one for scoring individual guide-target pairs and another which aggregates guide-target scores into a single, overall guide summary score. Through systematic investigation, we demonstrate that Elevation performs substantially better than competing approaches on both of these tasks. Additionally, we are the first to systematically evaluate approaches on the guide summary score problem; we show that the most widely-used method (and one re-implemented by several other servers) performs no better than random at times, whereas Elevation consistently outperformed it, sometimes by an order of magnitude. In our analyses, we also introduce a method to balance errors on truly active guides with those which are truly inactive, encapsulating a range of practical use cases, thereby showing that Elevation is consistently superior across the entire range. We thus contribute a new evaluation metric for benchmarking off-target modeling. Finally, because of the large computational demands of our tasks, we have developed a cloud-based service for end-to-end guide design which incorporates our previously reported on-target model, Azimuth, as well as our new off-target model, Elevation.
0

A multi-tiered approach to assess fecal pollution in an urban watershed: Bacterial and viral indicators and sediment microbial communities

Stephanie Friedman et al.Jun 18, 2024
Development of effective pollution mitigation strategies require an understanding of the pollution sources and factors influencing fecal pollution loading. Fecal contamination of Turkey Creek in Gulfport, Mississippi, one of the nation's most endangered creeks, was studied through a multi-tiered approach. Over a period of approximately two years, four stations across the watershed were analyzed for nutrients, enumeration of E. coli, male-specific coliphages and bioinformatic analysis of sediment microbial communities. The results demonstrated that two stations, one adjacent to a lift station and one just upstream from the wastewater-treatment plant, were the most impacted. The station adjacent to land containing a few livestock was the least impaired. While genotyping of male-specific coliphage viruses generally revealed a mixed viral signature (human and other animals), fecal contamination at the station near the wastewater treatment plant exhibited predominant impact by municipal sewage. Fecal indicator loadings were positively associated with antecedent rainfall for three of four stations. No associations were noted between fecal indicator loadings and any of the nutrients. Taxonomic signatures of creek sediment were unique to each sample station, but the sediment microbial community did overlap somewhat following major rain events. No presence of Escherichia coli (E. coli) or enterococci were found in the sediment. At some of the stations it was evident that rainfall was not always the primary driver of fecal transport. Repeated monitoring and analysis of a variety of parameters presented in this study determined that point and non-point sources of fecal pollution varied spatially in association with treated and/or untreated sewage.
0
0
Save