DD
Drena Dobbs
Author with expertise in Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR-associated proteins
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
3,313
h-index:
38
/
i10-index:
74
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Predicting linear B‐cell epitopes using string kernels

Yasser EL‐Manzalawy et al.May 22, 2008
Abstract The identification and characterization of B‐cell epitopes play an important role in vaccine design, immunodiagnostic tests, and antibody production. Therefore, computational tools for reliably predicting linear B‐cell epitopes are highly desirable. We evaluated Support Vector Machine (SVM) classifiers trained utilizing five different kernel methods using fivefold cross‐validation on a homology‐reduced data set of 701 linear B‐cell epitopes, extracted from Bcipep database, and 701 non‐epitopes, randomly extracted from SwissProt sequences. Based on the results of our computational experiments, we propose BCPred, a novel method for predicting linear B‐cell epitopes using the subsequence kernel. We show that the predictive performance of BCPred (AUC = 0.758) outperforms 11 SVM‐based classifiers developed and evaluated in our experiments as well as our implementation of AAP (AUC = 0.7), a recently proposed method for predicting linear B‐cell epitopes using amino acid pair antigenicity. Furthermore, we compared BCPred with AAP and ABCPred, a method that uses recurrent neural networks, using two data sets of unique B‐cell epitopes that had been previously used to evaluate ABCPred. Analysis of the data sets used and the results of this comparison show that conclusions about the relative performance of different B‐cell epitope prediction methods drawn on the basis of experiments using data sets of unique B‐cell epitopes are likely to yield overly optimistic estimates of performance of evaluated methods. This argues for the use of carefully homology‐reduced data sets in comparing B‐cell epitope prediction methods to avoid misleading conclusions about how different methods compare to each other. Our homology‐reduced data set and implementations of BCPred as well as the APP method are publicly available through our web‐based server, BCPREDS, at: http://ailab.cs.iastate.edu/bcpreds/ . Copyright © 2008 John Wiley & Sons, Ltd.
0

Predicting RNA-Protein Interactions Using Only Sequence Information

Usha Muppirala et al.Dec 1, 2011
RNA-protein interactions (RPIs) play important roles in a wide variety of cellular processes, ranging from transcriptional and post-transcriptional regulation of gene expression to host defense against pathogens. High throughput experiments to identify RNA-protein interactions are beginning to provide valuable information about the complexity of RNA-protein interaction networks, but are expensive and time consuming. Hence, there is a need for reliable computational methods for predicting RNA-protein interactions.We propose RPISeq, a family of classifiers for predicting RNA-protein interactions using only sequence information. Given the sequences of an RNA and a protein as input, RPIseq predicts whether or not the RNA-protein pair interact. The RNA sequence is encoded as a normalized vector of its ribonucleotide 4-mer composition, and the protein sequence is encoded as a normalized vector of its 3-mer composition, based on a 7-letter reduced alphabet representation. Two variants of RPISeq are presented: RPISeq-SVM, which uses a Support Vector Machine (SVM) classifier and RPISeq-RF, which uses a Random Forest classifier. On two non-redundant benchmark datasets extracted from the Protein-RNA Interface Database (PRIDB), RPISeq achieved an AUC (Area Under the Receiver Operating Characteristic (ROC) curve) of 0.96 and 0.92. On a third dataset containing only mRNA-protein interactions, the performance of RPISeq was competitive with that of a published method that requires information regarding many different features (e.g., mRNA half-life, GO annotations) of the putative RNA and protein partners. In addition, RPISeq classifiers trained using the PRIDB data correctly predicted the majority (57-99%) of non-coding RNA-protein interactions in NPInter-derived networks from E. coli, S. cerevisiae, D. melanogaster, M. musculus, and H. sapiens.Our experiments with RPISeq demonstrate that RNA-protein interactions can be reliably predicted using only sequence-derived information. RPISeq offers an inexpensive method for computational construction of RNA-protein interaction networks, and should provide useful insights into the function of non-coding RNAs. RPISeq is freely available as a web-based server at http://pridb.gdcb.iastate.edu/RPISeq/.
0
Citation427
0
Save
0

High frequency targeted mutagenesis in Arabidopsis thaliana using zinc finger nucleases

Feng Zhang et al.May 27, 2010
We report here an efficient method for targeted mutagenesis of Arabidopsis genes through regulated expression of zinc finger nucleases (ZFNs)—enzymes engineered to create DNA double-strand breaks at specific target loci. ZFNs recognizing the Arabidopsis ADH1 and TT4 genes were made by Oligomerized Pool ENgineering (OPEN)—a publicly available, selection-based platform that yields high quality zinc finger arrays. The ADH1 and TT4 ZFNs were placed under control of an estrogen-inducible promoter and introduced into Arabidopsis plants by floral-dip transformation. Primary transgenic Arabidopsis seedlings induced to express the ADH1 or TT4 ZFNs exhibited somatic mutation frequencies of 7% or 16%, respectively. The induced mutations were typically insertions or deletions (1–142 bp) that were localized at the ZFN cleavage site and likely derived from imprecise repair of chromosome breaks by nonhomologous end-joining. Mutations were transmitted to the next generation for 69% of primary transgenics expressing the ADH1 ZFNs and 33% of transgenics expressing the TT4 ZFNs. Furthermore, ≈20% of the mutant-producing plants were homozygous for mutations at ADH1 or TT4 , indicating that both alleles were disrupted. ADH1 and TT4 were chosen as targets for this study because of their selectable or screenable phenotypes ( adh1 , allyl alcohol resistance; tt4 , lack of anthocyanins in the seed coat). However, the high frequency of observed ZFN-induced mutagenesis suggests that targeted mutations can readily be recovered by simply screening progeny of primary transgenic plants by PCR and DNA sequencing. Taken together, our results suggest that it should now be possible to obtain mutations in any Arabidopsis target gene regardless of its mutant phenotype.
0
Citation357
0
Save
0

Targeted Mutagenesis of Duplicated Genes in Soybean with Zinc-Finger Nucleases

Shaun Curtin et al.Apr 4, 2011
We performed targeted mutagenesis of a transgene and nine endogenous soybean (Glycine max) genes using zinc-finger nucleases (ZFNs). A suite of ZFNs were engineered by the recently described context-dependent assembly platform--a rapid, open-source method for generating zinc-finger arrays. Specific ZFNs targeting dicer-like (DCL) genes and other genes involved in RNA silencing were cloned into a vector under an estrogen-inducible promoter. A hairy-root transformation system was employed to investigate the efficiency of ZFN mutagenesis at each target locus. Transgenic roots exhibited somatic mutations localized at the ZFN target sites for seven out of nine targeted genes. We next introduced a ZFN into soybean via whole-plant transformation and generated independent mutations in the paralogous genes DCL4a and DCL4b. The dcl4b mutation showed efficient heritable transmission of the ZFN-induced mutation in the subsequent generation. These findings indicate that ZFN-based mutagenesis provides an efficient method for making mutations in duplicate genes that are otherwise difficult to study due to redundancy. We also developed a publicly accessible Web-based tool to identify sites suitable for engineering context-dependent assembly ZFNs in the soybean genome.
0
Citation297
0
Save
0

GeneWeld: a method for efficient targeted integration directed by short homology

Wesley Wierson et al.Oct 3, 2018
Choices for genome engineering and integration involve high efficiency with little or no target specificity or high specificity with low activity. Here, we describe a targeted integration strategy, called GeneWeld, and a vector series for gene tagging, pGTag (plasmids for Gene Tagging), which promote highly efficient and precise targeted integration in zebrafish embryos, pig fibroblasts, and human cells utilizing the CRISPR/Cas9 system. Our work demonstrates that in vivo targeting of a genomic locus of interest with CRISPR/Cas9 and a donor vector containing as little as 24 to 48 base pairs of homology directs precise and efficient knock-in when the homology arms are exposed with a double strand break in vivo . Our results suggest that the length of homology is not important in the design of knock-in vectors but rather how the homology is presented to a double strand break in the genome. Given our results targeting multiple loci in different species, we expect the accompanying protocols, vectors, and web interface for homology arm design to help streamline gene targeting and applications in CRISPR and TALEN compatible systems.
0

Toward Precision Molecular Surgery: Robust, Selective Induction of Microhomology-mediated End Joining in vivo

Hirotaka Ata et al.Mar 28, 2018
One key problem in precision genome editing is the resultant unpredictable plurality of sequence outcomes at the site of targeted DNA double-strand breaks (DSBs). This is due to the typical activation of the versatile Non-homologous End Joining (NHEJ) pathway. Such unpredictability limits the utility of somatic gene editing for applications including gene therapy and functional genomics. For germline editing work, the accurate reproduction of identical alleles using NHEJ is a labor intensive process. In this study, we propose inducing Microhomology-mediated End Joining (MMEJ) as a viable solution for improving somatic sequence homogeneity in vivo, capable of generating a single predictable allele at high rates (56% ~ 86% of the entire mutant allele pool). Using a combined dataset from zebrafish (Danio rerio) in vivo and human HeLa cell in vitro as a training dataset, we identified specific contextual sequence determinants surrounding genomic DSBs for robust MMEJ pathway activation. We then applied our observation and prospectively designed MMEJ-inducing sgRNAs against a variety of proof-of-principle genes and demonstrated a high level of mutant allele homogeneity at these loci. F0 mutant zebrafish embryos and larvae generated with these gRNAs faithfully recapitulated previously reported, recessive loss-of-function phenotypes. We also provide a novel algorithm MENTHU (http://genesculpt.org/menthu/) for improved prediction of candidate MMEJ loci, suitable for both targeted and genome-wide applications. We believe that this MMEJ-centric approach will have a broad impact on genome engineering and its applications. For example, whereas somatic mosaicism hinders efficient recreation of a knockout mutant allele at base pair resolution via the standard NHEJ-based approach, we demonstrate that F0 founders transmitted the identical MMEJ allele of interest at high rates. Most importantly, the ability to directly dictate the reading frame of an endogenous target will have important implications for gene therapy applications in human genetic diseases.
0

Expanding the CRISPR Toolbox with ErCas12a in Zebrafish and Human Cells

Wesley Wierson et al.May 25, 2019
Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR) and CRISPR associated (Cas) effector proteins enable the targeting of DNA double-strand breaks (DSBs) to defined loci based on a variable length RNA guide specific to each effector. The guide RNAs are generally similar in size and form, consisting of a ~20 nucleotide sequence complementary to the DNA target and an RNA secondary structure recognized by the effector. However, the effector proteins vary in Protospacer Adjacent Motif (PAM) requirements, nuclease activities, and DNA binding kinetics. Recently, ErCas12a, a new member of the Cas12a family, was identified in Eubacterium rectale . Here, we report the first characterization of ErCas12a activity in zebrafish and human cells. Using a fluorescent reporter system, we show that CRISPR/ErCas12a elicits strand annealing mediated DNA repair more efficiently than CRISPR/Cas9. Further, using our previously reported gene targeting method that utilizes short homology, GeneWeld, we demonstrate the use of CRISPR/ErCas12a to integrate reporter alleles into the genomes of both zebrafish and human cells. Together, this work provides methods for deploying an additional CRISPR/Cas system, thus increasing the flexibility researchers have in applying genome engineering technologies.